FeatureExtract
FeatureExtract[{example1,example2,…}]
すべての exampleiについて訓練された特徴抽出器を使って exampleiのそれぞれから特徴を抽出する.
FeatureExtract[examples,extractor]
指定された特徴抽出器法を使って特徴を抽出する.
FeatureExtract[examples,{extractor1,extractor2,…}]
extractoriを順に適用して特徴を抽出する.
FeatureExtract[examples,specext]
ext で指定された抽出器法を,spec で指定された examples の部分に適用する.
FeatureExtract[examples,{spec1ext1,spec2ext2,…}]
抽出器法 extiを speciで指定された examples の部分に使う.
詳細とオプション
- FeatureExtractは,数値,テキスト,サウンド,画像,グラフ,時系列,それらの組合せを含む,数多くのタイプのデータに使うことができる.
- 各 exampleiは,単一のデータ要素,データ要素のリスト,データ要素の連想,あるいはDatasetオブジェクトでよい.
- 使用可能な特徴抽出器メソッドには以下がある.
-
Automatic 自動抽出 Identity データを変更せずに与える "ConformedData" 適合する画像,色,日付等 "NumericVector" 任意のデータからの数値ベクトル f 関数 f を各例に適用する {extractor1,extractor2,…} 一連の抽出器を交互に使う - 各データ型について追加的な特徴抽出器法を使うことができる.
- 数値データ
-
"DiscretizedVector" 離散化された数値データ "DimensionReducedVector" 次元を削減した数値ベクトル "MissingImputed" 欠落値が補完されたデータ "StandardizedVector" Standardizeで処理された数値データ - 名義データ
-
"IndicatorVector" インジケータベクトルで「ワンホットエンコード」された名義データ "IntegerVector" 整数で符号化された名義データ - テキスト:
-
"LowerCasedText" 各文字が小文字のテキスト "SegmentedCharacters" 文字に分割されたテキスト "SegmentedWords" 単語に分割されたテキスト "TFIDF" 単語の出現頻度と逆文書頻度のベクトル "WordVectors" 英語テキストからの意味ベクトル列(英語のみ) - 画像
-
"FaceFeatures" ヒトの顔からの意味ベクトル "ImageFeatures" 画像からの意味ベクトル "PixelVector" 画像からの画素値のベクトル - 音声オブジェクト
-
"AudioFeatures" 音声オブジェクトからの意味ベクトル列 "AudioFeatureVector" 音声オブジェクトからの意味ベクトル "LPC" 音声線形予測係数 "MelSpectrogram" 対数周波数ビンの音声スペクトログラム "MFCC" 音声メル周波数ケプストラム係数ベクトル列 "SpeakerFeatures" 意味話者ベクトルの列 "SpeakerFeatureVector" 話者の意味ベクトル "Spectrogram" 音声スペクトログラム - 動画オブジェクト
-
"VideoFeatures" 動画オブジェクトからの意味ベクトルの列 "VideoFeatureVector" 動画オブジェクトからの意味ベクトル - グラフ
-
"GraphFeatures" グラフ特性を要約する数値ベクトル - 分子
-
"AtomPairs" 原子対と両者の間の経路長からのブールベクトル "MoleculeExtendedConnectivity" 列挙された分子の部分グラフからのブールベクトル "MoleculeFeatures" 分子特性を要約する数値ベクトル "MoleculeTopologicalFeatures" 円形の原子近傍からのブールベクトル - 特徴抽出器法は互換タイプのデータ要素に適用される.その他のデータ要素は変更なしで返される.
- FeatureExtract[examples]はFeatureExtract[examples,"NumericVector"]と等価であることが多い.
- FeatureExtract[examples,specext]あるいはFeatureExtract[examples,{spec1ext1,…}]での spec と speciの可能な形
-
All 各例のすべての部分 i 各例の i 番目の部分 {i1,i2,…} 各例の部分 i1, i2, … "name" 各例の指定された名前のある部分 {"name1","name2",…} 各例の"namei"という名前の部分 - spec あるいは speciで言及されていない部分は,特徴抽出の目的では削除される.
- FeatureExtract[examples,{spec1ext1,…}]では,extiはすべて別々に examples に適用される.
- 使用可能なオプション
-
FeatureNames Automatic exampleiの要素に割り当てる名前 FeatureTypes Automatic exampleiの要素に仮定する特徴タイプ RandomSeeding 1234 どのような擬似乱数生成器のシードを内部的に使うべきか - RandomSeedingの可能な設定
-
Automatic 関数が呼び出されるたびに自動的にシードを変える Inherited 外部シードの乱数を使う seed 明示的な整数または文字列をシードとして使う - FeatureExtract[…]はFeatureExtraction[…,"ExtractedFeatures"]に等しい.
例題
すべて開くすべて閉じる例 (4)
スコープ (10)
DateObjectのリストから特徴を抽出する:
特徴抽出器をGraphのリストで訓練する:
特徴抽出器をTimeSeriesのリストで訓練する:
デフォルトで,テキストは単語に分割される.これでも同じ結果が与えられる:
"TFIDF"法を使い,続けて"DimensionReduced"法を使ってテキストから特徴を抽出する:
"IndicatorVector"法を名義変数に使って特徴を抽出する:
"IndicatorVector"法を第2名義変数のみに使って特徴を抽出する:
Identity抽出器法を使って第1変数も同様にコピーする:
オプション (2)
FeatureNames (1)
FeatureNamesを使って特徴に名前を付け,部分指定にその名前を使う:
FeatureTypes (1)
"IndicatorVector"法で単純なデータ集合から特徴を抽出する:
最初の特徴は数値と解釈される."IndicatorVector"法は名義的特徴にしか作用しないので,最初の特徴はそのまま返される.
FeatureTypesを使って最初の特徴が名義的であると強制的に解釈させる:
アプリケーション (1)
データ集合の可視化 (1)
FeatureSpacePlotを使っても,同じような可視化を直接得ることができる:
テキスト
Wolfram Research (2016), FeatureExtract, Wolfram言語関数, https://reference.wolfram.com/language/ref/FeatureExtract.html (2021年に更新).
CMS
Wolfram Language. 2016. "FeatureExtract." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2021. https://reference.wolfram.com/language/ref/FeatureExtract.html.
APA
Wolfram Language. (2016). FeatureExtract. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/FeatureExtract.html