FeatureExtraction
FeatureExtraction[{example1,example2,…}]
与えられた例で訓練されたFeatureExtractorFunction[…]を生成する.
FeatureExtraction[examples,extractor]
指定の特徴抽出器法を使う.
FeatureExtraction[examples,{extractor1,extractor2,…}]
extractoriを順に適用して特徴抽出器を生成する.
FeatureExtraction[examples,specext]
ext で指定された抽出器法を,spec で指定された examples の部分に適用する.
FeatureExtraction[examples,{spec1ext1,spec2ext2,…}]
抽出器法 extiを,speciで指定された examples の部分に適用する.
FeatureExtraction[examples,extractor,props]
props で指定された特徴抽出器の特性を与える.
詳細とオプション
- FeatureExtractionは,数値,テキスト,サウンド,画像,グラフ,時系列,それらの組合せを含む数多くのデータ型に使うことができる.
- 各 exampleiは,単一のデータ要素,データ要素のリスト,データ要素の連想,あるいはDatasetオブジェクトでよい.
- FeatureExtraction[examples]は,特定のデータに適用可能なFeatureExtractorFunction[…]を返す.
- 使用可能な特徴抽出メソッドには以下がある.
-
Automatic 自動抽出 Identity データを変更せずに与える "ConformedData" 一致する画像,色,日付等 "NumericVector" 任意のデータからの数値ベクトル f 関数 f を各例に適用する {extractor1,extractor2,…} 一連の抽出器を交互に使う - 各データ型について追加的な特徴抽出法を使うことができる.
- 数値データ
-
"DiscretizedVector" 離散化された数値データ "DimensionReducedVector" 次元を削減した数値ベクトル "MissingImputed" 欠落値が補完されたデータ "StandardizedVector" Standardizeで処理された数値データ - 名義データ
-
"IndicatorVector" インジケータベクトルで「ワンホットエンコード」された名義データ "IntegerVector" 整数で符号化された名義データ - テキスト
-
"LowerCasedText" 各文字が小文字のテキスト "SegmentedCharacters" 文字に分割されたテキスト "SegmentedWords" 単語に分割されたテキスト "TFIDF" 単語の出現頻度と逆文書頻度のベクトル "WordVectors" 英語テキストからの意味ベクトル列(英語のみ) - 画像
-
"FaceFeatures" ヒトの顔からの意味ベクトル "ImageFeatures" 画像からの意味ベクトル "PixelVector" 画像からの画素値のベクトル - 音声オブジェクト
-
"AudioFeatures" 音声オブジェクトからの意味ベクトル列 "AudioFeatureVector" 音声オブジェクトからの意味ベクトル "LPC" 音声線形予測係数 "MelSpectrogram" 対数周波数ビンの音声スペクトログラム "MFCC" 音声メル周波数ケプストラム係数ベクトル列 "SpeakerFeatures" 意味話者ベクトルの列 "SpeakerFeatureVector" 話者の意味ベクトル "Spectrogram" 音声スペクトログラム - 動画オブジェクト
-
"VideoFeatures" 動画オブジェクトからの意味ベクトルの列 "VideoFeatureVector" 動画オブジェクトからの意味ベクトル - グラフ
-
"GraphFeatures" グラフ特性を要約する数値ベクトル - 分子
-
"AtomPairs" 原子対と両者間の経路長からのブールベクトル "MoleculeExtendedConnectivity" 列挙された分子の部分グラフからのブールベクトル "MoleculeFeatures" 分子の特性を要約する数値ベクトル "MoleculeTopologicalFeatures" 円形の原子近傍からのブールベクトル - 特徴抽出器法は互換タイプのデータ要素に適用される.その他のデータ要素は変更なしで返される.
- FeatureExtraction[examples]はFeatureExtraction[examples,Automatic]に等しい.これは,FeatureExtraction[examples,"NumericVector"]と等しいことが多い.
- "NumericVector"法は,主に例を数値ベクトルに変換し,欠落データを補完し,DimensionReductionを使って次元を減少させる.
- FeatureExtraction[examples,extractors,props]では,props は単一の特性あるいは特性のリストでよい.次は使用可能な特性である.
-
"ExtractorFunction" FeatureExtractorFunction[…](デフォルト) "ExtractedFeatures" 特徴抽出後の examples "ReconstructedData" 抽出と逆抽出後の examples "FeatureDistance" 抽出器から生成されたFeatureDistance[…] - FeatureExtraction[examples,specext]あるいはFeatureExtraction[examples,{spec1ext1,…}]では,spec と speciの可能な形は以下の通りである.
-
All 各例のすべての部分 i 各例の i 番目の部分 {i1,i2,…} 各例の部分 i1, i2, … "name" 各例の指定された名前のある部分 {"name1","name2",…} 各例の"namei"という名前の部分 - spec あるいは speciで言及されていない部分は,特徴抽出の目的では削除される.
- FeatureExtraction[examples,{spec1ext1,…}]では,extiはすべて別々に examples に適用される.
- 使用可能なオプション
-
FeatureNames Automatic exampleiの要素に割り当てる名前 FeatureTypes Automatic exampleiの要素に仮定する特徴タイプ RandomSeeding 1234 どのような擬似乱数生成器のシードを内部的に使うべきか - RandomSeedingの可能な設定
-
Automatic 関数が呼び出されるたびに自動的にシードを変える Inherited 外部シードの乱数を使う seed 明示的な整数または文字列をシードとして使う - FeatureExtraction[…,"ExtractedFeatures"]はFeatureExtract[…]に等しい.
- FeatureExtraction[…,"FeatureDistance"]はFeatureDistance[FeatureExtraction[…]]に等しい.
例題
すべて開くすべて閉じる例 (3)
単純なデータ集合についてFeatureExtractorFunctionを訓練する:
"StandardizedVector"抽出器法を使って数値データ集合から特徴抽出器を構築する:
スコープ (14)
DateObjectのリストで特徴抽出器を訓練する:
新たなDateObjectから特徴を抽出する:
特徴抽出器をGraphのリストで訓練する:
特徴抽出器をTimeSeriesのリストで訓練する:
新たなTimeSeriesから特徴を抽出する:
特徴抽出器を訓練して,テキストから単語の出現頻度と逆文書頻度のベクトルを計算させる:
訓練集合の単語の出現頻度と逆文書頻度の行列は,SparseArrayで計算することができる:
"TFIDF"法はトークン化されたデータに使うこともできる:
"TFIDF"法を使い次に"DimensionReduced"法を使って,特徴抽出器をテキストについて訓練する:
"StandardizedVector"メソッドでカスタム抽出器を繋ぐ:
"IndicatorVector"法を使った名義変数についての特徴抽出器:
第2名義変数のみについて,"IndicatorVector"法で特徴抽出器を訓練する:
Identity抽出器法を使って第1変数をコピーする:
"TFIDF"法を使ってテキストと画像について特徴抽出器を訓練する:
この特徴抽出器は,値が欠けていても特徴を抽出することができる:
"StandardizedVector"法を使って特徴抽出器を訓練する:
特徴抽出器は可逆なので,FeatureExtractorFunction特性"OriginalData"を使って逆抽出を行うことができる:
FeatureExtraction特性"ReconstructedData"を使って,抽出と再構築の後でデータを取得することができる:
オプション (3)
FeatureNames (2)
FeatureNamesを使って名前を設定し,FeatureExtraction[examples,{spec1ext1,…}]でそれを参照する:
FeatureTypes (1)
"IndicatorVector"法で簡単なデータ集合について特徴抽出器を訓練する:
最初の特徴は数値的であると解釈された."IndicatorVector"法は名義的特徴に対してしか動作しないので,最初の特徴は変更されない:
FeatureTypesを使って最初の特徴が名義的であるという解釈を強制する:
アプリケーション (3)
画像検索 (1)
このデータ集合の抽出された特徴についてNearestFunctionを生成する:
NearestFunctionを使ってデータ集合の最近画像を描画する関数を構築する:
テキスト検索 (1)
「Alice in Wonderland」(不思議の国のアリス)のテキストをロードする:
文の特徴を使ってNearestFunctionを生成する:
NearestFunctionを使って「Alice in Wonderland」の最も近い文を表示する関数を構築する:
インピュテーション(データ補完) (1)
ExampleDataから"MNIST"データ集合をロードし,画像を保存する:
画像を数値データに変換し,データ集合を訓練集合とテスト集合に分ける:
"MissingImputed"法を使って特徴抽出器を作成する:
テスト集合ベクトルのいくつかの値をMissing[]で置換し,可視化する:
FeatureExtractorFunction[…]を使って欠落値を補完する:
テキスト
Wolfram Research (2016), FeatureExtraction, Wolfram言語関数, https://reference.wolfram.com/language/ref/FeatureExtraction.html (2021年に更新).
CMS
Wolfram Language. 2016. "FeatureExtraction." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2021. https://reference.wolfram.com/language/ref/FeatureExtraction.html.
APA
Wolfram Language. (2016). FeatureExtraction. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/FeatureExtraction.html