SynthesizeMissingValues

SynthesizeMissingValues[{example1,example2,}]

各例の欠損値を生成された値で置換する.

SynthesizeMissingValues[dist,data]

分布 dist を使って値を生成する.

詳細とオプション

  • SynthesizeMissingValuesは,データ集合中の欠落要素をデータの既知の部分から合成するために使われる.
  • SynthesizeMissingValuesは,数値,名義,画像を含む多くのデータ型に使うことができる.
  • exampleiは,単一のデータ要素,データ要素のリスト,あるいはデータ要素の連想でよい.例はDatasetオブジェクトとして与えることもできる.
  • 分布 distLearnedDistribution[]でなければならない.
  • 次のオプションが与えられる.
  • FeatureNames Automatic入力データに割り当てる特徴名
    FeatureTypes Automatic入力データに仮定する特徴タイプ
    Method Automaticどのモデリングアルゴリズムを使用するか
    MissingValuePattern _Missing|Indeterminate想定される欠損値のパターン
    PerformanceGoal Automatic最適化するパフォーマンスの局面
    RandomSeeding1234擬似乱数生成器の内部的シードをどのように行うか
    TimeGoalAutomatic検出器の訓練にどの程度の時間を費やするか
    TrainingProgressReporting Automatic訓練中の進捗状況をどのように報告するか
    ValidationSetAutomatic訓練中にモデルの評価に使うデータ集合
  • 次は,PerformanceGoalの可能な設定である.
  • "Quality"合成の質を最高にする
    "Speed"合成速度を最高にする
    Automatic速度と質の自動トレードオフ
  • 次は,Methodの可能な設定である.
  • Automatic分配方法と合成戦略を自動的に選択する
    None欠落した合成器は使わない
    method指定された方法を使う
    strategy分布からどのように合成するか
    assoc分配方法と合成戦略の両方を指定する
  • 次は,method の可能な設定である.
  • "Multinormal"多変量正規(ガウス)分布を使う
    "ContingencyTable"データを離散化し,考えられる各確率を保存する
    "KernelDensityEstimation"カーネル混合分布を使う
    "DecisionTree"決定木をつかて確率を計算する
    "GaussianMixture"ガウス(正規)分布の混合を使う
  • 次は,strategy の可能な設定である.
  • Automatic合成戦略を自動的に選択する
    "MarginalSampling"各特徴の周辺分布からサンプルを取る
    "ModeFinding"既知の値で条件付けられた分布の最頻値を求めようとする
    "RandomSampling"既知の値で条件付けられた分布からサンプルを取る(デフォルト)
  • Methodassoc の形式のときは,連想 assoc<|"LearningMethod"method,"EvaluationStrategy"strategy|>の形でなければならない.
  • TrainingProgressReportingの次の設定を使うことができる.
  • "Panel"動的に更新されるグラフィカルなパネルを表示する
    "Print"Printを使って定期的に情報を報告する
    "ProgressIndicator"単純なProgressIndicatorを表示する
    "SimplePanel"学習曲線なしでパネルを動的に更新する
    None情報は何も報告しない
  • 次は,RandomSeedingの可能な設定である.
  • Automatic関数が呼び出されるたびに自動的にシードを再設定する
    Inherited外部でシードされた乱数を使う
    seed明示的な整数または文字列をシードとして使う
  • SynthesizeMissingValues[,FeatureExtractor"Minimal"]は,内部的な前処理ができるだけ簡単であるべきことを示す.

例題

すべて開くすべて閉じる

  (2)

数値データ集合中の欠損値を埋める:

二次元データ集合で分布を訓練する:

学習した分布に基づいて欠損値を埋める:

スコープ  (5)

ベクトル中の欠損値を埋める:

ベクトルのリスト中の欠損値を埋める:

連想のリスト中の欠損値を埋める:

データ集合中の欠損値を埋める:

訓練済みのLearnedDistribution[]を使って値を埋める:

これを使って単一の例を合成することができる:

オプション  (9)

FeatureTypes  (1)

最初の特徴は名義的な変数として解釈され,残りは自動的に決定されるように指定する:

FeatureNames  (1)

欠損値を置換し,「gender」という名前の特徴を名義的であると考えるように指定する:

Method  (2)

分布を計算する"Multinormal"法を使ってMissing[]の値を置換する:

欠損値の置換に"KernelDensityEstimation"法を使う:

分布計算の評価方法と学習法を選択して,メソッドを連想として指定する:

MissingValuePattern  (2)

MissingValuePatternを使って欠損値であると考えられる値を指定する:

パターンを使って値を指定する:

Conditionで欠損値を指定する:

PerformanceGoal  (1)

PerformanceGoalを指定して欠損値を合成する:

欠損値の補完時間をデフォルトのPerformanceGoalと比較する:

TrainingProgressReporting  (2)

訓練中に,訓練の進捗状況を定期的に出力する:

訓練の進捗状況をプロットはせずにインタラクティブに表示する:

アプリケーション  (2)

画像のデータ集合を得る:

分布を画像で訓練する:

欠損値であるとみなされる値を,学習した分布から生成されたサンプルで置換する:

欠損値を含む,木星の衛星の特徴に関連するデータ集合を得る:

データ集合の欠損値を置換する:

特性と関係  (1)

"EvaluationStrategy"設定は行うサンプリングのタイプに影響する.

ランダムデータを定義する:

データの分布を学ぶ:

別の方法を試す:

さまざまなサンプル点の分布を比較する:

サンプル点をもとのデータと一緒にプロットする:

考えられる問題  (1)

単一の値は参照分布なしでは合成できない:

Wolfram Research (2019), SynthesizeMissingValues, Wolfram言語関数, https://reference.wolfram.com/language/ref/SynthesizeMissingValues.html.

テキスト

Wolfram Research (2019), SynthesizeMissingValues, Wolfram言語関数, https://reference.wolfram.com/language/ref/SynthesizeMissingValues.html.

CMS

Wolfram Language. 2019. "SynthesizeMissingValues." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/SynthesizeMissingValues.html.

APA

Wolfram Language. (2019). SynthesizeMissingValues. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/SynthesizeMissingValues.html

BibTeX

@misc{reference.wolfram_2024_synthesizemissingvalues, author="Wolfram Research", title="{SynthesizeMissingValues}", year="2019", howpublished="\url{https://reference.wolfram.com/language/ref/SynthesizeMissingValues.html}", note=[Accessed: 05-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_synthesizemissingvalues, organization={Wolfram Research}, title={SynthesizeMissingValues}, year={2019}, url={https://reference.wolfram.com/language/ref/SynthesizeMissingValues.html}, note=[Accessed: 05-November-2024 ]}