"KernelDensityEstimation" (機械学習メソッド)

詳細とサブオプション

  • "KernelDensityEstimation"は,KernelMixtureDistributionにおけるように,数値空間の確率密度を各訓練例周辺を中心とした(カーネルと呼ばれる)単純分布でモデル化するノンパラメトリックメソッドである.
  • ベクトル の確率密度関数は,カーネル関数 ,カーネルサイズ ,訓練例の数 m について,で与えられる.
  • 次は,使用可能なオプションである.
  • Method "Fixed"カーネルサイズメソッド
    "KernelSize" AutomaticMethod"Fixed"のときのカーネルサイズ
    "KernelType" "Gaussian"使用されているカーネルタイプ
    "NeighborsNumber" Automatic近傍数として表されたカーネルサイズ
  • 次は,"KernelType"の可能な設定である.
  • "Gaussian"各カーネルはガウス分布である
    "Ball"各カーネルは球面上の一様分布である
  • 次は,Methodの可能な設定である.
  • "Adaptive"個々のカーネルサイズは違ってよい
    "Fixed"全てのカーネルが同じサイズである
  • "KernelType""Gaussian"のとき,各カーネルは球面ガウス分布(独立正規分布の積)で,"KernelSize" h は正規分布の標準偏差を指す.
  • "KernelType""Ball"のとき,各カーネルは球内の一様分布で,"KernelSize"は球の半径を指す.
  • "NeighborsNumber"k の値は,訓練例の周りを中心とするカーネルが k 個の他の訓練例を含むように,カーネルサイズに変換される."KernelType""Ball"のとき,"contains"は球内の例を指す. "KernelType""Gaussian"であれば,"contains"は半径 hの球内の例を指す.ただし,n はデータの次元である.
  • Method"Fixed""NeighborsNumber"k のときは,訓練例が平均 k 個の他の例を含むように一意的なカーネルサイズが求められる.
  • Method"Adaptive""NeighborsNumber"k のときは,各訓練例が,カーネルに k 個の他の例が含まれるように,カーネルサイズを適応させる.
  • 前処理のために,"NeighborsNumber"オプションは,通常,カーネルサイズを制御する上で"KernelSize"より便利な方法である.Method"Fixed"のときは,"KernelSize"の値が"NeighborsNumber"の値を上書きする.
  • Information[LearnedDistribution[],"MethodOption"]を使って自動システムによって選択されたオプションの値を抽出することができる.
  • LearnDistribution[,FeatureExtractor"Minimal"]を使ってほとんどの前処理を削除してメソッドに直接アクセスすることができる.

例題

すべて開くすべて閉じる

  (3)

"KernelDensityEstimation"分布を数値データ集合で訓練する:

分布の情報(Information)を見る:

オプション情報を入手する:

オプションの値を直接得る:

新たな例の確率密度を計算する:

確率密度関数(PDF)を訓練データと一緒にプロットする:

新たなサンプルを生成し,可視化する:

"KernelDensityEstimation"分布を二次元データ集合で訓練する:

PDFを訓練データと一緒にプロットする:

SynthesizeMissingValuesを使い,学習済みの分布を使って欠落値を転嫁する:

"KernelDensityEstimation"分布を名義的データ集合で訓練する:

前処理が必要なので,PDFの計算は厳密ではない:

ComputeUncertaintyを使って結果の不確かさを得る:

MaxIterationsを大きくすると推定精度が上がる:

オプション  (4)

"KernelSize"  (1)

カーネル混合分布を0.2のカーネルサイズで訓練する:

分布のPDFを特定の点で評価する:

カーネル混合分布をさまざまなカーネルサイズで訓練した後で得られたPDFを可視化する:

"KernelType"  (1)

"KernelDensityEstimation"分布を"Ball"カーネルで訓練する:

分布のPDFを特定の点で評価する:

カーネル混合分布を"Ball"カーネルおよび"Gaussian"カーネルで訓練した後で得られたPDFを可視化する:

Method  (1)

"KernelDensityEstimation"分布を"Adaptive"メソッドで訓練する:

分布のPDFを特定の点で評価する:

カーネル混合分布を"Ball"カーネルと"Gaussian"カーネルで訓練した後で得られたPDFを可視化する:

"NeighborsNumber"  (1)

10の近傍のカーネルサイズでカーネル混合分布を訓練する:

分布のPDFを特定の点で評価する:

カーネル混合分布を近傍数で表されたさまざまなカーネルサイズで訓練した後で得られたPDFを可視化する: