"KernelDensityEstimation" (機械学習メソッド)
- LearnDistributionのメソッド
- 確率密度を単純分布の混合でモデル化する.
詳細とサブオプション
- "KernelDensityEstimation"は,KernelMixtureDistributionにおけるように,数値空間の確率密度を各訓練例周辺を中心とした(カーネルと呼ばれる)単純分布でモデル化するノンパラメトリックメソッドである.
- ベクトル の確率密度関数は,カーネル関数 ,カーネルサイズ ,訓練例の数 m について,で与えられる.
- 次は,使用可能なオプションである.
-
Method "Fixed" カーネルサイズメソッド "KernelSize" Automatic Method"Fixed"のときのカーネルサイズ "KernelType" "Gaussian" 使用されているカーネルタイプ "NeighborsNumber" Automatic 近傍数として表されたカーネルサイズ - 次は,"KernelType"の可能な設定である.
-
"Gaussian" 各カーネルはガウス分布である "Ball" 各カーネルは球面上の一様分布である - 次は,Methodの可能な設定である.
-
"Adaptive" 個々のカーネルサイズは違ってよい "Fixed" 全てのカーネルが同じサイズである - "KernelType""Gaussian"のとき,各カーネルは球面ガウス分布(独立正規分布の積)で,"KernelSize" h は正規分布の標準偏差を指す.
- "KernelType""Ball"のとき,各カーネルは球内の一様分布で,"KernelSize"は球の半径を指す.
- "NeighborsNumber"k の値は,訓練例の周りを中心とするカーネルが k 個の他の訓練例を含むように,カーネルサイズに変換される."KernelType""Ball"のとき,"contains"は球内の例を指す. "KernelType""Gaussian"であれば,"contains"は半径 hの球内の例を指す.ただし,n はデータの次元である.
- Method"Fixed"で"NeighborsNumber"k のときは,訓練例が平均 k 個の他の例を含むように一意的なカーネルサイズが求められる.
- Method"Adaptive"で"NeighborsNumber"k のときは,各訓練例が,カーネルに k 個の他の例が含まれるように,カーネルサイズを適応させる.
- 前処理のために,"NeighborsNumber"オプションは,通常,カーネルサイズを制御する上で"KernelSize"より便利な方法である.Method"Fixed"のときは,"KernelSize"の値が"NeighborsNumber"の値を上書きする.
- Information[LearnedDistribution[…],"MethodOption"]を使って自動システムによって選択されたオプションの値を抽出することができる.
- LearnDistribution[…,FeatureExtractor"Minimal"]を使ってほとんどの前処理を削除してメソッドに直接アクセスすることができる.
例題
すべて開くすべて閉じる例 (3)
"KernelDensityEstimation"分布を数値データ集合で訓練する:
分布の情報(Information)を見る:
"KernelDensityEstimation"分布を二次元データ集合で訓練する:
SynthesizeMissingValuesを使い,学習済みの分布を使って欠落値を転嫁する:
"KernelDensityEstimation"分布を名義的データ集合で訓練する:
ComputeUncertaintyを使って結果の不確かさを得る:
MaxIterationsを大きくすると推定精度が上がる: