"KMedoids" (機械学習メソッド)
- FindClusters,ClusterClassify,ClusteringComponentsのためのメソッドである.
- k メドイドクラスタリングアルゴリズム(kメドイド法)を使ってデータを類似要素の 個のクラスタに分割する.
詳細とサブオプション
- "KMedoids"法は,PAM (Partitioning Around Medoids)としても知られるもので,単純で高速の重心に基づいたメソッドである."KMedoids"は,クラスタのサイズが同じ位で各々の重心(メドイド)の周りに局所的に分布している場合によい.クラスタのサイズが大きく異なっていたり,絡み合っていたり,外れ値が存在したりする場合は,"KMedoids"が返す結果はあまりよくない可能性がある.
- 次のプロットは,"KMedoids"法をトイデータ集合に適用した結果を示している.
-
- "KMedoids"法は,k 個のクラスタを定義している k 個の重心を求めることを目的としている.各データ点は最近傍の重心に割り当てられる.ある重心に割り当てられたすべての点によってクラスタが形成される.
- 最良の k 個のメドイドを求める手続きは,メドイドがクラスタの中心として定義されるのではない点を除いて"KMeans"と同じである.メドイドのクラスタは,最も中心的なクラスタ内のデータ点,つまりクラスタ内の他の点までの平均距離が最小であるデータ点として定義される."KMedoids"は"KMeans"のように平均を計算するものではないので,非数値空間で使用できる(距離関数で十分である).
- 初期重心はランダムに選ばれるので,評価によって結果が変わるかもしれない.
- サブオプションの"InitialCentroids"を使って初期重心をデータ点のリストとして指定できる.各々の初期重心は既存のデータ点と一致しなければならない.
- 次は使用可能なサブオプションである.
-
"InitialCentroids" Automatic 初期重心のリスト
例題
すべて開くすべて閉じる例 (3)
"KMedoids"クラスタリングメソッドを使って,値が近いクラスタを厳密に4つ求める:
"KMedoids"法を使って data 内に求まったクラスタをプロットする:
ClassifierFunctionを文字列のリストで訓練する:
オプション (3)
考えられる問題 (1)
ノイズのある2Dの月の形の訓練データ集合と検定データ集合を作成して可視化する:
"KMedoids"を使って2つのクラスタについてClassifierFunctionを訓練し,検定集合中のクラスタを求める:
クラスタを可視化すると,絡み合っているクラスタについては"KMedoids"のパフォーマンスがあまりよくないことが分かる: