"KMedoids" (機械学習メソッド)

詳細とサブオプション

  • "KMedoids"法は,PAM (Partitioning Around Medoids)としても知られるもので,単純で高速の重心に基づいたメソッドである."KMedoids"は,クラスタのサイズが同じ位で各々の重心(メドイド)の周りに局所的に分布している場合によい.クラスタのサイズが大きく異なっていたり,絡み合っていたり,外れ値が存在したりする場合は,"KMedoids"が返す結果はあまりよくない可能性がある.
  • 次のプロットは,"KMedoids"法をトイデータ集合に適用した結果を示している.
  • "KMedoids"法は,k 個のクラスタを定義している k 個の重心を求めることを目的としている.各データ点は最近傍の重心に割り当てられる.ある重心に割り当てられたすべての点によってクラスタが形成される.
  • 最良の k 個のメドイドを求める手続きは,メドイドがクラスタの中心として定義されるのではない点を除いて"KMeans"と同じである.メドイドのクラスタは,最も中心的なクラスタ内のデータ点,つまりクラスタ内の他の点までの平均距離が最小であるデータ点として定義される."KMedoids""KMeans"のように平均を計算するものではないので,非数値空間で使用できる(距離関数で十分である).
  • 初期重心はランダムに選ばれるので,評価によって結果が変わるかもしれない.
  • サブオプションの"InitialCentroids"を使って初期重心をデータ点のリストとして指定できる.各々の初期重心は既存のデータ点と一致しなければならない.
  • 次は使用可能なサブオプションである.
  • "InitialCentroids" Automatic初期重心のリスト

例題

すべて開くすべて閉じる

  (3)

"KMedoids"クラスタリングメソッドを使って,値が近いクラスタを厳密に4つ求める:

ランダムな2Dベクトルを作成する:

"KMedoids"法を使って data 内に求まったクラスタをプロットする:

ClassifierFunctionを文字列のリストで訓練する:

クラスタ割当てを求め,要素をそのクラスタで集める:

オプション  (3)

"InitialCentroids"  (3)

"InitialCentroids"サブオプションを指定してクラスタを求める:

ランダムな色100色のリストを生成する:

"KMedoids"法を使って色をクラスタ化する:

"InitialCentroids"サブオプションを使って初期メドイドを指定する:

ランダムな2Dベクトルを作成する:

"KMedoids"法を使って求まった data 内のクラスタを求める:

"InitialCentroids"を設定してデータのクラスタリングを求める:

考えられる問題  (1)

ノイズのある2Dの月の形の訓練データ集合と検定データ集合を作成して可視化する:

"KMedoids"を使って2つのクラスタについてClassifierFunctionを訓練し,検定集合中のクラスタを求める:

クラスタを可視化すると,絡み合っているクラスタについては"KMedoids"のパフォーマンスがあまりよくないことが分かる: