"SpanningTree" (機械学習メソッド)

詳細とサブオプション

  • "SpanningTree"は近傍に基づいたクラスタリングメソッドである."SpanningTree"は任意のクラスタの形状とサイズに使用できる.しかし,クラスタの密度が異なったり結合が緩かったりする場合は失敗することがある.
  • 次のプロットは"SpanningTree"法をトイデータ集合に適用した結果を示している.
  • このアルゴリズムは,各近傍クラスタが互いに最も離れているクラスタの集合を求める.2つの近傍クラスタ ij の間の距離 dijは両者の最近点の間の距離として定義される.
  • 形式的には,"SpanningTree"法は(距離をグラフの重みとして使って)データ点の最小全域木を構築する.次に,木の最長の辺が刈り込まれる.各連結成分はクラスタに相当する.指定のクラスタ数に達すると刈込みが終了する.クラスタ数が指定されていない場合は,すべての辺が与えられた閾値よりも短くなった時点で刈込みが終了する.
  • オプションDistanceFunctionを使って使用する距離が定義ができる.
  • 次は,使用可能なサブオプションである.
  • "MaxEdgeLength" Automatic枝刈りの長さの閾値

例題

すべて開くすべて閉じる

  (3)

"SpanningTree"メソッドを使って近い値のクラスタを求める:

"SpanningTree"メソッドを使ってClassifierFunctionを訓練する:

クラスタの割当手を取得してデータをクラスタ化する:

ランダムな2Dベクトルを作成する:

"SpanningTree"メソッドで識別されたクラスタをプロットする:

スコープ  (2)

ClusteringComponentsを使ってクラスタ指標を求める:

ノイズのある2Dの月の形を作成して可視化し,データ集合を検証する:

"SpanningTree"を使ってClassifierFunctionを訓練し,検証集合中のクラスタを求める:

"SpanningTree"で求まった,絡み合っている2つのクラスタを可視化する:

オプション  (2)

DistanceFunction  (1)

マンハッタン距離を使ってデータをクラスタ化する:

"MaxEdgeLength"  (1)

"MaxEdgeLength"サブオプションを指定してクラスタを見付ける: