"SpanningTree" (機械学習メソッド)
- FindClusters,ClusterClassify,ClusteringComponentsのためのメソッドである.
- "SpanningTree" クラスタリングアルゴリズムを使ってデータを類似要素のクラスタに分割する.
詳細とサブオプション
- "SpanningTree"は近傍に基づいたクラスタリングメソッドである."SpanningTree"は任意のクラスタの形状とサイズに使用できる.しかし,クラスタの密度が異なったり結合が緩かったりする場合は失敗することがある.
- 次のプロットは"SpanningTree"法をトイデータ集合に適用した結果を示している.
- このアルゴリズムは,各近傍クラスタが互いに最も離れているクラスタの集合を求める.2つの近傍クラスタ i と j の間の距離 dijは両者の最近点の間の距離として定義される.
- 形式的には,"SpanningTree"法は(距離をグラフの重みとして使って)データ点の最小全域木を構築する.次に,木の最長の辺が刈り込まれる.各連結成分はクラスタに相当する.指定のクラスタ数に達すると刈込みが終了する.クラスタ数が指定されていない場合は,すべての辺が与えられた閾値よりも短くなった時点で刈込みが終了する.
- オプションDistanceFunctionを使って使用する距離が定義ができる.
- 次は,使用可能なサブオプションである.
-
"MaxEdgeLength" Automatic 枝刈りの長さの閾値
例題
すべて開くすべて閉じる例 (3)
"SpanningTree"メソッドを使って近い値のクラスタを求める:
"SpanningTree"メソッドを使ってClassifierFunctionを訓練する:
スコープ (2)
ClusteringComponentsを使ってクラスタ指標を求める:
ノイズのある2Dの月の形を作成して可視化し,データ集合を検証する:
"SpanningTree"を使ってClassifierFunctionを訓練し,検証集合中のクラスタを求める: