Agglomerate


要素 , , の階層的クラスタリングを返す.


各クラスタの で表す.


各クラスタの で表す.

詳細詳細

  • を使うためには,まず階層的クラスタリングパッケージをロードしなくてはならない.それにはNeeds["HierarchicalClustering`"]を実行する必要がある.
  • Clusterオブジェクトを返す.
  • クラスタ階層はDendrogramPlotを使って見ることができる.
  • データ要素 は,それぞれの がすべて同じ次元であるような数値リスト,行列,テンソル,ブール要素のリスト,文字列のいずれかとなり得る.
  • 次のオプションを使うことができる:
  • DistanceFunctionAutomatic使用する距離(非類似度)尺度
    LinkageAutomatic使用するクラスタリングの連結法
  • デフォルト設定のDistanceFunction->Automaticでは,は数値データについてはSquaredEuclideanDistanceを,ブールデータについてはJaccardDissimilarityを,文字列データに対してはEditDistanceを使う.
  • DistanceFunctionの設定は,任意の距離,非類似度の関数,あるいは2つの値の間の距離を定義する純関数 f とすることができる.
  • は,メンバ要素間の非類似度がある場合に,クラスタ間の非類似度を決定する.
  • Linkageオプションに可能な設定は次の通りである:
  • "Single"クラスタ間の最小非類似度
    "Average"クラスタ間の平均非類似度
    "Complete"クラスタ間の最大非類似度
    "WeightedAverage"クラスタ間の重み付き平均非類似度
    "Centroid"クラスタの重心からの距離
    "Median"クラスタの中央値からの距離
    "Ward"ウォードの最小分散非類似度
    f純関数
  • 関数 f は,クラスタ k からクラスタ ij の融合により形成された新しいクラスタまでの距離を計算する.
  • f に与えられる引数は である.ここで,d はクラスタ間の距離であり,n はクラスタ内の要素の数である.