ClusteringComponents
ClusteringComponents[array]
array の最低レベルにある各要素をその要素が含まれるクラスタを表す整数指標で置き換えた配列を与える.
ClusteringComponents[array,n]
n 個のクラスタを求める.
ClusteringComponents[array,n,level]
array の指定レベルのクラスタを求める.
ClusteringComponents[image]
image の値が同じような画素のクラスタを求める.
ClusteringComponents[image,n]
image 中のクラスタを n 個求める.
詳細とオプション
- ClusteringComponentsは,数値,テキスト,画像,日付と時刻等を含むさまざまなデータ型に使うことができる.
- クラスタの数は以下の形で指定できる.
-
Automatic クラスタ数を自動的に求める n 厳密に n 個のクラスタを求める UpTo[n] 最大で n 個のクラスタを求める - 使用可能なオプション
-
CriterionFunction Automatic メソッド選択の基準 DistanceFunction Automatic 使用する距離関数 FeatureExtractor Identity そこから学ぶ特徴をどのように抽出するか FeatureNames Automatic 入力データに割り当てる特徴名 FeatureTypes Automatic 入力データに仮定する特徴タイプ Method Automatic 使用するメソッド MissingValueSynthesis Automatic 欠落値の合成方法 PerformanceGoal Automatic パフォーマンスのどの面について最適化するか RandomSeeding 1234 どのような擬似乱数生成器のシードを内部的に使うべきか Weights Automatic 各例に与える重み - デフォルトでDistanceFunctionが指定されていなければ,ClusteringComponentsは自動的にデータを前処理する.
- DistanceFunctionの設定は,任意の距離関数,非類似度関数,または2つの値間の距離を定義する関数 f でよい.
- PerformanceGoalの可能な設定
-
Automatic 速度,確度,メモリ間の自動トレードオフ "Quality" 分類器の確度を最大にする "Speed" 分類器の速度を最大にする - Methodの可能な設定
-
Automatic メソッドを自動選択する "Agglomerate" 単一の結合クラスタ化アルゴリズム "DBSCAN" ノイズがあるアプリケーションの密度に基づいた空間クラスタ化 "GaussianMixture" ガウス混合アルゴリズムのバリエーション "JarvisPatrick" Jarvis–Patrickクラスタ化アルゴリズム "KMeans" k 平均クラスタ化アルゴリズム "KMedoids" メドイドの周りで分割する "MeanShift" 平均シフトクラスタ化アルゴリズム "NeighborhoodContraction" データ点を高密度領域にシフトする "SpanningTree" 最小全域木に基づいたクラスタ化アルゴリズム "Spectral" スペクトルクラスタ化アルゴリズム - "KMeans"法と"KMedoids"法はクラスタ数が指定されているときにしか使用できない.
- "DBSCAN","GaussianMixture","JarvisPatrick","MeanShift","NeighborhoodContraction"の各メソッドは,クラスタ数がAutomaticのときにしか使用できない.
- 次のプロットは一般的なメソッドをトイデータ集合に適用した結果を示している.
- CriterionFunctionの可能な設定
-
"StandardDeviation" 二乗平均平方根標準偏差 "RSquared" R平方 "Dunn" Dunn指標 "CalinskiHarabasz" Calinski–Harabasz指標 "DaviesBouldin" Davies–Bouldin指標 Automatic 内部指標 - RandomSeedingの可能な設定
-
Automatic 関数が呼び出されるたびに自動的にシードを変える Inherited 外部シードの乱数を使う seed 明示的な整数または文字列をシードとして使う
例題
すべて開くすべて閉じるスコープ (10)
オプション (13)
CriterionFunction (1)
DistanceFunction (1)
デフォルトで,文字列リストのクラスタ化にはEditDistanceが使われる:
HammingDistanceを使って,一致しない文字の数に基づいてクラスタ化する:
FeatureExtractor (1)
カスタムのFeatureExtractorを作って特徴を抽出する:
FeatureExtractorを使って新たなクラスタ化要素を見る:
FeatureNames (1)
FeatureNamesを使って特徴に名前を付け,以降の指定でこの名前を参照する:
FeatureTypes (1)
FeatureTypesを使って特徴の解釈を強制する:
Method (5)
PerformanceGoal (1)
上で生成したベクトルのクラスタ化を計算し,基準に従って操作を評価する:
PerformanceGoalを"Quality"に設定して同じ操作を行う:
RandomSeeding (1)
特性と関係 (3)
ClusteringComponentsはクラスタ指標の配列を与えるのに対し,FindClustersはクラスタのリストを返す:
ClusteringComponentsの結果を類似要素の分割に変換する:
FindClustersも同じ結果を返す:
FindClustersの結果をクラスタ指標のリストに変換する:
ClusteringComponentsも同じ結果を返す:
テキスト
Wolfram Research (2010), ClusteringComponents, Wolfram言語関数, https://reference.wolfram.com/language/ref/ClusteringComponents.html (2022年に更新).
CMS
Wolfram Language. 2010. "ClusteringComponents." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2022. https://reference.wolfram.com/language/ref/ClusteringComponents.html.
APA
Wolfram Language. (2010). ClusteringComponents. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/ClusteringComponents.html