製品
製品の一覧
Mathematica
Mathematica
学生エディション
Mathematica
ホームエディション
Wolfram
CDF Player
(無料ダウンロード)
CDF(計算可能ドキュメント形式)
web
Mathematica
grid
Mathematica
Wolfram
Workbench
Wolfram
SystemModeler
Wolfram
Finance Platform
Mathematica
アドオン
Wolfram|Alpha関連製品
ソリューション
ソリューションの一覧
工学
航空宇宙工学と防衛
化学工学
制御系
電気工学
画像処理
生産工学
材料科学
機械工学
オペレーションズリサーチ
光学
石油工学
バイオテクノロジーと医学
バイオインフォマティクス
医用画像処理
金融,統計,ビジネスの分析
保険数理
データの解析とマイニング
計量経済学
経済学
金融工学と数学
財務リスク管理
統計
ソフトウェア工学とコンテンツ配信
オーサリングと出版
インターフェース開発
ソフトウェア工学
Web開発
科学
天文学
バイオサイエンス
化学
環境科学
地球科学
社会・行動科学
デザイン,芸術,娯楽
ゲームデザイン・特殊効果・ジェネレーティブアート
教育
高等教育
短大・専門学校
初等・中等教育
学生
テクノロジー
CDF(計算可能ドキュメント形式)
高性能並列計算(HPC)
参照:テクノロジーガイド
ご購入
オンラインストア
他の購入方法
Volumeライセンスとサイトライセンス
販売部へのご連絡
ソフトウェア
サービス
アップグレード
トレーニング
書籍
Wolframグッズ
サポート
テクニカルサポートページ
Mathematica
ドキュメント
知識ベース
ラーニングセンター
テクニカルサービス
コミュニティ & フォーラム
トレーニング
サイトライセンスの確認
Wolframユーザポータル
会社概要
会社概要
ニュースとイベント
Wolframブログ
パートナーシップ
採用情報
Mathematica
の歴史
Stephen Wolframのホームページ
連絡先
Wolfram Webサイト
サイトの一覧
Wolfram|Alpha
デモンストレーションプロジェクト
MathWorld
Integrator
Wolfram Functions Site
Mathematica Journal
Wolfram Media
Wolfram
Tones
Wolfram Science
Stephen Wolfram
THIS IS DOCUMENTATION FOR AN OBSOLETE PRODUCT.
SEE THE
DOCUMENTATION CENTER
FOR THE LATEST INFORMATION.
DOCUMENTATION CENTER SEARCH
New to
Mathematica
?
Find your learning path
»
Mathematica
>
データの操作
>
数値データ
>
探索的データ解析
>
FindClusters
>
Mathematica
>
データの操作
>
統計的データ解析
>
探索的データ解析
>
FindClusters
>
Mathematica
>
数学とアルゴリズム
>
統計的データ解析
>
探索的データ解析
>
FindClusters
>
MATHEMATICA 組込みシンボル
データのクラスタ分割
チュートリアル »
|
ClusteringComponents
Partition
Split
Gather
Nearest
FindShortestTour
DistanceTransform
MeanShift
関連項目 »
|
ブール計算
計算幾何学
探索的データ解析
データの配列の操作
論理演算とブール代数
数値データ
テキストデータの処理
配列アラインメントと比較
統計的データ解析
その他 »
FindClusters
FindClusters
を同種の要素ごとにクラスタにまとめる.
FindClusters
各クラスタの
に対応する
を返す.
FindClusters
同じ結果を返す.
FindClusters
を厳密に
n
個のクラスタに分割する.
詳細
FindClusters
[{
e
1
,
e
2
,
...
},
DistanceFunction
->
f
]
は,ペアになった要素を,要素間の距離
が大きいほど類似性が低いものとして扱う.
が数のベクトルである場合,
FindClusters
はデフォルトにより,事実上ユークリッド距離関数
EuclideanDistance
を使用する.
が
True
と
False
からなるリストの場合,
FindClusters
はデフォルトにより,一致しない要素の正規化された割合に基づいて距離関数を使用する.
が文字列である場合,
FindClusters
はデフォルトにより,ひとつの文字列から別の文字列に移る際に必要な点の変更の数に基づいて距離関数を使用する.
Method
オプションを使って,異なるクラスタ化のメソッドが指定できる.以下は可能な設定の例である.
"Agglomerate"
階層的なクラスタ化を求める
"Optimize"
局所的最適化によるクラスタ化を求める
例題
すべて閉じる
例
(3)
近傍の値のクラスタを求める:
厳密に4つのクラスタを求める:
各規則の右辺でクラスタ化された要素を表す:
近傍の値のクラスタを求める:
In[1]:=
Out[1]=
厳密に4つのクラスタを求める:
In[1]:=
Out[1]=
各規則の右辺でクラスタ化された要素を表す:
In[1]:=
Out[1]=
スコープ
(5)
実数値のクラスタ化したベクトル:
任意精度のクラスタ化したデータ:
クラスタ化したブール値の0, 1または
True
,
False
データ:
文字列データのクラスタ化:
五次元ベクトルでクラスタを求める:
オプション
(5)
ManhattanDistance
を連続データの距離尺度として用いる:
デフォルトの
SquaredEuclideanDistance
で求まったクラスタ:
DiceDissimilarity
をブール値データの距離尺度として用いる:
デフォルトの
JaccardDissimilarity
で得られたクラスタ:
HammingDistance
を文字列データの距離尺度として用いる:
デフォルトの
EditDistance
で得られたクラスタ:
純関数として距離関数を定義:
データを階層的に処理して得られたクラスタ:
デフォルトのメソッドで得られたクラスタ:
アプリケーション
(2)
二変数データ中のクラスタを求め,可視化する:
要素単位の差分の数に基づいてゲノム配列をクラスタ化する:
特性と関係
(1)
FindClusters
はデータをグループ化するのに対し,
Nearest
は与えられた値に最も近い要素を返す:
考えられる問題
(1)
要素順が求まるクラスタに影響することがある:
おもしろい例題
(2)
均一に分布したランダムな点をクラスタ化することで正方形を
n
個の部分に分割する:
英語辞書中の「ax」で始まる語をクラスタにまとめる:
関連項目
ClusteringComponents
Partition
Split
Gather
Nearest
FindShortestTour
DistanceTransform
MeanShift
チュートリアル
データのクラスタ分割
その他
ブール計算
計算幾何学
探索的データ解析
データの配列の操作
論理演算とブール代数
数値データ
テキストデータの処理
配列アラインメントと比較
統計的データ解析
バージョン 6 の新機能