ClusteringComponents
ClusteringComponents[array]
给出一个数组,其中 array 中最低层的每个元素被一个表示该元素所在的连接的前景元件的整数索引所替代.
ClusteringComponents[array,n]
找到 n 个聚类.
ClusteringComponents[array,n,level]
找到 array 中指定层的聚类.
ClusteringComponents[image]
找到 image 中类似像素的最多的聚类.
ClusteringComponents[image,n]
在 image 中找到 n 个聚类.
更多信息和选项
- ClusteringComponents 可用于多种数据类型,包括数字、文字、图像以及日期和时间等数据类型.
- 可以通过以下方式指定聚类的数量:
-
Automatic 自动求得聚类数量 n 精确求得 n 个聚类 UpTo[n] 求得至多 n 个聚类 - 可给出下列选项:
-
CriterionFunction Automatic 选取何种方法的准则依据 DistanceFunction Automatic 使用的距离函数 FeatureExtractor Identity 如何提取要学的特征 FeatureNames Automatic 为输入数据分配的特征名称 FeatureTypes Automatic 为输入数据分配的特征类型 Method Automatic 使用何种方法 MissingValueSynthesis Automatic 怎样合成缺失值 PerformanceGoal Automatic 优化的目标 RandomSeeding 1234 应该在伪随机发生器内部完成的种子指定方式 Weights Automatic 给予每个样本的权重 - 缺省情况下,除非指定了 DistanceFunction,ClusteringComponents 将自动对数据进行预处理.
- DistanceFunction 的设置可以是任意距离、相异度函数,或定义两个值之间的距离的函数 f.
- PerformanceGoal 的可能设置包括:
-
Automatic 自动在速度、准确度和内存间进行取舍 "Quality" 最大化分类器的准确度 "Speed" 最大化分类器的速度 - Method 的可能设置包括:
-
Automatic 自动选择方法 "Agglomerate" 单链聚类算法 "DBSCAN" 具有噪声的基于密度的空间聚类算法 "GaussianMixture" 变分高斯混合算法 "JarvisPatrick" Jarvis–Patrick 聚类算法 "KMeans" k 均值聚类算法 "KMedoids" 围绕中心点划分算法 "MeanShift" mean-shift 聚类算法 "NeighborhoodContraction" 将数据点移向高密度区域 "SpanningTree" 基于最小生成树的聚类算法 "Spectral" 谱聚类算法 - "KMeans" 和 "KMedoids" 方法只能在聚类的数量已被指定的情况下使用.
- 方法 "DBSCAN"、"GaussianMixture"、"JarvisPatrick"、"MeanShift" 和 "NeighborhoodContraction" 只能在聚类数为 Automatic 时使用.
- 下图显示了玩具数据集上常用方法的结果:
- CriterionFunction 的可能设置包括:
-
"StandardDeviation" 均方根标准偏差 "RSquared" R 平方 "Dunn" Dunn 指数 "CalinskiHarabasz" Calinski–Harabasz 指数 "DaviesBouldin" Davies–Bouldin 指数 Automatic 内部指数 (internal index) - RandomSeeding 的可能设置包括:
-
Automatic 每次调用函数时都会自动重新设置种子 Inherited 使用外部种子随机数 seed 使用明确的整数或字符串作为种子
范例
打开所有单元关闭所有单元范围 (10)
选项 (13)
CriterionFunction (1)
DistanceFunction (1)
缺省情况下,EditDistance 被用来对字符串列表进行聚类分析:
使用 HammingDistance 根据相异字符的个数来进行聚类分析:
FeatureExtractor (1)
FeatureNames (1)
用 FeatureNames 命名特征,并在后面的规范中用它们的名称进行指代:
FeatureTypes (1)
用 FeatureTypes 强制特征的解释:
Method (5)
PerformanceGoal (1)
RandomSeeding (1)
属性和关系 (3)
ClusteringComponents 给出聚类指数数组,而 FindClusters 返回聚类列表:
把 ClusteringComponents 的结果转换成相似元素的分区:
FindClusters 给出同样的结果:
把 FindClusters 的结果转换成聚类指数的列表:
ClusteringComponents 给出同样的结果:
文本
Wolfram Research (2010),ClusteringComponents,Wolfram 语言函数,https://reference.wolfram.com/language/ref/ClusteringComponents.html (更新于 2022 年).
CMS
Wolfram 语言. 2010. "ClusteringComponents." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2022. https://reference.wolfram.com/language/ref/ClusteringComponents.html.
APA
Wolfram 语言. (2010). ClusteringComponents. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/ClusteringComponents.html 年