FindClusters

FindClusters[{e1,e2,}]
ei 分成相似元素组成的簇.

FindClusters[{e1v1,e2v2,}]
返回对应于各个簇中的 eivi.

FindClusters[{e1,e2,}{v1,v2,}]
得到相同结果.

FindClusters[label1e1,label2e2,]
返回与每个簇中的 ei 相对应的 labeli.

FindClusters[data,n]
data 分割为最多 n 个簇.

更多信息和选项更多信息和选项

  • FindClusters 可用于多种不同数据类型,包括数字、文字、图像以日期和时间.
  • 可给定以下选项:
  • CriterionFunctionAutomatic选择方法的标准
    DistanceFunctionAutomatic所用距离函数
    MethodAutomatic使用方式类型
    PerformanceGoalAutomatic优化性能方面
    WeightsAutomatic给定每个范例权重
  • 在默认情况下,以下距离函数用于不同类型的元素:
  • ColorDistance颜色
    EditDistance字符串
    EuclideanDistance数字数据
    ImageDistance图像
    JaccardDissimilarity布尔数据
  • DistanceFunction 的设定可以是任意距离或相异度函数,或定义两个值之间距离的函数 f.
  • PerformanceGoal 的可用设定包括:
  • Automatic速度、准确度和内存的自动权衡
    "Quality"最大化分类器的准确性
    "Speed"最大化分类器速度
  • Method 的可用设定包括:
  • Automatic自动选择方法
    "Agglomerate"聚类算法单独连接
    "DBSCAN"基于密度的有噪声应用的空间聚类
    "NeighborhoodContraction"向高密度区域转移范例
    "JarvisPatrick"JarvisPatrick 聚类算法
    "KMeans"k 均值聚类算法
    "MeanShift"均值平移聚类算法
    "KMedoids"中心点周围的分割
    "SpanningTree"树状聚类算法的最小填充
    "Spectral"谱聚类算法
    "GaussianMixture"变分高斯混合算法
  • "KMeans""KMedoids" 方法仅可用在指定聚类数目时使用.
  • CriterionFunction 的可用设定包括:
  • "StandardDeviation"均方根值(RMS)标准差
    "RSquared"R-平方
    "Dunn"邓恩指数
    "CalinskiHarabasz"CalinskiHarabasz 指数
    "DaviesBouldin"DaviesBouldin 指数
    Automatic内部指数

范例范例打开所有单元关闭所有单元

基本范例  (4)基本范例  (4)

找出数值附近的聚类:

In[1]:=
Click for copyable input
Out[1]=

找出准确的四个聚类:

In[1]:=
Click for copyable input
Out[1]=

用每个规则的右手边项表示聚类元素:

In[1]:=
Click for copyable input
Out[1]=

用关联键值表示聚类元素:

In[1]:=
Click for copyable input
Out[1]=
2007年引入
(6.0)
| 2016年更新
(11.0)