"NeighborhoodContraction" (机器学习方法)
- 用于 FindClusters、ClusterClassify 和 ClusteringComponents 的方法.
- 使用 "NeighborhoodContraction" 聚类算法将数据划分为相似元素的聚类.
Details & Suboptions
- "NeighborhoodContraction" 是一种基于邻域的聚类方法. "NeighborhoodContraction" 适用于任意形状和大小的聚类,但是,当聚类密度不同或相互交织时,它可能会失效.
- 下图展示了将 "NeighborhoodContraction" 方法应用于玩具数据集的结果:
- "NeighborhoodContraction" 方法通过迭代将数据点向更高密度区域移动. 在此过程中,数据点倾向于收敛到不同的固定点,每个固定点代表一个聚类.
- 形式上,在每一步中,每个数据点 被设置为其邻近点 的平均值,.
- 邻近点 被定义为半径为 ϵ 的球体内的所有点. 算法重复进行更新,直到点不再移动;属于一个聚类的所有点随后都会收缩到一起(在一定容差范围内). 这个算法等同于 "MeanShift" 方法,但使用了不同的邻域定义.
- 可以给出以下子选项:
-
"NeighborhoodRadius" Automatic 半径 ϵ
范例
打开所有单元关闭所有单元基本范例 (3)
使用 "NeighborhoodContraction" 聚类方法找到附近值的聚类:
使用 "NeighborhoodContraction" 方法在颜色列表上训练 ClassifierFunction:
在二维正态分布的混合上训练 ClassifierFunction:
选项 (3)
DistanceFunction (2)
通过指定 DistanceFunction 选项查找聚类:
通过指定不同的 DistanceFunction 选项来查找不同的聚类结构: