"JarvisPatrick" (机器学习方法)

Details & Suboptions

  • "JarvisPatrick" 是一种基于邻居的聚类方法. "JarvisPatrick" 适用于任意形状和大小的聚类. 但是,它对参数敏感,当聚类密度不同或连接松散时可能会失败.
  • 下图展示了将 "JarvisPatrick" 方法应用于玩具数据集的结果:
  • 该算法根据数据点的最近邻的相似性来寻找聚类,并使用共享最近邻作为点间相似性的度量.
  • "JarvisPatrick" 中,邻居由半径为 ϵ 的球内的点定义. 每对至少有 p 个邻居的邻居都属于同一个聚类.
  • 可以给出以下子选项:
  • "NeighborhoodRadius" Automatic半径 ϵ
    "SharedNeighborsNumber" Automatic最小共享邻居数 p

范例

打开所有单元关闭所有单元

基本范例  (2)

使用 "JarvisPatrick" 方法查找附近值的聚类:

创建随机二维向量:

绘制使用 "JarvisPatrick" 方法找到的 data 中的聚类:

选项  (5)

DistanceFunction  (1)

Find the clustering of the strings using the edit distance and specifying the "NeighborhoodRadius":

"NeighborhoodRadius"  (2)

Find clusters using "JarvisPatrick":

Find clusters by specifying the "NeighborhoodRadius" suboption:

Define a set of two-dimensional data points, characterized by four somewhat nebulous clusters:

Plot different clusterings of the data using the "JarvisPatrick" method by varying the "NeighborhoodRadius":

"SharedNeighborsNumber"  (2)

通过改变 "NeighborsNumber" 子选项来查找聚类:

创建随机二维向量:

通过改变 "SharedNeighborsNumber",使用 "JarvisPatrick" 方法绘制数据点聚类图:

应用  (1)

创建并可视化带噪声的二维月形训练和测试数据集:

使用 "JarvisPatrick" 方法通过改变 "NeighborhoodRadius" 训练不同的 ClassifierFunction

已知 "NeighborhoodRadius" 的微小变化,查找并可视化测试集的不同聚类: