"SpanningTree" (机器学习方法)

Details & Suboptions

  • "SpanningTree" 是一种基于邻域的聚类方法. "SpanningTree" 适用于任意形状和大小的聚类;但是,当聚类密度不同或连接松散时,它可能会失败.
  • 下图展示了将 "SpanningTree" 方法应用于玩具数据集的结果:
  • 该算法找到相邻聚类之间距离最远的聚类集合. 两个相邻聚类 ij 之间的距离 dij 定义为它们最近点之间的距离:
  • 从形式上讲,"SpanningTree" 方法构造数据点的最小跨度树(使用距离作为图权重). 然后修剪树的最长边. 每个连通分量对应一个聚类. 当达到指定的聚类数时,修剪将停止. 如果未指定聚类数,则当所有边都短于给定阈值时,修剪将停止.
  • 选项 DistanceFunction 可用于定义要使用的距离.
  • 可以给出以下子选项:
  • "MaxEdgeLength" Automatic修剪长度阈值

范例

打开所有单元关闭所有单元

基本范例  (3)

使用 "SpanningTree" 方法查找附近值的聚类:

使用 "SpanningTree" 方法训练 ClassifierFunction

获取聚类分配并对数据进行聚类:

创建随机二维向量:

绘制通过 "SpanningTree" 方法识别的聚类:

范围  (2)

使用 ClusteringComponents 查找聚类索引:

创建并可视化带噪声的二维月形训练和测试数据集:

使用 "SpanningTree" 训练 ClassifierFunction 并找到测试集中的聚类:

可视化由 "SpanningTree" 找到的两个相互交织的聚类:

选项  (2)

DistanceFunction  (1)

使用曼哈顿距离对数据进行聚类:

"MaxEdgeLength"  (1)

通过指定 "MaxEdgeLength" 子选项来查找聚类: