产品
产品概览
Mathematica
Mathematica 学生版
Mathematica Home Edition
Wolfram
CDF Player
(免费下载)
可计算文档格式(CDF)
web
Mathematica
grid
Mathematica
Wolfram
Workbench
Wolfram
SystemModeler
Wolfram
Finance Platform
Mathematica
附加程序包
Wolfram|Alpha 产品
解决方案
解决方案概览
工程
航空航天与国防
化学工程
控制系统
电气工程
图像处理
工业工程
材料科学
机械工程
运筹学
光学
石油工程
生物技术与医药
生物信息学
医学影像
金融、统计、商业分析
精算科学
数据分析与挖掘
计量经济学
经济学
金融工程与数学
金融风险管理
统计
软件工程、内容传递
创作与出版
界面开发
软件工程
网页开发
科学
天文学
生物科学
化学
环境科学
地球科学
社会与行为科学
设计、艺术以及娱乐
游戏设计、特殊效果及衍生艺术
教育
STEM 教育倡议
高等教育
高职高专院校
中小学教育
学生
科技
可计算文档格式(CDF)
高性能并行计算(HPC)
参见:技术指南
购买
网上商店
其它购买方式
批量许可及站点许可证
联络销售部
软件
服务
升级
培训
书籍
Merchandise
技术支持
技术支持概览
Mathematica
参考资料
知识库
学习中心
技术服务
社区与论坛
培训
查看站点是否有许可证授权
Wolfram 用户门户
公司概况
关于 Wolfram Research
新闻与活动
Wolfram 博客
合作伙伴
工作机会
Mathematica
的历史
Stephen Wolfram 主页
联系我们
公司网站
全部站点
Wolfram|Alpha
演示项目
MathWorld
Integrator
Wolfram Functions Site
Mathematica Journal
Wolfram Media
Wolfram
Tones
Wolfram Science
Stephen Wolfram
THIS IS DOCUMENTATION FOR AN OBSOLETE PRODUCT.
SEE THE
DOCUMENTATION CENTER
FOR THE LATEST INFORMATION.
DOCUMENTATION CENTER SEARCH
New to
Mathematica
?
Find your learning path
»
Mathematica
>
数据处理
>
数值数据
>
探索数据分析
>
FindClusters
>
Mathematica
>
数据处理
>
统计数据分析
>
探索数据分析
>
FindClusters
>
Mathematica
>
数学和算法
>
统计数据分析
>
探索数据分析
>
FindClusters
>
MATHEMATICA 内置符号
把数据划分为聚类
教程 »
|
ClusteringComponents
Partition
Split
Gather
Nearest
FindShortestTour
DistanceTransform
MeanShift
参见 »
|
布尔运算
计算几何
探索数据分析
大型数组的处理
逻辑和布尔代数
数值数据
文本数据处理
序列调整和比较
统计数据分析
更多关于 »
FindClusters
FindClusters
把
分成相似元素组成的簇.
FindClusters
返回对应于各个簇中的
的
.
FindClusters
得到相同结果.
FindClusters
把
精确地分成
n
个簇.
更多信息
当距离
较大时,
FindClusters
[{
e
1
,
e
2
,
...
},
DistanceFunction
->
f
]
认为成对的元素相似度较低.
若
是数字组成的向量,则在默认情况下,
FindClusters
实际上使用欧几里得距离函数
EuclideanDistance
.
若
为
True
和
False
组成的列表,则在默认情况下,
FindClusters
根据元素不一致的正则分式而使用一个距离函数.
如果
为字符串,则在默认情况下,
FindClusters
根据从一个字符串到另一个需要改变的点数而使用一个距离函数.
可使用
Method
选项指定簇的不同方法. 设置有:
"Agglomerate"
获得分级的簇
"Optimize"
由局部优化获得簇
范例
关闭所有单元
例
(3)
获得由邻近值组成的簇:
获得四个簇:
代表簇元素各个规则的右边:
获得由邻近值组成的簇:
In[1]:=
Out[1]=
获得四个簇:
In[1]:=
Out[1]=
代表簇元素各个规则的右边:
In[1]:=
Out[1]=
范围
(5)
簇向量的实数值:
任何精度的簇数据:
布尔簇的 0,1或
True
,
False
:
字符串簇的数据:
在
里获得簇的五维向量:
选项
(5)
用
ManhattanDistance
作为连续数据的距离测量方法:
在默认的情况下,由
SquaredEuclideanDistance
获得簇:
用
DiceDissimilarity
作为布尔数据的距离测量方法:
在默认情况下,由
JaccardDissimilarity
获得簇:
用
HammingDistance
作为字符串数据的距离测量方法:
在默认情况下,由
EditDistance
获得簇:
定义一个距离函数为抽象函数:
按等级生成簇数据:
按默认方法获得簇:
应用
(2)
在二元数据中获得并可视化簇:
按照不同元素的数量生成基因序列簇:
属性和关系
(1)
当
Nearest
给出的元素最接近指定值时,
FindClusters
对数据编组:
可能存在的问题
(1)
获得对簇有影响的顺序元素:
巧妙范例
(2)
按照一致分布的随意点形成的簇,把一个方形划分为
n
段:
在英语字典里,把"ax"开始的词语分簇:
参见
ClusteringComponents
Partition
Split
Gather
Nearest
FindShortestTour
DistanceTransform
MeanShift
教程
把数据划分为聚类
更多关于
布尔运算
计算几何
探索数据分析
大型数组的处理
逻辑和布尔代数
数值数据
文本数据处理
序列调整和比较
统计数据分析
版本 6 的新功能