无监督机器学习
主题概览 »无监督机器学习尝试分析未标记数据并发现隐藏的关系. 它发现隐藏的模式、相似示例的聚类、基础数据分布或更简单的数据表示. 常见用例是疾病诊断、购物篮分析、消费者分组和异常检测. 无监督机器学习也有助于数据可视化. Wolfram 语言提供了大量的无监督学习方法,可通过基于目标的函数访问,这些函数可自动化大部分处理流程(特征选择和提取、模型选择和交叉验证……),并可以分析各种文本、图像或图形等数据,不仅仅是标准数组.
聚类分析 »
ClusterClassify — 将数据分成类
ClusteringMeasurements — 分析聚类处理的结果
FindClusters ▪ ClusteringTree ▪ ClusteringComponents ▪ ...
特征提取
FeatureExtraction — 了解如何从数据中提取特征
FeatureExtract ▪ FeatureExtractorFunction ▪ FeatureNearest
异常检测
AnomalyDetection — 根据数据学习异常检测函数
FindAnomalies ▪ DeleteAnomalies ▪ AnomalyDetectorFunction ▪ RarerProbability
降维
DimensionReduction — 了解如何将数据投影到低维空间
DimensionReduce ▪ DimensionReducerFunction
分布建模
LearnDistribution — 学习任何类型数据的底层分布
FindDistribution — 根据命名分布找到数据的表示
SynthesizeMissingValues — 通过从现有数据插补填补缺失值
可视化
FeatureSpacePlot — 在 2D 中可视化降维特征空间
FeatureSpacePlot3D — 在 3D 中可视化降维特征空间
FeatureValueImpactPlot — 绘制特征值对模型结果的影响
FeatureImpactPlot — 将每个特征的影响绘制在一起
CumulativeFeatureImpactPlot — 绘制每个特征的累积影响
FeatureValueDependencyPlot — 绘制结果对特征值的依赖关系
Dendrogram — 可视化层次聚类
特定的无监督学习方法
FindGraphCommunities — 在图中查找社区或聚类
SmoothKernelDistribution — 找到数据的核密度估计
FindHiddenMarkovStates — 从数据序列中推断隐藏的马尔可夫状态
Eigensystem ▪ SingularValueDecomposition ▪ PrincipalComponents ▪ KarhunenLoeveDecomposition
无监督学习方法 »
"GaussianMixture" — 使用混合高斯(正态)分布
"KernelDensityEstimation" — 使用核混合分布
"Multinormal" — 使用多元正态(高斯)分布
"KMeans" ▪ "DBSCAN" ▪ "Autoencoder" ▪ "TSNE" ▪ "UMAP" ▪ ...