无监督机器学习

主题概览 »

无监督机器学习尝试分析未标记数据并发现隐藏的关系. 它发现隐藏的模式、相似示例的聚类、基础数据分布或更简单的数据表示. 常见用例是疾病诊断、购物篮分析、消费者分组和异常检测. 无监督机器学习也有助于数据可视化. Wolfram 语言提供了大量的无监督学习方法,可通过基于目标的函数访问,这些函数可自动化大部分处理流程(特征选择和提取、模型选择和交叉验证),并可以分析各种文本、图像或图形等数据,不仅仅是标准数组.

聚类分析 »

ClusterClassify 将数据分成类

ClusteringMeasurements 分析聚类处理的结果

FindClusters  ▪  ClusteringTree  ▪  ClusteringComponents  ▪  ...

特征提取

FeatureExtraction 了解如何从数据中提取特征

FeatureExtract  ▪  FeatureExtractorFunction  ▪  FeatureNearest

异常检测

AnomalyDetection 根据数据学习异常检测函数

FindAnomalies  ▪  DeleteAnomalies  ▪  AnomalyDetectorFunction  ▪  RarerProbability

降维

DimensionReduction 了解如何将数据投影到低维空间

DimensionReduce  ▪  DimensionReducerFunction

分布建模

LearnDistribution 学习任何类型数据的底层分布

FindDistribution 根据命名分布找到数据的表示

SynthesizeMissingValues 通过从现有数据插补填补缺失值

可视化

FeatureSpacePlot 在 2D 中可视化降维特征空间

FeatureSpacePlot3D 在 3D 中可视化降维特征空间

FeatureValueImpactPlot 绘制特征值对模型结果的影响

FeatureImpactPlot 将每个特征的影响绘制在一起

CumulativeFeatureImpactPlot 绘制每个特征的累积影响

FeatureValueDependencyPlot 绘制结果对特征值的依赖关系

Dendrogram 可视化层次聚类

特定的无监督学习方法

FindGraphCommunities 在图中查找社区或聚类

SmoothKernelDistribution 找到数据的核密度估计

FindHiddenMarkovStates 从数据序列中推断隐藏的马尔可夫状态

Eigensystem  ▪  SingularValueDecomposition  ▪  PrincipalComponents  ▪  KarhunenLoeveDecomposition

无监督学习方法 »

"GaussianMixture" 使用混合高斯(正态)分布

"KernelDensityEstimation" 使用核混合分布

"Multinormal" 使用多元正态(高斯)分布

"KMeans"  ▪  "DBSCAN"  ▪  "Autoencoder"  ▪  "TSNE"  ▪  "UMAP"  ▪  ...