监督机器学习

主题概览 »

监督机器学习是尝试使用在标记数据集上训练的数学模型对数据进行分类或预测结果. 它用于解决诸如评分估计(客户满意度、质量评估)、预测(价格、农业产量)和数据分类(垃圾邮件检测、版权或暴力内容)等问题. Wolfram 语言支持所有最常见的监督学习算法,方便地打包成高级功能,自动处理缺失数据插补、特征选择和提取、模型选择和交叉验证等任务.

分类

Classify 使用内置分类器或从示例中学习将数据分类

ClassifierFunction 应用于数据的分类器的符号表示

ClassifierMeasurements 测试数据的性能

回归

Predict 使用内置预测器从数据中预测值或从示例中学习

PredictorFunction 应用于数据的预测器的符号表示

PredictorMeasurements 测试数据的性能

对象检测

TrainImageContentDetector, TrainTextContentDetector 训练自定义检测器

ContentDetectorFunction 应用于数据的检测器的符号表示

序列预测

SequencePredict 从序列示例中预测后续元素

SequencePredictorFunction 序列预测器的符号表示

从行动中学习

BayesianMinimization 基于模型的任意目标函数的最小化

ActiveClassification 通过主动探测系统来学习分类器

ActivePrediction 通过主动探测系统来学习预测器

ActiveClassificationObject  ▪  ActivePredictionObject

特定监督学习方法

Nearest, NearestNeighborGraph 查找最近的邻居

FindFit 找到广义非线形拟合

LinearModelFit  ▪  LogitModelFit  ▪  NonlinearModelFit  ▪  GeneralizedLinearModelFit  ▪  ProbitModelFit

TimeSeriesModelFit 适合各种类型的时间序列

Interpolation 在数据集中找到值的插值

FindFormula 查找数据的简单符号公式

FindSequenceFunction 找到重现离散序列的函数

FindHiddenMarkovStates 在马尔可夫模型中找到最可能的路径

监督学习方法 »

"DecisionTree" 使用决策树

"LogisticRegression" 使用特征线性组合的概率

"RandomForest" 使用决策树的 BreimanCutler 集成

"SupportVectorMachine" 使用支持向量机进行分类

"GradientBoostedTrees"  ▪  "NearestNeighbors"  ▪  "Markov"  ▪  ...

机器学习选项

AnomalyDetector 如何检测输入数据中的异常

ComputeUncertainty 返回包括不确定性(如 Around) 的值

FeatureExtractor 如何提取要学习的特征

FeatureTypes 为输入数据假设的特征类型

MissingValuePattern 指定缺失值在数据中的表示方式

MissingValueSynthesis 如何合成缺失值

PerformanceGoal 是否优化内存、质量或速度

RandomSeeding 如何播种随机化

RecalibrationFunction 如何对模型预测进行后处理

TimeGoal 为培训分配多长时间等