监督机器学习
主题概览 »监督机器学习是尝试使用在标记数据集上训练的数学模型对数据进行分类或预测结果. 它用于解决诸如评分估计(客户满意度、质量评估……)、预测(价格、农业产量……)和数据分类(垃圾邮件检测、版权或暴力内容……)等问题. Wolfram 语言支持所有最常见的监督学习算法,方便地打包成高级功能,自动处理缺失数据插补、特征选择和提取、模型选择和交叉验证等任务.
分类
Classify — 使用内置分类器或从示例中学习将数据分类
ClassifierFunction — 应用于数据的分类器的符号表示
ClassifierMeasurements — 测试数据的性能
回归
Predict — 使用内置预测器从数据中预测值或从示例中学习
PredictorFunction — 应用于数据的预测器的符号表示
PredictorMeasurements — 测试数据的性能
对象检测
TrainImageContentDetector, TrainTextContentDetector — 训练自定义检测器
ContentDetectorFunction — 应用于数据的检测器的符号表示
序列预测
SequencePredict — 从序列示例中预测后续元素
SequencePredictorFunction — 序列预测器的符号表示
从行动中学习
BayesianMinimization — 基于模型的任意目标函数的最小化
ActiveClassification — 通过主动探测系统来学习分类器
ActivePrediction — 通过主动探测系统来学习预测器
ActiveClassificationObject ▪ ActivePredictionObject
特定监督学习方法
Nearest, NearestNeighborGraph — 查找最近的邻居
FindFit — 找到广义非线形拟合
LinearModelFit ▪ LogitModelFit ▪ NonlinearModelFit ▪ GeneralizedLinearModelFit ▪ ProbitModelFit
TimeSeriesModelFit — 适合各种类型的时间序列
Interpolation — 在数据集中找到值的插值
FindFormula — 查找数据的简单符号公式
FindSequenceFunction — 找到重现离散序列的函数
FindHiddenMarkovStates — 在马尔可夫模型中找到最可能的路径
监督学习方法 »
"DecisionTree" — 使用决策树
"LogisticRegression" — 使用特征线性组合的概率
"RandomForest" — 使用决策树的 Breiman–Cutler 集成
"SupportVectorMachine" — 使用支持向量机进行分类
"GradientBoostedTrees" ▪ "NearestNeighbors" ▪ "Markov" ▪ ...
机器学习选项
AnomalyDetector — 如何检测输入数据中的异常
ComputeUncertainty — 返回包括不确定性(如 Around) 的值
FeatureExtractor — 如何提取要学习的特征
FeatureTypes — 为输入数据假设的特征类型
MissingValuePattern — 指定缺失值在数据中的表示方式
MissingValueSynthesis — 如何合成缺失值
PerformanceGoal — 是否优化内存、质量或速度
RandomSeeding — 如何播种随机化
RecalibrationFunction — 如何对模型预测进行后处理
TimeGoal — 为培训分配多长时间等