LearnDistribution
LearnDistribution[{example1,example2,…}]
生成一个 LearnedDistribution[…],试图表示给定样例的基础分布.
更多信息和选项
- LearnDistribution 可用于许多类型的数据,包括数值型、名称型 (nominal) 和图像型数据.
- 每个 examplei 可以是单个数据元素、数据元素列表或数据元素的关联. 也可用 Dataset 对象给出样例.
- LearnDistribution 实际上假设独立地从 LearnDistribution 试图推断的基础分布中提取每个 examplei.
- LearnDistribution[examples] 给出一个 LearnedDistribution[…],可对其使用以下函数:
-
PDF[dist,…] 数据的概率或概率密度 RandomVariate[dist] 从分布中产生的随机样本 SynthesizeMissingValues[dist,…] 根据分布补充缺失的值 RarerProbability[dist,…] 计算生成 PDF 比给定样例低的样本的概率 - 可以给出以下选项:
-
FeatureExtractor Identity 怎样从要学习的样例中提取特征 FeatureNames Automatic 为输入数据分配的特征名称 FeatureTypes Automatic 假定的输入数据的特征类型 Method Automatic 使用哪种建模算法 PerformanceGoal Automatic 优化的目标 RandomSeeding 1234 应该在内部怎样对伪随机数字生成器进行播种 TimeGoal Automatic 花费多长时间来训练分类器 TrainingProgressReporting Automatic 训练过程中怎样报告进度 ValidationSet Automatic 训练过程中用来评估模型的数据集 - PerformanceGoal 的可能设置包括:
-
"DirectTraining" 直接在整个数据集上进行训练,不进行模型搜索 "Memory" 最小化分布的存储要求 "Quality" 最大化分布的模型质量 "Speed" 最大化 PDF 查询的速度 "SamplingSpeed" 最大化生成随机样本的速度 "TrainingSpeed" 最小化生成分布所用的时间 Automatic 自动在速度、质量和内存之间权衡 {goal1,goal2,…} 自动组合 goal1、goal2 等 - Method 的可能设置包括:
-
"ContingencyTable" 将数据离散化并存储每个可能的概率 "DecisionTree" 使用决策树来计算概率 "GaussianMixture" 使用混合高斯(正态)分布 "KernelDensityEstimation" 使用核混合分布 "Multinormal" 使用多元正态(高斯)分布 - 可使用 TrainingProgressReporting 的以下设置:
-
"Panel" 显示动态更新的图形面板 "Print" 用 Print 周期性地报告信息 "ProgressIndicator" 显示一个简单的 ProgressIndicator "SimplePanel" 动态更新的面板,不包括学习曲线 None 不报告任何信息 - RandomSeeding 可能的设置包括:
-
Automatic 每次调用方程时自动重新播种 Inherited 使用外部播种产生的随机数字 seed 明确给出整数或字符串作为种子 - 在选项 FeatureExtractor 中只能给出可逆特征提取器.
- LearnDistribution[…,FeatureExtractor"Minimal"] 表示内部的预处理应该越简单越好.
- 要先使用 ConformImages 一致化 (conform) 所有图像.
- Information[LearnedDistribution[…]] 生成有关分布及其估计性能的信息面板.
范例
打开所有单元关闭所有单元基本范例 (3)
范围 (3)
选项 (6)
Method (2)
在数值数据集上培训 "Multinormal" 分布:
在二维数据集上培训分布的所有可用方法("Multinormal"、"ContingencyTable"、"KernelDensityEstimation"、"DecisionTree" 和 "GaussianMixture"):
TimeGoal (2)
应用 (4)
比较训练集图像、测试集图像,学习到的分布的样本、另一个数据集中的图像和随机图像的概率密度:
在 Dataset 上直接训练分布:
可视化分布中变量 "PetalLength" 和 "SepalLength" 的随机样本,并将它们与数据集进行比较:
用分布和 SynthesizeMissingValues 根据不完整的样例生成完整样例:
通过 SynthesizeMissingValues 用学到的分布来估算缺失值:
文本
Wolfram Research (2019),LearnDistribution,Wolfram 语言函数,https://reference.wolfram.com/language/ref/LearnDistribution.html.
CMS
Wolfram 语言. 2019. "LearnDistribution." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/LearnDistribution.html.
APA
Wolfram 语言. (2019). LearnDistribution. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/LearnDistribution.html 年