FindDistribution
FindDistribution[data]
找出一个简单的函数形式以拟合 data 的分布.
FindDistribution[data,n]
找出最多 n 个最佳分布.
FindDistribution[data,n,prop]
返回最多 n 个与属性 prop 关联的最佳分布.
FindDistribution[data,n,{prop1,prop2,…}]
返回最多 n 个与属性 prop1、prop2 等关联的最佳分布.
更多信息和选项
- 数据必须是单变量分布可能结果的列表.
- FindDistribution[data,n,All] 创建带有所有可能属性的 Dataset 对象.
- 支持的属性包括:
-
"BIC" 贝叶斯信息量准则 "AIC" 赤池信息量准则 "HQIC" 汉南-奎因信息量准则 "Score" 内部分数 "Complexity" 分布的复杂度 "LogLikelihood" LogLikelihood 值 "PearsonChiSquare" PearsonChiSquareTest p-值 "CramerVonMises" CramerVonMisesTest p-值 All 所有前述属性 - 可以设置下列选项:
-
MaxItems Infinity 混合分布中分布的最大数目 PerformanceGoal Automatic 优化目标 RandomSeeding Automatic 应该在内部对伪随机数生成器进行什么样的初始化 TargetFunctions Automatic 要考虑的分布类型 - PerformanceGoal 可能的设置包括:
-
"Speed" 使寻找分布所用的时间最小化 "Quality" 试图找出更好的分布 - TargetFunctions 可能的设置包括:
-
Automatic 自动选择分布 All 全部内置分布 "Continuous" 全部连续分布 "Discrete" 全部离散分布 {dist1,,} 分布 disti {{dist1,,}} 权重为 wi 的分布 disti - RandomSeeding 的可能设置包括:
-
Automatic 每次函数调用时自动重新播种 Inherited 使用外部播种的随机数字 seed 用明确给定的整数或字符串作为种子 - TargetFunctions 可能的连续分布有:BetaDistribution、CauchyDistribution、ChiDistribution、ChiSquareDistribution、ExponentialDistribution、ExtremeValueDistribution、FrechetDistribution、GammaDistribution、GumbelDistribution、HalfNormalDistribution、InverseGaussianDistribution、LaplaceDistribution、LevyDistribution、LogisticDistribution、LogNormalDistribution、MaxwellDistribution、NormalDistribution、ParetoDistribution、RayleighDistribution、StudentTDistribution、UniformDistribution、WeibullDistribution、HistogramDistribution.
- TargetFunctions 可能的离散分布是:BenfordDistribution、BinomialDistribution、BorelTannerDistribution、DiscreteUniformDistribution、GeometricDistribution、LogSeriesDistribution、NegativeBinomialDistribution、PascalDistribution、PoissonDistribution、WaringYuleDistribution、ZipfDistribution、HistogramDistribution、EmpiricalDistribution.
- 内部的信息量准则使用贝叶斯信息量准则并结合 TargetFunctions 的先验.
范例
打开所有单元关闭所有单元基本范例 (2)
范围 (3)
默认情况下,FindDistribution 返回比较简单的分布:
生成包含前两种最佳分布全部属性的 Dataset 对象:
选项 (5)
TargetFunctions (3)
当作连续数据处理时,用 GammaDistribution 估计数据的分布:
在不用 TargetFunctions 的情况下估计最佳拟合:
PerformanceGoal (1)
RandomSeeding (1)
应用 (5)
属性和关系 (1)
默认情况下,FindDistributionParameters 使用最大似然估计固定分布的分布参数. FindDistribution 则使用完整的贝叶斯方法,通过将贝叶斯信息准则与分布的先验相结合,以选择最佳分布和最佳参数.
从 StudentTDistribution 中抽样生成数据:
用 FindDistribution 估计拟合数据的最佳分布:
用 FindDistributionParameters 估计最佳参数,假定为 StudentTDistribution:
尽管 StudentTDistribution 将对数似然性最小化,但与之相比,LogisticDistribution 具有更大的先验概率和较小的复杂性.
比较各自的 LogLikelihood:
如果想要找到与 FindDistributionParameters 大致相近的参数,可以使用选项 TargetFunctions:
文本
Wolfram Research (2015),FindDistribution,Wolfram 语言函数,https://reference.wolfram.com/language/ref/FindDistribution.html (更新于 2017 年).
CMS
Wolfram 语言. 2015. "FindDistribution." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2017. https://reference.wolfram.com/language/ref/FindDistribution.html.
APA
Wolfram 语言. (2015). FindDistribution. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/FindDistribution.html 年