连续分布
我们这里所描述的函数是在连续性的单变量统计分布里最常用的一些函数. 您可以计算它们的密度、均值、方差、和其它相关的属性. 这些分布本身可以采用形如
的符号来表示. 函数如 Mean,可以给我们提供统计分布的性质,并且使用分布的符号表达式作为一个参数. "离散分布" 描述了许多常见的离散单变量统计分布.
| NormalDistribution[ | 具有均值 |
| HalfNormalDistribution[ | 尺度和参数 |
| LogNormalDistribution[ | 均值为 |
| InverseGaussianDistribution[ | 具有均值 |
对数正态分布 LogNormalDistribution[
,
] 是正态分布的随机变量的指数服从的分布. 当许多独立的随机变量以相乘的方式被组合时出现该分布. 半正态分布 HalfNormalDistribution[
] 和局限于域
的分布 NormalDistribution[0, 1/(
Sqrt[2/
])] 成正比 .
逆高斯分布(InverseGaussianDistribution[
,
]),有时被称为森林分布(Wald distribution),是有正漂移的布朗运动的首达时分布.
| ChiSquareDistribution[ | |
| InverseChiSquareDistribution[ | 具有自由度 |
| FRatioDistribution[n,m] | 分子为 n,分母为 m 的 |
| StudentTDistribution[ | 具有 |
| NoncentralChiSquareDistribution[ | 具有自由度 |
| NoncentralStudentTDistribution[ | 具有自由度 |
| NoncentralFRatioDistribution[n,m, | 分子自由度为 |
如果
, ...,
是独立的正态随机变量,其方差为1,均值为0,那么
服从一个自由度为
的
分布 . 如果一个正态变量通过减去它的均值,并除以标准差来标准化,那么这样的数值结果的平方和服从该分布.
分布被广泛用于描述正态样本的方差.
如果
服从一个自由度为
的
分布,
服从逆
分布 InverseChiSquareDistribution[
]. 一个自由度为
和尺度为
的尺度化的逆
分布 可以由 InverseChiSquareDistribution[
,
] 给出. 逆
分布通常用作正态分布样本的贝叶斯分析中的方差的先验分布.
一个服从学生
分布 的变量也可以写为一个正态随机变量的函数. 假设
和
是独立的随机变量,其中
是一个标准正态分布,而
是一个自由度为
的
变量. 在这种情况下,
服从自由度为
的
分布. 学生
分布关于纵轴对称, 并且表示一个正态变量和它的标准差之间的比率的特点. 定位参数和尺度参数可以包括在 StudentTDistribution[
,
,
] 里,并且用
和
来表示. 当
,
分布和柯西分布( Cauchy distribution) 一样.
-比率 分布 是两个独立
变量除以它们各自的自由度的比率的分布. 它通常用于假设检验中比较两组人群的方差.
方差为
和均值非零的
个正态分布的随机变量的平方和服从一个非中心化
分布NoncentralChiSquareDistribution[
,
]. 非中心化参数
是随机变量的均值的平方和. 注意,在我们的文档的不同地方,
或
被作为非中心化参数.
非中心化学生
分布 NoncentralStudentTDistribution[
,
] 描述了比率
,其中
是一个自由度为
的中心随机变量
,而
是一个方差为
和均值为
的独立正态分布的随机变量.
非中心化
-比率 分布 NoncentralFRatioDistribution[n, m,
] 是
对
比率的分布,其中
是一个非中心化参数为
和自由度为
的非中心化
随机变量,而
是一个自由度为
的中心化
随机变量.
| TriangularDistribution[{a,b}] | 区间在 |
| TriangularDistribution[{a,b},c] | 区间为 |
| UniformDistribution[{min,max}] | 区间在 |
三角分布 TriangularDistribution[{a, b}, c] 是区间
上的三角分布,其最大概率值为
并且满足
. 如果
是
,TriangularDistribution[{a, b}, c] 是对称三角分布 TriangularDistribution[{a, b}].
均匀分布 UniformDistribution[{min, max}], 通常称为矩形分布, 它的特点是它的随机变量的值在每个位置都有相同的概率.我们常见的一个均匀分布随机变量的例子是在一条范围从 min 到 max 的线上随机选择的点的位置.
| BetaDistribution[ | 形状参数为 |
| CauchyDistribution[a,b] | 具有定位参数 a 和尺度参数 b 的柯西分布 |
| ChiDistribution[ | |
| ExponentialDistribution[ | 尺度参数和 |
| ExtremeValueDistribution[ | 具有定位参数 |
| GammaDistribution[ | 具有形状参数 |
| GumbelDistribution[ | 具有定位参数 |
| InverseGammaDistribution[ | 具有形状参数 |
| LaplaceDistribution[ | 均值为 |
| LevyDistribution[ | 具有定位参数 |
| LogisticDistribution[ | 均值为 |
| MaxwellDistribution[ | 尺度参数为 |
| ParetoDistribution[k, | 具有最小值参数 k 和形状参数 |
| RayleighDistribution[ | 尺度参数为 |
| WeibullDistribution[ | 形状参数为 |
如果
在
上均匀分布,那么随机变量
服从一个柯西分布 CauchyDistribution[a, b],这里
并且
.
当
并且
,伽马分布 GammaDistribution[
,
] 描述了
个单位的正态随机变量的平方和的分布. 这种类型的伽马分布被称为具有
个自由度的
分布. 当
,伽马分布以指数分布 的形式出现ExponentialDistribution[
],并且经常用以描述事件之间的等待时间.
如果一个随机变量
服从伽马分布 GammaDistribution[
,
],
服从逆伽马分布 InverseGammaDistribution[
, 1/
]. 如果一个随机变量
服从 InverseGammaDistribution[1/2,
/2],
服从 Lévy 分布 LevyDistribution[
,
].
当
和
是具有相同尺度参数的独立伽马分布时,随机变量
服从贝塔分布 BetaDistribution[
,
], 其中
和
是伽马变量的形状参数.
分布 ChiDistribution[
] 是一个
随机变量的平方根服从的分布. 对于
,
分布和
的HalfNormalDistribution[
] 相同. 对于
,
分布和
的瑞利分布 RayleighDistribution[
] 相同. 对于
,
分布和
的 Maxwell-Boltzmann 分布 MaxwellDistribution[
] 相同.
拉普拉斯分布 LaplaceDistribution[
,
] 是两个服从相同的指数分布的独立的随机变量的差值的分布. 当一个长尾分布是比较理想的分布时,洛杰斯蒂克分布 LogisticDistribution[
,
]经常被用来代替正态分布.
帕累托分布 ParetoDistribution[k,
] 可以用来描述收入,并用
代表可能的最低收入.
威布尔分布 WeibullDistribution[
,
] 通常用于工程上描述一个对象的生命期. 极值分布 ExtremeValueDistribution[
,
] 是服从不同分布的大样本中的最大值的限制性分布,包括正态分布. 在这样的样本中最小值的限制性分布是冈贝尔分布,GumbelDistribution[
,
]. "极值"和"冈贝尔分布"这两个名字有时可以交替使用,因为最大和最小极值的分布由一个服从线性变化的变量相关. 极值分布有时也被称为对数-威布尔分布,因为在一个服从极值分布的随机变量和一个妥善偏移和尺度化的服从威布尔分布的随机变量之间存在对数关系.
| PDF[dist,x] | 概率密度函数,自变量为 x |
| CDF[dist,x] | 累积分布函数,自变量为 x |
| InverseCDF[dist,q] | 使 CDF[dist, x] 等于 q 的 x 的值 |
| Quantile[dist,q] | q 次分位数 |
| Mean[dist] | 均值 |
| Variance[dist] | 方差 |
| StandardDeviation[dist] | 标准差 |
| Skewness[dist] | 偏度系数 |
| Kurtosis[dist] | 峰度系数 |
| CharacteristicFunction[dist,t] | 特征函数 |
| Expectation[f[x],x | 当 x 服从分布 dist 时, |
| Median[dist] | 中位数 |
| Quartiles[dist] | dist 的第 |
| InterquartileRange[dist] | 第一和第三四分位数之间的差距 |
| QuartileDeviation[dist] | 四分位间距的一半 |
| QuartileSkewness[dist] | 四分偏度系数的测量 |
| RandomVariate[dist] | 服从指定分布的伪随机数 |
| RandomVariate[dist,dims] | 维度为 dims 并且元素服从指定分布的伪随机数组 |
上面的表格给出可用于 Mathematica 中的分布的一些更常见函数的列表.
在点
的累积分布函数(CDF)由分布的概率密度函数(PDF)直到点
的积分给出. 因此,概率密度函数可以由对累积分布函数求导得到(可能在广义意义上). 在该软件包中,概率分布由符号化的形式表示. 如果
是一个数值型数据, PDF[dist, x] 计算在点
处的密度,否则,函数就保留符号化表达式的形式. 同样地,CDF[dist, x] 给出了累积分布.
逆累积分布函数 InverseCDF[dist, q] 提供了
点的值,在该点 CDF[dist, x] 达到
. 中位数由InverseCDF[dist, 1/2] 给出. 四分位数、十分位数和百分位数是逆累积分布函数的特殊值. 四分位数的偏度等于
,这里
、
和
分别是第一,第二和第三四分位数. 逆累积分布函数用于构建统计参数的置信区间. 对于连续分布,InverseCDF[dist, q] 和 Quantile[dist, q] 是相等的.
均值 Mean[dist] 是服从 dist 分布的随机变量的期望值,经常可以表示为
. 均值由
给出,其中
是分布的概率密度函数. 方差 Variance[dist] 由
给出. 方差的平方根被称为标准差,通常用
表示.
我们的 Skewness[dist] 和 Kurtosis[dist] 函数给我们提供了形状统计信息,用以分别总结一个分布的不对称性和峰度. 偏度系数由
给出,而峰度系数由
给出.
特征函数 CharacteristicFunction[dist, t] 由
给出. 在离散分布的情况下,
. 每个分布有一个独特的特征函数,该特征函数有时被用来代替概率密度函数定义我们的分布.
一个函数 g 的期望值 Expectation[g[x], x
dist] 由
给出. 在离散的情况下,函数 g 的期望值由
给出.
RandomVariate[dist] 给出服从指定分布的伪随机数字.
| In[1]:= |
| Out[1]= |
| In[2]:= |
| Out[2]= |
| In[3]:= |
| Out[3]= |
| In[4]:= |
| Out[4]= | ![]() |
| In[5]:= |
| Out[5]= |

