连续分布

我们这里所描述的函数是在连续性的单变量统计分布里最常用的一些函数. 您可以计算它们的密度、均值、方差、和其它相关的属性. 这些分布本身可以采用形如 的符号来表示. 函数如 Mean,可以给我们提供统计分布的性质,并且使用分布的符号表达式作为一个参数. "离散分布" 描述了许多常见的离散单变量统计分布.

NormalDistribution[μ,σ]具有均值 μ 和标准差 σ 的正态(高斯)分布
HalfNormalDistribution[θ]尺度和参数 θ 成反比的半正态分布
LogNormalDistribution[μ,σ]均值为 μ,标准差为 σ 的对数正态分布
InverseGaussianDistribution[μ,λ]具有均值 μ 和尺度 λ 的逆高斯分布

和正态分布相关的分布.

对数正态分布 LogNormalDistribution[μ,σ] 是正态分布的随机变量的指数服从的分布. 当许多独立的随机变量以相乘的方式被组合时出现该分布. 半正态分布 HalfNormalDistribution[θ] 和局限于域 的分布 NormalDistribution[0,1/(θ Sqrt[2/π])] 成正比 .

逆高斯分布(InverseGaussianDistribution[μ,λ]),有时被称为森林分布(Wald distribution),是有正漂移的布朗运动的首达时分布.

ChiSquareDistribution[ν]ν 个自由度的 分布
InverseChiSquareDistribution[ν]具有自由度 ν 的逆 分布
FRatioDistribution[n,m]分子为 n,分母为 m 比率分布
StudentTDistribution[ν]具有 ν 个自由度的学生 t 分布
NoncentralChiSquareDistribution[ν,λ]具有自由度 ν 和非中心化参数 λ 的非中心卡方分布( 分布)
NoncentralStudentTDistribution[ν,δ]具有自由度 ν 和非中心化参数 δ 的学生 t 分布
NoncentralFRatioDistribution[n,m,λ]分子自由度为 和分母自由度为 m 的非中心化 -比率分布, 分子非中心化参数为 λ

和正态分布样本相关的分布.

如果 , , 是独立的正态随机变量,其方差为1,均值为0,那么 服从一个自由度为 分布 . 如果一个正态变量通过减去它的均值,并除以标准差来标准化,那么这样的数值结果的平方和服从该分布. 分布被广泛用于描述正态样本的方差.

如果 服从一个自由度为 分布 服从逆 分布 InverseChiSquareDistribution[ν]. 一个自由度为 和尺度为 的尺度化的逆 分布 可以由 InverseChiSquareDistribution[ν,ξ] 给出. 逆 分布通常用作正态分布样本的贝叶斯分析中的方差的先验分布.     

一个服从学生 分布 的变量也可以写为一个正态随机变量的函数. 假设 是独立的随机变量,其中 是一个标准正态分布,而 是一个自由度为 变量. 在这种情况下, 服从自由度为 分布. 学生 分布关于纵轴对称, 并且表示一个正态变量和它的标准差之间的比率的特点. 定位参数和尺度参数可以包括在 StudentTDistribution[μ,σ,ν] 里,并且用 μσ 来表示. 当 分布和柯西分布( Cauchy distribution) 一样.

比率 分布 是两个独立 变量除以它们各自的自由度的比率的分布. 它通常用于假设检验中比较两组人群的方差.

由均值非零的正态分布得到的分布称为非中心化分布.

方差为 和均值非零的 个正态分布的随机变量的平方和服从一个非中心化 分布NoncentralChiSquareDistribution[ν,λ]. 非中心化参数 是随机变量的均值的平方和. 注意,在我们的文档的不同地方, 被作为非中心化参数.

非中心化学生 分布 NoncentralStudentTDistribution[ν,δ] 描述了比率 ,其中 是一个自由度为 的中心随机变量 ,而 是一个方差为 和均值为 的独立正态分布的随机变量.

非中心化 比率 分布 NoncentralFRatioDistribution[n,m,λ] 比率的分布,其中 是一个非中心化参数为 和自由度为 的非中心化 随机变量,而 是一个自由度为 的中心化 随机变量.

TriangularDistribution[{a,b}]区间在 上的对称三角分布
TriangularDistribution[{a,b},c]区间为 ,最大值为 c 的三角分布
UniformDistribution[{min,max}]区间在 上的均匀分布

分段线性分布.

三角分布 TriangularDistribution[{a,b},c] 是区间 上的三角分布,其最大概率值为 并且满足. 如果 TriangularDistribution[{a,b},c] 是对称三角分布 TriangularDistribution[{a,b}].

均匀分布 UniformDistribution[{min,max}], 通常称为矩形分布, 它的特点是它的随机变量的值在每个位置都有相同的概率.我们常见的一个均匀分布随机变量的例子是在一条范围从 minmax 的线上随机选择的点的位置.

BetaDistribution[α,β]形状参数为 αβ 的连续贝塔分布
CauchyDistribution[a,b]具有定位参数 a 和尺度参数 b 的柯西分布
ChiDistribution[ν]ν 个自由度的 分布
ExponentialDistribution[λ]尺度参数和 λ 成反比的指数分布
ExtremeValueDistribution[α,β]具有定位参数 α 和尺度参数 β 的极大值 (FisherTippett) 分布
GammaDistribution[α,β]具有形状参数 α 和尺度参数 β 的伽马分布
GumbelDistribution[α,β]具有定位参数 α 和尺度参数 β 的冈贝尔极小值分布
InverseGammaDistribution[α,β]具有形状参数 α 和尺度参数 β 的逆伽马分布
LaplaceDistribution[μ,β]均值为 μ,尺度参数为 β 的拉普拉斯(双指数)分布
LevyDistribution[μ,σ]具有定位参数 μ 和扩散参数 σ 的列维(Lévy)分布
LogisticDistribution[μ,β]均值为, 尺度参数为 β 的洛杰斯蒂克分布
MaxwellDistribution[σ]尺度参数为 σ 的Maxwell (MaxwellBoltzmann) 分布
ParetoDistribution[k,α]具有最小值参数 k 和形状参数 α 的 Pareto 分布
RayleighDistribution[σ]尺度参数为 σ 的瑞利分布
WeibullDistribution[α,β]形状参数为 α 和尺度参数为 β 的威布尔分布

其他连续性的统计分布.

如果 上均匀分布,那么随机变量 服从一个柯西分布 CauchyDistribution[a,b],这里 并且 .

并且 伽马分布 GammaDistribution[α,λ] 描述了 个单位的正态随机变量的平方和的分布. 这种类型的伽马分布被称为具有 个自由度的 分布. 当 ,伽马分布以指数分布 的形式出现ExponentialDistribution[λ],并且经常用以描述事件之间的等待时间.

如果一个随机变量 服从伽马分布 GammaDistribution[α,β] 服从逆伽马分布 InverseGammaDistribution[α,1/β]. 如果一个随机变量 服从 InverseGammaDistribution[1/2,σ/2] 服从 Lévy 分布 LevyDistribution[μ,σ].

是具有相同尺度参数的独立伽马分布时,随机变量 服从贝塔分布 BetaDistribution[α,β], 其中 是伽马变量的形状参数.

分布 ChiDistribution[ν] 是一个 随机变量的平方根服从的分布. 对于 分布和 HalfNormalDistribution[θ] 相同. 对于 分布和 瑞利分布 RayleighDistribution[σ] 相同. 对于 分布和 MaxwellBoltzmann 分布 MaxwellDistribution[σ] 相同.

拉普拉斯分布 LaplaceDistribution[μ,β] 是两个服从相同的指数分布的独立的随机变量的差值的分布. 当一个长尾分布是比较理想的分布时,洛杰斯蒂克分布 LogisticDistribution[μ,β]经常被用来代替正态分布.

帕累托分布 ParetoDistribution[k,α] 可以用来描述收入,并用 代表可能的最低收入.

威布尔分布 WeibullDistribution[α,β] 通常用于工程上描述一个对象的生命期. 极值分布 ExtremeValueDistribution[α,β] 是服从不同分布的大样本中的最大值的限制性分布,包括正态分布. 在这样的样本中最小值的限制性分布是冈贝尔分布GumbelDistribution[α,β]. 极值冈贝尔分布这两个名字有时可以交替使用,因为最大和最小极值的分布由一个服从线性变化的变量相关. 极值分布有时也被称为对数-威布尔分布,因为在一个服从极值分布的随机变量和一个妥善偏移和尺度化的服从威布尔分布的随机变量之间存在对数关系.

PDF[dist,x]概率密度函数,自变量为 x
CDF[dist,x]累积分布函数,自变量为 x
InverseCDF[dist,q]使 CDF[dist,x] 等于 qx 的值
Quantile[dist,q]q 次分位数
Mean[dist]均值
Variance[dist]方差
StandardDeviation[dist]标准差
Skewness[dist]偏度系数
Kurtosis[dist]峰度系数
CharacteristicFunction[dist,t]特征函数
Expectation[f[x],xdist]x 服从分布 dist 时, 的期望值
Median[dist]中位数
Quartiles[dist]dist 的第 位数的列表
InterquartileRange[dist]第一和第三四分位数之间的差距
QuartileDeviation[dist]四分位间距的一半
QuartileSkewness[dist]四分偏度系数的测量
RandomVariate[dist]服从指定分布的伪随机数
RandomVariate[dist,dims]维度为 dims 并且元素服从指定分布的伪随机数组

统计分布函数.

上面的表格给出可用于 Wolfram 语言中的分布的一些更常见函数的列表.

在点 的累积分布函数(CDF)由分布的概率密度函数(PDF)直到点 的积分给出. 因此,概率密度函数可以由对累积分布函数求导得到(可能在广义意义上). 在该软件包中,概率分布由符号化的形式表示. 如果 是一个数值型数据, PDF[dist,x] 计算在点 处的密度,否则,函数就保留符号化表达式的形式. 同样地,CDF[dist,x] 给出了累积分布.

逆累积分布函数 InverseCDF[dist,q] 提供了 点的值,在该点 CDF[dist,x] 达到 . 中位数由InverseCDF[dist,1/2] 给出. 四分位数、十分位数和百分位数是逆累积分布函数的特殊值. 四分位数的偏度等于,这里 分别是第一,第二和第三四分位数. 逆累积分布函数用于构建统计参数的置信区间. 对于连续分布,InverseCDF[dist,q]Quantile[dist,q] 是相等的.

均值 Mean[dist] 是服从 dist 分布的随机变量的期望值,经常可以表示为 . 均值由 给出,其中 是分布的概率密度函数. 方差 Variance[dist] 给出. 方差的平方根被称为标准差,通常用 表示.

我们的 Skewness[dist]Kurtosis[dist] 函数给我们提供了形状统计信息,用以分别总结一个分布的不对称性和峰度. 偏度系数由 给出,而峰度系数由 给出.

特征函数 CharacteristicFunction[dist,t] 给出. 在离散分布的情况下, . 每个分布有一个独特的特征函数,该特征函数有时被用来代替概率密度函数定义我们的分布.

一个函数 g 的期望值 Expectation[g[x],xdist] 给出. 在离散的情况下,函数 g 的期望值由 给出.

RandomVariate[dist] 给出服从指定分布的伪随机数字.

这是一个由符号化表示的 的伽马分布.
In[1]:=
Click for copyable input
Out[1]=
下面是当变量等于 时的累积分布函数.
In[2]:=
Click for copyable input
Out[2]=
下面是累积分布函数. 它由内置函数 GammaRegularized 给出.
In[3]:=
Click for copyable input
Out[3]=
下面是累积分布函数的图线.
In[4]:=
Click for copyable input
Out[4]=
下面是一个元素服从伽马分布的伪随机数组.
In[5]:=
Click for copyable input
Out[5]=