KernelMixtureDistribution
KernelMixtureDistribution[{x1,x2,…}]
表示基于数据值 xi 的核混合分布.
KernelMixtureDistribution[{{x1,y1,…},{x2,y2,…},…}]
表示基于数据值 {xi,yi,…} 的多变量核混合分布.
KernelMixtureDistribution[…,bw]
表示带宽为 bw 的核混合分布.
KernelMixtureDistribution[…,bw,ker]
表示带宽为 bw、平滑核为 ker 的核混合分布.
更多信息和选项
- KernelMixtureDistribution 返回一个 DataDistribution 对象,其用法和任何其它概率分布相似.
- 对于值 ,其 KernelMixtureDistribution 的概率密度函数由 给出,其中 为一个平滑核, 为带宽参数.
- 可以给出下列带宽规范说明 bw:
-
h 所用的带宽 {"Standardized",h} 以标准偏差为单位的带宽 {"Adaptive",h,s} 初始带宽为 h、灵敏度为 s 的自适应带宽 Automatic 自动计算带宽 "name" 使用一种已命名的带宽选择法 {bwx,bwy,…} 对 x、y 等单独指定的带宽规范 - 对于多变量密度,h 可以是一个正定的对称矩阵.
- 对于自适应带宽,敏感度 s 必须是一个位于 0 和 1 之间的实数或者 Automatic. 如果使用 Automatic,则 s 设为,其中 是数据维度.
- 可能的已命名带宽选择法包括:
-
"LeastSquaresCrossValidation" 使用最小二乘交叉验证的方法 "Oversmooth" 比标准高斯宽 1.08 倍 "Scott" 使用 Scott 规则确定带宽 "SheatherJones" 使用 Sheather–Jones代入估计 "Silverman" 使用 Silverman 规则确定带宽 "StandardDeviation" 使用标准差作为带宽 "StandardGaussian" 标准正态数据的最优带宽 - 默认情况下,使用 "Silverman" 方法.
- 对于自动带宽计算,假定常量数组有单位方差.
- 可以给出下列核规范说明 ker:
-
"Biweight" "Cosine" "Epanechnikov" "Gaussian" "Rectangular" "SemiCircle" "Triangular" "Triweight" func - 为使 KernelMixtureDistribution 生成真实的密度估计,函数 fn 应为一个有效的单变量概率密度函数.
- 默认情况下,使用 "Gaussian" 核.
- 对于多变量密度,核函数 ker 可以使用 {"Product",ker} 和 {"Radial",ker} 指定为乘积和径向类型. 如果没有指定类型,则使用乘积类型的核.
- 用于密度估计的精确度是在 bw 和数据中给出的最小精确度.
- 可以给出下列选项:
-
MaxMixtureKernels Automatic 所用核的最大数目 - KernelMixtureDistribution 可以与 Mean、CDF 和 RandomVariate 等函数联合使用.
范例
打开所有单元关闭所有单元基本范例 (3)
范围 (47)
基本用途 (8)
分布属性 (10)
带宽选择 (19)
把敏感度设置为 Automatic 将使用 ,其中 是数据维度:
给出一个标量型的 h 实际上使用的是 h IdentityMatrix[p]:
指定对角线元素 d 实际上使用的是 DiagonalMatrix[d]:
默认情况下,Silverman 方法用于独立选择每个维度上的带宽:
核函数 (10)
这与使用 NormalDistribution[0,1] 的概率密度函数等价:
选项 (7)
应用 (6)
对于重尾数据,增大 MaxMixtureKernels 选项的设置以得到较平滑的估计:
KernelMixtureDistribution 可用于创建椭圆分布. 椭圆分布是多变量正态分布的一个推广:
对边缘使用 NormalDistribution[0,1] 给出 MultinormalDistribution[μ,Σ]:
属性和关系 (9)
KernelMixtureDistribution 是内在分布的一致的估计量:
KernelMixtureDistribution 的线性插值是 SmoothKernelDistribution:
KernelMixtureDistribution 产生核的一个 MixtureDistribution:
当输入为 TimeSeries 或 EventSeries 时,KernelMixtureDistribution 只能用于数值:
当输入为 TemporalData 时,KernelMixtureDistribution 可用于所有的数值:
可能存在的问题 (5)
试着增加初始带宽 MaxMixtureKernels,或降低灵敏度:
把 MaxMixtureKernels 设置为 All 或者 Automatic:
"SheatherJones" 和 "LeastSquaresCrossValidation" 方法中不能使用符号数据:
把 Exclusions 选项设为 None,以避免错误的间隙以及降低图线的计时:
巧妙范例 (2)
文本
Wolfram Research (2010),KernelMixtureDistribution,Wolfram 语言函数,https://reference.wolfram.com/language/ref/KernelMixtureDistribution.html (更新于 2016 年).
CMS
Wolfram 语言. 2010. "KernelMixtureDistribution." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2016. https://reference.wolfram.com/language/ref/KernelMixtureDistribution.html.
APA
Wolfram 语言. (2010). KernelMixtureDistribution. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/KernelMixtureDistribution.html 年