Mathematica 9 is now available
THIS IS DOCUMENTATION FOR AN OBSOLETE PRODUCT.
SEE THE DOCUMENTATION CENTER FOR THE LATEST INFORMATION.
Mathematica > 数据处理 > 统计数据分析 > 概率和统计 > 非参数统计分布 > HistogramDistribution >
Mathematica > 数学和算法 > 统计数据分析 > 概率和统计 > 非参数统计分布 > HistogramDistribution >

HistogramDistribution

HistogramDistribution
表示与数据值 的直方图对应的概率分布.
HistogramDistribution
表示基于数据值 的多变量直方图分布.
HistogramDistribution
表示箱由 bspec 指定的直方图分布.
  • 对于值 ,其 HistogramDistribution 的概率密度函数由 给出,其中 为箱 中的数值点的个数, 为箱 的宽度, 为箱定界符, 为数据点的总个数.
  • 各箱的 -宽根据值 计算,-宽根据值 计算,依此类推.
  • 可以给出下列箱的规格说明 bpsec
n使用 n 个箱  »
{w}使用宽度为 w 的箱  »
{min,max,w}使用宽度 wminmax 的箱  »
{{b1,b2,...}}使用箱  »
Automatic自动确定箱的宽度
"name"使用一个已命名的分箱方法  »
fw应用 fw 获取一个显式的分箱指定
{xspec,yspec,...}给出不同的 xy 等的指定
  • 可能的命名分箱法包括:
"FreedmanDiaconis"使除以样本量的立方根得到的四分位区间加倍
"Knuth"平衡一个分段均匀模型的似然值和先验概率
"Scott"渐进最小化均方误差
"Sturges"根据数据长度计算箱数
"Wand"一层递归近似 Wand 分箱
  • 在直方图分布中,值 的概率密度为分段常函数.
创建单变量数据的直方图分布:
使用得到的分布进行分析,包括对分布函数作图:
计算矩和分位数:
创建双变量数据的直方图分布:
对概率密度函数和累积分布函数作图:
计算协方差和一般矩:
创建单变量数据的直方图分布:
In[1]:=
Click for copyable input
In[2]:=
Click for copyable input
使用得到的分布进行分析,包括对分布函数作图:
In[3]:=
Click for copyable input
Out[3]=
计算矩和分位数:
In[4]:=
Click for copyable input
Out[4]=
In[5]:=
Click for copyable input
Out[5]=
 
创建双变量数据的直方图分布:
In[1]:=
Click for copyable input
In[2]:=
Click for copyable input
对概率密度函数和累积分布函数作图:
In[3]:=
Click for copyable input
Out[3]=
计算协方差和一般矩:
In[4]:=
Click for copyable input
Out[4]//MatrixForm=
In[5]:=
Click for copyable input
Out[5]=
从一些数据组成的直方图中创建一个分布:
从该分布计算概率:
降低箱数,以降低局部敏感度:
增加箱宽,以降低局部敏感度:
在较高维度下,从直方图创建分布:
绘制单变量边缘概率密度函数的图线:
绘制双变量概率密度函数的图线:
估计分布函数:
计算分布的矩:
特殊矩:
一般矩:
分位数函数:
特殊分位数值:
生成随机数:
HistogramDistribution 比较:
计算概率和期望:
母函数:
估计双变量数据的分布函数:
计算双变量分布的矩:
特殊矩:
一般矩:
生成随机数:
显示点的分布:
箱数越少,对底层分布的近似越粗略:
母函数:
自动计算箱数:
数据越多生成的箱越小:
显式指定要用的箱数:
分别指定5和10个箱:
显式指定箱宽:
分别使用 1. 和 0.1 的箱宽:
指定箱的范围和宽度:
在区间 上,分别使用 作为箱宽:
显式指定箱定界符:
使用不同的自动分箱法:
使用分箱函数,在整数边界上将各箱进行分割:
自动计算双变量数据的箱数:
数据越多,箱越小:
显式指定要使用的箱数:
在每个维度上分别指定 5 和 10 个箱:
显式指定箱宽:
在每个维度上,分别使用箱宽 1.0 或者 2.0:
指定箱的范围和箱宽:
在从 的范围内使用箱宽
显式指定箱定界符:
使用箱定界符
使用不同的自动分箱方法:
在各维使用不同的箱规格说明:
在行向维数上指定3个箱,在列向维数上指定箱宽为0.5:
将估计的密度与理论模型作比较:
人类染色体的长度分布:
计算序列长度大于15的概率:
比较某些词性单词的长度分布:
一个随机选择的英文名词的字母个数期望值:
估计标普500指数每日点数变化的分布:
计算给定的一天内点数变化为 1% 或者更多的概率:
确定 Knuth 贝叶斯方法下双峰数据所用的箱数:
箱的最优数目最大化后验密度的对数:
利用 Knuth 方法、Scott 规则和 Freedman-Diaconis 规则的密度估计:
Knuth 方法在 LogLikelihood 上的性能超过其它两个:
HistogramDistribution 的 PDF 等价于概率密度的 Histogram
所得到的对概率密度函数的估计,其积分结果为1:
输出精度与数据精度一致:
PDF 为分段常数函数:
CDF 与 SurvivalFunction 为分段的线性函数:
HazardFunction 为线性分式函数:
HistogramDistribution 是底层分布的一致估计量:
这里有可能通过指定一个分箱范围从估计中去掉数据:
单独指定一个宽度使用所有的数据:
采用 HistogramDistribution 的随机流行艺术:
版本 8 的新功能
Ask a question about this page  |  Suggest an improvement  |  Leave a message for the team
格式:   HTML  |  CDF