HistogramList

HistogramList[{x1,x2,}]

给出值 xi 的直方图分组界限和高度的列表.

HistogramList[{{x1,y1,},{x2,y2,},}]

给出值 {xi,yi,} 的直方图分组界限和高度的列表.

HistogramList[,bspec]

给出分组方式由 bspec 指定的直方图分组界限和高度的列表.

HistogramList[,bspec,hspec]

给出直方条高度由规范 hspec 计算而得的直方图的分组界限和高度的列表.

更多信息和选项

  • HistogramList 亦称为样方计数.
  • HistogramList 在每一维度上产生一个分组界限列表 {b1,b2,},并为每个箱产生一个深度为 的数值数组.
  • 对于二维数据,该输出具有 {{{bx1,bx2,},{by1,}},{{v1,1,v1,2,},{v2,1,},}} 的形式. 这里 vi,j 是对应于箱 [bxi,bxi+1)×[byj,byj+1) 的值.
  • HistogramList[data] 默认给出大小相同的箱,这样的选择是为了能近似值 {xi,yi,} 假设的平滑分布.
  • 每个箱在 方向上的箱宽根据 xi 值计算, 方向上的箱宽根据 yi 值计算,以此类推.
  • 分组规范 bpsec 可以以下列形式给出:
  • nn 个箱
    {w}用宽度为 w 的箱
    {min,max,w}minmax 的范围内使用宽度为 w 的箱
    {{b1,b2,}}按界限值 [b1,b2),[b2,b3), 分组
    Automatic自动确定组距
    "name"采用已命名的分组方法
    {"Log",bspec}把分组方法 bspec 应用于经过对数变换的数据上
    fw应用 fw 以得到明确的分组规定 {b1,b2,}
    {xspec,yspec,}给出不同的 xy 等的规范
  • 采用分组规范 "Log" 时使用的是 Automatic 的基本分组方法.
  • 可能的已命名的分组方法包括:
  • "Sturges"以数据长度为基础计算箱数
    "Scott"渐进最小化均方误差
    "FreedmanDiaconis"四分位箱距的两倍除以样本大小的立方根
    "Knuth"平衡分段均匀模型的似然值和先验概率
    "Wand"一级递归近似 Wand 分组方法
  • HistogramList[data,fb] 中的函数 fb 被应用于全部 {xi,yi,} 的列表,并且应该返回一个显式的分组界限值列表 {{bx1,bx2,},{by1,by2,},}. 在 HistogramList[data,{fx,fy,}] 中, fx 用于 xi 的列表,fy 用于 yi 的列表,以此类推.
  • HistogramList[data,bspec,hspec] 中给出不同的箱高规范 hspec 可得到不同形式的直方图数据. 有下列形式可供使用:
  • "Count"每个箱内元素的数目
    "CumulativeCount"累积频数
    "SurvivalCount"生存频数
    "Probability"数值落在每个箱内的比率
    "PDF"概率密度函数
    "CDF"累积分布函数
    "SF"生存函数
    "HF"风险函数
    "CHF"累积风险函数
    fh通过把 fh 应用到箱和频数得到的高度
  • 只有由实数组成的值 {xi,yi,} 被分配到箱;其他的被视为是缺失数据.
  • HistogramList[data,bspec,fh] 中的函数 fh 被用于两个参量:一个是箱分隔点列表 {{bx1,bx2,},{by1,by2,},} ,另一个,对于 维数据,是深度为 的、有每个箱的频数的数组.

范例

打开所有单元关闭所有单元

基本范例  (4)

生成数据集的箱分隔点和频数的列表:

生成二元数据集的箱分隔点和频数的列表:

使用单位宽度的箱:

使用不同的高度函数:

范围  (10)

分组规范  (7)

指定要用的箱数:

指定箱宽:

指定界限及箱的大小:

列出指定的箱分隔点:

在可能的情况下,把离散值的直方条置于数值的中心:

指定每一个维度所用的箱的数目:

指定每一个维度不同的分组规范:

使用不同的有命名的箱分隔方法:

使用间隔长度为对数的箱:

使用分组函数使分组界限落在整数上:

高度规范  (3)

使用不同的高度规范:

使用累计频数的高度函数:

非实数数据将被视为缺失:

属性和关系  (5)

诸如 HistogramHistogram3D 这样的函数是用 HistogramList 来计算分组和高度的:

可以用 BinCountsBinLists 来找出指定箱内的项:

HistogramList 也能给出实际的箱:

二元数据是以数对列表形式给出的:

每个变量维度都有一组箱:

频数的数组深度与变量维度数目相同:

由 5 元组组成的数据:

对于 个箱分隔点,每一维度有 个箱:

若输入是 TimeSeries 那么 HistogramList 会忽略里面的时间数据:

与值的直方图分布相比较:

可能存在的问题  (4)

分组包括左端点,不包括右端点,这样可能会导致不正常的分组:

1 没有被包含在直方图中,因为它应位于分组 [1,1.2) 中:

使用 {min,max,w} 规格得到的分箱可能不包括所有数据点:

指定 minmax,以便将所有数据点都纳入分箱范围:

或者,使用只限宽度的分箱规格 {w}

对于多维数据,结果可能会变得非常庞大:

大部分值是零:

HistogramList 并不能识别多重路径 TemporalData 输入的路径结构:

按路径找出 HistogramList

Wolfram Research (2010),HistogramList,Wolfram 语言函数,https://reference.wolfram.com/language/ref/HistogramList.html.

文本

Wolfram Research (2010),HistogramList,Wolfram 语言函数,https://reference.wolfram.com/language/ref/HistogramList.html.

CMS

Wolfram 语言. 2010. "HistogramList." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/HistogramList.html.

APA

Wolfram 语言. (2010). HistogramList. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/HistogramList.html 年

BibTeX

@misc{reference.wolfram_2024_histogramlist, author="Wolfram Research", title="{HistogramList}", year="2010", howpublished="\url{https://reference.wolfram.com/language/ref/HistogramList.html}", note=[Accessed: 18-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_histogramlist, organization={Wolfram Research}, title={HistogramList}, year={2010}, url={https://reference.wolfram.com/language/ref/HistogramList.html}, note=[Accessed: 18-November-2024 ]}