描述统计学研究分布的性质, 比如中心位置, 散布范围, 和分布形状. 这里我们所介绍的函数可以用来做数据列表的描述性统计分析. 你可以利用
"连续分布" 和
"离散分布" 里介绍的函数来计算各种已知分布的一些标准描述性统计信息.
位置统计量描述了数据的位置. 最常见的功能包括集中趋势的测量, 比如均值, 中位数, 和众数.
Quantile
给我们提供了分布中达到百分之

的数据之前的位置. 换言之,
Quantile 提供了

的值, 并使概率

小于或等于

, 而且概率

大于或等于

.
离散统计量总结了数据的散布或扩散情况. 这些函数中的大部分描述了从某一特定位置的偏离度. 例如, 方差是相对均值而言偏离度的度量, 而标准差就是方差的开方.
协方差是方差的多元化扩展. 对于两个长度相等的向量来说, 协方差是一个数值. 对于一个单矩阵
m 来说, 协方差矩阵的第


是
m 的第
i 列和第
j 列之间的协方差. 对于两个矩阵

和

来说, 协方差矩阵的第

个元素是

的第
i 列和

的第
j 列之间的协方差.
协方差测量散布程度, 而相关系数测量相互关系. 两个向量之间的相关系数等于向量之间的协方差除以这些向量的标准差. 同样, 相关系数矩阵的元素等于相应的协方差矩阵的元素用适当的列标准差进行尺度化后得到的结果.
你可以用形状统计数据得到一些分布的形状信息. 这里, 偏度是描述变量取值分布不对称性的统计量. 而峰度是描述在峰值附近和两端尾部的数据集中度与两侧翼的数据集中度的对比度的统计量.
Skewness 通过把三阶中心矩除以总体标准差的立方来计算.
Kurtosis 由四阶中心矩除以数据总体方差的平方计算, 就等于
CentralMoment
. (总体方差就是二阶中心矩, 而总体标准差就是其平方根.)