Mathematica 9 is now available
THIS IS DOCUMENTATION FOR AN OBSOLETE PRODUCT.
SEE THE DOCUMENTATION CENTER FOR THE LATEST INFORMATION.
Mathematica > 数据处理 > 统计数据分析 > 假设检验 > DistributionFitTest >
Mathematica > 数学和算法 > 统计数据分析 > 假设检验 > DistributionFitTest >
Mathematica > 数据处理 > 统计数据分析 > 概率和统计 > 假设检验 > DistributionFitTest >

DistributionFitTest

DistributionFitTest[data]
检验 data 是否为正态分布.
DistributionFitTest
检验 data 是否服从分布 dist.
DistributionFitTest
返回 的值.
  • DistributionFitTest 进行拟合优度假设检验,其中零假设 假定 data 是从一个服从分布 dist 的总体中抽取的,而备择假设 认为并非如此.
  • 默认情况下,返回一个概率值或者 值.
  • 一个较小的 值表明 data 不可能来自 dist.
  • dist 可以是任何带有数值型或者符号型参数的符号式分布,也可以是一个数据集.
  • data 可以是单变量 或者多变量 .
  • 许多检验使用的是所检验分布 dist 的累积分布函数 ,数据的经验累积分布函数 ,以及两者的差值=Expectation[d(x), ...]. 累积分布函数 在零假设 下是相同的.
  • 下列检验可以用于单变量以及多变量分布:
"AndersonDarling"连续的,数据基于 Expectation
"CramerVonMises"连续的,数据基于 Expectation
"JarqueBeraALM"正态性基于偏度和峰度
"KolmogorovSmirnov"连续的,数据基于
"Kuiper"连续的,数据基于
"PearsonChiSquare"连续的或离散的,数据基于期望直方图和观测到的直方图
"ShapiroWilk"正态性基于分位数
"WatsonUSquare"连续的,数据基于 Expectation
  • 下列检验可用于多变量分布:
"DistanceToBoundary"均匀性基于到均匀边界的距离
"MardiaCombined"正态性组合的 Mardia 偏度和峰度
"MardiaKurtosis"正态性基于多变量峰度
"MardiaSkewness"正态性基于多变量偏度
"SzekelyEnergy"数据基于牛顿势能
  • 与检验结果报告相关的属性包括:
"AllTests"所有适用的检验列表
"AutomaticTest"使用 Automatic 时所选择的检验
"DegreesOfFreedom"检验中所用的自由度
"PValue" 值的列表
"PValueTable" 值的格式化表格
"ShortTestConclusion"检验结果的简短说明
"TestConclusion"检验结果的说明
"TestData"检验统计量和 值的成对列表
"TestDataTable" 值的格式化表格和检验统计量
"TestStatistic"检验统计量的列表
"TestStatisticTable"检验统计量的格式化表格
  • 下列属性与检验类型无关.
  • 与数据分布相关的属性有:
"FittedDistribution"数据的拟合分布
"FittedDistributionParameters"数据的分布参数
  • 可以给出下列选项:
MethodAutomatic计算 值所用的方法
SignificanceLevel0.05诊断与报告的临界值
  • 对于拟合优度检验,所选择的临界值 使得 仅当 时被拒绝. 用于 属性的 值由 SignificanceLevel 选项控制. 默认情况下, 设为 .
检验一些数据的正态性:
创建一个 HypothesisTestData 对象,以进一步提取属性:
完整的检验表格:
比较数据的直方图与所检验分布的概率密度函数:
检验一组数据对某特定分布的拟合效果:
提取 Anderson-Darling 检验表格:
ProbabilityPlot 验证检验结果:
检验将数据拟合为多元分布的拟合优度:
绘制检验分布的边缘概率分布函数相对于数据的图形,以验证检验结果:
检验一些数据的正态性:
In[1]:=
Click for copyable input
In[2]:=
Click for copyable input
Out[2]=
创建一个 HypothesisTestData 对象,以进一步提取属性:
In[3]:=
Click for copyable input
完整的检验表格:
In[4]:=
Click for copyable input
Out[4]=
比较数据的直方图与所检验分布的概率密度函数:
In[5]:=
Click for copyable input
Out[5]=
 
检验一组数据对某特定分布的拟合效果:
In[1]:=
Click for copyable input
提取 Anderson-Darling 检验表格:
In[2]:=
Click for copyable input
Out[2]=
ProbabilityPlot 验证检验结果:
In[3]:=
Click for copyable input
Out[3]=
 
检验将数据拟合为多元分布的拟合优度:
In[1]:=
Click for copyable input
In[2]:=
Click for copyable input
In[3]:=
Click for copyable input
Out[3]=
绘制检验分布的边缘概率分布函数相对于数据的图形,以验证检验结果:
In[4]:=
Click for copyable input
Out[4]=
检验一些数据的正态性:
对于正态分布的数据,其 值一般较大:
对于非正态分布的数据,其 值一般较小:
设定 Automatic 的第三个参数,以应用一般意义上较有效且适当的检验:
属性 可用于确定检验的类型:
检验数据是否符合某一种特定分布:
这里没有足够的证据来拒绝这是 WeibullDistribution 的良好拟合:
对一个导出分布,检验拟合优度:
比起非混合分布的数据,混合数据的 值较大:
检验一个基于公式的分布的拟合优度:
将从数据中估计未指定的参数:
值依赖于所估计的参数:
检验某些数据的多元正态性:
对于正态分布的数据,其 值一般较非正态数据的大:
检验某些数据对于某一特定多变量分布的拟合优度:
比较两个数据集的分布:
样本大小不一定相等:
比较两种多变量数据集的分布:
与非等分布的数据的 值相比,等分布的数据 值较大:
进行特定的拟合优度检验:
可同时进行任何检验:
同时进行适用于数据和分布的各种检验:
使用 来识别所用的检验类型:
创建一个 HypothesisTestData 对象以重复提取属性:
可以提取的属性:
从一个 HypothesisTestData 对象中提取一些属性:
Cramér-von Mises检验的 -值和检验统计量:
同时提取任意个属性:
Anderson-Darling 的 值和检验统计量的结果:
在参数未指定时获取拟合分布:
提取拟合分布的参数:
绘制拟合分布相对于数据的概率密度函数:
通过拟合优度检验验证拟合:
当参数已经指定好时,返回检验的分布:
作图比较数据与拟合的分布:
将一组检验结果在表格中显示:
所有适当检验结果的完整表格:
选择一些检验结果在表格中列出:
从检验表格中提取相应的项,生成自定义的报告:
值高于0.05,因此在该水平上没有足够的证据来拒绝分布的正态性:
将一个检验或一组检验的 值列成表:
表格中的 值:
所有适当检验的 值表:
一部分检验的 值表:
汇报一个或一组检验的检验统计量:
表格中的检验统计量:
所有适当检验的检验统计量的表格:
使用基于蒙特卡罗的方法,或自动选择最快的方法:
设置样本个数以使用基于蒙特卡罗的方法:
蒙特卡罗估计值随样本数的增大而收敛于真实的 值:
设置随机种子,用在基于蒙特卡罗的方法中:
种子影响生成器的状态,并对生成的 值产生某些影响:
蒙特卡罗模拟生成 条件下的许多检验统计量:
条件下该检验统计量的估计分布:
值的经验估计与蒙特卡罗估计一致:
默认情况下,使用的显著水平为
将显著水平设置为
显著水平也用于
分析一个数据集是否取自一个正态分布:
进行一系列拟合优度检验:
QuantilePlot 中作图比较实验和理论累积分布函数:
作图比较经验累积分布函数与检验分布:
判断布法罗市的降雪累积量是否为正态分布:
使用 Jarque-Bera ALM 检验与 Shapiro-Wilk 检验来评定正态性:
SmoothHistogram 与检验结果相符:
QuantilePlot 表明拟合效果相当好:
使用优度检验来验证拟合,其中拟合由图形表示,例如直方图:
Kolmogorov-Smirnov 检验的结果与直方图一致,均表明拟合效果良好 :
检验前100个最亮恒星的绝对星等呈正态分布:
Shapiro-Wilk 检验适用于检验正态性:
作图检查结果:
检验一组多元数据在一个框形区域是否为均匀分布:
使用 Distance-to-Boundary 检验:
利用 Szekely 能量检验比较两个多元数据集合:
这两组数据的分布显著不同:
作图比较边缘分布,以确定导致差异的起因:
检验数据在一个单位圆上是否呈均匀分布:
Kuiper 检验与 Watson 检验可以有效检验数据在圆上的均匀性:
第一个数据集为随机分布,第二个聚集成簇:
确定一个模型是否适用于标普500强数据的差异度量:
直方图表明这是一个重尾对称分布:
尝试用 LaplaceDistribution
对于大型数据集合,很容易检测到距检验分布的偏差:
检验 LinearModelFit 的残差的正态性:
Shapiro-Wilk 检验表明残差非正态分布:
QuantilePlot 中可以看出在分布的左尾部有大型偏差:
模拟一个检验统计量的分布,以获得蒙特卡罗 值:
利用 SmoothHistogram 作图表示检验统计量的分布:
获得 Anderson-Darling检验的蒙特卡罗 值:
DistributionFitTest 返回的 值比较:
得到一个假设检验的效能的估计:
可视化表示近似的效能曲线:
估计 Shapiro-Wilk检验的效能,其中底层分布为StudentTDistribution,检验的尺寸为 0.05,且样本大小为35:
利用核密度估计对一个数据集进行平滑处理可以在保留数据的底层分布结构的同时,删除噪音. 下面的两个数据集是从同一个分布中创建的:
未经平滑处理的数据提供了底层分布的一个带有噪声的估计:
噪声可能导致第一类误差的产生:
平滑处理可以降低噪声,并且在 显著性水平上得到一个正确的结论:
默认情况下,单变量数据与 NormalDistribution 比较:
分布的参数根据数据估计:
默认情况下,多变量数据与 MultinormalDistribution 比较:
分布中未指定的参数根据数据估计:
对于检验分布的未指定参数,采用最大似然估计:
值表明误确认(第一类错误)的期望比例:
设置检验的大小为 0.05 将导致有5%的概率会错误否定
第二类错误出现在当 非真但却没有被否定时:
提供检验的大小可以降低第二类错误的机率:
有效检验的 值在 下为 UniformDistribution
利用 Kolmogorov-Smirnov 检验验证均匀性:
各检验的效能等于在 不成立时否定它的概率:
在这些条件下,Pearson 检验的效能最低:
样本越小,各检验的效能越低:
在小样本情况下,一些检验的效能优于其它检验的效能:
在检测位置的不同时,一些检验的效能优于其它检验:
检验的效能:
在检测尺度不同时,一些检验的效能优于其它检验:
检验的效能:
Pearson 检验需要大型样本以得到高效能:
检验的效能:
在检验正态性时,一些检验的效能优于其它检验:
Jarque-Bera ALM 与 Shapiro-Wilk 检验对于小样本是最有效的:
为正态性的复合假设设计的检验忽略指定的参数:
检验方法不同,所检测的分布性质也不同. 基于某一个检验的结论并不总与其它检验所得到的结论一致:
绿色区域表示两种检验均得到正确结论. 当两种检验均产生第二类误差时,点落到红色区域. 灰色区域表示两种检验的结论不一致.
估计检验前的参数影响检验统计量的分布:
下,检验统计量的分布与所得的 值:
不考虑估计方法将对 值估计过高:
有些检验要求预先指定参数,并不对有效 值进行估计:
通常使用蒙特卡罗方法以达到一个有效的 值:
对于许多分布,在估计参数时要进行修正:
Jarque-Bera ALM 检验要求样本数至少为10以得到有效 值:
使用蒙特卡罗方法得到一个有效的 值:
Kolmogorov-Smirnov检验与 Kuiper 检验认为数据中不能存在任何关联:
Jarque-Bera ALM 检验与 Shapiro-Wilk 检验仅对正态性的检验有效:
Pearson 检验是适用于离散分布的仅有检验:
一些检验统计量的分布:
版本 8 的新功能
Ask a question about this page  |  Suggest an improvement  |  Leave a message for the team
格式:   HTML  |  CDF