これは,Wolfram言語の以前のバージョンに基
づくMathematica 5のためのドキュメントです.
最新のドキュメント(バージョン11.2)もご覧ください.

Documentation / Mathematica / アドオンとリンク / 標準パッケージ / Statistics /

Statistics`HypothesisTests`

統計的仮説の検定とは,変数の分布についての推測の検定である.標本データがあるとすると,その標本が抽出された母集団に何らかの特性があるかどうかをテストするものである.このパッケージの関数を使うと,平均,分散,2つの母平均の差・分散比に関する仮説を検定することができる.

検定関数の引数として与えられるデータは,正規分布であるものと想定されている.しかし,中心極限定理により,標本サイズ が大きく,データが単峰(単一モード)である場合の平均の検定には,この正規性の想定は無視してもよい.検定関数は引数として単変量データのリスト,仮定されたパラメータ,関連オプションを取る.

平均の仮説検定

平均の仮説検定は,母分散が分かっている場合には正規分布に基づき,分散が推定されなければならない場合には自由度のスチューデントt分布に基づく.分散ではなく標準偏差が分かっている場合は,KnownStandardDeviation -> stdと指定することもできる.

仮説検定の出力はp値である.p値とは,仮説の母数が真であるとしたときに,標本推定値が極端に大きい値になる確率のことである.TwoSided -> Trueとすると,両側検定を要求することができる.検定の詳細が知りたい場合は,FullReport -> Trueを使う.この設定によりパラメータ推定が実行され,検定統計量が出力に含まれるようになる.SignificanceLevel -> siglev を使うと有意水準を設定することもできる.この設定で,仮説の受容あるいは棄却の決定を含む検定の結果が出力される.

すべての仮説検定関数のオプション

パッケージをロードする.

In[1]:= <<Statistics`HypothesisTests`

分散が8である正規母集団から抽出された標本データのリストである.

In[2]:= data1 = {34, 37, 44, 31, 41, 42, 38, 45,
42, 38};

母平均が34になるかどうかを検定する.data1が分散8,平均がわずか34である正規母集団から抽出されたということはほとんどありえない.

In[3]:= MeanTest[data1, 34, KnownVariance -> 8]

Out[3]=

平均および平均の差の仮説検定

2つの母集団間の類似性を検定するためには,平均が等しいかどうかをテストするとよい.あるいは,2つの母平均の差がゼロとなるかどうかを検定してもよい.母分散が分かっており,それがKnownVarianceの値として指定されているなら,検定は正規分布に基づく.しかし,分散は分かっていないことが多いので,検定には仮説を評価するためにスチューデントt分布の分位数を使う.

平均の差に関する検定の追加オプション

母分散が8の集団から抽出された,2つ目の標本データのリストである.

In[4]:= data2 = {39, 40, 34, 45, 44, 38, 42, 39,
47, 41};

以下では2つの母平均の差がゼロであるかどうかを検定する.

In[5]:= MeanDifferenceTest[data1, data2, 0,
KnownVariance -> {8, 8}]

Out[5]=

上と同じ検定で,有意水準を指定し完全報告を要求した場合の結果である.これで出力に推定量,検定統計量,検定の結果が含まれるようになった.この有意水準では,data1data2は分散が8である同一の正規母集団から抽出されたものであり得る.

In[6]:= MeanDifferenceTest[data1, data2, 0,
KnownVariance -> {8, 8},
SignificanceLevel -> .05, FullReport -> True]

Out[6]=

VarianceTestVarianceRatioTestを使って,分散および2つの分散の比を検定することもできる.これらの関数にはそれぞれカイ2乗分布とF比分布を使用する.この2つの検定にも同じ出力オプションSignificanceLevelTwoSidedFullReportが使える.

分散と2つの分散の比の仮説検定

別のデータである.

In[7]:= data = {41.0, 42.4, 42.5, 40.6, 45.6, 34.4};

データが抽出された母集団の分散が8であるかどうかを調べる検定である.

In[8]:= VarianceTest[data, 8, TwoSided -> True,
FullReport -> True]

Out[8]=

正規分布,カイ2乗分布,スチューデントt分布,F比分布で検定統計量を計算したら,適切なp値関数を使ってp値を求めることができる.例えば,NormalPValueは平均がゼロで単位分散の正規分布を使って検定統計量のp値を計算する.両側p値はTwoSided -> Trueとすることで求められる.

検定統計量のp値を求める関数

以下は点において平均で,単位分散の正規分布の裾確率である.

In[9]:= NormalPValue[-1.96]

Out[9]=

TwoSidedPValueは検定統計量が分布のどちらかの裾で少なくとも となる確率を与える.

In[10]:= NormalPValue[-1.96, TwoSided -> True]

Out[10]=

ある統計分布のp値は,その分布の累積分布関数(CDF)とは等しくないという点に注意する.

In[11]:= Plot[CDF[ChiSquareDistribution[5], x],
{x, 1, 10}, PlotRange->{0, 1}]

Out[11]=

片側p値は片側の裾確率を表すので,最大値は0.5である.潜在的な統計分布の中央値において最大となる.

In[12]:= Plot[OneSidedPValue /. ChiSquarePValue[x, 5],
{x, 1, 10}, PlotRange->{0, 1}]

Out[12]=

両側p値は,片側p値の2倍である.

In[13]:= Plot[TwoSidedPValue /. ChiSquarePValue[x, 5,
TwoSided -> True], {x, 1, 10}, PlotRange->{0, 1}]

Out[13]=