仮説検定パッケージ >

仮説検定パッケージ

このパッケージにはデータの仮説を検定するための関数およびデータから信頼区間を計算する関数が含まれている.正規分布に関連する分布の p 値と信頼区間の他に,平均の検定と信頼区間,平均の差分,分散と分散比が含まれる.

仮説検定

このパッケージで行う検定は,パラメータ検定である.パラメータ Theta の帰無仮説値 Theta0とデータから得られた Theta の推定値 が与えられると,仮説検定関数は Theta0Theta の真値である場合に少なくとも と同じくらいの極値を観察する確率を与える.非常に小さい確率(p 値)は,Theta の真値と Theta0に有意差がある証拠となる.
MeanTestMeanDifferenceTestは,中心極限定理(Central Limit Theorem)に基づく平均の検定を行う.
MeanTest[list,Mu0]帰無仮説 Mu=Mu0の検定を行う
MeanDifferenceTest[list1,list2,CapitalDeltaMu0]帰無仮説 Mu1-Mu2=CapitalDeltaMu0の検定を行う

平均の仮説検定

パッケージをロードする.
In[1]:=
Click for copyable input
データである.
In[2]:=
Click for copyable input
次は,母平均と35の間に有意差があるかどうかの検定である.
In[13]:=
Click for copyable input
Out[13]=
データが抽出された母集団の分散についての仮定は,検定統計量の分布に影響を及ぼす.オプションKnownVarianceEqualVariancesを使うと,母分散についての仮定を指定することができる.
オプション名デフォルト値
KnownVarianceNone既知の母分散の値

MeanTestMeanDifferenceTestのオプション

平均および平均差の検定は,母分散が既知であるとされる場合は,正規分布に基づく.
n 個の要素のリストから母分散を推定しなければならない場合は,平均の検定は自由度 n-1のスチューデントの t 分布に基づく.
母分散が8と仮定して,母平均と35との間に有意差があるかどうかを検定する.
In[14]:=
Click for copyable input
Out[14]=
オプション名デフォルト値
EqualVariancesFalse未知の母分散が等しいと仮定されるかどうか

MeanDifferenceTestのオプション

平均差の検定も,分散が未知の場合にはスチューデントの t 分布に基づく.分散が等しいと仮定される場合は,MeanDifferenceTestは自由度Length[list1]+Length[list2]-2のスチューデントの t 分布に基づく.母分散が等しいと仮定されない場合は,自由度に対してウェルチの近似が使われる.
2つ目のデータである.
In[4]:=
Click for copyable input
2つの母集団の平均差と0の間に有意差があるかどうかを検定する.
In[15]:=
Click for copyable input
Out[15]=
同じ仮説に,母分散が等しいという仮定を加えて検定する.
In[16]:=
Click for copyable input
Out[16]=
VarianceTestVarianceRatioTestは正規分布に従う標本の分散検定を行う.
VarianceTest[list,Sigma02]帰無仮説 Sigma2=Sigma02 の検定を実行する
VarianceRatioTest[list1,list2,r]帰無仮説 Sigma12/Sigma22=r の検定を実行する

分散の仮説検定

分散検定統計量は Chi2分布に,分散比検定統計量は F 分布に従う.
3つ目のデータである.
In[7]:=
Click for copyable input
これらのデータが抽出された母集団の分散と8の間に有意差があるかどうかを検定する.
In[17]:=
Click for copyable input
Out[17]=
仮説検定関数は,デフォルトで片側 p 値を返す.パラメータ推定値が帰無仮説の値よりも小さい場合,p 値はパラメータ推定値以下の値を観察する確率である.推定値が帰無仮説の値よりも大きい場合,p 値はパラメータ推定値以上の値を観察する確率である.
両側 p 値を求めたり,検定結果についての詳細を得たりするためのオプションもある.
オプション名デフォルト値
SignificanceLevelNone検定の有意水準
TwoSidedFalse両側検定を実行するかどうか
FullReportFalse出力に推定値,検定統計量,分布を入れるかどうか

すべての仮説検定関数のオプション

両側検定はTwoSided->Trueを使って要求することができる.検定の詳細はFullReport->Trueを使うと得られる.完全レポートには,パラメータ推定値,検定統計量,検定統計量の分布が含まれる.SignificanceLevel->Alpha では有意水準 Alpha での検定の結論が与えられ,帰無仮説がその有意水準で棄却されるかどうかを記述する.
data1 の平均検定の完全レポートである.
In[19]:=
Click for copyable input
Out[19]=
data の両側分散検定.
In[20]:=
Click for copyable input
Out[20]=
正規分布,カイ二乗分布,スチューデントの t 分布,F 分布での検定統計量が与えられると,p 値は適切な p 値関数を使って計算される.例えば,NormalPValueは平均ゼロ,単位分散の正規分布を使って検定統計量の p 値を計算する.両側 p 値はTwoSided->Trueの設定で得ることができる.
NormalPValue[teststat]平均0で単位分散を持つ正規分布について teststatp 値を与える
StudentTPValue[teststat,dof]自由度 dof のスチューデントの t 分布について teststatp 値を与える
ChiSquarePValue[teststat,dof]自由度 dofChi2 分布について teststatp 値を与える
FRatioPValue[teststat,numdof,dendof]分子自由度が numdof,分母自由度が dendof である F 分布について teststatp 値を与える

検定統計量の p 値を求める関数

平均0,単位分散を持つ正規分布における-1.96の裾確率である.
In[9]:=
Click for copyable input
Out[9]=
TwoSidedPValueは,検定統計量の絶対値が少なくとも1.96となるような極端な値となる確率を与える.
In[10]:=
Click for copyable input
Out[10]=
p 値は,常に累積分布関数(CDF)と等価というわけではない.
In[11]:=
Click for copyable input
Out[11]=
片側 p 値では,最大値は0.5である.
In[12]:=
Click for copyable input
Out[12]=
両側 p 値は,片側 p 値の2倍である.
In[13]:=
Click for copyable input
Out[13]=

信頼区間

信頼区間は,あるパラメータが一定の確率で含まれる範囲を与える.パラメータの区間推定は,問題のパラメータについての統計的推測においてのみでなく,推定量の精度の観測においても有用なことがよくある.このパッケージでは,
MeanCIMeanDifferenceCIは中心極限定理(Central Limit Theorem)に基づいて平均および平均の差分の信頼区間を与える.
MeanCI[list]list から推定された母平均に対する信頼区間を与える
MeanDifferenceCI[list1,list2]list1list2から推定された母平均間の差分に対する信頼区間を与える

平均の信頼区間

標本値のリストである.
In[24]:=
Click for copyable input
平均に対する95%の信頼区間を与える.
In[25]:=
Click for copyable input
Out[25]=
データが抽出された母集団の分散についての仮定は,パラメータ推定値の分布に影響を及ぼす.オプションKnownVarianceEqualVariancesは母分散についての仮定を指定するために使うことができる.
オプション名デフォルト値
KnownVarianceNone既知の母分散の値

MeanCIMeanDifferenceCIのオプション

平均および平均間の差分に対する信頼区間は,母分散が既知であると仮定される場合は正規分布に基づく.
母分散を n 個の要素のリストから想定しなければならない場合は,平均に対する区間は自由度 n-1のスチューデントの t 分布に基づく.
母分散が.25としたときの平均に対する信頼区間.
In[27]:=
Click for copyable input
Out[27]=
オプション名デフォルト値
EqualVariancesFalse未知の母分散が等価であると仮定するかどうか

MeanDifferenceCIのオプション

平均間の差分に対する信頼区間も,分散が既知でなければスチューデントの t 分布に基づく.分散が等しいと想定されるときは,MeanDifferenceCIは自由度Length[list1]+Length[list2]-2のスチューデントの t 分布に基づく.母分散が等しいと想定されない場合は,自由度についてウェルチの近似が使われる.
2つ目のデータである.
In[28]:=
Click for copyable input
これは平均間の差分に対して95%の信頼区間を与える.
In[31]:=
Click for copyable input
Out[31]=
母分散が等しいと仮定した場合の信頼区間である.
In[32]:=
Click for copyable input
Out[32]=
VarianceCIVarianceRatioCIは,正規分布に従う標本の分散のテストを行う.
VarianceCI[list]list から推定された母分散に対する信頼区間を与える
VarianceRatioCI[list1,list2]list1list2から推定された母分散の比に対する信頼区間を与える

分散の信頼区間

分散信頼区間は Chi2分布に,分散比信頼区間は F 分布に基づく.
data1 に対する分散信頼区間である.
In[33]:=
Click for copyable input
Out[33]=
信頼区間関数でのデフォルトの信頼水準は.95である.他の水準はConfidenceLevelオプションで指定できる.
オプション名デフォルト値
ConfidenceLevel.95区間に対する信頼水準

すべての信頼区間関数のオプション

最初の標本の母分散に対する90%の信頼区間である.
In[34]:=
Click for copyable input
Out[34]=
平均の推定値,分散あるいは分散比,必要な標準偏差か自由度が与えられても,正規分布,カイ二乗分布,スチューデントの t 分布,F 分布の信頼区間が得られる.
NormalCI[mean,sd]中心が mean で標準偏差が sd の信頼区間を与える
StudentTCI[mean,se,dof]中心が mean,標準誤差が se,自由度が dof の信頼区間を与える
ChiSquareCI[variance,dof]標本分散が variance で自由度が dof のときの母分散の信頼区間を与える
FRatioCI[ratio,numdof,dendof]標本分散の比が ratio で,分子と分母の標本分散の自由度がそれぞれ numdofdendof であるときの母分散比の信頼区間を与える

標本推定値の信頼区間

data1 の平均を計算する.
In[35]:=
Click for copyable input
Out[35]=
次は平均の標準誤差を推定する.
In[36]:=
Click for copyable input
Out[36]=
以下は data1MeanCIと等価である.
In[38]:=
Click for copyable input
Out[38]=