仮説検定パッケージ
このパッケージにはデータの仮説を検定するための関数およびデータから信頼区間を計算する関数が含まれている.正規分布に関連する分布の
p 値と信頼区間の他に,平均の検定と信頼区間,平均の差分,分散と分散比が含まれる.
仮説検定
このパッケージで行う検定は,パラメータ検定である.パラメータ

の帰無仮説値
0とデータから得られた

の推定値

が与えられると,仮説検定関数は
0が

の真値である場合に少なくとも

と同じくらいの極値を観察する確率を与える.非常に小さい確率(
p 値)は,

の真値と
0に有意差がある証拠となる.
MeanTestと
MeanDifferenceTestは,中心極限定理(Central Limit Theorem)に基づく平均の検定を行う.
平均の仮説検定
次は,母平均と35の間に有意差があるかどうかの検定である.
| Out[13]= |  |
|
データが抽出された母集団の分散についての仮定は,検定統計量の分布に影響を及ぼす.オプション
KnownVarianceと
EqualVariancesを使うと,母分散についての仮定を指定することができる.
MeanTestとMeanDifferenceTestのオプション
平均および平均差の検定は,母分散が既知であるとされる場合は,正規分布に基づく.
n 個の要素のリストから母分散を推定しなければならない場合は,平均の検定は自由度
n-1のスチューデントの
t 分布に基づく.
母分散が8と仮定して,母平均と35との間に有意差があるかどうかを検定する.
| Out[14]= |  |
|
MeanDifferenceTestのオプション
平均差の検定も,分散が未知の場合にはスチューデントの
t 分布に基づく.分散が等しいと仮定される場合は,
MeanDifferenceTestは自由度
Length[list1]+Length[list2]-2のスチューデントの
t 分布に基づく.母分散が等しいと仮定されない場合は,自由度に対してウェルチの近似が使われる.
2つの母集団の平均差と 0の間に有意差があるかどうかを検定する.
| Out[15]= |  |
|
同じ仮説に,母分散が等しいという仮定を加えて検定する.
| Out[16]= |  |
|
分散の仮説検定
分散検定統計量は
2分布に,分散比検定統計量は
F 分布に従う.
これらのデータが抽出された母集団の分散と 8の間に有意差があるかどうかを検定する.
| Out[17]= |  |
|
仮説検定関数は,デフォルトで片側
p 値を返す.パラメータ推定値が帰無仮説の値よりも小さい場合,
p 値はパラメータ推定値以下の値を観察する確率である.推定値が帰無仮説の値よりも大きい場合,
p 値はパラメータ推定値以上の値を観察する確率である.
両側
p 値を求めたり,検定結果についての詳細を得たりするためのオプションもある.
すべての仮説検定関数のオプション
両側検定は
TwoSided->Trueを使って要求することができる.検定の詳細は
FullReport->Trueを使うと得られる.完全レポートには,パラメータ推定値,検定統計量,検定統計量の分布が含まれる.
SignificanceLevel->
では有意水準

での検定の結論が与えられ,帰無仮説がその有意水準で棄却されるかどうかを記述する.
| Out[19]= |  |
|
| Out[20]= |  |
|
正規分布,カイ二乗分布,スチューデントの
t 分布,
F 分布での検定統計量が与えられると,
p 値は適切な
p 値関数を使って計算される.例えば,
NormalPValueは平均ゼロ,単位分散の正規分布を使って検定統計量の
p 値を計算する.両側
p 値は
TwoSided->Trueの設定で得ることができる.
| NormalPValue[teststat] | 平均0で単位分散を持つ正規分布について teststat の p 値を与える |
| StudentTPValue[teststat,dof] | 自由度 dof のスチューデントの t 分布について teststat の p 値を与える |
| ChiSquarePValue[teststat,dof] | 自由度 dof の 2 分布について teststat の p 値を与える |
| FRatioPValue[teststat,numdof,dendof] | 分子自由度が numdof,分母自由度が dendof である F 分布について teststat の p 値を与える |
検定統計量の p 値を求める関数
平均 0,単位分散を持つ正規分布における-1.96の裾確率である.
| Out[9]= |  |
|
| Out[10]= |  |
|
p 値は,常に累積分布関数(CDF)と等価というわけではない.
| Out[11]= |  |
|
| Out[12]= |  |
|
| Out[13]= |  |
|
信頼区間
信頼区間は,あるパラメータが一定の確率で含まれる範囲を与える.パラメータの区間推定は,問題のパラメータについての統計的推測においてのみでなく,推定量の精度の観測においても有用なことがよくある.このパッケージでは,
MeanCIと
MeanDifferenceCIは中心極限定理(Central Limit Theorem)に基づいて平均および平均の差分の信頼区間を与える.
平均の信頼区間
| Out[25]= |  |
|
データが抽出された母集団の分散についての仮定は,パラメータ推定値の分布に影響を及ぼす.オプション
KnownVarianceと
EqualVariancesは母分散についての仮定を指定するために使うことができる.
MeanCIとMeanDifferenceCIのオプション
平均および平均間の差分に対する信頼区間は,母分散が既知であると仮定される場合は正規分布に基づく.
母分散を
n 個の要素のリストから想定しなければならない場合は,平均に対する区間は自由度
n-1のスチューデントの
t 分布に基づく.
| Out[27]= |  |
|
MeanDifferenceCIのオプション
平均間の差分に対する信頼区間も,分散が既知でなければスチューデントの
t 分布に基づく.分散が等しいと想定されるときは,
MeanDifferenceCIは自由度
Length[list1]+Length[list2]-2のスチューデントの
t 分布に基づく.母分散が等しいと想定されない場合は,自由度についてウェルチの近似が使われる.
これは平均間の差分に対して95%の信頼区間を与える.
| Out[31]= |  |
|
| Out[32]= |  |
|
分散の信頼区間
分散信頼区間は
2分布に,分散比信頼区間は
F 分布に基づく.
| Out[33]= |  |
|
信頼区間関数でのデフォルトの信頼水準は
.95である.他の水準は
ConfidenceLevelオプションで指定できる.
すべての信頼区間関数のオプション
最初の標本の母分散に対する90%の信頼区間である.
| Out[34]= |  |
|
平均の推定値,分散あるいは分散比,必要な標準偏差か自由度が与えられても,正規分布,カイ二乗分布,スチューデントの
t 分布,
F 分布の信頼区間が得られる.
| NormalCI[mean,sd] | 中心が mean で標準偏差が sd の信頼区間を与える |
| StudentTCI[mean,se,dof] | 中心が mean,標準誤差が se,自由度が dof の信頼区間を与える |
| ChiSquareCI[variance,dof] | 標本分散が variance で自由度が dof のときの母分散の信頼区間を与える |
| FRatioCI[ratio,numdof,dendof] | 標本分散の比が ratio で,分子と分母の標本分散の自由度がそれぞれ numdof,dendof であるときの母分散比の信頼区間を与える |
標本推定値の信頼区間
| Out[35]= |  |
|
| Out[36]= |  |
|
| Out[38]= |  |
|