離散分布
ここで取り上げるのは,最も広く使われている一変量の離散分布であり,その密度,平均,分散,その他の関連特性を計算することができる.分布自体は
という記号形式で表される.統計分布の特性を与えるMeanのような関数は,引数として分布の記号表現を取る.「連続分布」では多くの連続分布を説明している.
| BernoulliDistribution[p] | 平均 p のベルヌーイ(Bernoulli)分布 |
BetaBinomialDistribution[ , ,n] | 成功確率がBetaDistribution[ , ]確率変数である二項分布 |
BetaNegativeBinomialDistribution[ , ,n] | 成功確率がBetaDistribution[ , ]確率変数である負の二項分布 |
| BinomialDistribution[n,p] | 各試行における成功率を p としたときに,n 回の試行で起る成功回数の二項分布 |
| DiscreteUniformDistribution[{imin,imax}] | から までの整数上での離散一様分布 |
| GeometricDistribution[p] | 各試行における成功率を p としたときの,最初の成功までの試行回数の幾何分布 |
| HypergeometricDistribution[n,nsucc,ntot] |
| 成功数 を含む大きさ の母集団から標本数 n を取り出したときの成功数の超幾何分布 |
LogSeriesDistribution[ ] | パラメータ の対数級数分布 |
| NegativeBinomialDistribution[n,p] | パラメータ n および p の負の二項分布 |
PoissonDistribution[ ] | 平均 のポアソン (Poisson) 分布 |
ZipfDistribution[ ] | パラメータ のジップ(Zipf) 分布 |
離散分布
一般的な離散分布のほとんどは,「成功と失敗」のような2通りの結果が考えられる試行の連続と考えることで理解できる.
ベルヌーイ分布BernoulliDistribution[p]とは,成功(値1に対応)が
の確率で起り,失敗(値0に対応)が
の確率で起る1回の試行の確率分布である.
二項分布BinomialDistribution[n, p]とは,各試行における成功確率を
としたときに,
回の独立した試行で起る成功回数の分布である.
正の整数
に対する負の二項分布NegativeBinomialDistribution[n, p]とは,各試行における成功確率を
としたときに,
回成功するまでに起った失敗回数の分布である.この分布は任意の正の
について定義される.しかし,
が整数でないときは,
が成功数,
が成功確率という解釈は当てはまらない.
ベータ二項分布BetaBinomialDistribution[
,
, n]は二項分布とベータ分布を組み合せたものである.BetaBinomialDistribution[
,
, n]の確率変数は,成功確率
自身がベータ分布BetaDistribution[
,
]に従う確率変数となっているBinomialDistribution[n, p]に従う.ベータ負の二項分布BetaNegativeBinomialDistribution[
,
, n]はベータ分布と負の二項分布を組み合せたものである.
幾何分布GeometricDistribution[p]とは,各試行の成功率を
としたときに,最初に成功が起るまでの試行数の合計の分布のことである.
超幾何分布HypergeometricDistribution[n, nsucc, ntot]は
回の試行が,成功可能回数
回でサイズ
の母集団から置換なしでサンプリングすることに相当する実験で,二項分布に代り使用されるものである.
離散一様分布DiscreteUniformDistribution[{imin, imax}]とは,等しい確率で起る複数の結果を
から
までの整数で表した試行を表すものである.
ポアソン分布PoissonDistribution[
]とは,指定された時間内に起る事象数を記述する.ここで
は一定時間に対する事象の平均回数である.
付近の
の級数展開における項は,対数分布LogSeriesDistribution[
]に従った離散確率変数の確率に比例する.指定された期間内に購入される製品数の分布が,この分布によってモデル化されることがある.
ジップ(Zipf)分布ZipfDistribution[
]はゼータ分布と言われることがある.これは最初言語学で使われ,珍しい事象のモデル化にまで拡張された.
統計分布の関数の例
分布は記号形式で表現される.PDF[dist, x]は x が数値の場合は,x における密度関数を評価する.それ以外の場合は,可能な限り関数を記号形式のままにしておく.これと同様に,CDF[dist, x]は累積分布を与え,Mean[dist]は指定された分布の平均を与える.上の表は,分布で利用できる一般的な関数の例である.統計分布のさまざまな関数の詳説は,「連続分布」では,連続分布で対応するものを説明している.
以下は,各試行における成功率が0.3である場合の34回の試行の二項分布の記号表現である.
| Out[1]= |  |
| Out[2]= |  |
引数として記号変数を使うことによって平均を求める方程式を得ることができる.
| Out[3]= |  |
以下は50%の分位数であり,これは中央値に等しい.
| Out[4]= |  |
二項分布についての

の期待値を求める.
| Out[5]= |  |
| Out[6]= |  |