TruncatedDistribution
TruncatedDistribution[{xmin,xmax},dist]
dist の値が xminから xmaxまでになるように切断することで得られる分布を表す.
TruncatedDistribution[{{xmin,xmax},{ymin,ymax},…},dist]
多変量分布 dist の値が xminから xmaxまで,yminから ymaxまでという具合になるように切断することで得られる分布を表す.
詳細
- TruncatedDistribution[{xmin,xmax},dist]の確率密度は,についてはで与えられ(は dist の確率密度関数,は dist の累積分布関数),その他の場合は0である.
- {xmin,xmax}の一般的なケース
-
{-∞,xmax} 上から切断 {xmin,∞} 下から切断 {xmin,xmax} 二重に切断 {-∞,∞},None 切断なし - TruncatedDistributionは,Mean,CDF,RandomVariate等の関数とともに使うことができる.
予備知識
- TruncatedDistribution[{xmin,xmax},dist]は,区間 におけるすべての について定数倍し,については常に0になるデータをモデル化する統計分布を表す.非切断,以下を切断,以上を切断,二重切断という語は,{xmin,xmax}がそれぞれ{-∞,∞},{xmin,∞},{-∞,xmax},{xmin,xmax},の形であるものを説明するのに対し,一変量 dist は連続分布(NormalDistribution,GammaDistributionまたはBetaDistribution)あるいは離散分布(PoissonDistribution,BinomialDistributionまたはBernoulliDistribution)のいずれかであり,変換,打ち切りあるいは切断(それぞれTransformedDistribution,CensoredDistribution,TruncatedDistribution)あるいは既知の分布によって定義することができる.
- 多変量のTruncatedDistribution[{{,},… ,{,}},dist]は,一変量分布との類似に基づいて定義され,したがって,多変量分布 dist から取られ, 番目の成分 が区間内に収まるように切断されたベクトルの分布を表す.一変量の場合と同じように,多変量分布 dist も連続分布(例:MultinormalDistribution)あるいは離散分布(例:MultivariateHypergeometricDistribution)であり,(それぞCopulaDistributionおよびProductDistributionを使って)既知の分布のコピュラ分布あるいは積分布として定義することができる.
- 切断分布は,データ集合が「条件を満たす」とみなされる範囲の外側の値を含む場合に使われる.例えば,納税者の集合中の最初の 人を監査する場合(),監査対象となった人について行われる統計分析の結果は,監査対象とはならなかった 人の納税者についての情報が保存されていない切断データとなる.このようなデータは,生存分析,金融,保険数理,経済等の分野では一般的であり,そのようなデータの分析用のさまざまな特化された統計ツール(例:切断回帰)が存在する.
- TruncatedDistributionはCensoredDistributionと混同されることがよくあるが,切断分布が切断区間上の確率を分布させるのに対し打ち切り分布は打ち切り区間の最後に完全な確率を置く点でこの2つは根本的に異なる.CensoredDistribution[{xmin,xmax},dist]は,定義上,TransformedDistribution[g,xdist]に等しい.ただし,g は についてPiecewise[{{0,x<=xmin},{h,xmin<x<xmax},{0,x>=xmax}}]によって与えられる. は dist の累積密度関数であり,はその累積分布関数である.
例題
すべて開くすべて閉じるスコープ (35)
基本的な用法 (9)
EstimatedDistributionを使って切断区間を推定する:
パラメトリック分布 (7)
UniformDistributionの切断分布を定義する:
DiscreteUniformDistributionの切断分布を定義する:
切断は左端点を含まず,よって結果の離散分布は以下の様になる:
ノンパラメトリック分布 (3)
派生分布 (10)
切断TruncatedDistributionを定義する:
切断CopulaDistributionを定義する:
切断MixtureDistributionを定義する:
切断OrderDistributionを定義する:
ポアソンサンプルの最大値が5より大きいと仮定した場合に,6より大きくなる確率を求める:
最大値が5より大きいという仮定なしで,6より大きい確率を求める:
切断TransformedDistributionを定義する:
切断ParameterMixtureDistributionを定義する:
切断ProductDistributionを定義する:
切断MarginalDistributionを定義する:
切断CensoredDistributionを定義する:
QuantityDistributionの切断分布を評価するとQuantityDistributionになる:
自動簡約 (6)
連続分布 (4)
正の軸までで切断されたGumbelDistributionはGompertzMakehamDistributionに従う:
正の軸までで切断されたNormalDistributionはHalfNormalDistributionに従う:
ParetoDistributionは切断のもとで閉じている:
UniformDistributionは切断のもとで閉じている:
離散分布 (2)
アプリケーション (5)
ある食料品店では一日に販売するためにある食品を1ポンドあたり ドルで ポンド仕入れる,この食品の利益はポンドあたり である.この食品が一日に売れる量は分布 に従う.売れ残りはその日のうちに廃棄される.一日の利益が最大になるような を計算する:
30%の利益率を仮定し,需要の分布にLogNormalDistributionを使う:
アメリカのクランベリーの直径は平均16ミリ,標準偏差1.6ミリで正規分布に従う.クランベリーを青果として販売する場合は実の直径が最低15ミリなければならない.それより小さい場合はクランベリーソースの原料として使われる.青果として売られるクランベリーの大きさの分布を求める:
青果として売られる実の直径が少なくとも18ミリである確率を求める:
切断分布を使って裾部の長い分布の表示を制御することができる.サンプルを例に考える:
裾部が長いため,ヒストグラムの範囲を調整し,分布を切断しなければならない:
データにDagumDistributionをフィットさせる:
対数尤度値を比較して,切断分布を使った方フィットの方がよいかどうかを見る:
ある会社では長さが平均0.5インチで正規分布に従う釘を製造している.製造された釘の50%は長さの違いが0.05インチ未満であるとして,標準偏差を求める:
特性と関係 (7)
切断分布の確率密度関数では,切断された区間の内部にしか非零の値がない:
基になっている分布の特性を使って切断分布の確率密度関数を構築する:
テキスト
Wolfram Research (2010), TruncatedDistribution, Wolfram言語関数, https://reference.wolfram.com/language/ref/TruncatedDistribution.html (2016年に更新).
CMS
Wolfram Language. 2010. "TruncatedDistribution." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2016. https://reference.wolfram.com/language/ref/TruncatedDistribution.html.
APA
Wolfram Language. (2010). TruncatedDistribution. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/TruncatedDistribution.html