ZipfDistribution

ZipfDistribution[ρ]
母数 ρ のゼータ分布を表す.

ZipfDistribution[n,ρ]
範囲 n のZipf分布を表す.

詳細詳細

  • ZipfDistribution[ρ]は離散パレート分布としても知られている.
  • ZipfDistribution[n,ρ]はEstoup分布としても知られている.
  • と有限な の確率は x^(-(rho+1))/TemplateBox[{n, {rho, +, 1}}, HarmonicNumber2]で与えられる.無限の については x^(-(rho+1))/TemplateBox[{{rho, +, 1}}, Zeta]で与えられる.
  • ZipfDistributionでは,ρ は任意の正の実数でよく,n は任意の正の整数でよい.
  • ZipfDistributionは,MeanCDFRandomVariate等の関数で使うことができる. »

予備知識
予備知識

  • ZipfDistribution[n,ρ]は,整数値 について定義され,正の実数 ρ および正の整数 n (分布の範囲)によって決定される離散統計分布を表す.Zipf分布の確率密度関数(PDF)は離散的で単調減少であり,その全体的な形(広がり,領域,傾斜が急かどうか)は母数 ρ および n の値によって決まる.ここで定義しているZipf分布はEstoup分布と呼ばれることがある.母数が1つの形のZipfDistribution[ρ]n ときのZipfDistribution[n,ρ]の極限に等しく,最も一般的なZipf分布であるが,ゼータ分布,Zipfian分布,離散パレート分布(連続ParetoDistributionと混同してはならない)等と呼ばれることもある.
  • Zipf分布はアメリカ人の言語学者George Zipfに因んで名付けられた.Zipfは1930年代から1940年代にかけて行動と心理についての自身の研究にこの分布を盛んに応用した.この分布は,フランス人の速記者であるBaptiste Estoupによってすでに1912年から同様の文脈で応用されていたが,Zipfの研究によってZipf分布が基礎となっている現在Zipfの法則と呼ばれるものが誕生した.この法則は,自然言語における任意の単語の使用頻度は,度数分布と関連したその言語におけるその語の順位と反比例すると述べている.このため,現代におけるZipf分布の応用分野は言語学および意味論関連が多くなっている.しかし,この分布は数論,生物学,経済学においても使用されている.
  • RandomVariateを使って,Zipf分布から,1つあるいは複数の機械精度あるいは任意精度(後者はWorkingPrecisionオプションを介す)の擬似乱数変量を得ることができる.Distributed[x,ZipfDistribution[n,ρ]](より簡略な表記では xZipfDistribution[n,ρ])を使って,確率変数 x がZipf分布に従って分布していると宣言することができる.このような宣言は,ProbabilityNProbabilityExpectationNExpectation等の関数で使うことができる.
  • 確率密度関数および累積分布関数は,PDF[ZipfDistribution[n,ρ],x]およびCDF[ZipfDistribution[n,ρ],x]を使って得られる.平均,中央値,分散,原点の周りのモーメント,中心モーメントは,それぞれMeanMedianVarianceMomentCentralMomentを使って計算することができる.これらの数量はDiscretePlotを使って可視化できる.
  • DistributionFitTestを使って,与えられたデータ集合がZipf分布と一致するかどうかを検定することが,EstimatedDistributionを使って与えられたデータからパラメトリックZipf分布を推定することが,FindDistributionParametersを使ってデータをZipf分布にフィットすることができる.ProbabilityPlotを使って記号Zipf分布のCDFに対する与えられたデータのCDFのプロットを生成することが,QuantilePlotを使って記号Zipf分布の変位値に対する与えられたデータの変位値のプロットを生成することができる.
  • TransformedDistributionを使って変換されたZipf分布を表すことが,CensoredDistributionを使って上限値と下限値の間で切り取られた値の分布を表すことが,TruncatedDistributionを使って上限値と下限値の間で切断された値の分布を表すことができる.CopulaDistributionを使ってZipf分布を含む高次元分布を構築することが,ProductDistributionを使ってZipf分布を含む独立成分分布の結合分布を計算することができる.
  • ZipfDistributionは他の数多くの統計分布と関連がある..この分布は,しばしばParetoDistributionの離散バージョンであるとみなされ,したがって,PowerDistributionStableDistributionExponentialDistributionPearsonDistributionBetaPrimeDistributionと関係がある.ZipfDistributionは,CauchyDistributionLevyDistributionPoissonDistributionPoissonConsulDistributionSkellamDistributionとも関連している.

例題例題すべて開くすべて閉じる

  (4)  (4)

確率質量関数:

In[1]:=
Click for copyable input
Out[1]=
In[2]:=
Click for copyable input
Out[2]=

有限範囲で:

In[2]:=
Click for copyable input
Out[2]=
In[3]:=
Click for copyable input
Out[3]=
In[5]:=
Click for copyable input
Out[5]=

累積分布関数:

In[1]:=
Click for copyable input
Out[1]=
In[2]:=
Click for copyable input
Out[2]=

有限範囲で:

In[3]:=
Click for copyable input
Out[3]=
In[4]:=
Click for copyable input
Out[4]=
In[5]:=
Click for copyable input
Out[5]=

平均:

In[1]:=
Click for copyable input
Out[1]=
In[2]:=
Click for copyable input
Out[2]=

分散:

In[1]:=
Click for copyable input
Out[1]=
In[2]:=
Click for copyable input
Out[2]=
2007年に導入
(6.0)
| 2010年に修正
(8.0)
Translate this page: