記述統計

記述統計とは,位置,分散,形等の分布の特性を示すことである.ここで扱う関数はデータのリストの記述統計を計算する.「連続分布」および「離散分布」に含まれる関数を使うと,さまざまな既知の分布の標準的な記述統計のいくつかを計算することができる.

記述統計は,データ の各値の確率が はデータ中の要素数)であるという仮定のもとに計算される.

Mean[data]平均値
Median[data]メジアン(中央値)
Commonest[data]最大頻度の要素のリスト
GeometricMean[data]幾何平均
HarmonicMean[data]調和平均
RootMeanSquare[data]二乗平均平方根
TrimmedMean[data,f]並べ替えられたデータのリストの両端から ずつ除いた後に残った要素の平均
TrimmedMean[data,{f1,f2}]並べ替えられたデータの両端からそれぞれ 除いた後に残った要素の平均
Quantile[data,q] 分位数
Quartiles[data]list の中の要素の四分位数のリスト

位置の統計量

位置の統計量とは,データがどこに位置するかを記述するものである.最も一般的な関数には平均,中央値,最頻値など,中心傾向を表すものがある.Quantile[data, q]はデータの下からパーセントに当たる点の位置を与える.つまり,Quantileとなる確率が 以下で,となる確率が 以上である値 を与える.

データである.
In[1]:=
Click for copyable input
Out[1]=
データの平均と中央値を見付ける.
In[2]:=
Click for copyable input
Out[2]=
リストの最小要素を除外したときの平均である.TrimmedMeanを使うと,削除した外れ値を含むデータを記述することができる.
In[3]:=
Click for copyable input
Out[3]=
Variance[data]分散の不偏推定量,
StandardDeviation[data]標準偏差の不偏推定量
MeanDeviation[data]平均絶対偏差,
MedianDeviation[data]中央絶対偏差,の中央値
InterquartileRange[data]第1四分位数と第3四分位数との差
QuartileDeviation[data]四分位偏差の半分

分散の統計量

分散の統計量はデータのばらつきと広がりを要約するものである.これらの関数の大部分は指定された位置からの偏差を示す.例えば,分散とは平均からの偏差であり,標準偏差とは分散の平方根である.

除数が であるデータの分散の不偏推定値を与える.
In[4]:=
Click for copyable input
Out[4]=
3種類の偏差を比較する.
In[5]:=
Click for copyable input
Out[5]=
Covariance[v1,v2]リスト の間の共分散係数
Covariance[m]行列 m に対する共分散行列
Covariance[m1,m2]行列 に対する共分散行列
Correlation[v1,v2]リスト の間の相関係数
Correlation[m]行列 m に対する相関行列
Correlation[m1,m2]行列 に対する相関行列

共分散および相関統計

共分散は分散の多変量拡張である.同じ長さの2つのベクトルの場合,共分散は数値である.単独の行列 m の場合は,共分散行列の 番目の要素は,m の第 i 列と第 j 列の間の共分散である.2つの行列 の場合は,共分散行列の 番目の要素は,の第 i 列と の第 j 列の間の共分散である.

共分散は散らばりを測定し,相関は関連性を測定する.2つのベクトル間の相関は,そのベクトルの標準偏差で割ったベクトル間の共分散に等しい.同様に,相関行列の要素は,適切な列標準偏差でスケールされた対応する共分散行列の要素に等しい.

data と乱数ベクトルの間の共分散を与える.
In[6]:=
Click for copyable input
Out[6]=
乱数行列である.
In[7]:=
Click for copyable input
Out[7]=
行列 m に対する相関行列.
In[8]:=
Click for copyable input
Out[8]=
共分散行列である.
In[9]:=
Click for copyable input
Out[9]=
共分散行列の項を,適切な標準偏差でスケールすることにより,相関行列が与えられる.
In[10]:=
Click for copyable input
Out[10]=
CentralMoment[data,r]r 次中心モーメント
Skewness[data]歪度係数
Kurtosis[data]尖度係数
QuartileSkewness[data]四分位の歪度係数

形状の統計量

形状の統計量は分布の形状についての情報を得るために使われる.歪度は非対称の度合いを示す.尖度は,頂点付近と裾のデータの集中度に対するフランクの集中度を測定する.

Skewnessは,三次中心モーメントを母集団の標準偏差の3乗で除算することで求められる.Kurtosisは,四次中心モーメントをデータの母分散の2乗で除算することで求められ,CentralMoment[data, 2]と等価である(母分散は二次中心モーメント,母標準偏差はその平方根である).

QuartileSkewnessはデータの四分位数から計算する.これはと等価であり, はそれぞれ第1,第2,第3四分位数である.

以下はデータの二次中心モーメントである.
In[11]:=
Click for copyable input
Out[11]=
歪度が負の値となる場合は,データに潜在する分布が左側に長い裾を持つことを示す.
In[12]:=
Click for copyable input
Out[12]=
Expectation[f[x],xDistributedlist]list の値についての x の関数 f の期待値

期待値

関数 の期待値は,値 ,..., のリストについて である.多くの記述統計は期待値である.例えば,平均値は の期待値であり, 次中心モーメントは(ここで の平均値)の期待値である.

以下はデータのLogの期待値である.
In[13]:=
Click for copyable input
Out[13]=
New to Mathematica? Find your learning path »
Have a question? Ask support »