Mathematica 9 is now available
THIS IS DOCUMENTATION FOR AN OBSOLETE PRODUCT.
SEE THE DOCUMENTATION CENTER FOR THE LATEST INFORMATION.
Mathematica >

基本統計

Mean[list]平均値
Median[list]メジアン(中央値)
Max[list]最大値
Variance[list]分散
StandardDeviation[list]標準偏差
Quantile[list,q]q に当たる分位数
Total[list]総和

基本的な記述統計操作

n 個の要素xi を持つリストの平均Mean[list] と定義される.
分散Variance[list]は,実数データに関してはvar (x)=2 (x)= (xi- (x))2/ (n-1)と定義される.(複素数のデータに関してはと定義される.)
標準偏差StandardDeviation[list]は,と定義される.
list 中の要素が何らかの確率分布に従ってランダムに選ばれたと考えられるなら,「平均」は分布の中央がどこにあるかを推定し,標準偏差は分布におけるばらつきの度合いを推定する.
メジアンMedian[list]は,事実上,順序付けられたリストlist の中央の値を与える.これは値の広がりに依存する度合いが低いので,分布の中央を知るための平均よりも強力な尺度であると考えられることが多い.
q に当たる分位数Quantile[list, q]は,事実上順序付けしたリストlistq に当たる値を与える.
長さn のリストについて,MathematicaQuantile[list, q]s[[Ceiling[n q]]]であると定義する.ここで,sSort[list, Less]である.
しかし,分位数の定義で使われているものはこの他にも10種類程ある.そのすべてが多少異なった結果を与える.MathematicaQuantile[list, q, {{a, b}, {c, d}}]の形式で4つの「分位数のパラメータ」を導入して一般的な事例をカバーする.パラメータab は実際にリストのどの部分がq の位置であるかを定義する.これが整数の位置に当たるときにはその位置にある要素がq に当たる分位数とみなされる.これが整数の位置にないときには,cd で定義されているようにどちらかの側の要素の線形結合が使われる.
順序付けしたリストs 中のq に当たる分位数の位置はk=a+ (n+b) q であると考えられる.k が整数の場合,分位数はsk である.その他の場合はsk+ (sk-sk) (c+d (k-k))である.指標が領域外にあるときは係数を1あるいはn と考える.
{{0,0},{1,0}}実証的累積分布関数の逆関数(デフォルト)
{{0,0},{0,1}}線形補間法(カリフォルニア法)
{{1/2,0},{0,0}}qn に最も近い番号付き要素
{{1/2,0},{0,1}}線形補間法(水文学者法)
{{0,1},{0,1}}平均値に基づいた推定(ワイブル法)
{{1,-1},{0,1}}最頻値に基づいた推定
{{1/3,1/3},{0,1}}中央値に基づいた推定
{{3/8,1/4},{0,1}}標準分布推定

分位数パラメータの一般的な選択肢

d=0のときは,q に当たる分位数の値はlist 中の何らかの実在の要素に等しいので,q が変化するに連れて結果も非連続的に変化する.d=1ならq に当たる分位数はlist の連続する要素間を線形に補間する.Medianはこのような補間を使用するように定義されている.
Quantile[list, q]q=m/4のときは四分位数を,q=m/100ときは百分位数を返す.
Mean[{x1,x2,...}]xi の平均値
Mean[{{x1,y1,...},{x2,y2,...},...}]xi, yi, ... の平均値のリスト

多次元データの処理

データ中の各項目が値のリストを含む場合がある.Mathematica の基本的な統計関数はそのようなリスト中の対応するすべての要素に自動的に適用される.
これはデータの各「列」の平均を別々に求める.
In[1]:=
Click for copyable input
Out[1]=
list[[All, i]]を使って多次元リストからi 番目の「列」中の要素を抽出することができる.
Ask a question about this page  |  Suggest an improvement  |  Leave a message for the team