TransformAnomalies

TransformAnomalies[data,tspec]

データ中の異常値を変換 tspec を使って変換する.

TransformAnomalies[data,dspectspec]

指定 dspec を使って異常値を検出する.

TransformAnomalies[tab,{col1spec1,}]

coliに指定 speciを使って表形式データ tab を変換する.

詳細

  • TransformAnomaliesは,異常検出あるい外れ値処理としても知られている.
  • TransformAnomaliesは,事実上異常値を特定しこれを管理することで,信頼性の高い分析を保証し,データ品質を保持することに役に立つ.
  • 次は,data の使用可能な形式である.
  • {el1,el2,}個々の要素のリスト
    tab表形式データ
  • 次は,使用可能な表形式データ tab の形式である.
  • Tabular表形式オブジェクト
    Datasetデータ集合オブジェクト
    {assoc1,assoc2,}連想のリスト
    matrix行列
  • 次は,異常値を管理するために使用可能な変換方法 tspec である.
  • "Clip"極値を異常ではない範囲に制限する
    "Replace"異常値を計算された値で置換する
    {"Replace",method}method を使って異常値を置換する
    "Trim"異常要素を除去する
    "Flag"異常値をMissing["Anomalous"]で置換する
    tfun関数 tfun を使って異常値を変換する
  • 使用可能な"Replace"法はTransformMissingにおけるものに等しい.
  • " Mean"平均値
    "Median"中央値
    "Mode"最頻値
    {"Constant", val}一定の値 val
    "RandomElement"ランダムに選択された値
    {"RandomVariate",dist}dist からサンプルとして取られた値
    "NearestElement"欠落していない最近の要素を使う
    "NextElement"欠落していない次の要素を使う
    "PreviousElement"欠落していない前の要素を使う
    "Interpolation"補間を使う
    {"Interpolation",InterpolationOrderdegree}補間次数 degree を指定する
  • 異常値を除外することは分析に対する異常値の影響を最小にする.異常値の切取りや置換は異常値の影響を最小にしつつデータ集合の構造は保持する.フラッグを立てると将来的な分析のためにすべてのデータ点を保持しつつ検討項目として異常値に印を付けることができる.
  • 以下は,異常値検出に使えるメソッド dspec である.
  • "IQR"四分位範囲閾値
    "ZScore"平均からの標準偏差
    "ModifiedZScore"中央値とMADを使った強力なバージョン
    {spec,t}異常検出に閾値 t を指定する
    {spec,{t1,t2}}上下の閾値を指定する
  • さらに,次の指定もサポートされている.
  • Scaled[f]最小要素および最大要素の割合 f
    Scaled[{f1,f2}]最小要素と最大要素に別々の閾値
    dfunカスタム関数 fun
  • カスタムの異常値検出器 dfun は,各要素に別々に適用されてブール値を返さなければならない.
  • 希望の列を指定するとき,coliは以下の形式を取ることができる.
  • nn 番目の列
    "name""name"
    TypeSpecifier[]指定の型にマッチする列
    Allすべての列
    Automaticspec に基づいて自動的に列を求める(デフォルト)

例題

すべて開くすべて閉じる

  (2)

大小の値を削除することで外れ値を処理する:

95パーセンタイルより上の値を切り取る:

スコープ  (16)

データ型  (5)

リスト中の異常値を検出する:

TabularColumn中の異常値を検出する:

行列の列に沿って異常値を検出する:

Tabularオブジェクト中の異常値を検出する:

同じキーにまたがる連想のリスト中の異常値を検出する:

検出法  (6)

四分位範囲を使って異常を検出する:

Z値を使って異常を検出する:

修正Z値を使って異常を検出する:

カスタムの閾値を指定する:

上下の閾値を別々に指定する:

最小要素と最大要素の一部にフラグを設定する:

最小と最大の部分を別々に指定する:

カスタム関数を使って異常を検出する:

変換法  (5)

異常値を削除する:

異常値を最も近い値で置換する:

異常値を欠落要素で置換する:

任意のTransformMissing指定を適用する:

カスタムの変換を適用する:

アプリケーション  (2)

売上データのTabularオブジェクトを取得する:

"Sales"列には外れ値の0があるが,これは欠落値の代りである:

もとのデータから関連する行を削除することで0という異常値を変換する:

Missingオブジェクトに変えることで0という異常値を変換する:

新たなデータをチェックする:

気象観測のTabularオブジェクトを取得する:

気温をプロットする:

気温データには,多分不正な単位でデータを入力したことによる,外れ値が含まれているようである.同様に,"Pressure"列にも外れ値が含まれている.これは,しばしば欠落値に使われる99という数である.気温単位の変換関数を指定する:

上記関数を使って"Temperature"列の外れ値を変換し,"Pressure"列の外れ値は直近の有効な値で置換する:

観測値をプロットする:

Wolfram Research (2025), TransformAnomalies, Wolfram言語関数, https://reference.wolfram.com/language/ref/TransformAnomalies.html.

テキスト

Wolfram Research (2025), TransformAnomalies, Wolfram言語関数, https://reference.wolfram.com/language/ref/TransformAnomalies.html.

CMS

Wolfram Language. 2025. "TransformAnomalies." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/TransformAnomalies.html.

APA

Wolfram Language. (2025). TransformAnomalies. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/TransformAnomalies.html

BibTeX

@misc{reference.wolfram_2025_transformanomalies, author="Wolfram Research", title="{TransformAnomalies}", year="2025", howpublished="\url{https://reference.wolfram.com/language/ref/TransformAnomalies.html}", note=[Accessed: 15-January-2025 ]}

BibLaTeX

@online{reference.wolfram_2025_transformanomalies, organization={Wolfram Research}, title={TransformAnomalies}, year={2025}, url={https://reference.wolfram.com/language/ref/TransformAnomalies.html}, note=[Accessed: 15-January-2025 ]}