教師なし機械学習

この分野の
概要 »

教師なし機械学習は,タグの付いていないデータを分析し,隠れた関係を発見する試みである.隠れたパターン,類似した例のクラスタ,基礎となるデータ分布,またはより単純なデータ表現を検出する.一般的な使用例には,病気の診断,マーケットバスケット分析,消費者のグループ化,異常検出がある.教師なし機械学習はデータの視覚化にも役立つ. Wolfram言語は教師なし学習メソッドの大規模なコレクションを提供する.それは,特徴の選択と抽出,モデルの選択と相互検証等,処理パイプラインの大部分を自動化し,標準の配列だけでなく,テキストや画像,グラフなどあらゆる種類のデータ分析を可能にする目標ベースの関数を介してアクセスできる.

クラスタ解析 »

ClusterClassify データをクラスタに分類する

ClusteringMeasurements クラスタリング処理の結果を解析する

FindClusters  ▪  ClusteringTree  ▪  ClusteringComponents  ▪  ...

特徴抽出

FeatureExtraction データから特徴を抽出する方法を見付ける

FeatureExtract  ▪  FeatureExtractorFunction  ▪  FeatureNearest

異常検出

AnomalyDetection データから異常検出器を学習する

FindAnomalies  ▪  DeleteAnomalies  ▪  AnomalyDetectorFunction  ▪  RarerProbability

次元削減

DimensionReduction 低次元空間にデータを投影する方法を見付ける

DimensionReduce  ▪  DimensionReducerFunction

分布モデリング

LearnDistribution あらゆるタイプのデータの基本的な分布を学習する

FindDistribution 名前付き分布の観点からデータの表現を見付ける

SynthesizeMissingValues 既存のデータから入力して,欠損値を埋める

可視化

FeatureSpacePlot 次元が削減された特徴空間を2Dで可視化する

FeatureSpacePlot3D 次元が削減された特徴空間を3Dで可視化する

FeatureValueImpactPlot モデルの結果に対する特徴値の影響をプロットする

FeatureImpactPlot 各特徴の影響を一緒にプロットする

CumulativeFeatureImpactPlot 各特徴の累積的な影響をプロットする

FeatureValueDependencyPlot 特徴値に対する結果の依存関係をプロットする

Dendrogram 階層的クラスタを可視化する

特定の教師なし学習のメソッド

FindGraphCommunities グラフ中のコミュニティやクラスタを探す

SmoothKernelDistribution データのカーネル密度推定を求める

FindHiddenMarkovStates データの列から隠れマルコフ(Markov)状態を推測する

Eigensystem  ▪  SingularValueDecomposition  ▪  PrincipalComponents  ▪  KarhunenLoeveDecomposition

教師なし学習メソッド »

"GaussianMixture" ガウス(正規)分布の混合を使用する

"KernelDensityEstimation" カーネル混合分布を使用する

"Multinormal" 多変量正規(ガウス)分布を使用する

"KMeans"  ▪  "DBSCAN"  ▪  "Autoencoder"  ▪  "TSNE"  ▪  "UMAP"  ▪  ...