教師なし機械学習
この分野の概要 »
教師なし機械学習は,タグの付いていないデータを分析し,隠れた関係を発見する試みである.隠れたパターン,類似した例のクラスタ,基礎となるデータ分布,またはより単純なデータ表現を検出する.一般的な使用例には,病気の診断,マーケットバスケット分析,消費者のグループ化,異常検出がある.教師なし機械学習はデータの視覚化にも役立つ. Wolfram言語は教師なし学習メソッドの大規模なコレクションを提供する.それは,特徴の選択と抽出,モデルの選択と相互検証等,処理パイプラインの大部分を自動化し,標準の配列だけでなく,テキストや画像,グラフなどあらゆる種類のデータ分析を可能にする目標ベースの関数を介してアクセスできる.
クラスタ解析 »
ClusterClassify — データをクラスタに分類する
ClusteringMeasurements — クラスタリング処理の結果を解析する
FindClusters ▪ ClusteringTree ▪ ClusteringComponents ▪ ...
特徴抽出
FeatureExtraction — データから特徴を抽出する方法を見付ける
FeatureExtract ▪ FeatureExtractorFunction ▪ FeatureNearest
異常検出
AnomalyDetection — データから異常検出器を学習する
FindAnomalies ▪ DeleteAnomalies ▪ AnomalyDetectorFunction ▪ RarerProbability
次元削減
DimensionReduction — 低次元空間にデータを投影する方法を見付ける
DimensionReduce ▪ DimensionReducerFunction
分布モデリング
LearnDistribution — あらゆるタイプのデータの基本的な分布を学習する
FindDistribution — 名前付き分布の観点からデータの表現を見付ける
SynthesizeMissingValues — 既存のデータから入力して,欠損値を埋める
可視化
FeatureSpacePlot — 次元が削減された特徴空間を2Dで可視化する
FeatureSpacePlot3D — 次元が削減された特徴空間を3Dで可視化する
FeatureValueImpactPlot — モデルの結果に対する特徴値の影響をプロットする
FeatureImpactPlot — 各特徴の影響を一緒にプロットする
CumulativeFeatureImpactPlot — 各特徴の累積的な影響をプロットする
FeatureValueDependencyPlot — 特徴値に対する結果の依存関係をプロットする
Dendrogram — 階層的クラスタを可視化する
特定の教師なし学習のメソッド
FindGraphCommunities — グラフ中のコミュニティやクラスタを探す
SmoothKernelDistribution — データのカーネル密度推定を求める
FindHiddenMarkovStates — データの列から隠れマルコフ(Markov)状態を推測する
Eigensystem ▪ SingularValueDecomposition ▪ PrincipalComponents ▪ KarhunenLoeveDecomposition
教師なし学習メソッド »
"GaussianMixture" — ガウス(正規)分布の混合を使用する
"KernelDensityEstimation" — カーネル混合分布を使用する
"Multinormal" — 多変量正規(ガウス)分布を使用する
"KMeans" ▪ "DBSCAN" ▪ "Autoencoder" ▪ "TSNE" ▪ "UMAP" ▪ ...