"TSNE" (機械学習メソッド)

詳細とサブオプション

  • "TSNE"t-分布確率近傍埋込みを意味する非線形ノンパラメトリック次元削減メソッドである.このメソッドは局所構造を保持したデータの低次元表現を学ぼうとする.
  • "TSNE"は非線形多様体のデータ集合に使うことができ,特に高次元データ集合の可視化に適している.しかし,特徴が多数あるデータ集合や例の数が多いデータ集合について訓練するのには時間がかかる.
  • 以下は,ベンチマークデータ集合のFisher's IrisesMNISTFashionMNISTに適用された"TSNE"メソッドが学習した二次元埋込みを示している.
  • "TSNE"は,もとの空間でデータ点(xi, xj)の類似度行列 p_(ij)が与えられると,低次元空間における類似度 q_(ij)p_(ij)と一致するような低次元埋込み を求めようとする.
  • もとの空間における類似度は で与えられる.ただし, は近傍半径に相当する.低次元空間における類似度は によって与えられる.
  • 低次元埋込み は埋込みコスト を最小にすることで計算される.
  • パラメータ はPerplexityパラメータによって間接的に制御される.Perplexityが大きいとクラスタ量が小さくなり,Perplexityが小さいと多くのクラスタになる.
  • 次のサブオプションを与えることができる.
  • "Perplexity" Automatic半径 ϵ
    "LinearPrereduction" Falset-SNEメソッドの実行前に線形削減を行うかどうか

例題

すべて開くすべて閉じる

  (1)

"TSNE"メソッドを使って画像の次元を削減する:

画像の二次元表現を可視化する:

オプション  (2)

"Perplexity"  (1)

フィッシャー(Fisher)の「アヤメ」のデータ集合をExampleDataからロードする:

"TSNE"メソッドを使って削減関数を生成する:

例を種によってグループ化する:

特徴の次元を削減する:

削減されたデータ集合を可視化する:

別のPerplexity値を使って同じ操作を行う:

"LinearPrereduction"  (1)

"MNIST"データ集合からサンプルをロードする:

"TSNE"を使って画像の次元を削減する:

"LinearPrereduction"サブオプションを使ってt-SNEメソッドを実行する前に線形削減を行うことで特徴を求める:

入手した特徴を可視化して結果と比較する:

アプリケーション  (1)

データの可視化  (1)

"TSNE"メソッドを使って画像の次元を削減する:

画像の二次元表現を可視化する: