"Language" (組込み分類器)

テキストがどの自然言語のものかを識別する.

クラス

詳細

  • この分類器はテキスト入力が一意的な言語で書かれていると仮定する.確率は,言語の比率ではなく,テキストがどの言語で書かれているのかについての信念を反映するものである.
  • この分類器は,テキストの量が多い場合は文章の断片をランダムに選択して全体としての言語を判定する.
  • 現行バージョンでは,すべての言語がいずれかの公式アルファベットで書かれていなければならない.

例題

すべて開くすべて閉じる

  (2)

例のリストの言語を判別する:

最も可能性の高い言語の確率を得る:

この分類器のClassifierFunctionを得る:

この分類器をテキストのリストに適用する:

スコープ  (1)

組込みの分類器に対応するClassifierFunctionをロードする:

使用可能なクラスを得る:

オプション  (3)

ClassPriors  (1)

カスタムのClassPriorsを使って可能な出力を制限する:

IndeterminateThreshold  (1)

カスタムのIndeterminateThresholdを使う:

UtilityFunction  (1)

分類器の効用関数を得る:

この効用関数に変更を加えてが誤ってと分類された場合にペナルティを科すようにする:

新たな効用関数を使ってテキストを分類する:

デフォルトの効用関数の結果と比較する:

考えられる問題  (1)

場合によっては,非言語テキストが特定の言語として認識されることがある:

おもしろい例題  (1)

可能性がある各言語を対応する確率とともに得る:

WordCloudを使って結果を可視化する: