"Language(内置分类器)" (内置分类器)

识别文本是何种语言.

类别

更多信息

  • 该分类器假设文本输入是用唯一一种语言编写的. 这些概率反映了对文本是用哪种语言编写的相信概率,而不是语言的比例.
  • 对于大型文本,分类器随机选择片段确定总体的语种.
  • 在当前版本中,所有的文本必须用他们的官方字母之一编写.

范例

打开所有单元关闭所有单元

基本范例  (2)

确定示例列表的语种:

获取最可能语种的概率:

获取该分类器的 ClassifierFunction

将分类器应用于文本列表:

范围  (1)

加载对应于内置分类器的 ClassifierFunction

获取可能的类:

选项  (3)

ClassPriors  (1)

使用自定义的 ClassPriors 限制可能的输出:

IndeterminateThreshold  (1)

使用自定义的 IndeterminateThreshold

UtilityFunction  (1)

获取分类器的效用函数:

修改效用函数,惩罚 被误分类为

使用新的效用分类文本:

和默认的效用比较结果:

Possible Issues  (1)

在某些情况下,非语言文本仍被识别为一种语言:

巧妙范例  (1)

获取带有对应概率的不同的可能语言:

使用 WordCloud 可视化结果: