WordCounts

WordCounts["string"]

给出一个关联，其中的键是 string 中的不同单词，值为 string 中单词出现的次数.

WordCounts["string",n]

给出 string 中由 n 个单词组成的不同的 n-gram 的数量.

WordCounts[{"string₁","string₂",…},…]

给出每个 string_i 的统计结果.

范例

打开所有单元关闭所有单元

基本范例 (3)

统计字符串中的不同单词的数量：

计算字符串中不同的 2-gram 单词序列的数量：

统计每个字符串中不同单词的数量：

范围 (1)

单词可以包含数字和连字符，但不包含大多数标点符号：

选项 (2)

IgnoreCase (2)

默认设置 IgnoreCase->False 将大写和小写字符视为不同的字符：

IgnoreCase->True 将仅大小写不同的单词视为相同：

统计 n-grams 的数量，忽略大小写：

应用 (2)

计算在阿瑟·柯南·道尔的几本小说中主要角色夏洛克·福尔摩斯和约翰·华生被提到的次数：

可视化结果：

从 ExampleData 中获取米格尔·塞万提斯的小说《唐吉可德》来测试齐夫定律（Zipf's law）：

产生该文本中所有单词的频次表：

齐夫定律（Zipf's law）声称一个单词出现的频率与其在频次表中的排名在双对数曲线图中大致成线性关系. 在前 1000 个最常用的单词上检测这种说法：

结果接近 . 在图中同时显示拟合曲线和实际数据：

巧妙范例 (1)

找出文本中最常出现的 20 个单词：

对 2 个单词组成的序列执行相同操作：

顶部

更多学习资源

技术支持

成人教育计划

青少年教育计划

活动

Wolfram 倡议

教育资源

爱好与项目

Wolfram 解决方案

Wolfram 的教育解决方案

开始

提高你的技能

与我们合作

欢迎阅读

成人教育计划

青少年教育计划

活动

WordCounts

更多信息和选项

范例

基本范例 (3)

范围 (1)

选项 (2)

IgnoreCase (2)

应用 (2)

巧妙范例 (1)

文本

CMS

APA

BibTeX

BibLaTeX

WordCounts

更多信息和选项

范例

基本范例 (3)

范围 (1)

选项 (2)

IgnoreCase (2)

应用 (2)

巧妙范例 (1)

参见

相关指南

相关的工作流程

历史

文本

CMS

APA

BibTeX

BibLaTeX