WordFrequencyData
WordFrequencyData[word]
给出 word 在常见的已出版的英文文本中出现的频次.
WordFrequencyData[{word1,word2,…}]
给出 wordi 出现频次的关联.
WordFrequencyData[word,"TimeSeries"]
给出 word 在常见的已出版的英文文本中出现频次的时间序列.
WordFrequencyData[word,"TimeSeries",datespec]
给出由 datespec 指定的日期组成的时间序列.
WordFrequencyData[word,"prop"]
给出单词出现频次的属性 prop.
更多信息和选项
- WordFrequencyData[word1word2…] 给出所有单词 wordi 出现的总频次.
- WordFrequencyData[word,"Total",datespec] 给出单词 word 在由 datespec 指定的日期出现的总频次.
- 缺省情况下,WordFrequencyData 使用 Google Books English n-元组出版数据集.
- 可能的选项有:
-
IgnoreCase False 是否忽略 word 的大小写 Language "English" 使用何种语言的文献资料 - 在 WordFrequencyData[word,"prop"] 中,可能的属性包括:
-
"Total" 给出一个日期范围内的总频次 "TimeSeries" 给出频次的时间序列 "CaseVariants" 给出不同大小写情况下的变体 "PartsOfSpeechVariants" 给出词性的不同变体 {prop1,prop2,…} 给出不同属性的组合 - 可能的日期规范为:
-
All 使用指定的文献资料的所有可用日期 DateObject[…] 使用 DateObject year 采用指定的 year {yearmin,yearmax} 使用年份范围 yearmin 到 yearmax {{d1,d2,…}} 使用明确指定的日期 {d1,d2,…}
范例
打开所有单元关闭所有单元基本范例 (4)
范围 (4)
WordFrequencyData 接受具有指定"GrammaticalUnit" 的 TextElement 输入:
推广和延伸 (1)
当 Alternatives 被用作输入时,结果为所给选择的总频次:
Alternatives 可与其他属性组合在一起使用,如 "TimeSeries":
选项 (6)
IgnoreCase (1)
不考虑大写或小写变体,返回单词的频次. 缺省值为 False:
属性和关系 (14)
"CaseVariants" (3)
在 IgnoreCase->True 的情况下获取单词的频次相当于获取上一个输入的 Total:
"PartOfSpeechVariants" (4)
"TimeSeries" (2)
可以用 DateListPlot 直接将结果画出来:
"Total" (5)
允许在日期规范中使用 DateObject 对象:
Infinity 可被用来指定无穷大的范围:
可能存在的问题 (1)
对于未包含在语料库中的词将返回 Missing["NotAvailable"]:
文本
Wolfram Research (2016),WordFrequencyData,Wolfram 语言函数,https://reference.wolfram.com/language/ref/WordFrequencyData.html.
CMS
Wolfram 语言. 2016. "WordFrequencyData." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/WordFrequencyData.html.
APA
Wolfram 语言. (2016). WordFrequencyData. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/WordFrequencyData.html 年