TextCases
TextCases[text,form]
给出 text 中类型 form 的所有情况列表.
TextCases[text,{form1,form2,…}]
给出封装在关联中所有 formi 的列表.
TextCases[text,formspecprop]
给出每种情况指定的属性.
TextCases[text,formspec{prop1,prop2,…}]
给出每个找到的结果的属性列表.
TextCases[text,spec,n]
给出前 n 种情况.
更多信息和选项
- TextCases 被用于执行多种自然语言处理任务,如词性标注或已命名实体识别.
- 在 TextCases[text,…] 中,text 可以是一个字符串,一个由 File[…] 表示的纯文本文件,一个 ContentObject 表达式或这些文本对象的列表.
- TextCases[{text1,text2,…},…] 给出每个 texti 的情况.
- 识别类型 form 可以是:
-
"type" 任何文本内容类型(例如, "Noun"、"City" ) Entity[…,…] 文本内容类型的指定实体 form1form2… - 匹配任何 formi
的格式Containing[outer,inner] 包含类型 inner 的类型 outer 格式 Verbatim["string"] 精确匹配的指定字符串 pattern 匹配的字符串模式 - 属性 prop 的可能选择有:
-
"String" (默认的)识别文本的字符串 "Position" text 中字符串的开始和结束位置 "Probability" 估计情况正确的概率 "Interpretation" 识别的字符串的标准诠释 "Snippet" 识别的字符串周围的片段 "HighlightedSnippet" 识别的字符串突出显示的片段 f 把 f 应用于包含所有属性的关联 {prop1,prop2,…} 属性规范列表 - 可以给出以下选项:
-
AcceptanceThreshold Automatic 接受识别的最小概率 PerformanceGoal Automatic 带有特定优势的有利算法 TargetDevice "CPU" CPU 或 GPU 计算是否应该用于实体检测 VerifyInterpretation False 是否应该验证可诠释性 - TextCases 使用机器学习. 其方法、训练集和包含的偏差可能会在不同版本的 Wolfram 语言中发生变化并给出不同的结果.
- TextCases 可能会下载将保存在本地对象存储(位于 $LocalBase)中的资源,可用 LocalObjects[] 列出资源,用 ResourceRemove 将其删除.
范例
打开所有单元关闭所有单元范围 (5)
单词和句子分割 (2)
Alternatives 和 Containing (2)
返回类型 (1)
选项 (3)
AcceptanceThreshold (1)
通过设置高的 AcceptanceThreshold 可以获取极有可能正确的实体:
PerformanceGoal (1)
使用 PerformanceGoal->"Speed" 可以帮助加速检测,但是低精度:
VerifyInterpretation (1)
默认情况下,某些实体不能被诠释,可能是因为它们不正确或者还没有在知识库. 在这种情况下,会返回字符串而不是一个诠释:
使用 VerifyInterpretation 过滤不能被诠释的实体:
应用 (6)
单词和句子分割 (2)
实体和可诠释对象 (2)
属性和关系 (4)
TextCases 处理与 TextPosition 和 TextContents 相同的类型,并总是为给定类型标识这些函数的同样子字符串:
TextCases 是 TextPosition 的广义性:
类似于 TextContents 输出的数据集可以使用 TextCases 获取:
TextSentences 等价于 TextCases[…,"Sentence"]:
TextStructure 把文本分割成同样的句子:
TextWords 等同于 TextCases[…,"Word"]:
TextStructure 把文本分割成与 TextCases[…,"Word""Punctuation"] 一样的单词和标点符号:
巧妙范例 (2)
可在地图上标出许多实体(城市、国家等). TextCases 可一次性找出所有这样的实体.
查找所有包含日期的句子,并提取其对应的 DateObject 解释:
文本
Wolfram Research (2015),TextCases,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextCases.html (更新于 2019 年).
CMS
Wolfram 语言. 2015. "TextCases." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2019. https://reference.wolfram.com/language/ref/TextCases.html.
APA
Wolfram 语言. (2015). TextCases. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/TextCases.html 年