TextContents
文本内容类型列表 »TextContents[text]
给出在 text 中找到的有关实体、日期、数量及其他与内容相关的元素的信息数据集.
TextContents[text,form]
搜索与类型 form 相符的内容.
TextContents[text,{form1,form2,…}]
搜索与类型 form1、form2、… 相符的内容.
TextContents[text,forms,props]
包括生成的数据集中每个对象的属性 props.
更多信息和选项
- 在 TextContents[text,…] 中,text 可以是字符串、由 File[…] 表示的纯文本文件、ContentObject 表达式或这些文本对象组成的列表.
- TextContents[{text1,text2,…},…] 给出每个 texti 的信息数据集.
- 类型 form 可以是:
-
"type" 任意文本内容类型(如 "Noun"、"City") Entity[…,…] 文本内容类型的特定实体 form1form2… - 与 formi
的任意一种相匹配的形式Containing[outer,inner] 含有 inner 类型的 outer 类型 Verbatim["string"] 要完全匹配的特定字符串 pattern 要匹配的字符串模式 Automatic 实体、日期、量和其他与内容相关的元素 - 属性 prop 的可能的选项包括:
-
"String" 识别出的文字内容的字符串(默认) "Position" 字符串在 text 中开始和结束的位置 "Probability" 估计的识别为正确的概率 "Type" 内容类型(实体类型、…) "Interpretation" 识别出的字符串的标准解释 "Snippet" 已识别字符串周围的片段 "HighlightedSnippet" 文字片段,其中突出显示识别出的字符串 All 上面列出的所有属性 {prop1,prop2,…} 属性指定列表 - 可以给出以下选项:
-
AcceptanceThreshold Automatic 接受识别的最小概率 TargetDevice "CPU" 识别实体时是否使用 CPU 或 GPU 进行计算 VerifyInterpretation False 是否应该核实可解释性
范例
打开所有单元关闭所有单元选项 (2)
AcceptanceThreshold (1)
通过设置较高的 AcceptanceThreshold,只获取极有可能正确的实体:
VerifyInterpretation (1)
默认情况下,无法解释某些实体,要么因为它们不正确,要么因为它们尚未存在于知识库中:
用 VerifyInterpretation 滤除无法解释的实体:
属性和关系 (1)
TextContents 处理与 TextPosition 和 TextCases 相同的类型,并总是为给定类型标识这些函数的同样子字符串:
类似于 TextContents 输出的数据机可以使用 TextCases 获得:
文本
Wolfram Research (2019),TextContents,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextContents.html.
CMS
Wolfram 语言. 2019. "TextContents." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/TextContents.html.
APA
Wolfram 语言. (2019). TextContents. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/TextContents.html 年