TextPosition
文本内容类型的列表 »TextPosition["text",form]
给出 text 中 form 实例的开始和终止位置的列表.
TextPosition[text,{form1,form2,…}]
给出所有类型 formi 的关联结果.
TextPosition[text,formspec,n]
给出前 n 个找到的位置.
更多信息和选项
- 在 TextCases[text,form]中,text 可以是字符串、纯文本文件、ContentObject 表达式或者这些文本对象的列表.
- TextPosition[{text1,text2,…},…] 产生对应于 texti 的相应结果列表.
- 识别类型 form 可以是:
-
"type" 任何文本内容类型(例如, "Noun"、"City" ) Entity[…,…] 文本内容的类型的指定实体 form1form2… - 匹配任何 formi 的格式
Containing[outer,inner] 包含类型 inner 的类型 outer 的格式 Verbatim["string"] a精确匹配的特殊字符串 pattern 要匹配的字符串模式 - 属性 prop 的可能选择是:
-
"String" (默认)识别文本的字符串 "Position" text 中字符串开始和结束的位置 "Probability" 识别是正确的估计概率 "Interpretation" 识别的字符串的标准诠释 "Snippet" 识别的字符串周边的片段 "HighlightedSnippet" 带有高亮的识别字符串的片段 f 把 f 应用到包含所有属性的关联 {prop1,prop2,…} 属性规范的列表 - 可以给出以下选项:
-
AcceptanceThreshold Automatic 接受识别的最小概率 PerformanceGoal Automatic 具有特定优势的偏爱算法 TargetDevice "CPU" 是否应该使用 CPU 或 GPU 计算作为实体检测 VerifyInterpretation False 是否应该验证可诠释性
范例
打开所有单元关闭所有单元范围 (4)
ContextObject 和 File (2)
Alternatives 和 Containing (2)
使用 Alternatives 匹配多种类型:
组合 Alternatives 和 Containing 形成高度结构化的查询:
选项 (3)
AcceptanceThreshold (1)
通过设置高的 AcceptanceThreshold,仅获取极有可能正确的实体:
PerformanceGoal (1)
使用 PerformanceGoal->"Speed" 可以加速检测,但是更低的精确度:
VerifyInterpretation (1)
默认情况下,有些实体不能被诠释,可能因为不正确或还没有在知识库中. 在这种情况下,返回一个字符串,而不是一个诠释:
使用 VerifyInterpretation 过滤不能被诠释的实体:
应用 (6)
单词和句子分割 (2)
实体和诠释对象 (2)
属性和关系 (1)
TextPosition 处理与 TextCases 和 TextContents 相同的类型,并总是为给定类型标识这些函数的同样子字符串:
TextCases 是 TextPosition 的广义性质:
文本
Wolfram Research (2015),TextPosition,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextPosition.html (更新于 2019 年).
CMS
Wolfram 语言. 2015. "TextPosition." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2019. https://reference.wolfram.com/language/ref/TextPosition.html.
APA
Wolfram 语言. (2015). TextPosition. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/TextPosition.html 年