TextContents

文本内容类型列表 »

TextContents[text]

给出在 text 中找到的有关实体、日期、数量及其他与内容相关的元素的信息数据集.

TextContents[text,form]

搜索与类型 form 相符的内容.

TextContents[text,{form1,form2,}]

搜索与类型 form1form2 相符的内容.

TextContents[text,forms,props]

包括生成的数据集中每个对象的属性 props.

更多信息和选项

  • TextContents[text,] 中,text 可以是字符串、由 File[] 表示的纯文本文件、ContentObject 表达式或这些文本对象组成的列表.
  • TextContents[{text1,text2,},] 给出每个 texti 的信息数据集.
  • 类型 form 可以是:
  • "type"任意文本内容类型("Noun""City"
    Entity[,]文本内容类型的特定实体
    form1|form2|
  • formi
  • 的任意一种相匹配的形式
    Containing[outer,inner]含有 inner 类型的 outer 类型
    Verbatim["string"]要完全匹配的特定字符串
    pattern要匹配的字符串模式
    Automatic实体、日期、量和其他与内容相关的元素
  • 属性 prop 的可能的选项包括:
  • "String"识别出的文字内容的字符串(默认)
    "Position"字符串在 text 中开始和结束的位置
    "Probability"估计的识别为正确的概率
    "Type"内容类型(实体类型、
    "Interpretation"识别出的字符串的标准解释
    "Snippet"已识别字符串周围的片段
    "HighlightedSnippet"文字片段,其中突出显示识别出的字符串
    All上面列出的所有属性
    {prop1,prop2,}属性指定列表
  • 可以给出以下选项:
  • AcceptanceThreshold Automatic接受识别的最小概率
    TargetDevice"CPU"识别实体时是否使用 CPU 或 GPU 进行计算
    VerifyInterpretation False是否应该核实可解释性

范例

打开所有单元关闭所有单元

基本范例  (1)

找出文本中的实体:

只找出位置:

只找出位置和量:

给出所有结果的解释:

给出实体的指定属性:

选项  (2)

AcceptanceThreshold  (1)

默认情况下,所有检测出的实体的估计概率均高于 0.5:

通过设置较高的 AcceptanceThreshold,只获取极有可能正确的实体:

VerifyInterpretation  (1)

默认情况下,无法解释某些实体,要么因为它们不正确,要么因为它们尚未存在于知识库中:

VerifyInterpretation 滤除无法解释的实体:

属性和关系  (1)

TextContents 处理与 TextPositionTextCases 相同的类型,并总是为给定类型标识这些函数的同样子字符串:

类似于 TextContents 输出的数据机可以使用 TextCases 获得:

巧妙范例  (1)

加载维基百科页面关于 Moon(月球)的文本:

提取页面中值得注意的文本内容:

可视化在页面找到内容类型的频率:

查找页面上确定的潜在知名人士:

将这些人诠释为实体:

可视化这些人的职位:

Wolfram Research (2019),TextContents,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextContents.html.

文本

Wolfram Research (2019),TextContents,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextContents.html.

CMS

Wolfram 语言. 2019. "TextContents." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/TextContents.html.

APA

Wolfram 语言. (2019). TextContents. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/TextContents.html 年

BibTeX

@misc{reference.wolfram_2024_textcontents, author="Wolfram Research", title="{TextContents}", year="2019", howpublished="\url{https://reference.wolfram.com/language/ref/TextContents.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_textcontents, organization={Wolfram Research}, title={TextContents}, year={2019}, url={https://reference.wolfram.com/language/ref/TextContents.html}, note=[Accessed: 21-November-2024 ]}