TextSummarize

该功能需要外部账户 »

TextSummarize[text]

生成 text 的摘要.

TextSummarize[text, spec]

根据规定 spec 对文本进行总结.

TextSummarize[texttopic,spec]

对与 topic 相关的部分 text 进行总结.

更多信息和选项

  • TextSummarize 用于压缩文本信息.
  • TextSummarize 要求外部服务认证、计费和互联网连接.
  • 长字符串首先被分割成更小的块,独立进行总结(也称为映射),然后组合在一起(又称为缩减).
  • text 可取的值为:
  • "string"纯字符串
    File["path"]单个文件
    URL["url"]"url" 的文本表示
    CloudObject[]云对象
    LocalObject[]本地对象
    SemanticSearchIndex[]语义索引文本
    {obj1,obj2,}对象列表
  • topic 指定是自由格式的字符串. 可用来选择特定部分的 text.
  • 根据 SemanticSearchIndex[] 生成摘要需要 topic 指定.
  • spec 可取的值为:
  • "BulletPoints"以简洁、要点形式给出的 text 的摘要
    {"BulletPoints",n}n 个点形式给出的 text 的摘要
    "Description"以压缩形式转述的 text(默认)
    "Extracts"text 中的关键句子
    "Keywords"text 中的关键词,按重要性排序
    "KeywordSummary"text 中的关键词,按出现的顺序给出
    "OneLineSummary"极度压缩的摘要
    "Rewrite"text 的简短版本,风格保持一致
    "Title"text 可能的标题
    "Topics"text 的主题
  • 此外,可用以下方式自行指定 spec 的值:
  • prompt自定义规范说明
    {promptmap,promptreduce}mapreduce 部分的提示分开
  • prompti 支持以下值:
  • LLMPrompt["name"]存储库中的提示
    StringTemplate[]模板化文本
    TemplateObject[]创建文本的模板
  • TextSummarize 支持以下选项:
  • InsertionFunctionAutomatic在插入表达式之前应用的函数或格式
    CombinerFunctionStringJoin用于在 prompt 中组合片段的函数
    AuthenticationAutomatic明确的用户 ID 和 API 密钥
    LLMEvaluator$LLMEvaluator使用的 LLM 配置
    Method Automatic方法的详细信息
  • 对于单个字符块,默认的 InsertionFunctionTextString,对于一组字符块,则为 StringRiffle[#, "\n\n"]&.
  • 可用 Method<|opt1val1|> 给出详细选项. opti 可取的值为:
  • "ContextWindow"文字块的最大长度
    "ContextPadding"块之间的最小重叠
    "SplitPattern"Automatic在何处划分长字符串
  • 自动的 "SplitPattern" 尝试按段落、换行符和单词来划分 text,以创建小于 "ContextWindow" 的字符块.
  • TextSummarize 使用机器学习. 它的方法、训练集和其中的偏差可能会发生变化,并在不同版本的 Wolfram 语言中产生不同的结果.

范例

打开所有单元关闭所有单元

基本范例  (2)

总结文件的内容:

找到描述一段文字的主要关键词:

范围  (14)

输入的类型  (5)

对字符串进行总结:

对文件进行总结:

对 URL 进行总结:

对一组对象进行总结:

根据语义索引给出摘要:

总结指定  (8)

给出文本内容的简洁描述:

以压缩形式重写文本:

为所提供的文本创建一个标题:

用一句话概括全文:

找到描述文本内容的主要关键词:

按照文本中出现的顺序查找主要关键词:

通过提取关键句子对指定文本进行总结:

用要点列表给出指定文本的摘要:

指定列表的长度:

主题指定  (1)

总结全文:

仅总结与主题相关的部分文本:

选项  (1)

Method  (1)

对于没有换行符的长字符串,将在空格处自动划分:

自定义划分模式来划分章节:

用新的文本块进行总结:

可能存在的问题  (1)

根据 SemanticSearchIndex 给出摘要只适用于指定主题的情况下:

Wolfram Research (2024),TextSummarize,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextSummarize.html (更新于 2024 年).

文本

Wolfram Research (2024),TextSummarize,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextSummarize.html (更新于 2024 年).

CMS

Wolfram 语言. 2024. "TextSummarize." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2024. https://reference.wolfram.com/language/ref/TextSummarize.html.

APA

Wolfram 语言. (2024). TextSummarize. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/TextSummarize.html 年

BibTeX

@misc{reference.wolfram_2024_textsummarize, author="Wolfram Research", title="{TextSummarize}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/TextSummarize.html}", note=[Accessed: 23-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_textsummarize, organization={Wolfram Research}, title={TextSummarize}, year={2024}, url={https://reference.wolfram.com/language/ref/TextSummarize.html}, note=[Accessed: 23-November-2024 ]}