TextSearch
TextSearch[source,form]
搜索含有与 form 相匹配的文本、且由 source 指代的文件.
TextSearch[source,form,"prop"]
返回各个结果的 prop 属性.
更多信息和选项
- TextSearch 支持下面所列的基本搜索形式,同时,可以将它们任意组合使用:
-
"string" 文本字符串 {s1,s2,…} 所有 si 必须出现在文档中 s1s2… 至少必须出现一个 si "field"s1 si 必须出现在给定字段中 FixedOrder[s1,s2,…] si 必须以给定顺序出现 Except[q] q 不能出现在文档中 SearchAdjustment[q,…] q 要出现,并为其分配一定的权重等 Between[…],LessThan[…],… 有位于特定范围内的数字等出现 SearchQueryString["query"] 完整的搜索引擎式查询 All 返回所有索引的文档 - TextSearch 也支持其他形式 ContainsAll[…]、ContainsAny[…] 和 ContainsNone[…],以及 And[…]、Or[…] 和 Not[…].
- TextSearch 允许将下面内容作为源使用:
-
"path" 或 File["path"] 单个文件或文件目录 "name" SearchIndexObject["name"] SearchIndexObject[…] 由 CreateSearchIndex 产生的搜索索引 {obj1,obj2,…} 对象列表 - TextSearch[source,form] 返回一个 SearchResultObject[…] 表达式.
- prop 属性可以是 ContentObject 的任何属性,其中 TextSearch[source,form,prop] 等于 SearchResultObject[…][All,prop].
- TextSearch[source,form,prop] 还支持以下的额外属性:
-
"Count" 搜索结果的总数 "ContentObject" 搜索结果作为列表中的内容对象 "Association" 在关联中搜索结果 - 属性 "Score" 定义搜索结果的默认排序.
- 可能的选项包括:
-
ContentFieldOptions < > 字段的权选项 DocumentWeightingRules None 基于某字段值的文档 MaxItems All 返回的项数 - 扩展名为典型的二进制文件的,或者包含非文本字节值的文件将不被索引或搜索.
- TextSearch 支持很多可以导入为纯文本的文件格式. 其中包括:"TXT"、"CSV"、"JSON"、"XML"、"PDF"、"NB"、"EPS".
- TextSearch 不支持大部分图像、音频或没有文本元素的其他文件格式.
- TextSearch 读取由 Import[file, "Plaintext"] 给出的文件的 "Plaintext" 元素.
范例
打开所有单元关闭所有单元基本范例 (3)
使用高级查询语法搜索文件中含有的 "man",但不是 "animal",并显示上下文片段:
TextSearch 也可以查询目录,而无需加索引:
选项 (3)
可能存在的问题 (2)
只有字段权重可以在搜索时指定,其他内容字段选项必须在索引创建时指定:
以下搜索返回一个结果是因为,默认情况下,"IgnoreCase" 是 True,"IgnoreCase" 不能在搜索时指定:
Wolfram Research (2015),TextSearch,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextSearch.html (更新于 2017 年).
文本
Wolfram Research (2015),TextSearch,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextSearch.html (更新于 2017 年).
CMS
Wolfram 语言. 2015. "TextSearch." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2017. https://reference.wolfram.com/language/ref/TextSearch.html.
APA
Wolfram 语言. (2015). TextSearch. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/TextSearch.html 年