ContentFieldOptions

是 CreateSearchIndex 及相关函数的一个选项，允许指定用于处理被索引内容中不同字段的选项.

更多信息

ContentFieldOptions-><|"name₁"->opts₁,"name₂"->opts₂,…|> 指定名为 name_i 的字段应使用在关联 opts_i 中给定的选项建立索引.
每个opts_i 关联的可能的值为：

	"BulkRetrievalOptimized"	是否为字段加上索引以优化批量检索
	"CamelCaseMatching"	是否使用驼峰式来匹配多单词形式
	"DeleteStopWords"	加上索引前是否删掉停用词
	"IgnoreCase"	索引和匹配时是否忽略大小写
	"Language"	设想的字段的语种
	"LengthWeighted"	是否较短字段的匹配更占优
	"Searchable"	字段是否是可检索的
	"StemmingMethod"	是否提取单词的词干以用于索引和匹配
	"Stored"	是否将字段的文字内容存储在索引中
	"Tokenized"	索引前是否应把字段 tokenize
	"Type"	字段的整体类型
	"Weight"	搜索时字段的权重

字段的常见类型包括："Title"、"Text"、"String"、"Date"、"DateTime"、"Integer"、"Real"、"Boolean".
不同的字段类型被赋予不同的默认权重.
缺省情况下，如 "Title" 和 "Integer" 这样的字段类型被保存起来，而如 "Text" 这样的字段类型则不被保存.
与 "String" 或 "Date" 不同，缺省情况下，将 "Title" 和 "Text" 词条化，并清除其中的停用词.
缺省情况下，所有字段类型都是可检索的.
缺省情况下，没有对任何字段类型进行批量检索优化.
缺省情况下，和较短字段的匹配相比，较长字段的匹配对最终分数的影响要小. 要禁用此行为（所有字段类型的默认情况），可将 "LengthWeighted" 设为 False.
"StemmingMethod" 的默认值为 "Porter". 其他替代值包括 "Kstem" 和 None.
如果为某个类型明确指定了选项，则该显式选项覆盖缺省的选项.
缺省情况下，All->opts 可用来表示所有类型都使用选项设置.

范例

基本范例 (12)

创建样本索引，把 "Field2" 的语言设为法语：

忽略法语停用词 "le" 和 "la"，找到一个匹配的实例：

把文字内容存储起来，以便将其放在内容对象列表中返回：

设置 "Field2" 的字段类型，使它在搜索结果排序时权重更大，同时在内容对象中返回它的值：

如果大小写的匹配很重要，可以把字段的 "IgnoreCase" 设为 False：

由于大小写不匹配，没有结果可以返回：

对于非文字内容，需要时可将 "CamelCaseMatching" 设为无效：

如果启用 "CamelCaseMatching"，此处就会找到匹配的结果：

对于非文字内容，可以禁用提取单词的词干：

如果启用 stemming，此处就会找到匹配的结果：

为了在结果中有更高的排名，可以指定字段的 "Weight"：

当匹配出现在 "Keyword" 字段中，分数会被乘以 "Weight" 10：

不能对不可检索的字段进行搜索，但如果有保存的话，可以从所得的内容对象中获取：

对某些字段禁止删除停用词：

只在下列字段中找到停用词 "or"：

缺省情况下，和较短字段的匹配相比，较长字段的匹配对最终分数的影响要小：

可以通过将 "LengthWeighted" 设为 False 来禁用该行为：

将 "Tokenized" 设为 False 以要求对字段进行逐字匹配：

要对字段进行显式查询，否则无法匹配：

只能对字段进行逐字匹配：

当字段被用作对文档进行加权时，设置 "BulkRetrievalOptimized" 为 True 可以提高性能：

顶部

更多学习资源

技术支持

成人教育计划

青少年教育计划

活动

Wolfram 倡议

教育资源

爱好与项目

Wolfram 解决方案

Wolfram 的教育解决方案

开始

提高你的技能

与我们合作

欢迎阅读

成人教育计划

青少年教育计划

活动

ContentFieldOptions

更多信息

范例

基本范例 (12)

文本

CMS

APA

BibTeX

BibLaTeX

ContentFieldOptions

更多信息

范例

基本范例 (12)

参见

历史

文本

CMS

APA

BibTeX

BibLaTeX