ContentFieldOptions

CreateSearchIndexおよび関連関数のオプションで，インデックスを作成するコンテンツに対してさまざまなフィールドの扱いを指定するオプションを許可する．

詳細

ContentFieldOptions-><|"name₁"->opts₁,"name₂"->opts₂,…|>は，フィールド名 name_iのインデックスに連想 opts_iで与えられたオプションを使うように指定する．
各 opts_i連想で使用可能な項目

	"BulkRetrievalOptimized"	大量取り出しの最適化のためにフィールドにインデックスを付けるかどうか
	"CamelCaseMatching"	キャメルケースが複数の単語とマッチするかどうか
	"DeleteStopWords"	インデックス付けの前にストップワードを削除するかどうか
	"IgnoreCase"	インデックス付けとマッチングの際に大文字小文字の違いを無視するかどうか
	"Language"	フィールドに何語を想定するか
	"LengthWeighted"	より短いフィールドのマッチの方を多くカウントするかどうか
	"Searchable"	フィールドを検索可能にするかどうか
	"StemmingMethod"	インデックス付けとマッチングのために単語を語幹にするかどうか
	"Stored"	フィールドのリテラルなコンテンツをインデックスに保存するかどうか
	"Tokenized"	インデックスを付ける前にフィールドをトークン化するかどうか
	"Type"	フィールドの全体的なタイプ
	"Weight"	検索の際のフィールドの重み

よく使われるフィールドには，"Title"，"Text"，"String"，"Date"，"DateTime"，"Integer"，"Real"，"Boolean"がある．
フィールドタイプが異なるとデフォルトの重みも異なる．
"Title"や"Integer" 等のフィールドタイプはデフォルトで保存されるのに対し，"Text"等は保存されない．
"Title"および"Text"は，"String"あるいは"Date"とは異なり，トークン化されて，デフォルトでストップワードの削除が行われる．
デフォルトで，すべてのフィールドタイプが検索できる．
すべてのフィールドタイプがデフォルトで大量取り出しに最適化されているわけではない．
デフォルトで，長いフィールドのマッチは短いフィールドのマッチほど，最終のスコアにインパクトを与えない．すべてのフィールドタイプのデフォルトであるこの動作を無効にしたければ，"LengthWeighted"をFalseにするとよい．
"StemmingMethod"のデフォルト値は"Porter"である．代替値として"Kstem"やNoneがある．
タイプに加えて明示的なオプションが指定されると，明示的なオプションがそのタイプのデフォルトを無効にする．
All->opts を使って，デフォルトで全タイプに使われるオプション設定を示すことができる．

例題

例 (12)

"Field2"の言語をフランス語(French)に設定して例のインデックスを作る：

フランス語のストップワードである「le」や「la」は結果のマッチでは無視される：

検索結果で返されるように，テキストコンテンツを保存する：

フィールドタイプを"Field2"に設定すると，検索結果の順位を付ける際にこのフィールドにより重みが加えられ，この値がコンテンツオブジェクトとして返される：

大文字小文字の厳密な違いが重要なら，フィールドの"IgnoreCase"をFalseに設定するとよい：

大文字小文字の使い方が違うので，結果は求まらない：

望むのであれば，単語以外のコンテンツのために"CamelCaseMatching"を無効にすることができる：

"CamelCaseMatching"が有効なら次はマッチするだろう：

非単語コンテンツのために語幹にする操作を無効にすることができる：

これは，語幹にしてあればマッチするだろう：

フィールドの"Weight"を指定するとより高い順位の結果が返される：

"Keyword"フィールド内でマッチすると，そのスコアには重み（"Weight"）10がかけられる：

検索不可能なフィールドは検索することはできないが，保存されている場合は，結果のコンテンツオブジェクトから取り出すことができる：

特定のフィールドにおけるストップワードの削除を無効にする：

それらのフィールドではストップワードの「or」だけが求まる：

デフォルトで，より長いフィールド内のマッチはより短いフィールド内のマッチに比べて，最終スコアに対する影響が小さい：

この動作は"LengthWeighted"をFalseに設定して無効にすることができる：

"Tokenized"をFalseに設定して，フィールドの逐語的なマッチを要求する：

このフィールドは明示的にクエリされなければマッチされない：

このフィールドは逐語的にしかマッチされない：

フィールドがドキュメントの重み付けに使用されるときは，"BulkRetrievalOptimized"をTrueに設定するとパフォーマンスが向上する：

Top

その他のラーニングリソース

テクニカルサポート

Wolframソリューション

教育のためのWolframソリューション

使い始める

Grow Your Skills

Wolframと繋がる

大人用の教育プログラム

若者のための教育プログラム

読む

ContentFieldOptions

詳細

例題

例 (12)

テキスト

CMS

APA

BibTeX

BibLaTeX

ContentFieldOptions

詳細

例題

例 (12)

関連項目

履歴

テキスト

CMS

APA

BibTeX

BibLaTeX