CreateSearchIndexおよび関連関数のオプションで,インデックスを作成するコンテンツに対してさまざまなフィールドの扱いを指定するオプションを許可する.
ContentFieldOptions
CreateSearchIndexおよび関連関数のオプションで,インデックスを作成するコンテンツに対してさまざまなフィールドの扱いを指定するオプションを許可する.
詳細
- ContentFieldOptions-><|"name1"->opts1,"name2"->opts2,…|>は,フィールド名 nameiのインデックスに連想 optsiで与えられたオプションを使うように指定する.
- 各 optsi連想で使用可能な項目
-
"BulkRetrievalOptimized" 大量取り出しの最適化のためにフィールドにインデックスを付けるかどうか "CamelCaseMatching" キャメルケースが複数の単語とマッチするかどうか "DeleteStopWords" インデックス付けの前にストップワードを削除するかどうか "IgnoreCase" インデックス付けとマッチングの際に大文字小文字の違いを無視するかどうか "Language" フィールドに何語を想定するか "LengthWeighted" より短いフィールドのマッチの方を多くカウントするかどうか "Searchable" フィールドを検索可能にするかどうか "StemmingMethod" インデックス付けとマッチングのために単語を語幹にするかどうか "Stored" フィールドのリテラルなコンテンツをインデックスに保存するかどうか "Tokenized" インデックスを付ける前にフィールドをトークン化するかどうか "Type" フィールドの全体的なタイプ "Weight" 検索の際のフィールドの重み - よく使われるフィールドには,"Title","Text","String","Date","DateTime","Integer","Real","Boolean"がある.
- フィールドタイプが異なるとデフォルトの重みも異なる.
- "Title"や"Integer" 等のフィールドタイプはデフォルトで保存されるのに対し,"Text"等は保存されない.
- "Title"および"Text"は,"String"あるいは"Date"とは異なり,トークン化されて,デフォルトでストップワードの削除が行われる.
- デフォルトで,すべてのフィールドタイプが検索できる.
- すべてのフィールドタイプがデフォルトで大量取り出しに最適化されているわけではない.
- デフォルトで,長いフィールドのマッチは短いフィールドのマッチほど,最終のスコアにインパクトを与えない.すべてのフィールドタイプのデフォルトであるこの動作を無効にしたければ,"LengthWeighted"をFalseにするとよい.
- "StemmingMethod"のデフォルト値は"Porter"である.代替値として"Kstem"やNoneがある.
- タイプに加えて明示的なオプションが指定されると,明示的なオプションがそのタイプのデフォルトを無効にする.
- All->opts を使って,デフォルトで全タイプに使われるオプション設定を示すことができる.
例題
例 (12)
"Field2"の言語をフランス語(French)に設定して例のインデックスを作る:
フランス語のストップワードである「le」や「la」は結果のマッチでは無視される:
フィールドタイプを"Field2"に設定すると,検索結果の順位を付ける際にこのフィールドにより重みが加えられ,この値がコンテンツオブジェクトとして返される:
大文字小文字の厳密な違いが重要なら,フィールドの"IgnoreCase"をFalseに設定するとよい:
望むのであれば,単語以外のコンテンツのために"CamelCaseMatching"を無効にすることができる:
"CamelCaseMatching"が有効なら次はマッチするだろう:
非単語コンテンツのために語幹にする操作を無効にすることができる:
フィールドの"Weight"を指定するとより高い順位の結果が返される:
"Keyword"フィールド内でマッチすると,そのスコアには重み("Weight")10がかけられる:
検索不可能なフィールドは検索することはできないが,保存されている場合は,結果のコンテンツオブジェクトから取り出すことができる:
それらのフィールドではストップワードの「or」だけが求まる:
デフォルトで,より長いフィールド内のマッチはより短いフィールド内のマッチに比べて,最終スコアに対する影響が小さい:
この動作は"LengthWeighted"をFalseに設定して無効にすることができる:
"Tokenized"をFalseに設定して,フィールドの逐語的なマッチを要求する:
フィールドがドキュメントの重み付けに使用されるときは,"BulkRetrievalOptimized"をTrueに設定するとパフォーマンスが向上する:
テキスト
Wolfram Research (2016), ContentFieldOptions, Wolfram言語関数, https://reference.wolfram.com/language/ref/ContentFieldOptions.html (2017年に更新).
CMS
Wolfram Language. 2016. "ContentFieldOptions." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2017. https://reference.wolfram.com/language/ref/ContentFieldOptions.html.
APA
Wolfram Language. (2016). ContentFieldOptions. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/ContentFieldOptions.html
BibTeX
@misc{reference.wolfram_2025_contentfieldoptions, author="Wolfram Research", title="{ContentFieldOptions}", year="2017", howpublished="\url{https://reference.wolfram.com/language/ref/ContentFieldOptions.html}", note=[Accessed: 01-May-2026]}
BibLaTeX
@online{reference.wolfram_2025_contentfieldoptions, organization={Wolfram Research}, title={ContentFieldOptions}, year={2017}, url={https://reference.wolfram.com/language/ref/ContentFieldOptions.html}, note=[Accessed: 01-May-2026]}