CreateSemanticSearchIndex
CreateSemanticSearchIndex[source]
source 内のデータから検索索引を作成する.
CreateSemanticSearchIndex[{source1,…}]
ソース sourceiの集合から検索索引を作成する.
CreateSemanticSearchIndex[{source1val1,…}]
ソース sourceiを値 valiに関連付ける.
CreateSemanticSearchIndex[data,"name"]
検索索引に指定された名前を与える.
詳細とオプション



- CreateSemanticSearchIndexは,内容の意味的検索に使える特徴をテキストから抽出するために使われる.
- 次は,source の可能な値である.
-
"string" プレーンな文字列 File["path"] 個々のファイル URL["url"] "url"のテキスト表現 CloudObject[…] クラウドオブジェクト LocalObject[…] ローカルオブジェクト ContentObject[…] コンテンツオブジェクト {source1,source2,…} ソースのリスト - ソースには注釈が付けられる.同じソースからのものには同じ注釈が付けられる.
- 次は,注釈を指定する可能な方法である.
-
{source1val1,…} ソースと関連付けられた値のリスト {source1,…}{val1,…} ソースと値の間の規則 - 次は,許容される valiの形式である.
-
"string" 文字列ラベル <"tag1"v1,… > タグとメタデータ値の連想 - CreateSemanticSearchIndexは,以下のオプションをサポートする.
-
DistanceFunction EuclideanDistance 使用する距離関数 FeatureExtractor "SentenceBERT" テキストの断片から特徴をどのように抽出するか GeneratedAssetLocation $GeneratedAssetLocation 索引の場所 Method Automatic メソッドの詳細 OverwriteTarget Automatic 既存の場所に上書きするかどうか ProgressReporting $ProgressReporting 計算の進捗状況を報告するかどうか WorkingPrecision "Real32" 浮動小数点演算の精度 - DistanceFunctionの可能な値には,EuclideanDistance,SquaredEuclideanDistance,CosineDistance,JaccardDissimilarity,HammingDistanceがある.
- 次は,FeatureExtractorの可能な値である.
-
"SentenceBERT" SentenceBERTに基づくローカルモデル LLMConfiguration LLMに基づく文の埋込み f カスタムの抽出関数 - カスタムの抽出器 f は,文字列のリストに作用して同じ長さのベクトルのリストを生成しなければならない.
- より細かいオプションは,Method<opt1val1 >を使って与えることができる.次は,optiの可能な値である.
-
"ContextPadding" 断片間の最小のオーバーラップ "MaximumItemLength" テキストの断片の最大の長さ "MinimumItemLength" テキストの断片の最小の長さ "SplitPattern" Automatic 長い文字列をどこで分割するか - 自動"SplitPattern"は,ラグラフ,改行,単語内のソーステキストを分割して,"MinimumItemLength"から"MaximumItemLength"までの長さの断片を作成しようとする.
- 次は,WorkingPrecisionの可能な設定である.
-
"Integer8" -128から127までの符号付き8ビット整数 "Real32" 単精度実数(32ビット) "Real64" 倍精度実数(64ビット)
例題
すべて開くすべて閉じる例 (2)
スコープ (6)
注釈 (2)
別のAssociationで注釈をん指定する:
オプション (10)
DistanceFunction (1)
デフォルトで,EuclideanDistanceが使われる:
GeneratedAssetLocation (3)
Method (2)
OverwriteTarget (2)
デフォルトのOverwriteTargetAutomaticでは,衝突を避けるために新たな索引名が生成される:
強制的に上書きしたければOverwriteTargetTrueを使うとよい:
OverwriteTargetFalseを使って厳密にチェックする:

OverwriteTargetFalseは,同じ索引名を別の場所で再度使用することも防ぐ:


OverwriteTargetTrueを使って既存のファイルを上書きする:
アプリケーション (2)
テキスト
Wolfram Research (2024), CreateSemanticSearchIndex, Wolfram言語関数, https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html (2025年に更新).
CMS
Wolfram Language. 2024. "CreateSemanticSearchIndex." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2025. https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html.
APA
Wolfram Language. (2024). CreateSemanticSearchIndex. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html