CreateSemanticSearchIndex

この機能には次が必要です:外部アカウント »

CreateSemanticSearchIndex[source]

source 内のデータから検索索引を作成する.

CreateSemanticSearchIndex[source,"name"]

検索索引に指定された名前を与える.

詳細とオプション

  • CreateSemanticSearchIndexは,内容の意味的検索に使える特徴をテキストから抽出するために使われる.
  • 次は,source の可能な値である.
  • "string"プレーンな文字列
    File["path"]個々のファイル
    URL["url"]"url"のテキスト表現
    CloudObject[]クラウドオブジェクト
    LocalObject[]ローカルオブジェクト
    {obj1,obj2,}オブジェクトのリスト
  • ソースはタグ付けできる.以下は,その可能な値である.
  • {obj1val1,}ベクトルと関連付けられた値のリスト
    {obj1,}{val1,}ベクトルと値の間の規則
  • 次は,許容される valiの形式である.
  • "string"文字列ラベル
    <|"tag1"v1,|>タグとメタデータ値の連想
  • CreateSemanticSearchIndexは,以下のオプションをサポートする.
  • DistanceFunctionEuclideanDistance使用する距離関数
    FeatureExtractor "SentenceBERT"テキストの断片から特徴をどのように抽出するか
    GeneratedAssetLocation $GeneratedAssetLocation索引の場所
    MethodAutomaticメソッドの詳細
    OverwriteTargetAutomatic既存の場所に上書きするかどうか
    ProgressReporting$ProgressReporting計算の進捗状況を報告するかどうか
    WorkingPrecision"Real32"浮動小数点演算の精度
  • DistanceFunctionの可能な値には,EuclideanDistanceSquaredEuclideanDistanceCosineDistanceJaccardDissimilarityHammingDistanceがある.
  • 次は,FeatureExtractorの可能な値である.
  • "SentenceBERT"SentenceBERTに基づくローカルモデル
    fカスタムの抽出関数
  • カスタムの抽出器 f は,文字列のリストに作用して同じ長さのベクトルのリストを生成しなければならない.
  • より細かいオプションは,Method<|opt1val1|>を使って与えることができる.次は,optiの可能な値である.
  • "ContextPadding"項目間の最小のオーバーラップ
    "MaximumItemLength"テキストの断片の最大の長さ
    "MinimumItemLength"テキストの断片の最小の長さ
    "SplitPattern"Automatic長い文字列をどこで分割するか
  • 自動"SplitPattern"は,text をパラグラフ,改行,単語で分割して,"MinimumItemLength"から"MaximumItemLength"までの長さのチャンクを作成しようとする.
  • 次は,WorkingPrecisionの可能な設定である.
  • "Integer8"から127までの符号付き8ビット整数
    "Real32"単精度実数(32ビット)
    "Real64"倍精度実数(64ビット)

例題

すべて開くすべて閉じる

  (1)

新たなSemanticSearchIndexを作成する:

意味的類似性でテキストの検索を行う:

スコープ  (3)

文字列から索引を作成する:

ファイルから索引を作成する:

URLから索引を作成する:

オプション  (4)

FeatureExtractor  (1)

カスタムの特徴抽出器を訓練する:

これを使って別のテキストから特徴を抽出する:

GeneratedAssetLocation  (3)

データベースを格納するカスタムの場所を指定する:

場所を取り出す:

デフォルトで,データベースはローカルオブジェクトに格納される:

ベクトルデータベースをファイルに格納する:

場所を取り出す:

ファイル参照からデータベースを再構築する:

アプリケーション  (1)

単語とその定義の間の逆マッピングを作成する:

マッピングを使って索引を構築する:

クエリと定義をマッチングすることで辞書の逆検索を行う:

Wolfram Research (2024), CreateSemanticSearchIndex, Wolfram言語関数, https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html.

テキスト

Wolfram Research (2024), CreateSemanticSearchIndex, Wolfram言語関数, https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html.

CMS

Wolfram Language. 2024. "CreateSemanticSearchIndex." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html.

APA

Wolfram Language. (2024). CreateSemanticSearchIndex. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html

BibTeX

@misc{reference.wolfram_2024_createsemanticsearchindex, author="Wolfram Research", title="{CreateSemanticSearchIndex}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_createsemanticsearchindex, organization={Wolfram Research}, title={CreateSemanticSearchIndex}, year={2024}, url={https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html}, note=[Accessed: 21-November-2024 ]}