テキストの操作

Wolfram言語には,テキストデータを処理するための非常に柔軟な機能があり,文字列や文字のレベルで,または単語・文のレベルで操作することができる.組込みの幅広い自然言語理解機能を通して,およびWolfram Prompt Repositoryを含めた大規模言語モデルを使う機能を通して,意味論的に操作することもできる.

テキストの取得

Import ファイルやWebからテキストをインポートする

"Text""PDF""TeX""HTML" テキスト,表,データ等を抽出する

NotebookImport ノートブックからテキストをインポートする

FindList 特定の文字列を含む記録をファイルから検索する

TextString 任意の式をテキストに変換する

TextRecognize OCRを使って画像中のテキストを抽出する

テキストの正規化 »

ToLowerCase  ▪  ToUpperCase  ▪  RemoveDiacritics  ▪  CharacterEncoding  ▪  ...

DeleteStopwords 文字列から標準のストップワード(「the」,「and」等)を削除する

StringSplit 文字列を改行文字やその他の区切り文字で分割する

StringReplace  ▪  StringDelete  ▪  StringTrim  ▪  ...

テキストの構造操作

TextCases 記号的に指定された要素を抽出する

TextSentences 文のリストを抽出する

TextWords 単語のリストを抽出する

SequenceAlignment テキスト中の合致する列を探す

検索とパターンマッチング »

StringExpression 一般的な文字列のパターン

StringMatchQ  ▪  StringCases  ▪  StringCount  ▪  ...

大規模言語モデルベースのテキスト操作 »

LLMResourceFunction Wolfram Prompt Repositoryからの操作を適用する

LLMFunction 自然言語の記述によって指定された操作を適用する

LLMExampleFunction 例題に基づく操作を適用する

LLMSynthesize  ▪  LLMPrompt  ▪  LLMTool  ▪  ...

テキスト解析 »

WordCounts 単語と 文字の文字列の発生回数を数える

LetterCounts  ▪  CharacterCounts  ▪  WordCount

Classify 訓練データまたは組込み分類子を使って文字列を分類する

自然言語処理

LanguageIdentify テキストの言語を判定する

DictionaryLookup 英語やその他の辞書から単語を探す

WordData 単語の意味的,文法的,形態的等の特性を求める

TextStructure テキストの文法構造を解釈する

TextContents テキスト中の認識された要素のデータ集合を生成する

SpellingCorrectionList 綴り間違いのある単語に対する綴りの提案のリスト

自然言語理解 »

Interpreter さまざまなタイプの文字列の解釈を試みる

SemanticInterpretation  ▪  SemanticImportString  ▪  AmbiguityFunction  ▪  ...

テキストの生成 »

StringTemplate  ▪  StringRiffle  ▪  TextString  ▪  LLMSynthesize  ▪  ...