テキストの操作
Wolfram言語には,テキストデータを処理するための非常に柔軟な機能があり,文字列や文字のレベルで,または単語・文のレベルで操作することができる.組込みの幅広い自然言語理解機能を通して,およびWolfram Prompt Repositoryを含めた大規模言語モデルを使う機能を通して,意味論的に操作することもできる.
テキストの取得
Import — ファイルやWebからテキストをインポートする
"Text","PDF","TeX","HTML" — テキスト,表,データ等を抽出する
NotebookImport — ノートブックからテキストをインポートする
FindList — 特定の文字列を含む記録をファイルから検索する
TextString — 任意の式をテキストに変換する
TextRecognize — OCRを使って画像中のテキストを抽出する
テキストの正規化 »
ToLowerCase ▪ ToUpperCase ▪ RemoveDiacritics ▪ CharacterEncoding ▪ ...
DeleteStopwords — 文字列から標準のストップワード(「the」,「and」等)を削除する
StringSplit — 文字列を改行文字やその他の区切り文字で分割する
StringReplace ▪ StringDelete ▪ StringTrim ▪ ...
テキストの構造操作
TextCases — 記号的に指定された要素を抽出する
TextSentences — 文のリストを抽出する
TextWords — 単語のリストを抽出する
SequenceAlignment — テキスト中の合致する列を探す
検索とパターンマッチング »
StringExpression — 一般的な文字列のパターン
StringMatchQ ▪ StringCases ▪ StringCount ▪ ...
大規模言語モデルベースのテキスト操作 »
LLMResourceFunction — Wolfram Prompt Repositoryからの操作を適用する
LLMFunction — 自然言語の記述によって指定された操作を適用する
LLMExampleFunction — 例題に基づく操作を適用する
LLMSynthesize ▪ LLMPrompt ▪ LLMTool ▪ ...
テキスト解析 »
WordCounts — 単語と 文字の文字列の発生回数を数える
LetterCounts ▪ CharacterCounts ▪ WordCount
Classify — 訓練データまたは組込み分類子を使って文字列を分類する
自然言語処理
LanguageIdentify — テキストの言語を判定する
DictionaryLookup — 英語やその他の辞書から単語を探す
WordData — 単語の意味的,文法的,形態的等の特性を求める
TextStructure — テキストの文法構造を解釈する
TextContents — テキスト中の認識された要素のデータ集合を生成する
SpellingCorrectionList — 綴り間違いのある単語に対する綴りの提案のリスト
自然言語理解 »
Interpreter — さまざまなタイプの文字列の解釈を試みる
SemanticInterpretation ▪ SemanticImportString ▪ AmbiguityFunction ▪ ...
テキストの生成 »
StringTemplate ▪ StringRiffle ▪ TextString ▪ LLMSynthesize ▪ ...