テキストの操作

Wolfram言語には,テキストデータを処理するための非常に柔軟な機能があり,文字列や文字のレベルで,または単語・文のレベルで操作することができる.組込みの幅広い自然言語理解機能を通して意味論的に操作することもできる.

参照項目参照項目

テキストの取得

Import ファイルやWebからテキストをインポートする

"Text""PDF""TeX""HTML" テキスト,表,データなどを抽出する

NotebookImport ノートブックからテキストをインポートする

FindList 特定の文字列を含む記録をファイルから検索する

TextString 任意の式をテキストに変換する

TextRecognize OCRを使って画像中のテキストを抽出する

テキストの正規化 »

ToLowerCase  ▪  ToUpperCase  ▪  RemoveDiacritics  ▪  CharacterEncoding  ▪  ...

DeleteStopwords 文字列から標準のストップワード(「the」,「and」等)を削除する

StringSplit 文字列を改行文字やその他の区切り文字で分割する

StringReplace  ▪  StringDelete  ▪  StringTrim  ▪  ...

テキストの構造操作

TextSentences 文のリストを抽出する

TextWords 単語のリストを抽出する

SequenceAlignment テキスト中の合致する列を探す

検索とパターンマッチング »

StringExpression 一般的な文字列のパターン

StringMatchQ  ▪  StringCases  ▪  StringCount  ▪  ...

テキスト解析 »

WordCounts 単語と 文字の文字列の発生回数を数える

LetterCounts  ▪  CharacterCounts  ▪  WordCount

Classify 訓練データまたは組込み分類子を使って文字列を分類する

自然言語処理

LanguageIdentify テキストの言語を判定する

DictionaryLookup 英語やその他の辞書から単語を探

WordData 単語の意味的,文法的,形態的等の特性を求める

自然言語理解 »

Interpreter さまざまなタイプの文字列の解釈を試みる

SemanticInterpretation  ▪  SemanticImportString  ▪  AmbiguityFunction  ▪  ...

テキストの生成 »

StringTemplate  ▪  StringRiffle  ▪  TextString  ▪  Pluralize  ▪  ...