テキスト解析

Wolfram言語には，テキストを構造的に，または意味的に解析し，可視化するためのさらに高度になったツールが含まれている

テキストのソース

Import ▪ ExampleData ▪ WikipediaData

WordCount — テキスト中の全単語数

WordCounts — 単語または -gramの数

WordFrequency — 単語または -gramの出現頻度

LetterCounts ▪ CharacterCounts

Sort — アルファベット（字母）順にソートする

KeySort ▪ TakeLargest

Classify — 訓練データまたは組込み分類子を使って文字列を分類する

Nearest — リストから最もよく合致する文字列を探す

FindClusters — 文字列データからクラスタを求める

ClusteringTree ▪ ClusteringComponents ▪ ClusterClassify

Dendrogram — 類似性の階層的プロット

EditDistance — 編集距離（レーベンシュタイン(Levenshtein)距離）

LanguageIdentify — テキストの言語を判定する

DictionaryLookup ▪ WordData ▪ WordStem ▪ PartOfSpeech ▪ Transliterate

WordFrequencyData — 典型的な現在および過去のテキストにおける単語の出現頻度についてのデータ

SemanticImport — テキストの意味を理解してインポートする

大規模言語モデルベースの解析 »

LLMFunction — 自然言語によって指定された大規模言語モデルベースの操作をテキストに適用する

LLMResourceFunction — Wolfram Prompt Repositoryから大規模言語モデルベースの操作を適用する

LLMExampleFunction ▪ LLMPrompt ▪ LLMSynthesize ▪ LLMTool

テキストの可視化

Style — テキストの色，フォント，サイズのスタイルを指定する

WordCloud — 単語の出現頻度や重みからワードクラウドを生成する

Snippet — テキストの断片を抽出する

StringPartition — 文字列を等しい大きさのブロックに区切る

InsertLinebreaks — 文字列を複数の行に分割する

テキストの解釈

TextStructure — テキストの文法構造を解釈する

テキストの比較 »

SequenceAlignment ▪ Diff ▪ Diff3 ▪ LongestCommonSubsequence ▪ DistanceMatrix ▪ ...

内容分析

TextContents — テキスト中の認識された要素のデータ集合を生成する

内容の抽出

TextCases — 記号的に指定した要素を抽出する

Containing ▪ Alternatives ▪ Entity

TextPosition — 記号的に指定された要素の位置

FindTextualAnswer — テキストからの質問の解を求めようと試みる

テキストの正規化 »

TextWords ▪ TextSentences ▪ DeleteStopwords ▪ RemoveDiacritics ▪ ...

トップへ

その他のラーニングリソース

テクニカルサポート

大人用の教育プログラム

若者のための教育プログラム

イベント

Wolframイニシアチブ

教育リソース

趣味とプロジェクト

Wolframソリューション

教育のためのWolframソリューション

使い始める

Grow Your Skills

Wolframと繋がる

読む

大人用の教育プログラム

若者のための教育プログラム

イベント

テキスト解析

テキストのソース

大規模言語モデルベースの解析 »

テキストの可視化

テキストの解釈

テキストの比較 »

内容分析

内容の抽出

テキストの正規化 »

テキスト解析

テキストのソース

大規模言語モデルベースの解析 »

テキストの可視化

テキストの解釈

テキストの比較 »

内容分析

内容の抽出

テキストの正規化 »

関連するワークフローガイド

関連するガイド