DOCUMENTATION CENTER SEARCH
Mathematica
>
データの操作とデータソース
>
テキストデータの処理
Mathematica
には,膨大な量のテキストデータを処理するための非常に柔軟な機能がある.多くの場合,文字列として表されているデータは,
Mathematica
のパワフルな言語コンストラクトで操作できるリストや他のコンストラクトに変換される.
Import
—
ファイルやWebからデータをインポートする
"Text"
,
"PDF"
,
"TeX"
,
"HTML"
—
テキスト,表,データなどを抽出する
FindList
—
特定の文字列を含む記録をファイルから検索する
StringSplit
—
文字列を単語,文等に分割する
StringCount
—
単語等の発生回数を数える
StringCases
—
文字列パターンの例を探す
StringExpression
—
記号的文字列パターンに合致させる
Sort
—
アルファベット順にソートする
Nearest
—
リストから最も近い文字列を見付ける
FindClusters
—
文字列データからクラスタを探す
EditDistance
—
編集距離またはレーベンシュタイン(Levenshtein)距離
Hash
—
さまざまな方法を使ってハッシュコードを求める
DictionaryLookup
—
英語辞書から単語を探す
WordData
—
意味,文法,形態等の属性を調べる
チュートリアル
ファイルの検索
文字列の操作
文字列パターン
文字列パターンの操作
その他
文字列操作
式と文字列の間の変換
低レベルノートブックプログラミング
© 2008 Wolfram Research, Inc.