Text (.txt)

  • ImportExportは種々の西ヨーロッパ文字コードとUnicode標準をサポートする.
  • UTF (Unicode Transformation Format)およびUCS (Universal Character Set)マッピング法がサポートされる.
  • Wolfram言語は西ヨーロッパやアジアのスクリプト文字,数学記号,その他の特殊文字を含む.幅広い文字セットを表示することができる.

予備知識予備知識

    テキストファイル.
    テキスト情報の保管と交換に使われる一般的な形式.
    テキストを文字の列と行区切り記号の列として表す.
    文字をASCII,8ビット西ヨーロッパ文字コード,あるいはUnicodeとして保管する.

ImportとExportImportとExport

  • Import["file.txt"]はテキストファイルを文字列としてインポートする.
  • Export["file.txt",expr]は式をテキストファイルとしてエキスポートする.
  • Import["file.txt"]は文字列を返す.
  • Export["file.txt",expr]exprOutputForm表現からテキストファイルを作成する.
  • Import["file.txt",elem]はテキストファイルから指定された要素をインポートする.
  • Import["file.txt",{elem,suba,subb,}]は子要素をインポートする.
  • Import["file.txt",{{elem1,elem2,}}]は複数の要素をインポートする.
  • インポート形式はImport["file","Text"]またはImport["file",{"Text",elem,}]で指定できる.
  • Export["file.txt",expr,elem]expr が要素 elem を指定してるとしてテキストファイルを作成する.
  • Export["file.txt",{expr1,expr2,},{{elem1,elem2,}}]は各 が対応する を指定しているとして扱う.
  • Export["file.txt",expr,opt1->val1,]は指定の値を持つ指定のオプション要素で expr をエキスポートする.
  • Export["file.txt",{elem1->expr1,elem2->expr2,},"Rules"]は規則を使ってエキスポートする要素を指定する.
  • ImportExportについての一般的な情報は,関数ページを参照のこと.
  • ImportStringExportStringはテキスト形式をサポートする.

ノートブックインターフェースノートブックインターフェース

  • 選択範囲の形式保存はノートブックの選択した部分をテキストファイルにエキスポートする.

要素要素

  • 一般的なImport要素:
  • "Elements" ファイル中の有効な要素とオプションのリスト
    "Rules"要素とオプションのそれぞれの規則のリスト
    "Options"オプション,属性,設定の規則のリスト
  • データ表現要素:
  • "Data"表で表されたテキスト
    "Lines"文字列のリストとして与えられた行
    "Plaintext"単一のWolfram言語の文字列として表されたテキストファイル
    "String"生のバイト文字列
    "Words"文字列のリストとして与えられた,空白で区切られた単語
  • ImportExportはデフォルトで要素を使用する.
  • Import["file.txt"]はデフォルトで文字コードをとしてテキストファイルを読み込む.
  • Import["file.txt","Data"]はテキストファイルをTSV,CSV,Tableとして読み込むことを試み,文字列と数の配列を返す.
  • Import["file",{"Text","String"}]またはImport["file.txt","String"]はバイトの生の列をインポートし,Wolfram言語の文字列として返す.
  • テキストファイルの部分要素の指定と選択:
  • "Lines",nファイルの n 行目
    "Words",nファイルの n 番目の単語
  • テキストファイルからインポートする際,Importは一般的に改行記号として使われる文字列をすべて自動的にに置き換える.
  • Wolfram言語は通常テキストの内部表現の改行文字に文字コード10 ()を使用する.
  • ExportはWolframシステムが実行されているコンピュータシステムに従った改行文字を使用する.

オプションオプション

  • ImportExportの一般的なオプション:
  • CharacterEncoding"UTF8"ファイルで使用される生の文字コード
  • CharacterEncodingに使用できる設定の例:
  • "AdobeStandard"Adobe標準PostScriptフォントエンコード
    "ASCII"制御文字を含む全ASCII
    "EUC"Japanese用の拡張Unixコード
    "ISOLatin1"ISO 88591標準
    "ISOLatin2"ISO 88592標準
    "ISOLatin3"ISO 88593標準
    "ISOLatin4"ISO 88594標準
    "ISOLatinCyrillic"ISO 88595標準
    "MacintoshRoman"Macintosh明朝体エンコード
    "PrintableASCII"表示可能なASCII
    "ShiftJIS"JIS X 02081990および拡張のShiftJISエンコード
    "Symbol"記号フォントエンコード
    "Unicode"生の2バイトUnicode値
    "UTF8"可変幅1バイトUnicode形式
    "WindowsANSI"Windows標準フォントエンコード
  • Wolfram言語は文字を内部的にUnicode値として保管する.
  • CharacterEncoding->"Unicode"という設定でテキストをインポート,エキスポートするとき,Wolfram言語は常にByteOrdering->1で与えられるバイト順を想定する.
  • 使用できる全エンコードのリストは$CharacterEncodingsで得られる.

例題例題すべて開くすべて閉じる

  (3)  (3)

テキストファイルをインポートし,最初の何文字かを返す:

In[1]:=
Click for copyable input
Out[1]=

ファイルの最初の行をインポートする:

In[2]:=
Click for copyable input
Out[2]=

3行をインポートする:

In[3]:=
Click for copyable input
Out[3]=

要素を使ってインポートする:

In[4]:=
Click for copyable input
Out[4]=

どのようなテキストファイルでもテキストとしてインポートすることができる:

In[1]:=
Click for copyable input
Out[1]=

任意の式をテキストにエキスポートする:

In[1]:=
Click for copyable input
Out[1]=
1999年に導入
(4.0)
| 2007年に修正
(6.0)