Text (.txt)

  • ImportExport 支持各种西文字符编码和 Unicode 标准.
  • 支持 Unicode 转换格式(UTF)与 通用字符集(UCS)映射方法.
  • Wolfram 语言可以显示广范围的字符集,包括西方和东方的脚本,数学符号以及其他特殊字符.

背景背景

    纯文本文件.
    存储和交换文本信息的通用格式.
    以字符序列和行分隔符表示文本.
    以 ASCII、8位西文字符码或 Unicode 存储字符

Import 与 ExportImport 与 Export

  • Import["file.txt"] 以字符串形式导入文本文件.
  • Export["file.txt",expr] 把任意表达式导出为一个文本文件.
  • Import["file.txt"] 返回一个字符串.
  • Export["file.txt",expr]exprOutputForm 表示中创建一个文本文件.
  • Import["file.txt",elem] 从一个文本文件中导入指定的参数.
  • Import["file.txt",{elem,suba,subb,}] 导入一个子参数.
  • Import["file.txt",{{elem1,elem2,}}] 导入多个参数.
  • 导入格式可以用 Import["file","Text"]Import["file",{"Text",elem,}] 明确指定.
  • Export["file.txt",expr,elem] 通过把 expr 作为指定参数 elem 创建一个文本文件.
  • Export["file.txt",{expr1,expr2,},{{elem1,elem2,}}] 把每一个 指定为相应的 .
  • Export["file.txt",expr,opt1->val1,] 导出具有指定值的指定选项参数的 expr.
  • Export["file.txt",{elem1->expr1,elem2->expr2,},"Rules"] 使用规则指定要导出的参数.
  • ImportExport 的完整信息请见参考页.
  • ImportStringExportString 支持文本格式.

笔记本界面笔记本界面

  • 选择另存为 把笔记本选择的部分导出为纯文本文件.

参数参数

  • Import 的通用参数:
  • "Elements"该文件可用的参数和选项列表
    "Rules"每个参数和选项的完整规则列表
    "Options"选项、属性和设置的规则列表
  • 表示数据的参数:
  • "Data"文本的表格表示
    "Lines"以字符串列表形式表示的行
    "Plaintext"表示为单个 Wolfram 语言字符串的文本文件
    "String"原始字节字符串
    "Words"由空格分隔的单词,以字符串列表形式表示
  • 默认情况下,ImportExport 使用参数.
  • Import["file.txt"] 读取一个文本文件,默认情况下,认为字符编码为.
  • Import["file.txt","Data"] 尝试以 TSV、CSV 或Table 形式读取任何文本文件,返回字符串和数字的数组.
  • Import["file",{"Text","String"}] or Import["file.txt","String"] 导入原始字节序列并以 Wolfram 语言的字符字符串形式返回.
  • 指定和选择文本文件的子参数:
  • "Lines",n文件中的第 n
    "Words",n文件中第 n 个单词
  • 当从文本文件中导入时,Import 自动把常用作行分隔符的任何字符序列取代为.
  • Wolfram 语言在内部的文本表示中一般用10 () 作为行分隔符.
  • Export 使用运行 Wolfram 系统的计算机系统的行分隔字符的常用规范.

选项选项

  • ImportExport 的常用选项:
  • CharacterEncoding"UTF8"文件中使用的原始字符编码
  • CharacterEncoding 的可能设置包括:
  • "AdobeStandard"Adobe 标准 PostScript 字体编码
    "ASCII"完整的 ASCII,带有控制字符
    "EUC"用于日文的扩展的 Unix 编码
    "ISOLatin1"ISO 88591 标准
    "ISOLatin2"ISO 88592 标准
    "ISOLatin3"ISO 88593 标准
    "ISOLatin4"ISO 88594 标准
    "ISOLatinCyrillic"ISO 88595 标准
    "MacintoshRoman"Macintosh 罗马字体编码
    "PrintableASCII"可打印的 ASCII
    "ShiftJIS"JIS X 02081990 以及扩展的 ShiftJIS 编码
    "Symbol"符号字体编码
    "Unicode"原始2字节 Unicode 值
    "UTF8"可变宽度的1字节格式
    "WindowsANSI"Windows 标准字体编码
  • Wolfram 语言内部存储字符为 Unicode 值.
  • 当导入或导出具有 CharacterEncoding->"Unicode" 设置的文本,Wolfram 语言总是假设字节顺序由 ByteOrdering->1 给定.
  • $CharacterEncodings 给出完整的可能编码列表.

范例范例打开所有单元关闭所有单元

基本范例  (3)基本范例  (3)

导入一个文本文件并返回前几个字符:

In[1]:=
Click for copyable input
Out[1]=

从文件中导入第一行:

In[2]:=
Click for copyable input
Out[2]=

导入三行:

In[3]:=
Click for copyable input
Out[3]=

使用参数导入该文件:

In[4]:=
Click for copyable input
Out[4]=

任何纯文本文件可以被导入为文本:

In[1]:=
Click for copyable input
Out[1]=

把一个任意表达式导出为文本:

In[1]:=
Click for copyable input
Out[1]=
1999年引入
(4.0)
| 2007年更新
(6.0)