HTML (.html, .htm)

背景

    • 注册的 MIME 类型:text/html
    • HTML 标记语言和文件格式.
    • 创建网页的主要语言.
    • HTML 是 Hypertext Markup Language(超文本标记语言)的缩写.
    • 纯文本格式.
    • 描述网页外观的结构和特征.
    • 于 1993 年作为互联网工程任务组(IETF)工作草案初次发表.
    • 自 1996 年起由万维网联盟(World Wide Web Consortium-W3C)维护.
    • 作为 W3C 建议,于1999 年发行的最新版本为 4.01.
    • 国际标准 ISO/IEC 15445:2000.
    • XHTML 的前身.

Import 与 Export

  • Import["file.html"] 给出 HTML 文件的纯文本表示.
  • Import["file.html","Data"] 从 HTML 提取表格数据.
  • Export["file.html",expr] 创建一个 expr 的 HTML 版本.
  • Export["dir",expr]expr 转换成 HTML,把输出存储在指定的目录中.
  • Import["file.html"] 返回一个字符串,把文件的文本内容表示已格式化的纯文本.
  • Export["file.html",expr] 把一个笔记本、单元、单元列表或其他笔记本参数导出到 HTML.
  • Export 总是创建一个完整的 HTML 文档,不只是 HTML 的一个片段.
  • 输出包括一个或多个 HTML 文件以及两个目录、HTMLFile 和 HTMLLink.
  • 当导出至 HTML,默认情况下,Wolfram 语言把排版表达式转换成 GIF 图像.
  • Wolfram 语言可以把 TooltipHyperlink 表达式导出至 HTML,如必要则创建 HTML 图像映射.
  • Import["file.html",elem] 从一个 HTML 文件导入指定的参数.
  • Import["file.html",{elem,suba,subb,}] 导入一个子参数.
  • Import["file.html",{{elem1,elem2,}}] 导入多个参数.
  • 导入格式可以由 Import["file","HTML"]Import["file",{"HTML",elem,}] 指定.
  • Export["file.html",expr, elem] 通过把 expr 作为指定参数 elem 创建一个 HTML 文件.
  • Export["file.html",{expr1,expr2,},{{elem1,elem2,}}] 把每一个 expri 指定为相应的 elemi.
  • Export["file.html",expr,opt1->val1,] 导出具有指定值的指定选项参数的 expr.
  • Export["file.html",{elem1->expr1,elem2->expr2,},"Rules"] 使用规则指定要导出的参数.
  • 请到以下参考页面了解完整的基本信息:
  • Import, Export从文件导入或导出到文件
    CloudImport, CloudExport从云对象导入或导出到云对象
    ImportString, ExportString从字符串导入或导出到字符串
    ImportByteArray, ExportByteArray从字节数组导入或导出到字节数组

笔记本界面

  • 选择另存为 把笔记本的选择部分导出为一个网页.
  • 另存为 把整个笔记本导出为一个网页.

Import 参数

  • Import 的通用参数:
  • "Elements" 该文件可用的参数和选项列表
    "Summary"文件摘要
    "Rules"所有可用参数的规则列表
  • Import 参数:
  • "Data"来自于 HTML 表格和列表参数的文本和数值内容
    "FullData"完整的表格内容,包括空的 HTML 表格和列表参数
    "Hyperlinks"超链接,以字符串的列表形式给出
    "Images"嵌于 HTML 文档中的图像
    "Plaintext"HTML 文档格式化为文本
    "Source"表示为单个字符串的原始 HTML 资源
    "Title"HTML 网页标题
    "ImageLinks"嵌入图像的 URL
    "XMLObject"整个文档的符号式 XML 表示
  • 默认情况下,Import 使用 "Plaintext" 参数.
  • 当以一个 "XMLObject" 导入纯 HTML 文档,Wolfram 语言将试图把它转换成一个结构良好的 XHTML 并导入生成的 XML 文件.
  • Export 参数:
  • "Notebook"Notebook 表达式
    "NotebookObject"NotebookObject 表达式
    "Expression"任意 Wolfram 语言表达式

选项

  • Import 选项:
  • CharacterEncodingAutomatic当导入文件时,使用的原始字符编码
    "Numeric"True可能的话是否以数字形式导入数据字段
  • 如果文件的字符编码没有在 HTML 文件中指明, Import 使用由 CharacterEncoding 指定的编码. 可能的编码的完整列表由 $CharacterEncodings 指定.
  • CharacterEncoding->Automatic, Import 使用 HTML 中指定的编码. 如果未指定,则使用 "UTF8" 编码. 如果任何文件中存储的位数序列不能用 "UTF8" 表示,则使用 "ISOLatin1".
  • 当导出至 HTML,Wolfram 语言总是使用 UTF-8 编码.
  • Export 选项:
  • "Content"False是否导出 MathML 内容参数
    "ConversionRules"Automatic从 Wolfram 系统单元样式到 HTML 参数指定映射,包括标记的内嵌和块级版本
    "ConvertClosed"True是否导出前向闭合的单元组
    "ConvertLinkedNotebooks"False是否把链接的笔记本转换成 HTML
    "ConvertReverseClosed"False是否导出逆向闭合的单元组
    "CSS"Automatic使用或链接何种 CSS 样式表
    "FullDocument"True是否导出一个完整的 HTML 文档
    "Graphics3DOutput"Automatic如何表示三维图形表达式
    "GraphicsOutput""GIF"如何表示图形表达式
    "HeadAttributes"{}插入 HTML <head> 标签的属性,以规则的列表形式给出
    "HeadElements"{}HTML <head> 标签的子参数
    "ManipulateOutput""CDF"如何表示 Manipulate 表达式
    "MathOutput""GIF"如何表示排版表达式
  • "GraphicsOutput""Graphics3DOutput""ManipulateOutput""MathOutput" 的可能设置为:
  • "CDF"把目标表达式转换成内嵌的 CDF
    "DisplayForm"把目标表达式转换成它们外观的 ASCII 近似
    "GIF"把目标表达式转换成 GIF
    "InputForm"把目标表达式转换成它们的 InputForm
    "PNG"把目标表达式转换成 PNG
    "JPEG"把目标表达式转换成 JPEG
    "SVG"把目标表达式转换成 SVG
  • "MathOutput"->"MathML" 把所有排版表达式转换成 MathML.
  • "Graphics3DOutput"->Automatic 用与 "GraphicsOutput" 一样的指定方法转换三维图形.
  • 输出转换的选项选择是基于单元的顶层对象的类型. 例如,只包含二维图形的单元将使用 "GraphicsOutput",而包含嵌入在排版或代码中的二维图形的单元将使用 "MathOutput".
  • "CSS"的可能设置为:
  • Automatic从 Wolfram 系统样式表中创建一个 CSS 样本表
    None不创建一个样式表文件或内嵌 CSS 样式
    "file.css"使用样式表文件
  • "ConvertClosed""ConvertReverseClosed" 的允许设置为:
  • False不导出闭合的组
    True导出所有单元组
    "LinkedPage"把每个前向闭合的组导出至一个单独的页

范例

打开所有单元关闭所有单元

基本范例  (3)

从网页中导入所有的图像:

以纯文本形式读取 HTML 文件:

显示文件中可用的 Import 参数:

从文件中导入表格内容:

以下把一个数学表达式导出到 HTML:

显示存储到 "HTMLFiles" 目录中的文件名称:

导入光栅化的排版表达式:

范围  (5)

以下把一个 Cell 表达式转换成 HTML:

Wolfram 语言可以把具有嵌入工具条提示和超链接的图形导出到 HTML 图像映射:

Wolfram 系统样式参数到 HTML 的映射可以用 "ConversionRules" 指定:

将一个格式化的表格导出至 HTML:

创建一个 HTML 片段: