HTML (.html, .htm)
背景
-
- 注册的 MIME 类型:text/html
- HTML 标记语言和文件格式.
- 创建网页的主要语言.
- HTML 是 Hypertext Markup Language(超文本标记语言)的缩写.
- 纯文本格式.
- 描述网页外观的结构和特征.
- 于 1993 年作为互联网工程任务组(IETF)工作草案初次发表.
- 自 1996 年起由万维网联盟(World Wide Web Consortium-W3C)维护.
- 作为 W3C 建议,于1999 年发行的最新版本为 4.01.
- 国际标准 ISO/IEC 15445:2000.
- XHTML 的前身.
Import 与 Export
- Import["file.html"] 给出 HTML 文件的纯文本表示.
- Import["file.html","Data"] 从 HTML 提取表格数据.
- Export["file.html",expr] 创建一个 expr 的 HTML 版本.
- Export["dir",expr] 把 expr 转换成 HTML,把输出存储在指定的目录中.
- Import["file.html"] 返回一个字符串,把文件的文本内容表示已格式化的纯文本.
- Export["file.html",expr] 把一个笔记本、单元、单元列表或其他笔记本参数导出到 HTML.
- Export 总是创建一个完整的 HTML 文档,不只是 HTML 的一个片段.
- 输出包括一个或多个 HTML 文件以及两个目录、HTMLFile 和 HTMLLink.
- 当导出至 HTML,默认情况下,Wolfram 语言把排版表达式转换成 GIF 图像.
- Wolfram 语言可以把 Tooltip 和 Hyperlink 表达式导出至 HTML,如必要则创建 HTML 图像映射.
- Import["file.html",elem] 从一个 HTML 文件导入指定的参数.
- Import["file.html",{elem,suba,subb,…}] 导入一个子参数.
- Import["file.html",{{elem1,elem2,…}}] 导入多个参数.
- 导入格式可以由 Import["file","HTML"] 或 Import["file",{"HTML",elem,…}] 指定.
- Export["file.html",expr, elem] 通过把 expr 作为指定参数 elem 创建一个 HTML 文件.
- Export["file.html",{expr1,expr2,…},{{elem1,elem2,…}}] 把每一个 expri 指定为相应的 elemi.
- Export["file.html",expr,opt1->val1,…] 导出具有指定值的指定选项参数的 expr.
- Export["file.html",{elem1->expr1,elem2->expr2,…},"Rules"] 使用规则指定要导出的参数.
- 请到以下参考页面了解完整的基本信息:
-
Import, Export 从文件导入或导出到文件 CloudImport, CloudExport 从云对象导入或导出到云对象 ImportString, ExportString 从字符串导入或导出到字符串 ImportByteArray, ExportByteArray 从字节数组导入或导出到字节数组
Import 参数
- Import 的通用参数:
-
"Elements" 该文件可用的参数和选项列表 "Summary" 文件摘要 "Rules" 所有可用参数的规则列表 - Import 参数:
-
"Data" 来自于 HTML 表格和列表参数的文本和数值内容 "FullData" 完整的表格内容,包括空的 HTML 表格和列表参数 "Hyperlinks" 超链接,以字符串的列表形式给出 "Images" 嵌于 HTML 文档中的图像 "Plaintext" HTML 文档格式化为文本 "Source" 表示为单个字符串的原始 HTML 资源 "Title" HTML 网页标题 "ImageLinks" 嵌入图像的 URL "XMLObject" 整个文档的符号式 XML 表示 - 默认情况下,Import 使用 "Plaintext" 参数.
- 当以一个 "XMLObject" 导入纯 HTML 文档,Wolfram 语言将试图把它转换成一个结构良好的 XHTML 并导入生成的 XML 文件.
- Export 参数:
-
"Notebook" Notebook 表达式 "NotebookObject" NotebookObject 表达式 "Expression" 任意 Wolfram 语言表达式
选项
- Import 选项:
-
CharacterEncoding Automatic 当导入文件时,使用的原始字符编码 "Numeric" True 可能的话是否以数字形式导入数据字段 - 如果文件的字符编码没有在 HTML 文件中指明, Import 使用由 CharacterEncoding 指定的编码. 可能的编码的完整列表由 $CharacterEncodings 指定.
- 用 CharacterEncoding->Automatic, Import 使用 HTML 中指定的编码. 如果未指定,则使用 "UTF8" 编码. 如果任何文件中存储的位数序列不能用 "UTF8" 表示,则使用 "ISOLatin1".
- 当导出至 HTML,Wolfram 语言总是使用 UTF-8 编码.
- Export 选项:
-
"Content" False 是否导出 MathML 内容参数 "ConversionRules" Automatic 从 Wolfram 系统单元样式到 HTML 参数指定映射,包括标记的内嵌和块级版本 "ConvertClosed" True 是否导出前向闭合的单元组 "ConvertLinkedNotebooks" False 是否把链接的笔记本转换成 HTML "ConvertReverseClosed" False 是否导出逆向闭合的单元组 "CSS" Automatic 使用或链接何种 CSS 样式表 "FullDocument" True 是否导出一个完整的 HTML 文档 "Graphics3DOutput" Automatic 如何表示三维图形表达式 "GraphicsOutput" "GIF" 如何表示图形表达式 "HeadAttributes" {} 插入 HTML <head> 标签的属性,以规则的列表形式给出 "HeadElements" {} HTML <head> 标签的子参数 "ManipulateOutput" "CDF" 如何表示 Manipulate 表达式 "MathOutput" "GIF" 如何表示排版表达式 - "GraphicsOutput"、"Graphics3DOutput"、"ManipulateOutput" 和 "MathOutput" 的可能设置为:
-
"CDF" 把目标表达式转换成内嵌的 CDF "DisplayForm" 把目标表达式转换成它们外观的 ASCII 近似 "GIF" 把目标表达式转换成 GIF "InputForm" 把目标表达式转换成它们的 InputForm "PNG" 把目标表达式转换成 PNG "JPEG" 把目标表达式转换成 JPEG "SVG" 把目标表达式转换成 SVG - "MathOutput"->"MathML" 把所有排版表达式转换成 MathML.
- "Graphics3DOutput"->Automatic 用与 "GraphicsOutput" 一样的指定方法转换三维图形.
- 输出转换的选项选择是基于单元的顶层对象的类型. 例如,只包含二维图形的单元将使用 "GraphicsOutput",而包含嵌入在排版或代码中的二维图形的单元将使用 "MathOutput".
- "CSS"的可能设置为:
-
Automatic 从 Wolfram 系统样式表中创建一个 CSS 样本表 None 不创建一个样式表文件或内嵌 CSS 样式 "file.css" 使用样式表文件 - "ConvertClosed" 与 "ConvertReverseClosed" 的允许设置为:
-
False 不导出闭合的组 True 导出所有单元组 "LinkedPage" 把每个前向闭合的组导出至一个单独的页