MBOX (.mbox)
- Import 支持所有 MBOX 文件格式的常用变体.
背景
-
- MIME 类型:application/mbox
- Unix 邮箱格式.
- 拥有电子邮件消息集合.
- 电子邮件客户例如:Unix 邮件、Thunderbird 等的原档案格式.
- 有二进制数据编码的文本格式.
- EML 格式存储的信息,用分隔线连接.
- 支持 RFC 4155.
Import
- Import["file.mbox"] 导入一个 MBOX 文件,以关联形式返回信心摘要的列表.
- Import["file.mbox"] 返回形式为{msg1,msg2,…}的表达式,其中 msgi 为给出单个邮件消息的关联.
- Import["file.mbox",elem] 从 MBOX 文件中导入指定的参数.
- Import["file.mbox",{elem,suba,subb,…}] 导入一个子参数.
- Import["file.mbox",{{elem1,elem2,…}}] 导入多个参数.
- 导入格式可以由 Import["file","MBOX"] 或 Import["file",{"MBOX",elem,…}] 指定.
- 请到以下参考页面了解完整的基本信息:
-
Import 从文件导入 CloudImport 从云对象导入 ImportString 从字符串导入 ImportByteArray 从字节数组导入
导入参数
- Import 的通用参数:
-
"Elements" 文件中可用的参数和选项列表 "Summary" 文件摘要 "Rules" 所有可用参数的规则列表 - 完整邮箱参数:
-
"MessageSummaries" 给出每个信息基本参数的关联列表 "MessageElements" 给出每个信息主要参数的关联列表 "FullMessageElements" 给出信息所有可用参数的关联列表 "MessageCount" 邮箱中出现的信息数 - 默认情况下,Import 使用 "MessageSummaries" 参数.
- 摘要参数:
-
"From" 发件人姓名和电子邮件地址 "ToList" 收件人姓名和地址 "CcList" 复制的收件人姓名和地址 "BccList" 隐蔽抄送的收件人姓名和地址 "OriginatingDate" 电子邮件标头中客户端的日期和时间 "Subject" 电子邮件的主题 "BodyPreview" 邮件正文的简短预览 "HasAttachments" 邮件是否包含任何附件 "MessageID" 该信息的 ID - "MessageSummary" 包括所有摘要参数.
- 附加信息参数:
-
"FromAddress" 发件人原始电子邮件地址 "FromName" 发件人全名 "ToAddressList" 收件人地址 "ToNameList" 收件人全名 "CcAddressList" 复制的收件人地址 "CcNameList" 复制收件人全名 "BccAddressList" 隐蔽抄送的收件人地址 "BccNameList" 隐蔽抄送的收件人全名 "ReplyToList" 回复姓名和地址 "ReplyToAddressList" 回复地址 "ReplyToNameList" 回复全名 "Body" 作为字符串的消息正文 "AttachmentList" 作为表达式的经处理的附件列表 - "MessageElements" 包括除 "BodyPreview" 和 "HasAttachments" 之外的所有摘要和消息元素.
- 可从以下分类导入每封邮件更多详细信息.
- 信息正文参数:
-
"BodyPreview" 邮件正文的简短预览 "Body" 作为字符串的消息正文 "NewBodyContent" 未回复或转发的正文部分 "QuotedContent" 被引用的正文部分 - 主题参数:
-
"ThreadCount" 邮箱中的线程数 "ThreadGraph" 邮箱中表示为 Graph 的线程 "ThreadEmailCount" 每个线程中的邮件数 "ThreadTimeInterval" 每个线程中从第一封电子邮件到最后一封电子邮件的间隔 "ThreadDuration" 每个线程中从第一封电子邮件到最后一封电子邮件的持续时间 "ThreadMessageIDList" 每个线程中所有电子邮件的消息 ID 列表 "ThreadFromList" 引用内容的发件人列表 "ReferenceMessageIDGraph" "reference" 信息的 Graph 连接 - 信息路径相关参数:
-
"Precedence" 公开的邮件优先级 "ReturnPath" 邮件中公开的返回路径 "ReturnReceiptRequested" 是否要求回执 "DeliveryChainHostnames" 邮件发送链上的主机名称 "DeliveryChainRecords" 邮件发送链上的完整记录 - 邮件标题相关参数:
-
"Plaintext" 作为字符串的完整原始邮件 "HeaderString" 作为字符串的完整邮件标题 "HeaderRules" 所有标题的规则列表 "CharacterEncoding" 邮件内容的字符编码 "ContentType" 邮件正文的 MIME 内容类型 "MIMEVersion" MIME 标准的版本 "ReplyToMessageID" 每条消息回复的任何消息 ID 的列表 "ReferenceMessageIDList" "reference" 消息的 ID(通常在一个线程上) - 信息来源相关参数:
-
"OriginatingMailClient" 原始邮件客户端类型 "OriginatingIPAddress" 原始客户端机器的 IP 地址 "OriginatingHostname" 原始客户端的主机名称 "OriginatingCountry" 地理 IP 推测的原始国家 "OriginatingDate" 从邮件标题得到的客户端日期和时间 "OriginatingTimeZone" 基于标题的客户端时区 "ServerOriginatingDate" 原始服务器上的日期和时间 "ServerOriginatingTimeZone" 原始服务器上的时区 - 附件相关参数:
-
"HasAttachments" 信息中是否含有任何附件 "AttachmentNames" 发配附件的名称列表 "AttachmentList" 给出附件内容的表达式列表 "AttachmentSummaries" 给出基本附件参数的关联列表 "AttachmentData" 给出附件原始编码数据的关联列表 "AttachmentDecodedData" 给出附件原始解码数据的关联列表 "AttachmentDetails" 给出内容和附件元素的关联列表 - 参数 "AttachmentDetails" 是为每个附件提供关联的列表。该关联的常用参数如下:
-
"Name" 附件发送的名称 "MIMEType" 内容的 MIME 类型 "Content" 导入的内容 "ContentDisposition" 附件的内容处理 "ModificationDate" 附件的修改日期记录 "ByteCount" 原始编码内容的位数 - 参数 "AttachmentDecodedData" 是为每个附件提供关联的列表。该关联的常用参数如下:
-
"Name" 附件发送的名称 "MIMEType" 内容的 MIME 类型 "DecodedContent" 作为字节数组的原始解码内容 "ContentDisposition" 附件的内容处理 "ModificationDate" 附件的修改日期记录 "ByteCount" 原始编码内容的位数 - 参数 "AttachmentData" 是为每个附件提供关联的列表. 常见的该关联的参数如下:
-
"Name" 附件发送的名称 "MIMEType" 内容的 MIME 类型 "RawContent" 作为字符串的原始编码内容 "ContentTransferEncoding" "RawContent" 的内容传输编码 "ContentDisposition" 附件的内容处理 "ModificationDate" 附件的修改日期记录 "ByteCount" 原始编码内容的位数 - "AttachmentSummaries" 包含每个附件的 "Name"、"MIMEType" 和解码内容的 "ByteCount".
- 用于导入任何参数 elem 的部分数据的子参数,可以 {elem,msgs} 格式的行列规范,其中 msgs 可为一下任意:
-
n 第 n 封邮件 -n 从结尾的计算 messageid 指定邮件消息的 ID {spec1,spec2,…} 邮件索引或消息 ID 的列表 - 对于 "FullMessageElements"、"MessageElements" 和 "MessageSummaries" 的子元素也可以用 {elem,msgs,keys} 格式给出,其中键可以是关联中的任何参数.
- 以 {elem,spec} 形式访问部分线程参数 elem 的子元素可以采用以下规范 spec:
-
n nth 线程(基于起始数据) messageid 包含特定消息 ID 的线程
选项
- Import 参数:
-
"AttachmentRules" < > 控制如何导入附件的规则 - 作为关联的 "AttachmentRules"可用设置包括:
-
fmtNone 将格式 fmt 的附件导入为 None fmtelem 在导入 fmt 附件时的 Import 参数 fmtfun 在解码的字节数组上使用纯函数 fun
格式规范 fmt 可为任何 $ImportFormats 支持的格式或一个 MIME 类型.
范例
打开所有单元关闭所有单元范围 (6)
导入一个邮件的指定参数作为 Association:
导入参数 (62)
表示数据 (10)
"MessageSummaries" (2)
内容查询 (2)
线程参数 (8)
邮箱地址标题参数 (19)
基本标题参数 (4)
高级标题参数 (11)
"DeliveryChainRecords" (1)
将发送链记录作为 Association 导入: