导入 .mbox 文件进行分析.
MBOX 文件格式是邮件服务器的常用格式。数据来自 Apache 公共档案: https://lists.apache.org.
导入收件箱
获取有关 MBOX 文件元素的信息:
定义用于数据导入的元素:
从文件导入数据:
可视化 Dataset 中的每封电子邮件:
分析电子邮件
提取发送电子邮件的日期:
- 每个日期都表示为 DateObject.
提取电子邮件正文:
使用 StringLength 和 Total 汇总电子邮件的字符长度:
可视化电子邮件
使用 DateHistogram 创建一个发送电子邮件的时间直方图:
创建一个 Histogram 来显示消息长度的分布: