CommonLog
背景
-
- 通用日志格式.
- 亦称 NCSA 通用日志格式.
- 专用于记录网络流量数据.
- 采用纯文本格式.
- 每条记录以单行文本形式表示.
- 由 NCSA 开发.
Import
- Import["file","CommonLog"] 将日志文件作为 Tabular 对象导入.
- Import["file",{"CommonLog",elem}] 导入指定元素.
- Import["file",{"CommonLog",elem,subelem1,…}] 导入指定的子元素 subelemi,适用于部分数据导入.
- 导入通用日志文件时必须始终指定格式参数 "CommonLog".
- 完整参考信息请查阅以下页面:
-
Import 从文件导入 CloudImport 从云对象导入 ImportString 从字符串导入 ImportByteArray 从字节数组导入
导入元素
- 一般 Import 元素:
-
"Elements" 该文件中可用的元素和选项列表 "Summary" 文件摘要 "Rules" 所有可用元素的规则列表 - 数据表示要素:
-
"Data" 二维数组 "Dataset" 以 Dataset 形式表示的表格数据 "Tabular" Tabular 对象 - 默认情况下,Import 使用 "Tabular" 元素进行导入.
- "Tabular" 元素的子元素支持部分数据导入,可采用 {"Tabular",rows,cols}形式指定行和列,其中 rows 和 cols 可为以下任意形式:
-
n 第 nth 行或列 -n 从末尾开始计数 n;;m 从 n 到 m n;;m;;s 从 n 到 m,步长为 s {n1,n2,…} 指定的行或列 ni - 数据描述元素包含:
-
"ColumnLabels" 列名称 "ColumnTypes" 包含每列数据类型的关联 "Schema" TabularSchema 对象 - 常见日志文件通常包含以下列或标识符:
-
"RemoteHost" 远程主机名或 IP 地址 "ClientID" 远程日志名 "RemoteUser" 用于身份验证的用户名 "Date" 请求的日期和时间 "RequestLine" 客户端发起的原始请求 "StatusCode" 返回给客户端的 HTTP 状态码 "ByteCount" 传输文档的字节大小 - 元数据元素:
-
"ColumnCount" 文件中存储的列数 "Dimensions" 数据维度 "RowCount" 文件中存储的行数
导入选项
- 一般 Import 选项:
-
"Schema" Automatic 用于构建 Tabular 对象的模式 - "Schema" 选项的可能设置包括:
-
schema 完整的 TabularSchema 规范 propval 模式属性和值(请参阅 TabularSchema 参考页) <|"prop1"val1,…|> 模式属性和值的关联