POR (.por)

背景

    • MIME 类型:application/x-spss-por
    • SPSS 数据库传输格式.
    • 旧版数据交换格式.
    • 将数值数据集存储为可移植格式.
    • 二进制格式.
    • SPSS 最初是由 Norman H. Nie、Dale H. Bent 和 C. Hadlai Hull 于 1968 年发布.
    • 从 1975 年开始由 SPSS Inc. 维护,然后从 2009 年开始由 IBM SPSS Statistics 维护.

Import

  • Import["file.por"] 导入一个 POR 文件,将所有数据集返回为一个表格形式.
  • POR 数据在 Wolfram 语言中由实数或者字符串、布尔值 TrueFalse、以及 DateObject 规范表示.
  • Import["file.por",elem] 从 POR 文件导入特定的参数.
  • Import["file.por",{elem,suba,subb,}] 导入一个子参数.
  • 导入格式可以由 Import["file","POR"]Import["file",{"POR",elem,}]指定.
  • Export["file.por",expr] 从 expr 创建 POR 文件.
  • 支持的 expr 表达式包括:
  • {v1,v2,}单列数据
    {{v11,v12,},{v21,v22,},}数据行列表
    array例如 SparseArrayQuantityArray 等的数组
    tseriesTimeSeriesEventSeriesTemporalData 对象
    Dataset[]数据集
    <|"name1"expr1,|>有命名列的关联
  • ImportExport 支持一下数据类型:
  • "Date"日期和时间规范
    "Integer8"8 位整数
    "Integer16"16 位整数
    "Integer32"32 位整数
    "Real32"IEEE 单精度数
    "Real64"IEEE 双精度数
    "String"文字字符串
  • 请到以下参考页面了解完整的基本信息:
  • Import, Export从文件导入或导出到文件
    CloudImport, CloudExport从云对象导入或导出到云对象
    ImportString, ExportString从字符串导入或导出到字符串
    ImportByteArray, ExportByteArray从字节数组导入或导出到字节数组

Import 参数

  • Import 的通用参数:
  • "Elements" 该文件可用的参数和选项列表
    "Summary"文件摘要
    "Rules"所有可用参数的规则列表
  • 数据表示参数:
  • "Data"二维数组
    "Dataset"作为 Dataset 的表格数据
    "LabeledData"标签和数据的关联
  • 默认情况下,Import 使用 "Data" 参数.
  • 数据描述符参数:
  • "LabelDescriptions"列的描述和类型
    "Labels"列的名称
    "MissingPositions"每列认为丢失的参数的位置
    "MissingValues"每列被认为缺失的值
  • 元数据参数:
  • "ByteOrdering"元信息参数
    "CharacterEncoding"文件的字符编码
    "Comments"文件中的注释
    "Compression"文件中使用的压缩类型
    "CreationDate"DateObject 形式给出的文档创建日期
    "Dimensions"数据维度
    "MetaInformation"以字符串和日期对象形式给出的元数据
    "ModificationDate"DateObject 形式给出的文档修改日期
    "TableName"整个表格的名称
    "Version"该文件的 SAS 规范版本

选项

  • Import 选项:
  • "ColumnDefaultValues"Automatic列的名称和默认值的关联
    "TypeDefaultValues"Automatic类型和默认值的关联
  • Export 选项:
  • "ColumnDescriptions"Automatic每列的描述列表
    "MetaInformation"Automatic元数据标签和值的关联
  • "ColumnDescriptions" 可用的设定包括:
  • {"label1","label2", }给出列名的字符串列表
    {assoc,}提供列元数据的关联列表
    <|colassoc|>索引或列名与列元数据的关联
  • assoc 可用的键包括:
  • "Name"给出列名称的字符串
    "Description"给出列描述的字符串
    "Type"给出列类型的字符串
    "MissingValues"对于列认为确实的值
  • "MetaInformation" 可用的键包括:
  • "Comments"给出文件一般注释的字符串
    "CreationDate"给出文件创建日期的日期对象
    "ModificationDate"给出文件修改日期的日期对象
    "TableName"给出整个表单名称的字符串
    "Version"给出文件版本的整数

范例

打开所有单元关闭所有单元

基本范例  (3)

导入 POR 文件:

POR 文件摘要:

将表达式数组导出到 POR 文件:

将生成文件导入为数据集:

范围  (5)

导出 Dataset

自动推测列的名称:

导出数据组:

自动生成列的名称:

导出有命名列的关联:

自动推测列的名称:

导出一个 TimeSeries

时间存储在第一列中,值存储在第二列中:

不规则数组会自动填充到右侧并转换为完整数组:

Import 参数  (13)

数据表示  (3)

"Data"  (1)

将 POR 文件导入为值的二维列表:

以下也是默认参数:

"Dataset"  (1)

将 POR 文件导入为 Dataset

"LabeledData"  (1)

将 POR 文件导入为标签和数据的关联:

数据表示  (4)

"ColumnDescriptions"  (1)

为 POR 文件中的每一列提供名称、描述和类型的导入关联:

"Labels"  (1)

导入 POR 文件中的每列的名称:

"MissingPositions"  (1)

按列给出缺失值的位置导入关联:

"MissingValues"  (1)

导入每列中认为缺失的值:

Metadata  (6)

"Comments"  (1)

导入存储在 POR 文件元数据中的注释:

"CreationDate"  (1)

导入创建日期:

"Dimensions"  (1)

导入数据维度:

"MetaInformation"  (1)

导入存储在 POR 文件中的所有元数据的关联:

"ModificationDate"  (1)

导入修改日期:

"Version"  (1)

导入 POR 文件的版本:

Import 选项  (2)

"ColumnDefaultValues"  (1)

缺失的数值默认替换为零:

"ColumnDefaultValues" t为特定列指定不同的默认值:

"TypeDefaultValues"  (1)

缺失的数值默认替换为零:

"TypeDefaultValues" 为特定类型指定不同的默认值:

Export 选项  (2)

"ColumnDescriptions"  (1)

导出不同的数据类型:

列将根据给定的数据自动推断类型:

"ColumnDescriptions" 指定列的类型和描述:

导入生成的列描述:

导入含有丢失值得结果数据:

"MetaInformation"  (1)

从 POR 文件中检索元信息:

导出具有相同元信息的新文件: