DTA (.dta)

予備知識

    • MIMEタイプ:application/x-stata-dta
    • Stataデータベース転送形式.
    • レガシーデータ交換形式.
    • 数値データセットをポータブル形式で保持する.
    • バイナリ形式.
    • 1985年にStataCorpによって開発された.

Import

  • Import["file.dta"]はDTAファイルをインポートし,すべてのデータセットを表として並べて返す.
  • DTAデータはWolfram言語では,実数,整数,文字列,ブール値のTrueFalse,およびDateObject仕様によって表される.
  • Import["file.dta",elem]はDTAファイルから指定された要素をインポートする.
  • Import["file.dta",{elem,suba,subb,}]はサブ要素をインポートする.
  • インポート形式はImport["file","DTA"]またはImport["file",{"DTA",elem,}]で指定できる.
  • Export["file.dta",expr]expr からDTAファイルを生成する.
  • サポートされる式 expr は以下を含む:
  • {v1,v2,}データの一列
    {{v11,v12,},{v21,v22,},}データの行のリスト
    arraySparseArrayQuantityArray等の配列
    tseriesTimeSeriesオブジェクトまたはEventSeriesオブジェクトまたはTemporalDataオブジェクト
    Dataset[]データ集合
    <|"name1"expr1,|>名前付き列の連想
  • ImportExportは以下のデータ型をサポートする:
  • "Date"日付または時間指定
    "Integer8"8ビット整数
    "Integer16"16ビット整数
    "Integer32"32ビット整数
    "Real32"IEEE単精度数
    "Real64"IEEE倍精度数
    "String"文字列
  • 一般的な情報は,以下の関数ページを参照のこと.
  • Import, Exportファイルからインポートする,またはファイルへエキスポートする
    CloudImport, CloudExportクラウドオブジェクトからインポートする,またはクラウドオブジェクトへエキスポートする
    ImportString, ExportString文字列からインポートする,または文字列へエキスポートする
    ImportByteArray, ExportByteArrayバイト配列からインポートする,またはバイト配列へエキスポートする

Import要素

  • 一般的なImport要素:
  • "Elements" ファイル中の有効な要素とオプションのリスト
    "Summary"ファイルの概要
    "Rules"使用可能なすべての要素の規則のリスト
  • データ表現要素:
  • "Data"二次元配列
    "Dataset"Datasetとして表された表データ
    "LabeledData"ラベルとデータの連想
  • Importはデフォルトで"Data"要素を使用する.
  • データ記述子要素:
  • "ColumnDescriptions"列の説明とタイプ
    "Labels"列の名前
    "MissingValues"欠損値とみなす列ごとの値
  • メタデータ要素:
  • "ByteOrdering"データのエンディアン
    "CharacterEncoding"ファイルの文字コード
    "Comments"ファイルのコメント
    "Compression"ファイルで使用されている圧縮のタイプ
    "CreationDate"DateObjectで与えられる,ドキュメントの作成日
    "Dimensions"データの次元
    "MetaInformation"文字列と日付オブジェクトとして与えらるメタデータ
    "MissingValues"欠損値とみなす列ごとの値
    "ModificationDate"DateObjectで与えられる,ドキュメントの変更日
    "TableName"表全体の名前
    "Version"ファイルのSAS仕様のバージョン

オプション

  • Importオプション:
  • "ColumnDefaultValues"Automatic列名とデフォルト値の連想
    "TypeDefaultValues"Automaticタイプとデフォルト値の連想
  • Exportオプション:
  • "ColumnDescriptions"Automatic各列の概要のリスト
    "MetaInformation"Automaticメタデータのタグと値の連想
  • "ColumnDescriptions" の設定には以下を含むことができる:
  • {"label1", "label2", }列の名前に与える文字列のリスト
    {assoc,}列のメタデータに与える連想のリスト
    <|colassoc|>インデックスまたは列の名前と行のメタデータとの連想
  • assoc には以下を含むことができる:
  • "Name"列の名前に与える文字列
    "Description"列の概要に与える文字列
    "Type"列の型に与える文字列
  • "MetaInformation" には以下を含むことができる:
  • "Comments"ファイル上の一般的なコメントを与える文字列
    "CreationDate"ファイルの作成日を与える日付オブジェクト
    "ModificationDate"ファイルの変更日を与える日付オブジェクト
    "TableName"表全体の名前を与える文字列
    "Version"ファイルのバージョンを与える整数

例題

すべて開くすべて閉じる

  (3)

DTAファイルをインポートする:

DTAファイルの概要:

式の配列をDTAファイルにエキスポートする:

その結果のファイルをデータ集合としてインポートする:

スコープ  (6)

Datasetをエキスポートする:

列の名前は自動的に推測される:

データの配列をエキスポートする:

列の名前は自動的に生成される:

名前付き列の連想をエキスポートする:

列の名前は自動的に推測される:

TimeSeriesをエキスポートする:

時刻は1列目に,値は2列目に格納される:

タグ付けされた欠損値をエキスポートする:

不規則な配列は自動的に右側に空欄が充填され,完全配列に変換される:

Import要素  (13)

データ表現  (3)

"Data"  (1)

DTAファイルを値の2次元リストとしてインポートする:

これはデフォルト要素でもある:

"Dataset"  (1)

DTAファイルをDatasetとしてインポートする:

"LabeledData"  (1)

DTAファイルをラベルとデータの連想としてインポートする:

データ記述子  (3)

"ColumnDescriptions"  (1)

DTAファイルの各列について名前,説明,型を与える連想をインポートする:

"Labels"  (1)

DTAファイルの各列の名前をインポートする:

"MissingPositions"  (1)

列ごとの欠損値の位置を与える連想をインポートする:

メタデータ  (7)

"ByteOrdering"  (1)

DTAファイルのメタデータに含まれているバイト順をインポートする:

"Comments"  (1)

DTAファイルのメタデータに含まれているコメントをインポートする:

"CreationDate"  (1)

作成日をインポートする:

"Dimensions"  (1)

データの次元をインポートする:

"MetaInformation"  (1)

DTAファイルに含まれているすべてのメタデータの連想をインポートする:

"ModificationDate"  (1)

変更日をインポートする:

"Version"  (1)

DTAファイルのバージョンをインポートする:

Importオプション  (2)

"ColumnDefaultValues"  (1)

欠損数値はデフォルトではゼロで置換される:

"ColumnDefaultValues"を使って特定の列に別のデフォルト値を指定する:

"TypeDefaultValues"  (1)

欠損数値はデフォルトではゼロで置換される:

"TypeDefaultValues"を使って特定の型に別のデフォルト値を指定する:

Exportオプション  (2)

"ColumnDescriptions"  (1)

異なるデータ型をエキスポートする:

与えられたデータに基づいて自動的に列の型が推測される

"ColumnDescriptions"を使って,列の型と説明を指定する:

その結果の列の説明をインポートする:

"MetaInformation"  (1)

DTAファイルからメタ情報を取得する:

同じメタ情報を持つ新しいファイルをエキスポートする: