DOCX (.docx, .docm)

予備知識

    • MIMEタイプ: application/vnd.openxmlformats-officedocument.wordprocessingml.document
    • Microsoft Wordドキュメントファイル.
    • Microsoft Word 2007以降の標準形式.
    • Office Open XMLドキュメントとしても知られている.
    • XMLベースのファイルバンドル.
    • テキスト,表,グラフィックスを保存する.

Import

  • Import["file.docx"]は文字列としてDOCXファイルをインポートする.
  • Import["file.docx",elements] は指定された要素をインポートする.
  • インポート形式はImport["file","DOCX"]またはImport["file",{"DOCX",elem,}]で指定することができる.
  • 一般的な情報は,以下の関数ページを参照のこと.
  • Importファイルからインポートする
    CloudImportクラウドオブジェクトからインポートする
    ImportString文字列からインポートする
    ImportByteArrayバイト配列からインポートする

Import要素

  • 一般的なImport要素:
  • "Elements" ファイル中の有効な要素とオプションのリスト
    "Summary"ファイルの概要
    "Rules"使用可能なすべての要素の規則のリスト
  • データ表現要素:
  • "Plaintext"文書全体のテキスト内容を示す文字列
    "FormattedText"文書全体の一連のフォーマットされたテキスト
  • 埋め込みメディア要素:
  • "EmbeddedImageNames"バンドル内の画像ファイル名のリスト
    "EmbeddedImages"埋め込まれた画像のリスト
  • メタ要素:
  • "CreationDate"文書の作成日(DateObjectとして与えられる)
    "Creator"コンテンツを作成したプログラム
    "Description"文書の概要
    "Language"文書の言語
    "LastModifiedBy"ファイルの最終更新者
    "ModificationDate"文書の更新日( DateObjectとして与えられる)
    "RawMetaInformation"文字列と日付オブジェクトで与えられるメタデータ
    "RevisionNumber"文書が保存された回数
    "Subject"文書の主題
    "Title"文書のタイトル

例題

すべて開くすべて閉じる

  (2)

DOCXファイルをインポートする:

DOCXファイルの概要をインポートする:

スコープ  (2)

Import  (2)

DOCXファイルからプレーンテストをインポートする:

いくつかのメタデータをインポートする:

Import要素  (15)

利用できる要素  (1)

利用できる要素のリスト:

データ表現  (2)

"Plaintext"  (1)

文書全体からテキストをインポートする:

"FormattedText"  (1)

文書全体からフォーマットされたテキストをインポートする:

埋め込みのメディア要素  (2)

"EmbeddedImageNames"  (1)

埋め込みの画像の名前をインポートする:

"EmbeddedImage"  (1)

埋め込み画像をインポートする:

メタデータ  (10)

"CreationDate"  (1)

文書の作成日をインポートする:

"Creator"  (1)

文書の作成者をインポートする:

"Description"  (1)

文書の説明をインポートする:

"Language"  (1)

文書の言語をインポートする:

"LastModifiedBy"  (1)

最後にファイルを編集した作者をインポートする:

"ModificationDate"  (1)

文書の編集日をインポートする:

"RawMetaInformation"  (1)

ファイルからメタデータをインポートする:

"RevisionNumber"  (1)

改訂番号をインポートする:

"Subject"  (1)

文書の主題をインポートする:

"Title"  (1)

文書のタイトルをインポートする: