XMLのエキスポート

XMLのエキスポート関数

Export

Export関数を使うと,Wolfram言語からXMLデータがエキスポートできる.

Export[file,expr]ファイルの拡張子が表す形式にエキスポートする
Export[file,expr,format]特定の形式にエキスポートする

ファイルのエキスポート

関数の第1引数は,データをどのファイルにエキスポートするかを指定するものである.第2引数はエキスポートするデータを指定するもので,XMLデータのエキスポートの際は,これは記号的なXML式やその他のWolfram言語式になる.オプションの第3引数を出力形式の指定に使うこともできる.XMLデータのエキスポートに使用できるファイル形式には,"XML""ExpressionML""MathML""SVG"がある.

形式を"XML"とすると,すべての式がExpressionMLとしてエキスポートされる.
"MathML"を指定すると,同様の式がMathMLとして書き出される.
引数が2つだけの場合,Wolfram言語はファイル名の拡張子に従ってエキスポート形式を決定する..xmlはXMLに関連付けられている.Export[filename.xml,expr]Export[filename.xml,expr,"XML"]と同じ動作をする.
拡張子.mmlはMathMLに関連付けられている.

Exportのオプションを使うとエキスポート処理に関するさまざまな詳細部分が制御できる.

このセクションのコマンドを評価して作られたテストファイルを削除する.

ExportString

ExportStringを使うと,Wolfram言語式をXML文字列に変換することができる.

ExportString[expr,format]文字列にエキスポートする

XMLとしてエキスポートするのに使用できる形式には,"XML""ExpressionML""MathML""SVG"がある.

記号的なXML式を生成する.
ExportStringの第1引数として記号的なXML式を渡すと,出力は通常のXMLになる.
第1引数が他のタイプの式の場合は,出力はExpressionMLになる.

ExportStringのオプションを使うと,エキスポート処理に関するさまざまな詳細部分が制御できる.

Export オプション

はじめに

Export関数とExportString関数の標準オプションを使うと,エキスポート処理がより詳細に制御できる.

Export[file,expr,format,option1->value1,option2->value2,]
ファイルにエキスポートする
ExportString[expr,format,option1->value1,option2->value2,]
文字列にエキスポートする

XMLデータのエキスポートに使用できるオプションには,以下のものがある.

"Annotations"

この変換オプションは,どの注釈を出力のXMLに加えるかを制御するものである.このオプションの値は,"DocumentHeader""XMLDeclaration""DOCTYPEDeclaration"の任意の要素の組合せのリストである.リスト中の要素はどのような順序でも構わない.

"XMLDeclaration"

"XMLDeclaration"が注釈に含まれている場合,XML宣言<?xml version="1.0"?>はヘッダに含まれる.

"DOCTYPEDeclaration"

"DOCTYPEDeclaration"が注釈に含まれる場合,<!DOCTYPE ... >という形式のXML文書型宣言がヘッダに現れる.これは出力が書き出されるXMLアプリケーションのDTDを指定するものである.

"DocumentHeader"

"Annotations"->{"DocumentHeader","XMLDeclaration","DOCTYPEDeclaration"}
と設定すると,XML宣言とDTDの文書型宣言が自動的にヘッダに含まれる.
"Annotations""DocumentHeader"を含まない場合は,出力にはヘッダが含まれない.これは"Annotations""XMLDeclaration""DOCTYPEDeclaration"等の他の要素を含んでいても同じである.
生成される記号的なXMLの形式を制御するには"Annotations"->"DocumentHeader"を使うと便利である.出力の記号的なXMLにXMLElement[Document]を加える.
"Annotations"->{"DocumentHeader"}
が指定されていない場合は,XMLElement[Document]は出力されない.

"AttributeQuoting"

オプション
動作
"AttributeQuoting"'属性の値はシングルクォートで囲まれる (デフォルト)
\"属性の値はダブルクォートで囲まれる

"AttributeQuoting"の値

デフォルトの設定"AttributeQuoting"->"'"により,通常ダブルクォートで囲まれているWolfram言語文字列との衝突を避けることができる.
属性の値をダブルクォートで囲むには,"AttributeQuoting"->"\""と設定する.ダブルクォート文字は前にバックスラッシュを付けてエスケープしなければならない.

"CheckXML"

この変換オプションは記号的なXML式をエキスポートする際に,まずエラーのチェックを行うかどうかを指定するものである.

オプション
動作
"CheckXML"Trueエキスポートされるファイルのエラーがチェックされる (デフォルト)
Falseエキスポートされるファイルのエラーはチェックされない

"CheckXML"の値

記号的なXMLが正しいと確信がある場合は,このオプションをFalseに設定する.

XMLのエラーのチェックは処理遅延を伴う可能性がある.

エキスポートされた大きな記号的なXML式が,小さなエラーによって完全に破壊されてしまうこともあるため,"CheckXML"は非常に便利である.このオプションをオンにすると,小さなエラーの多くは修正される.

ここでは記号的なXML式には小さなエラーがあるが,修正されて妥当な結果が返される.
"CheckXML"->Falseとすると,ファイルには何も出力されない.

"ElementFormatting"

この変換オプションは,XMLファイル中の要素をどのようにインデントするかを制御する.

All要素の子ノードはすべてインデントされ,長い行は折り返される
Noneインデントは加えられない
Automatic混在する内容はインデントされないが,内容が要素のみである要素はインデントされる(デフォルト)
fnユーザ定義の関数

"ElementFormatting"の値

"ElementFormatting"->Allとした場合の例.
"ElementFormatting"->Noneとするとインデントは追加されない.
"ElementFormatting"->Automaticとすると,混在する内容(内容としての文字列)を持つ要素はインデントされないが,要素だけの内容を持つ要素はインデントされる.
"ElementFormatting"->Allとすると長い文字列は折り返される.これはHTMLに似た出力を生成するために使うことができる.一方ElementFormatting->Automaticは1行の長いテキストを生成する.
上級のユーザは,形式を決定する関数も指定できる.関数には2要素のリスト{名前空間,ローカル名}が渡される.関数はインデントが必要な場合はTrueを,インデントが必要でない場合はFalseを,要素のみの内容はインデントし,混在する内容はインデントしない場合はAutomaticを返す.

"Entities"

XMLドキュメントのエキスポートの際に,特殊文字を名前の付いた文字実体で表記することが望ましいことがある."Entities"は,このような名前の付いた文字実体の出力をサポートしている.

オプション
動作
"Entities""HTML"HTMLで定義された実体の名前を解決する
"MathML"MathMLで定義されている実体の名前を解決する
list文字置換規則のリスト

"Entities"の値

このオプションの値をリストとして指定することもできる.例えば,HTMLとMathMLの実体の両方をエキスポートするためには,"Entities"->{"HTML","MathML"}を使う. "HTML""MathML"のどちらにも設定されていない場合でも,すべての文字はXMLに正しく出力される.しかし,数値的な実体や文字コードUTF-8が使われる可能性がある.

"HTML"設定を使うと,α は名前付き文字実体&alpha;に変換される.

独自の文字置換規則リストを使用する場合は,次の例のように,XMLで必要となる基本的なエスケープ文字も含むようにしなければならない.

"Entities"->{
"&"->"&amp;",
"<"->"&lt;",
">"->"&gt;",
"\""->"&quot;",
"'"->"&apos;",
"h"->"&lowerCaseH;"
}

"Entities"に何らかの値を指定したら,適切な実体の宣言が確実に含まれるようにする.例えば"HTML"と設定すると,HTMLの実体を持つXMLが簡単に生成できる.

アイスランド文字「thorn」が,対応する文字の実体参照としてエキスポートされる.
ここでは実体が宣言されていないため,そのまま出力される.

"NamespacePrefixes"

このオプションを使うと,特定の名前空間宣言と名前空間接頭辞を含むXMLマークアップが生成できる.オプションは"NamespacePrefixes"->{url->prefix}という形式で指定する.

"NamespacePrefix"を使って,各MathML要素がMathML名前空間に関連付けられた名前空間接頭辞"mml"を持つ,表示マークアップを生成する.

"PrefixCreation"

このオプションは,名前空間が関連付けられているけれども記号的なXMLに名前空間宣言が含まれていないタグのエキスポートの際に,自動的に名前空間宣言を生成するかどうかを指定するものである.

オプション
動作
"PrefixCreation"True名前空間接頭辞を持つが,それに対応する名前空間宣言を持たない要素について,常に名前空間宣言を生成する
Falseどの要素についても名前空間宣言を生成しない
AutomaticURLの形式で名前空間接頭辞を持つ要素について名前空間宣言を生成する

"PrefixCreation"の値

記号的なXMLの例.
"PrefixCreation"->"True"という設定では,生成された名前空間接頭辞はnsiという形式を取る.ここで i は0から始まって,他の名前空間が必要となるたびに1ずつ増加していく指数である.
"PrefixCreation"->Automaticと設定すると,指定の名前空間がURLの形式を取る場合に限り,名前空間宣言が自動的に含まれる.
"PrefixCreation"->Falseと設定すると,名前空間が名前空間接頭辞としてそのまま使われる.

xmlns:prefix = "http://www.mydoc.net/2001/XML"という形式の名前空間宣言がないため,ここで作られたXMLにはあまり意味がない.これは,名前空間が束縛されているXMLに,フラグメントとしてXMLを埋め込むためにエキスポートする場合には望ましい動作である.