MathMLを使う

はじめに

MathMLはXMLベースのマークアップ言語で,数式を表記するためのものである.これはW3Cによって開発されたもので,これにより,Webページ上で数式を効果的に表示できるようになり,アプリケーション間での数学的内容の転送・再利用も容易になった.最大の利点は,数学的表記における意味と外観の両方の情報がコード化できるということである.そのため,MathMLは数学的情報を保管し,交換するための理想的なデータ形式となる.例えば,MathML式はWebページからコピーし,評価のために直接Wolfram言語のようなアプリケーションにペーストできる.

MathMLは数学的表記の一般的で広く受け入れられている標準として,多くの面白く便利なアプリケーションの基礎となる.MathMLを使うと,例えばインタラクティブな式を掲載したダイナミックな数式Webサイトを作成したり,内容の検索・索引の作成・アーカイブが簡単にできる技術文書のデータベースを作ったり,数式の音声出力ができる音声合成ソフトウェアを開発したりできる.

MathMLは1998年に初めてリリースされて以来,産業界・学術界の両方の幅広い支援を受け,急速に人気が高まった.現在では最新のWebブラウザで直接,または無料のプラグインを使用してMathML式を見ることができる.MathMLの著作,閲覧,処理のためのツールが増えるに従い,その重要性は増していくばかりであると考えられる.

Wolfram ResearchはMathMLの開発における主要メンバーであり,この重要なWeb技術のサポートに力を注いでいる.Wolfram言語はこの言語の最新バージョンであるMathML 2.0を完全にサポートしている.MathML式をWolfram言語ノートブックにインポートして評価したり,式をノートブックからMathMLにエキスポートして,HTMLにペーストしたりすることができる.MathMLとボックスの間の変換のためのいくつかのカーネルコマンドや,Wolfram言語が数式を表すために使う式もある.

MathMLのシンタックス

概要

MathMLはXMLアプリケーションであるので,MathMLのシンタックス規則はXML規格で定められている.各MathML式はHTMLと同様に,アングルブラケットのシンタックスで書かれた一連の要素で構成されている.各要素は複数の属性を持つことができる.使用できる要素と属性はMathML DTDで定められている.

すべてのMathML要素は,インターフェース要素,表示要素,内容要素の3つのカテゴリに分類できる.

最上位のmath要素等のインターフェース要素は,MathML式をどのようにXMLドキュメントに組み込むかを指定するものである.

表示要素は,数式の視覚的二次元構造についての情報をコード化する.例えばmrowmfracmsqrtmsub要素はそれぞれ行,分数,平方根,下付き文字を表している.

内容要素は数式の論理的意味の情報をコード化する.例えばplussin はそれぞれ加算関数と三角法の正弦関数を表しており,applyは関数を適用する操作を表している.

与えられた式は,MathMLではいくつかの異なる方法で表すことができる.

  • 表示MathML表示要素のみ.数式を表示することのみが重要である状況,例えば閲覧のみを目的としたWebページに数式を掲載する場合等に便利.
  • 内容MathML内容要素のみ.これは数学的意味をコード化することが重要である状況で便利.例えば,読者がコピーしてWolfram言語にペーストして評価できるようにWebページに数式を掲載するときに使用できる.
    • 複合マークアップ内容および表示要素の組合せ.数式の外観と意味をコード化したい場合に使われる.例えば,一般的な数式構成の非標準的な記述を指定したり,通常は異なる意味を持つ記述にある特定の数学的意味を割り当てたりするときに使うことができる.

    Wolfram言語を使うと,どのような式に対しても表示,内容,複合マークアップが生成できる.

表示MathML

表示MathMLは約30の要素と50の属性で構成されており,数式の視覚的二次元構造をコード化する.例えばWolfram言語のタイプセット式は,MathMLでは次のように表現される.

式全体はmath要素で囲まれている.これはMathMLマークアップのすべてのインスタンスに対するルート要素でなければならない.この他に以下のような表示要素を使っている.

  • mrowその行にあるサブ要素を表示する
  • mi関数名や変数名等の識別子を表す
  • mo演算子や区切り記号を表す
    • mn数値を表す

    識別子,演算子,数値は,それぞれがフォント,空白等について異なるタイプセット変換を行うので,それぞれ別の要素で表される.例えば,変数は通常斜体で,数値は標準フォントで,演算子は接頭辞,接尾辞,挿入辞のどこに現れるかによってその周りに空白を伴って表示される.

    mimnmo要素に加え,分数,平方根,下付き文字,上付き文字,行列等の一般的な表記構造に対応する表示要素もある.どのような式も構成部分に分解し,各表記構成を対応する表示要素に置き換えることで表現できる.例えば,タイプセット式は,MathMLでは以下のように表される.

    ここでmfracmsqrtmsupはそれぞれ分数,平方根,上付き文字を表している.これらの各要素は固定数の子要素を取る.子要素の位置は特定の意味を表す.これらの子要素は引数と呼ばれる.例えば,mfracmsup要素は,以下のシンタックスに従って両方とも2つの引数を取る.

<mfrac> numerator denominator </mfrac>

<msup> base superscript </msup>

mrow要素はその行に現れる他の要素を囲むために使われる.例えば,タイプセット式 はMathMLでは次のように表される.

ここで,積分の範囲は表示要素msubsupを使って表されている.この要素は以下のシンタックスに従って3つの引数を取る.

<msubsup> base subscript superscript </msubsup>

この他に注意すべきことは,積分記号,指数文字,微分記号dを表すシンボルは,それぞれ文字実体&int;&exp;&dd;を使って表されているということである.これらはMathML DTDで定められている約2000個の特殊シンボルの一部である.これらはUnicode文字コードを使う名前付き実体参照や文字実体参照を使ってドキュメントに含むことができる.

mstyle要素はスタイルを式に適用するために使われている.mstyle要素で指定された属性はすべて,その子要素にも適用される.この要素を使用して,以下の例のように式のフォントサイズや色等の属性を指定することができる.乗算には実体&InvisibleTimes;が使われる.

例題は,要素の例を使って,表示マークアップがどのように動作するかを示すことだけを意図したものである.すべての表示要素と属性のリストは, http://www.w3.org/TR/MathML2/でMathML仕様書を参照のこと.

内容MathML

内容MathMLは約140の要素と12の属性で構成されており,数式の論理的意味をコード化する.内容要素cicnはそれぞれ識別子と数値を表すのに使われる.これらは表示マークアップにおけるmimn要素に似ている.例えばタイプセット式 は,内容MathMLでは次のように表現される.

apply要素は,式に演算子や関数を適用するために使われる.apply要素の第1引数は,通常は演算子や関数を表す空要素である.残りの引数は第1引数を適用する1つまたは複数の式である.この例では,apply関数の第1引数は加算を表す空要素plusである.

cntype属性はコード化された数のタイプを表す.これはrealintegerrationalcomplex-polarcomplex-cartesianconstantのいずれかの値を取る.次の例のように,空要素sepは分数の分子と分母や,複素数の実部と虚部等,数値の異なる部分を区別するために使われる.

内容要素の多くは,特定の演算子や関数を表す空要素である.さまざまな要素が数学に関する特定の基本的な分野に従って名付けられたグループに分けられる.

  • 算数,代数,論理式
  • 初等関数
  • 微積分
  • 線形代数
  • 数列と級数
  • 集合論
    • 統計学

    高校の数学に現れるほとんどの演算子や関数に対応する要素がある.例えば基本的な算数演算子はplusminustimesdividepowerで表される.

    積分はint要素で表される.積分の変数はbvar要素を使って表される.積分の上限・下限はそれぞれ要素uplimitおよびlowlimitを使って表される.

    interval要素は開区間,閉区間を表すのに使われる.これは属性closureを取る.closureは可能な4つのタイプの区間を表すclosedopenclosed-openopen-closedのいずれかを取ることができる.closureのデフォルトの値はclosedである.

    uplimitlowlimitを使う代りに,interval要素を使って定積分の区間を指定することもできる.

    matrixおよびmatrixrow要素は,それぞれ行列と行列の行を表すのに使われる.eq要素は等価を表す.

    例題は,代表的な要素の例を使って,内容マークアップがどのように動作するかを示すことだけを意図したものである.すべての内容要素と属性のリストは,http://www.w3.org/TR/MathML2/でMathML仕様書を参照のこと.

MathMLのインポート

MathML式は以下の2通りの方法でWolfram言語にインポートできる.

  • MathML式をWebブラウザ等の他のアプリケーションでコピーし,直接ノートブックにペーストする.正しいMathML式をノートブックにペーストすると,Wolfram言語はマークアップをそのままペーストするか,あるいは解釈してペーストするかを尋ねる.マークアップを解釈するように選択すると式は自動的にWolfram言語式に変換される.
    • インポート形式を"MathML"としてImportコマンドを使う.
    In[381]:=
    Click for copyable input
    Out[381]=
    デフォルトでは,MathMLマークアップはWolfram言語のボックス式としてインポートされる.ToExpressionコマンドを使うと,ボックスを式に変換できる.
    In[382]:=
    Click for copyable input
    Out[382]=

MathMLインポートオプション

標準のImportオプションを使うと,インポート処理がより詳細に制御できる.変換オプションを指定するシンタックスは以下の通りである.

Import[file,expr,"MathML",option1->value1,option2->value2,]

MathMLの生成

Wolfram言語には,Wolfram言語で数式を表すために内部的に使われているボックスや式からMathMLを生成するための,いくつかの関数が含まれている.ノートブックにパレット,メニュー,キーボードショートカットを使って数式を入力し,これらの変換関数の1つを使ってMathMLに変換することができる.すべてのMathML変換関数は コンテキストに置かれている.

ボックス構造からMathMLを生成するためには,ExportStringを使う.デフォルトでは,これは表示マークアップのみ生成する.
In[383]:=
Click for copyable input
Out[383]=
ノートブックのタイプセット式をMathMLに変換するためにはExportStringを使う.デフォルトではこれは表示MathMLを生成する.
In[384]:=
Click for copyable input
Out[384]=
"Content"->True要素に囲まれた表示,内容MathMLを生成する.
In[385]:=
Click for copyable input
Out[385]=

annotation-xml要素は,コード化属性で指定されるタイプについての追加情報を有している.ここでは,コード化属性は"MathML-Content"という値を持っており,これはannotation-xml要素が内容MathMLを含んでいることを示している.

表示MathMLまたは内容MathMLだけを生成するためにはまたはを使う.ヘッダ情報を出力しないようにするには,と設定する.
In[386]:=
Click for copyable input
Out[386]=

ExportStringは,第1引数をMathMLに変換する前にまず評価する.評価の際に簡約できる式を与えると,期待とは異なる結果が返ってくることがある.

以下の定積分の表示マークアップを生成する.
In[387]:=
Click for copyable input
Out[387]=
積分の結果は1となるため,以下のコマンドは積分ではなく1のMathML表現を生成する.
In[388]:=
Click for copyable input
Out[388]=
積分のMathML表現を得るためには,積分の周りをUnevaluated関数で囲んで,積分が評価されないようにする.
In[389]:=
Click for copyable input
Out[389]=

オプションの設定

ExportExportStringはオプションを取る.

これらのオプションを使うと,生成されるMathMLにXML宣言やDTD宣言を含んだり,表示マークアップ,内容マークアップ,またはその両方を生成したり,明示的な名前空間宣言と名前空間接頭辞を含んだり等,さまざまな機能を制御することができる.

MathML関数を評価するたびにこれらのオプションを指定することができる.またはSetOptionsを使って,特定の関数のオプションのデフォルト値を変更することもできる.デフォルト値を変更すると,その関数のその後の評価の際にはこのオプション値が使われる.

MathMLのエキスポート

はじめに

適切にフォーマットされた数式を作り,MathMLに変換してWebで表示するには,Wolfram言語の高度なタイプセット機能を使う.Wolfram言語ノートブックの数式をMathMLにエキスポートするには,いくつかの方法がある.

  • 編集 形式を選択してコピー MathMLにより,選択された式がMathML形式でクリップボードにコピーされる.これはノートブックから特定の数式をコピーしてHTMLドキュメントにペーストするときに便利である.
  • ファイル 別名で保存ファイルの種類サブメニューからXML XHTML+MathML (*.xml)を選ぶ.これはノートブック全体をXHTMLに変換し,その際,ノートブックに含まれる数式をすべてMathMLとして保存する.数式はMathMLの「データアイランド」としてXHTMLファイルに埋め込まれる.これは直接,または特別なプラグインを使用してWebブラウザに表示できる.
    • エキスポート形式を "MathML"として,またはファイルの拡張子としてを付けてExportString関数を使う.
    In[390]:=
    Click for copyable input
    Out[390]=
    In[391]:=
    Click for copyable input
    Out[391]=

    出力にはsemantics要素で囲まれた表示マークアップと内容マークアップの両方を含まれる.の値を変更すると,表示マークアップ,内容マークアップのどちらかだけで生成することもできる.囲まれている要素の名前空間に関する情報を与えるために,xmlns属性が最上位のmath要素に加えられる.

MathMLエキスポートオプション

Export関数またはExportString関数の標準オプションを使うと,エキスポート処理がより詳細に制御できる.変換オプションを指定するシンタックスは以下の通りである.

Export[file,expr,"MathML",option1->value1,option2->value2,]

ExportString[expr,"MathML",option1->value1,option2->value2,].

オプションは出力としてMathMLを生成するどの関数の中でも直接指定することができる.

XML`MathML`ExpressionToMathML[expr,"MathML",option1->value1,option1->value1,].

MathMLとしてのエキスポートには,一般のXMLドキュメントのエキスポートに使用できるExportオプションのいずれでも使うことができる.

    これらに加え,特にMathMLのエキスポートに使用するためのオプションがある.

  • 表示MathMLをエキスポートするかどうかを制御する
  • 内容MathMをエキスポートするかどうかを制御する
  • 注釈として式のWolfram言語エンコードを含むかどうかを指定しする
  • MathML式のルートタグに追加の属性を挿入する
  • 各MathML要素に名前空間接頭辞を含むかどうかを指定する

"Annotations"

このオプションはどの注釈をMathML出力に含めるかを制御するものである.値は要素がのいずれかの値を取るリストである.リスト中の要素はどのような順序でも構わない.

XMLDeclaration

注釈のひとつにが含まれている場合,XML宣言<?xml version="1.0"?>がヘッダに含まれる.

In[392]:=
Click for copyable input
Out[392]=
In[393]:=
Click for copyable input
Out[393]=

DOCTYPEDeclaration

注釈のひとつにが含まれている場合,<!DOCTYPE ...>という形式のXMLドキュメントタイプ宣言がヘッダに含まれる.この文は,出力が書き出されるXMLアプリケーションのDTDを指定する.

In[394]:=
Click for copyable input
Out[394]=

DocumentHeader

と設定すると,XML宣言とMathML DTDのドキュメントタイプ宣言を含むヘッダが自動的に出力に加えられる.

In[395]:=
Click for copyable input
Out[395]=

を含まない場合は,MathMLはヘッダを持たない.これは等の他の要素を含んでいる場合でも成り立つ.

In[396]:=
Click for copyable input
Out[396]=

"Presentation" と"Content"

これらのオプションはどのタイプのMathMLマークアップを生成するかを制御する.デフォルトの設定は"Presentation"->True"Content"->Falseである.

表示MathMLのみエキスポートする.
In[397]:=
Click for copyable input
Out[397]=
内容MathMLのみエキスポートする.
In[398]:=
Click for copyable input
Out[398]=

"IncludeMarkupAnnotations"

このオプションは,MathMLに明らかには対応するものがないWolfram言語特有の構造を取る式のエキスポートの際に,付加的な注釈を加えるかどうかを指定するものである.

オプション
動作
"IncludeMarkupAnnotations"TrueMathematica 特有の情報が別の注釈要素に加えられる (デフォルト)
False付加的な注釈要素は加えられない

の値

"IncludeMarkupAnnotations"->Trueでは,Wolfram言語注釈はsemantics要素に囲まれる.これにより,損失なくWolfram言語に戻すことができる.

Wolfram言語の特殊文字「」は,Unicodeには対応する文字がない(Unicodeの右矢印は似ているように見えるが,コードポイントが異なる).「」をエキスポートするとき,付加的な注釈がマークアップに加えられる.
In[399]:=
Click for copyable input
Out[399]=
"IncludeMarkupAnnotations"->Falseという設定では,付加的な注釈は加えられない.
In[400]:=
Click for copyable input
Out[400]=

"MathAttributes"

このオプションを使うと,MathML式のルート要素に属性を加えることができる.このオプションのシンタックスはという形である.

MathMLをエキスポートし,インライン形式で表示するように指定する.
In[401]:=
Click for copyable input
Out[401]=
MathML式を表示形式でエキスポートする.
In[402]:=
Click for copyable input
Out[402]=

"UseUnicodePlane1Characters"

このオプションは,文字がUnicodeの1面に属する文字を0面の同様の文字に置き換えるかどうかを指定するものである.現時点では多くのブラウザで1面の文字を適切に表示することができないため,このオプションが役立つであろう.

オプション
動作
"UseUnicodePlane1Characters"TrueUnicodeの1面に属する特殊文字を置換せずにエキスポートする (デフォルト)
FalseUnicodeの1面に属する特殊文字のエキスポートの際に,0面の文字に置き換え,属性を加える

の値

Trueに設定すると,Unicodeの1面に属する特殊文字(ゴシック文字,スクリプト文字,2重文字等)は1面の数値的文字コードで書き出される.
In[403]:=
Click for copyable input
Out[403]=
Falseに設定すると,Unicodeの1面に属する特殊文字はすべて,それに対応する0面の文字で置き換えられ,mathvariant属性に適切な値が指定される.
In[404]:=
Click for copyable input
Out[404]=

MathML要素のシンボル

MathML中の内容要素には,Wolfram言語内に直接的な類似形がないものもあるため,コンテキストではいくつかのシンボルが特別に定義されている.

シンボルと,そのそれぞれが表すMathMLマークアップ.
これらのシンボルを使ったいくつかの例.これらはすべて従来のタイプセット形式を持つ.
In[406]:=
Click for copyable input
Out[406]=
In[407]:=
Click for copyable input
Out[407]=
In[408]:=
Click for copyable input
Out[408]=
In[409]:=
Click for copyable input
Out[409]=