PDB (.pdb)

MIMEタイプ:chemical/x-pdb
Protein Data BankのPDBファイル.
3次元分子模型のファイル.
生物情報学のアプリケーション内やWeb上で,分子模型を保持したり,交換したりするのに使用される.
PDBはProtein Data Bank(タンパク質データバンク)の頭字語である.
プレーンテキスト形式.
タンパク質や核酸等の大きな生体分子の構造情報を保持する.
化学結合の情報は保持しない.
1971年にBrookhaven National Laboratoryで開発された.
Research Collaboratory for Structural Bioinformatics (RCSB)で管理されている.
  • Importは2.3以前のバージョンのPDB形式に加えて,いくつかのよくある変異形もサポートする.

ImportとExportImportとExport

  • Import["file.pdb"]はPDBファイルを読み取り,タンパク質の定型化したレンダリングを返す.
  • Wolfram言語は高分子のためのさまざまな3次元レンダリングスタイルを提供する.
  • Export["file.pdb",expr]は分子の3D模型からPDFファイルを作成する.
  • Import["file.pdb"]Graphics3Dオブジェクトを返す.
  • Import["file.pdb",elem] は指定された要素をPDBファイルからインポートする.
  • Import["file.pdb",{elem,suba,subb,}]は子要素をインポートする.
  • Import["file.pdb",{{elem1,elem2,}}]は複数の要素をインポートする.
  • インポートの形式は Import["file","PDB"] あるいは Import["file",{"PDB",elem,}]で指定することができる.
  • Export["file.pdb",{elem1->expr1,elem2->expr2,}]はエキスポートする要素を規則を使って指定する.
  • ImportExportについての完全な一般情報は関数ページを参照のこと.
  • ImportStringExportStringはPDB形式をサポートする.

要素要素

  • 一般的なImport要素:
  • "Elements"ファイル中の有効な要素とオプションのリスト
    "Rules"それぞれの要素とオプションの規則の完全リスト
    "Options"オプション,属性,設定の規則のリスト
  • Exportはデフォルトでは要素を使用する.
  • グラフィックス要素:
  • "Graphics3D"Graphics3Dオブジェクトとして描画されるPDBファイル
  • Import要素をデフォルトでPDB形式に使う.
  • データ表現要素:
  • "AdditionalAtoms"鎖の構成要素ではない原子
    "AdditionalCoordinates"付加原子の3D座標
    "AdditionalIndex"VertexCoordinatesの追加の原子の指標
    "AdditionalResidues"3文字短縮形の配列として与えられる追加的な残基列
    "ResidueAtoms"残留原子のリスト
    "ResidueChainLabels"鎖ラベルのリスト
    "ResidueCoordinates"残留原子の3D座標
    "ResidueIndex"VertexCoordinatesの残留原子の指標
    "ResidueRoles"残留原子の機能的役割
    "Residues"3文字短縮形の配列として与えられる残基列
    "Resolution"模型座標の空間分解能(ピコメーターで)
    "SecondaryStructure"鎖の大規模な構造を表現する規則
    "Sequence"文字列のリストとして与えられる残基列
    "VertexCoordinates"原子座標(通常ピコメーターで与えられる)
    "VertexTypes"分子を構成しているすべての原子あるいはグループ(通常化学要素の短縮形のリストで与えられる)
  • 1つかそれ以上の残基が欠けている不完全な鎖をPDBから読み取る場合は,Wolfram言語はそれを個々の部分鎖の列として表示する.
  • Wolfram言語はアミノ酸残基に標準のIUB/IUPAC短縮形を使う:
  • Aアラニン (Ala)
    Cシステイン (Cys)
    Dアスパラギン酸 (Asp)
    Eグルタミン酸 (Glu)
    Fフェニルアラニン (Phe)
    Gグリシン (Gly)
    Hヒスチジン (His)
    Iイソロイシン (Ile)
    Kリジン (Lys)
    Lロイシン (Leu)
    Mメチオニン (Met)
    Nアスパラギン (Asn)
    Pプロリン (Pro)
    Qグルタミン (Gln)
    Rアルギニン (Arg)
    Sセリン (Ser)
    Tトレオニン (Thr)
    Vバリン (Val)
    Wトリプトファン (Trp)
    Yチロシン (Tyr)
    X詳細不明あるいは未知のアミノ酸 (Unk)
  • 以下の短縮形は核酸を表示するのに使われる:
  • Aアデノシン
    Cシチジン
    Gグアノシン
    Iイノシン
    Tチミジン
    Uウリジン
    X詳細不明あるいは未知の核酸
  • 同じ分子の複数3次元模型を表現するPDBファイルをインポートする場合には,すべての模型の形状を読み取るのに次のImport要素を使うことができる:
  • "ResidueCoordinatesList"それぞれの模型についての残基座標
    "AdditionalCoordinatesList"それぞれの模型についての付加原子の3次元座標
    "VertexCoordinatesList"それぞれの模型についての原子座標(通常ピコメーターで与えられる)
  • メタ情報要素:
  • "Author"ファイルで参照される著者情報
    "Comments"ファイル内に保持されたユーザのコメント(文字列のリストとしてあたえられる)
    "DepositionDate"いつファイルがデータベースに加えられたか
    "Organism"タンパク質が起る有機体
    "PDBClassification"ファイルヘッダからのPDB分類
    "PDBIDPDBの構造識別文字列
    "References"書誌参照(規則のリストとして与えられる)
    "Title"ドキュメントタイトル

オプションオプション

  • 一般的なレンダリングオプション:
  • ImageSizeAutomatic表示するグラフィックスの全体的な大きさを指定する
    BackgroundWhiteどの背景色を使うかを指定する
    ColorFunctionAutomatic二次構造の可視化の色付けを決定するために適用する関数
    ViewPointAutomatic3次元模型を見る空間内の視点
  • デフォルト設定のViewPoint->Automaticで,Wolfram言語はインポートされた分子模型を見るのに最適な角度を自動的に計算する.
  • レンダリングスタイルを選択する:
  • "Rendering""Structure"可視化メソッドを指定する
  • に可能な設定:
  • "BallAndStick"原子と結合を玉と棒の模型として表示する
    "Structure"タンパク質骨格の定型化されたレンダリング
    "Spacefilling"重なり合う球として表示された原子
    "Wireframe"線として描画された結合

例題例題すべて開くすべて閉じる

  (5)  (5)

大きなPDBファイルをRCSB Protein Data BankのWebサイトからインポートする:

In[1]:=
Click for copyable input
Out[1]=

このPDBファイルのタイトルを得る:

In[2]:=
Click for copyable input
Out[2]=

上記の分子でそれぞれの鎖のラベルをインポートする:

In[3]:=
Click for copyable input
Out[3]=

より小さなサンプルファイル内で使用可能なImport 要素を示す:

In[1]:=
Click for copyable input
Out[1]=

このファイルで参照される有機体の名前を得る:

In[2]:=
Click for copyable input
Out[2]=

このファイルから書誌参照をインポートする:

In[3]:=
Click for copyable input
Out[3]=

残基列をインポートする:

In[4]:=
Click for copyable input
Out[4]=

以下は同じ列を1文字の短縮形の文字列として返す:

In[5]:=
Click for copyable input
Out[5]=

この分子に関する構造情報を得る:

In[6]:=
Click for copyable input
Out[6]=

定型化された形でタンパク質骨格を示す:

In[7]:=
Click for copyable input
Out[7]=

それぞれの残基について標準色を使って,同じタンパク質を示す:

In[8]:=
Click for copyable input
Out[8]=

以下ではサンプルファイルを玉と棒のグラフィックスでインポートする:

In[9]:=
Click for copyable input
Out[9]=

同じタンパク質をワイヤフレーム模型で示す:

In[10]:=
Click for copyable input
Out[10]=

残基データをインポートする:

In[11]:=
Click for copyable input
Out[11]=

以下ではサンプルファイルをインポートして,原子を空間充填の球体として描画する:

In[12]:=
Click for copyable input
Out[12]=

DNA模型をインポートする:

In[1]:=
Click for copyable input
Out[1]=

このファイルからRNAとDNAの配列をインポートする:

In[2]:=
Click for copyable input
Out[2]=
In[3]:=
Click for copyable input
Out[3]=

PDBファイルからすべてのデータを読み込み,それをPDBにもう一度エキスポートする:

In[1]:=
Click for copyable input
In[2]:=
Click for copyable input
Out[2]=

MOLファイルから簡単な3D模型をインポートしてそれをPDBにエキスポートする:

In[1]:=
Click for copyable input
Out[1]=
In[2]:=
Click for copyable input
Out[2]=

結果のPDBファイルを3Dグラフィックスとしてインポートする:

In[3]:=
Click for copyable input
Out[3]=
2007年に導入
(6.0)
| 2014年に修正
(10.0)