"RCSBProteinDataBank" (サービス接続)
Wolfram言語を使ってRCSB Protein Data Bank APIに接続し,生体分子構造とその特性についての広範なデータを照会する.
接続と認証
リクエスト
生体分子構造
"BioMolecule" — RCSB Protein Data BankからBioMolecule構造を取得する
"PDBStructureID" | None | PDB構造ID |
データ
"EntryData" — RCSB Protein Data Bankからの構造ファイルにある関連データをDatasetとして取得する
"PDBStructureID" | None | PDB構造ID |
"ChemicalComponentData" — RCSB Protein Data Bankに存在する残基に関する関連情報を取得する
"ComponentID" | None | 残基の化学ID |
PDB ID
"TextSearch" — 簡単なテキストのクエリを使って関連するPDB IDをRCSB PDBから取得する
"Query" | None | 検索クエリ | |
"StartIndex" | 1 | 出力構造の開始インデックス | |
MaxItems | 10 | 出力構造の総数 |
"SequenceSearch" — BioSequenceを使って関連するPDB IDをRCSB PDBから取得する
"BioSequence" | None | 検索する配列 | |
"MinimumOverlapFraction" | None | 2つの配列間の重複の最小割合 | |
"StartIndex" | 1 | 出力構造の開始インデックス | |
MaxItems | 10 | 出力構造の総数 |
"SequenceMotifSearch" — 配列モチーフを検索することで関連するPDB IDをRCSB PDBから取得する
"Motif" | None | 検索モチーフ.文字列またBioSequenceオブジェクト | |
"PatternType" | None | 入力モチーフタイプ | |
"SequenceType" | None | 配列モチーフタイプ | |
"StartIndex" | 1 | 出力構造の開始インデックス | |
MaxItems | 10 | 出力構造の総数 |
パラメータの詳細
"Simple" | 単純な式 | |
"Regex" | 正規表現 | |
"Prosite" | Prosite式 |
"Protein" | タンパク質配列 | |
"DNA" | DNA配列 | |
"RNA" | RNA配列 |
"X" | タンパク質,DNAあるいはRNAの任意の1文字コード | |
"{P}" | "P" ("Pro")以外の任意のアミノ酸 | |
"[ST]" | "S" ("Ser")または"T" ("Thr")のいずれか | |
"X(2)" | "XX"に等しい | |
"X(2,4)" | "XX","XXX","XXXX"のいずれか | |
"C-{S}-C-X(2)-[LIVMYFWC]" | "Prosite"形式の例 | |
"C{S}CXX[LIVMYFWC]" | "Regex"形式の例 | |
"CXCXXL" | "Simple"形式の例 |
例題
例 (7)
ExternalIdentifierを介してPDB IDを与えることでBioMoleculeオブジェクトを取得する:
BioMoleculeを可視化する:
RCSB PDBに存在する分子についての関連情報を取得する:
簡単なテキストによるクエリを使ってRCSB PDBからの構造を検索する:
"StartIndex"およびMaxItemsパラメータから始まる指定された数の構造を取得する:
BioSequenceを使ってRCSB PDBの構造を検索する:
最初の構造のBioSequence:
上記リストのString要素は配列の共通部分である.出力のリスト要素は,不一致,挿入,削除のいずれかである.リストの最初の要素は最初の配列に対応し,2番目の要素は2番目の配列に対応する.配列がどの程度共通しているかを見てみる:
"BioSequence"は"RNA"または"DNA"でもよい:
"Motif"はBioSequenceも受容する: