"RCSBProteinDataBank" (サービス接続)

Wolfram言語を使ってRCSB Protein Data Bank APIに接続し,生体分子構造とその特性についての広範なデータを照会する.

接続と認証

ServiceConnect["RCSBProteinDataBank"]は,RCSB Protein Data Bank APIへの接続を作成する.それまでに保存された接続が見付かった場合には,その接続が使われる.それ以外の場合には,新しい認証リクエストが起動される.

リクエスト

ServiceExecute["RCSBProteinDataBank","request",params]は,パラメータ params を使ってRCSB Protein Data Bank APIにリクエストを送る.以下は可能なリクエストである.

生体分子構造

リクエスト:

"BioMolecule" RCSB Protein Data BankからBioMolecule構造を取得する

パラメータ:
  • "PDBStructureID"NonePDB構造ID
  • データ

    リクエスト:

    "EntryData" RCSB Protein Data Bankからの構造ファイルにある関連データをDatasetとして取得する

    パラメータ:
  • "PDBStructureID"NonePDB構造ID
  • リクエスト:

    "ChemicalComponentData" RCSB Protein Data Bankに存在する残基に関する関連情報を取得する

    パラメータ:
  • "ComponentID"None残基の化学ID
  • PDB ID

    リクエスト:

    "TextSearch" 簡単なテキストのクエリを使って関連するPDB IDをRCSB PDBから取得する

    パラメータ:
  • "Query"None検索クエリ
    "StartIndex"1出力構造の開始インデックス
    MaxItems10出力構造の総数
  • リクエスト:

    "SequenceSearch" BioSequenceを使って関連するPDB IDをRCSB PDBから取得する

    パラメータ:
  • "BioSequence"None検索する配列
    "MinimumOverlapFraction"None2つの配列間の重複の最小割合
    "StartIndex"1出力構造の開始インデックス
    MaxItems10出力構造の総数
  • リクエスト:

    "SequenceMotifSearch" 配列モチーフを検索することで関連するPDB IDをRCSB PDBから取得する

    パラメータ:
  • "Motif"None検索モチーフ.文字列またBioSequenceオブジェクト
    "PatternType"None入力モチーフタイプ
    "SequenceType"None配列モチーフタイプ
    "StartIndex"1出力構造の開始インデックス
    MaxItems10出力構造の総数
  • パラメータの詳細

    次は,リクエスト"SequenceMotifSearch""PatternType"の可能な値である.
  • "Simple"単純な式
    "Regex"正規表現
    "Prosite"Prosite式
  • 次は,リクエスト"SequenceMotifSearch""SequenceType"の可能な値である.
  • "Protein"タンパク質配列
    "DNA"DNA配列
    "RNA"RNA配列
  • リクエスト"SequenceMotifSearch""Motif"の値が配列の場合,"PatternType"によっては以下の慣習が使われる.
  • "X"タンパク質,DNAあるいはRNAの任意の1文字コード
    "{P}""P" ("Pro")以外の任意のアミノ酸
    "[ST]""S" ("Ser")または"T" ("Thr")のいずれか
    "X(2)""XX"に等しい
    "X(2,4)""XX","XXX","XXXX"のいずれか
    "C-{S}-C-X(2)-[LIVMYFWC]""Prosite"形式の例
    "C{S}CXX[LIVMYFWC]""Regex"形式の例
    "CXCXXL""Simple"形式の例
  • 例題

      (7)

    新規接続を確立する:

    ExternalIdentifierを介してPDB IDを与えることでBioMoleculeオブジェクトを取得する:

    BioMoleculeを可視化する:

    構造ファイルのデータを取得する:

    RCSB PDBに存在する分子についての関連情報を取得する:

    簡単なテキストによるクエリを使ってRCSB PDBからの構造を検索する:

    構造の一つを可視化する:

    "StartIndex"およびMaxItemsパラメータから始まる指定された数の構造を取得する:

    BioSequenceを使ってRCSB PDBの構造を検索する:

    最初の構造のBioSequence

    この配列を参照配列と並べる:

    上記リストのString要素は配列の共通部分である.出力のリスト要素は,不一致,挿入,削除のいずれかである.リストの最初の要素は最初の配列に対応し,2番目の要素は2番目の配列に対応する.配列がどの程度共通しているかを見てみる:

    2つの配列はほぼ99%重なっている.

    "BioSequence"は"RNA"または"DNA"でもよい:

    構造を可視化する:

    "DNA"配列を検索する:

    構造を可視化する:

    ジンクフィンガー配列のモチーフを含む構造を検索する:

    検索の最初の要素の構造を可視化する.亜鉛が紫になっている:

    "Motif"BioSequenceも受容する:

    "DNA"モチーフや"RNA"モチーフも検索できる:

    検索の最初の要素の構造を可視化する:

    RNA配列モチーフについて検索する:

    検索の最初の要素の構造を可視化する: