"ESMAtlas" (サービス接続)

Wolfram言語を使ってESMAtlas APIに接続し,ESMFoldによって予測されるタンパク質構造についての情報を取得する.

接続と認証

ServiceConnect["ESMAtlas"]は,ESMAtlas APIへの接続を確立する.それまでに保存された接続が見付かった場合は,それが使われる.それ以外の場合は,新たな認証リクエストが起動される.

リクエスト

ServiceExecute["ESMAtlas","request",params]は,パラメータ params を使ってESMAtlas APIにリクエストを送る.次は使用可能なリクエストである.

生体分子構造

リクエスト:

"FoldSequence" ペプチド配列の3D座標を生成する

パラメータ:
  • "BioSequence"None折りたたむ配列,BioSequenceまたは文字列
  • リクエスト:

    "PredictedStructure" 生体分子の"MGnifyID"を提供することで,BioMoleculeの予測される構造をESM Metagenomic Atlasから取得する

    パラメータ:
  • "MGnifyID"None予測される構造のMGnifyID
  • 予測される構造の特性

    リクエスト:

    "StructureConfidencePrediction" シーケンスの3D埋込みの背後にある信頼性を示す値を含むデータ集合を取得する

    パラメータ:
  • "MGnifyID"None予測される構造のMGnifyID
  • リクエスト:

    "Sequence" "MGnifyID"を使って生体分子のBioSequenceをESM Metagenomic Atlasから返す

    パラメータ:
  • "MGnifyID"None予測される構造のMGnifyID
  • リクエスト:

    "SequenceEmbedding" ESM2モデルの最終層のアクティベーションを列の長さについて平均化した後で,2560次元の埋込みベクトルを返す

    パラメータ:
  • "MGnifyID"None予測される構造のMGnifyID
  • 例題

      (5)

    認証ダイアログを立ち上げて新規接続を確立する:

    長さ400残基以下のBioSequenceを折りたたんで予測されるBioMolecule構造を取得する:

    BioMoleculeの構造を可視化する:

    生体分子の "MGnifyID"を与えることで,ESM Metagenomic Atlasからの予測される構造の予測される構造を取得する:

    データベースから取得した構造を可視化する:

    ESM Metagenomic Atlas中の構造に関するさまざまな予測値を取得する:

    信頼データは以下のキーを含む.

  • "PredictedAlignedError"予測構造内の2つの残基の相対的な位置に対する予測モデルの信頼性の測度
    "PredictedLocalDistanceDifferenceTest"個々の残基レベルにおけるモデルの信頼性を示す,局所的信頼性の測度
    "PredictedTemplateModelingScore"タンパク質の大域的確度を測定するテンプレートのモデリングスコアから導かれるが,これはかなりの程度まで予測の局所的な不正確さからは独立している
  • 予測の信頼性を可視化する:

    予測されるアラインメントエラーを可視化する.これは,予測モデルが予測構造内の2つの残基の相対的な位置についてどの程度信頼しているかを示す尺度である.尺度はオングストロームで,値が大きいほど信頼性が低くなる:

    生体分子のMGnifyID" を使って,ESM Metagenomic Atlasから生体分子のBioSequenceを取得する:

    "MGnifyID"を使用して特定のタンパク質の配列長に渡ってESM2モデルの最終層のアクティベーションを平均化した後,埋込みベクトルを取得する: