GenBank (.gb, .gbk)

  • ImportはGenBankファイル形式の全バージョンをサポートする.

予備知識予備知識

    MIMEタイプ:chemical/seq-na-genbank
    GenBank分子生物学形式.
    U.S. NCBI(National Center for Biotechnology Information;全米バイオテクノロジー情報センター)データベースのネイティブ形式.
    注釈付きDNA配列の保管と交換のための標準形式.
    テキスト形式.
    1982年にNIH GenBankプロジェクトの一部として開発された.

ImportとExportImportとExport

  • Import["file.gb"]はDNA配列あるいはタンパク質配列をGenBankファイルからインポートする.
  • Import["file.gb"]はファイル内に保持された配列を表す文字列を返す.
  • Import["file.gb",elem]は指定された要素をGenBankファイルからインポートする.
  • Import["file.gb",{elem,suba,subb,}]は子要素をインポートする.
  • Import["file.gb",{{elem1,elem2,}}]は複数の要素をインポートする.
  • インポートの形式はImport["file","GenBank"] あるいはImport["file",{"GenBank",elem,}]で指定することができる.
  • ImportExportについての完全な一般情報は関数ページを参照のこと.
  • ImportStringはGenBank形式をサポートする.

要素要素

  • 一般的なImport要素:
  • "Elements"ファイル中の有効な要素とオプションのリスト
    "Rules"それぞれの要素とオプションの規則の完全リスト
    "Options"オプション,属性,設定の規則のリスト
  • データ表現要素:
  • "Features"すべての処理注釈情報(規則のリストとして与えられる)
    "Sequence"文字列としてのDNA配列あるいはタンパク質配列
    "Plaintext"フォーマットされたテキストとしての配列
    "Reference"関連する参考文献のリスト
    "Comment"配列に関するさまざまなコメント
  • Import要素をデフォルトでGenBank形式に使う.
  • メタ情報要素:
  • "Locus"ローカスの記述
    "Definition"GenBankファイルタイトル
    "NCBIAccession"NCBI Accession Number
    "NCBIAccessionVersion"バージョン付きNCBI Accession Number
    "Accession"配列についての主要受入番号
    "GenBankID"GenBankデータベース識別子
    "Project"解読計画の名前
    "Keywords"キーワードのリスト
    "Organism"ファイルで参照されているSource Organism
    "Segment"配列セグメント(複数のGenBankファイルに分割されている場合)
    "Source"由来生物
    "Reference"書誌参照(規則のリストとして与えられる)
    "Comments"ファイルに保持されたコメント(文字列のリストとして与えられる)

例題例題すべて開くすべて閉じる

  (6)  (6)

以下はサンプルのGenBankファイルで使用可能な要素を返す:

Out[1]=

ファイルタイトル:

In[1]:=
Click for copyable input
Out[1]=

基本的なローカス情報:

In[1]:=
Click for copyable input
Out[1]=

Source Organismについての情報をインポートする:

In[1]:=
Click for copyable input
Out[1]=

Accession NumberとGenBank IDを抽出する:

In[2]:=
Click for copyable input
Out[2]=

DNA配列の最初の文字を読み取る:

In[3]:=
Click for copyable input
Out[3]=

列のテキストバージョンをインポートする:

In[1]:=
Click for copyable input
Out[1]//Short=

参考文献のリストを読み込み,最初の項目を抽出する:

In[1]:=
Click for copyable input
Out[1]=
2008年に導入
(7.0)