GenomeData

GenomeData["gene"]
给出人类参考基因组上指定基因的 DNA 序列.

GenomeData["gene","property"]
给出人类基因 gene 的指定属性值.

GenomeData[{"chr",{n1,n2}}]
给出人类参考基因组的染色体 chr 上,从位置 的序列.

更多信息更多信息

  • 基因通过诸如 等标准名称指定.
  • GenomeData[] 给出人类基因列表.
  • 人类染色体可以用 等指定,或用整数 指定.
  • GenomeData[{{"chr",+1},{n1,n2}}] 给出染色体 chr 顶链上位置 的 5' 到 3' 序列. 序列的位置是相对顶链的5' 端的.
  • GenomeData[{{"chr",-1},{m1,m2}}] 给出染色体 chr 底链上位置 的 5' 到 3' 序列. 序列的位置是相对底链的5' 端的.
  • 基因序列属性包括:
  • "FullSequence"基因的完全序列
    "FullSequencePosition"基因的起始位置和末端位置
    "SequenceLength"基因的长度(单位为碱基对)
  • 基因位置属性包括:
  • "Chromosome"基因所在的染色体
    "LocusList"列表形式基因座
    "LocusString"字符串形式的基因座
    "Orientation"向前 (5' 到 3') 或向后 (3' 到 5') 分别为 +1 或 -1
  • 蛋白质和转录属性包括:
  • "CodingSequenceLists"基因的编码序列列表
    "CodingSequencePositions"每个编码序列的区域位置列表
    "CodingSequences"基因编码序列的变形
    "ExonSequences"基因外显子序列的列表
    "IntronSequences"基因内含子序列的列表
    "ProteinNames"根据基因编码的蛋白质名称
    "UTRSequences"基因未转换终端区域的序列列表
  • 功能属性包括:
  • "BiologicalProcesses"与基因产物相关的生物过程
    "CellularComponents"找到基因产物的细胞成分
    "InteractingGenes"与该基因或它的产物相互作用的基因
    "MolecularFunctions"基因产物的分子功能
  • 基因识别属性包括:
  • "AlternateNames"同义词
    "GenBankIndices"GenBank 指标字符串
    "GeneID"GeneID 号码字符串
    "GeneOntologyIDs"Gene Ontology ID 字符串
    "MIMNumbers"人类孟德尔遗传(Mendelian Inheritance in Man)指标数字符串
    "Name"通用英文名称
    "NCBIAccessions"NCBI 存取号字符串
    "ProteinGenBankIndices"蛋白质产物的 GenBank 指标数字符串
    "ProteinNCBIAccessions"蛋白质产物的 NCBI 存取号字符串
    "StandardName"标准 Wolfram 语言名称
    "TranscriptGenBankIndices"RNA 产物的 GenBank 指标数字符串
    "TranscriptNCBIAccessions"RNA 产物的 NCBI 存取号字符串
    "UniProtAccessions"UniProt 存取号字符串
  • 染色体的整体属性包括:
  • "SequenceLength"以碱基对为单位的染色体的长度
    "UnsequencedPositions"未知序列的起始位置和末端位置
  • 与染色体带相关的属性包括:
  • "GBandLocusStrings"G-带基因座的名称
    "GBandScaledPositions"所有 G-带标度化的起始位置和末端位置
    "GBandStainingCodes"所有 G-带细胞基因染色密码
    "GBandStainingLevels"所有 G-带相对染色程度
  • GenomeData[gene,"prop","ann"] 给出与属性相关的各种注解. 通常注解包括:
  • "Name"通用英文名称
    "StandardName"标准 Wolfram 语言名称
    "Units"给出值的单位

范例范例打开所有单元关闭所有单元

基本范例  (5)基本范例  (5)

获取人类基因组中一个基因的完全DNA序列:

In[1]:=
Click for copyable input
Out[1]//Short=
In[2]:=
Click for copyable input
Out[2]=

获取一个染色体的部分 DNA 序列:

In[1]:=
Click for copyable input
Out[1]=

获取染色体的基因列表:

In[1]:=
Click for copyable input
Out[1]//Short=

获取基因所在染色体的 Wolfram 语言标准名称:

In[1]:=
Click for copyable input
Out[1]=

获取一个基因的染色体位置:

In[1]:=
Click for copyable input
Out[1]=
2008年引入
(7.0)