此为 Mathematica 7 文档,内容基于更早版本的 Wolfram 语言
查看最新文档(版本11.2)

ProteinData

ProteinData["prot"]
给出蛋白质 prot 的参考氨基酸序列。
ProteinData["prot", "property"]
给出蛋白质 prot 的指定属性值。
  • 蛋白质可以通过诸如 "TRPM1" 的标准名称来指定。
  • 蛋白质序列可以用单字符的氨基酸字母组成的字符串表示。
  • 基本属性包括:
"MolecularWeight"全部分子重量( dalton)
  • 序列的属性包括:
"DNACodingSequence"蛋白质的基本对序列代码
"DNACodingSequenceLength"蛋白质的基本对序列代码的长度
"Gene"蛋白质的基因代码
"Sequence"蛋白质的氨基酸序列
"SequenceLength"蛋白质的氨基酸序列长度
  • 蛋白质结构可能包含在原 DNA 序列中明确编码的其它元素。
  • 基于残基的分子结构属性包括:
"DihedralAngles" 二面角 Phi, Psi, Omega 的列表(弧度)
"SecondaryStructureRules"规则列表,给出螺旋等结构的起始坐标和终点坐标
  • 基于单个原子的分子结构属性包括:
"AdditionalAtomPositions"其它原子的三维坐标列表
"AdditionalAtomTypes"其它原子的元素符号列表
"AtomPositions"蛋白质原子的三维坐标列表
"AtomRoles"蛋白质原子的结构角色列表
"AtomTypes"蛋白质原子的元素符号列表
"GyrationRadius"回转半径
"MoleculePlot"三维分子结构图形
  • 距离按照微微米测量。
  • ProteinData["prot", "prop", grouping] 给出各组的分子结构属性:
{}无组
"Chain"按链分组
"Residue"按残基分组
{g1,g2,...}分组标准列表
  • 在结构中与链相关的属性包括:
"ChainLabels" 三维结构链的识别列表
"ChainSequences"三维结构链的氨基酸列表
  • 蛋白质普通域属性包括:
"DomainIDs"域的 NCBI CDD 数
"DomainPositions"蛋白质序列中域的坐标
"Domains"蛋白质中域名称
  • 函数属性包括:
"BiologicalProcesses"与蛋白质相关的生物进程
"CellularComponents"找到蛋白质的分子组件
"MolecularFunctions"蛋白质的分子函数
  • 蛋白质的识别属性包括:
"AlternateNames"可选择的传统名称
"GeneID"蛋白质基因的 GeneID 号
"Name"传统名称
"NCBIAccessions"NCBI 字符串
"PDBIDList"所有 PDB ID 字符串列表
"PrimaryPDBID"Mathematica 结构属性等中选择的PDB ID
"StandardName"标准 Mathematica 名称
  • ProteinData["prot", "prop", "Units"] 给出一个特定属性值的单位。
给出人类蛋白质的列表:
In[1]:=
Click for copyable input
Out[1]//Short=
In[2]:=
Click for copyable input
Out[2]=
 
显示带状图:
In[1]:=
Click for copyable input
Out[1]=
 
获得一个蛋白质的氨基酸序列:
In[1]:=
Click for copyable input
Out[1]=
 
获得一个蛋白质的分子重量:
In[1]:=
Click for copyable input
Out[1]=
 
获得蛋白质序列中氨基酸的数量:
In[1]:=
Click for copyable input
Out[1]=
 
获得一个三维蛋白质结构中原子的坐标:
In[1]:=
Click for copyable input
Out[1]//Short=
7 的新功能