MATHEMATICA IMPORT/EXPORT 格式
PDB (.pdb)
- Import["file.pdb"] 创建一个 PDB 文件并返回蛋白质的程式化渲染.
- Mathematica 对大分子提供各种三维渲染样式.
- Export["file.pdb", expr] 从一个分子的三维模型中创建一个 PDB 文件.
-
- Import["file.pdb"] 返回一个 Graphics3D 对象.
-
- Import["file.pdb", elem] 从 PDB 文件中导入指定的参数.
- Import["file.pdb", {elem, suba, subb, ...}] 导入一个子参数.
- Import["file.pdb", {{elem1, elem2, ...}}] 导入多个参数.
- 导入格式可以用 Import["file", "PDB"] 或 Import["file", {"PDB", elem, ...}] 指定.
-
- Export["file.pdb", {elem1->expr1, elem2->expr2, ...}] 使用规则制定要导出的参数.
-
- Import 与 Export 的完整信息请见参考页..
- ImportString 与 ExportString 支持 PDB 格式.
- Import 通用参数:
-
| "Elements" | 该文件可用的参数和选项列表 |
| "Rules" | 每个参数和选项的完整规则列表 |
| "Options" | 选项、属性和设置的规则列表 |
- 默认情况下,Export 使用
参数.
-
- 图形参数:
-
- 默认情况下,对于 PDB 格式,Import 使用
参数.
- 表示数据的参数:
-
| "AdditionalAtoms" | 不是链的成分的原子 |
| "AdditionalCoordinates" | 附加原子的三维坐标 |
| "AdditionalIndex" | 在 VertexCoordinates 和 中附加原子的指标 |
| "AdditionalResidues" | 以三个字母缩写数组表示的附加残基序列 |
| "ResidueAtoms" | 残基原子列表 |
| "ResidueChainLabels" | 链标签列表 |
| "ResidueCoordinates" | 残基原子的三维坐标 |
| "ResidueIndex" | 在 VertexCoordinates 和 中残基原子的指标 |
| "ResidueRoles" | 残基原子的功能角色 |
| "Residues" | 以三个字母缩写数组表示的残基序列 |
| "Resolution" | 模型坐标的空间分辨率,以皮米为单位 |
| "SecondaryStructure" | 描写一条链的大型结构的规则 |
| "Sequence" | 以字符串列表形式表示的残基序列 |
| "VertexCoordinates" | 原子坐标,一般以皮米为单位 |
| "VertexTypes" | 构成分子的所有原子或基团,一般以化学元素缩写的列表形式表示 |
- 当从 PDB 读取一个不完全的链,其缺少一个或多个残基,Mathematica 将以单个子链的序列表示它.
- Mathematica 对氨基酸残基使用标准的 IUB/IUPAC:
-
| A | 丙氨酸(Ala) |
| C | 半胱氨酸(Cys) |
| D | 天门冬氨酸(Asp) |
| E | 谷氨酸(Glu) |
| F | 苯丙氨酸(Phe) |
| G | 甘氨酸(Gly) |
| H | 组氨酸(His) |
| I | 异亮氨酸(Ile) |
| K | 赖氨酸(Lys) |
| L | 亮氨酸(Leu) |
| M | 蛋氨酸(Met) |
| N | 天门冬酰胺(Asn) |
| P | 脯氨酸(Pro) |
| Q | 谷氨酰胺(Gln) |
| R | 精氨酸(Arg) |
| S | 丝氨酸(Ser) |
| T | 苏氨酸(Thr) |
| V | 缬氨酸(Val) |
| W | 色氨酸(Trp) |
| Y | 酪氨酸(Tyr) |
| X | 未指定或未知氨基酸(Unk) |
- 以下缩写用于表示核酸:
-
| A | 腺苷 |
| C | 胞苷 |
| G | 鸟苷 |
| I | 肌苷 |
| T | 胸苷 |
| U | 尿苷 |
| X | 未指定或未知核酸 |
- 当导入一个用多个三维模型描述同样分子的 PDB 文件时,可以使用以下 Import 参数读取所有模型的几何形状:
-
| "ResidueCoordinatesList" | 每个模型的残基坐标 |
| "AdditionalCoordinatesList" | 每个模型附加原子的三维坐标 |
| "VertexCoordinatesList" | 每个模型的原子坐标,一般以皮米为单位 |
- 元信息参数:
-
| "Authors" | 文件中引用的作者信息 |
| "Comments" | 以一个字符串列表表示的注解和说明 |
| "DepositionDate" | 文件是什么时候加入数据库的 |
| "Organism" | 出现蛋白质的有机体 |
| "PDBClassification" | 文件头的 PDB 分类 |
| "PDBID | PDB 结构识别字符串 |
| "References" | 以规则列表形式给出的书目参考 |
| "Title" | 文档标题 |
- 通用渲染选项:
-
- 默认设置为 ViewPoint->Automatic,Mathematica 自动计算导入分子模型的最优观察角度.
- 选择一个渲染样式:
-
| "Rendering" | "Structure" | 指定可视化方法 |
可能的设置为:
-
| "BallAndStick" | 以球棍模型显示原子和化学键 |
| "Structure" | 蛋白质骨架的程式化渲染 |
| "Spacefilling" | 显示为重叠球的原子 |
| "Wireframe" | 以线渲染的化学键 |
从 RCSB 蛋白质数据库网页导入一个大型 PDB 文件:
| Out[1]= |  |
获取该 PDB 文件的标题:
| Out[2]= |  |
导入上面分子每个链的标签:
| Out[3]= |  |
显示样本文件中可用的 Import 参数:
| Out[1]= |  |
获取该文件中引用的有机体名称:
| Out[2]= |  |
导入文件中的参考书目:
| Out[3]= |  |
导入残基序列:
| Out[4]= |  |
以下以单个字符缩写的字符串形式给出同样的序列:
| Out[5]= |  |
获取关于该分子的结构信息:
| Out[6]= |  |
以程式化形式显示蛋白质骨架:
| Out[7]= |  |
使用每个残基的标准颜色显示同样的蛋白质:
| Out[8]= |  |
以下用球棍图形导入样本文件:
| Out[9]= |  |
以线框模型显示同样的蛋白质:
| Out[10]= |  |
导入残基数据:
| Out[11]= |  |
导入样本文件,把原子渲染为空间填充的球体:
| Out[12]= |  |
导入一个 DNA 模型:
| Out[1]= |  |
从文件中导入 RNA 和 DNA 序列:
| Out[2]= |  |
| Out[3]= |  |
Read all data from a从一个 PDB 文件中读取所有数据,并把它导回到 PDB:
| Out[2]= |  |
从一个 MOL 文件中导入简单的三维模型,并把它导出到 PDB:
| Out[1]= |  |
| Out[2]= |  |
把由此产生的 PDB 文件导入为一个三维图形:
| Out[3]= |  |
版本 6 的新功能 | 版本 8 修改功能