SFF (.sff)
- Import 支持 SFF 文件格式的大多数常用变体,包括有索引和没索引的.
背景
-
- MIME 类型:chemical/seq-na-sff
- SFF 分子生物学的格式.
- 用于存储和交换具有基本特性的 DNA 序列的标准 flowgram 格式.
- 常被用于 454 生命科学 DNA 焦磷酸测序技术平台(Life Sciences DNA pyrosequencing platform).
- 二进制格式.
- 把核酸序列和基质分别存储为字符字符串和列表.
- 在文件中存储关于序列运行的元信息.
Import 与 Export
- Import["file.sff"] 从 SFF 文件中导入 DNA 序列数据.
- Import["file.sff"] 返回一个存储在文件中表示序列数据的数组.
- Import["file.sff",elem] 从 SFF 文件中导入指定的参数.
- Import["file.sff",{{elem1,elem2,…}}] 导入多个参数.
- 导入格式可以用 Import["file","SFF"] 或 Import["file",{"SFF",elem,…}] 指定.
- 请到以下参考页面了解完整的基本信息:
-
Import 从文件导入 CloudImport 从云对象导入 ImportString 从字符串导入 ImportByteArray 从字节数组导入
Import 参数
- Import 的通用参数:
-
"Elements" 该文件可用的参数和选项列表 "Summary" 文件摘要 "Rules" 所有可用参数的规则列表 - 文件元数据:
-
"Header" 以规则列表形式给出的文件标头 "XMLManifest" XML 显现为一个 XML 对象 - 读取每个序列的数据表示参数:
-
"Sequence" 以字符串列表表示的 DNA 序列 "Qualities" 以列表的列表形式表示的基本特性 "FlowgramValues" 以列表的列表形式表示的 flowgram 值 "FlowIndexPerBase" 以列表的列表形式表示的流索引 "ClipQualities" 质量修剪序列的坐标,表示为一数组 "ClipAdapter" 适配器修剪序列的坐标,表示为一数组 "ReadName" 读取的名称,表示为字符串的列表 - 其他数据参数:
-
"Data" 所有数据表示参数组合成一列表形式 "LabeledData" 存储在文件中每个序列的规则列表 - 对于 SFF 格式,默认情况下,Import 使用 "Data" 参数.
- 对于核酸,Wolfram 语言使用标准的 IUB/IUPAC 缩写:
-
A 腺苷 C 胞苷 G 鸟嘌呤 T 胸苷 U 尿嘧啶 R 嘌呤 (G 或 A) Y 嘧啶 (T 或 C) K 酮 (G 或 T) M 氨基酸组 (A 或 C) S 强相互作用 (G 或 C) W 弱相互作用 (A 或 T) B C 或 G 或 T D A 或 G 或 T H A 或 C 或 T V A 或 C 或 G N 任何核酸(A 或 C 或 G 或 T) - 不定长度的间隔 - Wolfram 语言对于基质使用整数.