FASTQ (.fastq, .fq)

背景

    • MIME 类型:chemical/seq-na-fastq
    • FASTQ 分子生物学的格式.
    • 存储和交换具有基质的 DNA 序列的标准格式.
    • 纯文本格式.
    • 以字符串形式存储核酸序列和基质.
    • 使用各种协定表示元信息.

Import 与 Export

  • Import["file.fastq"] 从一个 FASTQ 文件中导入 DNA 序列.
  • Export["file.fastq",expr] 把一个序列或序列列表导出为 FASTQ 格式.
  • Import["file.fastq"] 返回一个表示存储在文件中的序列的字符串列表.
  • Export["file.fastq",{seq,qual}] 把一个表示具有基质的 DNA 序列的字符字符串导出到 FASTQ.
  • Export["file.fastq",{{seq1,seq2,},{qual1,qual2,}}] 导出多个具有基质的 DNA 序列.
  • Import["file.fastq",elem] 从一个 FASTQ 文件导入指定的参数.
  • Import["file.fastq",{{elem1,elem2,}}] 导入多个参数.
  • 导入参数可以用 Import["file","FASTQ"]Import["file",{"FASTQ",elem,}] 指定.
  • Export["file.fastq",expr,elem] 通过把 expr 作为指定参数 elem 创建一个 FASTQ 文件.
  • Export["file.fastq",{expr1,expr2,},{{elem1,elem2,}}] 把每一个 expri 指定为相应的 elemi.
  • Export["file.fastq",expr,opt1->val1,] 导出具有指定值的指定选项参数的 expr.
  • Export["file.fastq",{elem1->expr1,elem2->expr2,},"Rules"] 使用规则指定要导出的参数.
  • 请到以下参考页面了解完整的基本信息:
  • Import, Export从文件导入或导出到文件
    CloudImport, CloudExport从云对象导入或导出到云对象
    ImportString, ExportString从字符串导入或导出到字符串
    ImportByteArray, ExportByteArray从字节数组导入或导出到字节数组

导入参数

  • Import 的通用参数:
  • "Elements" 该文件可用的参数和选项列表
    "Summary"文件摘要
    "Rules"所有可用参数的规则列表
  • 表示数据的参数:
  • "Header"原始标头行
    "Sequence"以字符串列表表示的 DNA 序列
    "Qualities"以字符串列表表示的基本特性
  • 对于 FASTQ 格式,默认情况下,Import 使用 "Sequence" 参数.
  • 其他数据参数:
  • "Data""Header""Sequence""Qualities" 参数被组合成一列表
    "LabeledData"存储在文件中每个序列的规则列表
  • Wolfram 语言对核酸使用标准的 IUB/IUPAC 缩写:
  • A腺苷
    C胞苷
    G鸟嘌呤
    T胸苷
    U尿嘧啶
    R嘌呤 (G 或 A)
    Y嘧啶 (T 或 C)
    K(G 或 T)
    M氨基酸组 (A 或 C)
    S强相互作用 (G 或 C)
    W弱相互作用 (A 或 T)
    BC 或 G 或 T
    DA 或 G 或 T
    HA 或 C 或 T
    VA 或 C 或 G
    N任何核酸(A 或 C 或 G 或 T)
    -不定长度的间隔
  • Wolfram 语言对于基本特性使用 ASCII 字符.

选项

  • Export 的高级选项:
  • "LineWidth"70每行中最大的字符数目

范例

基本范例  (6)

以下从样本 FASTQ 文件中读取原始标头行:

读取 DNA 序列:

读取具有特性的 DNA 序列:

以下把短序列转换成 FASTQ 格式,自动添加默认的标头信息:

导出两个序列:

导出标头和序列对:

使用 "Data" 参数导入上面的输出,给出原始标头和序列:

以规则列表形式导入: