Affymetrix (.cel, .cdf, .chp, .gin, .psi)

背景

    • Affymetrix 微阵列数据格式.
    • 用于存储和交换微阵列数据与元信息的文件格式系列.
    • ASCII 或二进制格式.
    • MAS、GCOS 以及命令控制台应用程序的原始格式.
    • CEL 文件存储专用探针强度值的光栅.
    • CHP 文件包含关于探针集合的处理信息.
    • CDF 文件描述哪个探针是哪个探针集合的一部分.
    • GIN 文件存储与每个探针集合相关的基因名称.
    • PSI 文件存储探针集合名称以及在探针集合中的探针对的数量.

Import

  • Import["file"] 从任何 Affymetrix CEL、CDF、CHP、GIN 或 PSI 文件中导入数据.
  • Import["file",elem] 导入指定的元素.
  • Import["file",{{elem1,elem2,}}] 导入多个元素.
  • 导入格式可以用 Import["file","Affymetrix"]Import["file",{"Affymetrix",elem,}] 指定.
  • 请到以下参考页面了解完整的基本信息:
  • Import从文件导入
    CloudImport从云对象导入
    ImportString从字符串导入
    ImportByteArray从字节数组导入

Import 参数

  • Import 的通用参数:
  • "Elements" 该文件可用的参数和选项列表
    "Summary"文件摘要
    "Rules"所有可用参数的规则列表
  • 表示常用数据的参数:
  • "Data"强度值(CEL),处理的探针集合数据(CHP)或探针集合记录(CDF、 PSI、GIN)
    "ProbeSetNames"字符串列表形式的探针集合
  • 当从 CDF、PSI 或 GIN 中导入,Import["file",{"Data",probesetname}] 返回的记录与指定的探针集合相对应.
  • 默认情况下,对所有 Affymetrix 文件格式,Import 使用 "Data" 参数.
  • 常用元信息参数:
  • "Header"元信息以规则列表的形式给出
  • 其它 CEL 参数,表示关于基本的 DAT 图像文件的元信息:
  • "PixelRange"对应于每个探针强度值的像素数目
    "DataErrors"强度值中的错误
    "Outliers"被认为是离群的探针坐标列表
  • 其它 CDF 参数:
  • "QCData"质量控制信息
  • 其它 CHP 参数:
  • "DetectionStates"检测到的基因表达式状态,给出 TrueFalseIndeterminate 值的列表
    "DetectionSignificances"对应于每个检测状态的
    "ProbePairs"每个探针集合中的探针对数目
    "ProbePairsUsed"用于推断检测状态的探针对数目
    "Alleles"检测的基因类型
    "ConfidenceValues"每个基因类型检测的置信度

范例

打开所有单元关闭所有单元

基本范例  (5)

从一个 CEL 文件中导入和绘制强度值的光栅:

从一个 CEL 文件导入完整的头信息:

从一个 CDF 文件读取完整的头信息:

导入首几个探针集合名字:

导入与探针集合名字相关的数据:

从一个 CHP 文件中导入探针集合名字,信号数据以及检测的状态:

从一个 GIN 文件中读取完整的头信息:

导入首几个探针集合名字:

导入与探针集合名字相关的数据:

从一个 PSI 文件中导入首几个探针集合名字:

导入与探针集合名字相关的数据:

范围  (2)

显示离群探针的位置:

从数据中显示制造商的水印并以图像的形式显示: