agilent表达谱芯片注释信息提取的方法

agilent表达谱芯片注释信息提取的方法

本文小编为大家详细介绍“agilent表达谱芯片注释信息提取的方法”,内容详细,步骤清晰,细节处理妥当,希望这篇“agilent表达谱芯片注释信息提取的方法”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

不规范的表达谱芯片注释信息提取

agilent表达谱芯片注释信息提取的方法

1、GEO数据库中 agilent表达谱芯片由与其设计往往比较个性化,涉及的芯片型号很多,使用的Cy5/Cy3的双色芯片 或者仅使用Cy3的单色芯片,数据上比较混乱,而GEO中提供的GPL信息文件格式和affymetrix 、illumina 的表达谱芯片对应的GPL格式差别较大,虽然格式整齐,并不完全规范(相对于直接利用GEOquery下载芯片注释文件而言)

2、若直接下载标准化数据的同时,利用GEOquery下载对应的GPL芯片平台信息往往出现报错,或者提取信息过程中出现提取错误,这里针对 格式相对整齐统一的这种agilent表达谱芯片GPL信息 提供一种获取的方法,在进行芯片原始数据标准化的过程中直接获得其中的注释信息:探针和基因等对应关系。

3、此处仅以单通道芯片数据为例: 案例数据GSE83902 基于limma包读取数据,并进行预处理,标准化之后,获取的结果时一个EList对象,这个对象中包含了探针和基因之间的对应关系,先对芯片中重复的探针检测值取均值之后,获取的还是一个EList(此处用averEList向量表示取均值后的返回结果):

查看averEList 中对应的genes信息,这个矩阵中包括了每一列信息如下 涉及探针ProbeName 和GeneName以及描述信息,之后提取保存即可

>colnames(averEList$genes)[1]"Row""Col""Start""Sequence""ProbeUID"[6]"ControlType""ProbeName""GeneName""SystematicName""Description">Probe=averEList$genes[,c("ProbeName","GeneName","SystematicName","Description")]>head(Probe,5)ProbeNameGeneNameSystematicName1GE_BrightCornerGE_BrightCornerGE_BrightCorner2DarkCornerDarkCornerDarkCorner4A_23_P117082HEBP1NM_0159875A_33_P3246448KCNE4NM_0806716A_33_P3318220BPIFA3NM_178466Description124ref|Homosapienshemebindingprotein1(HEBP1),mRNA[NM_015987]5ref|Homosapienspotassiumvoltage-gatedchannel,Isk-relatedfamily,member4(KCNE4),mRNA[NM_080671]6ref|HomosapiensBPIfoldcontainingfamilyA,member3(BPIFA3),transcriptvariant1,mRNA[NM_178466]

注意: 不同芯片获取的EList结果中可以EList$genes 获取的矩阵涉及的列名不一致,具体情况具体对待

读到这里,这篇“agilent表达谱芯片注释信息提取的方法”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注恰卡编程网行业资讯频道。

发布于 2022-03-19 21:12:28
收藏
分享
海报
0 条评论
34
上一篇:bam文件怎么转换fastq 下一篇:vue中为什么不要使用for in循环来遍历数组
目录

    0 条评论

    本站已关闭游客评论,请登录或者注册后再评论吧~

    忘记密码?

    图形验证码