在R语言中如何将ENSEMBL ID转换成Gene ID或者Symbol
这篇文章主要介绍了在R语言中如何将ENSEMBL ID转换成Gene ID或者Symbol,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。
AnnotationDbi 和 结合物种对应的注释文件,将ENSEMBL ID转换成Gene ID(ENTREZID)
在R中如何利用ENSEMBL ID获得Gene ID(ENTREZID), 又或者转换为Gene Symbol,以人为例:
预先安装AnnotationDbi 和 org.Hs.eg.db
加载org.Hs.eg.db
>library(org.Hs.eg.db)
获取所有的ENSEMBL ID,并查看前五个ID
>k=keys(org.Hs.eg.db,keytype="ENSEMBL")>head(k,5)[1]"ENSG00000121410""ENSG00000175899""ENSG00000256069""ENSG00000171428""ENSG00000156006"
基于提取的ENSEMBL ID,提取对应的所有Gene ID(ENTREZID),(以及Symbol),并查看一下提取的内容。
>list=select(org.Hs.eg.db,keys=k,columns=c("ENTREZID","SYMBOL"),keytype="ENSEMBL")'select()'returned1:manymappingbetweenkeysandcolumns>dim(list)[1]291403>head(list,5)ENSEMBLENTREZIDSYMBOL1ENSG000001214101A1BG2ENSG000001758992A2M3ENSG000002560693A2MP14ENSG000001714289NAT15ENSG0000015600610NAT2
预先准备的ENSEMBL ID,如何找到他们对应的Gene ID(ENTREZID)和Symbol,例如ID 中的,获得的对应关系:ID_list
>ID[1]"ENSG00000256069""ENSG00000127837""ENSG00000129673""ENSG00000276016""ENSG00000075624""ENSG00000204262"[7]"ENSG00000149294""ENSG00000069943""ENSG00000173992""ENSG00000166171""ENSG00000177201">ID_list=list[match(ID,list[,"ENSEMBL"]),]>ID_listENSEMBLENTREZIDSYMBOL3ENSG000002560693A2MP18ENSG0000012783714AAMP9ENSG0000012967315AANAT30ENSG0000027601629ABR59ENSG0000007562460ACTB1017ENSG000002042621290COL5A23856ENSG000001492944684NCAM17605ENSG000000699439488PIGB8058ENSG000001739929973CCS10155ENSG0000016617125911DPCD17531ENSG00000177201127064OR2T12
感谢你能够认真阅读完这篇文章,希望小编分享的“在R语言中如何将ENSEMBL ID转换成Gene ID或者Symbol”这篇文章对大家有帮助,同时也希望大家多多支持恰卡编程网,关注恰卡编程网行业资讯频道,更多相关知识等着你来学习!