如何分析KEGG Disease 数据库
如何分析KEGG Disease 数据库,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
kegg disease 数据库收录了已经报告的各种疾病的信息,每个记录用H Number 唯一标识, 比如H00004
。
在kegg 中,将疾病视作分子网络的一个不正常的状态。所有的遗传因素,环境因子,药物等因素都被视作潜在的影响因素,所以在disease 数据库中,还收录了每种疾病相关的影响因素,以及它们之间的相互关系。对于这些影响因素的之间的相互关系,采用pathway 通路来进行展示。比如 H00004
对应的pathway 为 hsa05220
。
在通路中,我们可以看到有些红色标记的方框,这些其实就是和该疾病相关的基因。对于那些在disease 数据库中已有记录的疾病而言,我们可以查找到该疾病相关的致病基因。
和kegg orthology 等数据库类似,disease 数据库当然也有对应的分类信息。但是分类标准比较多,既有kegg 自己的标准,也有国际标准 ICD-10;
因为人类疾病的研究和我们日常生活最为密切相关,所以单独对human disease 进行了详细的分类,见以下文件
http://www.kegg.jp/kegg-bin/get_htext?br08402.keg
所有物种(包括human)的疾病信息的分类对应以下两个文件:
第一个文件为kegg 自己定义的分类标准, 主要依据物种分类信息
http://www.kegg.jp/kegg-bin/get_htext?br08401_genome.keg
第二个文件为国际上对疾病的分类标准 ICD-10 分类系统
http://www.kegg.jp/kegg-bin/get_htext?br08403.keg
所以对于disease 数据库中的记录而言,最多会有3种分类体系的注释。
对于human 相关疾病而言,专门在pathway 数据库中开辟了一个新的分类, Human Disease
, 用于展示人类疾病相关各种因素之间的相互作用信息;
kegg 还专门针对疾病的致病基因,药物的靶标基因在通路图上进行了标记,这些特异性的通路图采用 hsadd 编号,比如 hsadd04620
。
在这些通路图中,当一个基因和该疾病相关(可能的致病基因)时,用粉色标记;当一个基因为药物的靶点时,用淡蓝色标记,如果同时为致病基因和药物靶点,则一半为淡蓝色,一半为粉色。
注意绿色和疾病没有关系,绿色是物种的通路图中,将该物种的KO 进行了绿色的高亮显示。
disease 数据库收录了各种物种相关的疾病信息,最主要的是人类相关的疾病。对于疾病的分类,既有kegg 自己根据物种信息提供的分类标准,也有国际通用的ICD-10 标准;对于human disease, 更是单独提供了更加详细的分类;
对于人类相关疾病,专门提供了pathway 通路图,描绘疾病相关因素之间的相互作用关系;同时还针对疾病致病基因和药物靶标基因,在通路图上进行了标注,这些通路图的编号以hsadd
开头。
看完上述内容,你们掌握如何分析KEGG Disease 数据库的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注恰卡编程网行业资讯频道,感谢各位的阅读!