那些科研汪最想了解的KEGG基本功能
作者:互联网
KEGG数据库是由京都大学化学研究所提出建立并维护的,该数据库的特色是一系列经人手绘制而成KEGG代谢路径图的构成,以代表关于代谢以及其他细胞与生物机能的实验成果。
总之,KEGG是从代谢通路这方面起家的,后来慢慢壮大,其他的通路也做得不错了。如果你研究代谢,那么KEGG是最佳选择。如果你研究的是其他,那KEGG也个不错的选择,至少审稿人不会怼你用的是KEGG。
KEGG的网址:https://www.genome.jp/kegg/。进入网页后,主要关注下图方框里的内容,KEGG的主要数据就在这里了,包括
系统信息:Pathway(信号通路)、BRITE(生物实体的阶层分类)、MODULE(基因模组与功能分类);基因组信息:ORTHOLOGY(基因直系同源组别)、GENOME(基因组)、GENES(基因与蛋白列表);化学信息:COMPOUND(化合物)、GLYCAN(聚糖)、REACTION(生化反应)、ENZYME(酶);健康信息:NETWORK(疾病相关的网络元素)、 DISEASE(疾病)、Drugs(药物)、MEDICUS(健康信息资源)。
或者大家也可以从KEGG2进入,网址为:https://www.genome.jp/kegg/kegg2.html 网页显示如下,内容分门别类,看上去较为整齐。
在KEGG2有一个比较重要的搜索框,用户可以直接在此搜索,选项“KEGG”表示在此表示在KEGG整个数据库中搜索,其他的选项则表示只针对该选项下的内容进行过滤筛选。
1. KEGG PATHWAY这部分应该就是大家最熟悉的啦,也是KEGG数据库最核心的部分。它包含了与通路相关的各种信息,我们解螺旋也有相关课程教大家使用,在此就不赘述。
2. KEGG BRITE这部分是一个手动创建的分层文本文件的集合,捕获各种生物对象的功能层次结构。它包含5个部分:基因和蛋白、化合物和反应、药物、疾病、物种和细胞。与局限于分子间相互作用和反应的KEGG PATHWAY比,KEGG BRITE包含了许多不同的关系类型。大家可以根据自己的研究方向在对应的部分进行查找。
3. KEGG MODULEKEGG MODULE是人工手动定义的功能单元的集合,编号为M开头,用于基因组的注释和生物学解释。KEGG MODULE有三种类型:通路模块、结构复合体和功能集合。大家可以点击下图红色箭头所指的深蓝色字进一步查看。
4. KEGG Orthology总得来说,KEGG把分子网络的相关信息关联到基因组中,而推进物种间的注释流程。数据库会把功能已知的基因以及它们的同源基因作为一类,也就是一个KO,然后加上一个数字,将这个基因的功能当作这个KO的功能。
假设同源基因具有相似的功能,那么每个基因的功能多样性就得到了拓展,若A基因在甲物种中研究得很清楚了,和乙物种中的B基因是同源基因,那么AB是同源基因,定义为一个orthology,将A基因作为这个orthology的功能。这样不同物种间的基因功能研究就联系起来了,研究结果得到充分利用。
5. KEGG GENOME截止9月1日,这部分共收集了6105种物种(534 eukaryotes, 5272 bacteria, 299 archaea)的基因组信息和完整的基因组序列,并会根据EST数据集进行补充。
6. KEGG GENES这部分收集了真核生物、原核生物和病毒的基因在基因组上的信息,同时可进行基因聚类,搜索同源基因、旁系同源基因以及基因的motif。
7. KEGG SSDB这部分是基因组中蛋白编码基因的氨基酸序列相似性的数据库,同时可将相似的基因进行聚类。并且这部分还提供一个做聚类树的功能。输入基因,并点击“Draw dendrogram”即可。例图如下:
8. KEGG DISEASE在这个部分,疾病被视为分子系统的扰动状态。
我们可以点击“Human diseases”、“Infectious diseases”、“Human diseases in ICD-11 classification”查看与疾病有关的通路。KEGG会展示每个疾病的描述、分类、相关的基因、病原、致癌物等信息。
9. KEGG NETWORK这部分和上面的KEGG DISEASE比较像,它是KEGG尝试从扰乱的分子网络中获取有关疾病和药物的信息。这部分主要包含了癌症、内分泌和代谢性疾病、病毒和细菌感染三部分内容。
10. KEGG DRUG这部分包含的药物为在日本和美国上市的药物。大家可以在上面的搜索框进行搜索或者查看下面的药物分类。
搜索结果如下:
点击蓝色的搜索结果里的蓝色超链接可以进一步查看具体药物和疾病的信息。
11. KEGG ENVIRON这部分主要是一些“原料药,精油和其他促进健康的物质”,收集了它们的分子结构、分子量、靶点、影响通路等信息。这也是这个数据库的一个对“什么才叫药物”的态度吧,我们日常认为的一些活络油,中草药等等就在不在上面说的“药物”范畴,而在这个里面了,研究中草药的同学可以看看。另外,这部分也收集了一些有害健康的物质。
12. KEGG MEDICUS这部分是疾病,药物和与健康有关的物质的综合信息资源,其目标是将基因组革命带入社会。
目标还是很宏大,也做了一些整合,就是将所有的信息放在了一个框架里,搜索的时候就会将每个部分的信息展示出来。至于怎么看待这种整合,就仁者见仁智者见智了。
标签:KEGG,通路,科研,基因,这部分,基因组,信息,基本功能 来源: https://blog.51cto.com/u_15127638/2776127