跳转至内容
上一期为大家讲解了“弦图”,这一期将为大家介绍一种新的生信高级图——KEGG通路自定义图。
熟悉KEGG (https://www.kegg.jp/)的朋友都知道,这是一个非常著名的生物信号通路数据库,它整合了基因组学、生物化学和系统功能信息,常用来进行基因功能以及基因组信息分析。KEGG共有17个子数据库,而KEGG PATHWAY则是其中一种常用的子数据库,它的特点是具有强大的图形功能,能够将代谢、调控、通路、生化、疾病、药物等相关的分子相互作用整合到一起并形成关系网络。
下面的示例为我们呈现了KEGG通路图的两种模式——KEGG通路原生图(上)和KEGG通路自定义图(下),大家来找茬,猜猜有啥不同?
有些朋友可能会觉得,不就是填充颜色的差异嘛,好像没啥太大不同。非也,懂行的朋友在下图中看到的信息会更加的丰富,下面小编就为大家继续掰扯掰扯!
KEGG通路原生图(上)为我们展示了”cell cycle”这条通路及相关基因的相互作用,代谢的“骨骼”和“经络”一览无遗,从中得到的信息是不是还挺丰富的?虽说如此,但是原生图里的某些基因并非是我们研究数据中存在的,很多时候我们想要把研究的特定基因的表达变化和代谢物水平等信息标记在上面,不想局限于原生图这种单一模式,就形成了下图这种自定义模式。经过这一番操作后,通路图(下)变得更具可读性和可解释性,因为它贴近了我们的研究数据,更符合某些特定场景下的真实代谢情况。可以说,上图是“死”的,下图才是“活”的。
那有没有办法去实现这种自定义呢?这不,它带着解决方案来了——Pathview。
R包Pathview是一个用于针对KEGG通路进行数据整合和可视化的工具,它可以将用户数据映射并呈现在相关的原生通路图上。我们只需要提供目的基因数据,并指定目标通路,然后它就可以自动下载KEGG官网通路图数据,解析数据文件,将我们的数据映射到通路,对通路图进行再次渲染,进而实现我们的目的——对KEGG通路图的个性化处理,这样,一幅更加美观的高级图(下)就画好啦。
当然,这里输入的数据其实是一个广泛的概念,包括了基因、转录本、蛋白质、酶及其表达、修饰和任何可测量的属性,所以想添加哪种信息取决于你拥有的数据类型和作图需求。
KEGG通路自定义图(下),输入的是差异基因表达数据,它会保存所有关于通路、修饰、分子相互作用或反应等元数据,而富集到KEGG的差异表达基因在图中则被不同颜色填充。绿色渐变红色表示由下调(-1)到上调(1)。
Pathview整合、分析和可视化多种生物数据,可以将基因表达、蛋白表达、代谢物水平、遗传关联、基因组变异等数据映射到通路上,因此其应用范围可从转录组学拓展到基因组学、蛋白质组学和代谢组学等研究中,相当广泛。
感兴趣的朋友快点来试试,更多关于KEGG通路自定义及Pathview的详细使用方法请戳:http://www.bioconductor.org/packages/release/bioc/html/pathview.html
转载请联系邮箱授权:circRNA@163.com
Go to Top