“看山不是山”,本期一起来欣赏一张“山脊图”。
一、简介
熟悉组学分析的小伙伴们都知道,基因集富集分析(GSEA)是绕不开的话题,它是另一种用于基因集合功能探究的方法。GSEA的可视化图类型相对较少,下图即是其中一种展示方式:
这张图看起来十分高级,层层堆叠的曲线,如同一座座连绵的小山,我们可以将其称为“山脊图”。本质上,它是一种密度图,以一条中心线为基准,两侧呈现出数据的分布情况。这张图为我们展示了基因集之间的富集情况以及富集通路的核心富集基因的表达分布情况。在基因集富集分析中,通常核心富集基因会在某个表达水平上集中分布,在这种情况下就会形成类似于正态分布的曲线,从而展现出“山脊”的模样。通过观察山脊图,我们可以直观地了解核心基因在不同通路中的表达水平,从而揭示富集通路的活跃程度和差异。
那这种强大的工具又是出自何手?
熟悉往期推文的朋友可能猜到了,enrichplot——一个非常强大的R包,通过其内置的ridgeplot函数,只需几行代码,就可以生成一个美观而富有信息量的“山脊图”。同时,它还提供了丰富的参数选项,可以根据个人需求进行定制,例如调整线条颜色、线宽、填充类型和颜色等。
二、图解
横轴:
表示富集通路的核心富集基因表达倍数log2转换值的分布范围;
纵轴:
表示各通路中富集基因分布的频率;
图例:
各富集通路的p值,并通过渐变颜色表示值的变化,颜色越红表示越显著。
三、应用
这种“山脊图”在富集通路分析中具有重要的应用价值。通过展示核心基因的表达分布,我们可以更好地理解富集通路的功能和调控机制,这对于生物学研究和药物开发具有重要意义。例如,在癌症研究中,我们可以用来展示与肿瘤相关的富集通路的核心基因的表达分布,从而揭示肿瘤的发生机制和潜在治疗靶点。
轻舟已过万重山,小伙伴们快去“乘舟破浪”吧。
关于enrichplot的详细使用方法请戳:
http://www.bioconductor.org/packages/release/bioc/html/enrichplot.html