之前已经简单叙说了转录组分析中的热图,也提到了热图的本质 —— 矩阵数据,值被颜色替换。从基因芯片开始,翻阅各种涉及组学的文章,基本上都能看到热图的身影,但大部分热图都是一个模子。就算是“小苹果”那样的神曲也会过时,科学绘图也会产生审美疲劳,所以有时候为了衣服漂亮的图可谓搜肠刮肚。看来,深厚的“PPT功底”在科研领域也必不可少。
————————— 多图预警 ———————————————————–
数据大观
我们先来看一看哪些数据上常常用热图来展示
- 基因组 SNP 在染色体上的密度分布
- 行为染色体,列为样品,颜色为 SNP 的密度。
- SNP 连锁不平衡热图(LDheatmap)
- 行为 SNP,列为 SNP ,颜色为连锁不平衡程度。
- 转录组 高表达或差异表达基因热图
- 行为基因,列为样品,颜色为表达值。
- 代谢组 代谢物浓度改变热图
- 行为代谢产物,列为样品,颜色为代谢物浓度的改变。
- 宏基因组 菌群富集浓度热图
行为菌群家族,列为组织样品,颜色为菌群浓度。
- qPCR 验证基因表达热图
- 行为基因,列为样品,颜色为表达值。
- 相关性 计算样品相关性热图
- 行为样品,列为样品,颜色为相关性。
- 基因表达相关性热图
- 行为基因,列为基因,颜色为相关性。
可以看到,在基因研究不同层面热图都能大展拳脚,的确是数据可视化中的一把尖刀。当然,这完全适用于当前数据的特性和人们的认知 —— 虽然我们生活在多维空间里,然而在数据采集、储存时往往以二维表格的形式表现。
千姿百态
在信息爆炸的时代,仅仅依靠改变热图的颜色已经无法再满足人们对数据多元可视化的需求。下面展示了热图的一些变种以飨观众:
- 相关性热图
- 这里展示将相关性值由颜色替换为形状、数值等表现形式。
- circos 与热图碰撞
- circos 图也大受欢迎,除了图片让人赏心悦目,最主要的是图片能展示更多丰富的信息。这里只展示了一个简单的环化后的热图。
- ggtree 系统发生树与热图
- 热衷于 R 包开发的 Y 叔又带给大家一个好用的系统发生树的可视化工具 ggtree。
- 热图结合柱状图等其他图形
- 将热图与其他图形结合,展示了更丰富的信息。
透过形形色色的热图可以看到,尽管数据是“干巴巴”的,但科研工作者那颗“爱美之心”却让其焕发光彩。
最后温馨提示,爱美固然重要,但数据还是要原滋原味哦。