“出道即巅峰”的edgeR或DESeq被广泛应用于高通量测序的差异表达分析,包括环状RNA的差异表达分析。
然而,做过环状RNA差异表达分析的老师应该都清楚,反向剪切(back-splicing)的环状RNA并不像mRNA或lncRNA那样驯服。
独特的环状结构让二代测序较短的读长限制了对其鉴定以及定量,目前仅仅依靠其反向剪切序列;另外,环状RNA的表达总是与来源基因(host gene)线性RNA的表达纠缠不清,让我们很难区分差异是来源于反向剪切还是只是来源基因的副产物。
对此,许多软件在识别上下功夫,比如DCC、CIRCexplorer、CIRI等等,然后用DESeq2或edgeR进行差异分析;而另一些软件在定量上使劲,对环状 RNA 的定量不仅仅使用反向剪切序列(BSJ),而且考虑到来源基因线性分子表达的影响,使用BS ratio进行定量,例如DCC、CIRI2、CIRIquant以及CLEAR。当然这种定量就不适合用于DESeq2或edgeR,一般可以用DCC::CircTest或CIRIquant等软件进行差异分析。
DEBKS介绍
而最近北大基础医学院杨恩策团队提出了环状RNA差异分析的新方法DEBKS,对BS ratio进行了优化(公式及图解如下)。
对此,DEBKS设计了4个模块(见下面的流程图)
1. merge,整合不同样品的环状RNA
2. count,对来源基因的线性RNA进行定量
3. anno,评估环状RNA长度
4. dec,检测差异表达环状RNA
以及两个差异表达模式
1. paired,配对的样品
2. unpaired,非配对的样品
性能评估
作为一款工具,我们需要首先对其性能进行评估。
作者首先用了两套公共数据集检测了DEBKS识别差异环状RNA的检出率并用RT-qPCR进行了验证;随后,用模拟数据对DEBKS以及其他软件进行了评估,评估内容包括
1. 重复样品表达一致性检验
2. AUC,真阳性率以及假阳性率
3. 差异表达基因检测敏感性
4.来源基因表达对差异环状RNA的影响
通过比较,DEBKS具有更优秀的性能并且更少受来源基因表达的影响。
局限性
由于需要包含线性剪切位点的表达(LJC),因此,DEBKS只能应用于既包含环状 RNA又包含线性RNA的测序,例如rRNA-depleted RNA-seq或exome capture RNA-seq。
另外,基因间区的环状RNA由于缺乏线性分子的表达,因此无法用DEBKS评估。
结束语
虽说目前差异分析几乎被edgeR/DESeq包揽,然而面对复杂多样的生物学情景以及日益增长的多组学信息,分析工具的多样性和特异性是非常有必要的。
环状RNA研究越发蓬勃,然而专门的工具却仍旧匮乏,另外,有些工具走着走着就丢了。虽然DEBKS在文章中提到表现比较优秀,然而能不能成为环状RNA研究的利刃,仍需要大量真实数据去检验。
参考文献
1. Liu Z, Ding H, She J, et al. DEBKS: A Tool to Detect Differentially Expressed Circular RNA[J]. bioRxiv, 2020.