“出道即巅峰”的edgeR或DESeq被广泛应用于高通量测序的差异表达分析,包括环状RNA的差异表达分析。

 

然而,做过环状RNA差异表达分析的老师应该都清楚,反向剪切(back-splicing)的环状RNA并不像mRNA或lncRNA那样驯服。

 

独特的环状结构让二代测序较短的读长限制了对其鉴定以及定量,目前仅仅依靠其反向剪切序列;另外,环状RNA的表达总是与来源基因(host gene)线性RNA的表达纠缠不清,让我们很难区分差异是来源于反向剪切还是只是来源基因的副产物。

 

对此,许多软件在识别上下功夫,比如DCC、CIRCexplorer、CIRI等等,然后用DESeq2或edgeR进行差异分析;而另一些软件在定量上使劲,对环状 RNA 的定量不仅仅使用反向剪切序列(BSJ),而且考虑到来源基因线性分子表达的影响,使用BS ratio进行定量,例如DCC、CIRI2、CIRIquant以及CLEAR。当然这种定量就不适合用于DESeq2或edgeR,一般可以用DCC::CircTest或CIRIquant等软件进行差异分析。

 

DEBKS介

 

而最近北大基础医学院杨恩策团队提出了环状RNA差异分析的新方法DEBKS,对BS ratio进行了优化(公式及图解如下)。


对此,DEBKS设计了4个模块(见下面的流程图)

1. merge,整合不同样品的环状RNA

2. count,对来源基因的线性RNA进行定量

3. anno,评估环状RNA长度

4. dec,检测差异表达环状RNA

 

以及两个差异表达模式

1. paired,配对的样品

2. unpaired,非配对的样品

 

性能评估

 

作为一款工具,我们需要首先对其性能进行评估。

 

作者首先用了两套公共数据集检测了DEBKS识别差异环状RNA的检出率并用RT-qPCR进行了验证;随后,用模拟数据对DEBKS以及其他软件进行了评估,评估内容包括

1. 重复样品表达一致性检验

2. AUC,真阳性率以及假阳性率

3. 差异表达基因检测敏感性

4.来源基因表达对差异环状RNA的影响

 

通过比较,DEBKS具有更优秀的性能并且更少受来源基因表达的影响。

 

局限性

由于需要包含线性剪切位点的表达(LJC),因此,DEBKS只能应用于既包含环状 RNA又包含线性RNA的测序,例如rRNA-depleted RNA-seq或exome capture RNA-seq。

 

另外,基因间区的环状RNA由于缺乏线性分子的表达,因此无法用DEBKS评估。

 

结束语

 

虽说目前差异分析几乎被edgeR/DESeq包揽,然而面对复杂多样的生物学情景以及日益增长的多组学信息,分析工具的多样性和特异性是非常有必要的。

环状RNA研究越发蓬勃,然而专门的工具却仍旧匮乏,另外,有些工具走着走着就丢了。虽然DEBKS在文章中提到表现比较优秀,然而能不能成为环状RNA研究的利刃,仍需要大量真实数据去检验。

参考文献

1. Liu Z, Ding H, She J, et al. DEBKS: A Tool to Detect Differentially Expressed Circular RNA[J]. bioRxiv, 2020.

发表评论