目前识别环状RNA的方法存在检出率低以及在不同数据集中表现的性能不一致的问题,因此,检测算法可能会由于丢失相关的 circRNA 而使高通量研究结果产生偏差。
最近由意大利帕多瓦大学分子医学系的Enrico Gaffo教授和Stefania Bortoluzzi教授开发的一个生物信息学工具——CirComPara2 ,通过结合多种 circRNA 检测方法,在模拟数据集和不同的真实数据集中,还能始终保持较高的检出率而不损失精度,可谓是一大利器,文章发表在 Briefings in Bioinformatics (IF=11.622) 期刊上。

·当前的 circRNA 检测方法在不同的数据集上表现的性能不一致
·现今的 circRNA 检测方法可能会忽略掉感兴趣的circRNA
·CirComPara2 通过对7种方法的结合,在不损失精度的前提下实现了较高的检测召回率
·无论生物学背景如何,CirComPara2 的表现始终优于其他方法

图1. 常见的检测方法和 CirComPara2 方法忽略掉的 circRNA
此外,作者还在 142 个真实的 RNA-seq 公共数据集上评估了这 9 种预测工具,这些数据集分别来自 6 个独立的研究,包括人类细胞系,人类、恒河猴和小鼠的各种组织。根据这些工具在真实数据集上的 F1 评分进行排名,结果是CirComPara2 的分值最高(0.91),且差异显著(q < 0.001,图2e),显著优于其他工具。

图2. circRNA 检测方法在模拟和真实数据集上的性能
总之,与最先进的工具相比,CirComPara2 通过增强对真实可靠 circRNA 的检测,实现了对 circRNA 表达更全面的研究,并减小了单一方法产生的偏差,从而为科研人员在不同的生物环境和物种中的研究提供了可靠的 circRNA 预测方法。