来源:中科院之声
近日,中国科学院北京生命科学研究院赵方庆教授团队在《自然-实验手册》(Nature Protocols)上,发表了题为Full-length circular RNA profiling by nanopore sequencing with CIRI-long的研究论文,建立了环状RNA全长转录本解析和高效挖掘的技术体系。
近年的研究表明,环状RNA在真核生物体内具有广泛的生物学功能。环状RNA序列与线性RNA相似度高,因此如何高效鉴定环状RNA特有的外显子结构,是环状RNA研究中的重要问题。针对这一问题,赵方庆教授团队前期提出了CIRI-AS算法(基于BSJ读段对比结果对环状RNA内部可变剪接结构进行识别)。后续研究开发了CIRI-full算法(通过识别双端250bp测序数据中反向重叠区特征,对500bp以内的环状RNA进行全长重构)。由于上述方法主要基于短读长测序技术,难以对长度500bp以上的环状RNA的全长序列进行有效识别。在此基础上,研究组开发了基于纳米孔测序的环状RNA全长测定方法CIRI-long,实现了对不同长度环状RNA全长结构的高效鉴定。
该研究利用小鼠脑组织及人HeLa细胞系样本作为示例,阐释了环状RNA高效富集与全长测定方法:利用核糖体RNA去除试剂盒与改进的RNase R处理流程,消化RNA样本中的核糖体RNA与其余线性RNA分子,对环状RNA进行初步富集;利用随机引物逆转录与PCR扩增,构建cDNA文库。在该过程中,环状RNA模板可以发生滚环逆转录,产生含有多个环状RNA全长序列的嵌合体cDNA,而来自线性RNA的cDNA产物长度较短。
因此,后续流程中使用了片段筛选策略,对环状RNA来源的cDNA片段进行了进一步富集,从而有效提升了文库中环状RNA来源片段所占比例。该工作利用长读长纳米孔测序技术进行cDNA分子的全长测定,并使用该团队开发的CIRI-long算法对测序数据中的环状RNA序列进行识别与错误校正,从而获得高置信度的环状RNA全长结构。
前期研究观察到使用具有模板切换活性的逆转录酶,可以在滚环逆转录产生的cDNA末端直接引入PCR引物序列,从而实现对低起始量环状RNA的高效捕获(图1)。然而,该活性依赖5’RNA线性末端参与,因此不含5’与3’线性末端的环状RNA如何发生模板切换的原理尚未明确。该工作进一步利用体外转录构建的模式环状RNA探究滚环逆转录过程发现,经过逆转录后,大部分环状RNA模板发生了水解,从而提供了模板切换所需的线性5’末端。同时,在不加入逆转录酶的对照组中,环状RNA均保持了完整的环状结构。这提示环状RNA滚环反转录中的模板切换主要依赖RNA模板的线性化水解,为CIRI-long流程提供了重要的理论支持。
同时,该研究总结了CIRI-long方法的应用,提出了CIRI-long方法可为新型环状RNA如线粒体来源环状RNA或内含子自连型环状RNA的存在提供有力的支持证据。同时,重构获得的环状RNA全长序列可用于后续环状RNA的功能预测(如miRNA或RBP结合位点分析)。此外,利用长读长测序方法构建出的环状RNA序列,可作为评估基于传统二代测序技术的环状RNA拼接算法的标准数据集,为现有算法的改进提供指导方向。与近年开发的多个长读长环状RNA测序技术相比,CIRI-long方法实验步骤更为便捷,同时可实现对不同长度环状RNA全长结构的直接测定,可应用于多种组织与细胞样本,颇具应用前景。
研究工作得到国家自然科学基金国家杰出青年科学基金项目和重点项目的支持。
环状RNA滚环扩增及验证体系