环状RNA(circRNA) 是一种新的调控性非编码RNA,参与多种生理和病理过程。然而,circRNAs结构与分子机制的相互关系尚不清楚。近期,bioRxiv在线发表了江苏省人民医院金晖博士与吉赛生物丁向明博士为共同通讯作者的文章,利用circRNA阵列和生物信息学分析,发现许多circRNAs中存在大量的内部互补碱基对序列(ICBPS),由此提出一种针对circRNA新颖的研究模型。
什么是ICBPS(内部碱基互补配对序列)?
研究者利用微阵列在对人血浆中circRNA表达情况进行分析时意外地发现ICBPS(内部碱基互补配对序列)广泛存在于circRNAs中,特别是在超长的circRNAs中(el-circRNAs,>5000nt)。为了进一步验证这个结论,研究者又对人类circRNA数据库进行了分析,结果发现大多数circRNAs的ICBPS最大长度(maxLen)在15nt内(图1a)。接着,作者针对 ICBPS大于20nt的6155个circRNAs进行了分析,发现大多数circRNAs不只有一对ICBPS;且超过2000个circRNAs含有多于20对的ICBPS(图1b)。此外,90%的circRNA,其ICBPS中位长度为20-31nt。最后研究者通过分别对circRNAs长度与ICBPS数量和最大长度进行相关性分析发现ICBPS的数量和最大长度与circRNAs的总长(circLen)密切相关(图1c,1d)。
CR(互补比)的计算
研究者定义了互补比(complementary ratio,CR)的概念, CR= [(maxLen of ICBPS)×2/circLen]×100%。CR越高,预示circRNAs内部碱基配对的可能性越大。然而通过计算数据库中circRNAs的CR,研究者发现,绝大多数的circRNAs其CR低于10%(图1e)。而对于CR高的circRNAs, circLen大部分都低于200nt。为更直观地理解CR这个概念,研究者例举了一个el-circRNA:hsa_circ_0000527。如图所示,hsa_circ_0000527全长6071nt,有3对ICBPS,其中最长的一对(红色显示)是123nt,所以CR =(123×2/6071)×100%= 4.05%。
ICBPS在circRNAs中的特点
另外,研究者计算了亲本基因不同区域转录出的circRNAs的ICBPS情况,发现60%源自3′-UTR的circRNAs的ICBPS≥20nt(图1g)。接着研究者对不同的染色体起源以及来自亲本基因的不同成分进行了相似统计分析(图1h)。
circRNAs可作为ceRNA通过MRE(miRNA recognition elements ,miRNA应答原件)竞争性结合miRNA。在对206个ICBPS的maxLen大于100nt的circRNA进行分析,发现其中64%具有MRE。
同时, 具有内部核酶进入位点(IRES)的circRNAs包含有翻译蛋白质的潜力,这可以通过对其开放阅读框(ORF)的生物信息学分析来预测。于是研究者基于circBank数据库,发现ICBPS≥20 nt的6155个circRNAs,23%ORF以及92%MRE与ICBPS有重叠(图1i)。
circRNA中双链结构具有“打开”和“关闭”两种状态
综合以上分析结果,研究者推测circRNAs可能不是简单的圆环结构。由于ICBPS的存在,它内部可能包含双链结构(在图2a中显示为A和A’)。此外,还可能存在一些特殊情况。例如,可能有一部分ICBPS可与多个ICBPS互补配对(在图2a中显示为B和B’/ B’)。或对于一个连续序列,它可能具有彼此靠近或重叠在同一RNA链上的不同互补序列(在图2a中显示为C,D和C’,D’)。因此,研究者推断circRNAs中双链结构的“打开”或“关闭”状态是一个复杂的动态过程。
双链结构的形成使circRNAs在空间中受到压缩,这可能有助于RNA结合蛋白(RBP)与circRNAs的结合更为牢固,从而促进circRNAs从细胞核输出到细胞质中(视频截图1)。circRNAs形成双链结构的过程或许是可逆的,如上述的circRNAs出核后再“打开”双链结构,从而进一步行使其相关功能。此外,circRNAs高度稳定,外界尚未阐明circRNAs的降解机理。研究者推测circRNAs中的双链结构可能会使它们更容易被相关酶降解,这或许可以解释细胞如何“清除”circRNAs(图2b)。而这一动态过程受微环境(氧含量,温度等)或其他内部因素(ICBPS的长度,结合自由能,配对片段之间的距离,RNA的二级结构或RNA修饰)调节,调控circRNAs出核、翻译、降解。另外需要强调的是,当circRNAs的相关位点由于碱基配对的发生而被“封闭”时,circRNAs作为miRNA的海绵及其转录后调控行为将会受到阻碍(视频截图2)。同时,由于某些circRNA可以通过核糖体进行翻译,但当circRNA中的相关位点由于碱基配对的发生而被“封闭”时,这种情况将会被阻止(视频截图3)。
实际上,一些研究对ceRNA的机制提出了质疑:某些circRNA被预测能够结合特定的miRNA从而调节下游靶基因,而这一预测不能通过相关实验得到很好地证明。另一方面,某些circRNAs的丰度变化无法有效地调控目标基因。基于这种现象,作者提出了特定circRNAs从正常状态向病态过渡的“开-闭效应”假设:对于那些具有封闭ICBPS的circRNA,即使它们高表达,也可能发挥不了相应的生物学功能;对于那些表达相似甚至更低的circRNA,它们也可能通过“开放”相关的ICBPS发挥重要作用,反之亦然(图2c)。
讨论
综上所述,作者推测circRNA可能不是一个简单的环状结构,其内部可能含有双链结构,双链结构的“开”或“闭”是一个复杂的动态过程。如果这一假设是正确的,则说明circRNA在疾病的发生和发展中的作用不一定是通过其异常表达实现,也可能是通过序列上相关位点的“开-闭效应”。如果某个circRNA同时具有致癌和抑癌miRNA结合位点,那它可能选择性地“打开”或“关闭”特定miRNA结合位点,因此起到不同的作用。此外,该模型可能有助于为以下问题提供新的思路和证据:1)某些circRNA无法使用根据引物设计原则设计的引物进行扩增和验证; 2)为什么某些circRNA对它们的预测靶标miRNA没有影响; 3)circRNA如何从细胞核输出到细胞质中(特别是el-circRNA); 4)circRNA是如何被降解的; 5)m6A如何调节circRNA编码蛋白质; 6)有助于加强对el-circRNA的功能研究。该假设可能会改变现有的circRNA研究模式,更重要的是,将改变基于测序进而筛选出表达异常circRNA,作为潜在研究指标的基本逻辑认知。
参考文献
1. Handong Sun. et al. CircRNA may not be “circular”; bioRxiv 2020.09.27.315275 (2020).