2020年10月7日,Cancer Letters(IF=7.360)杂志上在线发表了一篇题为“Translation of noncoding RNAs and cancer”的文章,总结了用于识别和验证非编码RNA编码的肽/蛋白的现有方法、工具和数据库,并对非编码RNA编码的肽/蛋白在癌症中的新发现进行了汇总。该文章的第一作者为陆军军医大学的大四在校本科生周波,通讯作者为北部战区总医院刘娇博士陆军军医大学肖煜峰博士

人类基因组包含数千个非编码RNA,它们过去被认为缺乏开放阅读框(ORF),无法被翻译。据报道,非编码RNA在生理调节和各种疾病中发挥着重要的功能,包括表观遗传调控、染色质重塑、蛋白质修饰和RNA降解,但大多数非编码RNA的功能仍不清楚。通过核糖体分析和测序技术的应用和发展,越来越多的研究发现了非编码RNA的翻译。在这篇综述中,总结了识别和验证非编码RNA编码的肽/蛋白的工具、方法和数据库,也回顾了这些非编码RNA编码的肽/蛋白质在癌症中的作用。此外,讨论了非编码RNA编码的肽/蛋白的重要潜在应用并列出了一些与研究非编码RNA编码的肽/蛋白相关的挑战。这篇综述的意义提供了一个理论基础来促进发现更多由非编码RNA编码的肽/蛋白,并帮助进一步开发新的诊断和预后癌症标志物以及治疗靶点。

 

1. 非编码RNA编码的肽/蛋白的识别和验证

ORF是以起始密码子开始,以终止密码子结束的核酸序列,它对于RNA的翻译是必要的。要识别非编码RNA中隐藏的肽/蛋白,必须首先识别具有编码潜力的ORF。这些具有编码潜力的ORF具有序列同质性和序列保守性这两个特点。目前已经开发了一些工具来识别非编码RNA中具有编码潜能的ORF,包括CPC、ORF-RATER、sORF finder和ORFscore等。

 

核糖体对于RNA的翻译也是必要的元件,因此识别与核糖体相关的非编码RNA也是判断其是否有编码潜力的一个标准。Ingolia等人首先提出了核糖体分析,它可以测出核糖体保护的RNA并提供翻译区域阅读的定量信息。目前RiboTaper、RibORF、TOC和PROTEOFORMER已被开发来用于发现与核糖体相关的非编码RNA。其中RiboTaper基于核糖体分析数据识别翻译区域,可以检测翻译的表达水平。该方法可以识别翻译后的ORF序列,并对翻译后的ORF进行总结。

 

另外也需要测序技术来更好地识别有翻译能力的非编码RNA。但是,核糖体测序和RNA测序有一定的局限性,如短序列阅读、逆转录和扩增偏倚。现在新的测序技术,如Oxford Nanopore sequencing和PacBio single-molecule, real-time (SMRT) sequencing,已经解决了这些问题来促进了发现新的全长非编码RNA。一些基于测序技术的工具也被用来研究非编码RNA的编码能力,例如,COME、CPAT、PORTRAIT、PhyloCSF、RNAcode可以预测RNA的编码能力。

 

为了获得更多关于非编码RNA的信息,从而更好地评估非编码RNA的编码潜力,一些关于非编码RNA的数据库是必不可少的,相关的数据库已列在表1。除了这些数据库之外,许多方法被开发出来来验证非编码RNA的编码能力。CRISPR-Cas9基因编辑策略可以设计将一个表位标签插入到一个预测能编码肽/蛋白的ORF来形成标签融合肽/蛋白。标签融合肽/蛋白也可以通过构建质粒产生。之后可通过western blot、免疫沉淀和免疫荧光检测标签融合肽/蛋白来证明非编码RNA中预测的ORF被翻译成肽/蛋白。另外质谱(MS)可用于验证翻译的肽/蛋白,蛋白质基因组学也可用于确定新的肽/蛋白。

表1  用于识别非编码RNA编码的肽/蛋白的数据库

整合的蛋白基因组学分析工作流(IPAW)能够识别、管理和验证新的肽/蛋白。IPAW包含三个主要阶段:发现、管理和验证。在发现阶段,通过两种类型的蛋白质基因组学搜索来输出候选的新的肽/蛋白。在管理阶段,一些候选的新肽/蛋白被淘汰。BLASTP分析可以去除与已知蛋白质数据库(Uniprot、Ensembl、Refseq和Gencode)精确匹配的候选的肽/蛋白。在验证阶段,筛选的新肽/蛋白将根据不同水平方面的数据进行评估。这些方面包括:(1) RNA测序数据,(2) 核糖体数据,(3) CAGE数据,(4)保守性(PhyloP)等。因此,IPAW可以识别新肽/蛋白并且通过管理和验证来保证高精确度。

 

2. 长非编码RNA编码的多肽/蛋白质

 

最初,长非编码RNA被定义为长度超过200个核苷酸且缺乏ORF编码能力的RNA。通过染色质重塑、转录调控、翻译调控、RNA剪接、RNA降解、RNA编辑和miRNA海绵等活动,长非编码RNA在许多细胞过程中发挥关键作用。最近的研究表明,长非编码RNA可以通过编码肽段来发挥功能。

 

2.1 在结肠癌中长非编码RNA编码的肽/蛋白

 

长非编码RNA HOXB-AS3编码了一个抑制结肠癌生长的含53个氨基酸的肽。临床上,低丰度HOXB-AS3的结肠癌患者预后较差。通过竞争性结合hnRNPA1 RGG,HOXB-AS3肽会对抗hnRNPA1介导的PKM剪接的调节,导致PKM2的形成减少和葡萄糖代谢重编程的抑制,从而抑制了结肠癌的生长。综上所述,该发现提示了结肠癌中癌症代谢重编程的一种新的调节机制。

 

最近,Yan, G.R.等人发现结肠癌中有两种长非编码RNA编码两种不同的功能肽/蛋白。第一个具有编码能力的长非编码RNA是LOC90024。LOC90024编码了一个含130个氨基酸的蛋白,可促进结肠癌的肿瘤发生和发展。SRSF3是一种重要的剪接因子,在RNA选择性剪接中起着重要的调控作用。由于LOC90024编码的蛋白与SRSF3相互作用调节mRNA的剪接,因此LOC90024编码的蛋白被命名为“剪接调控小蛋白”(splicing regulatory small protein, SRSP)。与正常组织相比,结肠癌中SRSP水平升高,且SRSP上调水平与结肠癌患者的恶性表型及不良预后呈正相关,提示SRSP可能具有致癌作用。SRSP与SRSF3相互作用来增加SRSF3和转录因子Sp4的结合,这个结合导致了较长的Sp4同质蛋白 (L-Sp4蛋白质)的形成,该蛋白包含了一个有致癌作用的转录激活的结构域。这些结果表明SRSP在结肠癌中起着致癌作用,揭示了SRSP可能是一种潜在的预后生物标志物和治疗靶点。重要的是,该研究提示了长非编码RNA编码的蛋白/肽可以通过RNA的选择性剪接来调控基因的表达,从而发挥癌症相关的功能。

 

第二个具有编码能力的长非编码RNA为LINC-00266-1。LINC-00266-1编码了一个名为RBRP的肽。RBRP在结肠癌中显著升高,且RBRP高表达的结肠癌患者预后不良,提示RBRP可能发挥致癌作用。RBRP是m6A阅读器的一个新的调控亚基,参与了在RNA上的m6A识别。RBRP与m6A阅读器IGF2BP1相互作用,增强了IGF2BP1对癌基因c-Myc的mRNA的m6A识别,导致了RNA稳定因子HuR、MATK3和PABPC1的招募来提高其mRNA的稳定性和c-Myc水平。这个研究揭示了LINC-00266-1产生了一个具有致癌作用的小肽,可以促进肿瘤发生和转移,更有意义的是,该研究发现了长非编码RNA编码的肽/蛋白与RNA的m6A通路之间存在联系。

 

2.2 长非编码RNA编码的肽在肝癌中的表达

 

最近的一项研究揭示了非编码RNA编码的肽可以促进肝细胞癌的发生。通过核糖体结合蛋白RPS6的核糖体测序,研究人员筛选出了一个含有59个氨基酸的肽,名为SMIM30,由非编码RNA LINC00998编码。SMIM30在肝癌组织中高表达,而且SMIM30的高表达与肝癌患者较差的生存率相关。SMIM30在体内外均能促进肝癌细胞的增殖和迁移。SMIM30具有一个ɑ螺旋的二级结构,是酪氨酸激酶SRC/YES1的膜锚定和激活状态的重要适配器,可激活MAPK信号通路,促进肝癌的发展。因此,LINC00998编码的SMIM30可能是一种新的肝癌预后指标,为肝癌的靶向治疗提供依据。

 

2.3 长非编码RNA编码肽在三阴性乳腺癌中的作用

 

三阴性乳腺癌(Triple-negative breast cancer, TNBC)是一种总体生存率较低的乳腺癌亚型,不表达最常见的三种乳腺癌标记物:孕酮受体、雌激素受体(ER)和HER2/neu癌基因(HER2)。目前,Zhou Y.F等人进行了两项研究,在TNBC中发现了两个长非编码RNA编码的功能肽。LINC00908编码了一个在TNBC中差异表达的含有60个氨基酸的肽,名为ASRPS。LINC00908在TNBC中表达下调,且ASRPS的低表达与TNBC患者的较差的生存相关。研究表明ASRPS直接与STAT3结合,抑制STAT3的磷酸化,导致VEGF表达降低,从而降低肿瘤血管生成。这些结果表明,LINC00908编码的ASRPS能够抑制TNBC血管生成,是一种有效的抗肿瘤的肽。因此,ASRPS靶向TNBC血管生成可能是一种新的靶向的治疗方法。

 

另外LINC00665编码了一个含55个氨基酸的名为CIP2A-BP的功能肽。在TNBC中,LINC00665的翻译受TGF-β激活的Smad信号通路而减少。临床实验表明,LINC00665编码的肽CIP2A-BP在TNBC中表达降低,低表达CIP2A-BP与TNBC患者生存和肿瘤转移不良相关。在MMTV-PyMT小鼠模型中,乳房垫注射CIP2A-BP可显著减少肺转移并提高总生存率。CIP2A- bp可与PP2A竞争性结合癌基因CIP2A,从而释放PP2A活性。PP2A减少了AKT的磷酸化来抑制PI3K / AKT / NFκB通路,导致了MMP2、MMP9、 Snail表达水平的降低,因此抑制了TNBC侵袭和转移。总之, LINC00665的翻译通过CIP2A / PP2A和PI3K / AKT / NFκB信号通路促进肿瘤侵袭转移,因此CIP2A-BP是一个有治疗潜力的抗TNBC的肽。

3. 环状RNA编码的多肽/蛋白质

 

环状RNA是一类新类型的非编码RNA,它们缺少5 ‘ cap或3 ‘ tails,形成了共价封闭的环状结构,由于这种结构,环状RNA避免了外切酶,这使得它们比线性RNA更稳定。环状RNA的许多功能已被阐明,例如环状RNA可以作为miRNA海绵,控制转录,调控蛋白定位,并进行mRNA剪接,有趣的是,越来越多的证据表明环状RNA编码的肽/蛋白来发挥功能。环状RNA的翻译已经在丁型肝炎病毒、人类活细胞和类病毒中被检测到,但尽管如此,环状RNA仍被认为不能编码肽。之后circ-ZNF609和circ-Mbl这两个环状RNA的翻译的确认挑战了传统的观点,环状RNA翻译的概念才逐渐被接受。

 

目前有两种主要的环状RNA翻译调控机制正在研究中。第一个是位于环状RNA上的m6A。m6A是RNA碱基的一种腺苷甲基化修饰,可促进环状RNA翻译的有效起始。环状RNA的翻译被m6A去甲基化酶FTO减少,被腺苷甲基转移酶METTL3/14增加。先前的一项研究发现,大约一半的雄性生殖细胞环状RNA含有m6a修饰的ORF。MS检测到这些环状RNA序列编码的数百条多肽,提示这些环状RNA可以被翻译成肽/蛋白。实现环状RNA翻译的第二个机制涉及到环状RNA的IRES。IRES是一个RNA元件,可以直接招募核糖体到环状RNA的内部位置进行翻译。由于环状RNA缺乏帽子结构,所以环状RNA的翻译应通过IRES进行,IRES可促进核糖体与被翻译的环状RNA结合。

 

3.1 胶质母细胞瘤中环状RNA编码的多肽/蛋白

 

研究者发现环状RNA的翻译与癌症相关,并发现了一种新的肿瘤抑制蛋白(SHPRH-146aa)。在胶质母细胞瘤细胞中过表达SHPRH-146aa可以降低恶性行为,胶质母细胞瘤患者SHPRH-146aa的升高可以延长患者的生存时间。机制上,SHPRH-146aa作为一种保护性诱饵分子,保护SHPRH不被泛素蛋白酶体降解。全长的SHPRH作为E3连接酶可以泛素化PCNA,从而抑制细胞增殖和肿瘤发生。

 

Circ-AKT3通过重叠的起始和终止密码子编码了一个新的蛋白(AKT3-174aa)。Circ-AKT3在胶质母细胞瘤组织中表达水平低于相邻成对的正常组织。过表达AKT3-174aa可降低胶质母细胞瘤细胞的增殖。RTK/PI3K/AKT通路在许多癌症的发生发展中发挥重要作用,而紊乱的RTK/PI3K信号被认为是胶质母细胞瘤肿瘤发生的主要途径之一。与AKT3功能相反的AKT3-174aa与磷酸化的PDK1竞争性作用,降低了AKT-thr308的磷酸化,因此AKT3-174aa在PI3K/AKT信号通路中发挥负调控作用。

 

FBXW7基因的外显子3和4产生一个环状RNA (circ-FBXW7),在正常人脑中高表达。在IRES的驱动下circ-FBXW7的ORF编码一种新的蛋白(FBXW7-185aa)。circ-FBXW7的表达与胶质母细胞瘤患者的总生存期呈正相关。其中circ-FBXW7高表达的恶性胶质瘤患者中位生存时间为24.2个月,而circ-FBXW7低表达的恶性胶质瘤患者中位生存时间为11.7个月。重要的是,FBXW7-185aa的过表达抑制了体内外癌细胞的增殖和细胞周期。机制上,USP28是一种去泛素化酶,可结合并稳定癌基因c-Myc,FBXW7-185aa与USP28相互作用并拮抗USP28诱导的c-Myc去泛素化。因此,该肽通过拮抗USP28诱导的c-Myc的稳定,降低了c-Myc的半衰期。

 

3.2 环状RNA编码肽在膀胱癌中的作用

 

Circ-Gprc5a在膀胱癌干细胞中表达上调。circ-Gprc5a过表达促进膀胱癌干细胞的转移和自我更新,而下调circ-Gprc5a表达则相反。Gprc5a是膀胱癌干细胞所需的重要蛋白,因为Gprc5a敲除的细胞显示膀胱癌干细胞比例降低,并且transwell实验揭示了Gprc5a在膀胱癌转移的重要性。Circ-Gprc5a编码出与Gprc5a结合的肽,在膀胱癌干细胞中高表达。研究人员建立了circ-Gprc5a突变的细胞,这些突变细胞不能产生肽,导致circ-Gprc5a功能受损,这些发现提示需要该肽来促进膀胱肿瘤的发生和转移。因此circ- circ-Gprc5a-peptide-Gprc5a通路在膀胱癌转移和膀胱癌干细胞的自我更新中发挥作用。

 

3.3 环状RNA编码的蛋白在肝癌中的作用

 

Circ-β-catenin在肝癌组织中比在邻近的正常组织中表达更高。Circ-β-catenin的沉默抑制了体内外恶性表型。GSK3β与β-catenin相互作用并磷酸化,导致β-catenin的降解。Circ-β-catenin产生了一个含370个氨基酸的蛋白,名为β-catenin-370aa,该蛋白与GSK3β竞争性结合来阻止GSK3的蛋白与β-catenin结合,从而拮抗GSK3蛋白诱导的β-catenin的降解,导致了激活Wnt通路。综上所述,Circ-β-catenin编码了β-catenin-370aa,通过Wnt通路调控肝癌细胞的生长和转移。

 

3.4 环状RNA编码的多肽/蛋白在结肠癌中的作用

 

Circ-FNDC3B主要定位于细胞质中,与正常组织相比,其在结肠癌组织中的表达降低。低circ-FNDC3B表达的患者比高表达的患者的总生存期短。有趣的是,circ-FNDC3B编码了一个新的蛋白circ-FNDC3B-218aa。值得注意的是,circ-FNDC3B抑制结肠癌细胞的增殖、侵袭和迁移,而非circ-FNDC3B。机制上,circ-FNDC3B-218aa降低了Snail的表达,进而促进了FBP1在结肠癌中的抑癌作用,导致了抑制肿瘤进展和上皮-间质转化。因此,circ-FNDC3B-218aa可能成为结肠癌的潜在治疗靶点。

 

circ-PPP1R12A的表达在结肠癌组织中显著升高,且circ-PPP1R12A水平较高的患者总体生存期明显缩短。Circ-PPP1R12A携带ORF, ORF编码功能。Circ-PPP1R12A -73aa。circ-PPP1R12A -73aa,而不是circ-PPP1R12A,能促进结肠癌的增殖、迁移和侵袭。此外,circ-PPP1R12A-73aa通过激活Hippo-YAP信号通路来促进结肠癌的生长和转移。这一发现可能为结肠癌提供新的潜在的治疗靶点。

 

Circ-Lgr4是结肠癌中高表达的环状RNA。Circ-Lgr4表达下调抑制结肠癌干细胞的自我更新和结肠癌的发生和侵袭,而Circ-Lgr4过表达则发挥相反的作用。Circ-Lgr4以肽依赖性的方式驱动结肠癌干细胞的自我更新。Circ-Lgr4编码的肽与Lgr4相互作用并激活Lgr4,进而促进Wnt/β-catenin信号通路的激活。因此,circ-Lgr4-peptide-Lgr4轴可用于治疗结肠肿瘤发生的靶点。

 

长非编码RNA、环状RNA编码了在癌症中发挥重要作用的肽/蛋白。因此,非编码RNA编码的多肽/蛋白可能成为抑制肿瘤生长的药物靶点和诊断或预测癌症患者预后的生物标志物。尽管非编码RNAs的翻译有很大的前景,但有几个问题需要解决。其他非编码RNA(如tRNAs、rRNAs、snoRNAs)能否成为新的肽/蛋白资源?如何优化现有技术来发现、确认与疾病相关的肽/蛋白?非编码RNAs翻译的调控机制还有哪些?因此,需要进一步的研究来探索和解答这些问题。非编码RNA的翻译提供了一种新的分子机制,参与了癌细胞复杂的调控网络,并扩展了蛋白质组的版图。非编码RNA的翻译是一个新的研究热点,隐藏在非编码RNA中的肽/蛋白可以作为人类生物学和疾病研究的新来源,此外也需要进一步探索发现新的有价值的肿瘤相关肽。

 

参考文献

1. B. Zhou, H. Yang, C. Yang, Y.-l. Bao, S.-m. Yang, J. Liu, Y.-f. Xiao, Translation of noncoding RNAs and cancer, Cancer Letters (2020), doi: https://doi.org/10.1016/ j.canlet.2020.10.002

发表评论