CircRNAs在真核生物体内广泛表达,具有调控蛋白质功能和翻译多肽的作用。迄今为止,已在不同物种中鉴定出数百万个circRNAs,并开发了多个综合数据库,以揭示circRNAs在不同细胞和组织中的表达情况。与同源线性mRNAs相比,大多数circRNAs的表达水平较低,并表现出较高的组织和物种特异性。因此,大多数使用传统的RNA测序方法的研究无法充分描述单个细胞之间的内在异质性,单细胞水平上circRNAs的复杂性需要进一步探索。
随着单细胞全长转录组测序技术的发展,可以实现对单个细胞中circRNA进行鉴定,尽管效率较低,但仍可部分揭示单细胞分辨率下circRNAs的表达模式。单细胞水平的circRNAs表达及功能研究已成为circRNAs研究的新兴问题。
2022年6月10日,中国科学院北京生命科学研究院赵方庆团队在Nature Communications在线发表了题为Exploring the cellular landscape of circular RNAs using full-length single-cell RNA sequencing的文章。本研究中,作者使用大规模全长单细胞转录组测序结果,报告了circRNAs的单细胞表达谱。研究了circRNAs在不同组织、发育阶段和细胞状态中的单细胞表达模式。此外,与线性mRNAs相比,circRNAs具有更高的细胞特异性,大量单细胞RNA转录组测序结果的汇总,为揭示不同细胞类型或发育阶段中circRNAs的动态变化提供可能。
作者通过大规模的整合全长单细胞RNA测序数据,从circRNAs高度的细胞特异性表达、不同生理和病理阶段以及不同物种间的表达模式、转化应用三个方面,在单细胞水平对circRNAs的表达和应用进行了探究,并搭建了circSC在线平台,为circRNA研究提供丰富的资源。
一. CircRNAs具有高度的细胞特异性
从171项已发表的研究中收集了172,137个细胞的全长单细胞RNA测序数据,其中包括58种不同的人类和小鼠组织或细胞类型。通过建立基于单细胞转录组数据的circRNAs鉴定和整合分析方法,构建如图1b所示的单细胞RNA测序数据集分析和circRNAs检测流程。总之,40604个人类和131533个小鼠单细胞通过了质量控制(每个实验约1000个细胞,共172,137个细胞),并检测到这些细胞中的circRNAs用于下游分析。结果发现,在人类和小鼠样本中,约90%的单细胞RNA测序的特异性circRNAs在不到10个细胞中表达(图1j),这使得很难使用普通的RNA测序技术进行检测。全长单细胞RNA测序在揭示具有高细胞特异性的circRNAs方面具有高度的敏感性和可靠性,circRNA具有高度的细胞特异性表达。
图1.从大规模全长单细胞RNA测序数据集中发掘circRNAs
二. 不同生理病理阶段,不同物种间circRNAs表达模式
1. 脑circRNAs在神经元中呈现细胞特异性表达
CircRNAs在哺乳动物脑中高度富集,但是脑组织中的circRNAs的细胞表达模式未被探究。作者分别分析了14种共41911个人类脑细胞,并收集分析18份小鼠大脑样本。前10位最丰富的circRNAs在不同细胞类型中表现出保守的表达,但细胞类型特异性circRNAs在神经元、免疫细胞、胶质细胞和血管细胞之间表现出不同的模式,表明这些circRNAs具有高度的细胞特异性。表达水平较高的CircRNA更可能在两个物种中保持不变,而物种特异性circRNAs往往表达水平较低。
2. 胚胎发育过程中母体和受精卵细胞circRNAs表达
作者分析了11项人类和小鼠胚胎的研究,其中包含16个不同阶段的样本,包括卵母细胞到早期胚芽。分析显示circRNAs具有高度特异性表达,与线性对应物相比,circRNAs经历了更为显著的母体到合子的转变过程。CircRNAs的高度细胞特异性表达谱和合子CircRNA在胚胎发育中的大量激活,表明了这些母体和合子circRNAs在这一过程中的重要作用。
3. 人类乳腺癌转移中肿瘤间和肿瘤内circRNAs异质性
作者对20例不同管腔分期的乳腺浸润癌(BRCA)患者的26个原发性和转移性肿瘤单细胞序列样本进行研究。预后较好的低度恶性肿瘤(luminal A、luminal B和HER2阴性)的正常细胞和癌细胞比高度恶性三阴性乳腺癌(TNBC)细胞表达更多的circRNA,表明TNBC细胞中circRNAs的积累较少,进展速度较快。上皮-间充质转化(EMT)在肿瘤侵袭和转移中的重要作用,在EMT后期,观察到circRNA表达意外下降。尤其是,与正常细胞相比,癌细胞中的circRNAs表达水平在间充质阶段降低。间充质期正常细胞与癌细胞的差异表明,在EMT后期,circRNAs对肿瘤细胞增殖的聚集作用减弱。
三. CircRNAs作为生物标记物潜力和circSC数据库
CircRNAs的细胞类型特异性显著高于标记基因和随机对照基因,这进一步表明了circRNAs作为细胞类型生物标记物的能力。CircRNAs可以作为更好的细胞类型生物标记物,在某些细胞类型中发挥重要的生物学作用。
图2.circRNAs、标记基因和1000个随机选择的基因的细胞类型特异性
进一步将circRNAs在细胞内分布和免疫细胞中的circRNA特征矩阵集成到称为circRNA单细胞门户(circSC)的web服务器中。circSC门户网站提供包括细胞表达谱、差异表达结果以及在大量人类和小鼠细胞中识别的CircRNA目录等信息(图3)。circSC已作为一个单独的模块集成到circAtlas中(http://circAtlas.biols.ac.cn /),提供了方便的浏览和搜索感兴趣的circRNAs的单细胞和批量RNA序列表达模式的功能。该数据库可以作为探索circRNAs在胚胎发育、组织分化和癌症生物发生过程中动态变化的重要资源,并为circRNAs研究领域提供一个独特而有用的平台。
图3.circRNAs单细胞表达谱及数据平台—circSC
赵方庆,中国科学院北京生命科学研究院研究员。主要致力于建立高效的算法模型和实验技术,探索人体微生物与非编码RNAs的结构组成与变化规律,以期解析它们与人类健康和疾病的关系。赵教授在广州市生物产业联盟、广州吉赛生物科技股份有限公司联合主办的第十四届中国生物产业大会暨第六届环状RNA研究与转化论坛分享了环形RNA数据挖掘关键技术及在肿瘤研究中的应用的报告,为circRNAs研究的数据挖掘提供了高效的方法。
原文链接: https://doi.org/10.1038/s41467-022-30963-8