本期特邀北京市神经外科研究所、首都医科大学附属北京天坛医院江涛教授团队分享解读,感谢对circRNA平台的关注!
2023年10月28日,北京市神经外科研究所、首都医科大学附属北京天坛医院江涛教授团队在国际生物信息学领域权威学术期刊Nucleic Acids Research(14.9)在线发表题为“circRNADisease v2.0: an updated resource for high-quality experimentally supported circRNA-disease associations”的数据库论文。博士后孙志延、研究生杨昌霖、助理研究员黄立杰博士和香港科技大学莫宗超博士为共同第一作者,北京市神经外科研究所、附属北京天坛医院江涛教授、赵征副研究员与北京博奥晶典生物技术有限公司孟凡琳高级工程师为共同通讯作者。
graphic abstract
近年来,科学家们发现了一种不同于传统线性RNA的新型RNA,即环状RNA(circRNA)。环状RNA通过基因组DNA的正常转录形成一个共价封闭的环结构。相比线性RNA,环状RNA在各种生物物种中表达丰富且相对稳定,包括病毒和哺乳动物。越来越多的研究表明,环状RNA与疾病表型之间存在密切关联。然而,对于circRNA与疾病关系的系统收集研究相对不足。
为了填补这一研究空白,2018年4月江涛教授团队发布了circRNADisease v1.0数据库(https://www.nature.com/articles/s41419-018-0503-3)。经过系统核实800多篇已发表的文献,并收集整理了330种circRNA和48种疾病。现在,他们推出的circRNADisease v2.0数据库是对之前版本的全面升级。团队系统地回顾了超过12,000篇已发表的文献,并手动整理并收集了6,998个circRNA与疾病的关系,其中涉及4,246个circRNAs、330种疾病以及12个物种(图1)。此外,为了系统探究遗传变异对circRNA功能的潜在影响,团队还在30种TCGA人类癌症中鉴定了7,417,841个基因突变与circRNAs的关系。
图1.circRNADisease v2.0的数据扩展和特性。(A)数据收集。(B)数据处理。(C)数据库开发。
与其他数据库相比,circRNADisease 2.0具有五个独特的特点:
(1)数据库收录的疾病谱相较上一版本有了极大的扩充,更新后的疾病种类远超上版本数倍;
(2)circRNA的功能更全面,特别是有关circRNA在疾病中的生物功能、circRNA参与疾病的分子机制等内容也在新版数据库得到体现;
(3)提供了基于circRNA表达的患者预后状态,使circRNA与临床疾病的关系更为紧密;
(4)此版本不仅收集了人类的circRNA-疾病关系,还包括其他物种,如小鼠、大鼠等;
(5)新开发的“Circ2Mut”模块,可用于探索30种人类癌症中circRNA位点上的突变。
为了满足circRNA研究的需要,circRNADisease v2.0数据库将持续收集circRNA与疾病的关联关系,并定期进行数据库的更新。团队致力于引入额外的分析工具,以增强数据库的功能,并计划将大量的生物数据和基于网络的功能性工具整合到circRNADisease 2.0数据库中。这将为科学家探究circRNA在疾病中的作用提供重要的信息资源。
用户使用手册
在circRNADisease v2.0中,搜集的文献数据经过精心组织,使用MySQL 14.14进行管理,并采用关系模式进行存储。这种组织结构将在未来的更新中继续得到支持,以确保与之前版本保持一致。该网站的代码是使用Java Server Pages(JSP)编写的,并使用Eclipse软件开发的Java Servlet框架来构建的。该网站托管在Tomcat 6.0.44 Web服务器上,并在CentOS 6.5 Linux系统上运行。数据和结果可视化是通过jQuery和dataTable生成、渲染和处理的。在“浏览”模块中,使用了zTreeStyle生成树状结构。该网站在Google Chrome v115.0.5790.170和Safari v15.4浏览器中经过了全面的测试。
与以前的版本相比,此次更新收集了更多的circRNA与疾病的关系(表1),同时重新设计了用户友好的网络界面(图2)。具体更新的功能如下:
表1. circRNADisease v2.0与v1.0更新要点比较。
图2.circRNADisease v2.0更新后各功能模块界面。(A)“Search”模块的界面提供了四种搜索方式,分别按circRNA、疾病、宿主基因和microRNA。(B)“Browse”模块的界面。(C)“Browse或“Search模块的详细结果界面。(D) “Circ2Mut”模块的接口。(E)“Submit”模块的接口。(F)“Download”模块界面
基于circRNADisease v2.0,发现过去几年来,越来越多的研究探索了circRNA与疾病之间的关系(图3A)。当前版本的circRNADisease v2.0记录了12个物种(包括人类、小鼠、猪、秀丽隐杆线虫、鸡、牛、山羊、猪、大鼠、绵羊、病毒、海参)中6998个经实验证实的circRNA与疾病的关联(图3B)。此外,一些circRNA(如circ_HIPK3、circ_CDR1和circ_PVT1等)和DO疾病(如胃癌、肝细胞癌、结直肠癌等)在circRNA研究领域得到广泛研究(图3C、D)。这些关于circRNA的持续研究在揭示疾病机制和促进新的治疗策略的开发方面起着至关重要的作用。
图3.circRNA社区广泛研究的统计。(A)按年出版的科学文献的数量。(B)不同物种涉及的circRNA与疾病的关系。(C) circRNA中十大前沿研究circRNA与疾病关系的数量社区。(D) circRNA界前10大前沿研究疾病的circRNA-disease关系数。
Home:网站主页介绍了这个项目的动机、信息收集、数据库内容和统计信息。此外,网站还提供了一个方便的搜索工具,使用户能够快速搜索广泛研究的circRNAs、宿主基因、疾病和miRNAs。所有记录都显示在搜索结果页面上。
Search:circRNADisease v2.0作为一个综合性平台,提供了四种不同的搜索方式:circRNA、宿主基因、疾病和miRNAs。例如,在搜索界面中,用户可以检索circRNA和疾病之间的关联。此外,该界面便于根据检测方法和特定的组织、细胞系或PDX来进行筛选。在结果页面上,用户可以使用模糊搜索输入来进行过滤、排序和下载结果表格。
Browse:新版网站重新设计了浏览页面,以提供对不同分类中的circRNA-疾病关系的访问,例如物种、circRNA ID/名称/同义词、circRNA宿主基因以及基于疾病本体的统一疾病名称。为了进一步提高用户效率,网站支持模糊搜索工具。这些工具能够通过密切匹配和近似用户输入来迅速准确地检索结果,即使存在轻微的变化或拼写错误。这一实施显著提高了整体用户体验,提供了更灵活和宽容的搜索功能。类似地,在搜索结果页面上,用户可以浏览每个条目的更多详细信息。这个功能允许用户深入了解他们感兴趣的具体信息,增强了他们对浏览结果的理解和探索。
Circ2Mut:Circ2Mut是一个高级模块,用于检索circRNA位点内的突变。Circ2Mut专注于识别circRNA位点内的突变,帮助研究人员发现影响circRNA功能的遗传变异。它允许研究人员探索circRNA位点内的突变,最终促进对疾病背景下异常circRNA生物合成和表达的更深入理解。
Download:circRNADisease v2.0中收集的所有数据都可以免费访问。用户可以从专用的“下载”页面下载整个数据集,或选择感兴趣的特定部分。此外,用户可以通过“搜索”和“浏览”模块上的结果界面方便地访问结果数据,提供个性化查询并在搜索后下载结果表格。
Submit & Help :circRNADisease v2.0 鼓励科研人员通过主页上的Submit 模块提交有关circRNA最新的研究成果(包括但不限于,circRNA的名称,学术成果的PubMed ID,涉及的疾病,具体的调控方式以及更多的细节描述)。同时也鼓励研究者通过Help界面获得网站使用的系统教程。
示例演示
circRNADisease v2.0数据库应用举例。在搜索模块的“Search by Disease”页面中,用户可以通过选择“human”物种,输入“brain glioma”作为疾病关键字,检索与人类胶质瘤相关的circRNAs研究。这项研究得出了人类大脑胶质瘤和circRNAs之间的186种记录关系。例如,circNEIL3已被鉴定为ADAR1表达的调节剂,通过充当miR-432-5p的海绵,导致胶质瘤相关癌基因1 (GLI1)的RNA编辑。这一过程最终影响细胞周期进程,促进胰腺导管腺癌(PDAC)细胞的上皮-间质转化(EMT)。Pan等人发现,在脑胶质瘤的情况下,通过circNEIL3稳定IGF2BP3,诱导EWSR1促进胶质瘤的进展,促进外泌体介导的巨噬细胞免疫抑制极化。因此,circRNADisease v2.0提供了circrna -疾病关系的基本总结信息,并促进了进一步的研究。
原文链接:
https://doi.org/10.1093/nar/gkad949