简介

最近,由武汉大学的何春江教授和吴莹教授以及德洲农工大学Leng Han教授等团队联合开发的数据库更新啦!此前,他们的团队开发了一个癌症特异的 circRNA 数据库(CSCD),而这一次,他们带来了全新版本——CSCD2。该数据库收集了大量的人类癌症相关的转录组测序数据,再进一步分析整合,被开发成一个癌症特异的 circRNA 综合相互作用数据库,为科研人员探索 circRNA 在癌症中的功能和调控研究提供了一个新的资源平台。

该数据库有如下特点:

· 收集了人类癌症超过 1000 个样本(825 个组织和 288 个细胞系)的转录组测序数据

· 鉴定了大量的 circRNA:1013461 个癌症特异性 circRNA1533704 个来自正常样本的 circRNA 以及 354422 个来自癌症和正常样本的 circRNA

· 使用来自超过 200 个 RBP 和 2000 个 miRNA 的结合基序来预测潜在的 miRNA-circRNA 和 RBP-circRNA 相互作用关系

· 预测了 circRNA 的潜在全长和开放阅读框序列

· 所有分析后的数据可供用户下载

数据来源

作者从 ENCODE 和 SRA 数据库中获取转录组测序数据后,首先进行了与癌症相关特异性的 circRNA 鉴定,期间共使用了四种常用的鉴定工具:CIRI2、 circRNAfinder、find_circ 和 CIRCexplorer2。基于这些 circRNA,作者预测了 miRNA-circRNA 和 RBP-circRNA 潜在相互作用关系。另外,作者还预测了这些 circRNA 的潜在全长和开放阅读框序列。

图1. CSCD2 数据来源

基于以上数据信息,CSCD2 主要分为三个模块:circRNA、miRNA 和 RBP,我们逐一来看一下。

circRNA 模块

在该模块中,用户可以通过选择样本类型、样本名称和基因 symbol 来浏览 circRNA,并且可以通过 circRNA ID(即基因组坐标,例如,chr10:50804406|50804552)进行搜索。搜索结果会在列表中显示,包括亲本基因 symbol、线性基因结构、UCSC 基因组浏览器链接、样本类型、样本来源、构成、识别算法、lncRNA/mRNA 注释、circRNA 与线性 RNA 的比率以及对应的 circBase ID等丰富的信息。此外,还提供了过滤和排序功能,供用户按 read counts、算法数量、基因组区域和列排序过滤表格。

图2. circRNA 模块界面

miRNA 模块

在该模块中,用户可以通过在搜索框中选择样本类型或 miRNA ID(例如 let-7-5p/98-5p)来浏览。可以同时检索多个ID。搜索结果会在列表中显示,包括circRNA ID、miRNA ID、比对位点、位点类型、打分、TCGA 表达情况等信息。同样也提供了过滤和排序功能,供用户按位点类型、算法数量、基因组区域和列排序过滤表格。

图3. miRNA 模块界面

RBP 模块

在此模块中,用户可以通过在搜索框中选择样本类型或 RBP 基因 symbol 来浏览。可以同时检查多个基因 symbol。搜索结果包括 RBP 表达情况、结合位点、RBP 的基因组坐标以及 RBP 基因 symbol 和信息等。同样还提供了按基因组区域和按列排序过滤功能。

图4. RBP 模块界面

结语

通过 CSCD2 数据库的这三大模块,我们从中可以获取癌症相关的 circRNA 以及相应的 miRNA 和 RBP 等丰富信息。circRNA 的所有文件均可提供下载,包括基因组坐标、基因注释、junction reads、ORF、全长序列以及与 miRNA 或 RBP 的相互作用关系等信息,方便广大科研人员对感兴趣的分子进行研究。

数据库使用体验

小编上手使用了之后发现,该数据库的搜索响应很快,搜索结果简洁明了,但仅能通过 circRNA 基因组坐标查询,无法使用基因名或circBase ID。另外数据库还提供了 TCGA 临床数据,但是仅仅针对于 miRNA-circRNA 预测结果,稍微有些遗憾,希望未来还能提供其他方面的临床数据。

其他环状RNA癌症数据库

旧版本——CSCD 数据库文章,推荐阅读:

Nucleic Acids Research在线发布肿瘤特异性circRNA数据库

此外,还有其他与癌症相关的 circRNA 数据库,比如:

· MiOncoCirc

推荐阅读:荐读 | 重磅! Cell杂志同期发表两篇circRNA研究文章

· circExp

推荐阅读:circExp——一个新的癌症转录组在线分析平台

· CircRic

· …

 

参考文献

[1] Jing F , Wenbo C , Xin D . CSCD2: an integrated interactional database of cancer-specific circular RNAs[J]. Nucleic Acids Research, 2021.

发表评论