最近,来自中科院上海生科院计算生物所——德国马普计算生物学伙伴研究所杨力教授团队于Genomics Proteomics Bioinformatics国际学术期刊在线发表了升级版的circRNA数据库的进展“CIRCpe{Piwecka, 2017 #307}dia v2: An Updated Database for Comprehensive Circular RNA Annotation and Expression Comparison”。该研究通过整合六种物种circRNA数据,发布了升级版的circRNA数据库CIRCpedia v2http://www.picb.ac.cn/rnomics/circpedia/),介绍了基于前版数据库CIRCexplorer2的基础上,CIRCpedia v2数据库的新特性、检索、浏览、下载和circRNA表达差异分析等新功能。

 

CIRCpedia v2的新特性

1. CIRCpedia v2数据库通过对来自GEO(https://www.ncbi.nlm.nih.gov/geo/), ENCODE (https://www.encodeproject.org/) 和 EMBL-EBI (https://www.ebi.ac.uk/)数据库的涵盖六个物种(包含人、小鼠、大鼠、斑马鱼、果蝇和线虫)的185个RNA-seq数据集进行分析,再经CIRCexplorer2预测具有反向剪接方式的circRNAs

2. CIRCpedia v2数据库对circRNAs进行了综合全面性的信息注释,同时在不同物种、组织和细胞中分析了一个基因的多种反向剪接事件;

3. 对于single-read 和paired-end测序数据集,都可以利用FPM值定量circRNA的表达情况;

4. 通过LiftOver分析人和小鼠circRNAs序列保守性;

5. CIRCpedia v2利用新版JBrowse可视化观察circRNAs在基因组的位置,另外新增“Tool”功能可直接对不同circRNAs在不同组织和细胞中表达差异进行分析

CIRCpedia v2的使用方法

1. 首先进入http://www.picb.ac.cn/rnomics/circpedia/网站(建议使用IE浏览器),可看到CIRCpedia v2的四大功能:检索、浏览、下载和表达差异分析工具;还有来自六个物种的185 RNA-seq数据集的分析情况,大部分数据集中在人、小鼠和果蝇上;

2. 进入“search检索界面,设置好需要研究的物种(species),组织和细胞类型(cell),研究的基因名称或者位置或者circID,就可以进行检索,检索界面如下,可根据需要选择显示不同数据注释方式(circRNA、A5BS、A3BS);点击“gene”下的基因名称,就会链接到genecard网站,以便更全面地了解该基因的信息(该功能目前局限于人源基因,而不适用于其他物种);“ExonStart–ExonEnd”显示同一基因在不同细胞中不同的剪接方式包含的外显子;“cell line”显示该基因在这种细胞中特异反向剪接方式(但是检索结果中无法直接下载circRNAs的具体序列,只能下载circRNAs的检索汇总信息);

3. 点击检索结果中“location”(但是无法直接链接到基因组的位置)或者页面顶部的“browse”,进入的界面都是相同的,这个时候需要复制检索结果中的基因组位置“Chr10:17233586–17235889”,粘贴到界面顶部右边的红框内,检索的可视化结果如下,根据需要放大或者缩小,下方可看到检索的circRNA名称“HSA_CIRCpedia_75849”;

单击相应的“HSA_CIRCpedia_75849”后,可出现该circRNA的相关信息和具体序列,点击“FASTA”,可下载具体的circRNA序列;

4. 点击“download”进入下载界面,修改注释方式表格和物种,都可以轻松下载相应的数据,其中A5BS和A3BS数据等待时间需要久点;选择某种cell line下载的话,下载可能会出错,建议选择all,后续再对下载文件进行筛选;

5. 点击“tool”进入差异表达分析界面,该功能是CIRCpedia v2的一大亮点,可以对多种circRNA在同一物种的不同组织或者细胞系中分析其表达差异情况,并以热图或者点图的方式显示出来,以供下载;一般规定了基因组位置的circRNA,则规定了相应的物种;研究者可选择在不同的组织和细胞中比较表达差异,再以两种图显示出来。

优点:CIRCpedia v2数据库提供了更综合性的circRNA注释信息,涵盖6个物种共185个RNA-seq数据集分析结果,主要通过CIRCexplorer2和 MapSplice计算流程统计获得了262,782个circRNA分子,其中包括73,972个可变反向剪接事件。CIRCpedia v2具有检索、可视化浏览、下载相应物种分析的数据和分析不同circRNAs在物种中表达差异等功能,提供不同领域的circRNA研究人员更好地查询目的基因生成不同剪接方式的环形RNA的详细信息,以便更好地认识临床上环形RNA的功能和潜在应用背后的分子机制。

缺点:但是网站中检索结果中人性化的下载序列功能、可视化浏览直接定位功能和物种间保守性百分比显示功能,有待进一步完善。自定义下载功能也有待进一步优化,另外,不同circRNAs在同一物种中表达差异分析结果的显示图可以进一步多样化,以适应研究者的需要。

 

发表评论