ACTIVITIES学习

创新创业平台

19--circBase数据库最新信息详解

因此,这个数据库还是灰常良心和稳定的,自2014年发布以后,一直有人在投入维护,并且在行业内形成一个良性循环,诸如提供circRNA的命名规则,提供UCSC gemone browser信息等。

功能介绍

首先我们来看数据库上涵盖的数据信息,截至发稿,主要包括的测序物种有Homo sapiens, Mus musculus, Caenorhabditis elegans, Latimeria等。

circBase获取数据主要有以下三种方式:

• simple search

• List search

• Table browser

涵盖绝大多数简易搜索的词条,包括输入DNA or RNA序列后,使用Blat获取反向互补序列或者获得包含circular junctions的circRNA序列;符合规则的输入基因组位置能够获得circRNA overlapping repeats等一系列信息;当然也可以通过简单的关键词搜索,获得标准格式的12-column BED文件。简单的搜索内容如下图:

下载数据格式包括.xlsx, tab-separated .txt以及FASTA format,FASTA文件通常以tar.gz打包。在数据库上,作者非常友好的将如何发现circRNA所需要的所有代码(其实就是find_circ),以及用于测试的自测RNA-seq数据放入downloads页面,详细内容可见README。

注意事项

关于数据标签的展现形式,比如circBase上hg19 for H. sapiens, mm9 for M. musculus and ce6 for C。因此可以通过liftOver上进行转换。


本文转载自《生信草堂》。如有侵权,请联系删除。



关注微信

获取电子资讯

版权所有©山西医科大学 2022

| 忘记密码
注册说明

您好!感谢您关注清华x-lab创意创新创业教育平台。

在填写之前,请确认您项目的核心团队至少有一名成员是清华的在校生、校友及教师