当前位置:首页 » 操作系统 » GenBank数据库

GenBank数据库

发布时间: 2023-03-23 03:56:34

⑴ Genbank序列包含什么

用户可以通过NCBI(National Center for Biotechnology Information美国国家生物技术信息中心信息中心,隶属于NLM-美国国家医学图书馆)的主页使用GenBank。GenBank的宗旨是鼓励科研团体对DNA序列的获取,从而促进数据库中DNA序列的丰富和更新,所以NCBI对GenBank的数据使用与发送没有任何限制。用户可从GenBank主页上下载Banklt(NCBI提供的WWW格式,用于便捷的提交DNA序列的数据)、sequin(NCBI的独立于操作系统的提交软件,可用于MAC、PC和UNIX平台,也可以通过FTP远程获取)以及VecScreen(带菌污染物的筛选工具)等便于提交和更新研究成果的应用软件。
其页面上的简单检索界面提供19种相关检索选项,分别是:PubMed、Protein(蛋白质)、Nucleotide(核苷)、Structure(结构)、Genome(基因组)、PMC、LocusLink、PopSet、OMIM、Taxonomy(分类学)、Books(图书)、ProbeSet、3D Domains(三维区域)、UniSTS、Domains、SNP、Journals(期刊)、UniGene、NCBI Web Site(NCBI站点)。GenBank可以与DNA Star软件结合使用,进行基因序列分析和比对。GenBank是一个开放获取的序列数据库,对所有公开可利用的核苷酸序列与其翻译的蛋白质进行收集并注释。 此数据库是国际协作核酸序列数据库(INSDC)的一部分,由美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)主管,NCBI为美国国立卫生研究院的下属机构。GenBank和它的合作者从全球各个实验室接收了超过百万种生物的数据。Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献着作和生物学注释。它的数据直接来源于测序工作者提交的序列、由测序中心提交的大量EST序列和其它测序数据、以及与其它数据机构协作交换数据而来。
Genbank每天都会与欧洲分子生物学实验室(EMBL)的数据库,和日本的DNA数据库(DDBJ)交换数据,使这三个数据库的数据同步。到1999年8月,Genbank中收集的序列数量达到460万条,34亿个碱基,而且数据增长的速度还在不断加快。Genbank的数据可以从NCBI的FTP服务器上免费下载完整的库,或下载积累的新数据。NCBI还提供广泛的数据查询、序列相似性搜索以及其它分析服务,用户可以从NCBI的主页上找到这些服务。

⑵ ncbi是什么数据库

NCBI是美国国家生物技术信息中心,建立于1988年。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统,除了建有GenBank核酸序列数据库之外,NCBI还可以提供众多功能强大的数据检索与分析工具。

NCBI是National Center for Biotechnology Information的缩写,指美国国家生物技术信息中心,建立于1988年。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统,除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。

⑶ 向genbank提交数据的软件有几种,各有什么的特点

两种。
GenBank是由美国国立生物信息中心(NCBI)创建维护的核酸序列数据库,在世界三大生物信息学数据库中数据存储量最大,应用最为广泛.本研究采用文档处理语言Perl,设计开发针对GenBank序列记录检索及处理软件GenScalpel,这一应用对生物学实验室是迫切的.利用正则表达式设计及E-utilities等技术,GenScalpel应用程序对GenBank序列格式(GBF)进行解析,实现的主要功能包括有序列数据在线检索及本地获取,特征序列(集)类归及提取,序列文件批处理等.GenScalpel应用程序具备友好的图形用户界面,并符合Entrez数据检索系统最新接口标准,经测试,能够稳定,高效地为生物学家提供工具应用。

⑷ genbank号是什么

登录号。GenBank是一个开放获取的串行数据库,对所有公开可利用的核苷酸串行与其翻译的蛋白质袜旁进行收集并注释,genbank号是登录号,是序列申请时,系统分配的一个序列收录号。GenBank是美国国家生物技告渗橡术信息中心建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大规模基因组测序计划喊判。

⑸ 1.请谈谈如何在GenBank数据库中下载文献资料

1.打开GenBank数据库,界面如下:

2.点击Entrez,进入Entrez界面,界面如下:

3.在search across databases框中输入要下载的资料名称,如rbp4,得到下面的结果:

4.点击第二个标签,出现下面的结果:

5.点击Full Text 就得到想要的文献,如下:(这里只截取了一部分)

⑹ GenBank数据库的介绍

GenBank 是一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。

⑺ Genbank数据库与EMBL数据库格式的差异

一种特殊的文件格式!表示数据库文件,foxbase,dbase,visual
foxpro,等数据库处理系启知汪统所产生的数据库文件!
打开悄仔方式
dbf
viewer
pro
是一个用于
windows
下的
dbf
数据库文件管理器。
可猛拆用foxpro打开
还可用excel进行打开

⑻ genbank多久公开

七天。根据查询genbank使用方显示,genbank七天公开,GenBank属于一个序列数据库悔裂巧的国际合作组织, 包括EMBL和DDBJ。 是 NIH遗传序列碧键数据库,一个源吵所有可以公开获得的DNA序列的注释过的收集。genebank登陆号一星期可以获得,也就是七天。

⑼ DNA数据库的GenBank

大型数据库分成若干子库,有许多好处。首先,可以把数据库查询限定在某一特定部分,以便加快查询速度。其次,基因组计划快速测序得到的大量序列尚未加以注释,将它们单独分类,有利于数据库查询和搜索时“有的放矢”。GenBank将这些数据按高通量基因组序列(High Throughput Genomic Sequences,HTG)、表达序列标记(Expressed Sequence Tags,EST)、序列标记位点(Sequence Tagged Sites,STS)和基因组概览序列(Genome Survey Sequences,GSS)单独分类。尽管这些数据尚未加以注释,它们依然是GenBank的重要组成部分。
可通过Entrez数据库查询系统对GenBank进行查询。这个系统将核酸、蛋白质序列和基因图谱、蛋白质结构数据库整合在一起。此外,通过该系统的文献摘要数据库MEDLINE,可获取有关序列的进一步信息。在万维网上,进入NCBI的主页,可以用BLAST程序对GenBank数据库进行未知序列的同源性搜索(详见第六章)。
完整的GenBank数据库包括序列文件,索引文件以及其它有关文件。索引文件是根据数据库中作者、参考文献等子段建立的,用于数据库查询。GenPept是由GenBank中的核酸序列翻译而得到的蛋白质序列数据库,其数据格式为FastA。GenBank曾以CD-ROM光盘的形式分发,价格比较便宜。随着数据库容量的增长,一套最新版的GenBank需要12张光盘存放,不仅生产成本很高,也不便于使用。现在,光盘分发的方式已经停止,可以通过网络下载GenBank数据库。
GenBank中最常用的是序列文件。序列文件的基本单位是序列条目,包括核甘酸碱基排列顺序和注释两部分。目前,许多生物信息资源中心通过计算机网络提供该数据库文件。下面,我们介绍序列文件的结构。
序列文件由单个的序列条目组成。序列条目由字段组成,每个字段由关键字起始,后面为该字段的具体说明。有些字段又分若干次子字段,以次关键字或特性表说明符开始。每个序列条目以双斜杠“//”作结束标记。序列条目的格式非常重要,关键字从第一列开始,次关键字从第三列开始,特性表说明符从第五列开始。每个字段可以占一行,也可以占若干行。若一行中写不下时,继续行以空格开始。
序列条目的关键字包括代码(LOCUS),说明(DEFINITION), 编号(ACCESSION),核酸标识符(NID),关键词(KEYWORDS),数据来源(SOURCE),文献(REFERENCE),特性表(FEATURES),碱基组成(BASE COUNT)及碱基排列顺序(ORIGIN)。
代码LOCUS是该序列条目的标记,或者说标识符,蕴涵这个序列的功能。例如,图4.1中所示的HUMCYCLOX表示人的环氧化酶cyclooxygenase。该字段还包括其它相关内容,如序列长度、类型、种属来源以及录入日期等。说明字段是有关这一序列的简单描述,如本例为人环氧化酶-2的mRNA全序列。
序列代码具有唯一性和永久性,如本例中代码M90100用来表示上述人环氧化酶-2的mRNA序列,在文献中引用这个序列时,应该以此代码为准。核酸标识符NID对序列信息的当前版本提供?
关键词字段由该序列的提交者提供,包括该序列的基因产物以及其它相关信息,如本例中还氧化酶-2 (cyclooxygenase-2),前列腺素合成酶(prostaglandin synthase)。 数据来源字段说明该序列是从什么生物体、什么组织得到的,如本例中人脐带血管(umbilical vein)。次关键字种属(ORGANISM)指出该生物体的分类学地位,如本例人、真核生物等等。文献字段说明该序列中的相关文献,包括作者(AUTHORS),题目(TITLE)及杂志名(JOURNAL)等,以次关键词列出。该字段中还列出医学文献摘要数据库MEDLINE的代码。该代码实际上是个网络链接指针,点击它可以直接调用上述文献摘要。一个序列可以有多篇文献,以不同序号表示,并给出该序列中的哪一部分与文献有关。
FEATURES是具有自己的一套结构,用来详细描述序列特性的一个表格。在这个表格内,带有‘/db-xref/’标志的字符可以连接到其它数据库内(本例,您看到的是一个分类数据库(taxon 9606),以及一个蛋白质数据库(PID:g181254));序列中各部分的位置都加以标明,5’非编码区(1-97),编码区(98-1912),3非编码区(1913-3387),多聚腺苷酸序列(3367-3374),等等;蛋白质翻译的信号肽及最终的多肽也都有所说明。这个例子不能说很全面,但已经足以说明特性表给出信息的详细程度。
接下来是BASE COUNT记录,计算出不同碱基在整个序列中出现的次数(1010A,712个C,633个G,1032个T)。ORIGIN那一行,指出了序列第一个碱基在基因组中可能的位置。最后,核酸的序列全部列出,并以//作为结尾。

⑽ genbank是二级数据库吗

genbank不是二级数据库。根据查询相关资料信息,饥模根据需要从一级数据库中搜拿雀集对象的相关数据集合而成的就是二级数据库.像genebank,EMBL这种都是不加选择的一级数据库,消肢早只要是实验获得的。

热点内容
python字典使用 发布:2024-05-02 19:01:14 浏览:134
我的世界服务器联机ip 发布:2024-05-02 18:50:39 浏览:618
steam密码从哪里看 发布:2024-05-02 18:50:00 浏览:629
convertlinux 发布:2024-05-02 18:20:00 浏览:705
zxingandroid简化 发布:2024-05-02 17:47:53 浏览:189
贵州银行卡查询密码是什么 发布:2024-05-02 17:47:17 浏览:119
飓风算法没用 发布:2024-05-02 17:41:41 浏览:350
android铃声设置 发布:2024-05-02 17:40:01 浏览:485
php日记本 发布:2024-05-02 17:28:22 浏览:850
msc拒绝访问 发布:2024-05-02 17:19:09 浏览:122