GenBank
基因銀行(GenBank)是一個開放獲取的序列數據庫,對所有公開可利用的核苷酸序列與其翻譯的蛋白質進行收集並註釋。
內容 | |
---|---|
有機體 | 所有 |
相關信息 | |
研究中心 | NCBI |
發佈日期 | 1982年 |
訪問入口 | |
數據格式 | |
網站 | NCBI |
下載地址 | ncbi ftp |
網絡服務地址 | |
工具 | |
Web | BLAST |
Standalone | BLAST |
其他 | |
許可 | Public domain-US Government |
此數據庫是國際協作核酸序列數據庫(INSDC)的一部分,由美國國家生物技術信息中心(NCBI)主管,NCBI為美國國立衛生研究院的下屬機構。GenBank和它的合作者從全球各個實驗室接收了超過百萬種生物的數據。
成立三十年來,GenBank數據庫成為了最重要的也是最有影響力的生物全領域數據庫,其數據正被全球數以百萬計的研究人員獲取與引用。GenBank中的數據量正以每18個月翻一番的速度持續指數增長[1][2],在2013年2月的版本194中,數據庫包含有1.62億個序列,含有1500億個核苷酸堿基。[3]
歷史
1979年,洛斯阿拉莫斯國家實驗室(LANL)理論生物學和生物物理學小組 (頁面存檔備份,存於互聯網檔案館)的Walter Goad等人建立了洛斯阿拉莫斯序列數據庫,最終成為了公共的 GenBank數據庫的前身[4]。1982年,由美國國立衛生研究院、美國國家科學基金會、美國能源部和國防部共同出資,LANL與BBN科技公司合作,成立了GenBank。到1983年底,已有超過2,000個序列被存儲在GenBank。
在20世紀80年代中期,史丹福大學的Intelligenetics bioinformatics公司與LANL合作經營着GenBank項目[5]。作為最早的互聯網生物信息學社區項目,GenBank計劃為生物學家打造一個開放獲取的BIOSCI/Bionet消息社群。1989到1992年,GenBank被轉移到新成立的美國國家生物技術信息中心[6]。
發展
在GenBank的版本162.0(2007年8月)的發行說明中道出:「從1982年到現在,GenBank中的鹼基數每隔18個月翻一番。」[7]
截至2013年7月8日[update],GenBank的版本196.0已有165,740,164個基因座,152,599,230,112個鹼基,165,740,164個報導序列[3]。 GenBank數據庫還包括一些額外的數據集,不包括在這個統計內。
物種 | 鹼基對 |
---|---|
智人 Homo sapiens | 1.6310774187×10 10 |
小家鼠 Mus musculus | 9.974977889×10 9 |
褐鼠 Rattus norvegicus | 6.521253272×10 9 |
家牛 Bos taurus | 5.386258455×10 9 |
玉米 Zea mays | 5.062731057×10 9 |
野豬 Sus scrofa | 4.88786186×10 9 |
斑馬魚 Danio rerio | 3.120857462×10 9 |
紫色球海膽 Strongylocentrotus purpuratus | 1.435236534×10 9 |
普通獼猴 Macaca mulatta | 1.256203101×10 9 |
水稻 Oryza sativa Japonica Group | 1.255686573×10 9 |
紅花煙草 Nicotiana tabacum | 1.197357811×10 9 |
非洲爪蟾 Xenopus (Silurana) tropicalis | 1.249938611×10 9 |
黑腹果蠅 Drosophila melanogaster | 1.11996522×10 9 |
黑猩猩 Pan troglodytes | 1.008323292×10 9 |
擬南芥 Arabidopsis thaliana | 1.144226616×10 9 |
家犬 Canis lupus familiaris | 951,238,343 |
釀酒葡萄 Vitis vinifera | 999,010,073 |
原雞 Gallus gallus | 899,631,338 |
大豆 Glycine max | 906,638,854 |
普通小麥 Triticum aestivum | 898,689,329 |
另見
- Ensembl
- Human Protein Reference Database (HPRD)
- 序列分析
- UniProt
- 已測序真核生物基因組列表
- 已測序古菌基因組列表
- RefSeq — the Reference Sequence Database
- Geneious — includes a GenBank Submission Tool
參考文獻
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Wheeler, D. L.; et al. GenBank. Nucleic Acids Research. 2008, 36 (Database): D25–D30. PMC 2238942 . PMID 18073190. doi:10.1093/nar/gkm929.
- ^ Benson D; Karsch-Mizrachi, I.; Lipman, D. J.; Ostell, J.; Sayers, E. W.; et al. GenBank. Nucleic Acids Research. 2009, 37 (Database): D26–D31. PMC 2686462 . PMID 18940867. doi:10.1093/nar/gkn723.
- ^ 3.0 3.1 GenBank release notes. NCBI. [2013-12-02]. (原始內容存檔於2016-12-22).
- ^ Hanson, Todd. Walter Goad, GenBank founder, dies. Newsbulletin: obituary. Los Alamos National Laboratory. 2000-11-21 [2013-12-02]. (原始內容存檔於2008-11-07).
- ^ LANL GenBank History. [2013-12-02]. (原始內容存檔於2016-03-03).
- ^ Benton D. Recent changes in the GenBank On-line Service. Nucleic Acids Research. 1990, 18 (6): 1517–1520. PMC 330520 . PMID 2326192. doi:10.1093/nar/18.6.1517.
- ^ Dennis A. Benson, Mark Cavanaugh, Karen Clark, Ilene Karsch-Mizrachi, David J. Lipman, James Ostell, Eric W. Sayers. GenBank. Nucleic Acids Research. 2013-01, 41 (Database issue): D36–42 [2019-02-12]. ISSN 1362-4962. PMC 3531190 . PMID 23193287. doi:10.1093/nar/gks1195. (原始內容存檔於2020-05-14).
- ^ Benson DA, Karsch-Mizrachi I, Lipman DJ, Ostell J, Sayers EW. GenBank. Nucleic Acids Res. January 2011, 39 (Database issue): D32–37. PMC 3013681 . PMID 21071399. doi:10.1093/nar/gkq1079.
- 本條目引用的公有領域材料來自美國國家生物技術信息中心的文檔《NCBI Handbook》。
外部連結
- GenBank (頁面存檔備份,存於互聯網檔案館)
- Example sequence record, for hemoglobin beta
- BankIt (頁面存檔備份,存於互聯網檔案館)
- Sequin (頁面存檔備份,存於互聯網檔案館) — a stand-alone software tool developed by the NCBI for submitting and updating entries to the GenBank sequence database.
- EMBOSS (頁面存檔備份,存於互聯網檔案館) — free, open source software for molecular biology
- GenBank, RefSeq, TPA and UniProt: What's in a Name?(頁面存檔備份,存於互聯網檔案館)
- GenBank File-Format Converter (頁面存檔備份,存於互聯網檔案館)