美國國家生物技術資訊中心

数据库

國家生物技術資訊中心National Center for Biotechnology Information,簡稱NCBI)是美國國家醫學圖書館(NLM)的一部分(該圖書館是美國國家衛生研究所的一部分)。NCBI位於美國馬里蘭州貝塞斯達,建立於1988年。

NCBI的logo

NCBI設置有與生物技術和生物醫學相關的一系列數據庫,是生物資訊學工具和服務的重要資源。 主要數據庫包括DNA序列GenBank,和生物醫學文獻書目數據庫PubMed。 其他數據庫包括NCBI表觀基因組數據庫英語NCBI Epigenomics。 所有這些數據庫都可以通過Entrez搜尋引擎在線獲取。

許多受尊敬的研究者在NCBI工作,如比較基因組學領域的一位多產的科學家尤金·庫寧BLAST序列數據庫搜索算法的作者Stephen Altschul

NCBI在研究數據庫r3data.org的註冊表中列出[1]

GenBank

NCBI自1992年開始負責維護DNA序列數據庫英語Biological databasesGenBank。GenBank數據庫每日都會實時更新並和另外兩家數據庫(歐洲的EMBL與日本的DDBJ)交換數據,以確保三家數據庫的序列數據的一致性[2]。自1992開始,NCBI陸續將其它數據庫與GenBank整合起來,包括Gene、在線人類孟德爾遺傳數據庫、 分子模型數據庫(一個蛋白質三維結構數據庫)、dbSNP(一個單核苷酸多態性數據庫)、Reference Sequence Collection(一個人類基因組圖譜)以及分類學瀏覽方式和美國國家癌症研究所提供的癌症基因組剖析計劃英語Cancer Genome Project數據。NCBI也對每一個物種都設立了一個分類編號(taxonomy ID number)。

NCBI提供的一些在線軟件可供FTP或WWW瀏覽,比如BLAST序列相似性比對程序,可在15秒內完成與GenBank數據庫的序列比較。

NCBI書架

NCBI書架是一個集合了可以自由獲取、下載的線上精選生物醫學書籍資料庫。截至2011年4月,書架有845本書籍,涵蓋廣泛的主題包括分子生物學生物化學細胞生物學遺傳學,和微生物學。從分子和細胞從角度分析的疾病狀態、研究方法,和病毒學。一些書是以前出版的圖書的在線版本,而其他如Coffee Break(書)是由NCBI的工作人員編寫和編輯。書架是同行評審EntrezPubMed庫的期刊摘要的補充,因為它能提供前沿領域的已確立的觀點,並整理許多不同的零散的研究報告。

基本本地比對搜索工具(BLAST)

BLAST是用於計算生物序列之間的序列相似性的算法,例如DNA的核苷酸序列和蛋白質的氨基酸序列[3]。BLAST是查找與同一生物體內或不同生物體中的查詢序列相似的序列的有力工具。 它搜索NCBI數據庫和服務器上的查詢序列,並將結果以選定的格式發佈回該人員的瀏覽器。BLAST的輸入序列大部分採用FASTA或Genbank格式,而輸出可以以各種格式(如HTML,XML格式和純文本)傳送。 HTML是NCBI網頁的默認輸出格式。 NCBI-BLAST的結果以圖形格式顯示,找到所有命中結果,具有具有得分相關數據的命中結果的序列標識符的表格,以及感興趣序列的比對以及用於這些的類似BLAST得分的命中結果[4]

Entrez

Entrez全球查詢跨數據庫搜索系統在NCBI中用於所有主要數據庫,如核苷酸和蛋白質序列,蛋白質結構,PubMed,分類學,完整基因組,OMIM等[5]。Entrez是既具有生物醫學研究來源的數據的索引和檢索系統。NCBI於1991年分發了第一版Entrez,由蛋白質資料庫(PDB)GenBank的核苷酸序列,SWISS-PROT,翻譯的GenBank,PIR,PRF和PDB的蛋白質序列組成,PubMed的相關摘要和引文。Entrez專門設計用於將來自不同來源,數據庫和格式的數據集成到統一的資訊模型和檢索系統中,可以有效地檢索相關的參考文獻,序列和結構[6]

參見

參考文獻

  1. ^ NCBI | re3data.org. service.re3data.org. [2021-03-07]. (原始內容存檔於2016-03-05). 
  2. ^ Mizrachi, Ilene. Chapter 1 GenBank: The Nucleotide Sequence Database. GenBank: The Nucleotide Sequence Database. National Center for Biotechnology Information (US). 2007-08-22 [2021-03-07]. (原始內容存檔於2021-03-15) (英語). 
  3. ^ Altschul, S. F.; Gish, W.; Miller, W.; Myers, E. W.; Lipman, D. J. Basic local alignment search tool. Journal of Molecular Biology. 1990-10-05, 215 (3): 403–410 [2021-03-07]. ISSN 0022-2836. PMID 2231712. doi:10.1016/S0022-2836(05)80360-2. (原始內容存檔於2021-04-30). 
  4. ^ Madden T. (2002). The NCBI handbook, 2nd edition, Chapter 16, The BLAST Sequence Analysis Tool
  5. ^ Sayers, Eric W.; Agarwala, Richa; Bolton, Evan E.; Brister, J. Rodney; Canese, Kathi; Clark, Karen; Connor, Ryan; Fiorini, Nicolas; Funk, Kathryn. Database resources of the National Center for Biotechnology Information. Nucleic Acids Research. 2019, 47 (D1): D23–D28 [2021-03-07]. ISSN 1362-4962. PMC 6323993 . PMID 30395293. doi:10.1093/nar/gky1069. (原始內容存檔於2021-04-20). 
  6. ^ Ostell J. (2002). The NCBI handbook, 2nd edition, Chapter 15, The Entrez Search and Retrieval System

外部連結