Genbank庫里的數(shù)據按來源于約55,000個物種,其中56%是人類的基因組序列(所有序列中的34%是人類的EST序列)。每條Genbank數(shù)據記錄包含了對序列的簡要描述,它的科學命名,物種分類名稱,參考文獻,序列特征表,以及序列本身。序列特征表里包含對序列生物學特征注釋如:編碼區(qū)、轉錄單元、重復區(qū)域、突變位點或修飾位點等。所有數(shù)據記錄被劃分在若干個文件里,如細菌類、病毒類、靈長類、嚙齒類,以及EST數(shù)據、基因組測序數(shù)據、大規(guī)?;蚪M序列數(shù)據等16類,其中EST數(shù)據等又被各自分成若干個文件。
Entrez的網址是:http://www.ncbi.nlm.nih.gov/entrez/
BankIt的網址是:http://www.ncbi.nlm.nih.gov/BankIt
Sequin的相關網址是:http://www.ncbi.nlm.nih.gov/Sequin/
DDBJ的網址是:http://www.ddbj.nig.ac.jp/
<section style="margin: 10px; padding: 0px; max-width: 100%; color: rgb(51, 51, 51); font-family: -apple-system-font, BlinkMacSystemFont, " helvetica="" neue",="" "pingfang="" sc",="" "hiragino="" sans="" gb",="" "microsoft="" yahei="" ui",="" yahei",="" arial,="" sans-serif;="" min-height:="" 1em;="" font-size:="" 16px;="" letter-spacing:="" 2px;="" line-height:="" 2em;="" box-sizing:="" border-box="" !important;="" overflow-wrap:="" break-word="" !important;"="">
目前GDB中有:人類基因組區(qū)域(包括基因、克隆、amplimers PCR 標記、斷點breakpoints、細胞遺傳標記cytogenetic markers、易碎位點fragile sites、EST序列、綜合區(qū)域syndromic regions、contigs和重復序列);人類基因組圖譜(包括細胞遺傳圖譜、連接圖譜、放射性雜交圖譜、content contig圖譜和綜合圖譜等);人類基因組內的變異(包括突變和多態(tài)性,加上等位基因頻率數(shù)據)。GDB數(shù)據庫以對象模型來保存數(shù)據,提供基于Web的數(shù)據對象檢索服務,用戶可以搜索各種類型的對象,并以圖形方式觀看基因組圖譜。
GDB的網址是:http://www.gdb.org
GDB的國內鏡像是:http://gdb.pku.edu.cn/gdb/