人類基因組測(cè)序迎來(lái)新的里程碑!首個(gè)完整無(wú)間隙人類基因組測(cè)序,由近百位科學(xué)家合作完成,填補(bǔ)上最后 8% 的空缺。最新一期 Science 罕見地以特刊形式連發(fā) 6 篇論文,另外兩篇介紹研究方法的論文同日登上 Nature Method。
作者之一、華盛頓大學(xué)教授 Evan Eichler 稱:
我們?cè)谏鞎凶x到了前所未有的新章節(jié)。
回看 2003 年,人類基因組計(jì)劃 (Human Genome Project) 首次完成 92% 的人類基因測(cè)序,創(chuàng)造了歷史。到如今,新成立的端粒到端粒聯(lián)盟 (T2T Consortium) 填補(bǔ)上最后 8% 的空缺,同時(shí)糾正了之前的一些錯(cuò)誤,也將載入史冊(cè)。
△T2T 聯(lián)盟部分成員
新確認(rèn)的 8% DNA 片段里包含重要的免疫反應(yīng)基因,它們幫助人類適應(yīng)和抵御病毒和細(xì)菌感染,在預(yù)測(cè)藥物反應(yīng)方面很有價(jià)值。
聯(lián)盟發(fā)起人之一、馬里蘭大學(xué)的 Adam Phillippy 認(rèn)為,個(gè)人基因組測(cè)序在 10 年內(nèi)有望普及,個(gè)性化醫(yī)療成本會(huì)大幅下降。
另外新發(fā)現(xiàn)的基因中有一些使得人類大腦比其他靈長(zhǎng)類動(dòng)物大腦更大,有助于進(jìn)一步揭開人類進(jìn)化之謎。
攻克最后的 8%
當(dāng)初的人類基因組計(jì)劃由 6 國(guó)近 2000 位科學(xué)家耗時(shí) 13 年完成,最后遺留的 8% 靠當(dāng)時(shí)的測(cè)序技術(shù)難以突破。原因有二:
其一,最后的 8% 里有很多片段是重復(fù)的。科學(xué)家們用拼圖來(lái)形容這一困難。如果拼圖里好多小塊很相似就更難找到正確的位置。近幾年發(fā)展出的新測(cè)序方法 Oxford Nanopore 和 PacBio HiFi 可以一次處理更長(zhǎng)的 DNA 片段,就好像拼圖的塊變大,塊數(shù)變小了。
其二,很難找到只有一套 DNA 的人類細(xì)胞。正常細(xì)胞同時(shí)擁有兩套 DNA,分別來(lái)自父親和母親,測(cè)序時(shí)兩組 DNA 混在一起增加了難度。這次的解決辦法是使用一組來(lái)自“葡萄胎”的細(xì)胞,這是一種罕見妊娠疾病,使胚胎細(xì)胞異常生長(zhǎng),只保留一套 DNA。
用上新方法,人類 DNA 序列中 30.55 億個(gè)堿基對(duì)的測(cè)序工作終于宣告完工。人類基因組計(jì)劃前負(fù)責(zé)人 Robert Waterston 對(duì)新方法評(píng)價(jià)到:
(人類基因組)不再有任何隱藏的或未知的部分。
全新的人類參考基因組被命名為 T2T-CHM13,今后的個(gè)性化基因測(cè)序可以此為基準(zhǔn),鎖定病變基因,提前預(yù)防和治療。
這次研究成果幾個(gè)月前已發(fā)布在生物預(yù)印本平臺(tái),現(xiàn)在正式見刊 Science。具體到已發(fā)表的內(nèi)容上,還存在一點(diǎn)不足之處:使用的葡萄胎細(xì)胞保留的是 XX 染色體,缺失了 Y 染色體。
不過后來(lái)這段時(shí)間科學(xué)家們也沒閑著,Y 染色體的測(cè)序工作其實(shí)也另外完成了。項(xiàng)目負(fù)責(zé)人 Adam Phillippy 在社交媒體宣布了這一消息,人體 24 條染色體基因測(cè)序已全部完成。
最新參考序列 T2T-CHM13 v2.0 的完整數(shù)據(jù)和在線瀏覽器已公開,可供全球研究團(tuán)隊(duì)使用。
而最新包含 Y 染色體測(cè)序成果的論文預(yù)印版計(jì)劃在下個(gè)月發(fā)布。
論文地址:
https://www.science.org/toc/science/376/6588
CHM13 v2.0 相關(guān)數(shù)據(jù)和工具
https://genomeinformatics.github.io/CHM13v2/
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。