?
英國(guó)維康桑格研究所的人類基因組序列切片可視化圖。圖片來(lái)源:James King-Holmes/Science Photo Library
本報(bào)訊?20年前,當(dāng)人類基因組計(jì)劃誕生、生物技術(shù)公司Celera Genomics宣布對(duì)人類基因組進(jìn)行測(cè)序時(shí),這個(gè)序列尚未真正完整,其中缺失了約15%的序列。技術(shù)上的限制使得研究人員無(wú)法計(jì)算出某些DNA片段是如何結(jié)合在一起的,特別是那些有許多重復(fù)堿基對(duì)的片段。
隨著時(shí)間推移,科學(xué)家解開了其中一些謎團(tuán),但遺傳學(xué)家自2013年以來(lái)用作研究參考的最新人類基因組序列仍然缺少8%。
現(xiàn)在,大約30個(gè)機(jī)構(gòu)組成的國(guó)際合作組織——端粒到端粒聯(lián)盟(T2T)的研究人員填補(bǔ)了這些空白。
據(jù)《自然》報(bào)道,在近日發(fā)表于預(yù)印本平臺(tái)BioRxiv的論文中,美國(guó)加利福尼亞大學(xué)圣克魯茲分?;蚪M學(xué)研究人員Karen Miga和同事報(bào)告稱,他們已經(jīng)對(duì)剩余的部分基因組進(jìn)行了測(cè)序,其中發(fā)現(xiàn)了大約115個(gè)編碼蛋白質(zhì)的新基因。目前基因數(shù)量達(dá)到19969個(gè)。
被命名為T2T-CHM13的新測(cè)序的基因組,在2013年版的人類基因組序列上一次性增加了近2億個(gè)堿基對(duì)。
這次測(cè)序,研究人員沒(méi)有使用從人身上提取的DNA,而是使用了來(lái)源于一種被稱為完全性葡萄胎(當(dāng)精子使一個(gè)沒(méi)有細(xì)胞核的卵子受精時(shí)在人體內(nèi)形成的組織)的細(xì)胞系。由此產(chǎn)生的細(xì)胞只含有來(lái)自父親的染色體,因此研究人員不必區(qū)分來(lái)自不同人群的兩組染色體。
Miga表示,如果沒(méi)有太平洋生物科學(xué)公司的新測(cè)序技術(shù),這一壯舉或許不可能實(shí)現(xiàn)。這一新測(cè)序技術(shù)可一次性激光掃描包含多達(dá)2萬(wàn)個(gè)堿基對(duì)的從細(xì)胞中分離的DNA長(zhǎng)片段。而傳統(tǒng)測(cè)序方法一次只能讀取包含幾百個(gè)堿基對(duì)的DNA片段,研究人員要像拼拼圖一樣將它們重新組裝起來(lái)。
然而,T2T-CHM13并不是人類基因組的“最終版”。T2T團(tuán)隊(duì)在分辨染色體上的一些區(qū)域時(shí)遇到了困難,估計(jì)大約0.3%的基因組可能含有錯(cuò)誤。此外,形成葡萄胎的精子細(xì)胞攜帶X染色體,研究人員還沒(méi)有對(duì)Y染色體(通常會(huì)觸發(fā)男性生物學(xué)發(fā)育)進(jìn)行測(cè)序。
T2T-CHM13只代表一個(gè)人類的基因組。但T2T已經(jīng)與一個(gè)名為人類泛基因組參考聯(lián)盟的組織合作,該組織的目標(biāo)是在未來(lái)3年內(nèi)對(duì)全世界300多個(gè)人類基因組進(jìn)行測(cè)序。
Miga說(shuō),合作研究小組將使用T2T-CHM13作為參考,以了解基因組的哪些部分在個(gè)體之間存在差異。他們還計(jì)劃對(duì)包含雙親染色體的整個(gè)基因組進(jìn)行測(cè)序。(徐銳)
相關(guān)論文信息:
https://doi.org/10.1101/2021.05.26.445798
《中國(guó)科學(xué)報(bào)》 (2021-06-07 第1版 要聞)