據(jù)海外媒體報道,歐洲生物信息研究所的專家們?nèi)涨伴_發(fā)出了一項利用DNA存儲數(shù)據(jù)的技術(shù),優(yōu)越性十分明顯,其海量容量是傳統(tǒng)介質(zhì)無法比擬的。目前這項技術(shù)所面臨的唯一障礙就是成本過高,不過專家表示該技術(shù)有望在十年內(nèi)將其普及。研究人員表示,這一基因代碼可以把數(shù)十億的信息包含在一克DNA分子中,而一毫克的分子將美國國會圖書館(Library of Congress)中的所有書籍完全編碼后仍綽綽有余。不過這一切目前還只停留于理論上。
DNA,即脫氧核糖核酸,主要功能是存儲包含各種指令的生物信息,組成DNA的有G(鳥嘌呤)、T(胸腺嘧啶)、A(腺嘌呤)、C(胞嘧啶)四種堿基,并通過四種堿基不同順序的編碼,存儲了生物的所有遺傳信息。談到存儲信息,現(xiàn)有的硬盤無法跟DNA相比。
在一項新的研究中,研究人員將一本完整的遺傳學(xué)教材保存在了不到一沙克的DNA中,這一突破將徹底改變我們未來存儲數(shù)據(jù)的能力。據(jù)媒體報道,George Church領(lǐng)導(dǎo)的一個團(tuán)隊創(chuàng)建了基于任意細(xì)胞的DNA信息歸檔系統(tǒng),并利用噴墨打印機(jī)將使用化學(xué)方法合成的DNA片段嵌入到微小的玻璃芯片表面。
編碼數(shù)字文件時,研究人員將其劃分為小塊數(shù)據(jù),但不是以當(dāng)前通行的0、1來表示存儲數(shù)據(jù),而是以組成DNA的四種脫氧核苷酸(堿基)As、Cs、Gs和Ts表示。每一個DNA片段還包含一個數(shù)字“條碼”,記錄它在原始文件中的位置。讀取數(shù)據(jù)時,需要借助DNA測序器與計算機(jī)把所有DNA片段中的編碼按標(biāo)記順序排列,并將其轉(zhuǎn)換為數(shù)字格式。計算機(jī)負(fù)責(zé)糾錯,因為每個DNA片段都被復(fù)制了上千份副本,任意一個出錯都能通過其它副本來修正。
為證明該系統(tǒng)的可行性,研究團(tuán)隊先將遺傳學(xué)教材轉(zhuǎn)換并存儲到DNA存儲芯片上,然后再轉(zhuǎn)換回數(shù)字格式。演示系統(tǒng)的出錯率為百萬分之二,總共只有幾個單詞拼寫錯誤。這種效果等同于DVD,且遠(yuǎn)勝于磁盤存儲設(shè)備。再加上其尺寸微小,因此研究團(tuán)隊在發(fā)布到《Science》的研究報告稱,DNA芯片是當(dāng)前已知存儲密度最高的介質(zhì)。