世界上最密集存儲(chǔ)介質(zhì) DNA芯片獲突破
過去,有些研究團(tuán)隊(duì)一直試圖向活細(xì)胞中的基因組寫入數(shù)據(jù),但是這種方式有一些不足之處。首先,細(xì)胞會(huì)死亡,這并不是你存儲(chǔ)學(xué)期論文的好方法。另外,細(xì)胞還會(huì)分裂、復(fù)制,其中會(huì)不斷發(fā)生變異,從而改變數(shù)據(jù)的內(nèi)容。
圖DNA的四種脫氧核苷酸(A,G,C,T)可被用來對(duì)數(shù)據(jù)進(jìn)行編碼
為了解決這些問題,一個(gè)由波士頓哈佛醫(yī)學(xué)院合成生物學(xué)家喬治-丘奇(GeorgeChurch)領(lǐng)導(dǎo)的研究團(tuán)隊(duì)發(fā)明了一種DNA信息歸檔系統(tǒng),完全不需要利用細(xì)胞。相反,利用的是一臺(tái)噴墨打印機(jī),從而將化學(xué)合成的一小段DNA嵌入到一塊微型玻璃芯片的表面。為了給數(shù)字文件進(jìn)行編碼,研究人員把文件劃分為微小的數(shù)據(jù)塊,并把這些數(shù)據(jù)塊以A、C、G、T(DNA的四種脫氧核苷酸)的字母組合來表示,放棄了過去在計(jì)算機(jī)上的1和0編碼方法。每條DNA片段還包含了一個(gè)數(shù)字“條碼”,用來記錄數(shù)據(jù)在原文件中的位置信息。在讀取信息時(shí),需要DNA測序儀和電腦將所有片段按序重新組合起來,并轉(zhuǎn)換為數(shù)字的格式。計(jì)算機(jī)還需要負(fù)責(zé)處理錯(cuò)誤信息,因?yàn)槊總€(gè)數(shù)據(jù)塊都可能會(huì)被復(fù)制上千次,經(jīng)過比對(duì),任何小錯(cuò)誤都可以被發(fā)現(xiàn)和糾正。
為了證實(shí)這一系統(tǒng)在實(shí)際應(yīng)用中的能力,該團(tuán)隊(duì)使用了這種DNA芯片將丘奇同他人合著的一本遺傳學(xué)書籍進(jìn)行了編碼。他們成功了。在將書籍內(nèi)容轉(zhuǎn)換為DNA的信息、并將其翻譯成數(shù)字存儲(chǔ)模式后,該系統(tǒng)顯示的出錯(cuò)率為每百萬比特僅兩個(gè)錯(cuò)誤,相當(dāng)于一些小小的拼寫錯(cuò)誤。這同DVD的性能差不多,遠(yuǎn)遠(yuǎn)好過硬盤。本周五,該團(tuán)隊(duì)在《科學(xué)》雜志上發(fā)布的報(bào)告稱,考慮到DNA芯片的體積非常小,它成為了目前世界上最密集的信息存儲(chǔ)介質(zhì)。
不過,你最好別急著將閃存上的數(shù)據(jù)復(fù)制到基因存儲(chǔ)上。美國馬里蘭州羅克維爾市克雷格-文特爾研究所的合成生物學(xué)家丹尼爾-吉布森(DanielGibson)表示,DNA測序儀和其他設(shè)備的成本相當(dāng)高,目前還不適宜推廣,但是這一領(lǐng)域發(fā)展迅速,這項(xiàng)科技將會(huì)變得更便宜、更快速和更輕便。吉布森過去領(lǐng)導(dǎo)的研究團(tuán)隊(duì)曾合成了世界上第一個(gè)最完整的基因組,并在DNA中加入了一些額外的信息作為“水印”。不過,這些研究人員使用的是三個(gè)字母的編碼系統(tǒng),要比丘奇團(tuán)隊(duì)的效率低一些,但是卻成功阻止了活體細(xì)胞的復(fù)制,從而不會(huì)將DNA轉(zhuǎn)換為蛋白質(zhì)。吉布森說,“如果DNA要被用來存儲(chǔ)信息,并且使用環(huán)境不在實(shí)驗(yàn)室里,那么你還需要DNA測序儀的幫助,而這是很不現(xiàn)實(shí)的。”丘奇不同意這種觀點(diǎn)。他表示,除非某人有意識(shí)的“破壞”他的DNA數(shù)據(jù)存儲(chǔ)系統(tǒng),否則信息將非常安全。