holiso
存儲的未來是什么?
DNA存儲!這一定是很奇妙的事情,但你無法想象這會是怎樣的畫面。只能在顯微鏡下才能看到?能否將你的所有數(shù)據(jù)備份到DNA然后將其植入人體內(nèi)?全球70多億人口的檔案(包括家庭相片、自拍文件、影像資料、音樂文件和個人信息等)儲藏,只需一個不到100平方米的房間??梢源_定的是,在未來半個世紀(jì)里,甚至更短的時間內(nèi),DNA確實能夠儲存數(shù)量驚人的信息,比如照片、書籍、音樂,甚至是視頻!這一點也不“科幻”,事實上,在科學(xué)家完全繪制出基因組圖譜之前,在破解核苷酸的密碼過程中,少數(shù)人就已經(jīng)想到這種生命結(jié)構(gòu)單元的新用途??瓷先?,這些雙螺旋能做的不僅僅是承載藍(lán)色眼睛、微積分天才或是三分線外遠(yuǎn)射能力的基因。那些扭曲的淘氣鬼也可以用來存儲數(shù)據(jù)。這里的數(shù)據(jù)指的是我們過去幾年間涉及到的——大數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)、移動數(shù)據(jù)、社交數(shù)據(jù)。
科學(xué)家?guī)啄昵熬土私獾竭@個事實,人們已經(jīng)知道怎么在DNA上保存數(shù)據(jù)了。2016年4月,著名的好萊塢影視技術(shù)公司特藝集團研發(fā)團隊發(fā)布的一則消息引起了轟動,他們宣稱自己已經(jīng)在幾段DNA上儲存了100萬份《月球旅行記》的拷貝,那是一部由電影藝術(shù)先驅(qū)、法國導(dǎo)演喬治·梅里愛于1902年拍攝的電影。特藝集團的成就并非首創(chuàng)。早在2012年和2013年,就有兩個團隊將一本300頁的書、若干圖像、一個PDF文件,甚至聲音成功地儲存在了DNA上。新奇之處在于其所編碼的信息類型。這是人類第一次成功地把視頻資料儲存到了DNA上。這也意味著現(xiàn)在已經(jīng)可以在這種分子上存儲一切數(shù)碼信息。
生物分子變身硬盤
這個消息來得正是時候!如今,人類產(chǎn)生越來越多的信息,而儲存它們變得越來越困難。在電腦和手機的時代,我們現(xiàn)在每年制造出來的數(shù)據(jù)要比人類有文字以來產(chǎn)生的數(shù)據(jù)總和還要多!與我們每時每刻產(chǎn)生的上千億條短信、郵件、推文、自拍和視頻相比,把古埃及的象形文字、達·芬奇的手稿、狄德羅和達朗貝爾的《百科全書》,以及雨果的小說全集全部數(shù)字化加起來也比不上!預(yù)計從2013年到2020年,這一數(shù)據(jù)量將增長11倍,且這種趨勢并無逆轉(zhuǎn)跡象。根據(jù)數(shù)據(jù)儲存專業(yè)公司易安信的計算,如果用內(nèi)存為128GB的蘋果iPad Air來儲存這些數(shù)據(jù),那所需的蘋果iPad Air疊起來可以在地球到月球之間堆6次。數(shù)字化信息數(shù)量的飛速增長很快就會令人應(yīng)接不暇,人類呼喚比現(xiàn)有儲存系統(tǒng)更高效的新系統(tǒng)。DNA存儲恰能滿足以上需求。作為最古老的信息儲存系統(tǒng),數(shù)十億年來,它一直是生物遺傳信息的載體,DNA能將數(shù)量驚人的數(shù)據(jù)儲存在極小的體積里,因此也是最高效的:在體積不到一只螞蟻的百分之一的人類細(xì)胞核中,DNA包含有35億對堿基,而堿基是編碼遺傳信息最基本的材料。在硬盤上,信息以字節(jié)0或1的形式記錄,每個字節(jié)要占200納米(0.0002毫米)的空間;而在DNA上,記錄一個字節(jié)只需0.2~0.3納米。
如今,谷歌和亞馬遜為了儲存數(shù)據(jù),需要多個面積數(shù)倍于標(biāo)準(zhǔn)足球場的數(shù)據(jù)中心的支持,而且這還很耗電。而用DNA這種新型載體,只需一個汽車后備箱就能滿足它們所有數(shù)據(jù)的儲存需求!DNA在儲存體積上的優(yōu)勢也引起了電影公司的興趣。僅就我國而言,每年要拍攝上千部電影和電視劇,這將產(chǎn)生龐大的數(shù)據(jù)量。一首MP3格式的歌曲差不多有4MB,但是一部長達兩小時的電影,即使壓縮成MP4的格式,也要占據(jù)700MB。有了DNA儲存技術(shù),現(xiàn)在可以成功地把自20世紀(jì)以來拍攝的所有影片都儲存在兩到三個火柴盒里!
其實,特藝集團的科學(xué)家又是如何把100萬份電影拷貝存到DNA上的呢?過程并不容易。為此他們還請來美國基因?qū)W家喬治當(dāng)顧問,因為早在2012年,他就成功地把一本300頁的書存到了DNA上面。他們首先將梅里愛的電影數(shù)碼化,轉(zhuǎn)化成電腦能識讀的二進制語言,也就是轉(zhuǎn)化成一系列0和1的編碼。然后研究人員將這些二進制編碼轉(zhuǎn)化成由4個堿基(A、C、G、T)構(gòu)成的DNA編碼。得到這串編碼后,就能制成相應(yīng)的DNA序列,并在合成器(一種能自動拼接A、C、G、T的機器)的幫助下,拷貝數(shù)千份。這樣就獲得了一些DNA片段,它們?nèi)珙^發(fā)絲一樣漂浮在裝有液體的玻璃容器里,每一份都包含著電影的一個片段。
未來道路一片光明
接著就要證實反向操作的可行性了,也就是從這些片段中讀取電影。研究人員使用了另一種名為排序器的機器,它能自動按序讀取DNA分子里A、C、G、T序列。電腦接手完成剩余工作,把這一系列編碼轉(zhuǎn)化成一連串0和1,再把二進制編碼轉(zhuǎn)成圖像。只需一天不到的時間,就能將電影精準(zhǔn)重現(xiàn)。不過,目前這項技術(shù)還在實驗階段:現(xiàn)在把電影轉(zhuǎn)化成能漂在試管里的DNA要花費一個多月的時間!但是前景一片光明。尤其是因為DNA儲存的另一張王牌就是它的持久性。只要儲藏空間保持寒冷干燥且避光,保存時效就可長達數(shù)世紀(jì),甚至更長。人們在冰層里發(fā)現(xiàn)了幾萬年前猛犸象的DNA,還能成功將其破譯出來,就是最好的證明。
現(xiàn)有的其他載體,無論是硬盤、CD還是DVD,最多只能保存數(shù)十年,過了這個期限,首先硬件就會更新?lián)Q代,再也找不到能讀取它們的機器了!但DNA儲存就沒有此類問題:只要有人類存在,就一定會有破譯編碼的技術(shù)。不過DNA儲存還無法立即取代硬盤。讀?。ㄅ判颍┯绕涫菍懭耄ê铣桑┧璧臅r間還是太漫長了。排序最快也要幾個小時,而合成則需要花上幾周的時間。不僅如此,這兩個步驟目前耗資甚巨,合成成本可達數(shù)百甚至數(shù)千歐元。但數(shù)十年后,或許DNA儲存就會普及,要知道此類技術(shù)的花費會大幅降低。比如與2002年時相比,如今DNA測序費用僅為當(dāng)初的5萬分之一!對于沒有迫切使用需求的信息,我們就可以考慮用DNA來儲存。事實上,DNA儲存已經(jīng)引起了電影公司、博物館、檔案館,還有諸如亞馬遜、谷歌這類有長期信息儲存需求機構(gòu)的興趣。信息技術(shù)巨頭微軟公司即于2016年4月28日宣布,將購買1 000萬條DNA,用于研究數(shù)據(jù)儲存。毫無疑問DNA存儲渾身都散發(fā)著未知的光芒,不久的將來人類會迎來一個全新的數(shù)據(jù)存儲新時代。