文/郭林忠(杭州睿笛生物科技有限公司)
在現(xiàn)代科技時(shí)代背景下,海量數(shù)據(jù)爆發(fā)式增長使得信息技術(shù)的發(fā)展面臨巨大的挑戰(zhàn),如海量數(shù)據(jù)存儲、海量數(shù)據(jù)分析等帶來的能耗、效能挑戰(zhàn)等,要求信息技術(shù)尋找新的發(fā)展契機(jī)與方向,才能滿足于科技時(shí)代創(chuàng)新發(fā)展對信息技術(shù)的具體要求。結(jié)合生物技術(shù)的啟發(fā),從生物結(jié)構(gòu)中探尋信息技術(shù)創(chuàng)新發(fā)展方案,已經(jīng)成為當(dāng)前國際研究的重要方向之一[1]。DNA數(shù)據(jù)存儲和神經(jīng)形態(tài)計(jì)算,作為新興研究領(lǐng)域,是具有廣闊發(fā)展前景的代表性方向。鑒于此,基于信息技術(shù)創(chuàng)新發(fā)展及應(yīng)用范圍拓展角度考慮,本文深入分析“生物技術(shù)與信息技術(shù)的融合發(fā)展”具有一定現(xiàn)實(shí)意義。
進(jìn)入到智能化和大數(shù)據(jù)時(shí)代,生物技術(shù)與信息技術(shù)的融合發(fā)展已經(jīng)是必然趨勢,當(dāng)前,一些國家在“精準(zhǔn)醫(yī)學(xué)計(jì)劃”“半導(dǎo)體合成生物學(xué)”等計(jì)劃領(lǐng)域中,開始廣泛使用信息技術(shù)手段,并進(jìn)行了重點(diǎn)布局,這些都是生物技術(shù)和信息技術(shù)融合發(fā)展的重要舉措,并促進(jìn)了生命科學(xué)解決方案的開發(fā),并催生了西寧西技術(shù)大數(shù)據(jù)存儲和分析的需求。另外,在市場經(jīng)濟(jì)不斷發(fā)展中,各實(shí)力強(qiáng)大的信息技術(shù)企業(yè)紛紛順應(yīng)市場發(fā)展潮流,積極與生物技術(shù)企業(yè)建立長期戰(zhàn)略合作關(guān)系,如微軟、谷歌等大型信息技術(shù)企業(yè),都與實(shí)力一絕的生物技術(shù)企業(yè)建立了戰(zhàn)略合作關(guān)系;再比如,作為半導(dǎo)體設(shè)備領(lǐng)域的龍頭企業(yè),泛林公司在合成生物學(xué)研究等方面進(jìn)行了戰(zhàn)略布局,旨在實(shí)現(xiàn)創(chuàng)新性發(fā)展來適應(yīng)時(shí)代發(fā)展需求,繼而為企業(yè)的持續(xù)發(fā)展保駕護(hù)航[2-3]。
生物技術(shù)與信息技術(shù)的融合發(fā)展催生了大量新興布局項(xiàng)目,如人體微生物組計(jì)劃、腦科學(xué)計(jì)劃,且可以促進(jìn)人工智能、健康等新興項(xiàng)目的布局。尤其是生命組學(xué)與半導(dǎo)體領(lǐng)域的相融合發(fā)展,更是促進(jìn)了生物電子細(xì)胞等的進(jìn)一步發(fā)展,其與通信、互聯(lián)網(wǎng)領(lǐng)域的融合發(fā)展,可以促進(jìn)人機(jī)交互和遠(yuǎn)程醫(yī)療的進(jìn)一步發(fā)展[4-5]。另外,信息技術(shù)與腦科學(xué)領(lǐng)域的融合發(fā)展,可促進(jìn)計(jì)算神經(jīng)科學(xué)、3D生物學(xué)等領(lǐng)域的進(jìn)一步發(fā)展。由此可見,生物技術(shù)與信息技術(shù)的融合發(fā)展將會(huì)促進(jìn)大量新興項(xiàng)目的出現(xiàn),對新型布局空間的優(yōu)化起到了積極的促進(jìn)作用[3]。
近年來,基于生物技術(shù)的信息技術(shù)發(fā)展取得了階段性的成績,其中,DNA存儲已經(jīng)成為全球研究的重點(diǎn)和熱點(diǎn)。DNA存儲技術(shù)以人工合成的脫氧核苷酸鏈為存儲介質(zhì),以此實(shí)現(xiàn)文檔、音頻等信息的存儲與讀取,具體而言,基于A、T、C、G4種堿基對應(yīng)二進(jìn)制進(jìn)行數(shù)據(jù)編碼,使得數(shù)據(jù)可以通過脫氧核苷酸鏈形式合成DNA分子進(jìn)行存儲[6-7]。DNA數(shù)據(jù)存儲方式相比傳統(tǒng)數(shù)據(jù)存儲方式,具有顯著優(yōu)勢,如低能耗、安全穩(wěn)定性高、存儲密度大等,在未來可以發(fā)展成滿足海量數(shù)據(jù)爆發(fā)式增長的存儲需求的創(chuàng)新型技術(shù)。但當(dāng)前的DNA存儲技術(shù)發(fā)展與應(yīng)用,仍然面臨諸多挑戰(zhàn),要求專業(yè)領(lǐng)域的科學(xué)家從以下幾個(gè)方面進(jìn)行研究,才能為DNA存儲技術(shù)的發(fā)展與應(yīng)用夯實(shí)基礎(chǔ)。
(1)優(yōu)化和完善生物技術(shù)。在DNA存儲中,考慮存儲操作的便捷性和成本,要求深入研究操作簡便的DNA合成及測序技術(shù),繼而才能整體降低DNA存儲成本,這既是現(xiàn)代分子生物學(xué)中研究的重要技術(shù)方向之一,又是降低基于生物技術(shù)的DNA存儲成本的重要舉措,可以為DNA存儲技術(shù)的發(fā)展創(chuàng)造更大的空間[8-9]。
(2)編解碼方式與糾錯(cuò)機(jī)制。編碼方案的優(yōu)化和完善,充分利用DNA存儲空間,減少數(shù)據(jù)冗余及誤差。編碼方案在DNA存儲研究中已經(jīng)形成成熟體系,四進(jìn)制轉(zhuǎn)換模型已經(jīng)發(fā)展成為DNA存儲的主流轉(zhuǎn)換模型,但現(xiàn)有的存儲方案的儲存密度,仍然需要通過模型建立來進(jìn)行優(yōu)化和提高,才能滿足于海量數(shù)據(jù)爆發(fā)式增長的存儲需求。另外,考慮到DNA的人工合成無法應(yīng)用在活細(xì)胞中酶的校正機(jī)制,合成、擴(kuò)增等環(huán)節(jié)的校正方案研究,也是重點(diǎn)研究方向之一,在此領(lǐng)域Blawat等嘗試采取前向糾錯(cuò)技術(shù)方式進(jìn)行校正,可以大幅度提升DNA存儲數(shù)據(jù)讀取的準(zhǔn)確性。
(3)隨機(jī)存取。早在2016年華盛頓大學(xué)與微軟公司共同研究的DNA存儲,已經(jīng)實(shí)現(xiàn)了內(nèi)容重寫、隨機(jī)訪問等功能,具體是通過聚合酶鏈?zhǔn)椒磻?yīng)實(shí)現(xiàn)了字符串副本的精準(zhǔn)復(fù)制,極大地提升了字符讀取速度,但相比傳統(tǒng)磁介質(zhì)存儲讀取速度,仍然具有較大的提升空間。因此,接近于傳統(tǒng)存儲方式的隨時(shí)讀取與寫入功能,仍然是DNA存儲技術(shù)發(fā)展研究的重點(diǎn)方向之一。
以“神經(jīng)形態(tài)”為核心的類腦芯片,指的是仿照大腦結(jié)構(gòu)中神經(jīng)元(計(jì)算)和突觸(存儲)單元集于一體,能夠根據(jù)傳遞的信號強(qiáng)弱進(jìn)行相應(yīng)的調(diào)整,并在此過程中,既可以確保信息傳遞效率,又可以實(shí)現(xiàn)數(shù)據(jù)并行、分布式處理,且整個(gè)過程的能源消耗是極低的。在類腦芯片中,憶阻器作為模仿大腦神經(jīng)元功能的關(guān)鍵電子器件,伴隨此電子器件研究開發(fā)的成功及推廣應(yīng)用,使得神經(jīng)網(wǎng)絡(luò)芯片研究取得突破性的進(jìn)展。另外,輔以類腦計(jì)算方法的深層次研究與應(yīng)用,實(shí)現(xiàn)神經(jīng)擬態(tài),在攻克傳統(tǒng)計(jì)算范式局限性的基礎(chǔ)上,形成了傳“自主認(rèn)知”的新范式,使得計(jì)算機(jī)整體性能得以優(yōu)化和增強(qiáng)。
現(xiàn)階段,我國圍繞類腦研究已經(jīng)成立了多個(gè)研究中心,參與單位眾多,具體有浙江大學(xué)、清華大學(xué)等,并已經(jīng)取得了多項(xiàng)技術(shù)成果。以“天機(jī)”系列類腦芯片為例,由清華大學(xué)團(tuán)隊(duì)研究開發(fā),既實(shí)現(xiàn)了大規(guī)模神經(jīng)元網(wǎng)絡(luò)模擬,又支持脈沖神經(jīng)網(wǎng)絡(luò)算法和人工神經(jīng)網(wǎng)絡(luò)算法。另外,清華大學(xué)團(tuán)隊(duì)并在原有網(wǎng)絡(luò)算法的基礎(chǔ)上,建立了卷積神經(jīng)網(wǎng)絡(luò)新算法。由此可見,現(xiàn)階段,類腦芯片技術(shù)的研究已經(jīng)取得了重大進(jìn)展,但距離大規(guī)模應(yīng)用還要解決諸多問題,才能確保類腦芯片技術(shù)應(yīng)用效果,具體包括以下幾點(diǎn):
(1)處理能力有待提高。類腦芯片雖然能夠滿足智能算法的實(shí)用性需求,但任務(wù)性處理能力仍然具有較大的提升空間[10]。與之相匹配的架構(gòu)、算法和模型等,都處于初期研發(fā)階段,需要基于計(jì)算要求進(jìn)一步提煉神經(jīng)網(wǎng)絡(luò)處理中的共性運(yùn)算特性,以此發(fā)展類腦神經(jīng)元計(jì)算模型,以此增強(qiáng)神經(jīng)計(jì)算電路模塊的任務(wù)處理能力的同時(shí),提高模塊的通用性,為大規(guī)模應(yīng)用類腦芯片提供支持。
(2)硅晶片工藝成本有待降低。當(dāng)前,類腦芯片材料主要以硅晶片電路為基礎(chǔ)實(shí)現(xiàn)神經(jīng)元模擬,但硅晶片工藝生產(chǎn)成本過高,導(dǎo)致類腦芯片大規(guī)模應(yīng)用存在成本限制。針對這種情況,要實(shí)現(xiàn)類腦芯片的大規(guī)模使用,則要積極尋找可以替代硅晶片,且與生物神經(jīng)系統(tǒng)相似的材料,以此設(shè)計(jì)出高性價(jià)比的類神經(jīng)計(jì)算芯片,才能降低類腦芯片大規(guī)模使用的成本。
(3)在類腦芯片設(shè)計(jì)中,單純地借鑒了腦信息處理中諸如神經(jīng)元連接、脈沖放電機(jī)制等最基本的單元和機(jī)制,但對于相對復(fù)雜的信息處理單元的作用機(jī)制,如神經(jīng)微環(huán)路、多腦區(qū)協(xié)同等,尚未引進(jìn)類腦芯片計(jì)算機(jī)制研究中,使得類腦芯片在復(fù)雜信息處理中存在一定的局限性[11-12]。因此,在未來類腦芯片技術(shù)研究中,要實(shí)現(xiàn)類腦芯片大規(guī)模應(yīng)用目的,要求借鑒和研究多尺度信息處理機(jī)制,并重點(diǎn)關(guān)注全腦不同尺度計(jì)算單元之間的協(xié)同處理能力,以便進(jìn)一步提升類腦芯片信息處理能力,滿足于信息時(shí)代發(fā)展對類腦芯片信息處理能力的實(shí)際要求,才能為類腦芯片的大規(guī)模使用夯實(shí)基礎(chǔ)。
綜上所述,在現(xiàn)代科技不斷發(fā)展和人們需求不斷提高的背景下,信息技術(shù)領(lǐng)域涌現(xiàn)出大量技術(shù)桎梏問題,在此環(huán)境中,如何實(shí)現(xiàn)信息技術(shù)的創(chuàng)新發(fā)展與廣泛應(yīng)用,使得其在社會(huì)各個(gè)領(lǐng)域中產(chǎn)生更大的效能,已經(jīng)成為相關(guān)專業(yè)領(lǐng)域人員重點(diǎn)研究的課題。而生物技術(shù)與信息技術(shù)的融合發(fā)展,為信息技術(shù)的發(fā)展開辟了新的路徑,如基于DNA特殊的結(jié)構(gòu)模式,解決了信息技術(shù)發(fā)展中存在的存儲空間和時(shí)間問題,神經(jīng)形態(tài)計(jì)算通過模仿人腦構(gòu)造實(shí)現(xiàn)了計(jì)算機(jī)信息處理能力和反應(yīng)能力,且大幅度降低了計(jì)算機(jī)運(yùn)行能耗。不僅如此,類腦芯片在海量數(shù)據(jù)處理方面具有顯著的低能耗、高效性等優(yōu)勢,且能夠?yàn)槿斯ぶ悄?、?dòng)態(tài)調(diào)節(jié)等功能的實(shí)現(xiàn)提供支持,從而能夠?yàn)樾畔⒓夹g(shù)的進(jìn)一步發(fā)展及推廣應(yīng)用提供了技術(shù)支持。