大數(shù)據(jù)正在深刻影響生物醫(yī)學(xué)。大數(shù)據(jù)并不是一個(gè)遙遠(yuǎn)的概念,它在現(xiàn)代生活中無(wú)處不在,發(fā)展大數(shù)據(jù)是為了讓老百姓生活得更美好……
我國(guó)生物大數(shù)據(jù)還處于發(fā)展的初期階段,發(fā)達(dá)國(guó)家在生物大數(shù)據(jù)領(lǐng)域的技術(shù)和應(yīng)用遠(yuǎn)遠(yuǎn)領(lǐng)先于我國(guó)。美國(guó)政府在2014財(cái)年已就充分利用生物醫(yī)學(xué)大數(shù)據(jù),啟動(dòng)了Big Data to Knowledge計(jì)劃,這是繼2012年美國(guó)國(guó)家大數(shù)據(jù)計(jì)劃實(shí)施后新一輪面向生物大數(shù)據(jù)的基礎(chǔ)研究計(jì)劃。如何以最快的速度趕上先進(jìn)國(guó)家生物大數(shù)據(jù)技術(shù)的發(fā)展,如何從國(guó)家主權(quán)層面對(duì)生物大數(shù)據(jù)進(jìn)行有效的保護(hù)和管理,如何在基礎(chǔ)研究和技術(shù)市場(chǎng)應(yīng)用上與世界同步,已成為不可回避且應(yīng)當(dāng)深入思考的問(wèn)題。
我國(guó)生物大數(shù)據(jù)技術(shù)與發(fā)達(dá)國(guó)家差距較大
高通量測(cè)序技術(shù)的快速發(fā)展,使生命科學(xué)研究獲得了強(qiáng)大的數(shù)據(jù)產(chǎn)生能力。
20世紀(jì)90年代,科學(xué)家花費(fèi)10年時(shí)間、近30億美元才獲得第一個(gè)人類(lèi)基因組圖譜;而今天,完成一個(gè)個(gè)人基因組測(cè)序不到一天時(shí)間,費(fèi)用低于1000美元。
自人類(lèi)基因組計(jì)劃完成以來(lái),以美國(guó)為代表的世界主要發(fā)達(dá)國(guó)家紛紛啟動(dòng)了生命科學(xué)基礎(chǔ)研究計(jì)劃,如國(guó)際千人基因組計(jì)劃、DNA百科全書(shū)計(jì)劃、英國(guó)10萬(wàn)人基因組計(jì)劃等。這些計(jì)劃使得生物數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng)趨勢(shì)。隨著測(cè)序技術(shù)在醫(yī)療、健康、醫(yī)藥、環(huán)境、能源等相關(guān)領(lǐng)域的廣泛應(yīng)用,人類(lèi)將面臨生物數(shù)據(jù)的汪洋大海,而這些將成為相關(guān)領(lǐng)域創(chuàng)新的源泉。目前,全球每年產(chǎn)生的生物數(shù)據(jù)總量已達(dá)EB級(jí),生命科學(xué)在某種程度上已經(jīng)成為大數(shù)據(jù)科學(xué)。對(duì)這些數(shù)據(jù)創(chuàng)新性的管理和應(yīng)用,將為生命科學(xué)及相關(guān)產(chǎn)業(yè)領(lǐng)域帶來(lái)一次新的革命。
與全球來(lái)勢(shì)洶涌的生物大數(shù)據(jù)創(chuàng)新發(fā)展熱潮相比,我國(guó)的研發(fā)及應(yīng)用才剛剛開(kāi)始,與國(guó)際前沿技術(shù)水平至少相差30年,差距主要表現(xiàn)在數(shù)據(jù)分析、數(shù)據(jù)管理和與臨床的應(yīng)用對(duì)接上。有關(guān)人士認(rèn)為,我國(guó)在四大方面非常欠缺:其一,國(guó)內(nèi)現(xiàn)有的生物大數(shù)據(jù)分析能力雖然與歐美相差不大,但是在數(shù)據(jù)分析構(gòu)架、軟件系統(tǒng)與先進(jìn)的IT技術(shù)接軌上有待提升。其二,國(guó)外在生物大數(shù)據(jù)領(lǐng)域的領(lǐng)先人才多,盡管我國(guó)也有國(guó)際頂級(jí)刊物上發(fā)表的論文和成果,但總體而言,國(guó)內(nèi)高水準(zhǔn)團(tuán)隊(duì)還比較少。其三,歐美講求成果應(yīng)用,層出不窮的分析軟件可被實(shí)驗(yàn)室、臨床、產(chǎn)業(yè)多方應(yīng)用。其四,在生物大數(shù)據(jù)理論研究、標(biāo)準(zhǔn)制定和廣泛應(yīng)用上,中國(guó)都亟待全面跟進(jìn)。
對(duì)生物大數(shù)據(jù)應(yīng)用的市場(chǎng)和資源的激烈爭(zhēng)奪
為了對(duì)生物大數(shù)據(jù)進(jìn)行有效管理和利用,發(fā)達(dá)國(guó)家很早就開(kāi)始了競(jìng)爭(zhēng)。早在20世紀(jì)80—90年代,美國(guó)、歐洲和日本即已分別建立起世界三大生物數(shù)據(jù)中心:美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)、歐洲生物信息研究所(EBI)和日本DNA數(shù)據(jù)庫(kù)(DDBJ)。這三大生物數(shù)據(jù)中心掌握和管理著全世界的生物數(shù)據(jù)和知識(shí)資源,并處于壟斷地位。
美國(guó)國(guó)立衛(wèi)生研究院(NIH)建立了八個(gè)國(guó)家級(jí)生物數(shù)據(jù)技術(shù)研究中心,旨在長(zhǎng)期發(fā)展生物大數(shù)據(jù)分析技術(shù),提高生物大數(shù)據(jù)利用和轉(zhuǎn)化能力,并保持其領(lǐng)先地位。美國(guó)政府于近兩年兩次啟動(dòng)生物大數(shù)據(jù)研究計(jì)劃,目的是有針對(duì)性地研究生物大數(shù)據(jù)管理、分析、共享等生物領(lǐng)域迫切需要的核心技術(shù),從根本上提升美國(guó)利用生物大數(shù)據(jù)的水平,并以此帶動(dòng)生物領(lǐng)域研究與產(chǎn)業(yè) 發(fā)展。
在商業(yè)領(lǐng)域,生物大數(shù)據(jù)的應(yīng)用市場(chǎng)也紛紛涌現(xiàn)。目前,一些公司已開(kāi)始提供生物大數(shù)據(jù)服務(wù)。例如,谷歌投資DNANexus公司,提供生物大數(shù)據(jù)管理和分析服務(wù),并于2011年接管NCBI數(shù)據(jù);早在2006年,23AndMe公司就開(kāi)始提供個(gè)人基因組數(shù)據(jù)分析服務(wù),目前受益者總數(shù)已超過(guò)50萬(wàn)人;英國(guó)衛(wèi)生部于2013年專(zhuān)門(mén)建立了Gel公司,管理和分析英國(guó)10萬(wàn)人基因組計(jì)劃產(chǎn)生的基因組數(shù)據(jù)。
BCC報(bào)告指出:“至2018年,生物大數(shù)據(jù)的市場(chǎng)總額將增長(zhǎng)至76億美元,年復(fù)合增長(zhǎng)率達(dá)到71.6%。”麥肯錫公司報(bào)告指出:“如果美國(guó)醫(yī)療保健行業(yè)有效利用大數(shù)據(jù),就能把成本降低8%左右,從而每年創(chuàng)造出超過(guò)3000億美元的產(chǎn)值?!?/p>
必須掌控我國(guó)生物大數(shù)據(jù)主權(quán)
對(duì)于國(guó)家而言,重要領(lǐng)域的大數(shù)據(jù)已成為戰(zhàn)略資源,擁有數(shù)據(jù)的規(guī)模和運(yùn)用數(shù)據(jù)的能力將成為一個(gè)國(guó)家綜合國(guó)力的重要標(biāo)志。
我國(guó)人口為世界第一,生物樣本資源豐富,這將使我國(guó)很快成為生物數(shù)據(jù)產(chǎn)出大國(guó),但重要的是,我們應(yīng)當(dāng)成為利用生物大數(shù)據(jù)的強(qiáng)國(guó)。國(guó)際上生物數(shù)據(jù)資源一直由歐美的幾大數(shù)據(jù)中心掌握,我國(guó)產(chǎn)生的許多生物數(shù)據(jù)資源不得不提交給這些數(shù)據(jù)中心,導(dǎo)致我國(guó)投入大量資金與人力產(chǎn)生的生物數(shù)據(jù)嚴(yán)重流失。
在生物大數(shù)據(jù)領(lǐng)域,我國(guó)缺乏國(guó)家層面的對(duì)生物大數(shù)據(jù)進(jìn)行有效管理與利用的體制、機(jī)制和環(huán)境,這已經(jīng)使中國(guó)的生物數(shù)據(jù)主權(quán)受到嚴(yán)重威脅。現(xiàn)在國(guó)際上的三大生物數(shù)據(jù)中心都是歐美從國(guó)家層面建立的,并免費(fèi)向國(guó)際開(kāi)放。我國(guó)的相關(guān)科學(xué)研究和市場(chǎng)應(yīng)用發(fā)展受益于這些數(shù)據(jù)中心,同時(shí)也嚴(yán)重依賴(lài)和受制于此。
我國(guó)尚未建立面向生物大數(shù)據(jù)技術(shù)發(fā)展的國(guó)家級(jí)技術(shù)研究中心,技術(shù)研發(fā)缺乏宏觀規(guī)劃和引導(dǎo),技術(shù)產(chǎn)出較少,難以建立完善的生物大數(shù)據(jù)技術(shù)體系,不能滿(mǎn)足生物大數(shù)據(jù)發(fā)展面臨的數(shù)據(jù)管理和服務(wù)需求。同時(shí),人才缺口較大。
大數(shù)據(jù)的使用已經(jīng)成為一個(gè)國(guó)家各領(lǐng)域提高生產(chǎn)力、創(chuàng)新能力以及競(jìng)爭(zhēng)力的關(guān)鍵要素。
生物大數(shù)據(jù)是國(guó)家戰(zhàn)略資源,對(duì)生物大數(shù)據(jù)資源的管理和利用應(yīng)上升為國(guó)家意志,并考慮實(shí)施如下措施:建立國(guó)家生物大數(shù)據(jù)中心,保障我國(guó)數(shù)字主權(quán),統(tǒng)一管理和合理利用國(guó)家生物大數(shù)據(jù)戰(zhàn)略資源;通過(guò)國(guó)家科技政策,集中突破生物大數(shù)據(jù)核心技術(shù),形成自主關(guān)鍵技術(shù)與系統(tǒng)產(chǎn)品,打破美歐技術(shù)限制;以現(xiàn)有優(yōu)勢(shì)學(xué)術(shù)和技術(shù)資源為基礎(chǔ),建立國(guó)家級(jí)生物大數(shù)據(jù)研究機(jī)構(gòu),提升我國(guó)生物大數(shù)據(jù)技術(shù)和服務(wù)水平,并培養(yǎng)專(zhuān)業(yè)的生物大數(shù)據(jù)人才;強(qiáng)調(diào)應(yīng)用需求牽引和政策支持,以加快生物大數(shù)據(jù)產(chǎn)業(yè)的全面發(fā)展。
(作者系本刊特約撰稿人)