黃文莉
摘 要本文首先對(duì)大數(shù)據(jù)的涵義及特點(diǎn)進(jìn)行了梳理,在綜述國(guó)內(nèi)外大數(shù)據(jù)應(yīng)用實(shí)踐基礎(chǔ)上,歸納總結(jié)了我國(guó)大數(shù)據(jù)技術(shù)在疾病防控上應(yīng)用面臨的困難和挑戰(zhàn),進(jìn)而提出了加快我國(guó)大數(shù)據(jù)發(fā)展的對(duì)策建議。
【關(guān)鍵詞】大數(shù)據(jù) 疾病防控
被喻為"未來(lái)的新石油"的大數(shù)據(jù),正成為繼云計(jì)算、物聯(lián)網(wǎng)之后信息技術(shù)領(lǐng)域的又一熱點(diǎn)《華爾街日?qǐng)?bào)》將大數(shù)據(jù)時(shí)代、智能化生產(chǎn)和無(wú)線網(wǎng)絡(luò)革命稱(chēng)為引領(lǐng)未來(lái)繁榮的三大技術(shù)變革。大數(shù)據(jù)技術(shù)已經(jīng)開(kāi)始應(yīng)用到各行各業(yè)。在給人類(lèi)社會(huì)帶來(lái)海量信息和巨大變革的同時(shí),大數(shù)據(jù)技術(shù)在疾病防控上的應(yīng)用引起了人們?cè)絹?lái)越大的興趣。
1 大數(shù)據(jù)的定義
從某種程度上說(shuō),大數(shù)據(jù)是數(shù)據(jù)分析的前沿技術(shù)。簡(jiǎn)言之,從各種各樣類(lèi)型的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力,就是大數(shù)據(jù)技術(shù)。
大數(shù)據(jù)的特點(diǎn)有四個(gè)層面:
(1)數(shù)據(jù)體量巨大。從TB級(jí)別,躍升到PB級(jí)別;
(2)數(shù)據(jù)類(lèi)型繁多。如網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等。
(3)處理速度快,1秒定律,可從各種類(lèi)型的數(shù)據(jù)中快速獲得高價(jià)值的信息,這一點(diǎn)也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。
(4)高價(jià)值,只要合理利用數(shù)據(jù)并對(duì)其進(jìn)行正確、準(zhǔn)確的分析,將會(huì)帶來(lái)很高的價(jià)值回報(bào)。業(yè)界將其歸納為4個(gè)“V”——Volume(大量)、Variety(多樣)、Velocity(高速)、Value(價(jià)值)。
大數(shù)據(jù),其影響除了經(jīng)濟(jì)方面的,它同時(shí)也能在政治、文化、衛(wèi)生等方面產(chǎn)生深遠(yuǎn)的影響,大數(shù)據(jù)可以幫助人們開(kāi)啟循“數(shù)”管理的模式,也是我們當(dāng)下“大社會(huì)”的集中體現(xiàn),三分技術(shù),七分?jǐn)?shù)據(jù),得數(shù)據(jù)者得天下。數(shù)據(jù)有了,但如何駕馭這些海量數(shù)據(jù),將它們應(yīng)用于疾病防控工作方面,挖掘數(shù)據(jù)的核心價(jià)值,這就是我們疾控人員研究的方向。
1.1 大數(shù)據(jù)技術(shù)應(yīng)用的必要性
傳統(tǒng)疾病預(yù)防控制的方式最大的不足在于實(shí)時(shí)性上,但疾病的防控?fù)尩木褪菚r(shí)間。如果能在疾病流行前即預(yù)測(cè)到疾病的發(fā)展態(tài)勢(shì),加強(qiáng)對(duì)疾病的預(yù)防,就能達(dá)到最大限度保障群眾健康的目的?,F(xiàn)在,利用大數(shù)據(jù)技術(shù)對(duì)疾病傳播進(jìn)行更先進(jìn)的監(jiān)控與控制成為了可能。
1.2 大數(shù)據(jù)技術(shù)應(yīng)用實(shí)例
(1)谷歌已在疾病預(yù)測(cè)防控上已經(jīng)走出先例,那么我們先來(lái)看下谷歌的谷歌流感趨勢(shì)(Google Flu Trends,GFT)的工作成果,從中窺視疾病預(yù)防控制的大數(shù)據(jù)未來(lái)。
2008年,谷歌上線“谷歌流感趨勢(shì)”項(xiàng)目,該項(xiàng)目開(kāi)始預(yù)測(cè)流感傳播。
2009年在美國(guó)的H1N1爆發(fā)幾周前,谷歌成功預(yù)測(cè)了H1N1在全美的傳播范圍,具體到了州還有特定地區(qū),判斷非常及時(shí),令美國(guó)公共衛(wèi)生機(jī)構(gòu)以及全美大為震驚,疾控中心通常只能在流感爆發(fā)一兩周之后才可以做到,而谷歌的及時(shí)性讓全美側(cè)目。
這是真正第一次利用搜索引擎大數(shù)據(jù)對(duì)疾病控制的預(yù)測(cè)嘗試,谷歌因此也獲得巨大殊榮。
(2)2014年4月2日,清華大學(xué)在京宣布,該校將聯(lián)合國(guó)內(nèi)醫(yī)療設(shè)備生產(chǎn)企業(yè)啟動(dòng)基于大數(shù)據(jù)的公共衛(wèi)生項(xiàng)目國(guó)民“健康云數(shù)據(jù)”計(jì)劃,預(yù)計(jì)3年內(nèi)完成數(shù)據(jù)平臺(tái)建設(shè),并為遠(yuǎn)程健康管理、疾病預(yù)防等提供支撐。這也是大數(shù)據(jù)技術(shù)服務(wù)于公共衛(wèi)生領(lǐng)域的個(gè)案,這個(gè)項(xiàng)目將有效提升疾病早期預(yù)防等服務(wù)的針對(duì)性。通過(guò)對(duì)大規(guī)模數(shù)據(jù)的整理分析,可以在疾病早期防控和阻斷疾病產(chǎn)生根源方面產(chǎn)生更積極的作用。
2 大數(shù)據(jù)在疾病防控的應(yīng)用方向
2.1 提前確定一定規(guī)模的未知疾病,為疫情控制爭(zhēng)取時(shí)間
無(wú)論傳統(tǒng)檢測(cè)還是歷史數(shù)據(jù)統(tǒng)計(jì)都是無(wú)法監(jiān)測(cè)到任何沒(méi)有臨床癥狀的病例的,這些經(jīng)驗(yàn)在醫(yī)院的臨床經(jīng)驗(yàn)中都為0。但大數(shù)據(jù)卻可以做到這件事,通過(guò)醫(yī)院的共享信息、疾病監(jiān)測(cè)系統(tǒng)網(wǎng)絡(luò)報(bào)告數(shù)據(jù)以及各類(lèi)網(wǎng)絡(luò)監(jiān)控引擎指定地區(qū)的用戶的頻繁搜索關(guān)鍵詞,可以檢測(cè)到某個(gè)地區(qū)已經(jīng)出現(xiàn)了諸如不明原因的肺炎,某地餐館讓多少人出現(xiàn)嘔吐腹瀉等異常狀況……然后再通過(guò)與疾病控制中心的病毒庫(kù)中的病毒分析,尋找吻合的病毒,進(jìn)行比對(duì)分析然后將其找出,為判斷疾病贏取時(shí)間。換句話說(shuō),有了大數(shù)據(jù)后,疾病預(yù)防可以真正在第一時(shí)間內(nèi)去判斷出疫情的病毒源,進(jìn)而為控制爭(zhēng)取時(shí)間。當(dāng)前的科技下,疫情的發(fā)生是誰(shuí)也無(wú)法控制的,我們目前唯一能夠控制的就是及時(shí)制止其傳播的范圍,而大數(shù)據(jù)則是目前唯一的也是最佳的途徑。
2.2 判斷人員流向,控制疫情
在疫情發(fā)生后,雖然國(guó)家可以第一時(shí)間控制住當(dāng)?shù)匾咔?,但是人員流動(dòng)則是無(wú)法控制的。現(xiàn)在利用網(wǎng)絡(luò)技術(shù)可以做到,比如A地突然爆發(fā)了傳染病,而此時(shí)根據(jù)大數(shù)據(jù)的監(jiān)控就能監(jiān)測(cè)到傳染源區(qū)人員的主要流向地是B地與C地,于是疾控中心就拿出對(duì)應(yīng)的醫(yī)療技術(shù)和對(duì)應(yīng)的治療藥品以及疫苗來(lái)防治,第一時(shí)間趕到B地與C地,將一切藥物準(zhǔn)備就緒并為當(dāng)?shù)厝私臃N疫苗,這樣一來(lái)就減少了盲目的廣撒網(wǎng)式的全面布局情況,通過(guò)網(wǎng)絡(luò)技術(shù)上提供的人員流動(dòng)數(shù)據(jù),讓控制疫情在效率上大幅度提升。
2.3 治療藥物和疫苗的迅速研發(fā)
在疫情發(fā)生后最重要的事情就是研發(fā)對(duì)應(yīng)藥物,傳統(tǒng)的做法是一個(gè)小范圍的研發(fā),然后用傳統(tǒng)的交流方式,但是有了大數(shù)據(jù)就不可同日而語(yǔ)。在病人的治療中,所有藥物的使用數(shù)據(jù)以及用戶的病情數(shù)據(jù)都將全部聯(lián)網(wǎng),當(dāng)機(jī)器檢測(cè)到發(fā)現(xiàn)某種藥物(通過(guò)讀取錄入的藥物數(shù)據(jù))對(duì)病人的病情(通過(guò)讀取錄入病人健康的關(guān)鍵指數(shù)后的數(shù)據(jù))有部分效果后,將會(huì)迅速納入研發(fā)的決策范圍,為研發(fā)部門(mén)提供有用參考,為研發(fā)對(duì)抗疫情的藥物以及預(yù)防疫情的疫苗,提供全網(wǎng)的大數(shù)據(jù)的支持。
2.4 建立疾病防控監(jiān)測(cè)預(yù)警預(yù)報(bào)機(jī)制
未來(lái)通過(guò)大數(shù)據(jù)技術(shù)在疾病防控的預(yù)警預(yù)報(bào)應(yīng)用方面,不僅僅只是有關(guān)部門(mén)的決策者能夠收到,而是全民都享有的福利,從而保障更多人的安全。比如當(dāng)你去出差時(shí),網(wǎng)絡(luò)會(huì)在你的手機(jī)上提前通知你,你將要去的地區(qū)有食品安全問(wèn)題,再比如第一時(shí)間通知你,你所在的地區(qū)有流感地區(qū)的人群大量流入,讓你及時(shí)做好預(yù)防工作以及接種疫苗等等。
3 面臨的困難和挑戰(zhàn)
谷歌雖然在09年的預(yù)測(cè)上做出了漂亮的成績(jī),但是在2013年的2月谷歌流感趨勢(shì)被媒體大量批評(píng),原因就在于其數(shù)據(jù)總是偏高于真實(shí)的流感數(shù)據(jù)。
谷歌出錯(cuò)的原因有很多,比如谷歌的搜索算法調(diào)整會(huì)間接影響到用戶習(xí)慣,再比如谷歌的推薦搜索以及相關(guān)性推薦也會(huì)影響用戶的搜索結(jié)果,此外搜索某個(gè)關(guān)鍵詞的用戶也不一定是患病用戶,再加上運(yùn)營(yíng)商的地理位置判斷等問(wèn)題,使得谷歌出現(xiàn)算法過(guò)度擬合的情況,將噪聲當(dāng)成了信號(hào),導(dǎo)致其結(jié)果的不準(zhǔn)確性。
4 對(duì)策與建議
大數(shù)據(jù)是云計(jì)算的具體化,且正在成為一個(gè)國(guó)家最重要的國(guó)家社會(huì)資源,對(duì)大數(shù)據(jù)的獲取和利用能力正成為軟硬兼?zhèn)涞恼鎸?shí)力。因此,對(duì)于大數(shù)據(jù)在疾病預(yù)防控制上應(yīng)用的研究可以由政府為主導(dǎo),搭建基于云計(jì)算的安全、可靠、準(zhǔn)確大數(shù)據(jù)平臺(tái),再引入社會(huì)力量建設(shè)各類(lèi)疾病預(yù)防控制專(zhuān)業(yè)信息服務(wù)平臺(tái),面向公眾提供疾病預(yù)防專(zhuān)業(yè)、權(quán)威咨訊。
困難從從,但機(jī)會(huì)與挑戰(zhàn)并存,我們要加快大數(shù)據(jù)技術(shù)研究,將其應(yīng)用于疾病防控,最大限度地保障人民的身體健康。
參考文獻(xiàn)
[1]馬家奇.公共衛(wèi)生大數(shù)據(jù)應(yīng)用[J].中國(guó)衛(wèi)生管理信息雜志,2014(04).
[2]于石成.大數(shù)據(jù)視角下的衛(wèi)生統(tǒng)計(jì)工作[J].醫(yī)學(xué)信息學(xué)雜志,2013(10).
[3]高漢松,基于云計(jì)算的醫(yī)療大數(shù)據(jù)挖掘平臺(tái)[J].醫(yī)學(xué)信息學(xué)雜志,2013(05).
[4]于石成.全球疾病負(fù)擔(dān)研究-大數(shù)據(jù)分析應(yīng)用實(shí)例[J].醫(yī)學(xué)信息學(xué)雜志,2013(09).
作者單位
廣東省肇慶市疾病預(yù)防控制中心 廣東省肇慶市 526060