許浪 趙國(guó)光 張建宇 劉丹 曾燕
(1武漢科技大學(xué)醫(yī)學(xué)院,湖北 武漢 430065;2武漢科技大學(xué)醫(yī)學(xué)院腦與認(rèn)知功能研究所)
2011年,第11屆美國(guó)易安信公司(EMC)世界年度大會(huì),大數(shù)據(jù)概念被正式提出〔1〕,標(biāo)志著人類(lèi)進(jìn)入大數(shù)據(jù)時(shí)代。目前比較認(rèn)同的大數(shù)據(jù)定義有5V特征,即數(shù)據(jù)容量巨大(Volume)、生成速度極快(Velocity)、模態(tài)多樣(Variety)、可變性大(Variability)和真?zhèn)坞y辨(Veracity)〔2〕,此定義可能會(huì)進(jìn)一步擴(kuò)增,比如增加可視化 (Visualisation)和科學(xué)價(jià)值(Value)〔3〕。在滿(mǎn)足大數(shù)據(jù)基本特征的前提下,與醫(yī)療健康服務(wù)目的、過(guò)程、結(jié)果相關(guān)的大數(shù)據(jù)可以稱(chēng)之為醫(yī)療健康大數(shù)據(jù)。 2016年是我國(guó)醫(yī)療健康大數(shù)據(jù)元年:3月8日,國(guó)家啟動(dòng)精準(zhǔn)醫(yī)學(xué)研究重點(diǎn)專(zhuān)項(xiàng),目標(biāo)是構(gòu)建百萬(wàn)人以上自然人群健康隊(duì)列和重大疾病專(zhuān)病隊(duì)列〔4〕;6月24日,國(guó)務(wù)院辦公廳印發(fā)《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見(jiàn)》〔5〕;8月26日,中共中央政治局審議通過(guò)“健康中國(guó)2030”規(guī)劃綱要;8月29日,中國(guó)衛(wèi)生信息學(xué)會(huì)健康醫(yī)療大數(shù)據(jù)產(chǎn)業(yè)發(fā)展與信息安全專(zhuān)業(yè)委員會(huì)成立大會(huì)在南京召開(kāi),這是首個(gè)聚焦大數(shù)據(jù)產(chǎn)業(yè)與信息安全的全國(guó)性專(zhuān)業(yè)委員會(huì)。與密集出臺(tái)的政策和指導(dǎo)意見(jiàn)相呼應(yīng),復(fù)旦大學(xué)、北京大學(xué)和清華大學(xué)等多所高校和科研機(jī)構(gòu)相繼成立生物或醫(yī)療健康大數(shù)據(jù)研究中心,由大數(shù)據(jù)引領(lǐng)的醫(yī)療健康領(lǐng)域發(fā)展將會(huì)深刻影響醫(yī)療健康服務(wù)模式。
在人口急速老齡化的社會(huì)大背景下,與老年相關(guān)的神經(jīng)認(rèn)知功能障礙(NCD,也叫癡呆疾病)在中國(guó)快速蔓延,成為影響國(guó)人健康的重大慢性病。本文主要概述癡呆和阿爾茨海默病(AD)研究現(xiàn)狀和面對(duì)的困難,分析了我國(guó)醫(yī)療健康大數(shù)據(jù)資源的來(lái)源和基礎(chǔ),探討了大數(shù)據(jù)應(yīng)用于癡呆和AD研究的機(jī)會(huì)與挑戰(zhàn),提出了大數(shù)據(jù)應(yīng)用于癡呆和AD研究未來(lái)的發(fā)展方向。
流行病學(xué)研究資料表明中國(guó)癡呆患者總數(shù)已經(jīng)超過(guò)919萬(wàn)〔6〕,到2030年將達(dá)1 200萬(wàn),2040年將達(dá)到2 200萬(wàn),是所有發(fā)達(dá)國(guó)家癡呆患者人數(shù)的總和〔7〕,其中以AD為最高發(fā),占所有癡呆病例的60%~70%〔6〕。據(jù)估計(jì),目前全球癡呆疾病所耗費(fèi)的直接醫(yī)療資源有55 289.32億元人民幣(8 200億美元),還不包括家庭照顧所造成的人力成本和其他間接費(fèi)用〔8〕,而以中國(guó)為首的低收入和中等收入國(guó)家,90%以上的癡呆癥患者只能選擇家庭照顧〔9〕。雖然中國(guó)是世界上老年人口數(shù)最多的國(guó)家,目前60歲以上人口為2.14億人〔10〕,并且還是癡呆癥患者人數(shù)最多的國(guó)家〔7〕,但是我國(guó)人群癡呆知曉率、就診率、治療率及控制率都處在相當(dāng)?shù)偷乃健?1〕。我國(guó)目前還沒(méi)有一家從事老年期癡呆研究的專(zhuān)門(mén)機(jī)構(gòu)和醫(yī)院;癡呆并未被納入到慢病管理國(guó)家基本公共衛(wèi)生服務(wù)項(xiàng)目;相比發(fā)達(dá)國(guó)家和國(guó)際組織制定的模型、防治指南和建立的數(shù)據(jù)庫(kù)〔8,9〕,我國(guó)在該領(lǐng)域的工作尚處于空白階段,難以與國(guó)際接軌。
為了解AD的危險(xiǎn)因素、保護(hù)因素和疾病進(jìn)程,國(guó)際上一些長(zhǎng)期跟蹤癡呆和AD的人群隊(duì)列研究做出了卓越貢獻(xiàn)。 其中比較著名的隊(duì)列有 Alzheimer Disease Neuroimaging Initiative (ADNI)〔12〕、10/66 Population-Based Study隊(duì)列〔13〕、Mayo Clinic Study of Aging〔14〕和Framingham Heart Study Offspring〔15〕。 但是,我國(guó)的老年人群隊(duì)列研究才剛剛起步,目前國(guó)內(nèi)從事AD相關(guān)危險(xiǎn)因素的隊(duì)列有:(1)2009年由復(fù)旦大學(xué)華山醫(yī)院神經(jīng)內(nèi)科洪震教授領(lǐng)銜的科研團(tuán)隊(duì)在國(guó)內(nèi)建立了第1個(gè)老年認(rèn)知功能障礙研究的社區(qū)人群隊(duì)列,開(kāi)展了社區(qū)AD和帕金森病流行病學(xué)調(diào)查〔16〕;(2)首都醫(yī)科大學(xué)宣武醫(yī)院神經(jīng)內(nèi)科賈建平教授團(tuán)隊(duì)聯(lián)合北京、上海、廣州、長(zhǎng)春、貴陽(yáng)等7個(gè)地區(qū)城鄉(xiāng)臨床隊(duì)列進(jìn)行過(guò)AD輕度認(rèn)知障礙診斷與干預(yù)等研究工作,發(fā)表了一批有影響力的論文,但隊(duì)列的人數(shù)有限,只有幾百例,主要在AD藥物的早期干預(yù)研究上;(3)2016年6月同濟(jì)大學(xué)校長(zhǎng)裴鋼倡導(dǎo)發(fā)起的上海老年腦健康隊(duì)列研究才剛剛啟動(dòng)。
相比于在AD的危險(xiǎn)因素研究方面所取得的成果,國(guó)際上的AD新藥研究卻多以失敗告終,2002~2012年,99.6%的治療AD新藥的臨床試驗(yàn)宣告失敗〔17〕。目前僅僅只有3種藥物加1種聯(lián)合治療方案先后獲得美國(guó)食品和藥品管理局(FDA)批準(zhǔn),更為無(wú)奈的是這些上市藥物僅僅只能緩解部分癥狀,并不能減緩、治愈老年癡呆〔8〕。因此,癡呆和AD研究面臨的困難特別巨大〔18〕。
2.1我國(guó)醫(yī)療健康大數(shù)據(jù)主要來(lái)源和特點(diǎn) 我國(guó)搭上“互聯(lián)網(wǎng)+”的列車(chē),各級(jí)醫(yī)療機(jī)構(gòu)正行進(jìn)在醫(yī)療信息數(shù)字化的軌道上,海量的醫(yī)療健康數(shù)據(jù)正在產(chǎn)生。臨床醫(yī)療:電子健康檔案,電子病歷,電子處方,診療數(shù)據(jù),醫(yī)學(xué)影像數(shù)據(jù),病案管理,醫(yī)療設(shè)備和儀器數(shù)據(jù),醫(yī)院信息系統(tǒng) (HIS)數(shù)據(jù)等;醫(yī)學(xué)研究:全基因組,全外顯子組,轉(zhuǎn)錄組,蛋白質(zhì)組,DNA甲基化,微生物組,單細(xì)胞水平基因型和表型研究,人類(lèi)健康相關(guān)微生物群落研究,生物醫(yī)學(xué)圖像研究腫瘤生物學(xué)特性,分子標(biāo)記,藥物靶標(biāo)的鑒定和特征描述等;制藥企業(yè):新藥臨床試驗(yàn),藥理學(xué),藥物化學(xué),新型藥物的設(shè)計(jì),藥品供應(yīng)等;人口健康信息:運(yùn)動(dòng)監(jiān)測(cè)、膳食監(jiān)測(cè),個(gè)體健康教育,兒童青少年心理衛(wèi)生問(wèn)題,中國(guó)兒童青少年血壓,生殖健康,學(xué)生體質(zhì)健康監(jiān)測(cè),居民健康狀況調(diào)查等;數(shù)字健康醫(yī)療設(shè)備:實(shí)時(shí)視頻,智能穿戴設(shè)備及相關(guān)微型傳感器件,遠(yuǎn)程監(jiān)控系統(tǒng),數(shù)字醫(yī)療設(shè)備等;公共衛(wèi)生和流行病學(xué)研究:電子健康檔案,慢病監(jiān)測(cè),傳染病監(jiān)測(cè),疾病與死亡登記,公共衛(wèi)生監(jiān)測(cè),腫瘤登記,計(jì)劃生育等;基本公共衛(wèi)生服務(wù):城鄉(xiāng)居民健康檔案管理,健康教育,預(yù)防接種,0~6歲兒童健康管理,孕產(chǎn)婦健康管理,老年人健康管理,慢性病患者健康管理 (高血壓、糖尿病),重性精神疾病患者管理、結(jié)核病患者健康管理,傳染病及突發(fā)公共衛(wèi)生事件報(bào)告和處理服務(wù),中醫(yī)藥健康管理,衛(wèi)生監(jiān)督協(xié)管服務(wù)等;社會(huì)人口學(xué):人口普查,社保,國(guó)家、省市級(jí)統(tǒng)計(jì)決策庫(kù),醫(yī)療保險(xiǎn),生育保險(xiǎn),經(jīng)濟(jì)數(shù)據(jù),養(yǎng)老保險(xiǎn)等;環(huán)境健康:環(huán)境質(zhì)量監(jiān)測(cè)網(wǎng),污染源監(jiān)測(cè),企業(yè)環(huán)境信息,休閑場(chǎng)所等;社會(huì)媒體:健康網(wǎng)站,搜索引擎,通訊運(yùn)營(yíng)商,微博,微信,論壇,QQ,客服上網(wǎng)話單等;醫(yī)療消費(fèi):醫(yī)療服務(wù)費(fèi)用,醫(yī)療設(shè)備銷(xiāo)售,藥店銷(xiāo)售,醫(yī)療保險(xiǎn),藥品消費(fèi)數(shù)據(jù),醫(yī)療消費(fèi)等;個(gè)體行為:手機(jī)上網(wǎng)行為,社交網(wǎng)絡(luò)行為,健身記錄,體力活動(dòng)記錄,缺勤記錄,即時(shí)通訊等;健康消費(fèi):保健品,健身設(shè)施數(shù)據(jù),智能健康產(chǎn)品,中醫(yī)功能狀態(tài)檢測(cè)與養(yǎng)生保健儀器設(shè)備等。其中不僅包括臨床數(shù)據(jù)和基因組數(shù)據(jù),也包括環(huán)境暴露、日常生活習(xí)慣、地理位置信息、社交媒體及其他多種多樣的數(shù)據(jù)。在這些數(shù)據(jù)基礎(chǔ)上,中國(guó)每年或每幾年就會(huì)產(chǎn)生醫(yī)學(xué)數(shù)據(jù)分析報(bào)告,諸如:中國(guó)心血管病報(bào)告、中國(guó)糖尿病行業(yè)發(fā)展趨勢(shì)及預(yù)測(cè)報(bào)告、中國(guó)腫瘤登記年報(bào)、中國(guó)居民營(yíng)養(yǎng)與慢性病狀況報(bào)告、中國(guó)出生缺陷報(bào)告、中國(guó)青少年生殖健康可及性調(diào)查基礎(chǔ)數(shù)據(jù)報(bào)告、中國(guó)疾病預(yù)防控制中心數(shù)據(jù)、全國(guó)學(xué)生體質(zhì)健康監(jiān)測(cè)報(bào)告和中國(guó)城市居民健康狀況調(diào)查白皮書(shū)。雖然數(shù)據(jù)量越來(lái)越大,但是數(shù)據(jù)質(zhì)量堪憂,大數(shù)據(jù)基礎(chǔ)還比較薄弱??偨Y(jié)起來(lái),我國(guó)醫(yī)療衛(wèi)生領(lǐng)域的大數(shù)據(jù)具有如下特點(diǎn)。①多態(tài)性。區(qū)別于其他領(lǐng)域數(shù)據(jù),醫(yī)療大數(shù)據(jù)有多模態(tài)性,比如:純數(shù)據(jù) (如化驗(yàn)、體檢結(jié)果)、信號(hào)(如腦電、心電和肌電信號(hào)等)、圖像〔如磁共振成像(MRI)、正電子發(fā)射型計(jì)算機(jī)斷層成像(PET)、X線、B超等〕、文字(如主訴、現(xiàn)/往病史、過(guò)敏史、檢測(cè)報(bào)告等)及動(dòng)畫(huà)、視頻和語(yǔ)音信息等多種形態(tài)的數(shù)據(jù)。 ②不完整性。因?yàn)獒t(yī)療數(shù)據(jù)的搜集和處理過(guò)程經(jīng)常相互脫節(jié),使得醫(yī)療數(shù)據(jù)庫(kù)不可能對(duì)任何疾病信息都能全面反映。 且有大量數(shù)據(jù)來(lái)源于人工記錄,導(dǎo)致數(shù)據(jù)記錄的偏差和殘缺,許多數(shù)據(jù)的表達(dá)、記錄本身也具有不確定性,病例和病案尤為突出,這些都造成了醫(yī)療數(shù)據(jù)的不完整性。 ③時(shí)間性。疾病的發(fā)生、發(fā)展和患者的就診有一個(gè)過(guò)程,在時(shí)間上有一個(gè)進(jìn)度,醫(yī)學(xué)檢測(cè)的波形、圖像都是時(shí)間函數(shù)。 患者隨訪、跟蹤也有一個(gè)時(shí)間跨度,這些都具有一定的時(shí)序性。 ④冗余性。每天的日常醫(yī)療過(guò)程都伴有大量醫(yī)療信息產(chǎn)生,導(dǎo)致醫(yī)學(xué)數(shù)據(jù)量特別龐大,其中可能會(huì)包含重復(fù)、無(wú)關(guān)緊要甚至是相互矛盾的記錄。 ⑤低透明性。由于我國(guó)還沒(méi)有健全的醫(yī)療健康大數(shù)據(jù)應(yīng)用準(zhǔn)入制度和實(shí)名認(rèn)證等控制系統(tǒng),一方面難以保護(hù)個(gè)人隱私和信息安全,另一方面導(dǎo)致數(shù)據(jù)透明度低。 ⑥沉重性。與其他行業(yè)的數(shù)據(jù)具有時(shí)效性及數(shù)據(jù)很輕、易于解析所不同,醫(yī)療健康大數(shù)據(jù)普遍很“重”、信息量超大、不同的解析策略可能得出豐富的結(jié)果。
2.2我國(guó)醫(yī)療健康大數(shù)據(jù)相關(guān)學(xué)科平臺(tái) 醫(yī)療健康大數(shù)據(jù)研究的發(fā)展離不開(kāi)科學(xué)平臺(tái)的支撐,成立醫(yī)療健康大數(shù)據(jù)研究中心成為推動(dòng)醫(yī)學(xué)大數(shù)據(jù)研究的重點(diǎn),在政策利好和現(xiàn)實(shí)需求的雙重驅(qū)動(dòng)下,中國(guó)各大高校在醫(yī)療健康大數(shù)據(jù)領(lǐng)域頻頻出招,多個(gè)健康大數(shù)據(jù)研究中心成立:中科院深圳先進(jìn)院成立健康大數(shù)據(jù)研究中心(2014年);復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院和大數(shù)據(jù)研究院(2015年);北京大學(xué)健康醫(yī)療大數(shù)據(jù)研究中心(2016年);清華大學(xué)數(shù)據(jù)科學(xué)研究院醫(yī)療健康大數(shù)據(jù)研究中心(2016年);湘雅臨床大數(shù)據(jù)系統(tǒng)建設(shè)項(xiàng)目(2014年);華東理工大學(xué)信息學(xué)院生物醫(yī)療開(kāi)放大數(shù)據(jù)研究中心(2016年);電子科技大學(xué)醫(yī)療健康大數(shù)據(jù)研究院(2016年);哈爾濱工業(yè)大學(xué)電子健康研究所(2013年);上海生物信息技術(shù)研究中心(2002年);春雨·中國(guó)科學(xué)院大學(xué)健康大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室(2015年)。以大數(shù)據(jù)研究中心吸引優(yōu)秀大數(shù)據(jù)研究團(tuán)隊(duì),形成一個(gè)水到渠成的牽引。
2.3我國(guó)政府層面已經(jīng)制定健康大數(shù)據(jù)近期發(fā)展目標(biāo) 根據(jù)國(guó)務(wù)院辦公廳6月24日印發(fā)《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見(jiàn)》(下稱(chēng)“意見(jiàn)”),我國(guó)近幾年在大數(shù)據(jù)發(fā)展方面將達(dá)到如下目標(biāo)〔5〕:第一步:在2017年年底建立國(guó)際級(jí)、省級(jí)、市、縣及社區(qū)多層次的人口健康信息平臺(tái)并與各級(jí)藥品招標(biāo)采購(gòu)業(yè)務(wù)應(yīng)用平臺(tái)互聯(lián)互通。第二步:在2020年實(shí)現(xiàn)建立國(guó)家醫(yī)療衛(wèi)生信息分級(jí)開(kāi)放應(yīng)用平臺(tái);100個(gè)區(qū)域臨床醫(yī)學(xué)數(shù)據(jù)示范中心;城鄉(xiāng)居民擁有規(guī)范化的電子健康檔案和功能完備的健康卡。
3.1癡呆和AD研究領(lǐng)域已開(kāi)始利用大數(shù)據(jù) 一些國(guó)際組織和機(jī)構(gòu)正在組織專(zhuān)家,形成一股研究大數(shù)據(jù)的驅(qū)動(dòng)力〔19〕。 如美國(guó)國(guó)家AD協(xié)作研究中心、ADNI、歐洲醫(yī)學(xué)信息學(xué)架構(gòu)、全球老年癡呆癥協(xié)作互動(dòng)組織,顯性遺傳性AD研究組織、AD預(yù)防組織和歐洲委員會(huì)等正是這股力量的中流砥柱〔20〕。其中,ADNI已經(jīng)走在AD大數(shù)據(jù)研究前列,他們有很好的數(shù)據(jù)共享和發(fā)表文章的記錄,同時(shí)也能從廠家吸引投資和資助,迄今已有共 2 億美元的投入〔19〕。2014年,來(lái)自英美兩國(guó)的研究員,運(yùn)用兩個(gè)世界上最大的科學(xué)數(shù)據(jù)集合ENIGMA聯(lián)盟的腦掃描數(shù)據(jù)和小鼠腦庫(kù)的遺傳信息數(shù)據(jù),比較小鼠和人類(lèi)基因,識(shí)別出能調(diào)節(jié)小鼠和人大腦中海馬尺寸的新基因微粒體谷胱甘肽S轉(zhuǎn)移酶(MGST)3,而海馬的尺寸與神經(jīng)退行性疾病有關(guān)〔21〕。2015年,美國(guó)國(guó)立健康研究院(NIH)發(fā)起“加速醫(yī)藥研究合作者計(jì)劃”(AMP),即集合政府和民間力量,利用大數(shù)據(jù)加速AD藥物研究〔22〕。來(lái)自于美國(guó)FDA、企業(yè)界和學(xué)術(shù)界的科學(xué)家們集成各方面來(lái)源的醫(yī)療健康大數(shù)據(jù),加快AD藥物研發(fā),尋找新的治療〔22〕。 同年,澳大利亞新南威爾士大學(xué)宣布該校啟動(dòng)一項(xiàng)針對(duì)癡呆癥的大數(shù)據(jù)研究項(xiàng)目,名為“癡呆癥行動(dòng)計(jì)劃”〔23〕,目標(biāo)是聯(lián)合科研人員與社會(huì)各方的力量研究癡呆癥發(fā)病機(jī)制,尋求新的治療方法。其研究重點(diǎn)是AD,此外也包括其他類(lèi)型的癡呆癥。希望將全球研究資源整合到一起,創(chuàng)建出“大數(shù)據(jù)集合”,綜合癡呆癥的多種風(fēng)險(xiǎn)因素,建立更可靠的統(tǒng)計(jì)模型、做出更精確的預(yù)測(cè)〔23〕。
這些機(jī)構(gòu)和組織正在向癡呆和AD大數(shù)據(jù)夢(mèng)想挑戰(zhàn)〔24〕,建立大型的數(shù)據(jù)庫(kù),開(kāi)發(fā)分析工具以便更有效地利用這些數(shù)據(jù),希望實(shí)現(xiàn)數(shù)據(jù)、信息和知識(shí)的無(wú)縫集成。的確,大數(shù)據(jù)的優(yōu)點(diǎn)體現(xiàn)在能將不同水平、不同形式的數(shù)據(jù)集中到一起,從基因到分子,從影像到認(rèn)知功能,為癡呆和AD研究提供一個(gè)洞悉重點(diǎn)和管中窺豹的機(jī)會(huì)。
3.2政府作為大數(shù)據(jù)研究的催化劑 健康醫(yī)療大數(shù)據(jù)的發(fā)展目前面臨一系列障礙,包括技術(shù)的限制、成本高昂、處理及分析數(shù)據(jù)對(duì)于多學(xué)科知識(shí)的要求等。前面提到的政府層面的支持措施密集出臺(tái)體現(xiàn)了政府作為大數(shù)據(jù)研究催化劑的作用,增加了大數(shù)據(jù)公共話語(yǔ)影響面,并且政府在召集人才方面具有更大的優(yōu)勢(shì),能夠建立起更加強(qiáng)大的網(wǎng)絡(luò),特別是外交網(wǎng)絡(luò),為中國(guó)的癡呆和AD研究和健康管理提供新機(jī)會(huì)。
3.3大數(shù)據(jù)應(yīng)用于癡呆和AD研究有方法學(xué)上的特色 大數(shù)據(jù)正在催生科學(xué)研究方法的巨大轉(zhuǎn)變,從假設(shè)驅(qū)動(dòng)的方法轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng)的方法。傳統(tǒng)科學(xué)方法遵循提出假設(shè),分析論證為主的路徑,而大數(shù)據(jù)研究,遵循的是收集數(shù)據(jù),再假設(shè),然后發(fā)現(xiàn)有價(jià)值的數(shù)據(jù)模式。傳統(tǒng)科學(xué)研究中,生物醫(yī)學(xué)界傾向于認(rèn)為“噪音數(shù)據(jù)”不好,研究人員往往把實(shí)驗(yàn)條件限制在可以嚴(yán)格測(cè)量的問(wèn)題上,但強(qiáng)調(diào)數(shù)據(jù)純度就意味著可供研究的病人或者樣本數(shù)量減少,也就會(huì)導(dǎo)致數(shù)據(jù)集的規(guī)模比較小,從而限制了研究的“功效”〔25〕。大數(shù)據(jù)技術(shù)可能在“噪音數(shù)據(jù)”分析方面有更強(qiáng)的能力,可以從海量的數(shù)據(jù)出發(fā),來(lái)尋找模式和關(guān)聯(lián),從而反轉(zhuǎn)醫(yī)學(xué)研究模型〔24〕。
3.4國(guó)內(nèi)生物樣本庫(kù)初具規(guī)模 國(guó)家《“十二五”生物技術(shù)發(fā)展規(guī)劃》中,明確要求建設(shè)國(guó)家生物信息科技基礎(chǔ)設(shè)施—國(guó)家生物信息中心,包括基因組、蛋白質(zhì)組、代謝組和國(guó)家生物技術(shù)管理信息庫(kù)等生物信息庫(kù)及大型生物樣本、標(biāo)本、病例資源和人類(lèi)遺傳資源庫(kù)及共享服務(wù)體系;建設(shè)若干實(shí)驗(yàn)動(dòng)物和模式生物基礎(chǔ)設(shè)施和生物醫(yī)學(xué)資源基礎(chǔ)設(shè)施。目前國(guó)內(nèi)主要的生物樣本庫(kù)有:北京市老年病醫(yī)療研究中心老年疾病遺傳資源樣本庫(kù)、生物芯片上海國(guó)家工程研究中心生物樣本庫(kù)分中心、中國(guó)醫(yī)藥生物技術(shù)協(xié)會(huì)組織生物樣本庫(kù)分會(huì)中醫(yī)藥學(xué)組。 由國(guó)家基因庫(kù)發(fā)起的E-BioBank資源信息共享平臺(tái) (簡(jiǎn)稱(chēng)“E-BioBank平臺(tái)”)已整合人類(lèi)、動(dòng)物、植物、微生物等樣本資源55.6萬(wàn)份,共享科研項(xiàng)目信息10余項(xiàng),分享行業(yè)技術(shù)性文件400余份〔26〕。 另外,中國(guó)每一家三甲醫(yī)院都建立了生物樣本庫(kù),一些大型腫瘤研究所、疾病控制與預(yù)防中心也建立了專(zhuān)攻方向上的樣本庫(kù)。這將大大有助于我國(guó)醫(yī)療健康大數(shù)據(jù)技術(shù)的發(fā)展。
4.1人群大數(shù)據(jù)面臨整合上的問(wèn)題 大數(shù)據(jù)為導(dǎo)向的人群隊(duì)列研究成為癡呆和AD研究熱點(diǎn),經(jīng)過(guò)長(zhǎng)期隨訪能夠產(chǎn)出大量人群數(shù)據(jù)〔26〕,如何收集數(shù)據(jù)是此類(lèi)研究需要解決的問(wèn)題。比如:(1)如何整合家庭醫(yī)療信息? 諸如母親健康、懷孕情況、養(yǎng)老保險(xiǎn)、醫(yī)療保險(xiǎn)、失業(yè)保險(xiǎn)、工傷保險(xiǎn)、生育保險(xiǎn)和住房公積金。(2)如何使用可穿戴設(shè)備和移動(dòng)智能設(shè)備來(lái)檢測(cè)毒物和化學(xué)物接觸? (3)如何計(jì)算研究對(duì)象被他人或家庭照顧時(shí)間? 藍(lán)牙傳感器和智能手機(jī)如何用于此項(xiàng)研究? (4)如何計(jì)算研究對(duì)象的運(yùn)動(dòng)時(shí)間? 智能手機(jī),健康數(shù)據(jù)記錄App是否可以完成? (5)研究對(duì)象使用數(shù)字設(shè)備時(shí)間?
4.2醫(yī)療健康大數(shù)據(jù)應(yīng)用于癡呆研究面臨的方法學(xué)問(wèn)題 利用大數(shù)據(jù)研究癡呆類(lèi)疾病時(shí),可能會(huì)面臨一些方法學(xué)上的問(wèn)題〔27〕,比如:(1)樣本消耗/樣本選擇,包括選擇性生存,如何選擇縱向研究隊(duì)列、數(shù)據(jù)庫(kù)、合作研究網(wǎng)絡(luò)或其他研究聯(lián)盟? (2)測(cè)量和診斷標(biāo)準(zhǔn)的不確定性,在人工評(píng)估神經(jīng)心理時(shí)產(chǎn)生的測(cè)量誤差,重復(fù)檢測(cè)方法的不一致性;(3)當(dāng)隨訪研究對(duì)象數(shù)月、數(shù)年甚至幾十年時(shí),如何規(guī)范化縱向數(shù)據(jù)模型;(4)如何監(jiān)測(cè)隨時(shí)間變化的測(cè)量;(5)如何處理高維數(shù)據(jù)〔27〕? (6)不全面或偏頗的數(shù)據(jù)會(huì)產(chǎn)生歧義性的結(jié)果。
4.3合作的問(wèn)題 我國(guó)健康醫(yī)療行業(yè)的海量數(shù)據(jù)迅速形成,但相對(duì)于國(guó)外大量開(kāi)放鏈接數(shù)據(jù)集來(lái)說(shuō),國(guó)內(nèi)的醫(yī)療健康行業(yè)數(shù)據(jù)封閉、分散且描述方式不一致,制約了整個(gè)行業(yè)的發(fā)展。癡呆和AD 研究領(lǐng)域急需建立多個(gè)國(guó)際、國(guó)內(nèi)合作項(xiàng)目,實(shí)現(xiàn)數(shù)據(jù)、信息和知識(shí)的無(wú)縫集成,建立國(guó)際化的數(shù)據(jù)收集規(guī)范和標(biāo)準(zhǔn)。建立健全幾個(gè)機(jī)構(gòu)牽頭,科技管理部門(mén)協(xié)調(diào),政府、科研院校、企業(yè)等管理部門(mén)配合的協(xié)調(diào)機(jī)制,做好人員配備和工作保障,建立醫(yī)療健康大數(shù)據(jù)生態(tài)體系和深度合作所需要的政策法規(guī)。
4.4安全問(wèn)題 與任何技術(shù)一樣,揚(yáng)長(zhǎng)避短十分重要。醫(yī)療健康大數(shù)據(jù)領(lǐng)域的快速推進(jìn)已經(jīng)引發(fā)了在各種不同的情況下部署這些系統(tǒng)的安全性問(wèn)題,需要通過(guò)嚴(yán)謹(jǐn)?shù)墓こ萄芯空页鲞@些問(wèn)題的解決方案,以提供大數(shù)據(jù)分析系統(tǒng)的創(chuàng)作者在解決這些問(wèn)題時(shí)有切實(shí)可用的方法和工具,避免數(shù)據(jù)的缺口。構(gòu)建安全標(biāo)準(zhǔn)并基于戰(zhàn)略互操作性及隱私管理規(guī)范進(jìn)行數(shù)據(jù)共享是進(jìn)一步增大醫(yī)療健康數(shù)據(jù)量的重要手段。因此醫(yī)療衛(wèi)生領(lǐng)域的癡呆疾病研究專(zhuān)家們應(yīng)該帶頭為醫(yī)療健康大數(shù)據(jù)的安全、運(yùn)營(yíng)及其他產(chǎn)品領(lǐng)域的基礎(chǔ)設(shè)施制定新的規(guī)則以及制定特定用途的調(diào)控方法。
神經(jīng)認(rèn)知功能障礙疾病受遺傳和環(huán)境因素的影響,種族、生存環(huán)境、生活習(xí)慣、醫(yī)療保障條件等均可一定程度改變神經(jīng)精神疾患的構(gòu)成與發(fā)生發(fā)展。此研究領(lǐng)域的幾個(gè)重點(diǎn)問(wèn)題特別需要利用大數(shù)據(jù)來(lái)解決:(1)腦健康的代級(jí)傳遞問(wèn)題 (例如,母親的健康和妊娠期腦健康;生命早期母親與子女互動(dòng)和早期建立的“認(rèn)知儲(chǔ)備”等對(duì)個(gè)體神經(jīng)認(rèn)知功能的影響)。(2)教育程度、認(rèn)知刺激和積極的認(rèn)知活動(dòng) (閱讀、使用智能手機(jī)和互聯(lián)網(wǎng)接觸等)與腦健康和老年期認(rèn)知能力下降的風(fēng)險(xiǎn)關(guān)聯(lián)問(wèn)題。(3)主要的心血管危險(xiǎn)因素,比如高血壓、糖尿病、血管疾病和身體活動(dòng)不足對(duì)老年期認(rèn)知功能下降的影響。(4)豐富的社交活動(dòng)與多彩的社會(huì)生活與大腦健康和老年期認(rèn)知能力下降的相關(guān)性。 (5)應(yīng)用中醫(yī)中藥與腦健康和認(rèn)知功能變化的相關(guān)性。中醫(yī)中藥在中國(guó)具有廣泛的群眾基礎(chǔ),有數(shù)以?xún)|萬(wàn)計(jì)的人使用過(guò)諸如針灸、刮痧、推拿按摩、中成藥、湯劑、中醫(yī)養(yǎng)生等中醫(yī)適宜技術(shù),那么這些措施讓使用者獲得了哪些健康益處? 與神經(jīng)認(rèn)知功能變化的關(guān)系? 是如一些文獻(xiàn)所說(shuō)的改善認(rèn)知功能還是療效不確定?(6)中國(guó)正處于社會(huì)轉(zhuǎn)型時(shí)期,經(jīng)濟(jì)轉(zhuǎn)型、社會(huì)轉(zhuǎn)型、人群遷徙、氣候變化和環(huán)境污染物在個(gè)體神經(jīng)功能變化中占有多大的權(quán)重,對(duì)腦功能的影響也需要大數(shù)據(jù)研究來(lái)支撐。(7)日常選擇與認(rèn)知功能的關(guān)系。人們每天做出各種選擇、吃東西、服藥、做這樣那樣的事情——產(chǎn)生所謂的“數(shù)據(jù)廢氣”,挖掘這樣的大型數(shù)據(jù)集來(lái)找到有用的關(guān)聯(lián),如何利用購(gòu)物籃分析,找到有意義的關(guān)聯(lián)。(8)腦庫(kù)構(gòu)建問(wèn)題。人腦組織庫(kù)建設(shè)和對(duì)人腦組織的研究是認(rèn)識(shí)人腦疾病的基本條件,在發(fā)達(dá)國(guó)家受到高度重視,其相關(guān)學(xué)術(shù)成果推動(dòng)了神經(jīng)疾病病因?qū)W和病理學(xué)機(jī)制認(rèn)識(shí)、為建立和完善對(duì)這些疾病的預(yù)防和治療提供了新的理論基礎(chǔ)和探索方向。另外,針對(duì)癡呆和AD的臨床數(shù)據(jù)庫(kù)缺乏,如果能有兩三個(gè)具體的癡呆或AD大數(shù)據(jù)研究的實(shí)操案例,就能給其他的研究者提供思路。
癡呆和AD是伴隨著人口老年化出現(xiàn)的重大慢性病,病因復(fù)雜,需要依靠大數(shù)據(jù)技術(shù)來(lái)解決一些傳統(tǒng)技術(shù)不能解決的問(wèn)題,而醫(yī)療健康大數(shù)據(jù)為生物學(xué)家、臨床醫(yī)生、流行病學(xué)家及醫(yī)療衛(wèi)生政策制定專(zhuān)家提供了有效的工具,使得數(shù)據(jù)驅(qū)動(dòng)的決策制定成為可能,并最終對(duì)患者及整個(gè)人群產(chǎn)生有益影響,希望能借助于大數(shù)據(jù)研究突破目前AD和癡呆新藥開(kāi)發(fā)所面臨的窘境。