(青島科技大學(xué) 青島 266061)
心腦血管疾病患者伴發(fā)癥較多,起因復(fù)雜,免疫力、耐受力較低,復(fù)發(fā)幾率較高,治療以控制為主,極難治愈。所以心腦血管疾病一直為慢性病主要研究的對象之一[1]?!吨袊h(huán)雜志》一篇報(bào)告的調(diào)研數(shù)據(jù)表明,當(dāng)前中國心腦血管疾病患病率及死亡率仍處于上升階段,且患病率與年齡成正比。截止于2018年,心腦血管患病人數(shù)為2.9億人,其中患者年齡構(gòu)成中老年人占比約為60%[2]。
將大數(shù)據(jù)技術(shù)應(yīng)用于醫(yī)療領(lǐng)域,給心腦血管疾病的診療提供了新的突破契機(jī)。伴隨生命科學(xué)、信息化和大數(shù)據(jù)的高速發(fā)展,醫(yī)學(xué)數(shù)據(jù)出現(xiàn)了爆炸式增長,為疾病研究、個性化診療、醫(yī)療衛(wèi)生統(tǒng)計(jì)決策、流行病預(yù)警和趨勢預(yù)測等提供數(shù)據(jù)支撐[3]。但數(shù)據(jù)增長過快的同時(shí),出現(xiàn)了數(shù)據(jù)關(guān)聯(lián)性強(qiáng)、周期性長、隱私性敏感和冗余度大等問題,導(dǎo)致數(shù)據(jù)計(jì)算強(qiáng)度增大?;趥鹘y(tǒng)醫(yī)療大數(shù)據(jù)的分析處理方式將迎來巨大挑戰(zhàn)。
醫(yī)療大數(shù)據(jù)是一種對大量數(shù)據(jù)運(yùn)用數(shù)據(jù)挖掘、云計(jì)算、人工智能等方式,找尋其中隱藏的、具有應(yīng)用價(jià)值的、解決實(shí)際相關(guān)問題的技術(shù)。數(shù)據(jù)主要來源于臨床試驗(yàn)、醫(yī)藥分析、診斷治療、健康體檢等醫(yī)療業(yè)務(wù)所產(chǎn)生的大量的、模糊的、不規(guī)范的、有噪聲的、不可預(yù)測的數(shù)據(jù)。其中以心腦血管疾病的診療為目的產(chǎn)生的數(shù)據(jù),為心腦血管疾病大數(shù)據(jù)。
文章分析了醫(yī)療大數(shù)據(jù)的相關(guān)概念,總結(jié)心腦血管疾病大數(shù)據(jù)所具有的特征。闡述了目前心腦血管疾病大數(shù)據(jù)的應(yīng)用方向,分析并提出其研究所面臨的問題和展望。
通過采集心腦血管疾病大數(shù)據(jù)發(fā)現(xiàn),除具有一般大數(shù)據(jù)的5V特征外(Volume、Variety、Velocity、Value、Veracity)[4~5],還具有關(guān)聯(lián)性強(qiáng)、周期性長、隱私性敏感的特征。
關(guān)聯(lián)性:心腦血管疾病具有“發(fā)病率高、致殘率高、死亡率高、復(fù)發(fā)率高、并發(fā)癥多”的特點(diǎn)[6]?;颊唧w內(nèi)的醇類和脂類物質(zhì)無法正常代謝,導(dǎo)致沉淀累積并引發(fā)血管、血壓、血液發(fā)生異常。通過心腦血管疾病大數(shù)據(jù)分析,癥狀之間具有顯著的關(guān)聯(lián)規(guī)則。如麻木、虛弱、肢體感覺障礙等癥狀,主要與腦血管疾病相關(guān);陣發(fā)性呼吸困難、心悸、胸悶等癥狀,主要與心血管疾病相關(guān)。心腦血管疾病大數(shù)據(jù)的關(guān)聯(lián)性為解決疾病研究提供了方法依據(jù)。
周期性:心腦血管疾病是一種復(fù)發(fā)性強(qiáng)的慢性疾病,需要患者長期按規(guī)律檢查。伴隨檢查所生成的數(shù)據(jù)是一組時(shí)間序列,數(shù)據(jù)指標(biāo)隨治療情況的走勢進(jìn)行變化,具有一定的周期性。在治療過程中,患者不同病癥時(shí)期所產(chǎn)生的數(shù)據(jù)信息,對后續(xù)治療手段的選擇有一定的影響。因治療時(shí)間長,出現(xiàn)未知事件概率也就越大,如若導(dǎo)致數(shù)據(jù)的重采集,則會進(jìn)一步拉長治療周期。
隱私性:心腦血管疾病患者在進(jìn)行多次醫(yī)療檢測時(shí),期間所涉及的數(shù)據(jù)都為患者的個人隱私,尤其部分?jǐn)?shù)據(jù)是涉及個人生活、安全、財(cái)產(chǎn)信息的敏感數(shù)據(jù)。Latanya Sweeney教授指出,通過郵編、出生日期、性別而確定一個人的概率為87%,具有嚴(yán)重?cái)?shù)據(jù)泄露危險(xiǎn)[7]。數(shù)據(jù)泄露狀態(tài)下,患者數(shù)據(jù)會在未授權(quán)和不知情的情況下被重復(fù)、全面甚至賣給第三方利用,患者對自己隱私的掌控權(quán)利大大減弱[8]。在確保數(shù)據(jù)處理質(zhì)量的同時(shí),也會對隱私安全策略的構(gòu)建造成一定的影響[9]??梢姡颊唠[私安全問題,為心腦血管疾病大數(shù)據(jù)應(yīng)用所具有的獨(dú)特問題做鋪墊。
綜上,心腦血管疾病大數(shù)據(jù)所呈現(xiàn)出的特征,與疾病的診療模式具有一定的因果關(guān)系。把握心腦血管疾病大數(shù)據(jù)具體特征,有利于其在心腦血管疾病方面的研究與應(yīng)用。
醫(yī)療大數(shù)據(jù)被廣泛地應(yīng)用在心腦血管疾病的研究中,從醫(yī)療數(shù)據(jù)存儲系統(tǒng)中提取患者的診斷、檢查、檢驗(yàn)、體征等信息進(jìn)行分析,對患者、醫(yī)師、科研人員都具有極大的幫助。心腦血管疾病大數(shù)據(jù)蘊(yùn)藏大量有價(jià)值的信息,可應(yīng)用在如下幾個方面中。
心腦血管疾病大數(shù)據(jù)的一個重要應(yīng)用是進(jìn)行藥物作用分析,根據(jù)疾病具體癥狀,科學(xué)選擇用藥。古人云“是藥三分毒”,如何高效用藥,避免藥物不良反應(yīng),是醫(yī)療過程中需要著重對待的問題。據(jù)文獻(xiàn)統(tǒng)計(jì),門診病人藥物不良反應(yīng)的發(fā)生率為0.3%~0.5%,而住院患者達(dá)10%~20%[10]。尤其目前治療的主要方案是依靠藥物控制病情,進(jìn)行患者用藥情況數(shù)據(jù)分析,對促進(jìn)藥物效果的改進(jìn),保障醫(yī)療用藥安全有重大意義。
馮變玲等利用患者用藥后出現(xiàn)不良反應(yīng)案例數(shù)據(jù),得出心腦血管疾病常用藥物不良反應(yīng)癥狀,為使用此類藥物患者提供用藥安全分析[11];除此之外,McDowell SE等通過心腦血管藥物應(yīng)用文獻(xiàn)數(shù)據(jù)分析得出,不良反應(yīng)與不同種族人群具有一定的關(guān)聯(lián),為藥物的適用人群提供了風(fēng)險(xiǎn)分析[12]。
心腦血管疾病患者并發(fā)癥多,癥狀與疾病之間存在一定的關(guān)聯(lián)規(guī)則,導(dǎo)致研究人員多采用關(guān)聯(lián)分析法進(jìn)行分析。找尋數(shù)據(jù)之間存在的關(guān)聯(lián)關(guān)系,可以為患者的診療和防治帶來便利。分析數(shù)據(jù)之間的異常值,確定相關(guān)病癥誘發(fā)因子,做好病理關(guān)系分析,為心腦血管疾病的診療手段提供重要數(shù)據(jù)參考。
寧峰等通過對青島市常住居民血糖檢測數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)糖尿病患者會增加患冠心病和腦卒中的死亡風(fēng)險(xiǎn)[13];張艷芳等通過內(nèi)蒙古常駐居民身體狀況數(shù)據(jù),闡述了代謝綜合征與心腦血管疾病及死亡的關(guān)聯(lián)性[14];除使用患者癥狀數(shù)據(jù)之外,胡媛通過對基因數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)缺血性心腦血管疾病的發(fā)生與MTHFR基因多態(tài)性有著密切的聯(lián)系[15]。
醫(yī)療大數(shù)據(jù)對心腦血管疾病的研究具有前瞻性。不僅局限于診療過程中的應(yīng)用,對疾病防備策略的制定同樣有幫助。李吉慶等通過大量人群數(shù)據(jù)進(jìn)行構(gòu)建風(fēng)險(xiǎn)預(yù)測模型,實(shí)現(xiàn)高準(zhǔn)確度的心腦血管疾病風(fēng)險(xiǎn)預(yù)測,達(dá)到疾病的早期干預(yù)目的[16]。陳金宏在博士論文中分析,利用心腦血管疾病大數(shù)據(jù)搭建人工神經(jīng)網(wǎng)絡(luò),對心腦血管疾病預(yù)測構(gòu)建模型,為精準(zhǔn)醫(yī)療的實(shí)現(xiàn)提供了參考依據(jù)[17]。
由此可得,醫(yī)療大數(shù)據(jù)可以更深層次地研究心腦血管疾病潛在的問題,Vcelak提出將原始和挖掘的數(shù)據(jù)提供給醫(yī)生[18],可在臨床決策、輔助診斷、風(fēng)險(xiǎn)預(yù)測等方面提供全面的數(shù)據(jù)支持。
醫(yī)療大數(shù)據(jù)已經(jīng)廣泛應(yīng)用在心腦血管疾病的診治過程中,對病癥指導(dǎo)提供有價(jià)值的信息。但是要更廣泛高效地開發(fā)大數(shù)據(jù),還需要面臨諸多的挑戰(zhàn)及問題。
周期問題為心腦血管疾病大數(shù)據(jù)的采集帶來了長期的挑戰(zhàn)。心腦血管疾病大數(shù)據(jù)所具有的周期性長的特征,致使數(shù)據(jù)的收集需要投入更多的時(shí)間和精力。為進(jìn)行一項(xiàng)數(shù)據(jù)收集,需要持久保持與數(shù)據(jù)源交流。導(dǎo)致在保證數(shù)據(jù)低失訪率的同時(shí),還要維持?jǐn)?shù)據(jù)的基礎(chǔ)量級,就需要提升醫(yī)療成本。
共享問題給數(shù)據(jù)的存儲方式帶來關(guān)鍵的挑戰(zhàn)。心腦血管疾病的治療周期長、易復(fù)發(fā)。若造成患者轉(zhuǎn)診情況的發(fā)生,將導(dǎo)致數(shù)據(jù)失訪,降低數(shù)據(jù)質(zhì)量。因隱私安全問題,目前醫(yī)療機(jī)構(gòu)之間無法實(shí)現(xiàn)數(shù)據(jù)共享。共享問題的存在容易造成數(shù)據(jù)孤島,數(shù)據(jù)分散存儲無法進(jìn)行高質(zhì)量分析,也就無法獲取高價(jià)值信息。
分析問題給心腦血管疾病大數(shù)據(jù)帶來核心的挑戰(zhàn)。心腦血管疾病大數(shù)據(jù)具有極強(qiáng)的關(guān)聯(lián)性,導(dǎo)致在進(jìn)行數(shù)據(jù)分析時(shí)需要進(jìn)行關(guān)聯(lián)計(jì)算。同時(shí)數(shù)據(jù)中存在較多的冗余數(shù)據(jù),數(shù)據(jù)量大,計(jì)算時(shí)間長,很難實(shí)現(xiàn)實(shí)時(shí)計(jì)算。數(shù)據(jù)量的增長速度要快于數(shù)據(jù)分析技術(shù)的更新速度,需要科研人員進(jìn)一步研究分析策略。
保障數(shù)據(jù)隱私安全是心腦血管疾病大數(shù)據(jù)應(yīng)用的基礎(chǔ)挑戰(zhàn)。心腦血管疾病的“四高一多”特點(diǎn),會促使患者數(shù)據(jù)被頻繁采集,因目前安全系統(tǒng)未達(dá)到絕對安全,對數(shù)據(jù)的操控依然含有人工元素的參與,存在數(shù)據(jù)的隱私泄露、非法交易等隱患。
心腦血管疾病大數(shù)據(jù)的特征分析,為其應(yīng)用奠定了基礎(chǔ)。大數(shù)據(jù)技術(shù)的發(fā)展,給心腦血管疾病的突破帶來了新的機(jī)遇。但是迎來機(jī)遇的同時(shí),還需要面對諸多的挑戰(zhàn),尤其是目前國內(nèi)醫(yī)療大數(shù)據(jù)的應(yīng)用研究水平與西方國家相比,仍有較大的差距。國內(nèi)大數(shù)據(jù)發(fā)展所面臨的問題,使得應(yīng)用發(fā)展存在很多限制,無法進(jìn)行更具有價(jià)值的醫(yī)學(xué)研究。為此需要科研人員進(jìn)一步完成問題攻關(guān),實(shí)現(xiàn)醫(yī)療大數(shù)據(jù)的高效應(yīng)用。