醫(yī)學(xué)知識圖譜將知識圖譜與醫(yī)學(xué)知識進(jìn)行結(jié)合,定會推進(jìn)醫(yī)學(xué)數(shù)據(jù)的自動化與智能化處理,為醫(yī)療行業(yè)帶來新的發(fā)展契機(jī)。
循證醫(yī)學(xué)(evidence-based medicine,EBM)又稱實(shí)證醫(yī)學(xué),其核心思想是醫(yī)療決策應(yīng)在現(xiàn)有的、最好的臨床研究基礎(chǔ)上作出的一種結(jié)合個(gè)人的臨床經(jīng)驗(yàn)。循證醫(yī)學(xué)不同于以經(jīng)驗(yàn)醫(yī)學(xué)為主的傳統(tǒng)醫(yī)學(xué),它只是強(qiáng)調(diào)任何醫(yī)療決策應(yīng)建立在最佳科學(xué)研究證據(jù)基礎(chǔ)上。因此,循證醫(yī)學(xué)的出現(xiàn)為客觀化、科學(xué)化奠定了基礎(chǔ)。然而,循證醫(yī)學(xué)也有它的缺陷。例如,藥物是通過臨床試驗(yàn)的不斷驗(yàn)證而獲得許可的,但是想進(jìn)入上市階段,還需要臨床試驗(yàn)后期的不斷驗(yàn)證。即使這些藥物上市,在大量人群的使用中仍然存在問題,所以很多藥物又被退回基地。為此,我們需要對已積累的病情數(shù)據(jù)進(jìn)行不斷的挖掘,這樣才能反映整個(gè)診療中出現(xiàn)的問題。
隨著大數(shù)據(jù)的發(fā)展,越來越多的領(lǐng)域開始從經(jīng)驗(yàn)走向知識。當(dāng)經(jīng)驗(yàn)轉(zhuǎn)化成知識時(shí),整個(gè)醫(yī)學(xué)臨床決策會更加客觀化、智能化和個(gè)性化。在知識密集型的醫(yī)學(xué)領(lǐng)域,它經(jīng)歷著從循證醫(yī)學(xué)到一種基于數(shù)據(jù)的可靠模型的醫(yī)學(xué)轉(zhuǎn)變。在當(dāng)今智能時(shí)代,涵蓋三大核心技術(shù)體系的臨床診斷輔助系統(tǒng)包括知識庫(知識應(yīng)用)、人工智能(數(shù)據(jù)挖掘)、統(tǒng)計(jì)建模(輔助決策)。其中,每一部分都對醫(yī)學(xué)領(lǐng)域的臨床診斷決策起著至關(guān)重要的作用。
在醫(yī)學(xué)學(xué)科發(fā)展的過程中,臨床路徑的更新和規(guī)范化的臨床指南的應(yīng)用對臨床醫(yī)生造成越來越大的壓力。醫(yī)生與計(jì)算機(jī)技術(shù)的緊密結(jié)合,使得智能臨床輔助決策支持變得可行。計(jì)算機(jī)技術(shù)處于發(fā)展上升階段,它的不斷發(fā)展為今天的智能時(shí)代添加了“催化劑”。很多診斷檢測步驟都是在計(jì)算機(jī)的輔助下完成的,包括從整個(gè)人群的疾病篩查到真正把它檢測出來,形成最終的臨床報(bào)告。與僅有醫(yī)生診斷相比,計(jì)算機(jī)和醫(yī)生的結(jié)合會使醫(yī)療效率大大提高。此外,計(jì)算機(jī)和醫(yī)生的結(jié)合也會使醫(yī)生誤診率大大降低。為此,我們希望更多的計(jì)算機(jī)與醫(yī)生相結(jié)合,利用現(xiàn)有的智能技術(shù)將醫(yī)生的誤診率降低至更小乃至為零。當(dāng)前,計(jì)算機(jī)的存儲與計(jì)算能力的大幅度提高會使醫(yī)學(xué)數(shù)據(jù)愈發(fā)豐富,醫(yī)學(xué)信息標(biāo)準(zhǔn)越來越規(guī)范,從而減輕醫(yī)生診斷壓力、提高醫(yī)生的診斷效率和服務(wù)質(zhì)量。
計(jì)算機(jī)可以輔助醫(yī)生分割圖像、提取特征。但是,病情的分析、影像分類建模的工作還需要醫(yī)生的臨床思維、專業(yè)知識做牽引,這樣才能接近臨床場景,才能解決臨床問題。
借助醫(yī)學(xué)知識圖譜,臨床診斷決策支持系統(tǒng)可以根據(jù)患者癥狀描述及化驗(yàn)數(shù)據(jù),給出智能診斷、治療方案推薦及轉(zhuǎn)診指南,還可以針對醫(yī)生的診療方案進(jìn)行分析、查漏補(bǔ)缺,減少甚至避免誤診。
目前,人工智能在語音識別、影像識別方面凸顯優(yōu)勢,但以決策診斷為主的醫(yī)學(xué)人工智能在國內(nèi)幾乎是空白。造成這一空白的核心原因是醫(yī)學(xué)人工智能無法擁有人類生活中的邏輯思維和由龐大的知識庫形成的知識圖譜。近年來,建立知識圖譜的工作已成為知識服務(wù)領(lǐng)域的一個(gè)新熱點(diǎn),并受到國內(nèi)外學(xué)者和工業(yè)界的廣泛關(guān)注。其中,國家重點(diǎn)研發(fā)項(xiàng)目“疾病研究精準(zhǔn)醫(yī)學(xué)知識庫構(gòu)建”在國內(nèi)學(xué)者的牽頭下開始展開。該項(xiàng)目最終形成一個(gè)標(biāo)準(zhǔn)——規(guī)范標(biāo)準(zhǔn)、系統(tǒng)全面的精準(zhǔn)醫(yī)學(xué)本體和語義表示,一個(gè)庫——面向全疾病譜、可自動更新的精準(zhǔn)醫(yī)學(xué)知識庫,一個(gè)平臺——可交互、可更新醫(yī)學(xué)知識的共享平臺。該項(xiàng)目不僅能夠補(bǔ)充和完善國內(nèi)全疾病學(xué)術(shù)方面在臨床轉(zhuǎn)化中面臨的產(chǎn)品化、可視化、工具應(yīng)用、數(shù)據(jù)端接口、數(shù)據(jù)關(guān)聯(lián)等底層技術(shù)問題,還可以通過知識庫的關(guān)聯(lián)建立知識圖譜,以此輔助醫(yī)生的決策診斷、制定個(gè)性化的診療方案。
人們對醫(yī)學(xué)人工智能的認(rèn)識是用深度學(xué)習(xí)去看醫(yī)學(xué)影像,實(shí)際則不然。首先,醫(yī)生需要翻閱大量的醫(yī)學(xué)文獻(xiàn)和臨床指南,做各種各樣的知識庫。其次,醫(yī)生需要找到從分子水平到個(gè)體水平的關(guān)聯(lián),形成龐大的知識圖譜,這是非常重要的。在建立知識圖譜的過程中,我們需要將患者目前的疾病癥狀與之前已有的相同或者類似的疾病癥狀連接起來,找到其相似點(diǎn)并進(jìn)行比較。此外,我們需要深入挖掘隱藏的特征——隱性的知識。然而,想要挖掘那些隱性的知識,又是一個(gè)相當(dāng)復(fù)雜且有挑戰(zhàn)性的工作。例如,在醫(yī)學(xué)影像領(lǐng)域,醫(yī)生不僅要將各種病例的醫(yī)學(xué)影像分類,還要將
患者癥狀與已有的知識庫及隱性的知識連接起來,重新推理,形成圖像和知識庫連接的知識圖譜。在這個(gè)過程中,醫(yī)生需要經(jīng)歷一個(gè)相當(dāng)復(fù)雜的推理過程去研究一個(gè)疾病的癥狀,不僅要參照醫(yī)學(xué)文獻(xiàn)和臨床指南,還要在將它們中的知識消化成自己的知識之后再進(jìn)行深度挖掘,從而形成隱性的知識。
很多針對肺部疾病的篩查公司檢測病灶的能力很強(qiáng),但他們并不能判斷病灶的發(fā)展程度。這就需要依靠醫(yī)生的先驗(yàn)知識與機(jī)器檢測結(jié)果的結(jié)合才能實(shí)現(xiàn)更精準(zhǔn)的診斷結(jié)果。為此,我們建立了一種叫基于混合專家模型預(yù)測知識圖譜的肺部電子計(jì)算機(jī)斷層掃描(CT)影像輔助圖譜。它包括對病灶的篩查、分割,參數(shù)的提取,準(zhǔn)確模型的建立,以及含有專家推理報(bào)告的肺癌和肺結(jié)核影像知識圖譜的構(gòu)建。例如,醫(yī)生在一名男性艾滋病患者的肺部發(fā)現(xiàn)了明顯的病灶,但這個(gè)病灶是否屬于肺癌,醫(yī)生不能立即給出結(jié)論。他們需要將醫(yī)學(xué)影像分析出來的病灶參數(shù)與臨床指南里的參數(shù)比較并整合在一起,在這個(gè)基礎(chǔ)上,醫(yī)生再把病灶的特征、發(fā)展程度與已有的知識庫構(gòu)建而成的知識圖譜進(jìn)行分析、比較。最后,醫(yī)生給出準(zhǔn)確的結(jié)論——良性的結(jié)核?;诖朔N方式,醫(yī)生能對患者的病灶進(jìn)行更加精準(zhǔn)、全面的分析,得出可解釋性較強(qiáng)的結(jié)論。在基于混合專家模型預(yù)測知識圖譜的肺部CT影像輔助圖譜中,醫(yī)學(xué)影像處理為前半部分,如何把在醫(yī)學(xué)影像中找到的疾病特征和知識圖譜結(jié)合起來為后半部分,前后兩部分相結(jié)合才是完整的知識圖譜的構(gòu)建。這樣才能補(bǔ)充和完善臨床診斷決策所需的推理能力,全面覆蓋臨床信息,為臨床診斷決策分析提供重要的證據(jù)。
罕見疾病又稱“孤兒病”,發(fā)病率很低,患病人群較分散。目前,罕見疾病的種類超過7 000種,80%具有遺傳性,以先天性畸形、內(nèi)分泌代謝及神經(jīng)系統(tǒng)疾病為主。部分普通醫(yī)生無法在第一時(shí)間做出正確的醫(yī)學(xué)診斷,往往需要將患者轉(zhuǎn)至三甲醫(yī)院,且在多學(xué)科、跨專業(yè)的臨床專家協(xié)作下進(jìn)行精準(zhǔn)的治療。此外,罕見疾病在病癥指數(shù)增長不是特別明顯的時(shí)候往往容易被漏診,漏診率達(dá)到99%。一旦漏診會造成嚴(yán)重的后果,到了一定年齡,它可能會造成患者殘疾或者死亡。
基于罕見疾病患者照片中的面部特征(又稱人類表型本體,HPO)可以被利用并進(jìn)行推理,醫(yī)生可將深度學(xué)習(xí)識別面部特征技術(shù)與已有的知識庫相結(jié)合,對目前的罕見疾病進(jìn)行圖像和知識庫的關(guān)聯(lián)性分析,繪制出一個(gè)基于大量數(shù)據(jù)的、通過面部特征篩查罕見疾病的知識圖譜?;颊咴诰驮\期間可以依據(jù)這個(gè)知識圖譜詢問具體病情。同時(shí),醫(yī)生可以根據(jù)這個(gè)知識圖譜更加準(zhǔn)確地診斷罕見疾病,減少誤診及漏診的發(fā)生,從而大大提高罕見疾病的初診正確率。
醫(yī)學(xué)知識圖譜將知識圖譜與醫(yī)學(xué)知識進(jìn)行結(jié)合,定會推進(jìn)醫(yī)學(xué)數(shù)據(jù)的自動化與智能化處理,為醫(yī)療行業(yè)帶來新的發(fā)展契機(jī)。借助醫(yī)學(xué)知識圖譜,臨床診斷決策支持系統(tǒng)可以根據(jù)患者癥狀描述及化驗(yàn)數(shù)據(jù),給出智能診斷、治療方案推薦及轉(zhuǎn)診指南,還可以針對醫(yī)生的診療方案進(jìn)行分析、查漏補(bǔ)缺,減少甚至避免誤診。但是,在實(shí)際應(yīng)用中,醫(yī)學(xué)知識圖譜的應(yīng)用存在兩個(gè)方面的問題:一是缺少完備的全科醫(yī)學(xué)知識圖譜;二是臨床診斷決策的可靠性有待提高。對于前者,目前基于知識圖譜實(shí)際應(yīng)用的臨床診斷決策主要還是針對特定疾病類型,無法廣泛應(yīng)用。對于后者,臨床診斷決策直接關(guān)系到患者的身體健康問題,需要更加準(zhǔn)確、可靠的臨床診斷決策推動醫(yī)療的發(fā)展。目前,國內(nèi)醫(yī)學(xué)知識庫建設(shè)剛剛起步,主要是基于單一信息源的醫(yī)學(xué)知識庫,以及一些自主構(gòu)建、結(jié)構(gòu)各異的專病知識庫。這些知識庫還需要在數(shù)據(jù)完備、標(biāo)準(zhǔn)共享等方面進(jìn)行完善,與國際接軌。