白晉偉 沈百榮
(四川大學(xué)華西醫(yī)院科技部圖書信息中心 成都 610041) (四川大學(xué)華西醫(yī)院系統(tǒng)遺傳研究院 成都 610041)
簡單而言,醫(yī)學(xué)信息學(xué)是關(guān)于醫(yī)學(xué)數(shù)據(jù)的存取、分析和應(yīng)用、醫(yī)學(xué)與信息學(xué)交叉的學(xué)科,隨著時代的演變,醫(yī)學(xué)數(shù)據(jù)本身以及存取、分析、應(yīng)用等各方面都發(fā)生巨大變化,如從原來的小數(shù)據(jù)演變成現(xiàn)代的大數(shù)據(jù); 從群體病歷發(fā)展到包含個人基因組信息、智能穿戴設(shè)備測定的人體生理等多維數(shù)據(jù); 從靜態(tài)演變成復(fù)雜多樣、動態(tài)的時空數(shù)據(jù); 從單一醫(yī)院數(shù)據(jù)演變成患者及相關(guān)行業(yè)人員參與的醫(yī)學(xué)數(shù)據(jù); 從以疾病信息為主演變成包含健康數(shù)據(jù)在內(nèi)的人體全息數(shù)據(jù)等。在數(shù)據(jù)存取方面有互聯(lián)網(wǎng)和云計算,在分析方面有可視化、深度學(xué)習(xí)、知識庫和知識圖譜等新方法,在應(yīng)用方面則包括治病到治將病方向的疾病早期預(yù)警、治未病方面的健康管理與干預(yù)等。在此背景下的現(xiàn)代醫(yī)學(xué)信息學(xué)迎來前所未有的應(yīng)用和機遇,其應(yīng)用實例,見表1。本文將從數(shù)據(jù)、技術(shù)、算法和應(yīng)用4個方面討論現(xiàn)代醫(yī)學(xué)信息學(xué)的機會和挑戰(zhàn)。
表1 現(xiàn)代醫(yī)學(xué)信息學(xué)新應(yīng)用舉例
過去10年來醫(yī)學(xué)信息學(xué)所分析的數(shù)據(jù)最關(guān)鍵的演變是從群體數(shù)據(jù)到個性化數(shù)據(jù),無論是精準(zhǔn)醫(yī)學(xué)還是精準(zhǔn)健康管理,首先是要有個性化的數(shù)據(jù)作為前提并且是多維信息的個性化數(shù)據(jù)。目前在基因?qū)用妫S著測序技術(shù)的發(fā)展和降價,個人基因組測定的普及將逐漸成為可能,然而與個人基因組相對應(yīng)的個性化表型數(shù)據(jù)的缺乏依然是基因型-表型關(guān)系研究的瓶頸。收集精準(zhǔn)的個性化表型,尤其是臨床相關(guān)的表型數(shù)據(jù),建立相關(guān)的收集標(biāo)準(zhǔn),即本體,是多維復(fù)雜數(shù)據(jù)收集的核心問題。目前較高層次的本體如疾病本體(Disease Ontology,DO)已經(jīng)開發(fā),但是針對具體疾病的個性化、特有的疾病本體仍然有限,亟需對多種疾病進行本體開發(fā)研究,才能有利于收集個性化和結(jié)構(gòu)化的數(shù)據(jù),以便進一步個性化建模分析。只有收集大量的基于本體的數(shù)據(jù)才有可能共享、進行個性化的建模分析(包括深度學(xué)習(xí)和人工智能的實現(xiàn))。本體研究的根本挑戰(zhàn)在于臨床醫(yī)生、醫(yī)學(xué)信息學(xué)家和計算機專家在交叉融合基礎(chǔ)上建設(shè)可以為臨床應(yīng)用的疾病術(shù)語及關(guān)聯(lián)結(jié)構(gòu),構(gòu)建醫(yī)學(xué)數(shù)據(jù)收集平臺,用于收集結(jié)構(gòu)化、多維、成對的個性化大數(shù)據(jù)。疾病本體、人工智能及應(yīng)用的關(guān)系,見圖1。本體研究基于臨床、醫(yī)學(xué)信息學(xué)和計算科學(xué)的合作,在本體支持下可以構(gòu)建參與性網(wǎng)絡(luò)平臺,患者、醫(yī)生和相關(guān)人員協(xié)同提供數(shù)據(jù)形成結(jié)構(gòu)化的生物醫(yī)學(xué)大數(shù)據(jù),從而促進人工智能的發(fā)展、知識發(fā)現(xiàn)和基于患者相似性的大數(shù)據(jù)比對應(yīng)用,這是實現(xiàn)醫(yī)學(xué)人工智能的基礎(chǔ)和必要條件。
圖1 疾病本體、人工智能及應(yīng)用的關(guān)系
互聯(lián)網(wǎng)的發(fā)展為解決遠程數(shù)據(jù)空間孤立與分散的問題提供有利條件,本體建設(shè)可以為領(lǐng)域內(nèi)提供一個共享的標(biāo)準(zhǔn)。與醫(yī)學(xué)信息學(xué)相關(guān)聯(lián)的不僅是互聯(lián)網(wǎng)的發(fā)展,社會網(wǎng)絡(luò)如Facebook、Linkedin、WeChat使人們的生活通過網(wǎng)絡(luò)虛擬地連接起來,患者、醫(yī)生、親友和相關(guān)人員社會網(wǎng)絡(luò)的建立使優(yōu)質(zhì)、深度信息與資源的獲取變得更加便利,如醫(yī)生、治療和藥物信息、患者經(jīng)驗等。當(dāng)然這種社會網(wǎng)絡(luò)的信息傳遞也可能帶來負(fù)面的心理干擾?;ヂ?lián)網(wǎng)上可以通過交流建立起患者-醫(yī)生-社會網(wǎng)絡(luò)的信息交換平臺,典型的平臺如PatientsLikeme是患者或相關(guān)人員在網(wǎng)絡(luò)上注冊、交流并積累數(shù)據(jù)與信息分析的平臺?;诒倔w的疾病信息平臺可以為患者入院前后進行有指導(dǎo)的信息添加、分析與診斷,從而減少患者與醫(yī)生的交流障礙與時間,同時有利于數(shù)據(jù)和時空信息的積累。參與性醫(yī)學(xué)是在互聯(lián)網(wǎng)和社會網(wǎng)絡(luò)的技術(shù)下實現(xiàn)的一種以患者為主體的新型醫(yī)學(xué)模式,在互聯(lián)網(wǎng)的支持下患者、醫(yī)生和其他相關(guān)人員(如家人、好友等)形成的社會網(wǎng)絡(luò)中患者、醫(yī)生和相關(guān)的醫(yī)學(xué)信息、資源等網(wǎng)絡(luò)距離變得很近,從而讓更多人參與到醫(yī)學(xué)的實踐、研究和傳播,見圖2。
圖2 互聯(lián)網(wǎng)與社會網(wǎng)絡(luò)促進參與性醫(yī)學(xué)的發(fā)展
傳統(tǒng)的個人醫(yī)學(xué)信息有限、數(shù)據(jù)量小,數(shù)據(jù)分析方法通常是統(tǒng)計平均為主的群體分析。隨著個性化數(shù)據(jù)量的增長,傳統(tǒng)的方法往往不再有效,因為會將數(shù)據(jù)中的個性化模式平均掉。近年來提出不少對統(tǒng)計平均方法進行修正的算法,如COPA、MOST等都是在計算時更加注重隱含在特殊子群結(jié)構(gòu)里的個性化統(tǒng)計算法[7]。除統(tǒng)計方法外基于第一性原理的方法尋找醫(yī)學(xué)大數(shù)據(jù)內(nèi)在的基本規(guī)則也十分重要[8]。大數(shù)據(jù)的積累為醫(yī)學(xué)人工智能的發(fā)展提供機會,但基本規(guī)律的尋找和機制性的研究是人工智能所不能替代的。由于數(shù)據(jù)的多維性和復(fù)雜性,不同程度的數(shù)據(jù)融合是提高分析精準(zhǔn)度的根本思路。最近發(fā)展起來的放射基因組學(xué)就是融合圖像與組學(xué)兩個層次的數(shù)據(jù)分析策略。隨著智能穿戴設(shè)備的廣泛使用,實時、動態(tài)、個性化數(shù)據(jù)的獲取變得越來越便捷和重要,對實時動態(tài)信號的收集、處理也需要發(fā)展新的算法,如非線性信號變換方法:小波分析、各種熵的計算等。
疾病生物醫(yī)學(xué)數(shù)據(jù)反映人體疾病的演變特征和規(guī)律,人們可以根據(jù)其基本特征如動態(tài)演化性、系統(tǒng)網(wǎng)絡(luò)關(guān)系、文本數(shù)據(jù)、影像數(shù)據(jù)等開發(fā)相應(yīng)的算法工具,理解疾病的復(fù)雜演化規(guī)律,從而提前預(yù)測疾病的發(fā)生發(fā)展。早在公元前250年,黃帝內(nèi)經(jīng)中就提出治病、治將病、治未病的概念,后兩者是疾病早期診斷與預(yù)防的思想,與疾病演化密切相關(guān),涉及基本的遺傳風(fēng)險預(yù)測、病變生理信號、分子變異早期發(fā)現(xiàn)與監(jiān)控,從鍛煉、營養(yǎng)和精神等多方面的網(wǎng)絡(luò)系統(tǒng)演化。而這一復(fù)雜系統(tǒng)還有自組織、疾病自愈的特征,免疫系統(tǒng)、神經(jīng)系統(tǒng)與疾病體系的復(fù)雜抗衡演變,即使有早期的疾病信號或遺傳風(fēng)險,在復(fù)雜的環(huán)境-基因-生活習(xí)慣的多系統(tǒng)耦合下疾病有可能自愈。過度診斷、治療成為不可避免的現(xiàn)象,任何一個模型都難以精準(zhǔn)預(yù)測這種系統(tǒng)的動態(tài)演變和自愈。目前治病模式更多的還是在生物醫(yī)學(xué)模型下展開的研究或治療,生物-心理-社會醫(yī)學(xué)模型需要更大框架下的多維數(shù)據(jù)才能真正研究從治病到治未病的演變,促進智能健康管理與主動健康的實現(xiàn)。
由于現(xiàn)代醫(yī)學(xué)信息學(xué)在內(nèi)涵上發(fā)生巨大變化,該學(xué)科的發(fā)展與其他學(xué)科如生物信息學(xué)、數(shù)據(jù)科學(xué)、人工智能、健康管理、互聯(lián)網(wǎng)支撐的參與性醫(yī)學(xué)等形成一個交叉學(xué)科群。未來學(xué)科設(shè)置必須考慮醫(yī)學(xué)數(shù)據(jù)的特征與學(xué)科群的協(xié)同發(fā)展。真正的學(xué)科交叉并非簡單的加和,而是整合前提下的融合,傳統(tǒng)的教學(xué)內(nèi)容應(yīng)隨之發(fā)生變化,反映學(xué)科發(fā)展現(xiàn)狀與未來趨勢。醫(yī)學(xué)信息學(xué)學(xué)科相關(guān)新研究方向,見表2。根據(jù)醫(yī)學(xué)數(shù)據(jù)5大特征,即演化性、隱私性、復(fù)雜性、多維性(文本、數(shù)字、圖像、動態(tài)等)、跨層次性(分子、細胞、個體和群體等),隨著數(shù)據(jù)技術(shù)的應(yīng)用推廣,將產(chǎn)生更多新的方向?,F(xiàn)代醫(yī)學(xué)信息學(xué)是一個跨生物、醫(yī)學(xué)、計算的交叉學(xué)科,其發(fā)展制約著相關(guān)理論和應(yīng)用科學(xué)的發(fā)展。從數(shù)據(jù)到算法、應(yīng)用對應(yīng)著不同新型學(xué)科的產(chǎn)生與交叉。參與性醫(yī)學(xué)可以促進復(fù)雜數(shù)據(jù)的群體協(xié)作功能,而人工智能相關(guān)算法將促進精準(zhǔn)的智能健康管理實施。
表2 現(xiàn)代醫(yī)學(xué)信息學(xué)新研究方向
新技術(shù)催生新的研究范式,現(xiàn)代基因組學(xué)是驅(qū)動醫(yī)學(xué)信息學(xué)變化的根本動力,改變各層次(分子、細胞、個體、群體等) 的研究范式以及這些不同層次交叉融合。這種融合也深化醫(yī)學(xué)信息學(xué)的內(nèi)涵,醫(yī)學(xué)圖像分析與基因組學(xué)融合產(chǎn)生放射基因組學(xué),患者個體的電子病歷數(shù)據(jù)與基因組學(xué)融合產(chǎn)生個體化治療或精準(zhǔn)診療,群體層次的衛(wèi)生統(tǒng)計學(xué)也將受到基因組學(xué)發(fā)展的影響而研究群體基因圖譜特征和演化等。對應(yīng)于個體基因組學(xué),個性化表型組學(xué)的研究將是醫(yī)學(xué)信息學(xué)的重要研究方向,醫(yī)學(xué)信息學(xué)的發(fā)展也將隨著相關(guān)學(xué)科的生態(tài)變化而發(fā)生演變?,F(xiàn)代醫(yī)學(xué)信息學(xué)必將成為新時代重要和關(guān)鍵的交叉學(xué)科領(lǐng)域,也將會因時代的發(fā)展和需求迎來更多的機會和挑戰(zhàn)。