鞏高,黃文華,曹石,陳超敏,鄭東宏
1.南方醫(yī)科大學(xué)生物醫(yī)學(xué)工程學(xué)院,廣東廣州510515;2.南方醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院人體解剖學(xué)國(guó)家重點(diǎn)學(xué)科/廣東省醫(yī)學(xué)生物力學(xué)重點(diǎn)實(shí)驗(yàn)室,廣東廣州510515;3.河源市人民醫(yī)院設(shè)備科,廣東河源517000
在移動(dòng)智能時(shí)代到來(lái)之前,經(jīng)典的醫(yī)療設(shè)備(如假肢、支架、植入物等)被廣泛應(yīng)用。人工智能(Artifical Intelligence,AI)技術(shù)的到來(lái),使醫(yī)療技術(shù)發(fā)生了顛覆性的變革,如:(1)AI設(shè)備進(jìn)行閱片,在保證準(zhǔn)確率的前提下,效率是普通醫(yī)生的幾十倍甚至更高,還能夠幫助醫(yī)生處理臨床上一些復(fù)雜問(wèn)題,減輕以上的負(fù)擔(dān);(2)可穿戴設(shè)備監(jiān)測(cè)健康記錄,患者可隨時(shí)了解自身狀況;(3)識(shí)別醫(yī)生語(yǔ)音或筆記,精確形成電子健康記錄存儲(chǔ)在病歷數(shù)據(jù)庫(kù)中,無(wú)需花費(fèi)人力再去整理;(4)陪護(hù)機(jī)器人的研究,既能代替醫(yī)生去輻射高危地區(qū),又能時(shí)刻陪護(hù)病人,隨時(shí)感受病人健康數(shù)據(jù)與情緒波動(dòng)等。5G 時(shí)代的到來(lái),智慧醫(yī)療進(jìn)一步發(fā)展,促進(jìn)AI與病理、診斷、影像、精神醫(yī)學(xué)、眼科學(xué)、中醫(yī)學(xué)等諸多學(xué)科的融合發(fā)展[1-3]。AI在融入醫(yī)療領(lǐng)域發(fā)展的同時(shí)也存在一定的挑戰(zhàn),在應(yīng)用醫(yī)學(xué)的同時(shí)也在不斷完善自身,促進(jìn)AI技術(shù)的前進(jìn)。
目前,AI技術(shù)在醫(yī)學(xué)的應(yīng)用主要為以下幾個(gè)方面:智能藥物研發(fā)、智能輔助診療、智能語(yǔ)音識(shí)別與語(yǔ)義理解、健康管理和醫(yī)院管理。
AI在新藥研發(fā)領(lǐng)域取得了不錯(cuò)的成績(jī)。為了降低藥物的研發(fā)成本、縮短藥物發(fā)現(xiàn)的時(shí)間,在藥物發(fā)現(xiàn)階段,利用AI技術(shù)加速藥物靶點(diǎn)發(fā)現(xiàn);在臨床前研究階段,進(jìn)行化合物篩選,分析化合物的構(gòu)效關(guān)系,用于新藥發(fā)現(xiàn)和新藥風(fēng)險(xiǎn)評(píng)估;在臨床研究階段,分析藥物重定位,在不斷試驗(yàn)中發(fā)現(xiàn)新的適應(yīng)癥。目前,AI技術(shù)已經(jīng)應(yīng)用于心血管疾病、腫瘤控制等藥物的研究。特別在2019年新冠病毒疫苗及相關(guān)藥物研發(fā)中發(fā)揮著巨大作用[4]。
對(duì)于新藥研發(fā),靶點(diǎn)的發(fā)現(xiàn)及驗(yàn)證是臨床前研究的關(guān)鍵步驟之一。2020年,Pawar等[5]通過(guò)AI方法識(shí)別乳腺和卵巢的常見(jiàn)癌癥生物標(biāo)志物。在研究中,作者通過(guò)對(duì)重要基因進(jìn)行優(yōu)先級(jí)排序,并最終預(yù)測(cè)特定生物標(biāo)記物的存在;利用開(kāi)源數(shù)據(jù)庫(kù)Gene Expression Omnibus(GEO)的公開(kāi)數(shù)據(jù)集,通過(guò)層次聚類(lèi)、k-means 聚類(lèi)法,再通過(guò)隨機(jī)森林分類(lèi)算法,最終確定最潛在的靶點(diǎn)為雌激素應(yīng)答基因-雌激素受體生長(zhǎng)調(diào)節(jié)結(jié)合蛋白1(GREB1)。隨后,Dezs? 等[6]提出一種機(jī)器學(xué)習(xí)方法,以靶點(diǎn)生成產(chǎn)生的藥物性對(duì)蛋白質(zhì)進(jìn)行分類(lèi)。在文中,筆者提取70 種蛋白質(zhì)特征,包括蛋白質(zhì)序列特征、表征蛋白質(zhì)功能的特征以及蛋白質(zhì)之間相互作用的屬性,經(jīng)訓(xùn)練后得到模型受試者工作特征曲線ROC 下面積(AUC)為0.89,之后在臨床試驗(yàn)藥物組成的測(cè)試數(shù)據(jù)集上證明了該方法的有效性。
雖然AI技術(shù)的應(yīng)用縮短了新藥研發(fā)的周期,大大減少新藥研發(fā)的成本,但也存在著一定的局限性,如數(shù)據(jù)質(zhì)量差、標(biāo)注不清晰甚至含有錯(cuò)誤信息,新藥研發(fā)標(biāo)準(zhǔn)不統(tǒng)一,這對(duì)于當(dāng)前熱門(mén)的深度學(xué)習(xí)來(lái)說(shuō)是巨大的挑戰(zhàn)。除此之外,數(shù)據(jù)學(xué)習(xí)不定性大,試錯(cuò)成本較高、數(shù)據(jù)信噪比較低、缺乏優(yōu)質(zhì)的數(shù)據(jù)庫(kù)等困難制約了AI在新藥研發(fā)中的發(fā)展。因此,數(shù)據(jù)質(zhì)量的問(wèn)題在新藥研發(fā)中亟待解決。
1.2.1 輔助診斷智能影像診斷是AI在醫(yī)療領(lǐng)域中應(yīng)用最熱門(mén)的場(chǎng)景之一。一方面,經(jīng)過(guò)圖像識(shí)別技術(shù)對(duì)醫(yī)學(xué)圖像進(jìn)行辨認(rèn)和剖析,快速發(fā)現(xiàn)病灶,并將其與正常組織細(xì)胞分開(kāi),提高影像診斷效率;另一方面,構(gòu)建深度學(xué)習(xí)模型,通過(guò)對(duì)大量的圖像和診斷信息進(jìn)行深入挖掘且不斷訓(xùn)練優(yōu)化,提高模型的診斷能力,降低對(duì)復(fù)雜疾病的誤診率。
Zhang 等[7]研究一種多模態(tài)深度學(xué)習(xí)模型,用于對(duì)所采集視頻中兒童的異常行為進(jìn)行分類(lèi),并且結(jié)合其他系統(tǒng)模塊所采集的信息,輔助診斷系統(tǒng)能夠自動(dòng)生成標(biāo)準(zhǔn)化的診斷報(bào)告,包括測(cè)試結(jié)果、異常行為分析、輔助診斷結(jié)論和治療建議等。文中指出,該系統(tǒng)目前在浙江大學(xué)醫(yī)學(xué)院附屬兒童醫(yī)院心理科,用于臨床輔助診斷,得到醫(yī)生和患者一致好評(píng)。Yang 等[8]利用密集連接卷積神經(jīng)網(wǎng)絡(luò)(DenseNet)評(píng)價(jià)在高分辨率計(jì)算機(jī)斷層掃描(HRCT)上檢測(cè)COVID-19特征的診斷效果。數(shù)據(jù)集采用295例患者的數(shù)據(jù),其中健康人數(shù):149 人;COVID-19 患者數(shù):146 人。DenseNet經(jīng)過(guò)數(shù)據(jù)集訓(xùn)練和驗(yàn)證后,將圖像分類(lèi)為感染或正常兩類(lèi),最后采用ROC 和AUC 評(píng)價(jià)模型性能。結(jié)果顯示,算法在驗(yàn)證集的AUC 為0.99,在測(cè)試集的AUC 為0.98。閾值選擇為0.8,在驗(yàn)證和測(cè)試集的準(zhǔn)確性分別為95%和92%。從中得出結(jié)論,采用DenseNet 的深度學(xué)習(xí)可在HCRT 上準(zhǔn)確分類(lèi)COVID-19,可減少漏診誤診。
1.2.2 輔助治療AI用于輔助治療,主要應(yīng)用為醫(yī)療機(jī)器人。目前應(yīng)用最為廣泛是手術(shù)機(jī)器人和康復(fù)機(jī)器人。手術(shù)機(jī)器人由外科醫(yī)生控制中心、床旁機(jī)械臂系統(tǒng)、高清影像系統(tǒng)3 部分組成,具有可增加視野角度、減少手部顫抖、操作精細(xì)等優(yōu)點(diǎn),輔助醫(yī)生完成臨床手術(shù)。另外,康復(fù)機(jī)器人的使用也發(fā)展迅速,能完成輔助患者行走或者康復(fù)等基本功能。
Shin 等[9]提出并研究了兩種基于AI學(xué)習(xí)和視覺(jué)策略的模型預(yù)測(cè)控制算法:強(qiáng)化學(xué)習(xí)(RL)和演示學(xué)習(xí)(LfD)。通過(guò)對(duì)這兩種算法在仿真設(shè)置中的性能比較,表明從演示中學(xué)習(xí)算法可以通過(guò)初始化給定演示的預(yù)測(cè)動(dòng)態(tài)來(lái)提高學(xué)習(xí)策略。此外,文中提到,他們?cè)谑中g(shù)機(jī)器人系統(tǒng)上實(shí)現(xiàn)了LfD的學(xué)習(xí),并通過(guò)實(shí)驗(yàn)方法成功證明算法的可行性。實(shí)驗(yàn)結(jié)果表明,LfD 大大減少了神經(jīng)網(wǎng)絡(luò)正確學(xué)習(xí)所需的參數(shù)量,從而促進(jìn)學(xué)習(xí)過(guò)程。LfD 在手術(shù)機(jī)器人上的實(shí)現(xiàn),表明在演示中涵蓋相關(guān)的工作空間時(shí),LfD 算法可以產(chǎn)生很好地初始化策略來(lái)完成實(shí)際環(huán)境的任務(wù)。作者認(rèn)為,如果能給出更多的演示數(shù)據(jù),更充分地捕獲機(jī)器人的工作空間,LfD 算法的能力將會(huì)更加顯著;其次,在實(shí)際工作中,機(jī)器人的工作空間受到限制,是為了防止視覺(jué)遮擋,因此可以開(kāi)發(fā)新的算法來(lái)避免遮擋,實(shí)現(xiàn)性能上的進(jìn)一步突破。
強(qiáng)化學(xué)習(xí)技術(shù)的發(fā)展,使得機(jī)器人能夠更加精準(zhǔn)地模仿外科醫(yī)生的動(dòng)作;深度學(xué)習(xí)技術(shù)能夠顯著提升機(jī)器人輔助手術(shù)的穩(wěn)定性和適應(yīng)性。目前,在機(jī)器人輔助治療方面還并未廣泛應(yīng)用,技術(shù)大多仍停留在理論層面,機(jī)器人代替人類(lèi)完成任務(wù)大多運(yùn)用在醫(yī)導(dǎo)等方面,如何讓機(jī)器人更加自主甚至脫離外科醫(yī)生精確完成手術(shù)、如何優(yōu)化算法,降低成本,讓更多機(jī)器人投入到一般基層醫(yī)院,是我們需要一直思考的問(wèn)題。
隨著自然語(yǔ)言處理技術(shù)的發(fā)展,語(yǔ)音、文字等信息可以很迅速、精確地被計(jì)算機(jī)捕獲,智能虛擬助理系統(tǒng)、慢性病防控和疫情防控系統(tǒng)、醫(yī)療文書(shū)錄入和電子病歷等技術(shù)應(yīng)運(yùn)而出,大大減輕了醫(yī)務(wù)人員的負(fù)擔(dān)[10]。
Doumbouya 等[11]根據(jù)全球7 億文盲人研究出一種無(wú)監(jiān)督學(xué)習(xí)語(yǔ)音識(shí)別技術(shù)對(duì)無(wú)線電廣播檔案進(jìn)行識(shí)別。這些檔案內(nèi)含資源豐富、能夠獲取最有價(jià)值的信息。作者首先提出兩個(gè)數(shù)據(jù)集:一是西非廣播語(yǔ)料庫(kù),包含超過(guò)10 種語(yǔ)言的142 h 音頻;二是西非虛擬助手語(yǔ)音識(shí)別語(yǔ)料庫(kù),由4種語(yǔ)言的10 K標(biāo)記音頻剪輯組成。接著對(duì)音頻識(shí)別網(wǎng)絡(luò)wav2vec 進(jìn)行改進(jìn)得到西非wav2vec,并將兩者在語(yǔ)音識(shí)別上進(jìn)行比較,發(fā)現(xiàn)西非wav2vec顯著優(yōu)勝。最后針對(duì)Maninka、popular 和Susu(這些語(yǔ)言在7 個(gè)國(guó)家中共有1 000 萬(wàn)人使用,文盲率高達(dá)68%),提出一種新的智能語(yǔ)音識(shí)別模型,目前還在優(yōu)化,希望可以為AI研究者提供線索。Zheng 等[12]提出了基于上下文語(yǔ)義感知的云平臺(tái),輔助機(jī)器人感知周?chē)h(huán)境,包括用戶的情緒、心理變化等。文中指出,依靠認(rèn)知的上下文信息框架,機(jī)器人可以極大改善用戶的交互體驗(yàn)。此外,該平臺(tái)還集成了各種人工智能識(shí)別服務(wù),通過(guò)分析大量文字信息來(lái)提取語(yǔ)義,結(jié)果返回云端,以便在下次交互中做出更好的決策。結(jié)果顯示,該語(yǔ)義分析平臺(tái)能夠極大改善機(jī)器人的交互性和智能性。
由于自然語(yǔ)言處理技術(shù)理論復(fù)雜,發(fā)展滯后,在醫(yī)療領(lǐng)域落地時(shí)間較晚,許多技術(shù)運(yùn)用不是特別成熟。但目前在慢性病防控和疫情防控系統(tǒng)、電子健康檔案數(shù)據(jù)關(guān)系分析、醫(yī)療知識(shí)圖譜的構(gòu)建等領(lǐng)域展現(xiàn)出良好的價(jià)值,如COVID-19 中防控系統(tǒng)的構(gòu)建,現(xiàn)在已有很多研究者投入其中。
智能健康管理主要體現(xiàn)在患者層面,運(yùn)用AI技術(shù),可在健康指數(shù)、合理飲食、情緒調(diào)節(jié)、慢性病管理以及某些疾病風(fēng)險(xiǎn)預(yù)測(cè)等方面提供醫(yī)療和指導(dǎo)。目前應(yīng)用主要有可穿戴醫(yī)療設(shè)備以及基于物聯(lián)網(wǎng)的醫(yī)療設(shè)備等,如血壓血糖監(jiān)測(cè)設(shè)備、智能化健康檔案管理系統(tǒng)、母嬰健康管理系統(tǒng)、心理健康監(jiān)測(cè)系統(tǒng)等。
2020年,Zhao 等[13]提出了智能醫(yī)療輔助診斷知識(shí)庫(kù)共享系統(tǒng),實(shí)現(xiàn)智能醫(yī)療診斷。該系統(tǒng)可建立醫(yī)學(xué)知識(shí)圖譜,包括呼吸醫(yī)學(xué)知識(shí)庫(kù),為智能推理系統(tǒng)提供學(xué)習(xí)平臺(tái)。文中指出,該系統(tǒng)架構(gòu),可滿足患者不斷提高醫(yī)療公共服務(wù)的需求,實(shí)現(xiàn)便捷、包容的服務(wù)體系。此外,結(jié)合物聯(lián)網(wǎng)和云計(jì)算,為智能醫(yī)院管理提供了切實(shí)有效的解決方案。
智能健康管理是AI在醫(yī)療領(lǐng)域的一個(gè)非常重要的應(yīng)用,時(shí)刻影響著人們的生活質(zhì)量。在此模式上,由計(jì)算機(jī)、信息技術(shù)、軟硬件設(shè)備發(fā)展帶來(lái)的價(jià)值不可限量,遠(yuǎn)程醫(yī)療服務(wù)質(zhì)量將進(jìn)一步優(yōu)化。
疫情的爆發(fā)警示研究者們重視醫(yī)院管理對(duì)醫(yī)療資源配置的重要性。通過(guò)建立AI體系,利用病歷信息、用戶反饋等大數(shù)據(jù)來(lái)協(xié)調(diào)資源的分配,節(jié)省醫(yī)療成本、極大改善患者的就診體驗(yàn),最大程度滿足患者需求[14]。
涉及到倫理的醫(yī)學(xué)數(shù)據(jù),一方面獲取方式困難,數(shù)據(jù)多而繁雜,信息的碎片化處理目前還是個(gè)難題;另一方面質(zhì)量高的數(shù)據(jù)少,得到數(shù)據(jù)后要經(jīng)過(guò)專(zhuān)家進(jìn)行精準(zhǔn)標(biāo)注,標(biāo)注的數(shù)量與質(zhì)量也直接影響到整個(gè)數(shù)據(jù)集。除此之外,每個(gè)單位都有屬于自己的數(shù)據(jù)庫(kù),每一病種的數(shù)據(jù)及其形式又不同,沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)對(duì)其進(jìn)行整合,也缺乏大型的公共數(shù)據(jù)庫(kù)系統(tǒng)[15]。高質(zhì)量的數(shù)據(jù)是AI發(fā)展的首要前提,這一難關(guān)阻礙了AI前進(jìn)的腳步。
臨床問(wèn)題的復(fù)雜要求神經(jīng)網(wǎng)絡(luò)層數(shù)加深,模型的復(fù)雜程度與之相對(duì)應(yīng)的數(shù)據(jù)量不匹配。模型太過(guò)復(fù)雜,學(xué)習(xí)能力過(guò)于強(qiáng)大,以至于把訓(xùn)練集中數(shù)據(jù)本身特征學(xué)習(xí)到了,這樣會(huì)導(dǎo)致算法過(guò)擬合;模型的復(fù)雜程度遠(yuǎn)低于與其匹配的數(shù)據(jù)量,這導(dǎo)致模型學(xué)習(xí)能力低下,產(chǎn)生欠擬合。欠擬合可以通過(guò)增加數(shù)據(jù)量和訓(xùn)練次數(shù)來(lái)解決,過(guò)擬合的解決卻比較困難,是深度學(xué)習(xí)中經(jīng)常會(huì)遇到的問(wèn)題。尤其是在醫(yī)療實(shí)際應(yīng)用中,一定要對(duì)AI算法進(jìn)行嚴(yán)格測(cè)試評(píng)估,否則會(huì)導(dǎo)致發(fā)生醫(yī)療事故和糾紛,引發(fā)大規(guī)模醫(yī)源性風(fēng)險(xiǎn)[16]。
除此之外,算法的主觀性與算法的“黑箱”問(wèn)題也不容忽視[17-18]。算法的設(shè)計(jì)過(guò)程中難免會(huì)有工程師主觀的偏見(jiàn),有些數(shù)據(jù)也會(huì)存在價(jià)值偏好,這樣會(huì)使得算法模型可能會(huì)朝著與預(yù)期完全不同的方向決策?!昂谙洹眴?wèn)題一直是深度學(xué)習(xí)中困擾研究者們的難題,模型可解釋性弱,對(duì)醫(yī)學(xué)問(wèn)題中復(fù)雜問(wèn)題只知結(jié)果不知其過(guò)程,這樣的瓶頸問(wèn)題制約了深度學(xué)習(xí)在醫(yī)療領(lǐng)域的滲透。
AI在醫(yī)療領(lǐng)域的發(fā)展離不開(kāi)人才的挖掘與培養(yǎng)。特別是涉及AI與醫(yī)學(xué)兩個(gè)大學(xué)科,屬于典型的交叉學(xué)科,這要求人才能夠精通這兩個(gè)方面。但AI工程師對(duì)醫(yī)學(xué)領(lǐng)域的難題了解較少,對(duì)臨床復(fù)雜性不熟悉,必然會(huì)影響到AI系統(tǒng)的研發(fā);具有醫(yī)學(xué)背景的應(yīng)用人才缺乏對(duì)工程算法的理解,對(duì)系統(tǒng)開(kāi)發(fā)過(guò)程的培訓(xùn)也難以實(shí)現(xiàn),也會(huì)影響AI產(chǎn)品的規(guī)范性。因此,我們需要解決這樣的問(wèn)題:一方面,我們要大量培養(yǎng)在臨床醫(yī)生和算法工程師之間進(jìn)行對(duì)接交流工作的臨床工程師,輔助AI應(yīng)用醫(yī)療,進(jìn)行過(guò)渡;另一方面,從零培養(yǎng)AI與醫(yī)學(xué)復(fù)合型專(zhuān)業(yè)人才,服務(wù)于臨床,這是從根本上解決人才缺乏問(wèn)題的方式[19-21]。
AI在醫(yī)學(xué)方面的應(yīng)用,主要集中在新藥研發(fā)、輔助診療、語(yǔ)音識(shí)別和語(yǔ)義理解、健康管理和醫(yī)院管理等領(lǐng)域。近3年內(nèi),每個(gè)領(lǐng)域都有不同程度的突破,但在不同領(lǐng)域都有難以攻破、亟待解決的難題。
新藥研發(fā)中要經(jīng)過(guò)篩選、預(yù)測(cè)潛在性質(zhì)、預(yù)測(cè)生物活性及毒性、預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)等過(guò)程,AI的利用極大減少時(shí)間和人力成本,進(jìn)一步提高藥物研發(fā)的效率。但準(zhǔn)確預(yù)測(cè)藥物靶點(diǎn)仍具有一定的挑戰(zhàn)性,目前存在的算法模型的精確度仍然不理想,需要更進(jìn)一步深入探究。輔助診斷是AI應(yīng)用于醫(yī)療行業(yè)最為廣泛的領(lǐng)域,尤其是在智能影像方面,已取得巨大成果,但如何擴(kuò)大共享數(shù)據(jù)庫(kù),提高數(shù)據(jù)質(zhì)量,提高診斷準(zhǔn)確率,減少誤診漏診,是一直要努力的方向。語(yǔ)音識(shí)別和語(yǔ)義理解相比影像診斷發(fā)展略微緩慢,歸因于其技術(shù)的復(fù)雜性及數(shù)據(jù)結(jié)構(gòu)多樣性,主要解決手段仍是要繼續(xù)開(kāi)發(fā)新算法,對(duì)不同語(yǔ)言進(jìn)行識(shí)別與解讀,除此之外,對(duì)元數(shù)據(jù)的處理也是非常重要的手段之一。健康管理與醫(yī)院管理依賴前面3個(gè)領(lǐng)域AI技術(shù)的發(fā)展,更多集中在可穿戴設(shè)備檢測(cè)與大數(shù)據(jù)碎片化處理技術(shù)方面,從而更好地服務(wù)患者。綜上所述,AI與醫(yī)學(xué)的融合具有巨大發(fā)展前景,希望有越來(lái)越來(lái)多的研究者投入其中,致力于AI研究服務(wù)于醫(yī)學(xué)。