吳行偉 ,劉馨宇 ,龍恩武 ,童榮生 *
近年來,隨著臨床信息系統(tǒng)的建立和完善,醫(yī)療數(shù)據(jù)的可用性不斷提高。然而,影響藥物治療結(jié)果的因素繁雜,且各因素之間可能存在交互作用。因此,對藥物治療過程中產(chǎn)生的真實世界數(shù)據(jù)進行分析時,面臨高維度、大樣本、共線性等復(fù)雜問題。這些問題使得臨床藥師在復(fù)雜的臨床狀態(tài)下,難以對藥物作用的效果和風(fēng)險進行有效的早期識別和預(yù)測,從而影響藥物治療結(jié)果,導(dǎo)致疾病進程加快、負擔(dān)加重、患病率和死亡率上升、住院時間延長[1-4]等問題出現(xiàn)。
機器學(xué)習(xí)作為人工智能的核心技術(shù),由于其在處理高維度、大數(shù)據(jù)等方面的獨特優(yōu)勢,越來越多地被應(yīng)用于分析藥物治療過程中患者復(fù)雜的臨床特征和用藥情況。本文對機器學(xué)習(xí)在臨床藥物治療中的進展和成果予以綜述,內(nèi)容包括藥物處方和用藥劑量、藥物不良反應(yīng)、藥物療效、耐藥性、藥物相互作用和用藥依從性等,為臨床醫(yī)生及藥學(xué)同行開展基于機器學(xué)習(xí)的預(yù)測模型研究提供方法和模式的參考。
機器學(xué)習(xí)由計算機科學(xué)家Arthur Samuel于1959年提出,其被描述為“計算機在沒有編程的情況下的學(xué)習(xí)能力”[5],可被理解為基于真實世界數(shù)據(jù)或以往的經(jīng)驗開發(fā)數(shù)據(jù)驅(qū)動的算法,以學(xué)習(xí)和模仿人類的行為[6]。根據(jù)學(xué)習(xí)方式的不同,機器學(xué)習(xí)分為有監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)等。監(jiān)督學(xué)習(xí)即輸入大量帶有標簽的樣本數(shù)據(jù)以建立一個模型并得到相應(yīng)輸出值,主要被用來處理分類和回歸任務(wù),常見的算法有邏輯回歸、支持向量機和K—鄰近算法等[7]。無監(jiān)督學(xué)習(xí)即通過輸入無標簽的數(shù)據(jù)來學(xué)習(xí)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和關(guān)聯(lián),其更多地被用來處理聚類和降維問題,常見算法包括K—均值聚類和期望最大化聚類等[8]。強化學(xué)習(xí)即根據(jù)狀態(tài)和動作計算獲益,將獲益反饋到模型并對模型作出調(diào)整以獲得最大的獎勵信號,常見算法包括Q學(xué)習(xí)以及時間差學(xué)習(xí)等[9]。作為機器學(xué)習(xí)的分支之一,近年來深度學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域的應(yīng)用取得了巨大成功。其通過在輸入層與輸出層之間使用隱藏層來對數(shù)據(jù)的中間表征進行建模,用于有監(jiān)督或無監(jiān)督的特征學(xué)習(xí)、表示、分類和模式識別等,常見算法有深度神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)等[10]。
2.1 藥物處方和用藥劑量預(yù)測 在藥物處方預(yù)測方面,尤其針對慢性病的逐步治療模式,常使用序列模式挖掘和深度學(xué)習(xí)技術(shù)等方法來推斷藥物之間的時間關(guān)系,并生成規(guī)則來預(yù)測患者將會被處方的下一種藥物[11]。WRIGHT等[12]學(xué)者使用序列模式挖掘方法,應(yīng)用SPADE(Sequential Pattern Discovery Using Equivalence Classes)算法從藥物類別和仿制藥水平挖掘2型糖尿病患者藥物處方的序列模式,該算法能夠挖掘符合指南推薦的藥物治療模式且無需患者的所有用藥史。在藥物類別預(yù)測方面,SPADE能夠預(yù)測出90%的患者所用的藥物;在仿制藥預(yù)測方面,能夠預(yù)測出64.1%的患者所用的藥物。BEAM等[13]學(xué)者將機器學(xué)習(xí)和自然語言處理相結(jié)合,以提取患者的合并癥、用藥史及醫(yī)生的處方偏好。通過權(quán)衡患者和醫(yī)生因素,研究影響安眠藥處方模式的醫(yī)患因素,以更深入了解醫(yī)生的處方行為。YELIN等[14]學(xué)者使用梯度增強決策樹推導(dǎo)的一種算法對尿路感染患者的數(shù)據(jù)進行分析發(fā)現(xiàn),通過篩選抗生素耐藥性的特征,推薦最佳的經(jīng)驗性治療藥物,通過該算法推薦的處方正確使用抗生素的概率比醫(yī)生高4%,降低了藥物錯配風(fēng)險。ROUGH等[15]學(xué)者根據(jù)住院患者的電子健康記錄中的結(jié)構(gòu)化信息,利用深度學(xué)習(xí)序列模型預(yù)測患者的特定用藥順序,該算法能夠挖掘出與指南一致的藥物治療模式,因此,在入院時可以作為早期預(yù)警工具預(yù)測出院用藥種類,以便監(jiān)測即將處方的藥物,減少重復(fù)用藥或遺漏用藥等。此外,朱立強等[16]學(xué)者采用非線性邏輯回歸和支持向量機的方法建立了Ⅰ類切口手術(shù)患者使用抗菌藥物合理性的評價模型,使抗菌藥物預(yù)防使用率下降了7.41%,藥物品種選用合理率提高了16.53%,使用療程縮短了1.75 d。
對于個體差異大、治療窗窄、毒性較強的藥物,對給藥劑量進行正確預(yù)測可在一定程度上減少不良事件的發(fā)生。MA等[17]研究者使用堆棧泛化框架集成了支持向量機、隨機森林、近鄰算法和梯度提升樹4種算法,結(jié)合患者的臨床特征和遺傳數(shù)據(jù)預(yù)測華法林劑量,該算法適用于華法林低劑量維持治療的患者,相比于其他患者,其在實際穩(wěn)定治療劑量20%以內(nèi)的患者中預(yù)測能力提高了12.7%。ROCHE-LIMA等[18]學(xué)者使用7種機器學(xué)習(xí)方法,通過回顧性分析心血管疾病患者的臨床特征和遺傳數(shù)據(jù)來預(yù)測華法林的使用劑量,該研究以平均絕對誤差和預(yù)測準確率來評估模型性能,結(jié)果顯示,隨機森林回歸、多元自適應(yīng)回歸樣條(multivariate adaptive regression splines,MARS)和支持向量回歸的預(yù)測準確性優(yōu)于其他算法。TAO等[19]學(xué)者建立了一種集成學(xué)習(xí)模型,以類似的衡量指標評價了模型對中國人群華法林使用劑量的預(yù)測性能。SU等[20]學(xué)者回顧性分析了2個重癥監(jiān)護病房研究數(shù)據(jù)庫中的患者數(shù)據(jù),使用隨機森林、支持向量機、自適應(yīng)增強算法、極限梯度增強和淺層神經(jīng)網(wǎng)絡(luò)5種機器學(xué)習(xí)方法,以部分凝血活酶時間作為預(yù)測因子來預(yù)測肝素的治療效果,結(jié)果顯示,淺層神經(jīng)網(wǎng)絡(luò)以最高的F1值作為預(yù)測肝素治療效果的最適模型,該模型可用于優(yōu)化患者的肝素劑量。此外,LEVY等[21]學(xué)者對接受抗心律失常藥物多非利特治療的患者的臨床數(shù)據(jù)進行了分析,與多種監(jiān)督學(xué)習(xí)方法比較,一種深度強化學(xué)習(xí)算法—Q學(xué)習(xí)算法以96.1%的準確度更好地預(yù)測了多非利特的使用劑量。
2.2 藥物不良反應(yīng)預(yù)測 藥物不良反應(yīng)不僅是藥物開發(fā)失敗和藥物上市后撤市的主要原因,也是藥物治療失敗和治療被迫中止的原因。隨著藥物不良反應(yīng)數(shù)據(jù)庫的出現(xiàn),有監(jiān)督的機器學(xué)習(xí)算法已被廣泛用于藥物信息提取和藥物不良反應(yīng)的關(guān)系預(yù)測[22-23]。該類研究主要基于藥物生物學(xué)特征、化學(xué)特征和表型特征等建立預(yù)測模型對藥物不良反應(yīng)進行預(yù)測[24]。
藥物性肝損傷(drug induced liver injury,DILI)是最常見的不良反應(yīng)之一,大量的基因表達數(shù)據(jù)為早期識別和準確預(yù)測DILI提供了有價值的信息。HAMMANN等[25]學(xué)者基于藥物化學(xué)結(jié)構(gòu),構(gòu)建了決策樹、K-鄰近算法、支持向量機和人工神經(jīng)網(wǎng)絡(luò)4種機器學(xué)習(xí)模型以預(yù)測DILI,其中決策樹模型實現(xiàn)了89%的正確分類率。FENG等[26]學(xué)者基于Array Express數(shù)據(jù)庫中的基因表達數(shù)據(jù)建立了深度學(xué)習(xí)模型來預(yù)測DILI,該模型在準確率、精確度和相關(guān)系數(shù)等方面均明顯優(yōu)于支持向量機模型,并通過外部數(shù)據(jù)集和動物實驗對模型性能進行了驗證。LAI等[27]研究者將結(jié)核患者的臨床特征和基因組數(shù)據(jù)相結(jié)合,建立并比較了人工神經(jīng)網(wǎng)絡(luò)、支持向量機和隨機森林3種模型對抗結(jié)核藥物肝毒性的預(yù)測性能,其中人工神經(jīng)網(wǎng)絡(luò)表現(xiàn)最佳。DAVAZDAHEMAMI等[28]學(xué)者將時序藥物警戒網(wǎng)絡(luò)和機器學(xué)習(xí)技術(shù)相結(jié)合,預(yù)測8種常見高風(fēng)險藥物的藥物不良反應(yīng),結(jié)果顯示,梯度增強樹識別藥物不良反應(yīng)的準確率高達92.8%。
2.3 藥物療效預(yù)測 在藥物療效預(yù)測時,常將患者臨床癥狀和體征的改善,以及實驗室檢查指標的變化作為待預(yù)測結(jié)果,以評估藥物療效。此外,還可應(yīng)用機器學(xué)習(xí)方法挖掘現(xiàn)有臨床試驗數(shù)據(jù)或電子病歷系統(tǒng)中的數(shù)據(jù)來建立預(yù)測模型,對特定患者的特定藥物療效進行回顧性分析和前瞻性識別,從而對藥物療效進行精準評價。
CHEKROUD等[29]研究者篩選了抑郁癥患者的25個臨床特征并建立了梯度提升機模型,以評估患者使用西酞普蘭治療12周后癥狀是否緩解,該模型的預(yù)測準確率為64.6%。若將抗抑郁治療反應(yīng)的生物標志物作為預(yù)測變量,可能會獲得更高的預(yù)測準確性。ATHREYA等[30]學(xué)者論證了將機器學(xué)習(xí)與藥物基因組生物標志物相結(jié)合的可行性,以實現(xiàn)對兩種新型抗抑郁藥西酞普蘭和依他普倫8周治療效果的預(yù)測。SAKELLAROPOULOS等[31]學(xué)者將基因表達數(shù)據(jù)與藥物反應(yīng)相結(jié)合,構(gòu)建了深度神經(jīng)網(wǎng)絡(luò)模型以預(yù)測癌癥患者的藥物治療反應(yīng),并在多個臨床隊列上進行了外部驗證,結(jié)果表明,深度神經(jīng)網(wǎng)絡(luò)在藥物治療反應(yīng)預(yù)測方面優(yōu)于傳統(tǒng)的機器學(xué)習(xí)算法。JIANG等[32]學(xué)者建立了支持向量機模型,用于識別對5-氟尿嘧啶/奧沙利鉑高度敏感的胃癌患者,該模型可將Ⅱ期和Ⅲ期胃癌患者進行準確分類,使用該模型預(yù)測的不同類別患者的5年無進展生存期和總生存期存在顯著的統(tǒng)計學(xué)差異。
2.4 藥物耐藥預(yù)測 隨著高通量測序技術(shù)的發(fā)展,藥物基因組學(xué)相關(guān)數(shù)據(jù)庫的建立和完善,以及電子病歷系統(tǒng)中大規(guī)模數(shù)據(jù)集的累積,機器學(xué)習(xí)現(xiàn)已被廣泛應(yīng)用于抗菌藥物和化療藥物等敏感性相關(guān)的基因型/表型預(yù)測、臨床決策的制定和藥物治療方案的優(yōu)化等方面[33]。
DAVIS等[34]學(xué)者建立了Ada Boost機器學(xué)習(xí)模型,用于識別鮑曼不動桿菌對碳青霉烯類抗生素、金黃色葡萄球菌對甲氧西林以及肺炎鏈球菌對β-內(nèi)酰胺類抗生素和復(fù)方新諾明的耐藥性,實現(xiàn)了88%到99%的準確率。另外,該研究還將結(jié)核分枝桿菌對異煙肼、卡那霉素、氧氟沙星、利福平和鏈霉素的耐藥性進行了預(yù)測,實現(xiàn)了71%到88%的準確率。CHOWDHURY等[35]學(xué)者提出了堆疊的集成模型,以邏輯回歸、決策樹和支持向量機作為基線模型,基于蛋白質(zhì)序列的相似性來預(yù)測結(jié)核分枝桿菌對卷曲霉素的耐藥性;與最佳的基線模型支持向量機相比,集成模型預(yù)測準確性提高了2.43%。MANCINI等[36]學(xué)者建立了Cat Boost、支持向量機和神經(jīng)網(wǎng)絡(luò)3種機器學(xué)習(xí)模型,并集成了一個云平臺來預(yù)測患者住院后發(fā)生多藥耐藥性尿路感染的風(fēng)險。AN等[37]學(xué)者通過對58萬余例癲癇患者的索賠數(shù)據(jù)進行分析,以預(yù)測患者在首次開具某種抗癲癇藥物時耐藥的風(fēng)險,其訓(xùn)練的隨機森林算法表現(xiàn)最佳。DORMAN等[38]學(xué)者研究了紫杉醇和吉西他濱的生長抑制濃度與基因表達之間的相關(guān)性,該研究使用多因素主成分分析篩選出“強關(guān)聯(lián)”的基因,使用支持向量機來預(yù)測藥物的敏感性,對紫杉醇和吉西他濱敏感性的預(yù)測準確率分別為70.2%和57.0%。
2.5 藥物相互作用預(yù)測 在聯(lián)合用藥情況下,藥物相互作用通常是導(dǎo)致藥物不良反應(yīng)發(fā)生和醫(yī)療成本增加的常見原因。因此,識別藥物相互作用是減少藥物不良事件和提高患者用藥安全性的關(guān)鍵。雖然已有文獻研究成果和可獲取的藥物相互作用數(shù)據(jù)庫可為機器學(xué)習(xí)的應(yīng)用提供基礎(chǔ),但對醫(yī)療數(shù)據(jù)中的藥物相互作用研究仍較為缺乏。
CHENG等[39]學(xué)者通過整合藥物相互作用數(shù)據(jù)庫中的藥物表型、治療、化學(xué)和基因組學(xué)相似性,提出了一種異構(gòu)網(wǎng)絡(luò)輔助推理(Heterogeneous Network-assisted Inference,HNAI)框架,在該框架中應(yīng)用了樸素貝葉斯、決策樹、K-鄰近算法、邏輯回歸和支持向量機5種機器學(xué)習(xí)模型來預(yù)測藥物相互作用,其中HNAI模型ROC曲線下面積為0.67。KASTRIN等[40]學(xué)者基于Drug Bank、KEGG和Two sides等5個藥物相互作用數(shù)據(jù)庫中藥物間的拓撲和語義相似性特征,比較了分類樹、K-鄰近算法、支持向量機、隨機森林和梯度提升機模型的預(yù)測效果,結(jié)果顯示,隨機森林和梯度提升機對Two sides網(wǎng)絡(luò)的預(yù)測性能最佳。RYU等[41]學(xué)者建立了深度學(xué)習(xí)模型,通過輸入藥物-藥物對或藥物-食物對的名稱及其結(jié)構(gòu)信息,生成了86種藥物相互作用,并對模型進行了外部驗證,預(yù)測準確率平均為92.4%。
2.6 藥物依從性預(yù)測 患者藥物依從性差是普遍存在的問題。良好的用藥依從性對于疾病的治療和管理至關(guān)重要。有研究者嘗試使用機器學(xué)習(xí)算法來識別藥物依從性差的患者,從而有針對性地制訂提高藥物依從性的策略。
TUCKER等[42]學(xué)者采用決策樹、K-鄰近算法、樸素貝葉斯、支持向量機和隨機森林模型,根據(jù)帕金森病患者使用非穿戴式多模式傳感器接收的步態(tài)特征來建立預(yù)測模型,實現(xiàn)對患者用藥依從性的遠程監(jiān)控。MOHEBBI等[43]學(xué)者基于連續(xù)葡萄糖監(jiān)測信號,建立多層感知器和卷積神經(jīng)網(wǎng)絡(luò)模型對2型糖尿病患者使用胰島素的依從性進行預(yù)測,結(jié)果顯示卷積神經(jīng)網(wǎng)絡(luò)的預(yù)測性能最佳。LI等[44]學(xué)者使用機器學(xué)習(xí)方法識別使用降壓藥不依從的亞組人群,以制定針對目標人群的干預(yù)措施。WU等[45]學(xué)者采用30種機器學(xué)習(xí)方法建立了300個模型來預(yù)測2型糖尿病患者的用藥依從性,以用藥擁有率對患者的用藥依從性進評價,結(jié)果顯示,集成算法預(yù)測性能最佳。
隨著計算機技術(shù)的不斷發(fā)展,機器學(xué)習(xí)在輔助臨床藥物治療決策方面展現(xiàn)出了巨大的潛力。此類方法為醫(yī)生和臨床藥師制訂藥物治療策略、應(yīng)對藥物不良反應(yīng)、監(jiān)測藥物治療效果和優(yōu)化藥物治療方案等提供了理想的工具。目前,機器學(xué)習(xí)在臨床藥物治療方面的研究主要基于醫(yī)院電子病歷系統(tǒng)、基因組學(xué)數(shù)據(jù)庫、藥物相互作用數(shù)據(jù)庫和藥物不良反應(yīng)數(shù)據(jù)庫等,采用機器學(xué)習(xí)的方法,尤其是深度學(xué)習(xí)算法,建立臨床預(yù)測模型以實現(xiàn)對目標人群或目標藥物的預(yù)測。但由于目前我國醫(yī)院電子病歷系統(tǒng)等數(shù)據(jù)庫缺乏規(guī)范系統(tǒng)的患者信息錄入流程、有效的數(shù)據(jù)質(zhì)控過程和數(shù)據(jù)孤島等缺陷,總體數(shù)據(jù)利用率有待提升。
此外,醫(yī)學(xué)機器學(xué)習(xí)是一項交叉學(xué)科,研究者常需掌握計算機、線性代數(shù)、概率論與數(shù)理統(tǒng)計等專業(yè)知識。因此,機器學(xué)習(xí)在醫(yī)療領(lǐng)域的廣泛應(yīng)用尚存在巨大的學(xué)科壁壘,常出現(xiàn)“醫(yī)療工作者不懂機器學(xué)習(xí),計算機工程師不懂醫(yī)學(xué)”的現(xiàn)象。開發(fā)醫(yī)療工作者簡便易用的機器學(xué)習(xí)建模工具可能是緩解該問題的有效措施。
未來,隨著高質(zhì)量數(shù)據(jù)庫的建立和新算法的開發(fā),通過臨床科研人員與計算機研究人員的有機協(xié)作,機器學(xué)習(xí)有望更多地應(yīng)用于臨床藥物治療的研究中。借助于優(yōu)秀的機器學(xué)習(xí)算法和工具,可有效提高臨床預(yù)測模型在臨床實踐中的實用性,提高診療效率,實現(xiàn)個體化治療決策的智能化。
作者貢獻:吳行偉負責(zé)文章的構(gòu)思與設(shè)計,進行論文、英文的修訂;劉馨宇負責(zé)文獻/資料收集、整理,撰寫論文;龍恩武負責(zé)文章質(zhì)量的控制及審校;童榮生對文章整體負責(zé),監(jiān)督管理。
本文無利益沖突。
本文文獻檢索策略:
英文檢索詞:machine learning、supervised learning、unsupervised learning、semi-supervised learning、deep learning、drug、medicine、prescription、dosage、dose、ADR、adverse reaction、therapeutic effect/response、treatment effect/response、drug resistance、DDI、drug interaction、drug-drug interaction、compliance、predicting、predict、prediction,結(jié)合運算符(AND、OR和NOT)檢索PubMed數(shù)據(jù)庫,共檢索3 352篇文獻;中文檢索詞:機器學(xué)習(xí)、監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)、藥物、藥物處方、藥物劑量、藥物不良反應(yīng)、藥物療效、耐藥性、藥物相互作用、用藥依從性、預(yù)測,結(jié)合運算符(AND、OR和NOT)檢索中國知網(wǎng)、萬方數(shù)據(jù)知識服務(wù)平臺和維普網(wǎng),共檢索104篇文獻。檢索時間為2010—2020年。