吳健 曹林平
近幾年,機器學(xué)習(xí)在疾病預(yù)測領(lǐng)域的研究及臨床實踐中取得顯著成就,其通過各種算法深度挖掘海量數(shù)據(jù)中的隱藏關(guān)系,構(gòu)建診療模型,從而高效、準(zhǔn)確地對疾病做出預(yù)測,指導(dǎo)臨床診療過程。肝移植是治療各種終末期肝病最有效的方法,隨著器官供需矛盾日趨嚴(yán)重,人口老齡化的進一步加重,伴隨疾病的復(fù)雜多變性,使得移植決策面臨前所未有的挑戰(zhàn)。機器學(xué)習(xí)包括人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、隨機森林(random forest,RF)、支持向量機(support vector machine,SVM)、決策樹(decision tree,DT)等預(yù)測模型,可以從肝移植人口特征、臨床資料、實驗室檢查、影像學(xué)參數(shù)等大量數(shù)據(jù)中提取隱藏的非線性關(guān)系,找到變量之間的關(guān)聯(lián)并有效準(zhǔn)確地做出決策,目前已廣泛應(yīng)用于肝移植臨床及基礎(chǔ)研究中,尤其在肝移植術(shù)前器官分配、供肝評估,圍手術(shù)期并發(fā)癥預(yù)測、輸血預(yù)測,術(shù)后新發(fā)疾病預(yù)測、疾病復(fù)發(fā)預(yù)測、急性排斥反應(yīng)預(yù)測及遠期生存預(yù)后預(yù)測方面展現(xiàn)出較好的前景[1-3]。本文就機器學(xué)習(xí)在肝移植領(lǐng)域中的應(yīng)用現(xiàn)狀及前景做一綜述。
供肝緊缺是阻礙肝移植發(fā)展的最大挑戰(zhàn),如何利用有限的供肝資源使患者獲得最大生存獲益一直是研究的熱點。目前肝臟分配的金標(biāo)準(zhǔn)仍舊是終末期肝病模型(model for end-stage liver disease,MELD)評分,它能精確地預(yù)測患者等待移植期間的死亡風(fēng)險[4]。但該模型只考慮了受者疾病因素,忽略了隱藏的供者因素及供受者間的聯(lián)系,存在一定的局限性。因此,很多學(xué)者探索利用機器學(xué)習(xí)模型來輔助建立器官分配機制[5]。
韓國一項全國性、多中心、回顧性隊列研究納入2 248例患者,采用分類和回歸樹(classification and regression tree,CART)模型來預(yù)測不同MELD評分等待移植患者的生存率,發(fā)現(xiàn)MELD評分31~40分、21~30分、≤20分的患者90 d等待期生存率分別為16.2%、64.1%、95.9%。進一步細分發(fā)現(xiàn)MELD評分為31~37分和38~40分的重癥患者14 d等待期生存率分別為64.0%和43.4%。考慮到韓國供器官的缺乏和地域差異,研究者建議在全國范圍內(nèi)對病情最嚴(yán)重的患者(MELD≥38分)使用更廣泛的肝臟共享,以降低等待名單上患者的病死率[6]。同樣也有研究在MELD評分基礎(chǔ)上,結(jié)合供受者及手術(shù)相關(guān)信息來預(yù)測不同閾值下的器官存活率,將進化算法(evolutionary algorithm)與過采樣技術(shù)(over-sampling technique)相結(jié)合,極大提高預(yù)測能力,為特定的供肝選擇最合適的受者,以最大限度提高移植術(shù)后的生存率,從而實現(xiàn)公平原則[7]。Qu等[8]構(gòu)建決策建模(decision modelling),通過從以往的研究中收集數(shù)據(jù)來比較不同模型間的優(yōu)缺點,為更好的供受者匹配提供有力支持,從而能更合理、高效地使用供肝。此外,Bertsimas等[9]和Vage fi等[10]利用最優(yōu)分類樹(optimal classification tree)模型來預(yù)測肝移植受者等待期間的病死率或除名風(fēng)險,構(gòu)建了優(yōu)化的病死率預(yù)測(optimized prediction of mortality,OPOM)模型,隨后采用肝臟模擬分配模型來比較OPOM模型與基于MELD評分的分配模型的準(zhǔn)確性,發(fā)現(xiàn)OPOM模型能更好地預(yù)測等待者3個月的病死率。OPOM模型可以根據(jù)疾病的嚴(yán)重程度,更準(zhǔn)確、客觀地確定移植受者的優(yōu)先次序,使供肝分配更加公平。
Cucchetti等[11]構(gòu)建ANN,并將其用于預(yù)測63例內(nèi)部驗證組及137例外部驗證組肝移植等待者的預(yù)后生存率,發(fā)現(xiàn)ANN比MELD評分能更準(zhǔn)確地預(yù)測肝硬化患者3個月的死亡風(fēng)險,更好地優(yōu)先選擇肝移植等待者,從而降低受者等待期間的病死率。同樣,Bricen~o等[12]在2014年利用ANN建立肝移植供受者匹配方法模型,納入西班牙11家中心1 003對肝移植供受者,選取出64個變量信息,預(yù)測移植術(shù)后3個月的移植肝存活率及丟失率。采用受試者工作特征(receiver operating characteristic,ROC)曲線來驗證比較不同模型預(yù)測的準(zhǔn)確性,結(jié)果發(fā)現(xiàn)ANN預(yù)測模型效果最優(yōu)。該預(yù)測模型進一步在歐洲衛(wèi)生保健系統(tǒng)納入的858例英國患者隊列中得到驗證,其術(shù)后3個月及1年的生存預(yù)測準(zhǔn)確性顯著高于MELD評分及風(fēng)險平衡(balance of risk,BAR)評分,被認(rèn)為是迄今為止最先進、最客觀、最有用的移植等待模型[13]。
Ershoff等[14]使用美國器官共享聯(lián)合網(wǎng)絡(luò)對57 544例肝移植受者及供者數(shù)據(jù)建立深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)模型,來預(yù)測移植術(shù)后90 d的病死率。該模型在上萬例病例集測試中表現(xiàn)出較現(xiàn)有的肝移植術(shù)后生存結(jié)果分?jǐn)?shù)(survival outcomes following liver transplantation,SOFT)及BAR評分更高的預(yù)測性能,能為客觀的供肝分配提供參考價值。
活體肝移植中常采用影像學(xué)手段充分評估供肝體積,以往的手工分割既耗時又容易出現(xiàn)偏差,隨后出現(xiàn)的交互式方法及半自動分割法雖然精度高,但需要人工初始化或較多的人為干預(yù)。近年來,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)初步應(yīng)用于圖像分割上并取得不錯的效果。Lu等[15]采用深度學(xué)習(xí)(deep learning)和圖像分割優(yōu)化結(jié)合的分割方法對肝臟體積進行評估,其準(zhǔn)確性可以與手工分割法相媲美,能更好地應(yīng)用于臨床。Kavur等[16]比較了基于CNN的自動分割算法與交互式半自動方法在CT成像中測定活體肝移植供肝體積的準(zhǔn)確性和可重復(fù)性,發(fā)現(xiàn)自動分割算法顯著提高肝臟體積測量的準(zhǔn)確性和可重復(fù)性,且能節(jié)省大量時間成本。這些基于CNN的分割法可以自動從CT圖像中學(xué)習(xí)特征的空間層次結(jié)構(gòu),以捕獲復(fù)雜的非線性關(guān)系,比目前半自動化模型更加高效和準(zhǔn)確,成為肝臟分割及體積評估的首選方法,具有廣闊的臨床應(yīng)用潛力[2]。
脂肪變性供肝在肝移植供肝來源中占有一定的比例,研究發(fā)現(xiàn)重度大泡性脂肪變性供肝可明顯影響移植肝的功能恢復(fù)和移植物原發(fā)性無功能(primary nonfunction,PNF)的發(fā)生[17]。盡管供肝嚴(yán)重短缺,仍有約10%的合格肝臟被舍棄,其中脂肪變性為主要原因之一[18]。病理學(xué)活組織檢查(活檢)是評估脂肪變性的金標(biāo)準(zhǔn),然而在制作病理切片過程中不可避免加入人工制品導(dǎo)致肝臟脂肪變性被低估。如何快速準(zhǔn)確地評估供肝脂肪變性對于降低肝移植術(shù)后肝衰竭風(fēng)險至關(guān)重要。
Moccia等[19]用SVM及RF算法自動分析智能手機拍攝的供肝圖像,通過提取供肝紋理特征并結(jié)合血液學(xué)檢測指標(biāo),能準(zhǔn)確評估脂肪變性程度,快速為外科醫(yī)師提供決策支持。也有研究采用機器學(xué)習(xí)自動分析智能手機拍攝的肝臟圖像紋理,結(jié)合供肝相關(guān)數(shù)據(jù)來評估脂肪變性程度,與肝臟活檢進行對比,其準(zhǔn)確率高達98%[20]。這充分表明機器學(xué)習(xí)具有評估供肝脂肪變性的潛力,能方便、無創(chuàng)、可靠地識別潛在不可移植供肝,從而提高移植物的存活率。此外,病理學(xué)專家在評估脂肪變性時的重復(fù)性和主觀性存在很大偏差,容易低估高風(fēng)險供肝移植物衰竭的發(fā)生風(fēng)險[21]。因此,有研究者開發(fā)了CNN模型,能準(zhǔn)確識別并量化冷凍病理全視野數(shù)字切片中脂肪變性的比例,且具有良好的一致性,預(yù)測結(jié)果也優(yōu)于病理學(xué)專家的評估[22]。此外,基于機器學(xué)習(xí)及人工視覺開發(fā)的新程序可以快速準(zhǔn)確分析出供肝活檢病理切片中大泡脂肪變性的占比,其準(zhǔn)確性高達99%[23]。以上研究表明,機器學(xué)習(xí)可在供肝脂肪變性評估中發(fā)揮重要作用,快速、準(zhǔn)確和可重復(fù)地對供肝進行有效評估,避免有效供肝被舍棄,也能識別無效供肝,從而有效拓寬移植物來源,提高移植物存活率。
急性腎損傷(acute kidney injury,AKI)、肺炎等是肝移植術(shù)后常見并發(fā)癥,嚴(yán)重影響受者預(yù)后生存。機器學(xué)習(xí)已被廣泛用于預(yù)測肝移植術(shù)后并發(fā)癥發(fā)生的風(fēng)險。
文獻報道移植術(shù)后早期AKI發(fā)生率高達95%,與移植物存活率低明顯相關(guān)[24]。傳統(tǒng)的預(yù)測模型由于其線性限制,未能有效全面涵蓋供受者信息以及手術(shù)情況等復(fù)雜的臨床變量,導(dǎo)致預(yù)測AKI的準(zhǔn)確度有限[25]?;跈C器學(xué)習(xí)構(gòu)建的預(yù)測模型被報道具有比經(jīng)典統(tǒng)計分析更好的預(yù)測移植術(shù)后AKI的能力。Lee等[26]比較了不同機器學(xué)習(xí)模型和logistic回歸分析預(yù)測肝移植術(shù)后AKI的發(fā)生率,并使用ROC曲線評估這些模型的預(yù)測能力。研究發(fā)現(xiàn),DT、RF、SVM、梯度提升機(gradient boosting machine,GBM)、樸素貝葉斯(na?ve Bayes)、多層感知器(multilayer perceptron)和深度信念網(wǎng)絡(luò)(deep belief network)等機器學(xué)習(xí)模型均優(yōu)于傳統(tǒng)的logistic回歸分析,其中GBM模型對各階段的AKI預(yù)測準(zhǔn)確度明顯優(yōu)于其他機器學(xué)習(xí)模型。He等[27]納入493例接受心臟死亡供肝移植的受者,比較AKI和非AKI受者的臨床特征,隨后構(gòu)建RF、SVM、經(jīng)典決策樹(classical decision tree)和條件推理樹(conditional inference tree)算法4種機器學(xué)習(xí)模型來比較以logistic回歸分析為傳統(tǒng)模型的預(yù)測能力。結(jié)果發(fā)現(xiàn),隨訪期間AKI的發(fā)生率為35.7%,與非AKI組相比,AKI組的生存率顯著降低,且其中RF模型的預(yù)測精度顯著高于其他機器學(xué)習(xí)模型及l(fā)ogistic回歸分析。Zhang等[28]收集2015年至2019年894例肝移植受者的數(shù)據(jù),包括受者一般情況、供者特征、原發(fā)病、圍手術(shù)期實驗室檢查結(jié)果、伴隨疾病和藥物治療等相關(guān)信息,分別評價傳統(tǒng)logistic回歸、SVM、RF、GBM和自適應(yīng)推進(adaptive boosting,AdaBoost)等機器學(xué)習(xí)模型的預(yù)測性能。研究發(fā)現(xiàn)GBM模型預(yù)測能力最優(yōu),進一步的機器學(xué)習(xí)可解釋性工具(SHapley Additive exPlanation,SHAP)顯示術(shù)前間接膽紅素高、術(shù)中尿量少、麻醉時間長、術(shù)前血小板低和移植物脂肪變性5個變量是GBM模型預(yù)測移植術(shù)后AKI發(fā)生的重要指標(biāo)。這些研究均表明應(yīng)用機器學(xué)習(xí)模型可以精確預(yù)測肝移植術(shù)后AKI的發(fā)生率。
同樣,肝移植術(shù)后肺炎嚴(yán)重影響受者生存,其發(fā)生率和病死率高度相關(guān)。Chen等[29]構(gòu)建機器學(xué)習(xí)模型來預(yù)測原位肝移植術(shù)后肺炎的發(fā)生率,通過回顧性分析2015年至2019年中山大學(xué)第三附屬醫(yī)院786例原位肝移植受者的數(shù)據(jù),建立logistic回歸、SVM、RF、AdaBoost、GBM和極端梯度提升(extreme gradient boosting,XGBoost)6種機器學(xué)習(xí)模型,并通過ROC曲線來評估不同模型其預(yù)測性能。結(jié)果發(fā)現(xiàn),XGBoost模型預(yù)測能力最優(yōu),且肺炎的發(fā)生率與凝血酶原時間國際標(biāo)準(zhǔn)化比值、紅細胞比容、血小板、白蛋白、丙氨酸轉(zhuǎn)氨酶、纖維蛋白原、白細胞、血小板、血清鈉、總膽紅素、麻醉時間、術(shù)前住院時間、總輸液時間、手術(shù)時間等14項指標(biāo)顯著相關(guān)。
肝移植圍手術(shù)期控制濃縮紅細胞的輸注可以有效降低深靜脈血栓形成、腫瘤復(fù)發(fā)及病死率[30]。一項研究納入我國3家大型三級醫(yī)院1 193例肝移植受者,收集24項術(shù)前變量,包括基本人群特征、診斷、癥狀和實驗室指標(biāo),分別采用遞歸式特征消除(recursive feature elimination,RFE)和XGBoost來選擇變量并構(gòu)建機器學(xué)習(xí)預(yù)測模型,采用機器學(xué)習(xí)模型預(yù)測肝移植圍手術(shù)期輸濃縮紅細胞的必要性[31]。結(jié)果表明XGBoost模型預(yù)測性能明顯優(yōu)于其他,并篩選出9個重要的術(shù)前變量,包括門靜脈高壓、年齡、血紅蛋白、原發(fā)病、直接膽紅素、活化部分凝血活酶時間、球蛋白、天冬氨酸轉(zhuǎn)氨酶、丙氨酸轉(zhuǎn)氨酶等。機器學(xué)習(xí)可以成功構(gòu)建肝移植圍手術(shù)期輸血預(yù)測模型,來指導(dǎo)高?;颊卟扇∠鄳?yīng)的預(yù)防措施。
移植后糖尿病(post transplantation diabetes mellitus,PTDM)已成為器官移植術(shù)后嚴(yán)重且常見并發(fā)癥,可導(dǎo)致術(shù)后感染、心血管疾病、排斥反應(yīng)、移植物功能不良等疾病的發(fā)生率升高,受者生存率降低[32]。Bhat等[33]通過多種機器學(xué)習(xí)模型分析1987年至2016年所有成人肝移植受者的數(shù)據(jù),發(fā)現(xiàn)高齡、男性和肥胖受者具有更高的PTDM風(fēng)險,使用以西羅莫司為主要免疫抑制藥的受者發(fā)生PTDM的風(fēng)險較使用他克莫司的受者高33%。與非糖尿病患者相比,PTDM患者10年生存率顯著降低,提示其需要更積極的護理和更密切的隨訪。
肝移植受者術(shù)后主要不良心血管事件(major adverse cardiovascular events,MACE)是常見且嚴(yán)重的并發(fā)癥之一,病死率較高[34]。Jain等[35]建立機器學(xué)習(xí)模型來預(yù)測肝移植受者術(shù)后MACE、全因病死率和心血管病死率。研究納入1 459例肝移植受者,分別采用logistic回歸、RF、SVM、GBM及最小絕對收縮和選擇手術(shù)回歸(least absolute shrinkage and selection surgery regression)對MACE、全因病死率和心血管病死率進行建模。結(jié)果表明,GBM模型預(yù)測性能最優(yōu),并篩選出移植年齡、糖尿病、血清肌酐、非酒精性脂肪性肝炎引起的肝硬化、右心室收縮壓和左心室射血分?jǐn)?shù)等為MACE的高危因素。這些模型能有效幫助臨床醫(yī)師篩選出可能發(fā)生移植術(shù)后MACE的高風(fēng)險個體。
由于肝移植術(shù)后長期使用免疫抑制藥,非黑色素瘤皮膚癌(non-melanoma skin cancer, NMSC)的發(fā)生風(fēng)險明顯增加,NMSC是肝移植術(shù)后最常見的惡性腫瘤,其預(yù)后差、病死率高[36]。Tanaka等[37]研究發(fā)現(xiàn)DT模型可準(zhǔn)確對肝移植受者NMSC發(fā)病風(fēng)險進行分層和量化,并將體質(zhì)量指數(shù)<40 kg/m2、未服用西羅莫司且年齡>47歲的白種男性患者劃為高風(fēng)險人群,預(yù)測其5、10、20年NMSC累積發(fā)生率分別為5.6%、11.6%、23.1%。
肝移植是目前治療原發(fā)性肝細胞癌(肝癌)的有效方法,然而肝癌肝移植術(shù)后復(fù)發(fā)極大地影響了受者生存,探索肝癌肝移植術(shù)后復(fù)發(fā)相關(guān)標(biāo)志物,篩選高危人群,早期預(yù)警,是防治肝癌復(fù)發(fā)的主要目標(biāo)。Marsh等[38]從178例肝癌肝移植術(shù)后存活超過150 d的受者中,基于5個高危因素(性別,腫瘤數(shù)量、大小、肝內(nèi)分布和血管浸潤程度)建立預(yù)測移植術(shù)后1、2、3年肝癌復(fù)發(fā)的ANN模型。并結(jié)合微衛(wèi)星突變或缺失基因分型對103例肝癌肝移植受者進行分析,發(fā)現(xiàn)兩者結(jié)合可顯著提高肝移植術(shù)后肝癌復(fù)發(fā)的預(yù)測準(zhǔn)確性,其準(zhǔn)確率高達88.0%[39]。隨后Rodriguez-Luna等[40]利用該預(yù)測模型對1999年至2002年19例肝移植受者進行外部驗證,證實其具有較高的預(yù)測性能,準(zhǔn)確率高達89.5%。
Nam等[41]應(yīng)用DNN模型來預(yù)測肝癌肝移植術(shù)后腫瘤復(fù)發(fā)率,研究納入563例肝癌肝移植受者,發(fā)現(xiàn)該預(yù)測模型顯著優(yōu)于米蘭標(biāo)準(zhǔn)、加州大學(xué)舊金山分校(University of California at San Francisco,UCSF) 標(biāo)準(zhǔn)、up-to-seven標(biāo)準(zhǔn)及京都標(biāo)準(zhǔn)等傳統(tǒng)標(biāo)準(zhǔn)模型,其主要影響因素為腫瘤直徑,其次是甲胎蛋白、年齡和異常凝血酶原。He等[42]將臨床數(shù)據(jù)、病理組織學(xué)和放射學(xué)特征相結(jié)合構(gòu)建預(yù)測肝癌肝移植術(shù)后復(fù)發(fā)模型,研究納入109例受者,三者結(jié)合的深度學(xué)習(xí)預(yù)測模型可以發(fā)現(xiàn)腫瘤大小和腫瘤標(biāo)志物之外的復(fù)發(fā)危險因素,可以更客觀地評估肝癌患者肝移植的風(fēng)險。最近的一項研究納入739例肝癌肝移植受者,分析相關(guān)數(shù)據(jù),包括系列影像學(xué)資料、甲胎蛋白、局部治療、治療反應(yīng)和移植后結(jié)果5項因素,利用機器學(xué)習(xí)來建立肝癌肝移植術(shù)后復(fù)發(fā)預(yù)測模型,發(fā)現(xiàn)CoxNet正則化回歸(regularized Cox regression)模型預(yù)測性能最佳[43]。
肝移植術(shù)后急性排斥反應(yīng)發(fā)生率及嚴(yán)重程度明顯低于其他器官移植,但術(shù)后排斥反應(yīng)仍較為常見,是引起移植肝并發(fā)癥和晚期移植肝衰竭的主要原因[44]。Hughes等[45]應(yīng)用ANN構(gòu)建模型來協(xié)助診斷肝移植術(shù)后急性排斥反應(yīng),研究回顧性收集117例肝移植受者術(shù)后生化指標(biāo)(轉(zhuǎn)氨酶、膽紅素及其動態(tài)過程)和移植術(shù)后的時間,采用ROC曲線分析診斷準(zhǔn)確性,發(fā)現(xiàn)ANN模型預(yù)測靈敏度和特異度分別為0.800和0.901,顯著高于轉(zhuǎn)氨酶及膽紅素等單一肝功能指標(biāo)。對于術(shù)后早期肝移植受者的監(jiān)測,可以成為常規(guī)肝功能檢查的輔助手段。Zare等[46]也利用ANN構(gòu)建預(yù)測模型,探討早期預(yù)測肝移植受者急性排斥反應(yīng)的最佳時機。研究納入148例肝移植受者術(shù)后3、7、14 d的臨床和實驗室檢查指標(biāo),主要指標(biāo)為天冬氨酸轉(zhuǎn)氨酶和丙氨酸轉(zhuǎn)氨酶,發(fā)現(xiàn)術(shù)后7 d預(yù)測效果最佳,準(zhǔn)確率為90%,靈敏度為0.870。這些研究表明,在肝移植術(shù)后早期監(jiān)測中,ANN可以作為常規(guī)肝功能檢測的一種有價值的輔助手段。
機器學(xué)習(xí)在評估患者移植術(shù)后遠期生存預(yù)后方面同樣發(fā)揮著巨大作用,其構(gòu)建的預(yù)測模型可以更準(zhǔn)確地預(yù)測移植預(yù)后[47]。Liu等[48]利用RF算法將患者術(shù)前1~9 d的實驗室檢查指標(biāo)及相關(guān)臨床特征納入預(yù)測模型中,發(fā)現(xiàn)相比于傳統(tǒng)模型,該模型能顯著提高術(shù)后30 d生存率預(yù)測能力,特異度高達0.820。Hoot等[49]利用器官共享聯(lián)合網(wǎng)絡(luò)數(shù)據(jù)庫的移植信息,構(gòu)建貝葉斯模型預(yù)測移植物90 d存活率,通過對29個移植前變量進行綜合分析,其預(yù)測準(zhǔn)確率高達91%。Khosravi等[50]應(yīng)用ANN模型來預(yù)測肝移植術(shù)后生存率,研究回顧性納入1 168例受者,采用ROC曲線比較其預(yù)測精度。發(fā)現(xiàn)該模型能更精準(zhǔn)地預(yù)測移植術(shù)后1~5年的病死率,其準(zhǔn)確率高達92.73%。Kantidakis等[51]回顧性分析62 294例肝移植受者的相關(guān)數(shù)據(jù),應(yīng)用RF和ANN模型來預(yù)測其生存率,并篩選出97個危險因素,比較不同模型其預(yù)測準(zhǔn)確性,發(fā)現(xiàn)ANN模型對肝移植術(shù)后遠期生存的預(yù)測能力明顯優(yōu)于傳統(tǒng)的Cox模型及RF模型。
盡管機器學(xué)習(xí)模型在肝移植研究領(lǐng)域中顯示出了優(yōu)越的預(yù)測性能,但不容忽略的是,這些預(yù)測模型都是基于高質(zhì)量的數(shù)據(jù)分析之上。原始數(shù)據(jù)質(zhì)量的高低會直接影響模型的預(yù)測精度。事實上,機器學(xué)習(xí)模型并非總能得出比傳統(tǒng)統(tǒng)計學(xué)模型更好的結(jié)果[52],只有當(dāng)數(shù)據(jù)足夠大且各變量間包含非線性關(guān)系時,機器學(xué)習(xí)預(yù)測模型才能發(fā)揮其最大預(yù)測性能。目前多數(shù)的機器學(xué)習(xí)研究目前均屬于回顧性分析,不可避免存在一定的偏倚,使其準(zhǔn)確度和可信度受到一定影響。另一方面,單中心的肝移植研究樣本量有限,且存在一定的數(shù)據(jù)缺失,需要更大樣本、多中心的前瞻性研究來建立算法的準(zhǔn)確性。最后,機器學(xué)習(xí)模型存在黑箱模型效應(yīng)(black-box effect),其內(nèi)部工作機制難以理解,無法評估每個特征對預(yù)測結(jié)果的重要性,讓很多研究者對之望而卻步。
因此,嚴(yán)謹(jǐn)?shù)难芯吭O(shè)計、合理的數(shù)據(jù)整合、恰當(dāng)?shù)哪P瓦x擇以及臨床研究的相關(guān)性都是影響機器學(xué)習(xí)模型的關(guān)鍵因素。此外,肝移植不僅僅涉及供受者雙方的多種變量,也涉及多方倫理問題,因此對預(yù)測模型產(chǎn)生的數(shù)據(jù)仍應(yīng)該謹(jǐn)慎對待,不同特征隊列產(chǎn)生的模型其重復(fù)性跟一致性還有待進一步證實,其只能作為決策的一種參考依據(jù),而不能替代臨床醫(yī)師做出決定。
隨著大數(shù)據(jù)時代的來臨,深度學(xué)習(xí)的不斷發(fā)展,機器學(xué)習(xí)在肝移植研究領(lǐng)域的應(yīng)用會更加廣泛,尤其在器官分配過程中評估最佳供受者匹配、手術(shù)風(fēng)險預(yù)測、患者生存預(yù)后及并發(fā)癥預(yù)測等方面都有很好的應(yīng)用前景。同時在計算機科學(xué)技術(shù)的發(fā)展推動下,新的優(yōu)秀的算法會不斷涌現(xiàn),結(jié)合臨床數(shù)據(jù)及基礎(chǔ)研究數(shù)據(jù)使構(gòu)建的模型準(zhǔn)確度越來越高,泛化能力越來越強,更好實現(xiàn)對肝移植術(shù)后腫瘤復(fù)發(fā)的早期預(yù)警、風(fēng)險評估和療效監(jiān)測,實現(xiàn)肝移植受者個體化精準(zhǔn)的長期管理干預(yù),更好地服務(wù)于肝移植受者。