張明琪,鄧鑫
(廣西中醫(yī)藥大學(xué),廣西南寧 530001)
肝硬化是一種因感染性、毒性或藥物誘導(dǎo)(主要是酒精誘導(dǎo))、代謝性、膽汁淤積或自身免疫性損傷等各種因素所導(dǎo)致的彌漫性肝損害,其肝損害以肝臟彌漫性纖維化、假小葉形成、肝內(nèi)外血管增殖為病理特征[1-2]。肝硬化常呈隱匿性起病,代償期可無明顯臨床癥狀,隨著疾病進展可發(fā)展為失代償期,出現(xiàn)多種并發(fā)癥,甚則癌變及死亡。因此,延緩代償期肝硬化進入失代償期、預(yù)防肝細胞癌變及減少并發(fā)癥是肝硬化的治療目標(biāo)。病因治療及抗炎抗肝纖維化治療是現(xiàn)代醫(yī)學(xué)治療肝硬化代償期最主要的方法。然而目前尚無抗纖維化的特效西藥[2]。代償期肝硬化可歸屬于中醫(yī)“積聚”范疇[3]。中醫(yī)藥抗肝纖維化治療有顯著的療效,且副作用較少[4]?!氨孀C論治”是中醫(yī)學(xué)理論體系的主要特點之一,中醫(yī)辨證的精準(zhǔn)性決定了論治的有效性,但現(xiàn)行中醫(yī)的辨證方法眾多,證型分類不規(guī)范,易受個人主觀因素的影響[5],中醫(yī)辨證有待進一步客觀化、標(biāo)準(zhǔn)化。
近年來,隨著人工神經(jīng)網(wǎng)絡(luò)架構(gòu)和算法的不斷發(fā)展,以及計算能力的不斷增強,人工智能技術(shù)在中醫(yī)臨床的疾病診斷、輔助治療及經(jīng)驗傳承等多方面取得了較大的發(fā)展[6-8]。其中,中醫(yī)數(shù)字化辨證一直是人工智能在中醫(yī)領(lǐng)域研究的熱點課題[9]。統(tǒng)一規(guī)范的中醫(yī)辨證模式是中醫(yī)辨證智能化的基礎(chǔ),同時也是中醫(yī)藥現(xiàn)代化的重要內(nèi)容之一[10]。目前機器學(xué)習(xí)領(lǐng)域有較多經(jīng)典的算法,如決策樹、支持向量機、K最近鄰、隨機梯度下降法、隨機森林、極端梯度增強法等,這些算法基于不同的數(shù)學(xué)原理,具有各自的優(yōu)缺點,均可運用于中醫(yī)藥領(lǐng)域的研究。本研究采用集成學(xué)習(xí)的方法研究肝硬化代償期中醫(yī)辨證模型,將這些算法輸出的概率進行后融合,通過后融合的方法彌補各個模型的不足,發(fā)揮其長處,達到取長補短的目的,用BP 神經(jīng)網(wǎng)絡(luò)作為最終的元學(xué)習(xí)器,輸出最終的預(yù)測概率,以期為中醫(yī)辨證智能化和客觀化提供借鑒,并為肝硬化代償期的中醫(yī)臨床診療提供參考。
1.1 病歷資料來源及篩選收集2016 年1 月至2022 年10 月期間在廣西中醫(yī)藥大學(xué)附屬瑞康醫(yī)院就診(包括門診及住院)的肝硬化代償期(首次就診)的病歷數(shù)據(jù)。收集的病歷資料包含中醫(yī)癥狀、體征、舌象、脈象等詳細信息,不記錄其他個人信息。對患者的性別、年齡、職業(yè)、病程、原發(fā)疾病、用藥情況不做特殊限制。
納入以下病歷資料:①患者符合《肝硬化診治指南》[2]中的肝硬化代償期診斷標(biāo)準(zhǔn);②患者以肝硬化代償期為主要診斷;③患者無其他重大疾病。排除以下病歷資料:①患者有嚴(yán)重心、腎等并發(fā)癥,或合并有其他嚴(yán)重原發(fā)性疾??;②患者以其他疾病為主要診斷,而肝硬化代償期為次要診斷;③患者為肝硬化失代償期;④臨床記錄有缺陷而無法使用的病歷記錄。
1.2 證候分型標(biāo)準(zhǔn)參考《積聚(肝硬化代償期)中醫(yī)診療方案》[11],將本病的證候確定為5 個證型,即濕熱瘀阻證、氣滯瘀阻證、肝郁脾虛血結(jié)證、陰虛血阻證、氣虛血瘀證。
1.3 數(shù)據(jù)錄入與預(yù)處理獲得上述病歷樣本的數(shù)據(jù)信息,將規(guī)范后的數(shù)據(jù)與證型(包括患者的癥狀和體征及所對應(yīng)的證型)錄入到Excel中,并以此作為原始數(shù)據(jù)庫(錄入格式:醫(yī)案編號;證型;癥狀和體征)。
以患者的臨床表現(xiàn)作為特征值,參考《肝硬化醫(yī)生報告結(jié)局量表研制》[12]中的癥狀和體征,將獲得的數(shù)據(jù)進行規(guī)范化?;颊叩呐R床特征(癥狀、體征、舌象和脈象)包括肝區(qū)疼痛、腹部疼痛、腹部脹滿不適、情志抑郁、煩躁易怒、乳房脹痛或結(jié)塊、疲倦乏力、視物模糊、噯氣、腰痛、頭痛、咳嗽、咽部異物感、目干澀、頭暈、難以入睡、口干、口苦、口臭、納差、盜汗、五心煩熱、惡心不適、肢體困重、牙齦出血、耳鳴耳聾、腰膝酸軟、皮膚瘙癢、小便黃、尿頻、嘔吐、胸悶氣喘、大便干結(jié)、小便少、遺精、月經(jīng)量少、閉經(jīng)、下肢水腫、蜘蛛痣、毛細血管擴張、肝掌、面色晦暗、面色黧黑、面色萎黃、唇色紫暗、黃染、消瘦、貧血貌、舌淡紅、舌紫、舌淡紫、舌質(zhì)暗、舌有瘀斑或瘀點、苔薄白、苔薄黃、舌苔白膩、舌苔黃膩、舌苔少、舌少津、舌邊有齒痕、舌胖大、舌質(zhì)紅、舌下絡(luò)脈顯露、裂紋舌、脈弦、脈細、脈滑、脈無力、脈數(shù)、脈澀、脈沉等共72項。采用“0-1”編碼對各臨床特征進行賦值,即出現(xiàn)該特征計為“1”,未出現(xiàn)該特征計為“0”。然后以原始數(shù)據(jù)庫中每個樣本所對應(yīng)的證型作為目標(biāo)值,以此建立符合方案的數(shù)據(jù)集(PPS 數(shù)據(jù)集格式包括患者編號、目標(biāo)值、特征值)。
1.4 數(shù)據(jù)集建立及實驗開發(fā)環(huán)境與框架通過Scikit-learn 機器學(xué)習(xí)庫中的標(biāo)簽編碼(label encoding)對目標(biāo)值下的中醫(yī)證型進行處理,將文本信息映射為數(shù)值,將氣虛血瘀證、氣滯血瘀證、濕熱瘀阻證、陰虛血阻證、肝郁脾虛血結(jié)證分別編碼為0、1、2、3、4。利用Python 將數(shù)據(jù)集以8∶2隨機劃分為訓(xùn)練集和測試集,通過設(shè)置參數(shù)stratify=y使得訓(xùn)練集和測試集的各個證型數(shù)據(jù)的比例與原PPS數(shù)據(jù)集保持相同的比例,然后通過設(shè)置參數(shù)random state=0 保證每次實驗都使用相同的訓(xùn)練集和測試集,并增加實驗的可重現(xiàn)性。
本研究的開發(fā)環(huán)境為Anaconda 4.10.3,采用決策 樹(decision tree,DT)、K最近鄰(K-nearest neighbor,KNN)、支持向量機(support vector machine,SVM)、隨機梯度下降法(stochastic gradient descent,SGD)、隨機森林(random forest,RF)、極端梯度增強(extreme gradient boosting,XGBoost)等算法。算法采用的框架為Scikit-learn(0.24.2)。Scikitlearn 是Python 第三方提供的機器學(xué)習(xí)框架,支持分類、聚類、降維、回歸四大算法以及特征提取、數(shù)據(jù)處理、模型評估三大模塊[13]。BP 神經(jīng)網(wǎng)絡(luò)采用的框架為PyTorch(1.12.0+cpu)。PyTorch 是以Python 優(yōu)先的深度學(xué)習(xí)框架,它僅支持自動求導(dǎo)功能,而且設(shè)計簡潔,較其他深度學(xué)習(xí)框架具有靈活性強、運行速度快等優(yōu)點[14]。模型解釋采用的框架為SHAP(0.40.0),使用SHAP 值解釋機器學(xué)習(xí)模型和特征的重要性[15]。
1.5 模型構(gòu)建方法
1.5.1 初級學(xué)習(xí)器之傳統(tǒng)機器學(xué)習(xí)算法 不同的機器學(xué)習(xí)模型是基于不同的數(shù)學(xué)算法原理,究竟何種機器學(xué)習(xí)模型更具優(yōu)勢還不明確,因此選擇多個機器學(xué)習(xí)模型共同參與肝硬化代償期診斷模型的構(gòu)建,有助于模型之間的優(yōu)勢互補,彌補其不足,提高最終模型的性能表現(xiàn)。研究過程中可融合多種傳統(tǒng)機器學(xué)習(xí)算法構(gòu)建模型,以提高模型準(zhǔn)確度。本研究所涉及的主要算法有6種,即決策樹(DT)、K最近鄰(KNN)、支持向量機(SVM)、隨機梯度下降法(SGD)、隨機森林(RF)、極端梯度增強法(XGBoost)。各算法原理及優(yōu)缺點如下:
DT 是一種被廣泛應(yīng)用于數(shù)據(jù)處理的分類器,主要根據(jù)數(shù)據(jù)特征屬性值進行排序及分組。DT 由節(jié)點和分支組成,節(jié)點則由根節(jié)點、葉子節(jié)點和若干內(nèi)部節(jié)點構(gòu)成[16]。DT 決策的過程就是從頂端的根節(jié)點開始,通過測試待分類項中相應(yīng)的特征屬性進行節(jié)點分裂,直到到達葉子節(jié)點停止分裂,葉子節(jié)點的類別代表分類決策最終結(jié)果[17]。其優(yōu)點是具有簡單高效、便于理解、易于評測,也存在易于過擬合的固有缺陷。
KNN 分類器代表了一種簡單通用的分類方法,其相對性能與距離度量或相似度量的選擇密切相關(guān)。其核心工作原理是計算待分類樣本與K個鄰居樣本的距離,尋找與待分類樣本距離最近的K個樣本,由這K個樣本中數(shù)量最多的類別決定待分類樣本的類別,使用少數(shù)服從多數(shù)的原則[18]。KNN分類器具有對數(shù)據(jù)分布要求較低、對噪聲有一定容忍度的特點,是最懶惰的學(xué)習(xí)方法之一。
SVM 最早應(yīng)用在二分類問題上,用于尋找能將二類樣本分開且分類間隔最大的一個最優(yōu)超平面[19]。其基本思想在于引用核函數(shù)將輸入的非線性樣本空間映射到高維特征空間,以構(gòu)建線性函數(shù)判別。SVM 適用于回歸分析和分類問題等領(lǐng)域,具有結(jié)構(gòu)簡單、適應(yīng)性好、訓(xùn)練速度快和良好泛化能力等優(yōu)勢[20]。
RF 是基于決策樹基礎(chǔ)上的一種集成算法,隨機性是其區(qū)別于決策樹的重要屬性。這種隨機性體現(xiàn)在Bagging 技術(shù)上可實現(xiàn)對樣本的重采樣,有利于降低決策樹模型之間的相關(guān)性、增加RF 的精度。RF 具有簡單、計算量小、可以降低決策樹容易過于擬合等諸多優(yōu)勢[21]。
SGD 是基于全梯度下降方法(GD)的一種優(yōu)化形式。GD 每次迭代時需使用全部的訓(xùn)練集樣本以更新模型參數(shù),而SGD 每次更新訓(xùn)練則只需在訓(xùn)練集隨機抽取一個樣本計算梯度。相較而言,GD有較高的精度,但也存在計算量過大,耗時明顯,且容易陷入局部極值點的問題;SGD 雖然計算量小,速度快,但精度稍遜GD[21]。
XGBoost 同樣以DT 作為基學(xué)習(xí)器,通過弱分類器的多輪迭代計算以降低偏差、實現(xiàn)最優(yōu)分類效果[22-23]。通常以分類回歸樹作為弱分類器,每次訓(xùn)練所得弱分類器需要經(jīng)過加權(quán)求和,最終生成總的分類器。XGBoost 主要利用二階泰勒損失函數(shù)進行運算,并用正則項得到最優(yōu)解,能夠充分利用多核CPU 并行計算的優(yōu)勢,實現(xiàn)更快的模型探索[24]。
1.5.2 集成學(xué)習(xí)后融合 融合是將相同數(shù)據(jù)的不同模型預(yù)測結(jié)果進行有機整合后以刻畫結(jié)果的過程。一般情況下,融合分為前融合、后融合,后融合是結(jié)果層面的融合。stacking 概率后融合是經(jīng)典的集合算法。本研究使用stacking 后端概率融合模式將訓(xùn)練好的機器學(xué)習(xí)分類器預(yù)測概率輸出,再結(jié)合原始影像組學(xué)特征以及深度學(xué)習(xí)特征輸入到BP 人工神經(jīng)網(wǎng)絡(luò)(backpropagation neural network)進行融合,其中,6 種傳統(tǒng)機器學(xué)習(xí)模型作為初級學(xué)習(xí)器,而BP神經(jīng)網(wǎng)絡(luò)則屬于元學(xué)習(xí)器。
元分類器之深度學(xué)習(xí)網(wǎng)絡(luò)通過BP 人工神經(jīng)網(wǎng)絡(luò)算法實現(xiàn),它由輸入層、隱藏層和輸出層三部分組成[25]。其工作原理如下:首先,向輸入層神經(jīng)元輸入信號,再把信號一層層向前傳遞,直至輸出層結(jié)果生成為止;接著對輸出層進行誤差計算,將得到的誤差反向擴散到隱層神經(jīng)元上;最后,基于隱層神經(jīng)元誤差調(diào)整連接權(quán)與閾值,直到滿足停止條件,最終獲得具有較好泛化能力的模型[25]。整個研究利用torch 模塊完成,使用交叉熵損失函數(shù)(cross entropy loss)對特征進行分類;優(yōu)化器選擇Adam 優(yōu)化器。分類結(jié)果設(shè)置為5,隱藏層設(shè)定為100?;诩蓪W(xué)習(xí)后融合神經(jīng)網(wǎng)絡(luò)算法構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的建模流程如圖1所示。
圖1 基于集成學(xué)習(xí)后融合神經(jīng)網(wǎng)絡(luò)算法構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的建模流程圖Figure 1 Modeling flow chart for the construction of TCM intelligent syndrome differentiation model of compensated liver cirrhosis based on integrated learning and late-fusion neural network algorithm
1.6 參數(shù)調(diào)優(yōu)及模型評價決策樹(DT)、K最近鄰(KNN)、支持向量機(SVM)、隨機梯度下降法(SGD)、隨機森林(RF)、極端梯度增強法(XGBoost)采用GridSearchCV 模塊通過參數(shù)列表param_grid 尋找最優(yōu)模型的超參數(shù)組合,使用分層K(K=5)折交叉驗證。人工神經(jīng)網(wǎng)絡(luò)在Optuna 框架下創(chuàng)建目標(biāo)函數(shù)(objective),目標(biāo)函數(shù)的評估指標(biāo)設(shè)置為準(zhǔn)確率(accuracy),進行100 次試驗(epoches=100),并在試驗完成后從study 項下選擇最優(yōu)的超參數(shù)組合。以上模型均使用準(zhǔn)確率、精確率(precsion)、召回率(recall)、F1分?jǐn)?shù)(F1 score)、混淆矩陣、受試者工作特征曲線(ROC 曲線)以及ROC 曲線下面積(AUC)值評估模型的性能。各模型最優(yōu)超參數(shù)組合見表1。
表1 各模型的最優(yōu)超參數(shù)組合Table 1 The optimal hyperparameter combination for various models
初步搜集得到928例肝硬化代償期患者的病歷資料,經(jīng)篩選后可供錄入的病歷資料(包含了中醫(yī)癥狀、體征、舌象、脈象等證候詳細信息)為912 份。912 例患者的原發(fā)病主要為病毒性肝炎、酒精性脂肪肝、非酒精性脂肪肝以及原發(fā)性膽汁性肝硬化等,其中氣虛血瘀證108例,氣滯瘀阻證95例,濕熱瘀阻證168例,陰虛血阻證95例,肝郁脾虛血結(jié)證446 例。構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的病歷數(shù)據(jù)處理流程如圖2所示。
圖2 構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的病歷數(shù)據(jù)處理流程圖Figure 2 Flow chart for the process of medical record data for constructing TCM intelligent syndrome differentiation model of compensated liver cirrhosis
2.1 模型評價結(jié)果將912 例患者的證型數(shù)據(jù)按8∶2劃分為訓(xùn)練集(共730例,以上各證型的例數(shù)分別為83、78、135、77、357 例)和測試集,采用不同算法進行訓(xùn)練,其訓(xùn)練結(jié)果如下:
2.1.1 決策樹模型 通過決策樹建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖3所示。決策樹在各個證型的分類正確率都很高,對肝硬化代償期證型預(yù)測較為理想。
圖3 肝硬化代償期各證型的決策樹(DT)模型的ROC曲線與混淆矩陣Figure 3 The ROC curve and confusion matrix of decision tree(DT)model for compensated liver cirrhosis of various syndrome types
2.1.2 支持向量機模型 通過支持向量機建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖4 所示。支持向量機未能較好地區(qū)分氣虛血瘀證和肝郁脾虛血結(jié)證,在83 例氣虛血瘀證中,有40例被誤分類為肝郁脾虛血結(jié)證。
圖4 肝硬化代償期各證型的支持向量機(SVM)模型的ROC曲線與混淆矩陣Figure 4 The ROC curve and confusion matrix of support vector machine(SVM)model for compensated liver cirrhosis of various syndrome types
2.1.3K最近鄰模型 通過K最近鄰建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖5 所示。K最近鄰在預(yù)測氣虛血瘀證的分類上的表現(xiàn)也不盡人意,83 例氣虛血瘀證僅有54 例分類正確。
圖5 肝硬化代償期各證型的K最近鄰(KNN)模型的ROC曲線與混淆矩陣Figure 5 The ROC curve and confusion matrix of K-nearest neighbor(KNN)model for compensated liver cirrhosis of various syndrome types
2.1.4 隨機梯度下降法模型 通過隨機梯度下降法建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖6所示。隨機梯度下降法預(yù)測陰虛血阻證的分類結(jié)果尚可,77 例陰虛血阻證中有76 例分類預(yù)測正確,但對其他證的預(yù)測能力則較弱。
圖6 肝硬化代償期各證型的隨機梯度下降法(SGD)模型的ROC曲線與混淆矩陣Figure 6 The ROC curve and confusion matrix of stochastic gradient descent(SGD)model for compensated liver cirrhosis of various syndrome types
2.1.5 隨機森林模型 通過隨機森林建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖7所示。隨機森林在陰虛血阻證的分類上表現(xiàn)最佳,在其余證型的預(yù)測上表現(xiàn)也尚可。
圖7 肝硬化代償期各證型的隨機森林(RF)模型的ROC曲線與混淆矩陣Figure 7 The ROC curve and confusion matrix of random forest(RF)model for compensated liver cirrhosis of various syndrome types
2.1.6 極端梯度增強法模型 通過極端梯度增強法(XGBoost)建模后輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣如圖8 所示。XGBoost 對陰虛血阻證的預(yù)測結(jié)果尚可,77 例陰虛血阻證中僅有2 例被預(yù)測錯誤,分別被誤歸類為濕熱瘀阻證和肝郁脾虛血結(jié)證,但在其他證型的預(yù)測方面則表現(xiàn)一般。
圖8 肝硬化代償期各證型的極端梯度增強法(XGBoost)模型的ROC曲線與混淆矩陣Figure 8 The ROC curve and confusion matrix of extreme gradient boosting(XGBoost)model for compensated liver cirrhosis of various syndrome types
2.1.7 BP 神經(jīng)網(wǎng)絡(luò)模型 通過BP 神經(jīng)網(wǎng)絡(luò)建模的準(zhǔn)確率-損失(accuracy-loss)曲線見圖9。x軸代表迭代周期(epoch),y軸代表準(zhǔn)確率和損失。隨著迭代次數(shù)增加,準(zhǔn)確率逐漸上升,損失逐漸下降。迭代周期為65 的曲線趨平緩,達到收斂。BP神經(jīng)網(wǎng)絡(luò)輸出的肝硬化代償期各證型的ROC 曲線和混淆矩陣見圖10。
圖9 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程的準(zhǔn)確率-損失(accuracyloss)曲線Figure 9 The accuracy-loss curve of backpropagation neural network training process
圖10 肝硬化代償期各證型的BP神經(jīng)網(wǎng)絡(luò)模型的ROC曲線與混淆矩陣Figure 10 The ROC curve and confusion matrix of backpropagation neural network model for compensated liver cirrhosis of various syndrome types
2.2 各類模型的性能比較在相同測試集下各分類模型的準(zhǔn)確率(accuracy)、精確率(precsion)、召回率(recall)、F1 分?jǐn)?shù)以及AUC 值如表1 所示。F1值是對精確率與召回率的調(diào)和平均,優(yōu)點在于能賦予精確率和召回率相同的權(quán)重以平衡兩者,F(xiàn)1值越高,說明精確率和召回率都較高,算法的性能越好。從表2 可知,F(xiàn)1 值最高為BP 神經(jīng)網(wǎng)絡(luò)模型,最低為支持向量機。
表2 構(gòu)建肝硬化代償期中醫(yī)智能辨證模型的各算法模型的性能指標(biāo)比較Table 2 Comparison of the performace indicators of various models using for constructing TCM intelligent syndrome differentiation model of compensated liver cirrhosis
2.3 模型解釋醫(yī)學(xué)領(lǐng)域中,模型可解釋性的重要性與模型的性能同樣重要,這些具有高準(zhǔn)確度預(yù)測結(jié)果的模型要讓人們(尤其是專業(yè)醫(yī)生)信服,就必須更進一步提供模型做出預(yù)測的依據(jù)[26]。SHAP(Shapley additive explanations)值是Lundberg S M等在2017年提出的一種基于博弈論的模型解釋方法[27],該方法量化了模型中每個特征對觀察結(jié)果最終預(yù)測的貢獻,采用基于所有可能的特征子集組合(包括給定特征)預(yù)測模型[28]。本研究按照證型分類求得每個樣本特征對應(yīng)的SHAP值,并采用SHAP 值的平均值作為該特征的重要性值,從而得到全局解釋,以此來闡明模型中貢獻度較大的特征。通過模型性能指標(biāo)的比較可知,BP 神經(jīng)網(wǎng)絡(luò)模型和隨機梯度下降法的各項評估指標(biāo)均超過0.90,但BP 神經(jīng)網(wǎng)絡(luò)模型的維度太高,無法使用SHAP 進行研究。因此本研究在隨機梯度下降法的基礎(chǔ)上,調(diào)用SHAP 庫的Explainer API 降序輸出肝硬化代償期各證型的PPS 數(shù)據(jù)集的特征重要性(排前20位),結(jié)果見圖11。
圖11 肝硬化代償期各證型中特征貢獻度排前20位的符合方案數(shù)據(jù)集(PPS)Figure 11 The per protocol set(PPS)with the leading 20 feature contribution degree for compensated liver cirrhosis of various syndrome types
由圖11 中可知,對于陰虛血阻證而言,疲倦乏力、舌質(zhì)紅、舌苔少、脈細等特征有著較高的貢獻度;舌苔黃膩、舌質(zhì)紅、脈滑等特征對濕熱瘀阻證有著較高的貢獻度;舌淡紅、苔薄白、脈弦等特征對肝郁脾虛血結(jié)證有著較高的貢獻度;脈澀、舌紫、舌質(zhì)暗等特征對氣滯瘀阻證有著較高的貢獻度;脈細、疲倦乏力、舌淡紫等特征對氣虛血瘀證有著較高的貢獻度。
目前,阻礙中醫(yī)藥客觀化與規(guī)范化的主要原因是中醫(yī)語言的模糊性、理論知識的難理解性、治療思維的抽象性以及中醫(yī)醫(yī)案的繁雜性。機器學(xué)習(xí)能將中醫(yī)藥內(nèi)部復(fù)雜的聯(lián)系轉(zhuǎn)化為不同變量在隱層空間的數(shù)學(xué)關(guān)系,將中醫(yī)模糊用詞進行規(guī)范,降低主觀性,提高客觀性,有益于中醫(yī)藥理論體系的理解,可為中醫(yī)藥理論的傳承與創(chuàng)新以及中醫(yī)循證醫(yī)學(xué)的發(fā)展做出貢獻。
本研究基于決策樹、支持向量機、K最近鄰、隨機梯度下降法、隨機森林、XGBoost 等機器學(xué)習(xí)算法和集成學(xué)習(xí)后融合的算法,通過病歷數(shù)據(jù)對肝硬化代償期的中醫(yī)智能辨證進行了深入分析和探索。實驗結(jié)果表明,在模型性能評估指標(biāo)中,BP 神經(jīng)網(wǎng)絡(luò)模型的召回率為0.90,略低于隨機森林的0.91,但BP 神經(jīng)網(wǎng)絡(luò)模型其他各項評估指標(biāo)均大于0.90 并優(yōu)于其他分類器模型??梢姡c機器學(xué)習(xí)相比,BP 神經(jīng)網(wǎng)絡(luò)對肝硬化代償期中醫(yī)證型預(yù)測具有更好的準(zhǔn)確性、精確性,其各項指標(biāo)具有更好的均衡性。
本研究使用了集成學(xué)習(xí)后融合的方法,該方法類似于醫(yī)院的臨床科室會診制度,各個科室的住院醫(yī)師(機器學(xué)習(xí)模型)對同一份病例(搜集的數(shù)據(jù)資料)提出各自的意見(機器模型預(yù)測結(jié)果),將這些意見提交給副主任醫(yī)師(BP 神經(jīng)網(wǎng)絡(luò))后,副主任醫(yī)師綜合這些意見得出最準(zhǔn)確、最綜合、最全面的結(jié)果(BP 神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果)。BP 神經(jīng)網(wǎng)絡(luò)具有良好的容錯性、自組織適應(yīng)性和學(xué)習(xí)能力,在疾病診斷、預(yù)后判斷等方面有著廣泛的應(yīng)用[29]。劉麗蓉等[30]通過BP 神經(jīng)網(wǎng)絡(luò)構(gòu)建蕁麻疹證候預(yù)測模型,其預(yù)測的準(zhǔn)確率為83.13%,表明利用BP 神經(jīng)網(wǎng)絡(luò)進行蕁麻疹證候分類取得較好的結(jié)果。劉秀峰等[31]將遺傳算法降維優(yōu)化后的BP 神經(jīng)網(wǎng)絡(luò)(GABP)診斷模型用于大腸癌虛實證型的分類研究,并與傳統(tǒng)的未經(jīng)優(yōu)化的BP 診斷模型進行比較,結(jié)果發(fā)現(xiàn)優(yōu)化后的神經(jīng)網(wǎng)絡(luò)模型建模所需時間明顯減少,證型正判率都較前顯著提高,表明基于GABP 的神經(jīng)網(wǎng)絡(luò)泛化能力更好,分類效果更佳。辛基梁等[32]比較了機器學(xué)習(xí)和BP-MLL 神經(jīng)網(wǎng)絡(luò)構(gòu)建的中醫(yī)健康狀態(tài)辨識的分類預(yù)測模型的平均精度,結(jié)果顯示BP-MLL神經(jīng)網(wǎng)絡(luò)預(yù)測模型的平均精度最高,性能最優(yōu)。綜上可見,以往的研究多使用單一的模型進行中醫(yī)疾病證型的預(yù)測,然而單個模型的泛化能力單薄,在解決所研究的問題上能力較出色,但在解決其他問題時結(jié)果卻不盡人意。本文所研究的集成學(xué)習(xí)后融合BP 神經(jīng)網(wǎng)絡(luò)的方法可以提高模型對未知問題的泛化能力,避免算法失誤,通過結(jié)合多個模型的優(yōu)點,實現(xiàn)優(yōu)勢互補,提升模型的預(yù)測精度。
本研究所搭建的集成學(xué)習(xí)后融合的神經(jīng)網(wǎng)絡(luò)肝硬化代償期中醫(yī)辨證模型,將多個機器學(xué)習(xí)模型的預(yù)測結(jié)果進行相互補充結(jié)合,保證了各模型的多樣性,克服了不同模型的劣勢,具有性能全面、指標(biāo)均衡、預(yù)測結(jié)果客觀可靠等優(yōu)勢。集成學(xué)習(xí)后融合的神經(jīng)網(wǎng)絡(luò)肝硬化代償期中醫(yī)辨證模型所輸出的肝硬化代償期各證型的PPS數(shù)據(jù)集,可提高臨床醫(yī)生對肝硬化代償期中醫(yī)辨證的速度和準(zhǔn)確率,提高對患者的診療質(zhì)量。