叢慧文,徐雅琪,王愛民,王廉源,楊 毅,王鳳琳,黃一銘,石福艷,王素珍
濰坊醫(yī)學院公共衛(wèi)生學院衛(wèi)生統(tǒng)計學系 山東濰坊 261053
阿爾茨海默病(Alzheimer′s disease,AD)是一種神經系統(tǒng)性疾病,是癡呆癥的主要原因[1],其特征是大腦中淀粉樣斑塊的細胞外沉積和細胞內神經原纖維纏結[2]。近期研究[3]結果顯示,中國AD總體發(fā)病率約為3.9%,并且未來將會持續(xù)增長。AD發(fā)病隱匿,且缺乏治療或有效逆轉疾病進程的特效藥物,因此AD的早期識別和及時診斷尤為重要[4]。輕度認知障礙(mild cognitive impairment,MCI)是認知正常和AD之間的一個過渡階段,MCI患者已逐漸成為AD預后評估和早期治療的目標人群[5]。
機器學習技術作為一種計算機自我學習方法,具有能夠處理多個變量、描述復雜的非線性相互作用和預測準確的特點[6],在疾病風險預測領域應用廣泛[7-10]。極限梯度增強(extreme gradient boosting,XGBoost)算法因具有更強的預測能力、基于集成算法的高效性和模型可解釋性,解決了傳統(tǒng)機器學習算法的黑箱問題,近年來在多項機器學習和數(shù)據(jù)挖掘中得到了廣泛認可[11]。本研究擬基于AD神經影像學計劃(Alzheimer′s disease neuroimaging initiative,ADNI)數(shù)據(jù)庫,采用XGBoost算法構建MCI人群AD發(fā)病預測模型,為AD的早期干預提供理論依據(jù)。
1.1 數(shù)據(jù)來源從ADNI數(shù)據(jù)庫中選擇符合MCI診斷標準、在2005至2016年至少完成兩次隨訪且結局為MCI或AD發(fā)病的患者;排除患有精神類疾病或實質性神經系統(tǒng)疾病,以及用于精神疾病類藥物或對MRI檢查有禁忌證者,最終共納入370例MCI患者。MCI診斷標準:簡易精神狀態(tài)檢查量表(mini-mental state examination,MMSE)得分在24~30;記憶力障礙;經教育評分校正后的韋氏記憶量表邏輯記憶Ⅱ評價證實存在客觀記憶力減退;臨床癡呆評定量表(clinical dementia rating,CDR)得分為0.5;在其他認知領域沒有顯著水平的損傷,基本上可進行日常生活活動,無癡呆。AD診斷標準:MMSE評分在20~26;CDR得分為0.5或1.0,符合美國國立神經病語言障礙卒中研究所AD及相關疾病協(xié)會(NINCDS/ADRDA)關于可能AD的標準。ANDI數(shù)據(jù)庫由美國國立衛(wèi)生研究院批準,所有研究對象均在入組前簽署知情同意書。
1.2 預測模型變量選擇和賦值因變量為MCI患者從首次隨訪10 a內是否發(fā)展為AD。參考國內外文獻[12-14],結合臨床專家意見,基于預測變量的易獲得性,從ADNI數(shù)據(jù)庫中挑選出16個臨床指標,包括一般情況(性別、年齡、教育水平得分、婚姻狀況、BMI、舒張壓、收縮壓),臨床認知評分指標[臨床癡呆評分總和量表(clinical dementia rating scale sum of boxes,CDR-SB)得分、MMSE得分、聽覺語言學習測試(Rey auditory-verbal learning test,RAVLT)得分、社會活動功能量表(functional activities questionnaire,F(xiàn)AQ)得分],血清脂蛋白及其代謝指標[糖蛋白-N-乙酰(glycoprotein N-acetyl,GlycA)、纈氨酸、白蛋白、葡萄糖、多不飽和脂肪酸與總脂肪酸的比值]。采用LASSO法對變量進行篩選。
通過多重填補法填補連續(xù)型變量中的缺失值,并進行0~1標準化處理;對分類變量賦值,將55歲≤年齡<65歲、65歲≤年齡<75歲、75歲≤年齡<85歲、年齡≥85歲,分別賦值1、2、3、4;依據(jù)是否獨居將研究對象分為兩類,喪偶、未婚、離婚的個體賦值為0,已婚者賦值為1。
1.3 模型的構建及評價XGBoost算法將決策樹作為基學習器,通過集成算法,在模型訓練時利用所有CPU內核并行建樹。輸入自變量計算每棵樹的預測值,并對上一棵樹的預測殘差求泰勒展開式的二階導數(shù),以達到模型復雜度的最小化,同時將樹復雜度作為正則項加入到目標函數(shù)中,最后加權平均多個決策樹的預測結果[15]。
本研究通過無放回隨機抽樣將樣本分割成包含70%樣本量的訓練集和包含30%樣本量的測試集,訓練集用于建模,測試集用于模型性能的評價。繪制ROC曲線[16]衡量模型的預測性能,通過Hosmer-Lemeshow檢驗和預測模型校準曲線評估模型擬合性能。
1.4 統(tǒng)計學處理采用兩獨立樣本t檢驗或χ2檢驗比較MCI組和AD組間基線資料的差異,檢驗水準α=0.05。采用R4.1.2軟件中的xgboost包構建XGBoost模型,rpart包構建Logistic回歸模型,e1071包構建支持向量機模型,nnet包構建BP神經網(wǎng)絡模型,trainControl函數(shù)選擇模型最優(yōu)超參數(shù);通過caret包計算模型的敏感度、特異度、準確率和Kappa值,reportROC包計算模型AUC值,ResourceSelection包進行Hosmer-Lemeshow檢驗,caTools包繪制預測模型校準曲線。
2.1 研究對象的基線資料370例共隨訪1 013次。根據(jù)最后一次隨訪的發(fā)病狀態(tài)分為MCI組256例和AD組114例。2組間基線資料的比較結果見表1,表1顯示2組患者CDR-SB得分、MMSE得分、RAVLT得分、FAQ得分、BMI、年齡、婚姻狀況差異有統(tǒng)計學意義,見表1。
表1 2組患者基線資料比較
2.2 預測模型構建結果經XGBoost算法計算,逐步剔除重要性最弱變量直至特征變量數(shù)為12時,基于XGBoost算法的AD預測模型AUC值最高。預測模型變量選擇結果見圖1。
圖1 預測模型變量選擇結果
將12個變量標準化后納入XGBoost模型。超參數(shù)設置情況如下:nrounds=30,max_depth=40,eta=0.1,colsample_bytree=0.4,min_child_weight=5。模型特征重要性排序結果從大到小依次為:CDR-SB得分(40.42%)、FAQ得分(34.49%)、MMSE得分(12.65%)、RAVLT得分(5.27%)、GlycA(1.48%)、BMI(1.29%)、葡萄糖(1.22%)、纈氨酸(1.00%)、年齡(0.83%)、舒張壓(0.63%)、教育水平得分(0.63%)、白蛋白(0.09%)。
2.3 預測模型的比較及評價除BP神經網(wǎng)絡模型外,所構建的XGBoost模型、Logistic回歸模型、支持向量機模型均通過Hosmer-Lemeshow檢驗,表明模型擬合較好。與Logistic回歸模型、BP神經網(wǎng)絡模型、支持向量機模型相比,XGBoost模型具有更高的準確率、敏感度、特異度、Kappa值、AUC值(表2)。4種預測模型校準曲線圖見圖2,圖2顯示,XGBoost模型擬合較好。
表2 4種模型的評價結果
圖2 4種預測模型的校準曲線
臨床研究[17]表明,從MCI發(fā)展為AD的進程緩慢,僅部分MCI患者會進展為AD,另一部分個體則會保持穩(wěn)定,甚至恢復到正常的認知狀態(tài)。因此,提前預測并識別MCI向AD轉化的危險因素對于AD的預防和精準治療至關重要。近年來,許多研究者將機器學習應用到AD預測模型構建中,研究[14,18-21]結果表明,Logistic回歸、隨機森林、人工神經網(wǎng)絡、決策樹、支持向量機等多種機器學習算法可有效提高AD預測模型的預測精度。
Kuang等[14]構建Logistic回歸、人工神經網(wǎng)絡和決策樹模型,對MCI進展為AD進行預測,3個模型預測穩(wěn)定性均較好,但人工神經網(wǎng)絡模型具有最佳的預測價值。Wang等[18]對臨床問卷變量進行LASSO法篩選,確定了性別、年齡、經濟狀況、健康狀況、生活方式和遺傳風險共6個預測因子,并利用這6個變量構建Logistic回歸預測模型,該模型對AD有較好的預測能力。Bari Antor等[19]比較了4種機器學習算法(支持向量機、Logistic回歸、決策樹和隨機森林)構建的模型在AD發(fā)病預測中的表現(xiàn),發(fā)現(xiàn)支持向量機模型準確性最高。Velazquez等[20]基于ADNI數(shù)據(jù)庫中的383例MCI的資料構建包含9個臨床特征的隨機森林模型,結果表明,該模型預測AD轉化的準確率高達93.6%。Tang等[21]將ADNI數(shù)據(jù)庫中的560名受試者分為認知正常組、早期MCI組、晚期MCI組和AD組,分別構建隨機森林、決策樹、支持向量機預測模型,結果顯示隨機森林預測模型可對AD不同階段進行準確分類。這些模型在不同數(shù)據(jù)集表現(xiàn)不同,提示在建立AD預測模型領域有更大的探索空間。
近年來,XGBoost算法在糖尿病[22]、腦卒中[23]、腎病[24]等疾病發(fā)病預測領域應用廣泛,而在預測AD等神經系統(tǒng)疾病方面應用較少。為探索XGBoost算法的優(yōu)勢,本研究基于一般資料、臨床認知評分指標、脂蛋白及其代謝指標篩選出12個變量構建AD預測模型,研究結果顯示,基于XGBoost算法構建的預測模型相比其他3種模型(Logistic回歸模型、BP神經網(wǎng)絡模型和支持向量機模型),預測效能更好。
此外,本研究模型特征變量選擇結果提示,臨床認知評分指標對AD預測的貢獻最高,占比92.83%;臨床認知評分指標中CDR-SB得分、FAQ得分重要程度分別占40.42%和34.49%,這表明臨床認知評分指標可能是預測AD發(fā)病的重要因素,醫(yī)療決策人員在MCI人群AD篩查中應加強對CDR-SB得分和FAQ得分的監(jiān)測管理。
綜上所述,基于ADNI數(shù)據(jù)庫所建立的XGBoost模型可用于MCI人群中AD高風險人群篩查,進而為AD的有效防控提供依據(jù)。然而,本研究也具有一定的局限性如未考慮隨訪數(shù)據(jù)之間的時間關聯(lián)性,這也是大部分機器學習算法的劣勢,另外,未對模型預測性能進行外部驗證。后期研究中如條件許可,將進一步考慮數(shù)據(jù)之間的時間聯(lián)系,同時進行模型的外部驗證。