李彩,范炤
1.山西醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院,山西太原030001;2.山西醫(yī)科大學(xué)轉(zhuǎn)化醫(yī)學(xué)研究中心,山西太原030001
阿爾茲海默?。ˋlzheimer′s Disease,AD)是一種以認(rèn)知和智力損害、行為生活能力下降為主要特點(diǎn)的神經(jīng)退行性腦疾病,發(fā)病原因尚不明確,且缺少有效徹底的治療方案,是臨床上導(dǎo)致癡呆的主要原因[1-2]。輕度認(rèn)知障礙(Mild Cognitive Ⅰmpairment,MCⅠ)是介于正常衰老和癡呆之間的一種過(guò)渡狀態(tài),在6年后有80%轉(zhuǎn)化為癡呆[3]。如果在A(yíng)D 早期階段對(duì)患者進(jìn)行干預(yù)治療,可延緩AD 發(fā)病時(shí)間[4]。所以,針對(duì)早期A(yíng)D患者的高效診斷、識(shí)別AD的前驅(qū)階段的研究十分有必要。目前廣泛應(yīng)用于A(yíng)D 分類(lèi)預(yù)測(cè)的辦法是應(yīng)用各種機(jī)器學(xué)習(xí)算法,利用單模態(tài)影像學(xué)數(shù)據(jù)或多模態(tài)影像數(shù)據(jù),或結(jié)合人口統(tǒng)計(jì)學(xué)特征和遺傳學(xué)資料作為特征變量,以尋求最佳分類(lèi)預(yù)測(cè)解決方案。邏輯回歸已經(jīng)用于多種臨床應(yīng)用[5-7],但對(duì)AD 分類(lèi)還少有研究,邏輯回歸的大量應(yīng)用和迅速發(fā)展為其用于A(yíng)D 分類(lèi)提供了良好借鑒。Challis等[8]采用貝葉斯高斯過(guò)程邏輯回歸對(duì)77 例受試者分類(lèi),區(qū)分正常老年人(Normal Controls,NC)和早期輕度認(rèn)知障礙(Early Mild Cognitive Ⅰmpairment,EMCⅠ)患者、EMCⅠ患者和AD 患者之間的差異,結(jié)果并不理想,且模型樣本量相對(duì)特征數(shù)量較小,可能存在過(guò)擬合問(wèn)題。此外,該模型沒(méi)有考慮正規(guī)教育年限和性別對(duì)疾病的影響。Desikan 等[9]用邏輯回歸建立自動(dòng)核磁共振成像(Magnetic Resonance Ⅰmaging,MRⅠ)測(cè)量?jī)?nèi)嗅皮層厚度、海馬體積和超邊緣回厚度,以識(shí)別MCⅠ患者和AD 患者的模型,該模型雖然在臨床診斷的AD 和MCⅠ群體得到推廣,但在存在一系列認(rèn)知障礙和癡呆亞型的臨床環(huán)境中,這些程序可能不太準(zhǔn)確。已有的研究要么是使用單一影像學(xué)方法,要么樣本含量不大,所得出的準(zhǔn)確率都不是很高。由于使用多模態(tài)影像學(xué)數(shù)據(jù)檢測(cè)會(huì)給患者帶來(lái)經(jīng)濟(jì)壓力,應(yīng)用其他模型的分類(lèi)器雖然獲有不錯(cuò)的分類(lèi)精確度,但在臨床實(shí)際應(yīng)用中仍存在困難。本研究基于結(jié)構(gòu)性MRⅠ(Structural MRⅠ,sMRⅠ)影像學(xué)資料、人口統(tǒng)計(jì)學(xué)特征(年齡、性別、受教育程度)和簡(jiǎn)易智力狀態(tài)檢查量表(Mini-Mental State Examination,MMSE),提出來(lái)一種基于L1 正則Logistic 回歸(L1-Regularized Logistic Regression, L1-LR)特征選擇和自動(dòng)識(shí)別NC、EMCⅠ患者、晚期MCⅠ(Late MCⅠ,LMCⅠ)患者和AD 患者的輔助診斷工具,使病程分類(lèi)更加細(xì)化,更清楚準(zhǔn)確地判斷病程階段。
本研究把NC、EMCⅠ患者、LMCⅠ患者和AD患者這4 組作為研究對(duì)象,進(jìn)行sMRⅠ,得到三維結(jié)構(gòu)圖像。用Freesurfer工具箱進(jìn)行一系列算法,sMRⅠ圖像經(jīng)空間標(biāo)準(zhǔn)化、圖像平滑、分割、調(diào)制等預(yù)處理,計(jì)算得到各個(gè)大腦區(qū)域的面積、體積等形態(tài)學(xué)指標(biāo)。
提取的形態(tài)學(xué)指標(biāo)包括海馬亞區(qū)體積(Hippocampal Subfield, HS)、皮層體積(Cortical Volume,CV)、皮層表面積(Surface Area,SA)、皮層下體積(Subcortical Volume, SV)、皮層厚度(Cortical Thicknesses,TA),作為特征選擇的基礎(chǔ)。
在特征選擇和分類(lèi)之前,首先要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,把全部數(shù)據(jù)映射到0~1。轉(zhuǎn)換的函數(shù)為(X - Min)/(Max - Min)。
1.2.1 L1-LR特征選擇 本研究的每位研究對(duì)象均有272個(gè)形態(tài)學(xué)指標(biāo),涵蓋全部大腦的皮層和海馬亞區(qū)。文獻(xiàn)[10]指出AD病變腦區(qū)并非全腦,若使用全腦特征過(guò)于冗余,影響分類(lèi)效果,所以必須進(jìn)行特征選擇。
L1-LR是一種組合的機(jī)器學(xué)習(xí)的特征選擇方法,根據(jù)每個(gè)特征的最大數(shù)似然函數(shù)(Log-Likehood,LL)值,選擇對(duì)分類(lèi)模型準(zhǔn)確率的因變量的貢獻(xiàn)率達(dá)到一定程度的指標(biāo)才進(jìn)入分類(lèi)模型,剔除無(wú)貢獻(xiàn)或貢獻(xiàn)很小的特征變量。偏差值D=-2(當(dāng)前模型的LL值-飽和模型的LL 值)。飽和模型指各模型參數(shù)相同,似然值等于1。D值越小代表當(dāng)前特征越重要。當(dāng)加入一個(gè)新特征,D值和似然比的減小等價(jià)。當(dāng)樣本量N足夠大時(shí),似然比呈分布,因此用似然比當(dāng)作判斷某一特征的依據(jù)。加入某一特征,如果前后模型偏差值的差大于或等于某一限定值,則認(rèn)為此特征在類(lèi)的判定中有比較大的貢獻(xiàn),否則認(rèn)為此特征冗余。
本研究的特征選擇分兩部分完成特征空間維數(shù)壓縮。首先,選擇272 項(xiàng)sMRⅠ數(shù)據(jù)進(jìn)行L1-LR 方法篩選,并按照貢獻(xiàn)率大小進(jìn)行排序,并組成特征數(shù)據(jù)集;然后,在272 項(xiàng)sMRⅠ數(shù)據(jù)的基礎(chǔ)上引入年齡、性別、受教育程度、MMSE 量表評(píng)分,共276 項(xiàng)指標(biāo),再次使用L1-LR 方法篩選,組成新的特征集,得到用于訓(xùn)練分類(lèi)器的特征集合。L1-LR特征選擇的過(guò)程為:
(1)i= 1,令S=φ,R=(x1,…,xk);
(2)i=i+ 1,k*= arg minkDk,k= 1,…,‖R‖,‖R‖為集合R的勢(shì);令S=S?{xk},R=R{xk};
(3)對(duì)任何非負(fù)λ,正則化形式為L(zhǎng)(λ,β) =arg min(y-X′β)2+λP(β);其中P(β)代表正則化項(xiàng);
(4)若Di-1-Di<[]-1(0.01)循環(huán)結(jié)束;且S=S{xk*};否則執(zhí)行(2);直至選出所有最優(yōu)特征,算法結(jié)束。
A{a}代表從集合A中剔除元素a。在此算法中,兩模型D值之差可近似看作自由度為DF的χ2分布。DF 大小取決于評(píng)價(jià)的特征數(shù),限值定為0.01。當(dāng)[]-1(p)為限值p時(shí),自由度為DF的χ2分布的倒數(shù)。
1.2.2 L1-LR 分類(lèi)模型 L1-LR 模型是一種稀疏的邏輯回歸模型[11],模型是在廣泛應(yīng)用于二分類(lèi)的邏輯回歸模型[12]的損失函數(shù)中加入懲罰項(xiàng),正則化技術(shù)[13]能解決過(guò)擬合問(wèn)題,提高魯棒性,優(yōu)化模型分類(lèi)能力。在樣本數(shù)相對(duì)于樣本特征維數(shù)有點(diǎn)小的數(shù)據(jù)集中,L1-LR性能優(yōu)于其他模型。
響應(yīng)變量y∈{0,1},每次觀(guān)測(cè)的p個(gè)預(yù)測(cè)變量值表示成向量,x=[x1,x2,…,xp]對(duì)應(yīng)的響應(yīng)變量隸屬于類(lèi)別1的后驗(yàn)概率:
其中,β=(β1,β2,…,βp)為回歸模型參數(shù)。
假定存在n個(gè)訓(xùn)練樣本Dn={(xi,yi)}依據(jù)樣本數(shù)據(jù)及隸屬類(lèi)別Dn去除β,優(yōu)化損失函數(shù)為對(duì)數(shù)似然函數(shù):
依據(jù)最小絕對(duì)收縮和選擇算法的思想,在邏輯回歸的損失函數(shù)中加入對(duì)模型系數(shù)的L1 范數(shù)懲罰項(xiàng),得到L1-LR模型函數(shù):
本研究比較了另外兩種常用的二分類(lèi)模型,一種是L1 正則支持向量機(jī)(L1-Support Vector Machine,L1-SVM),是在A(yíng)D 二元分類(lèi)中最常使用的支持向量機(jī)的決定函數(shù)中加入L1 懲罰項(xiàng),試圖找到性能更好的SVM 模型[14]。另一種是梯度提升樹(shù)(Gradient Boosting Decison Tree, GBDT),是一種迭代的決策樹(shù)算法,可以靈活處理各種類(lèi)型的數(shù)據(jù),魯棒性強(qiáng)[15]。有研究指出該機(jī)器學(xué)習(xí)算法的預(yù)測(cè)準(zhǔn)確率高于SVM[16]。最后選取分類(lèi)效果最好的模型作為分類(lèi)預(yù)測(cè)模型。
本研究選擇10-折交叉驗(yàn)證(10-fold Cross-Validation)評(píng)價(jià)模型性能,可以確保進(jìn)行小樣本訓(xùn)練的實(shí)驗(yàn)結(jié)果無(wú)偏差估計(jì),確保測(cè)試精確度。具體方法是隨機(jī)將樣本分為10 份,隨機(jī)抽取9 份作為訓(xùn)練樣本,剩余1 份為測(cè)試樣本,每次試驗(yàn)L1-LR 模型后得到訓(xùn)練和測(cè)試正確率(或差錯(cuò)率),重復(fù)10次,將10次訓(xùn)練準(zhǔn)確率和測(cè)試準(zhǔn)確率的平均值作為L(zhǎng)1-LR 模型最終的分類(lèi)準(zhǔn)確率的估計(jì)。
數(shù)據(jù)由ANDⅠ數(shù)據(jù)庫(kù)(Alzheimer's Disease Neuroimaging Ⅰnitiative)提供,受試者年齡選擇55~90歲,能夠提供獨(dú)立的功能評(píng)估,排除特定的精神活性藥物。數(shù)據(jù)包括543 例的sMRⅠ腦圖像、MMSE 量表評(píng)分、年齡、性別、受教育程度這5 項(xiàng)資料。獲得NC組共139 例(男65,女74);EMCⅠ組共220 例(男119,女101);LMCⅠ組共108 例(男58,女50);AD 組共76例(男44,女32)。
sMRⅠ數(shù)據(jù)統(tǒng)一選取場(chǎng)強(qiáng)3.0T飛利浦MRⅠ掃描儀的數(shù)據(jù),BOLD序列:射頻重復(fù)時(shí)間/回波時(shí)間(TR/TE)6.8 ms/3.1 ms,翻轉(zhuǎn)角(FA)9°,視野大?。‵OV)RL204 mm、AP 240 mm、FH 256 mm;分辨率(1.0×1.0×1.2)mm3,層厚1.2 mm,共170層。
3.1.1 272項(xiàng)sMRⅠ特征組結(jié)果 首先對(duì)實(shí)驗(yàn)數(shù)據(jù)集預(yù)處理后,獲得272 項(xiàng)sMRⅠ形態(tài)學(xué)指標(biāo),使用L1-LR 特征選擇模型進(jìn)行特征提取。在分類(lèi)NC-EMCⅠ組中,272項(xiàng)sMRⅠ特征中有65個(gè)特征被挑選進(jìn)入下一步驟的L1-LR 分類(lèi)預(yù)測(cè)模型;同樣的,在對(duì)NC-LMCⅠ、NC-AD、EMCⅠ-LMCⅠ、EMCⅠ-AD、LMCⅠ-AD 分類(lèi)中,分別有37、22、52、38、41 個(gè)特征進(jìn)入L1-LR 分類(lèi)模型。特征選擇結(jié)果按對(duì)分類(lèi)的組別貢獻(xiàn)由大到小依次給出,顯示貢獻(xiàn)最大的前10項(xiàng)特征,見(jiàn)表1。
表1 272項(xiàng)sMRI特征中最重要的前10項(xiàng)特征Tab.1 Top 10 important features of 272 sMRI features
3.1.2 276項(xiàng)特征結(jié)果 為進(jìn)一步增強(qiáng)分類(lèi)準(zhǔn)確率,本研究在272項(xiàng)形態(tài)學(xué)指標(biāo)的基礎(chǔ)上,再引入不同模態(tài)的3項(xiàng)人口學(xué)指標(biāo)和1項(xiàng)MMSE量表評(píng)分。在NC-EMCⅠ、NC-LMCⅠ、NC-AD、EMCⅠ-LMCⅠ、EMCⅠ-AD、LMCⅠ-AD分類(lèi)中,分別有67、42、11、56、21、20個(gè)特征進(jìn)入L1-LR分類(lèi)模型。這里同樣顯示前10貢獻(xiàn)率的指標(biāo),見(jiàn)表2。
表2 276項(xiàng)特征中最重要的前10項(xiàng)特征Tab.2 Top 10 important features of 276 features
3.1.3 特征選擇結(jié)果分析 272項(xiàng)結(jié)果中,只測(cè)試形態(tài)學(xué)指標(biāo)sMRⅠ時(shí),在識(shí)別NC-EMCⅠ、NC-AD、EMCⅠ-AD、LMCⅠ-AD 分組時(shí),TA-左顳橫回對(duì)判斷處于哪個(gè)病程階段最為重要,顳橫回為聽(tīng)覺(jué)皮質(zhì)區(qū),在A(yíng)D 疾病進(jìn)程中,聽(tīng)覺(jué)的不斷弱化是判斷病程的重要依據(jù)。NC-LMCⅠ組中,SA-左顳下回占分類(lèi)決策的權(quán)重最大,顳下回負(fù)責(zé)學(xué)習(xí)和記憶,在進(jìn)展為L(zhǎng)MCⅠ的時(shí)候,病人的學(xué)習(xí)記憶表現(xiàn)出更多差異;在EMCⅠ-LMCⅠ病程很接近難以區(qū)分的組中,CV-左扣帶回后部起最重要的作用,后扣帶回參與情感和自我評(píng)價(jià)功能,說(shuō)明在EMCⅠ進(jìn)化為L(zhǎng)MCⅠ的過(guò)程中,病人的情感和自我評(píng)價(jià)功能有較明顯的差別。值得注意的是,除了EMCⅠ-LMCⅠ組,其余組HS-左右海馬前下托都可作為一個(gè)很重要特征去識(shí)別分類(lèi),尤其是HS-右海馬前下托貢獻(xiàn)更大,而海馬與近期記憶有關(guān),海馬體積變化發(fā)生在疾病進(jìn)展全程,說(shuō)明記憶障礙體現(xiàn)在從發(fā)病開(kāi)始持續(xù)到AD階段。
276項(xiàng)結(jié)果中,在引入MMSE量表評(píng)分、年齡、性別、受教育程度后,特征選擇結(jié)果改變,特征貢獻(xiàn)率也發(fā)生變化,其中MMSE 量表評(píng)分作為非常重要的特征用于識(shí)別各階段的疾病,臨床上可將MMSE 視為必不可少的依據(jù),以提高診斷準(zhǔn)確率。年齡和受教育程度是影響NC-EMCⅠ、NC-LMCⅠ、EMCⅠ-LMCⅠ、EMCⅠ-AD、LMCⅠ-AD 疾病進(jìn)展的重要因素。在NCAD 識(shí)別中,性別因素占很大比重,但年齡因素被剔除,說(shuō)明性別差異導(dǎo)致男女患AD 的可能性不同,在決定一個(gè)人患AD 可能性大小的時(shí)候,性別比年齡因素更重要。
比較L1-LR、L1-SVM、GBDT的分類(lèi)準(zhǔn)確率,分別是(85.93±2.53)%、(80.73±4.89)%、(71.77±6.79)%。結(jié)果顯示L1-LR 具有更好的分類(lèi)效果。本研究選擇L1-LR作為分類(lèi)預(yù)測(cè)AD病程的模型。
為了進(jìn)一步提高分類(lèi)準(zhǔn)確率,本研究在272 項(xiàng)sMRⅠ特征的基礎(chǔ)上引入年齡、性別、受教育年限、MMSE 評(píng)分;經(jīng)特征選擇后,構(gòu)建另一個(gè)L1-LR 分類(lèi)預(yù)測(cè)模型。比較兩種不同特征集合的分類(lèi)效果,結(jié)果如表3、表4所示。
表3 基于兩種特征數(shù)據(jù)集的分類(lèi)準(zhǔn)確率(%)Tab.3 Classification accuracy based on two different feature datasets(%)
表4 基于兩種特征數(shù)據(jù)集的敏感度、特異性、AUC值Tab.4 Sensitivity,specificity and AUC values based on two different feature datasets
相比272 項(xiàng)特征組模型,276 項(xiàng)特征組L1-LR 分類(lèi)模型在識(shí)別NC-EMCⅠ、NC-LMCⅠ、NC-AD、EMCⅠ-LMCⅠ、EMCⅠ-AD、LMCⅠ-AD 組分類(lèi)準(zhǔn)確率依次提高2.92%、3.14%、11.42%、0.89%、6.07%、4.91%。尤其在早期識(shí)別EMCⅠ、LMCⅠ和AD 時(shí),準(zhǔn)確率高達(dá)94.28%、91.24%,同時(shí)在區(qū)分難以鑒別的EMCⅠ和LMCⅠ時(shí)也可以達(dá)到82.93%的準(zhǔn)確率。結(jié)合引入的4 項(xiàng)特征后,特征選擇中年齡、性別、受教育年限、MMSE 量表評(píng)分占很大貢獻(xiàn)率,分類(lèi)預(yù)測(cè)準(zhǔn)確率的提高,說(shuō)明在實(shí)際臨床診斷時(shí)這幾項(xiàng)指標(biāo)可以看作很重要的輔助診斷病程階段因素,尤其是MMSE 量表評(píng)分的評(píng)價(jià)。
用受試者工作特征(Receiver Operating Characteristic,ROC)曲線(xiàn)下面積(AUC)評(píng)估兩種特征集的分類(lèi)性能,AUC值越大,分類(lèi)性能越好。圖1為兩種特征集的ROC曲線(xiàn)圖(0、1、2、3分別代表NC組、EMCⅠ組、LMCⅠ組、AD組)。圖1a為基于L1-LR的272項(xiàng)特征集的ROC曲線(xiàn)下面積,為0.925 9±0.386 2;圖1b為基于L1-LR的276項(xiàng)特征集的ROC曲線(xiàn)下面積,為0.953 2±0.475 4,從圖中看出后者有更好的分類(lèi)性能。
圖1 兩種特征數(shù)據(jù)集的ROC曲線(xiàn)Fig.1 Receiver operating characteristic curves of two different feature datasets
以往AD分類(lèi)研究一般只指出大腦哪些區(qū)域發(fā)生病變,本研究不僅發(fā)現(xiàn)識(shí)別分組時(shí)的關(guān)鍵特征,還發(fā)現(xiàn)關(guān)鍵病變部位是體積或面積的變化,更有助于預(yù)測(cè)病程進(jìn)展方向。本研究發(fā)現(xiàn)識(shí)別各組的特征集中在海馬體、海馬旁回、扣帶回、大部分顳葉、島葉、梭狀回。其中NC-MCⅠ變化集中發(fā)生在海馬下托、海馬旁回、海馬前下托、上中下顳回、杏仁核、扣帶回、梭狀回、島葉;MCⅠ-AD變化主要集中在海馬體、海馬旁回、前扣帶回,其中左右海馬體積變化和海馬亞區(qū)體積變化更為明顯。已有研究發(fā)現(xiàn)在NC發(fā)展為MCⅠ的過(guò)程,主要是負(fù)責(zé)認(rèn)知功能的海馬體和顳葉的萎縮,MCⅠ發(fā)展為AD的過(guò)程,認(rèn)知進(jìn)一步下降,同時(shí)負(fù)責(zé)行為障礙和生活能力的前扣帶回萎縮更嚴(yán)重[17-18]。本研究的研究重點(diǎn)是對(duì)NC-EMCⅠ、EMCⅠ-LMCⅠ和LMCⅠ-AD組的識(shí)別,除了與已有研究一致的腦部形態(tài)學(xué)變化之外,本研究還發(fā)現(xiàn)僅在某個(gè)分組中的特征變化有助于預(yù)測(cè)病程判斷,在臨床判斷該組分類(lèi)時(shí)評(píng)價(jià)這些指標(biāo)更有識(shí)別度和價(jià)值。SA-左島葉、SA-左額上回、TA-右額中回下部、TA-左中央后回、TA-右扣帶回后部、CV-右眶回、TA-右眶回、SA-右額眶回外側(cè)、SA-左額中回后部、CV-左海馬旁回、CV-左島葉、SV-右脈絡(luò)叢、SA-右額上回、CV-右枕葉外側(cè)部、CV-左眶回、TA-左扣帶回峽部、SA-左海馬旁回部位的變化僅在判斷NC-EMCⅠ分類(lèi)時(shí)占有較大貢獻(xiàn)率;而CV-左扣帶回后部、CV-左額上回、SV-左側(cè)小腦白質(zhì)、SA-左中央旁小葉、CV-右中央后回、SV-幕上、TA-左額中回后部、CV-右扣帶回后部、CV-右三角部、SA-右顳上回、TA-左額上回、CV-右額中回下部、CV-左額中回后部、TA-右楔前葉的變化只發(fā)生在EMCⅠ與LMCⅠ的分類(lèi)中。CV-顳極、CV-右島蓋、TA-左右中央前回、CV-右楔前葉、SV-右丘腦、SA-右中央前回、TA-左額眶回外側(cè)的變化在EMCⅠ到AD的過(guò)程中發(fā)生得更明顯。MMSE量表評(píng)分是很重要的影響診斷的因素,臨床工作務(wù)必認(rèn)真準(zhǔn)確測(cè)評(píng)量表;另外,年齡和受教育年限、性別也作為重要影響因素影響疾病進(jìn)展。
本研究比較了3種常用機(jī)器學(xué)習(xí)方法,提出了一種基于sMRⅠ圖像的AD及前驅(qū)階段的自動(dòng)識(shí)別分類(lèi)模式,結(jié)果證明L1-LR分類(lèi)器可以作為臨床輔助診斷AD病程的有效工具。實(shí)驗(yàn)采用sMRⅠ數(shù)據(jù)+年齡+性別+受教育年限+MMSE量表評(píng)分特征集實(shí)現(xiàn)最優(yōu)分類(lèi)精度,能實(shí)現(xiàn)早期識(shí)別,起到阻礙病程進(jìn)展的作用,提高輔助診斷系統(tǒng)的準(zhǔn)確率。本研究在NC-AD組中達(dá)到97.66%的準(zhǔn)確率,明顯高于Bi 等[14]利用支持向量機(jī)得到的94.44%的準(zhǔn)確率和楊晨暉[19]應(yīng)用隨機(jī)森林得到的93%的準(zhǔn)確率。在MCⅠ-AD的識(shí)別中平均準(zhǔn)確率為92.76%,高于A(yíng)rdekani等[20]基于多模態(tài)隨機(jī)森林獲得的82.3%的準(zhǔn)確率,Bi等[14]的研究也僅達(dá)88.73%。NC-MCⅠ組中,本實(shí)驗(yàn)達(dá)到89.38%的平均準(zhǔn)確率,Bi等[14]的研究?jī)H有81.45%。在與本文數(shù)據(jù)類(lèi)型相似的研究中,齊雪丹[21]比較了支持向量機(jī)、隨機(jī)森林、決策樹(shù)、K近鄰對(duì)AD做分類(lèi)預(yù)測(cè),NC-EMCⅠ、NC-LMCⅠ、NC-AD、EMCⅠ-LMCⅠ、EMCⅠ-AD、LMCⅠ-AD 組識(shí)別最高準(zhǔn)確率為77.78%、88.00%、96.45%、81.82%、90.00%、84.21%,本研究中使用的L1-LR模型準(zhǔn)確率在各分組分別提高9.16%、3.87%、1.21%、1.11%、4.28%、7.06%,且與之不同的是,本研究還將人口學(xué)指標(biāo)和MMSE量表評(píng)分引入模型。并且本研究提出的L1-LR分類(lèi)器僅需檢測(cè)sMRⅠ,獲取人口統(tǒng)計(jì)學(xué)指標(biāo)和測(cè)評(píng)MMSE量表即可,具有經(jīng)濟(jì)實(shí)惠的社會(huì)效益。
sMRⅠ是AD進(jìn)行分類(lèi)研究的基礎(chǔ),本研究的后續(xù)將通過(guò)增加認(rèn)知評(píng)價(jià)、人口統(tǒng)計(jì)學(xué)資料、正電子發(fā)射型計(jì)算機(jī)斷層顯像、功能性磁共振成像、腦脊液檢查等數(shù)據(jù)類(lèi)型形成多模態(tài)數(shù)據(jù),同時(shí)加大實(shí)驗(yàn)數(shù)據(jù)量,以獲得更高精度、更穩(wěn)定的分類(lèi)器用于預(yù)測(cè)AD病程分類(lèi),以期達(dá)到延緩疾病進(jìn)展、提高生活質(zhì)量、減輕國(guó)家和個(gè)人負(fù)擔(dān)的目標(biāo)。