谷翔,彭明洋,陳宇辰,殷信道,陳國(guó)中,任軍*
帕金森?。≒arkinson's disease, PD)作為神經(jīng)退行性疾病的第二常見疾病,其患病率隨著年齡的增長(zhǎng)而增加,致使患者的生活質(zhì)量下降、死亡率增加[1]。因此,早期準(zhǔn)確診斷PD并進(jìn)行相應(yīng)的干預(yù)至關(guān)重要。然而,PD 的臨床表現(xiàn)具有較大的異質(zhì)性,臨床早期準(zhǔn)確診斷困難。研究顯示PD 的特征是黑質(zhì)神經(jīng)元的缺失[2]。神經(jīng)成像尤其是磁敏感加權(quán)成像(susceptibility-weighted imaging, SWI)可評(píng)估黑質(zhì)神經(jīng)元的損失[3-5]。燕尾征消失,即在SWI上健康的黑質(zhì)體消失,已被證明是診斷PD 的影像征象[6-7]。然而,由于較低的特異性和準(zhǔn)確性及較強(qiáng)的主觀性,使其臨床應(yīng)用受到限制。影像組學(xué)可從影像中提取肉眼無法識(shí)別的高通量信息,為臨床決策提供準(zhǔn)確信息[8-9]。本研究擬基于SWI 圖像提取黑質(zhì)影像組學(xué)特征,并應(yīng)用機(jī)器學(xué)習(xí)方法,構(gòu)建PD 的診斷模型,并與人工識(shí)別的燕尾征診斷PD 進(jìn)行比較,旨在達(dá)到早期準(zhǔn)確診斷PD的目的。
回顧性分析2020 年1 月至2023 年1 月在南京市第一醫(yī)院接受腦部MRI(包括SWI 序列)的PD 早期患者的臨床及影像資料。所有患者均符合英國(guó)帕金森病學(xué)會(huì)腦庫(kù)帕金森病臨床診斷標(biāo)準(zhǔn),且Hoehn-Yahr分期為0~2 期[10]。有其他神經(jīng)和精神疾病史以及繼發(fā)性或非典型PD 的患者排除在外。同時(shí)招募年齡和性別匹配的健康受試者作為對(duì)照,所有健康受試者均接受相同的腦部MRI(包括SWI 序列)。本研究遵守《赫爾辛基宣言》,經(jīng)南京市第一醫(yī)院倫理委員會(huì)批準(zhǔn),批準(zhǔn)文號(hào):2022-664,所有患者及健康受試者均已簽署知情同意書。最終共納入80 例PD 患者和80 例健康受試者。將PD 患者和健康受試者按7∶3 的比例隨機(jī)分為訓(xùn)練組(n=112)和測(cè)試組(n=48)。
采用西門子3.0 T MRI(Magnetom Prisma,Siemens Healthineer)掃描設(shè)備。掃描序列包括T1WI、T2WI、SWI。SWI 掃描參數(shù)如下:TR 27 ms,TE 20 ms,翻轉(zhuǎn)角15°,F(xiàn)OV 220 mm×220 mm,層厚2 mm,層面內(nèi)分辨率0.9 mm×0.9 mm×2.0 mm。
燕尾征表現(xiàn)為在SWI 序列上高信號(hào)結(jié)構(gòu),呈線性、逗號(hào)或楔形,兩側(cè)以低信號(hào)結(jié)構(gòu)(緊密部黑質(zhì)和內(nèi)側(cè)丘系)為邊界[11]。由2名具有10年工作經(jīng)驗(yàn)的神經(jīng)放射學(xué)診斷醫(yī)師采用雙盲法對(duì)患者和受試者的SWI 評(píng)估是否存在燕尾征,雙側(cè)不存在、單側(cè)不存在或微弱存在則認(rèn)為燕尾征消失判定為PD,雙側(cè)存在則認(rèn)為燕尾征陽(yáng)性判定為健康受試者,評(píng)估結(jié)果存在分歧時(shí)由另一位具有20年工作經(jīng)驗(yàn)的神經(jīng)放射學(xué)診斷醫(yī)師共同協(xié)定。
1.4.1 感興趣區(qū)勾畫
使用ITK-SNAP 軟件(版本3.4.0,http://www.itksnap.org)逐層手動(dòng)勾畫SWI 兩側(cè)黑質(zhì)區(qū)作為感興趣區(qū)(volume of interests, VOIs)(圖1)。由上述1 名具有10 年工作經(jīng)驗(yàn)的神經(jīng)放射學(xué)診斷醫(yī)師進(jìn)行VOIs的勾畫,并由上述另一名具有10年工作經(jīng)驗(yàn)的神經(jīng)放射學(xué)診斷醫(yī)師進(jìn)行核對(duì);(2)特征提取及篩選:使用PyRadiomics 軟件(version: 3.0.1,https://pyradiomics.readthedocs.io/en/latest/)提取特征。影像組學(xué)特征包含形態(tài)學(xué)特征、一階特征(first order)和紋理特征等共1132個(gè)特征。采用最小絕對(duì)收縮與選擇算子(least absolute shrinkage and selection operator, LASSO)選取與PD 密切相關(guān)的影像組學(xué)特征。LASSO 通過構(gòu)造懲罰函數(shù)得到一個(gè)較為精練的模型,壓縮一些回歸系數(shù),并設(shè)定一些回歸系數(shù)為零。采用10倍交叉驗(yàn)證對(duì)模型參數(shù)進(jìn)行最優(yōu)化。
圖1 磁敏感加權(quán)成像黑質(zhì)感興趣區(qū)勾畫示意圖。1A~1B:帕金森病患者黑質(zhì)感興趣區(qū)勾畫,左側(cè)燕尾征消失(箭)(1A);1C~1D:健康受試者黑質(zhì)感興趣區(qū)勾畫,雙側(cè)燕尾征存在(1C)。Fig.1 Schematic diagram of volumes of interest delineation of substantia nigra on susceptibility-weighted imaging (SWI) images.1A-1B: The volumes of interest delineation of substantia nigra on SWI images in Parkinson's disease patients, absence of the swallow tail sign in the left side (arrow) (1A).1C-1D: The volumes of interest delineation of substantia nigra on SWI images in the health controls, normal swallow tail sign on both sides (1C).
應(yīng)用5 個(gè)常見的分類器[支持向量機(jī)(support vector machine, SVM)、邏輯回歸(logistic regression,LR)、隨 機(jī) 森 林(random forest, RF)、貝 葉 斯(Bayesian, Bayes)、K 近 鄰(K-nearest neighbor,KNN)]對(duì)篩選的特征進(jìn)行機(jī)器學(xué)習(xí),構(gòu)建模型。每個(gè)模型構(gòu)建100 次,并計(jì)算相應(yīng)的100 個(gè)曲線下面積(area under the curve, AUC)。使用以下公式計(jì)算相對(duì)標(biāo)準(zhǔn)差(relative standard deviations,RSD):
其中σAUC 表示100 個(gè)AUC 值的標(biāo)準(zhǔn)差,μAUC 是這100 個(gè)AUC 值的平均值。RSD 越小,模型越穩(wěn)定。在上述過程中,選擇最穩(wěn)定的模型(AUC的RSD值最小的模型)作為最終模型,并在測(cè)試集中進(jìn)行驗(yàn)證。
統(tǒng)計(jì)學(xué)分析均使用R 軟件(4.0.3 版)。應(yīng)用Kolmogorov-Smimov 檢驗(yàn)計(jì)量資料是否符合正態(tài)分布,正態(tài)分布的計(jì)量資料以均數(shù)±標(biāo)準(zhǔn)差表示并用獨(dú)立樣本t檢驗(yàn)分析;計(jì)數(shù)資料采用例(%)表示并用卡方檢驗(yàn)分析。應(yīng)用Kappa 一致性檢驗(yàn)評(píng)估觀察者間的一致性。應(yīng)用pROC 軟件包進(jìn)行ROC 曲線分析。應(yīng)用AUC、準(zhǔn)確度、敏感度、特異度等評(píng)價(jià)指標(biāo)評(píng)估模型。人工識(shí)別與機(jī)器學(xué)習(xí)模型效能間比較采用DeLong檢驗(yàn)。P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
共160例研究對(duì)象納入分析,經(jīng)人工識(shí)別為PD的對(duì)象為60例(PD組),正常受試者為100例(對(duì)照組),觀察者間一致性為k=0.80(95%CI: 0.76-0.83)。在訓(xùn)練集和測(cè)試集中,PD 組與對(duì)照組組間性別、年齡差異均無明顯統(tǒng)計(jì)學(xué)意義(P>0.05)(表1)。ROC 曲線分析顯示人工識(shí)別燕尾征診斷PD 的AUC 為0.750,敏感度和特異度分別為67.9%、82.1%(表2)。
表1 PD組和對(duì)照組的臨床基線資料比較Tab.1 Comparison of basic clinical data between PD and controls group
表2 人工識(shí)別和五種機(jī)器學(xué)習(xí)方法診斷PD的效能Tab.2 Efficacy of visual analysis and five machine learning methods in diagnosing PD
SWI黑質(zhì)區(qū)共提取的1132個(gè)特征經(jīng)方差分析+秩和檢驗(yàn)后剩下172 個(gè),Spearman 相關(guān)性檢驗(yàn)后剩下37個(gè),最后使用LASSO降維后選擇的特征數(shù)為7個(gè),包含2個(gè)形態(tài)學(xué)特征、1個(gè)一階特征、2個(gè)灰度共生矩陣特征(gray-level co-occurrence matrix, GLCM)、1 個(gè)灰度尺寸區(qū)域矩陣(gray-level size zone matrix,GLSZM)、1 個(gè)灰度相關(guān)矩陣(gray-level dependence matrix, GLDM)。影像組學(xué)特征的LASSO 邏輯回歸、系數(shù)分布及最佳特征見圖2。
圖2 影像組學(xué)特征最小絕對(duì)收縮與選擇算子算法(LASSO)邏輯回歸、系數(shù)分布及最佳特征圖。2A:LASSO模型中的調(diào)諧參數(shù)通過最小標(biāo)準(zhǔn)使用十倍交叉驗(yàn)證選擇。繪制曲線下面積與log (λ)的關(guān)系,根據(jù)最小準(zhǔn)則和最小準(zhǔn)則的1標(biāo)準(zhǔn)誤差,在最優(yōu)值處繪制虛線;2B:在最佳λ值處繪制一條垂直線;2C:LASSO篩選后與帕金森病相關(guān)的特征及加權(quán)系數(shù)。Fig.2 Radiomics feature selection using least absolute shrinkage and selection operator (LASSO) logistic regression, LASSO coefficient profiles of the radiomics features and the optimum radiomics.2A: The tuning parameters in the LASSO model are selected using 10-fold cross-validation via minimum criteria.The area under the curve is plotted vs.log(λ).Dotted vertical lines are drawn at the optimal values according to the minimum criteria and the 1 standard error of the minimum criteria; 2B: A vertical line is plotted at the optimal λ value; 2C: The detailed features associated with Parkinson's disease and the weighting coefficients of different datasets after LASSO screening.
基于所得的最佳影像組學(xué)特征構(gòu)建PD的診斷模型。五種機(jī)器學(xué)習(xí)的診斷效能見表2。在訓(xùn)練集中,LR 模型的診斷效能最好,AUC 為0.975,敏感度為94.4%、特異度為97.6%、準(zhǔn)確度為95.6%。此外,用不同機(jī)器學(xué)習(xí)方法評(píng)估模型的穩(wěn)定性,LR 模型最穩(wěn)定(AUC的RSD為4%)。在測(cè)試集中,選擇診斷效能做好、穩(wěn)定性最高的LR模型作為最終的驗(yàn)證模型,其診斷PD的AUC 為0.938,敏感度為83.3%、特異度為95.8%、準(zhǔn)確度為89.6%。經(jīng)DeLong檢驗(yàn)后,其診斷效能明顯優(yōu)于人工識(shí)別(Z=2.241,P=0.025)(表2,圖3)。
圖3 測(cè)試集中邏輯回歸模型和人工識(shí)別診斷帕金森病的ROC曲線。Fig.3 ROC curve of test set for diagnosing Parkinson's disease using logistic regression model and visual analysis in the test set.
本研究對(duì)80 例PD 患者和80 例健康受試者的SWI 圖像上黑質(zhì)區(qū)域進(jìn)行影像組學(xué)特征提取、篩選,共篩選出與PD 密切相關(guān)的7 個(gè)影像組學(xué)特征,包含2 個(gè) 形 態(tài) 學(xué) 特 征、1 個(gè) 一 階 特 征、2 個(gè)GLCM、1 個(gè)GLSZM、1 個(gè)GLDM。經(jīng)5 種機(jī)器學(xué)習(xí)方法建模后,結(jié)果顯示LR 模型診斷PD 的效能最好且最穩(wěn)定,且明顯優(yōu)于人工識(shí)別燕尾征的診斷效能。本研究結(jié)果可有效克服由于人工識(shí)別的主觀性帶來的低敏感度和低準(zhǔn)確度。通過構(gòu)建的模型可使臨床醫(yī)生能夠通過模型快速準(zhǔn)確地診斷PD,進(jìn)而進(jìn)行早期臨床干預(yù)治療。
PD 的病因目前尚不清楚,但黑質(zhì)在其神經(jīng)病理學(xué)中具有重要的作用,研究顯示PD 中黑質(zhì)多巴胺能神經(jīng)元缺失[12-13]。Nigrosome-1 在SWI 上黑質(zhì)的尾部顯示為兩個(gè)低信號(hào),中間為高信號(hào),在SWI 或T2WI 上顯示為燕尾征[14-16]。因此,以往的研究顯示[17-20],燕尾征的缺失可有助于將PD 患者與健康受試者區(qū)分開。BLAZEJEWSKA 等[21]在7 T MRI 高分辨率T2*加權(quán)序列上描述了原本低強(qiáng)度的黑質(zhì)致密部后外側(cè)區(qū)域內(nèi)的高信號(hào)線性區(qū)域,即Nigrosome-1,而在10 名PD 患者中沒有看到。SCHWARZ等[22]在3 T MRI上描述了與高分辨率T2*加權(quán)序列上的燕尾征消失類似的結(jié)構(gòu)。該研究主要包括非PD 參與者,與對(duì)照組中燕尾征消失的存在相比,PD 患者中STS 缺失的敏感度(100%)、特異度(97%)和準(zhǔn)確度(96%)非常高。COSOTTINI 等[23]的一項(xiàng)研究顯示3 T MRI 的平均敏感度為79%,特異度為94%,診斷準(zhǔn)確度為86%。本研究基于SWI 的燕尾征消失診斷PD,在訓(xùn)練集中的敏感度為67.9%、特異度為82.1%、準(zhǔn)確度為75.0%;在測(cè)試集中的敏感度為70.8%、特異度為83.3%、準(zhǔn)確度為77.1%,其診斷效能稍低于以往研究。可能原因?yàn)楸狙芯考{入的PD患者均為早期患者(Hoehn-Yahr 分期為0~2 期),黑質(zhì)改變不明顯,導(dǎo)致醫(yī)生通過燕尾征消失診斷PD 的準(zhǔn)確性相對(duì)較低。由此可見,由于存在主觀性強(qiáng)、一致性較低、診斷準(zhǔn)確度相對(duì)較低的局限性,目前基于燕尾征消失診斷PD在臨床應(yīng)用中仍受限。
影像組學(xué)目前已廣泛應(yīng)用于醫(yī)學(xué)研究中,與以往的研究類似[24-25],本研究也使用了影像組學(xué)的方法來提取并構(gòu)建PD 的診斷模型。SHU 等[26]從SWI 圖像上的黑質(zhì)區(qū)域提取影像組學(xué)特征,可一定程度上反映PD的Hoehn-Yahr分期。本研究通過從SWI圖像上勾畫黑質(zhì)區(qū)域并提取特征進(jìn)行篩選,發(fā)現(xiàn)2個(gè)形態(tài)學(xué)特征、1 個(gè)一階特征、2 個(gè)GLCM、1 個(gè)GLSZM、1 個(gè)GLDM與PD 診斷密切相關(guān),具有較高的加權(quán)系數(shù)。本研究進(jìn)一步應(yīng)用5 種分類器方法構(gòu)建PD 的診斷模型。不同的分類器模型在PD 的診斷中具有不同的效能,本研究顯示LR 模型的診斷效能優(yōu)于其他分類器方法。二進(jìn)制的LR是一種基于一個(gè)或多個(gè)自變量估計(jì)二進(jìn)制響應(yīng)概率的傳統(tǒng)方法,提供的不是離散輸出,而是與每個(gè)觀測(cè)相關(guān)的概率[27-29]。此外,本研究發(fā)現(xiàn)LR模型是所有診斷模型中最穩(wěn)定的。因此,本研究選擇LR 作為最終分類器,并用測(cè)試集進(jìn)行驗(yàn)證。結(jié)果顯示LR 模型在測(cè)試集中仍然具有較好的診斷效能,并明顯優(yōu)于人工識(shí)別燕尾征消失診斷PD的效能。由此可見,與傳統(tǒng)的人工識(shí)別相比,基于LR分類器構(gòu)建的PD 診斷模型臨床適用性,且避免了人工識(shí)別主觀性強(qiáng)、診斷準(zhǔn)確度低的局限性。
本研究仍存在一些不足之處。首先,本研究為單中心研究,且樣本量較少。其次,本研究?jī)H根據(jù)影像方法進(jìn)行診斷,未納入臨床量表。此外,本研究?jī)H提取了SWI圖像上的影像組學(xué)特征,后期需進(jìn)一步加入T1WI、T2WI等其他序列的特征,以期進(jìn)一步提高PD的診斷效能。最后,本研究未做外部驗(yàn)證。
綜上所述,基于SWI 黑質(zhì)的影像組學(xué)特征,應(yīng)用機(jī)器學(xué)習(xí)方法構(gòu)建的PD診斷模型能夠較為準(zhǔn)確地診斷PD,為臨床早期干預(yù)治療提供指導(dǎo)。
作者利益沖突聲明:全體作者均聲明無利益沖突。
作者貢獻(xiàn)聲明:任軍設(shè)計(jì)本研究的方案,對(duì)稿件重要內(nèi)容進(jìn)行了修改;谷翔起草和撰寫稿件,獲取、分析或解釋本研究的數(shù)據(jù);彭明洋、陳宇辰、殷信道、陳國(guó)中獲取、分析或解釋本研究的數(shù)據(jù),對(duì)稿件重要內(nèi)容進(jìn)行了修改,其中殷信道獲得了江蘇省自然科學(xué)基金的資助;陳國(guó)中獲得了國(guó)家自然科學(xué)基金的資助;全體作者都同意發(fā)表最后的修改稿,同意對(duì)本研究的所有方面負(fù)責(zé),確保本研究的準(zhǔn)確性和誠(chéng)信。