馬立勇,董夢(mèng)超,李廣涵,劉 健,武敬平,陸海濤,鄒古明,卓 莉,牟 姍,鄭 敏*
[1.哈爾濱工業(yè)大學(xué)(威海)信息科學(xué)與工程學(xué)院,山東 威海 264209;2.中日友好醫(yī)院超聲醫(yī)學(xué)科,3.腎病科,北京 100029;4.上海交通大學(xué)醫(yī)學(xué)院附屬仁濟(jì)醫(yī)院腎臟科,上海 200127]
腎臟疾病臨床常見,人群患病率較高。超聲剪切波彈性成像(shear wave elastography, SWE)屬非侵入性影像學(xué)技術(shù),通過測(cè)量腎臟組織的剪切波速度而得到評(píng)估其彈性的楊氏模量參數(shù)。目前認(rèn)為組織彈性與其病理狀態(tài)相關(guān)。腎臟硬度與腎臟纖維化之間存在顯著相關(guān)性,利用SWE可準(zhǔn)確檢出腎小球硬化和腎間質(zhì)纖維化所致腎損傷[1],通過測(cè)量硬度能反映腎實(shí)質(zhì)病理變化[2],為診斷腎臟疾病提供了一種補(bǔ)充性的檢查方法[3]。既往研究[4-7]表明SWE測(cè)量的腎臟硬度與病理所見間質(zhì)纖維化高度相關(guān),且對(duì)檢出IgA腎病具有高度特異性和敏感性[4]。研究[8]表明腎皮質(zhì)的彈性模量對(duì)于診斷早期糖尿病具有重要價(jià)值,且與慢性腎病呈正相關(guān)[9];彈性成像并可用于評(píng)估兒童慢性腎病[10],提示SWE能夠輔助診斷腎病。目前已有研究采用支持向量機(jī)方法結(jié)合B模超聲圖像和SWE建立預(yù)測(cè)腎疾病的模型[11]。
深度學(xué)習(xí)(deep learning, DL)是一種人工智能技術(shù),卷積神經(jīng)網(wǎng)絡(luò)則是最為成熟的DL方法之一,通過從圖像到結(jié)果完成端到端學(xué)習(xí),建立有效的分類模型[12-14]。與其他神經(jīng)網(wǎng)絡(luò)方法不同,卷積神經(jīng)網(wǎng)絡(luò)可自動(dòng)提取最能實(shí)現(xiàn)有效分類的特征并加以利用,高效完成分類任務(wù),在分析醫(yī)學(xué)圖像和輔助診斷方面取得了巨大成功,并已用于輔助診斷腎臟疾病[14-15]。本研究前瞻性采用卷積神經(jīng)網(wǎng)絡(luò)建立腎臟疾病預(yù)測(cè)模型,并比較其與其他機(jī)器學(xué)習(xí)方法的效能。
1.1 一般資料 收集2019年6月—12月于中日友好醫(yī)院接受腎穿刺活檢患者,排除單側(cè)腎臟、腎盂積水、腎臟腫瘤、合并其他嚴(yán)重疾病或無法完成超聲彈性成像檢查者,最終94例入組(病例組),其中男60例,女34例,年齡24~69歲,平均(42.1±13.1)歲;病理分類包括原發(fā)腎小球腎炎53例、繼發(fā)腎小球腎炎28例及腎小管間質(zhì)病變13例。同期招募109名健康志愿者(對(duì)照組),男59名,女50名,年齡21~72歲,平均(52.9±15.0)歲。本研究經(jīng)中日友好醫(yī)院倫理委員會(huì)批準(zhǔn)。
1.2 儀器與方法
1.2.1 數(shù)據(jù)集 按照4∶1將2組受檢者分為訓(xùn)練集和測(cè)試集。訓(xùn)練集包括病例組75例和對(duì)照組87名,將其超聲彈性參數(shù)用于DL方法訓(xùn)練。測(cè)試集包括病例組19例和對(duì)照組22名,采用不同模型預(yù)測(cè)其彈性參數(shù),根據(jù)結(jié)果對(duì)比各模型預(yù)測(cè)性能。
1.2.2 SWE參數(shù)獲取 由一名具有5年以上超聲腹部診斷和彈性成像操作經(jīng)驗(yàn)的醫(yī)師于腎穿刺活檢前采用Mindray昆侖Resona 8多普勒彩色超聲診斷儀,C6-1探頭,頻率1.5~6 MHz行SWE。囑受檢者俯臥或側(cè)臥,探頭與腎臟包膜相垂直,保持ROI區(qū)域大小一致,囑受檢者屏息,待ROI內(nèi)部顏色充滿且均勻、彈性圖像穩(wěn)定后,依次測(cè)量雙側(cè)腎皮質(zhì)、髓質(zhì)和腎竇部的剪切波速度,每個(gè)部位最少測(cè)量3次,取中位數(shù)為剪切波數(shù)值,共得到6個(gè)測(cè)量值。見圖1。
圖1 獲取腎臟超聲彈性成像參數(shù)示意圖
1.2.3 卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型 每個(gè)樣本的輸入為由6個(gè)彈性模量組成的向量。為充分發(fā)掘數(shù)據(jù)之間的關(guān)系,采用一維卷積神經(jīng)網(wǎng)絡(luò)方法構(gòu)建KDnet模塊,見圖2;由該模塊以6種不同參數(shù)的卷積和批正則化(batch normalization, BN)層處理輸入的一維向量之后加以合并,結(jié)果仍為一維向量。采用3個(gè)KDnet模塊依次連接構(gòu)成卷積神經(jīng)網(wǎng)絡(luò),經(jīng)DropOut層后進(jìn)入全連接網(wǎng)絡(luò)(fully connected layers, FC)得到分類輸出,見圖3。
圖2 KDnet塊的網(wǎng)絡(luò)架構(gòu) 經(jīng)多個(gè)卷積和BN處理輸入通道數(shù)為Cin的一維向量,之后合并得到通道數(shù)為Cout的一維向量
圖3 卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)架構(gòu) 經(jīng)過多個(gè)KDnet模塊處理一維向量后,通過FC層得到結(jié)果
DL模型采用Python 3.7和PyTorch 1.3.1實(shí)現(xiàn),使用隨機(jī)梯度下降(stochastic gradient descent, SGD)優(yōu)化器、分類交叉熵?fù)p失訓(xùn)練網(wǎng)絡(luò)模型,設(shè)置批處理量為32,初始學(xué)習(xí)率為0.002, DropOut層的比率為0.8,當(dāng)驗(yàn)證數(shù)據(jù)集損失連續(xù)50次不再下降時(shí),學(xué)習(xí)率降低0.1。
1.2.4 支持向量機(jī)和隨機(jī)森林模型 針對(duì)相同數(shù)據(jù)集建立支持向量機(jī)和隨機(jī)森林模型。以Scikit-learn 0.22在Python 3.7中完成模型建立。對(duì)支持向量機(jī)模型的目標(biāo)函數(shù)懲罰因子參數(shù)C在[24,216]范圍以2倍步長(zhǎng)進(jìn)行參數(shù)尋優(yōu),同時(shí)對(duì)所有核函數(shù)進(jìn)行尋優(yōu)。對(duì)隨機(jī)森林的決策樹數(shù)量在[25,212]范圍以2倍步長(zhǎng)進(jìn)行尋優(yōu)。兩種模型的其余參數(shù)均采用默認(rèn)值。
1.3 統(tǒng)計(jì)學(xué)分析 以Python 3.7軟件生成受試者工作特征(receiver operating characteristic, ROC)曲線,計(jì)算曲線下面積(area under the curve, AUC),計(jì)算并比較各模型的敏感度、特異度和準(zhǔn)確率。使用Python 3.7軟件和統(tǒng)計(jì)工具箱scipy 1.3.1,以χ2檢驗(yàn)比較DL模型與支持向量機(jī)和隨機(jī)森林模型針對(duì)測(cè)試集的預(yù)測(cè)結(jié)果的差異。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
DL模型預(yù)測(cè)腎疾病的敏感度、特異度和準(zhǔn)確率分別為90.48%、100%和95.12%,AUC為0.93;對(duì)病例組3例預(yù)測(cè)錯(cuò)誤,對(duì)照組預(yù)測(cè)均準(zhǔn)確。支持向量機(jī)模型預(yù)測(cè)腎疾病的敏感度、特異度和準(zhǔn)確率分別為80.74%、80.71%和80.98%,AUC為0.90;隨機(jī)森林模型的敏感度、特異度和準(zhǔn)確率分別為82.22%、77.87%和80.33%,AUC為0.88。DL模型的敏感度、特異度、準(zhǔn)確率和AUC均高于支持向量機(jī)模型和隨機(jī)森林模型;與支持向量機(jī)模型及隨機(jī)森林模型預(yù)測(cè)腎疾病差異均有統(tǒng)計(jì)學(xué)意義(χ2=10.25、P=0.00137,χ2=10.26、P=0.00136)。見圖4。
圖4 各模型預(yù)測(cè)腎疾病的ROC曲線
基于SWE定量參數(shù)和卷積神經(jīng)網(wǎng)絡(luò)的DL模型可有效預(yù)測(cè)腎疾病。支持向量機(jī)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的機(jī)器學(xué)習(xí)方法,通過求解優(yōu)化算法找到最佳分類超平面,具有良好的泛化能力。隨機(jī)森林通過隨機(jī)組合建立的決策樹,最終利用多數(shù)表決得到分類結(jié)果。
本研究結(jié)果顯示,相比支持向量機(jī)和隨機(jī)森林模型,DL模型的預(yù)測(cè)性能更好,這是由于深度卷積神經(jīng)網(wǎng)絡(luò)方法具有自動(dòng)尋找參數(shù)中隱含特性、并從中自動(dòng)提取適合腎疾病預(yù)測(cè)任務(wù)特征的優(yōu)勢(shì)。支持向量機(jī)依賴核函數(shù)將低維空間映射到高維空間,以尋找最優(yōu)分類界面,隨機(jī)森林使用決策樹隨機(jī)選取最優(yōu)特征,此兩種模型選擇特征空間均受到較大限制,導(dǎo)致靈活性不足;而DL模型通過目標(biāo)函數(shù)選擇特征,其尋優(yōu)范圍更大、選擇參數(shù)更靈活。DL模型通過引入局部感受野和共享權(quán)重解決了計(jì)算效率問題,通過分層結(jié)構(gòu)模仿人腦進(jìn)行層次化建模,可發(fā)掘數(shù)據(jù)的隱含關(guān)系并加以表達(dá),故其敏感度、特異度和準(zhǔn)確率均更高,特異度表現(xiàn)尤其優(yōu)秀。針對(duì)IgA腎病的SWE研究[4]結(jié)果顯示,診斷敏感度和特異度分別為89.00%和90.00%;而以超聲剪切波預(yù)測(cè)兒童慢性腎病[10]的敏感度和特異度分別為76.50%和92.10%,均低于本研究結(jié)果,主要原因在于既往研究?jī)H關(guān)注腎皮質(zhì)彈性模量值,而未采用機(jī)器學(xué)習(xí)預(yù)測(cè)模型。GROSSMANN等[6]利用剪切波彈性值診斷腎小球腎炎的AUC為0.89 ,同樣低于本研究結(jié)果,主要原因亦為未采用機(jī)器學(xué)習(xí)預(yù)測(cè)模型。
通過腎穿刺進(jìn)行活體病理學(xué)檢查是目前診斷腎臟病變的金標(biāo)準(zhǔn),但有創(chuàng),使其應(yīng)用受到一定限制。SWE具有無創(chuàng)、便捷等特點(diǎn),為診斷腎臟病變提供了一種補(bǔ)充性的非侵入性途徑。開發(fā)基于超聲彈性成像的腎臟疾病預(yù)測(cè)模型,不僅有助于輔助診斷腎臟病變,還有助于根據(jù)病情進(jìn)行篩選分流,優(yōu)化診斷流程。超聲SWE和DL相結(jié)合,有助于建立高性能的腎臟疾病預(yù)測(cè)模型。
綜上所述,本研究應(yīng)用SWE和卷積神經(jīng)網(wǎng)絡(luò)建立DL模型預(yù)測(cè)腎臟疾病,其診斷效能優(yōu)于支持向量機(jī)和隨機(jī)森林模型,有一定臨床應(yīng)用價(jià)值。本研究的主要局限性在于單中心設(shè)計(jì),樣本量有限,需要更多數(shù)據(jù)進(jìn)一步深入觀察。
中國(guó)醫(yī)學(xué)影像技術(shù)2021年6期