張興娜,楊 會(huì),劉雪宇,姜秋竹,李榮山,周曉霜△,王 晨
(1.山西醫(yī)科大學(xué),太原 030051;2.山西醫(yī)科大學(xué)附屬人民醫(yī)院腎內(nèi)科,太原 030012;3.太原理工大學(xué)大數(shù)據(jù)學(xué)院,山西 030024;4.山西醫(yī)科大學(xué)附屬第二醫(yī)院病理科,太原 030001)
膜性腎病(MN)是成年人腎病綜合征最常見原因之一。近年來,MN在我國發(fā)病率不斷上升,可能成為發(fā)病率最高的原發(fā)性腎小球疾病[1]。MN是一種腎小球疾病,其病理特征為腎小球基底膜增厚和免疫復(fù)合物在上皮下沉積,腎臟活檢被認(rèn)為是診斷的“金標(biāo)準(zhǔn)”[2]。MN病理分期Ⅱ期表現(xiàn)為光鏡下腎小球毛細(xì)血管不均勻增厚形成釘突,電鏡下發(fā)現(xiàn)上皮細(xì)胞下存在電子致密物沉積。釘突是指腎小球基底膜出現(xiàn)微小隆起,因其結(jié)構(gòu)微小常不易辨別,常為病理科醫(yī)師做出診斷帶來困難[3]。
近年來,大數(shù)據(jù)處理和深度學(xué)習(xí)已成為醫(yī)學(xué)進(jìn)步的先鋒,病理學(xué)也不例外。隨著數(shù)字病理技術(shù)、精準(zhǔn)醫(yī)療和人工智能的發(fā)展卷積神經(jīng)網(wǎng)絡(luò)(CNNs)在影像、病理等的圖像識(shí)別上不斷成熟[4]。深度學(xué)習(xí)算法通過對(duì)數(shù)據(jù)庫中的病理圖像進(jìn)行學(xué)習(xí),可對(duì)可疑病灶作標(biāo)記,輔助醫(yī)師進(jìn)行初步診斷,但目前利用人工智能對(duì)腎小球進(jìn)行準(zhǔn)確分類的相關(guān)研究很少見[5]。本研究利用DenseNet網(wǎng)絡(luò)對(duì)MN腎組織病理切片中腎小球根據(jù)有無釘突進(jìn)行檢測(cè)并分類,希望基于DenseNet的人工智能軟件可在MN病理切片中發(fā)現(xiàn)釘突這一結(jié)構(gòu),輔助病理科醫(yī)師作出病理診斷,從而最大限度地減輕病理科醫(yī)師工作量,并提高診斷的客觀性和準(zhǔn)確率。
選取2014-2019年山西醫(yī)科大學(xué)附屬第二醫(yī)院收治的MN患者腎組織針刺活檢病理切片1 250張,包括六胺銀(PASM)染色、蘇木精-伊紅染色、馬松(MASSON)染色和過碘酸雪夫染色4種染色的病理切片,通過使用KF-PRO-005-E×數(shù)字幻燈片掃描儀(KFbio,中國寧波)掃描獲取,分辨率為0.25毫米/像素,文件格式為KFB,由于圖像太大不適合網(wǎng)絡(luò)訓(xùn)練則轉(zhuǎn)換為SVS格式。納入標(biāo)準(zhǔn):(1)腎活檢病理診斷為MN Ⅱ期;(2)臨床數(shù)據(jù)完整;(3)病理切片清晰完整、染色均勻。排除標(biāo)準(zhǔn):(1)可疑病例;(2)入院后臨床資料不齊全;(3)病理切片損壞、染色不均勻、腎小球未聚焦等。經(jīng)篩選符合要求的PASM染色病理切片1 150張,選擇診斷為MN病理分期Ⅱ期的PASM染色病理圖像127張。
1.2.1圖片注釋
前期實(shí)驗(yàn)通過級(jí)聯(lián)區(qū)域CNNs識(shí)別并對(duì)腎小球進(jìn)行分割[6]。由高年資病理科醫(yī)師對(duì)切割后的腎小球進(jìn)行分類,將有釘突的腎小球放入一個(gè)文件夾,命名為釘突陽性(+),共492個(gè);將沒有釘突的腎小球放入另一個(gè)文件夾,命名為釘突陰性(-),共523個(gè),格式均為JPG。因僅根據(jù)圖像判斷結(jié)果,故要求注釋者對(duì)患者信息、臨床信息和診斷視而不見。
1.2.2訓(xùn)練/驗(yàn)證數(shù)據(jù)集
按8∶2分為訓(xùn)練集與測(cè)試集。訓(xùn)練集用于人工智能模型的訓(xùn)練,為對(duì)模型進(jìn)行參數(shù)的調(diào)整,從訓(xùn)練集里再次分出驗(yàn)證集,訓(xùn)練集共611張圖像,驗(yàn)證集共204張圖像。訓(xùn)練模型使用TensorFlow 2.0框架和Python環(huán)境。選擇NVIDIA Tesla k80 GPU,將學(xué)習(xí)率設(shè)置為0.001,將訓(xùn)練迭代次數(shù)設(shè)置為100,將批量大小設(shè)置為16。訓(xùn)練模型使用TensorFlow2.0框架和Python環(huán)境。選擇NVIDIA Tesla k80 GPU,將學(xué)習(xí)率設(shè)置為0.001,將訓(xùn)練迭代次數(shù)設(shè)置為100,將批量大小設(shè)置為16。訓(xùn)練/驗(yàn)證數(shù)據(jù)集由5名病理科醫(yī)師注釋,每個(gè)病例隨機(jī)分配2名病理科醫(yī)師并獨(dú)立進(jìn)行注釋。
1.2.3測(cè)試數(shù)據(jù)集
測(cè)試集包含200張圖像,用來對(duì)經(jīng)過訓(xùn)練的DenseNet模型的泛化與識(shí)別能力進(jìn)行測(cè)試,然后得出二種分類標(biāo)簽(+)和(-)。DenseNet模型:傳統(tǒng)的 L 層卷積網(wǎng)絡(luò)有 L 個(gè)連接——每一層只與其前一層和后一層相連,而DenseNet在前饋時(shí)將每一層與其他的任一層均進(jìn)行了連接,有 L(L+1)/2 個(gè)連接。每一層均將之前的所有層的特征圖作為輸入,而其自己的特征圖是之后所有層的輸入。就是每一層的輸入來自前面所有層的輸出,即X0是輸入(input),H1的輸入是X0,H2的輸入是X0和X1。見圖1。與傳統(tǒng)網(wǎng)絡(luò)模型比較,DenseNet有助于解決梯度消失問題,增強(qiáng)特征傳播,促進(jìn)特征的重復(fù)利用,明顯減少了參數(shù)的數(shù)量,DenseNet還改善了網(wǎng)絡(luò)中信息和梯度的傳遞,讓網(wǎng)絡(luò)更容易訓(xùn)練。
一個(gè)5層的密集塊,每一層以前面所有層的特征作為輸入。
1.2.4模型性能評(píng)估
模型性能通過測(cè)試數(shù)據(jù)集進(jìn)行評(píng)估。對(duì)測(cè)試數(shù)據(jù)集中的每個(gè)圖像隨機(jī)選擇1名病理科醫(yī)師的注釋標(biāo)簽被用作真實(shí)標(biāo)簽,其他病理科醫(yī)師注釋標(biāo)簽用于評(píng)估其表現(xiàn)。通過受試者工作特征曲線的曲線下面積(AUC)、靈敏度和特異度對(duì)訓(xùn)練后模型進(jìn)行評(píng)估。測(cè)試數(shù)據(jù)集性能通過靈敏度(召回率、真陽性率)和特異度(真陰性率)進(jìn)行評(píng)估。精確度=真陽性/(真陽性+假陽性)。召回率=真陽性/(真陽性+假陰性)。準(zhǔn)確率=(真陽性+真陰性)/(真陽性+假陰性+假陽性+真陰性)。F1=2×(召回率×精確度)/(召回率+精確度)。真陽性為釘突(+)腎小球被正確識(shí)別,假陽性為釘突(-)腎小球被錯(cuò)誤識(shí)別為釘突(+)腎小球,真陰性為釘突(-)腎小球被正確識(shí)別,假陰性為釘突(+)腎小球被錯(cuò)誤識(shí)別為釘突(-)腎小球。
1.2.5研究流程
裁剪127張MN病理分期Ⅱ期患者PASM染色病理圖像得到1 015張腎小球圖像。訓(xùn)練集和驗(yàn)證集分別包含611、204張圖像,測(cè)試集包含200張圖像,研究流程見圖2。
圖2 研究流程
各數(shù)據(jù)集中注釋標(biāo)簽數(shù)量見表1。釘突(-)腎小球和釘突(+)腎小球見圖3。
表1 數(shù)據(jù)集的注釋標(biāo)簽
A:釘突(-)腎小球;B:釘突(+)腎小球及部分釘突。
基于DenseNet的人工智能模型可檢測(cè)到腎小球是否有釘突并且對(duì)其進(jìn)行二分類。測(cè)試結(jié)果見表2。通過計(jì)算得到召回率為98.00%,精確度為92.45%,準(zhǔn)確率為95.00%,F(xiàn)1為95.15%。對(duì)于釘突這一結(jié)構(gòu)的識(shí)別,病理科醫(yī)師的特異度較高,但靈敏度差異較大。根據(jù)最接近病理科醫(yī)師特異度的臨界值評(píng)估DenseNet模型輸出靈敏度。DenseNet模型靈敏度低于腎病學(xué)家靈敏度平均值,但超過部分病理科醫(yī)師靈敏度。
表2 在測(cè)試集上DenseNet模型對(duì)腎小球釘突的二分類結(jié)果
在MN腎活檢組織PASM染色的病理結(jié)果中腎小球釘突二分類模型的性能見圖4。DenseNet模型表現(xiàn)出高性能,AUC為 0.97。訓(xùn)練過程中模型總損失曲線見圖5?;贒enseNet模型對(duì)腎小球釘突分類獲得的召回率和準(zhǔn)確率較高,表現(xiàn)出較高的靈敏度,但精確度和特異度尚需進(jìn)一步提高。
圖4 腎小球釘突二分類模型的性能
圖5 DenseNet模型訓(xùn)練總損失
在我國MN病理分期大多為Ⅰ、Ⅱ期,隨著病情進(jìn)展,病理分期也會(huì)進(jìn)一步發(fā)生改變。而腎活檢也被認(rèn)為是診斷MN的“金標(biāo)準(zhǔn)”,故早期病理診斷對(duì)MN的治療及預(yù)后均至關(guān)重要。MN是近年來發(fā)病率增長最快的原發(fā)性腎小球疾病,2016年一項(xiàng)全國多中心流行病學(xué)研究結(jié)果顯示,MN以每年13%的比例增長,占腎活檢患者的比例高達(dá)23.4%[7]。腎小球病變和結(jié)構(gòu)的識(shí)別是腎臟疾病的病理診斷、治療指導(dǎo)和預(yù)后評(píng)估的關(guān)鍵,如MN病理分期Ⅱ期患者可得到控制,對(duì)患者治療和預(yù)后均具有很大幫助[8]。MN病理分期Ⅱ期在PASM染色中表現(xiàn)為基底膜彌漫性增厚,釘突結(jié)構(gòu)形成,與其他染色方法比較,PASM染色對(duì)釘突的成像特點(diǎn)尤為顯著。由于腎臟病理的復(fù)雜性和多樣性,以及釘突的結(jié)構(gòu)微小,資歷較淺的病理科醫(yī)師容易出現(xiàn)漏診情況,所以,腎臟病理的計(jì)算機(jī)輔助診斷可通過識(shí)別各種腎小球及其病理特征提高病理科醫(yī)師的工作效率,并且可幫助病理科醫(yī)師作出更為客觀的病理診斷。
由于強(qiáng)大的學(xué)習(xí)能力和處理復(fù)雜模式的優(yōu)勢(shì),深度學(xué)習(xí)算法非常適合圖像分析挑戰(zhàn),尤其是在數(shù)字病理學(xué)領(lǐng)域,包括分類、檢測(cè)和分割等[9]。有研究通過訓(xùn)練CNNs分割腎臟主要結(jié)構(gòu),包括腎小球、腎小管、腎動(dòng)脈、腎靜脈等對(duì)來自不同物種和腎臟疾病模型的高碘酸希夫染色腎臟的數(shù)字全幻燈片圖像進(jìn)行了準(zhǔn)確的多類分割[10-11]。有研究表明,根據(jù)腎小球不同區(qū)域細(xì)胞核數(shù)量增加的卷積特征對(duì)細(xì)胞進(jìn)行分類也可輔助臨床診斷[12]。
DenseNet建立的是前面所有層與后面層的密集連接,可有效利用高層信息重新發(fā)現(xiàn)底層新特征,增強(qiáng)跨網(wǎng)絡(luò)特征傳輸并實(shí)現(xiàn)增強(qiáng)的特征重用,有效減少參數(shù)數(shù)量[13]。DenseNet將兩個(gè)相同特征圖尺寸的任意層進(jìn)行連接,工程師能很輕松地設(shè)計(jì)出上百層網(wǎng)絡(luò),也不會(huì)出現(xiàn)優(yōu)化困難的問題,隨著參數(shù)量的增加,DenseNet準(zhǔn)確率也隨之提高,而且未出現(xiàn)較差表現(xiàn)或過擬合現(xiàn)象[14-15]。
本研究結(jié)果顯示,腎小球釘突的二分類在DenseNet模型上獲得的召回率較高,但精度值與準(zhǔn)確度尚需進(jìn)一步提高,相信二分類模型在經(jīng)過不斷地提高準(zhǔn)確度后可更好地為臨床醫(yī)療提供幫助。因此,今后將使用更大的數(shù)據(jù)集對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行不斷改進(jìn)以提高準(zhǔn)確度。