雷立存,杜亞強,周琦,高天姿,楊爽,王哲
1.河北醫(yī)科大學第一醫(yī)院放射科,河北 石家莊 050031;2.河北醫(yī)科大學第四醫(yī)院體檢部,河北 石家莊 050011;*通信作者 杜亞強 halixundong@126.com
非酒精性脂肪性肝?。╪onalcoholic fatty liver disease,NAFLD)是一種世界范圍內(nèi)的慢性疾病,發(fā)病原因主要有肥胖、2型糖尿病、高脂血癥與代謝性疾病等,近年NAFLD患病率呈逐年上升趨勢[1-2]。肝臟脂肪性病變是由于肝臟細胞脂肪液滴的積累,進而可能導致肝炎、纖維化、肝硬化,最后進展為肝細胞癌[3-4]。NAFLD發(fā)生纖維化的概率約為25%,1.5%~8.0%可進展為肝硬化[5]。因此,早期診斷與提前干預(yù)可能阻止其發(fā)病歷程[4]。
目前肝臟活檢是診斷NAFLD的重要參考標準,但因其有創(chuàng)性、價格昂貴,不適合大范圍篩查。肝臟超聲檢查的缺點是分辨率低,依賴超聲設(shè)備與操作醫(yī)師的個人經(jīng)驗手法[6]。肝臟CT平掃雖然有電離輻射,但成像快速,且分辨率較高,可以顯示更多的信息,廣泛應(yīng)用于臨床,并且聯(lián)合肝/脾CT值分析有助于診斷NAFLD[7-8]。隨著近年深度學習技術(shù)的興起,其在計算機視覺與自然語言處理領(lǐng)域已取得突破性成果[9]。自2012年以來,基于卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)的圖像識別網(wǎng)絡(luò)每年均提高識別準確率[10-11]。目前各學科交叉促使將優(yōu)異的深度學習圖像識別網(wǎng)絡(luò)應(yīng)用于醫(yī)學圖像輔助醫(yī)務(wù)人員診斷變得切實可行。本文挑選ResNet-18圖像識別網(wǎng)絡(luò),采用遷移學習的方式[12-13],基于肝臟CT平掃圖像,驗證深度學習診斷NAFLD的可行性。
1.1 研究對象 回顧性分析2020年5—12月河北醫(yī)科大學第一醫(yī)院收治的164例經(jīng)CT掃描檢查診斷為NAFLD的影像資料,共1 801層CT平掃圖像,其中男101例,女63例;年齡9~86歲,平均(46.1±16.3)歲;輕度脂肪肝53例共577層圖像,中度脂肪肝54例共590層圖像,重度脂肪肝57例共634層圖像。一般資料見表1。將20例行上腹部CT平掃未見明顯異?;颊呒{入對照組,共200層圖像,其中男13例,女7例,年齡13~73歲,平均(36.6±18.7)歲。共收集2 001層圖像。納入標準為所有患者均在CT檢查中未發(fā)現(xiàn)其他明顯肝臟疾病,且無重大肝臟疾病史和手術(shù)史。本研究經(jīng)河北醫(yī)科大學第一醫(yī)院倫理委員會批準(審批號:20200425),并獲得患者知情同意。
表1 輕度、中度、重度NAFLD患者一般資料(例)
1.2 數(shù)據(jù)集 NAFLD分級標準參考《中國非酒精性脂肪性肝病診療指南》[14],CT診斷脂肪肝的依據(jù)為肝臟密度普遍降低,肝/脾CT值<1.0,其中0.7<肝/脾CT值<1.0為輕度脂肪肝,0.5<肝/脾CT值≤0.7為中度脂肪肝,肝/脾CT值≤0.5為重度脂肪肝。首先收集研究所用病例影像數(shù)據(jù),進行相應(yīng)預(yù)處理,然后隨機劃分訓練集、驗證集、測試集,訓練集與驗證集用于訓練參數(shù)建立模型,測試集用于模型最后評估,最后進行模型評估指標分析(圖1)。
1.3 數(shù)據(jù)預(yù)處理 為了將圖像數(shù)據(jù)送到網(wǎng)絡(luò)中便于訓練且節(jié)省計算機內(nèi)存,統(tǒng)一將肝臟CT圖像數(shù)據(jù)調(diào)整為512×512像素、JPG格式,采用后處理工作站實現(xiàn)(圖2)。然后將數(shù)據(jù)集按照60%、20%、20%劃分訓練集、驗證集、測試集;且隨機打亂,保證泛化性;其中訓練集1 201層圖像,用于訓練網(wǎng)絡(luò)模型參數(shù);驗證集400層圖像,用于防止網(wǎng)絡(luò)過擬合,調(diào)節(jié)模型超參數(shù);測試集401層圖像,用于評估模型真實效果。
1.4 深度學習模型 使用ResNet-18圖像識別網(wǎng)絡(luò),較以往傳統(tǒng)基于CNN的圖像識別網(wǎng)絡(luò)(如VGG網(wǎng)絡(luò)[10])不同,ResNet類型的網(wǎng)絡(luò)增加了“短接”機制[11](圖3)。
公式:xi=F(xi-1)+xi-1(xi代表第i層的圖像特征信息,F(xiàn)代表由卷積層、BN層、池化層等組成的基本單元),前向傳播過程中,將之前提取過的特征信息也考慮在內(nèi)。
ResNet類型的網(wǎng)絡(luò)加入“短接”機制,即將原始圖像特征數(shù)據(jù)通過1×1卷積的作用,調(diào)整為與由基本單元提取后的特征數(shù)據(jù)一致的尺寸大小,便于特征的融合,即將特征信息相加。在前向傳播過程中,每一層均考慮了之前由基本單元提取過的特征信息,解決了傳統(tǒng)的圖像識別網(wǎng)絡(luò),因網(wǎng)絡(luò)層數(shù)堆疊很深時,模型難以收斂的問題。結(jié)尾的數(shù)字18,僅代表基本單元數(shù)量不同,結(jié)構(gòu)上無差異。
本研究采用遷移學習方法,即不使用較小的數(shù)據(jù)樣本量直接訓練模型巨大的隨機初始化的參數(shù),而是在裝載了預(yù)訓練參數(shù)的模型上,在模型輸出端更換適合本研究分類情況的全連接層,然后再使用本研究數(shù)據(jù)訓練網(wǎng)絡(luò),進行參數(shù)微調(diào),避免因數(shù)據(jù)量與算力的不足導致模型不收斂。代碼實現(xiàn)基于深度學習框架Pytorch,采用Python 3.7語言編寫,代碼運行環(huán)境為Windows 10系統(tǒng),GPU為Nvidia Geforce RTX 2080Ti 11GB,epoch設(shè)置為500,學習率設(shè)置為0.001,batchsize設(shè)置為64,訓練過程中,運行完所有的epoch,保存其中在驗證集上準確率表現(xiàn)最好的那一次的模型參數(shù)。
1.5 統(tǒng)計學方法 入選病例臨床一般資料性別和年齡段行χ2檢驗。針對評估模型的表現(xiàn),采用受試者工作特征(ROC)曲線與曲線下面積(AUC)評估準確度、敏感度、特異度對ResNet-18圖像識別網(wǎng)絡(luò)在NAFLD分級中的價值。
ResNet-18圖像識別網(wǎng)絡(luò)在測試集中的總體準確率為95%,識別正常肝臟、輕度脂肪肝、中度脂肪肝和重度脂肪肝的CT平掃圖像敏感度、特異度及AUC值見表2,ROC曲線見圖4。
表2 ResNet-18圖像識別網(wǎng)絡(luò)測試集評估
NAFLD是指除酒精和其他明確的肝損傷因素所致肝細胞內(nèi)脂肪過度沉積為主要特征的臨床病理綜合征,NAFLD包括非酒精性脂肪肝、非酒精性脂肪性肝炎、肝硬化和肝細胞癌[15-16]。NAFLD在全球的發(fā)病率為10%~30%,亞洲國家為11%~16%,中國的發(fā)病率約為15%[17]。隨著近年醫(yī)工結(jié)合的不斷發(fā)展,人們對醫(yī)療質(zhì)量和效能提出了更高的要求。傳統(tǒng)基于醫(yī)學影像對NAFLD分級的方法雖有一定效果,但其效率不高、圖像信息不全面。深度學習可以自動獲取原始圖像的一系列特征,可以為NAFLD分級診斷提供新的方向。
深度學習技術(shù)目前已滲入醫(yī)學影像領(lǐng)域的諸多方面,如心血管疾病的CT/MRI影像的分割與量化、視網(wǎng)膜眼底影像分析、胸部X線影像的深度學習輔助診療以及對顱內(nèi)出血與顱內(nèi)腫瘤影像的語義分割[18-21]。在肝臟影像領(lǐng)域,此類報道較多,F(xiàn)orlano等[22]利用CNN技術(shù)將收集的NAFLD患者資料建立模型,與人工組對比結(jié)果一致;Heinemann等[23]用CNN系統(tǒng)建模,量化了NAFLD和非酒精性肝炎的病理圖片,并建立了相應(yīng)的區(qū)分系統(tǒng),其準確性與病理診斷正確率接近一致。余文林等[24]研究發(fā)現(xiàn),使用T1RHO-FA參數(shù)采集的MR影像和采用VGGNet-11模型更能提高肝纖維化分期的診斷準確率。茹仙古麗·艾爾西丁等[25]利用圖像識別網(wǎng)絡(luò)Inception-v3在肝癌病理切片圖像中區(qū)分正常與病變兩種類型,最終平均準確率達到99.2%。
傳統(tǒng)的圖像識別網(wǎng)絡(luò),單純通過堆疊由卷積層、激活函數(shù)層、BatchNormalization層(BN層)、池化層組成的基本單元,進行對圖像數(shù)據(jù)的單一向前逐層提取特征。本研究采用遷移學習方式,利用深度學習框架Pytorch搭建已預(yù)訓練的ResNet-18圖像識別網(wǎng)絡(luò),避免因數(shù)據(jù)量與算力的不足導致最終模型不收斂的情況,同時也在一定程度上降低了模型過擬合的風險。另外數(shù)據(jù)預(yù)處理過程相對簡單,無需過多復(fù)雜的圖像處理相關(guān)操作,網(wǎng)絡(luò)模型可以直接讀取原始JPG格式的數(shù)據(jù),也為將來實際應(yīng)用降低了難度。
本研究結(jié)果發(fā)現(xiàn),測試集共401層圖像中,正常圖像32層,網(wǎng)絡(luò)可以全部識別正確,準確辨別正常圖像與NAFLD圖像,而在NAFLD圖像中分級的輕、中、重度圖像中,網(wǎng)絡(luò)表現(xiàn)出較高的敏感性,但也有識別分類錯誤的圖像,其原因可能是由于當前數(shù)據(jù)規(guī)模較小,不可能將所有NAFLD圖像特征包含在內(nèi),并且NAFLD的CT平掃表現(xiàn)也因人而異。此外,盡管大量研究表明通過測量肝/脾CT值定量診斷NAFLD與病理活檢肝脂肪含量有較高的相關(guān)性,但由于CT值除受肝臟脂肪含量影響外,還存在鐵、銅、纖維化、水腫等多方面的干擾因素,因而需要進一步研究加以證實。
隨著深度學習等相關(guān)計算機技術(shù)的不斷更新發(fā)展,實現(xiàn)全自動化自動診療繼續(xù)向前邁進,本文進行基礎(chǔ)性探索,使計算機自動化進行NAFLD的分級得以實現(xiàn),可以預(yù)期,深度學習有望在將來為肝病診斷提供更多的方法。