六盤(pán)水師范學(xué)院 貴州 六盤(pán)水 553004
自從2019年以來(lái),新冠肺炎病毒已經(jīng)席卷了全球很多個(gè)國(guó)家,各地的醫(yī)療機(jī)構(gòu)都承受了巨大的壓力[1],許多國(guó)家和地區(qū)都出現(xiàn)了嚴(yán)重缺乏醫(yī)生、防護(hù)用品、醫(yī)療器材等問(wèn)題。
新冠肺炎病毒具有傳染性強(qiáng),臨床確診難度大等特點(diǎn)。因此提出一種簡(jiǎn)單、實(shí)用、價(jià)格便宜的新冠肺炎疾病檢測(cè)方法來(lái)輔助診斷是很有意義的。
近年來(lái)隨著技術(shù)的不斷發(fā)展,基于深度學(xué)習(xí)的圖像處理技術(shù)被廣泛的應(yīng)用在醫(yī)療機(jī)構(gòu)中[3]。傳統(tǒng)的圖像處理算法泛化能力差,且需要人工進(jìn)行特征處理,而深度學(xué)習(xí)算法能夠自動(dòng)提取圖像特征,并且能夠很好的利用這些特征信息。劉一鳴等提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的肺結(jié)節(jié)檢測(cè)辦法,其準(zhǔn)確率達(dá)到了92.3%[4]。李端[5]等將殘差網(wǎng)絡(luò)與自適應(yīng)濾波算法相結(jié)合來(lái)識(shí)別心電信號(hào),并取得了較高的準(zhǔn)確率。黃盛[6]等利用了神經(jīng)網(wǎng)絡(luò)的方法來(lái)對(duì)CT圖像進(jìn)行分類(lèi),首先在深度殘差網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行了改進(jìn),然后利用了遷移學(xué)習(xí)的方法縮短的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)長(zhǎng),最后也得到了較好的分類(lèi)結(jié)果。
殘差網(wǎng)絡(luò)能夠很好地解決梯度消失的問(wèn)題,稠密連接網(wǎng)絡(luò)能夠充分利用神經(jīng)網(wǎng)絡(luò)中各層次的特征圖,因此本文在二者的基礎(chǔ)上改進(jìn),并采用了擴(kuò)展-卷積-壓縮的稠密塊和深度分離的卷積來(lái)解決參數(shù)過(guò)多的問(wèn)題,使得神經(jīng)網(wǎng)絡(luò)能夠在精確度和網(wǎng)絡(luò)參數(shù)之間找到一個(gè)平衡點(diǎn),在保證一定準(zhǔn)確率的情況下盡量減少神經(jīng)網(wǎng)絡(luò)參數(shù)。
本文提出了一種利用改進(jìn)型的卷積神經(jīng)網(wǎng)絡(luò)來(lái)檢測(cè)新冠肺炎的方法。首先需要對(duì)圖像預(yù)處理,然后送入神經(jīng)網(wǎng)絡(luò)訓(xùn)練,最后訓(xùn)練好的網(wǎng)絡(luò)模型可用于輔助篩查早期的新冠肺炎患者。
1.1 實(shí)驗(yàn)數(shù)據(jù) 本文使用的實(shí)驗(yàn)數(shù)據(jù)來(lái)自于加拿大滑鐵盧大學(xué)提供的公開(kāi)數(shù)據(jù)集,其中訓(xùn)練集有正常的圖片7966張,普通肺炎圖片5451張,新冠肺炎圖像214張。測(cè)試集有正常圖像885張,普通肺炎圖像594張,新冠肺炎圖像31張。
由數(shù)據(jù)分布圖可以發(fā)現(xiàn)新冠肺炎數(shù)據(jù)相對(duì)于整體數(shù)據(jù)來(lái)說(shuō)數(shù)量還比較少,為了使數(shù)據(jù)平衡,我們也采用了圖片翻轉(zhuǎn),裁剪以及加權(quán)的損失函數(shù)等措施來(lái)使得數(shù)據(jù)得以均衡。
1.2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 近年來(lái),卷積神經(jīng)網(wǎng)絡(luò)被大量用于醫(yī)學(xué)圖像處理中,韓坤[6]等提出了一種卷積神經(jīng)網(wǎng)絡(luò)模型,該模型利用圖像的特征信息對(duì)阿爾茲海默癥進(jìn)行分類(lèi)診斷并取得了良好的準(zhǔn)確率。
神經(jīng)網(wǎng)絡(luò)越深,獲取的特征信息越多也越豐富。但是隨著網(wǎng)絡(luò)的加深,神經(jīng)網(wǎng)絡(luò)會(huì)出現(xiàn)梯度爆炸和梯度消失的問(wèn)題導(dǎo)致網(wǎng)絡(luò)很難優(yōu)化。何凱明提出的殘差網(wǎng)絡(luò)[7]能夠有效的解決這個(gè)問(wèn)題。
當(dāng)神經(jīng)網(wǎng)絡(luò)的輸入層和輸出層之間的連接越短時(shí),神經(jīng)網(wǎng)絡(luò)的層數(shù)可以加深,神經(jīng)網(wǎng)絡(luò)的精度會(huì)提高,而且也更方便訓(xùn)練。Gao Huang等提出的DenseNet[8]就實(shí)現(xiàn)了這個(gè)想法,作者讓神經(jīng)網(wǎng)絡(luò)的中的每一層都與該層前面的所有層建立連接。這樣不僅有利于特征復(fù)用,還能減少參數(shù),解決梯度消失的問(wèn)題。
圖1 新冠肺炎患者肺部影像
圖2 訓(xùn)練測(cè)試集數(shù)據(jù)分布圖
本文的神經(jīng)網(wǎng)絡(luò)模型充分利用殘差神經(jīng)網(wǎng)絡(luò)和密集連接網(wǎng)絡(luò)的優(yōu)點(diǎn)并在其基礎(chǔ)上改進(jìn)。首先確定可重復(fù)的稠密塊A,B,(示意圖見(jiàn)圖6)。然后將這些稠密塊用稠密連接的方式疊加起來(lái)再加上輸入輸出模塊(示意圖見(jiàn)圖7),最后形成完整的網(wǎng)絡(luò)(示意圖見(jiàn)圖5)。
圖5 網(wǎng)絡(luò)結(jié)構(gòu)圖
由于稠密塊過(guò)多會(huì)增加網(wǎng)絡(luò)的復(fù)雜度,因此稠密塊A/B內(nèi)部設(shè)置是首先將輸入擴(kuò)展到高維,然后采用輕量卷積做過(guò)濾處理,最后再將特征信息投影回低維表示,這樣做能大大減少參數(shù)。另一方面采用了殘差連接來(lái)連接特征圖,這樣能使得神經(jīng)網(wǎng)絡(luò)中各個(gè)層次的特征圖能得到有效的利用。
在網(wǎng)絡(luò)模型的稠密塊中,部分采用了深度分離卷積來(lái)代替?zhèn)鹘y(tǒng)卷積,使得參數(shù)數(shù)量進(jìn)一步減少。
綜上所述,本文用到了殘差連接和稠密連接,這兩種方式使得低緯度的特征可以連接到高緯度進(jìn)行計(jì)算,使得神經(jīng)網(wǎng)絡(luò)的體系結(jié)構(gòu)很豐富,但同時(shí)大大增加計(jì)算復(fù)雜度。但由于稠密塊的設(shè)計(jì)使得網(wǎng)絡(luò)在精確度和計(jì)算復(fù)雜度之間找到了平衡點(diǎn)。
圖6 A/B模塊圖
圖7 輸入輸出模塊圖Fig.7 I/O module diagram
從網(wǎng)絡(luò)結(jié)構(gòu)圖中可以發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)里面的體系結(jié)構(gòu)很豐富,里面有多種內(nèi)核卷積層,使得網(wǎng)絡(luò)的能力很強(qiáng)。
1.3 訓(xùn)練的神經(jīng)網(wǎng)絡(luò) 本文所用的實(shí)驗(yàn)環(huán)境主要在GPU下進(jìn)行,GPU為GTX1060TI,使用基于Windows的tensorflow深度學(xué)習(xí)框架,使用Python編程語(yǔ)言對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行搭建。
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練參數(shù)為learning rate=2e-4,number of epochs=22,batch size=64,factor=0.7,patience=5。
1.4 實(shí)驗(yàn)結(jié)果及分析 為了評(píng)估神經(jīng)模型的有效性,本文將與另外的神經(jīng)網(wǎng)絡(luò)進(jìn)行比較,其中包括:VGG-19[9],殘差網(wǎng)絡(luò),使用同樣的數(shù)據(jù)集,做同樣的數(shù)據(jù)預(yù)處理,對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)價(jià),分別是準(zhǔn)確率、參數(shù)數(shù)量,計(jì)算公式如下。其中TP表示正樣本被分到正確分類(lèi)中的數(shù)量,TN表示負(fù)樣本被分配到負(fù)樣本中的數(shù)量,FP表示負(fù)樣本被分配到正樣本中的數(shù)量,FN表示正樣本被分配到負(fù)樣本中的數(shù)量。由于本文中新冠肺炎數(shù)據(jù)不足,再加上又是三分類(lèi)實(shí)驗(yàn),故使用加權(quán)的平均準(zhǔn)確率來(lái)評(píng)估模型。
其中Si為第i個(gè) 類(lèi)別的樣本數(shù),N為樣本總數(shù),wi為第i個(gè)類(lèi)別在總樣本中的占比。
表1 不同模型的準(zhǔn)確率Table 1 Accuracy of different models
表2 不同模型的網(wǎng)絡(luò)參數(shù)Table 2 Network parameters of different models
本文中提出的網(wǎng)絡(luò)模型的特點(diǎn)是采用了輕量級(jí)的稠密模塊設(shè)計(jì),在這個(gè)模塊中首先采用1x1的卷積把圖像的特征圖擴(kuò)展到高維,然后經(jīng)過(guò)輕量卷積處理后又采用了1X1的卷積壓縮到低維。這個(gè)模塊的優(yōu)點(diǎn)在于能大量減少參數(shù)。當(dāng)然在不同的稠密塊之間采用了稠密連接,這樣就使得整個(gè)網(wǎng)絡(luò)中具有結(jié)構(gòu)體系多樣性,特征圖的多樣性,而且也更容易訓(xùn)練。
從表1表2可以明顯的看出本文中提出的網(wǎng)絡(luò)模型體系結(jié)構(gòu)復(fù)雜度和計(jì)算復(fù)雜度相對(duì)于VGG-19和殘差網(wǎng)絡(luò)有明顯降低,同時(shí)在準(zhǔn)確度上本文提出的模型相對(duì)于其他兩種模型有一個(gè)較好的表現(xiàn)。
由表1和圖8可以看出神經(jīng)網(wǎng)絡(luò)對(duì)于新冠肺炎的預(yù)測(cè)有很好的效果,但是可以發(fā)現(xiàn)還是有少量的被誤診,說(shuō)明準(zhǔn)確率還是不夠,還需要進(jìn)一步提升,其實(shí)也就是數(shù)據(jù)量還不足,還需要更多的數(shù)據(jù)去補(bǔ)充。
圖8 實(shí)驗(yàn)結(jié)果的混淆矩陣
本文提出了改進(jìn)型的卷積神經(jīng)網(wǎng)絡(luò)對(duì)肺部影像進(jìn)行分析處理,由實(shí)驗(yàn)數(shù)據(jù)可知,相比VGG和殘差神經(jīng)網(wǎng)絡(luò),本文中的網(wǎng)絡(luò)具有很少的參數(shù)數(shù)目,卻擁有更好的準(zhǔn)確率。
綜上可知本文中的模型不僅準(zhǔn)確性高而且具有較好的穩(wěn)定性,能夠?yàn)樾鹿诜窝自\斷提供了一些輔助支持,對(duì)疫情的防控具有積極意義。
探索科學(xué)(學(xué)術(shù)版)2020年9期