關(guān)鍵詞:肺炎;X射線圖像;深度學(xué)習(xí);ResNet50;分類;計(jì)算機(jī)輔助診斷
0 引言
肺炎是一種常見的嚴(yán)重呼吸道感染疾病,對(duì)兒童的健康和生命構(gòu)成了嚴(yán)重影響[1]。據(jù)世界衛(wèi)生組織統(tǒng)計(jì), 每年約有150萬兒童因肺炎而死亡,死于肺炎的兒童人數(shù)超過死于瘧疾、腹瀉和麻疹的兒童總和[2]。兒童肺炎主要表現(xiàn)為呼吸道感染、發(fā)熱、疲倦乏力及咳痰等癥狀[3]。然而,多項(xiàng)研究表明,僅通過兒童的主要表現(xiàn)來判斷其是否患有肺炎缺乏敏感性和特異性,可能導(dǎo)致誤診或過度治療[4]。因此,早期準(zhǔn)確判斷兒童是否患有肺炎對(duì)其生命健康至關(guān)重要[5]。
深度學(xué)習(xí)在肺炎診斷中展現(xiàn)出顯著優(yōu)勢。它通過分析大量的醫(yī)學(xué)影像和病歷數(shù)據(jù),能夠快速、準(zhǔn)確地診斷肺炎,并提供相應(yīng)的治療建議。此外,深度學(xué)習(xí)模型具有高準(zhǔn)確性、可擴(kuò)展性、高效性、自動(dòng)化以及輔助決策等優(yōu)點(diǎn),已成為肺炎診斷領(lǐng)域的重要工具。本文提出了一種基于ResNet50 的兒童肺炎分類模型。在公開的兒童肺炎X光數(shù)據(jù)集上經(jīng)過訓(xùn)練和優(yōu)化,利用深度學(xué)習(xí)ResNet50 模型自動(dòng)學(xué)習(xí)兒童肺炎X光圖像中的病灶信息,實(shí)現(xiàn)肺炎的分類,并在準(zhǔn)確率、精確率、召回率和F1 分?jǐn)?shù)這四個(gè)評(píng)價(jià)指標(biāo)上進(jìn)行實(shí)驗(yàn)結(jié)果的驗(yàn)證和評(píng)估。與傳統(tǒng)肺炎診斷方法相比,基于ResNet50的兒童肺炎分類模型表現(xiàn)出更好的泛化性和魯棒性,對(duì)兒童肺炎的計(jì)算機(jī)輔助診斷具有積極的意義。
1 方法
1.1 基于深度學(xué)習(xí)的ResNet50網(wǎng)絡(luò)
針對(duì)兒童肺炎的問題,本文提出了一種ResNet50 模型,如圖1所示,該模型用于兒童肺炎圖像分類。其結(jié)構(gòu)主要包括輸入層、卷積層、殘差塊、全局平均池化層和分類器,具體流程如圖1所示。
首先,將特征圖大小為224×224的兒童肺炎X射線圖像輸入7×7卷積層和最大池化層進(jìn)行特征提取,對(duì)特征圖進(jìn)行下采樣,同時(shí)通過批量歸一化和ReLU激活函數(shù)處理,最終輸出大小為56×56的特征圖。
其次,將輸出大小為56×56的特征圖經(jīng)過Stage I 至Stage IV 的處理,最終得到7×7 的特征圖。每個(gè)Stage由若干個(gè)殘差塊組成,殘差塊包含兩個(gè)1×1卷積和一個(gè)3×3卷積,并且每個(gè)卷積后面都接有BN層和ReLU激活函數(shù)。通過3×3卷積提取特征,并引入1×1 卷積以調(diào)整通道數(shù),從而提高計(jì)算效率。最后,加入殘差連接以緩解梯度消失,并幫助模型更快地收斂。
最后,將特征圖輸入全連接層中進(jìn)行兒童肺炎X 射線圖像分類。全連接層將特征圖轉(zhuǎn)換為一維向量,并進(jìn)行分類操作。通過學(xué)習(xí)適合任務(wù)的特征映射,使得網(wǎng)絡(luò)能夠?qū)Σ煌妮斎霕颖咀龀稣_的分類。
ResNet50在兒童肺炎圖像分類中表現(xiàn)出高準(zhǔn)確性,其深層網(wǎng)絡(luò)結(jié)構(gòu)和殘差塊的設(shè)計(jì)使得網(wǎng)絡(luò)能夠有效提取特征信息。通過殘差連接,解決了深層網(wǎng)絡(luò)中的梯度問題。多個(gè)殘差塊的堆疊有助于提取高層次的抽象特征,從而提高分類準(zhǔn)確性。同時(shí),ResNet50具有較強(qiáng)的魯棒性和泛化能力,能夠抵抗噪聲和干擾。
1.2 卷積計(jì)算
卷積計(jì)算圖是描述卷積神經(jīng)網(wǎng)絡(luò)中卷積操作的一種圖形表示,如圖2所示。在深度學(xué)習(xí)中,卷積操作是一種有效的方式,用于從輸入數(shù)據(jù)中提取特征。在ResNet50模型中,卷積操作通過權(quán)值共享來提取特征。輸入一個(gè)大小為224×224的特征圖,每個(gè)像素包含RGB三個(gè)通道。卷積核是一個(gè)3×3的矩陣,對(duì)應(yīng)每個(gè)通道的權(quán)重值。對(duì)于每個(gè)像素,將3×3窗口中的像素值與卷積核對(duì)應(yīng)的權(quán)重相乘并求和,從而得到新的特征圖的像素值。重復(fù)這一過程,直到遍歷完整個(gè)輸入特征圖。在卷積計(jì)算中,還添加了一個(gè)偏置項(xiàng),其值為1,用于引入偏移值以進(jìn)一步調(diào)節(jié)特征圖的響應(yīng)。最終得到的輸出特征圖尺寸與輸入特征圖的尺寸相同,均為224×224。整個(gè)卷積過程通過卷積核的權(quán)重共享實(shí)現(xiàn),即卷積核在整個(gè)特征圖上進(jìn)行滑動(dòng)計(jì)算,這可以減少網(wǎng)絡(luò)中的參數(shù)量,加快計(jì)算速度,同時(shí)能夠提取圖像的局部特征以捕捉圖像的空間局部性。
2 實(shí)驗(yàn)及結(jié)果分析
2.1 數(shù)據(jù)集
實(shí)驗(yàn)所用數(shù)據(jù)集是由廣東市婦幼保健中心整理并公開的肺炎X射線數(shù)據(jù)集ChestRay2017[6]。該數(shù)據(jù)集包含5 856張X射線圖像,其中正常圖像1 583張,肺炎圖像4 273張,如圖3所示。為了進(jìn)行實(shí)驗(yàn),筆者將數(shù)據(jù)集按照6∶2∶2的比例分成訓(xùn)練集、驗(yàn)證集和測試集。對(duì)于肺炎X射線圖像,將其輸入尺寸設(shè)置為224×224,并將訓(xùn)練圖像的尺寸縮放至256×256。此外,筆者還對(duì)訓(xùn)練集進(jìn)行了隨機(jī)的水平和垂直翻轉(zhuǎn)以增強(qiáng)數(shù)據(jù)集。最后,將訓(xùn)練集轉(zhuǎn)換為向量格式,并進(jìn)行像素值歸一化,使其像素值范圍保持在0至255之間。
2.2 實(shí)驗(yàn)環(huán)境
本文的實(shí)驗(yàn)環(huán)境配置如下:操作系統(tǒng)為WindowsServer 2019;內(nèi)存為256GB;中央處理器由兩塊IntelXeon Gold 6154處理器構(gòu)成,主頻為3GHz,共有36個(gè)CPU 核心;圖像處理器采用兩塊并行的TITAN V 顯卡;使用的編程環(huán)境為PyCharm;開發(fā)框架基于GPU 的PyTorch;優(yōu)化器為隨機(jī)梯度下降優(yōu)化器(StochasticGradient Descent, SGD) 。此外,不同模型均使用相同參數(shù)進(jìn)行訓(xùn)練,最終選擇驗(yàn)證集中最小損失對(duì)應(yīng)的權(quán)重,用于測試集的評(píng)估。
2.3 評(píng)價(jià)指標(biāo)
為全面評(píng)估本文方法的分類性能,通過準(zhǔn)確率(Accuracy, Acc) 、召回率(Recall, Rec) 、精確率(Preci?sion, Pre) 及F1值(F1 Score, F1 Score) 四項(xiàng)指標(biāo)來評(píng)估模型的有效性,相關(guān)公式如(1)~(4)所示。其中,TP(True Positive) 表示樣本為正類且預(yù)測為正類;FP(False Positive) 表示樣本為負(fù)類且預(yù)測為正類;FN(False Negative) 表示樣本為正類但預(yù)測為負(fù)類;TN(True Negative) 表示樣本為負(fù)類且預(yù)測為負(fù)類。根據(jù)這四個(gè)指標(biāo)的值構(gòu)造混淆矩陣,以可視化分類結(jié)果。
2.4 實(shí)驗(yàn)結(jié)果
2.4.1 模型對(duì)比實(shí)驗(yàn)結(jié)果
模型對(duì)比實(shí)驗(yàn)結(jié)果如表1所示。
2.4.2 混淆矩陣可視化
混淆矩陣(Confusion Matrix) ,又稱可能性矩陣或錯(cuò)誤矩陣。在圖像精度評(píng)價(jià)中,混淆矩陣主要用于比較分類結(jié)果與實(shí)際測得值,展示分類模型在預(yù)測過程中對(duì)哪些部分產(chǎn)生了混淆,從而全面評(píng)估分類模型的性能和效果。圖4顯示了ResNet50與ResNet18的對(duì)比混淆矩陣:
在混淆矩陣中,各數(shù)值反映了分類模型性能的不同方面。在這種情況下,有153個(gè)樣本被正確分類為正類,而僅有9個(gè)樣本錯(cuò)誤分類為負(fù)類。此外,只有6 個(gè)樣本被錯(cuò)誤分類為正類,而334個(gè)樣本被正確分類為負(fù)類。這表明模型訓(xùn)練中有效數(shù)據(jù)的準(zhǔn)確率高達(dá)95%以上。相較之下,在本實(shí)驗(yàn)中,ResNet50的效果明顯優(yōu)于ResNet18。
3 結(jié)論
肺炎不僅會(huì)影響兒童的呼吸系統(tǒng),增加呼吸困難和呼吸衰竭的風(fēng)險(xiǎn),還可能引發(fā)其他器官的并發(fā)癥,例如心臟損害和大腦損害,對(duì)兒童的健康造成嚴(yán)重影響。因此,通過對(duì)大量兒童胸片數(shù)據(jù)的訓(xùn)練和優(yōu)化,研究中使用的深度學(xué)習(xí)ResNet50模型展現(xiàn)了較高的準(zhǔn)確性和可靠性。ResNet50模型具備強(qiáng)大的特征提取能力,能夠自動(dòng)學(xué)習(xí)圖像中的關(guān)鍵信息,從而實(shí)現(xiàn)對(duì)兒童肺炎的準(zhǔn)確分類。
與傳統(tǒng)肺炎診斷方法相比,基于深度學(xué)習(xí)ResNet50模型的分類方法在診斷準(zhǔn)確性、敏感性和特異性等方面具有顯著優(yōu)勢。研究結(jié)果表明,準(zhǔn)確率(Accuracy) 為96.61%,F(xiàn)1值(F1-score) 為97.53%,精確率(Precision) 為97.96%,召回率(Recall) 為97.71%?;谏疃葘W(xué)習(xí)ResNet50模型的兒童肺炎分類方法具有較高的泛化能力和魯棒性,能夠有效識(shí)別不同類型的兒童肺炎。
綜上所述,基于深度學(xué)習(xí)ResNet50模型的兒童肺炎分類研究證明了其在兒童肺炎診斷中的有效性和可行性,為醫(yī)生提供了一種新的自動(dòng)化技術(shù)手段,減輕了工作負(fù)擔(dān),并提高了醫(yī)療服務(wù)的質(zhì)量。