史婧婷,馬 煒,劉 婷,陳旭輝
(1.福州大學(xué) 物理與信息工程學(xué)院,福建 福州 350108;2.福建省醫(yī)療器械和醫(yī)藥技術(shù)重點實驗室,福建 福州 350108)
運動中肌肉負(fù)荷收縮過量易引起炎癥,確認(rèn)肌肉有效收縮可以幫助運動主體強調(diào)運動上下限,輔助康復(fù)訓(xùn)練。有效肌肉收縮運動是肌肉疾病康復(fù)訓(xùn)練的關(guān)鍵,肌肉收縮力量訓(xùn)練對預(yù)防肌肉拉傷及勞損具有重要意義[1-3]。肌肉等軟組織常用超聲進(jìn)行成像,超聲成像旨在生成感興趣組織的聲學(xué)特性圖,與磁共振成像(Magnetic Resonance Imaging,MRI)或計算機斷層掃描(Computed Tomography,CT)等其他成像方式相比,具有非電離輻射、可移動、運營成本低以及實時成像的優(yōu)勢[4]。隨著近年來超聲分辨率的提高,其對軟組織損傷、積液、異物、腫瘤、血流保持較高的檢出率[5]。本研究擬結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)模型實現(xiàn)對肱二頭肌超聲圖像的特征提取與量化,達(dá)到有效分類肌肉收縮圖像的目標(biāo),探討超聲在肌肉訓(xùn)練康復(fù)療效評估中的應(yīng)用價值。
超聲圖像采集設(shè)備為飛依諾掌上超聲診斷儀Q5-7LMIX520,采集部位為健康受試者肱二頭肌,分別采集肌肉放松和帶負(fù)重(2.5 kg)的肌肉靜態(tài)收縮狀態(tài)。其中男性和女性各5 例,年齡為(23±1.5)歲。多次、多天進(jìn)行采集,共采集2 000 余張圖片,兩類圖像數(shù)量相當(dāng),避免數(shù)量差帶來的影響。
主體使用Python 3.6 作為開發(fā)語言。Python 是一種介于面向?qū)ο缶幊毯秃瘮?shù)式編程之間的編程語言,具有迭代庫、類定義、函數(shù)以及對象等[6]。與其他編程語言相比,其在深度神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練上更具顯著優(yōu)勢[7]。以Pytoch 為框架,該框架功能豐富,能較為迅速地完成深度學(xué)習(xí)模型的構(gòu)建和形成。和Tensorflow 框架相比,Pytorch 的動態(tài)特性使訓(xùn)練過程和數(shù)據(jù)更改更為直觀,調(diào)整參數(shù)也更加方便。硬件方面采用了具備Windows 10 系統(tǒng)的計算機,處理器CPU 為Intel Core I7-6700K,主頻為4 GHz,顯卡為NVIDIA GeForce GTX 1070Ti。
相較于傳統(tǒng)方法,深度學(xué)習(xí)使用更深層次的網(wǎng)絡(luò)和非線性相映射結(jié)構(gòu),通過提取數(shù)據(jù)更高層次的特征來發(fā)現(xiàn)數(shù)據(jù)在高層次特征中的關(guān)系,可以彌補傳統(tǒng)方法分類功能的不足[8-9]。圖1 為簡單的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)。
圖1 多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
在深度學(xué)習(xí)中,CNN 是一種非常經(jīng)典的結(jié)構(gòu),其靈感來自于人類的視覺感知機制。隨著神經(jīng)網(wǎng)絡(luò)和硬件的改進(jìn),CNN 網(wǎng)絡(luò)結(jié)構(gòu)越來越深。網(wǎng)絡(luò)的層數(shù)越多,意味著能夠提取到的不同的特征越豐富。目前,生物醫(yī)學(xué)領(lǐng)域已經(jīng)提出了許多神經(jīng)網(wǎng)絡(luò)架構(gòu)用于醫(yī)學(xué)圖像分類,常用于醫(yī)學(xué)圖像分類的模型框架是CNN?;贑NN 的常見深度學(xué)習(xí)架構(gòu)中主要使用3個重要層,即卷積層、池化層以及全連接層[10]。其中,深度殘差網(wǎng)絡(luò)ResNet101 和VGG19 深度網(wǎng)絡(luò)模型常被用于CNN 的分類任務(wù)[11]。本文將使用這兩種模型提取圖像特征,進(jìn)行肌肉收縮超聲圖像分類。
在原始圖像數(shù)據(jù)中選擇包含完整肌肉纖維且較為清晰的圖像,刪除原始圖像中非目標(biāo)的冗余區(qū)域。針對超聲圖像的特征,采用斑點抑制各向異性擴散濾波器(Speckle Reduce Anisotropic Diffusion,SRAD)對其進(jìn)行濾波處理,降低高頻分量的幅值,防止高頻段的特征信息被噪聲覆蓋,降低噪聲等無關(guān)信息對訓(xùn)練結(jié)果的影響。
2.2.1 ResNet 模型
殘差神經(jīng)網(wǎng)絡(luò)(ResNet)是由微軟研究所的何愷明、張祥雨等人首次提出,其發(fā)現(xiàn)了“退化現(xiàn)象(Degradation)”,并針對該現(xiàn)象發(fā)明了“快捷連接(Shortcut connection)”。如果一味簡單地增加網(wǎng)絡(luò)深度,會導(dǎo)致梯度彌散或梯度爆炸。ResNet 模型添加了快捷連接并使用殘差函數(shù),可以減少深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差。ResNet 有兩種類型的結(jié)構(gòu)塊,即Conv Block 和Identity Block,如圖2 所示。
圖2 ResNet 結(jié)構(gòu)塊
3 個卷積層構(gòu)成一個殘差塊,這3 個卷積層的尺寸分布是1×1,3×3 和5×5。其中,1×1 層先降維后增維,3×3 層的輸入輸出維度更小[12]。為了改善線性結(jié)構(gòu)引起的問題,ResNet 中引入了非線性深度殘差學(xué)習(xí)框架,在圖像分類任務(wù)中表現(xiàn)良好。ResNet 的圖像處理流程如圖3 所示。
圖3 ResNet 圖像處理流程
2.2.2 VGG 模型
VGGNet 是由SIMONIAN 等人設(shè)計的卷積神經(jīng)網(wǎng)絡(luò),主要通過11×11 和5×5 的卷積核依次替換大小為3×3 的卷積核[13]。小的卷積核可以增加非線性網(wǎng)絡(luò)的深度,使網(wǎng)絡(luò)能夠?qū)W習(xí)更復(fù)雜的特征。
VGG19 的結(jié)構(gòu)非常簡潔,由16 個卷積層、5個最大池化層、3 個全連接層以及1 個輸出層組成,不同卷積層中的卷積核數(shù)量為64,128 或256。VGG19 中的卷積核用于計算不同的特征圖,其流程如圖4 所示。
圖4 VGG19 圖像處理流程
通過CNN 模型對健康人體肱二頭肌的超聲圖像進(jìn)行特征提取并分類,對具有不同結(jié)構(gòu)和特色的兩種CNN 模型,即ResNet101 模型和VGG19 模型進(jìn)行測試。在模型的分類訓(xùn)練中,將超聲圖像數(shù)據(jù)集分為訓(xùn)練集和測試集,分別按照75%與25%的比例隨機挑選,以保證分類結(jié)果的客觀性??紤]到GPU、CPU 及內(nèi)存性能,將上述兩種模型在相同平臺上運行50 次,兩種模型的訓(xùn)練集、測試集正確率和損失曲線如圖5、圖6 所示。
圖5 兩種模型的準(zhǔn)確率對比
圖6 兩種模型的損失曲線對比
微調(diào)學(xué)習(xí)率、批量大小(batch size)等參數(shù),重復(fù)訓(xùn)練多次,獲得模型準(zhǔn)確率最高值、平均值及模型大小,如表1 所示。
表1 模型測試結(jié)果對比
從圖6、圖7 可以看出,VGG19 訓(xùn)練集和測試集的正確率與損失曲線變化更顯著,波形無明顯震蕩。在兩種CNN 模型中,VGG19 模型在訓(xùn)練集上收斂速度最快,訓(xùn)練效果最優(yōu),表現(xiàn)出良好的分類性能。此外,其在測試集中的表現(xiàn)同樣比ResNet 101 模型要好,平均準(zhǔn)確率為91.00%,分類效果不俗。但是,VGG19 模型占用更多的計算資源,而且使用更多的網(wǎng)絡(luò)參數(shù),在訓(xùn)練時間上存在劣勢。ResNet101 的深度為152 層,是VGG19 模型的8 倍,但ResNet101 的分類效果反而更差,之所以出現(xiàn)這種現(xiàn)象,是因為本研究數(shù)據(jù)集不大,且二類分任務(wù)復(fù)雜度較低,較深網(wǎng)絡(luò)模型反而不占優(yōu)勢。VGG19模型的獨特簡潔結(jié)構(gòu)使決策函數(shù)的光滑度和泛化能力得到加強,非常適用于與本研究類似的小數(shù)據(jù)樣本訓(xùn)練,效率較高。通過實驗,在兩種模型上均訓(xùn)練出了可觀的結(jié)果,證明了基于CNN 對肌肉收縮進(jìn)行分類的可行性。
以CNN 為代表的深度學(xué)習(xí)網(wǎng)絡(luò)模型常被用于生物醫(yī)學(xué)圖像分類領(lǐng)域,通過對兩種不同網(wǎng)絡(luò)深度、結(jié)構(gòu)及功能的CNN 模型進(jìn)行分類訓(xùn)練測試,綜合來看VGG19 模型的分類效果較好,正確率較高。本研究成果可輔助肌肉康復(fù)訓(xùn)練,確認(rèn)肌肉的有效收縮。在未來的研究中,將增加數(shù)據(jù)樣本量并同步微調(diào)網(wǎng)絡(luò)參數(shù),以減少過擬合和欠擬合現(xiàn)象,從而實現(xiàn)準(zhǔn)確性更高、適應(yīng)性更強以及適用范圍更廣,為運動康復(fù)領(lǐng)域的肌肉康復(fù)訓(xùn)練監(jiān)測奠定堅實基礎(chǔ)。