裴頌文,樊 靜,沈天馬,顧春華
1(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093) 2(中國(guó)科學(xué)院計(jì)算技術(shù)研究所 計(jì)算機(jī)體系結(jié)構(gòu)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100190)
X射線計(jì)算機(jī)斷層掃描儀(CT)在醫(yī)學(xué)領(lǐng)域做出了巨大的貢獻(xiàn).CT掃描產(chǎn)生一系列從人體不同角度拍攝的x射線圖像,并利用計(jì)算機(jī)創(chuàng)建并處理血管、骨骼和軟組織的橫斷面圖像(切片).目前,CT技術(shù)在社會(huì)上應(yīng)用廣泛.比如,可以診斷骨腫瘤,發(fā)現(xiàn)不能直接觀察到的內(nèi)部損傷和內(nèi)部出血.并且CT的密度分辨率較高,能夠輕易地分辨出人體組織或器官內(nèi)微小的差別.CT雖然給醫(yī)學(xué)診斷帶來了極大的便利,但是它的使用也引起了人們對(duì)輻射泄露的關(guān)注.CT圖像獲取過程中,當(dāng)患者所受到的輻射成倍增加時(shí),其誘發(fā)癌癥和患遺傳病的機(jī)會(huì)也顯著增加,這將嚴(yán)重威脅人們的身體健康.為了解決這個(gè)問題,人們采用了盡可能低的可行原則(ALARA)來保護(hù)患者免受過量的輻射劑量[1].
減少輻射劑量能降低患者風(fēng)險(xiǎn),但會(huì)增加CT圖像的噪聲并產(chǎn)生塊狀和蠟狀的偽影,從而影響醫(yī)生正確的診斷.國(guó)內(nèi)外在CT圖像降噪方面做了大量的工作,并通過各種方法取得了令人矚目的成果.目前降噪技術(shù)主要有3大類:1)重構(gòu)前的正弦濾波[2];2)迭代重建[3];3)重建后的圖像處理[4].均在一定程度上提高了圖像質(zhì)量,但仍然存在弊端.例如重構(gòu)圖像會(huì)引入偽影并產(chǎn)生模糊的邊緣信息;生成的圖像過于平滑而導(dǎo)致失真;迭代重建算法計(jì)算復(fù)雜度高等.
深度學(xué)習(xí)利用多層神經(jīng)網(wǎng)絡(luò)組成的計(jì)算模型提取圖像特征,并在高維空間中發(fā)現(xiàn)圖像數(shù)據(jù)的復(fù)雜結(jié)構(gòu).最近圖像超分辨率的卷積神經(jīng)網(wǎng)絡(luò)(CNN)被應(yīng)用于低劑量CT圖像降噪,獲得了顯著的性能提升.接著,人們提出了更為復(fù)雜的網(wǎng)絡(luò)模型來處理低劑量CT圖像噪聲問題.比如RED-CNN[5]和小波網(wǎng)絡(luò)[6].RED-CNN用卷積/反卷積層替代U-net的池化/上池化層.小波網(wǎng)絡(luò)則直接采用了U-net的快捷連接.
當(dāng)前,各種新型的網(wǎng)絡(luò)結(jié)構(gòu)都在低劑量CT圖像降噪領(lǐng)域取得了豐碩成果,但這些結(jié)構(gòu)仍存在一些弊端.首先,網(wǎng)絡(luò)模型普遍采用端到端的結(jié)構(gòu),這種結(jié)構(gòu)通常將網(wǎng)絡(luò)的輸出和真值之間的均方誤差(MSE)作為損失函數(shù),這種以像素為單位的均方誤差往往使得圖像邊緣過于平滑并損失細(xì)節(jié)信息.基于均方誤差的方法采用歐幾里德距離而不是采用測(cè)地距離獲取高分辨率圖像的平均值,將導(dǎo)致圖像模糊的后果并引入例如非均勻偏差的偽影.
為了解決上述問題,本文提出了面向低劑量CT圖像降噪的多生成器生成對(duì)抗網(wǎng)絡(luò)模型,具有以下特性:
1)提出的生成對(duì)抗網(wǎng)絡(luò)模型含有3個(gè)生成器,不同的生成器分別對(duì)低劑量CT圖像的泊松量子噪聲、高斯模糊和形變等3種不同類型的噪聲進(jìn)行有針對(duì)性的降噪.
2)引入了殘差網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)結(jié)構(gòu)中的快捷連接(shortcut connection)避免了訓(xùn)練過程中出現(xiàn)的梯度消失問題,提高了訓(xùn)練效率.
3)采用譜歸一化方法,通過采用權(quán)重矩陣的譜范數(shù)引入正則約束來穩(wěn)定網(wǎng)絡(luò)訓(xùn)練并使網(wǎng)絡(luò)更易收斂.
生成對(duì)抗網(wǎng)絡(luò)的作用是使得降噪后的低劑量CT圖像和正常劑量的CT圖像有著相同的數(shù)據(jù)分布,從而反映出模型的降噪效果.生成網(wǎng)絡(luò)G和判別網(wǎng)絡(luò)D在GAN框架中緊密耦合并被同時(shí)訓(xùn)練:G用來模擬真實(shí)數(shù)據(jù)的潛在分布,D則用來判別所得到的樣本是屬于真實(shí)分布還是生成的數(shù)據(jù)分布.當(dāng)前,GAN已經(jīng)在單張圖像的超分辨處理、藝術(shù)創(chuàng)作和圖像變換等領(lǐng)域有了較為廣泛的應(yīng)用.但是,GAN生成器的目標(biāo)函數(shù)是Jensen-Shannon(JS)散度,該散度的非連續(xù)性導(dǎo)致訓(xùn)練GAN的兩大問題:不穩(wěn)定性梯度和模式坍塌,從而導(dǎo)致GAN訓(xùn)練過程難以收斂.由于搬土距離(Earth Mover′s Distance:EMD)幾乎處處連續(xù)并可微分,Wasserstein-GAN(WGAN)提出用搬土距離EMD作為距離度量[7],并利用Kantorovich-Rubinstein 對(duì)偶性計(jì)算損失函數(shù):
(1)
其中f(x)是1-Lipschitz函數(shù);Ex~Prf(x)是當(dāng)x來自于真實(shí)樣本分布時(shí),f(x)的期望;Ex~Pgf(x)是當(dāng)x來自于生成樣本分布時(shí),f(x)的期望;sup是函數(shù)的上確界.W(Pr,Pg)是指Pr和Pg的搬土距離.
為了實(shí)現(xiàn)Lipschitz約束,WGAN會(huì)在每個(gè)梯度更新后將權(quán)重限制在一定范圍內(nèi).比如,Gulrajani通過增加梯度懲罰項(xiàng)來限制梯度[8]的方法提出了WGAN-GP.
隨著卷積神經(jīng)網(wǎng)絡(luò)[9]層數(shù)的增加,不同結(jié)構(gòu)之間的差異逐漸擴(kuò)大.VGGNet利用多層堆疊的小尺寸的卷積核將網(wǎng)絡(luò)深度增加到16層或19層,使得網(wǎng)絡(luò)能提取出更加復(fù)雜和具有代表性的特征[10].GoogleNet設(shè)計(jì)了inception模塊,該模塊近似最優(yōu)的局部稀疏結(jié)構(gòu)并采用不同大小的卷積核來捕捉不同尺度的圖像細(xì)節(jié).此外,瓶頸層也減少了計(jì)算量[11].
然而,訓(xùn)練深層次的網(wǎng)絡(luò)結(jié)構(gòu)會(huì)產(chǎn)生一系列問題:梯度消失或爆炸將嚴(yán)重影響網(wǎng)絡(luò)的收斂性;訓(xùn)練層數(shù)過多反而導(dǎo)致精度飽和甚至降低;卷積網(wǎng)絡(luò)僅提取圖像中的一部分信息,深度卷積網(wǎng)絡(luò)可能僅從原始圖像中提取了少量特征,導(dǎo)致丟失了更多的細(xì)節(jié)特征.深度殘差網(wǎng)絡(luò)(ResNet)[12]采用快捷連接(shortcut connection)解決網(wǎng)絡(luò)退化問題.恒等快捷連接可越過一個(gè)或多個(gè)卷積層,通過恒等映射直接將輸入添加到堆疊層的輸出,保證了信息的完整性.殘差結(jié)構(gòu)既未增加額外參數(shù),也未提高計(jì)算復(fù)雜度.實(shí)驗(yàn)結(jié)果表明,ResNet模型比VGGNet和GoogleNet的分類準(zhǔn)確率更高[13-15].
圖像成像過程中經(jīng)常引入不同類型的噪聲和偽影.隨著深度學(xué)習(xí)的發(fā)展,深度神經(jīng)網(wǎng)絡(luò)模型被應(yīng)用于圖像降噪.例如,生成對(duì)抗網(wǎng)絡(luò)的生成器和判別器都采用卷積神經(jīng)網(wǎng)絡(luò)的形式來實(shí)現(xiàn)低劑量CT圖像的降噪[16].使用WGAN和視覺損失函數(shù)來捕捉圖像微小的紋理和特征[17].利用對(duì)抗網(wǎng)絡(luò)和清晰度檢測(cè)網(wǎng)絡(luò)來獲取微小的分辨率損失并消除圖片模糊的效果[18].在缺乏配對(duì)的訓(xùn)練樣本時(shí),采用嵌入保真度(fidelity-embedded)的生成對(duì)抗網(wǎng)絡(luò)對(duì)低劑量CT圖像降噪[19].有條件約束的生成對(duì)抗網(wǎng)絡(luò)(CGAN)被用來給胸部低劑量CT圖像降噪[20].
盡管以上深度學(xué)習(xí)網(wǎng)絡(luò)在低劑量CT圖像降噪領(lǐng)域取得了成果,但是均存在弊端.比如,以均方誤差為損失函數(shù)的方法將導(dǎo)致降噪后的圖像過于平滑并丟失一些細(xì)節(jié)特征信息;部分深度學(xué)習(xí)網(wǎng)絡(luò)則會(huì)產(chǎn)生圖像偽影.
CT圖像噪聲大致可分為3類:泊松量子噪聲,高斯模糊噪聲和形變?cè)肼昜21].因此,本文將低劑量CT圖像的噪聲視為多分布組合的數(shù)據(jù),即其分布具有多個(gè)“峰值”.標(biāo)簽是標(biāo)準(zhǔn)劑量的CT圖像(NDCT),可以視其為真實(shí)數(shù)據(jù)分布.為了能夠更有效地對(duì)圖像降噪,本文提出了具有多生成器的并行框架,每個(gè)生成器有針對(duì)性地?cái)M合不同噪聲分布.多生成器的生成對(duì)抗網(wǎng)絡(luò)是以WGAN為基礎(chǔ).不同的是,模型由3個(gè)不同的生成器Generator1、Generator2、Generator3和一個(gè)判別器Discriminator組成.3個(gè)生成器使用相加方式級(jí)聯(lián),僅會(huì)以線性增長(zhǎng)方式適當(dāng)增加計(jì)算復(fù)雜度.
概率統(tǒng)計(jì)模型顯示,復(fù)雜數(shù)據(jù)分布往往是多個(gè)獨(dú)立隨機(jī)
變量的聯(lián)合分布.圖1噪聲分布仿真圖,圖1(a)展示了一些散落在分布外的點(diǎn),說明僅僅一個(gè)隨機(jī)分布模型不能很好地?cái)M合所有的隨機(jī)變量.如圖1(b)所示,采用多個(gè)隨機(jī)模型擬合復(fù)雜的分布,可以獲得較好效果.因此,本文采取了并行的多生成器網(wǎng)絡(luò)擬合多種噪聲,從而實(shí)現(xiàn)多維降噪的目的.
設(shè)不同生成器生成的CT圖分布為Pgi,標(biāo)準(zhǔn)劑量CT圖數(shù)據(jù)分布為Pr,則生成對(duì)抗網(wǎng)絡(luò)的損失函數(shù)滿足:
(2)
圖2 概率分布λiPr和PgiFig.2 Probability distribution λiPr and Pgi
根據(jù)搬土距離的定義,損失函數(shù)可進(jìn)一步定義:
(3)
其中,xi是真實(shí)分布λiPr里的隨機(jī)變量;yi是生成分布里Pgi的隨機(jī)變量;xi-yi表示兩者之間的歐氏距離;γi為聯(lián)合概率分布,并且γi∈Π(λiPr,Pgi),即γi為邊緣分布分別為λiPr和Pgi所有分布的集合.inf表示下確界.接著引入優(yōu)化函數(shù)f取代對(duì)聯(lián)合分布γi的限制,得公式(4):
(4)
根據(jù)極大極小值原理,公式(4)可轉(zhuǎn)化為:
(5)
由于下確界inf是凹的,并且Lipschitz連續(xù)函數(shù)f可以和inf產(chǎn)生同樣的優(yōu)化效果,于是將公式(5)轉(zhuǎn)換為對(duì)上限的約束,得到搬土距離的對(duì)偶形式,如公式(6)所示.
(6)
(7)
(8)
其中W為權(quán)重矩陣,然后用一對(duì)近似奇異向量逼近W的譜范數(shù)[23]:
(9)
對(duì)每個(gè)權(quán)重矩陣進(jìn)行譜歸一化之后,公式可簡(jiǎn)化為:
(10)
3.4.1 三生成器生成對(duì)抗網(wǎng)絡(luò)模型
三生成器的生成對(duì)抗網(wǎng)絡(luò)的整體框架如圖3所示,首先以一定的比例β1,β2,β3將低劑量CT圖像放入網(wǎng)絡(luò).根據(jù)對(duì)CT圖像的實(shí)驗(yàn)分析可知,泊松噪聲明顯比高斯模糊噪聲和形變?cè)肼暥?,并且高斯模糊噪聲多于形變?cè)肼?,所以參?shù)的選取按照β3>β1>β2的原則.本文采用了兩種損失函數(shù),包括生成對(duì)抗網(wǎng)絡(luò)的損失函數(shù)(La)和均方誤差損失函數(shù)(Lp1,Lp2,Lp3).均方誤差損失函數(shù)是用來最小化像素級(jí)別的誤差,并且能使每個(gè)生成器對(duì)不同噪聲都有降噪的專一性和有效性.例如,Generator1針對(duì)高斯模糊,那Generator1生成的G1 image除了與G2 image和G3 image放入判別器,還與擁有泊松噪聲和形變?cè)肼?D23 image)的圖像數(shù)據(jù)集進(jìn)行均值平方誤差的計(jì)算.損失函數(shù)如公式(11)所示:
Loss=La+Lp1+Lp2+Lp3
(11)
(12)
(13)
(14)
(15)
圖3 三生成器的生成對(duì)抗網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Framework of GAN with triple generators
其中La表示生成對(duì)抗網(wǎng)絡(luò)損失函數(shù),‖·‖代表Frobenius-2范數(shù); z表示低劑量CT圖像;D23、D13、D12是具有不同噪聲的圖像,如圖3所示;Lp1、Lp2、Lp3表示像素?fù)p失,而β1,β2,β3是預(yù)定義的加權(quán)參數(shù).
3.4.2 生成器
生成器采用的是編碼器-解碼器的對(duì)稱結(jié)構(gòu),直接學(xué)習(xí)低劑量CT圖像到生成圖像的端到端映射,如圖4所示.在每個(gè)生成器中,網(wǎng)絡(luò)模型前端有兩個(gè)卷積層,網(wǎng)絡(luò)模型后端對(duì)應(yīng)兩個(gè)反卷積層,最后3個(gè)生成器的輸出相加,輸入到一個(gè)卷積核數(shù)量為3(RGB圖片通道數(shù)為3)的卷積層中,作為最終生成模型輸出.模型在卷積層和反卷積層中間加入了殘差網(wǎng)絡(luò)模塊(BasicBlock),這些模塊通過恒等快捷連接來解決網(wǎng)絡(luò)由于層數(shù)過多可能引起的網(wǎng)絡(luò)退化問題.卷積層使用了3*3大小的卷積核,沒有用更大尺寸的卷積核是因?yàn)?*3的卷積核有更少的參數(shù),更多的非線性的同時(shí),網(wǎng)絡(luò)有著更為理想的感受野.卷積層分別有32和64個(gè)卷積核,對(duì)應(yīng)地反卷積層分別有64和32個(gè)卷積核.所有的訓(xùn)練層都用了relu激活函數(shù)增加網(wǎng)絡(luò)非線性,避免了梯度消失問題的出現(xiàn)并且減少了網(wǎng)絡(luò)的計(jì)算量.
圖4 生成器的網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Framework of generator
3.4.3 判別器
判別器是判別圖片是來自標(biāo)準(zhǔn)劑量CT圖像還是生成器生成的圖像.其網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示.判別器有4層卷積層,分別有32,64,128,256個(gè)卷積核.判別器的末端有兩個(gè)全連接層,第1個(gè)全連接層有1024個(gè)輸出而第2個(gè)全連接層只有1個(gè)輸出.因?yàn)樗惴ǖ幕A(chǔ)是WGAN,所以模型沒有使用sigmoid函數(shù).
圖5 判別器的網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Framework of discriminator
本文從“the 2016 NIH-AAPM-Mayo Clinic Low Dose CT Grand Challenge”(1)https://www.aapm.org/GrandChallenge/LowDoseCT授權(quán)的臨床數(shù)據(jù)中,隨機(jī)抽取了9000張作為訓(xùn)練集,選取了230張為測(cè)試集.為了建立低劑量CT圖像數(shù)據(jù)集,隨機(jī)給標(biāo)簽加入了泊松噪聲、高斯模糊噪聲和形變?cè)肼?每次迭代數(shù)據(jù)批次大小為64.超參數(shù)β1=0.3,β2=0.2,β3=0.5.實(shí)驗(yàn)環(huán)境為python3.5和tensorflow1.9;CPU為i7 7700k;內(nèi)存為48GB;GPU是兩塊英偉達(dá)GTX1080TI.數(shù)據(jù)集如圖6所示,NDCT為標(biāo)準(zhǔn)劑量CT圖像,LDCT為低劑量CT圖像.D23 image是添加了泊松噪聲和形變?cè)肼暤腃T圖像;D12 image是添加了高斯模糊和形變?cè)肼暤腃T圖像;D13 image是添加了泊松噪聲和高斯模糊噪聲的CT圖像.訓(xùn)練集和測(cè)試集的CT圖像像素都縮放至256×256.
為了更加客觀地測(cè)試本算法的性能,本文采用了兩個(gè)圖像質(zhì)量評(píng)價(jià)指標(biāo):峰值信噪比(PSNR)和結(jié)構(gòu)相似性(SSIM).峰值信噪比是最大像素值和兩圖像均方誤差的比值.但由于峰值信噪比是基于像素點(diǎn)的誤差,并未考慮人眼的特性,結(jié)果會(huì)出現(xiàn)評(píng)價(jià)指標(biāo)和人眼主觀感覺不一致的現(xiàn)象.因此,本文另增加了SSIM作為評(píng)價(jià)指標(biāo).該指標(biāo)從3個(gè)方面表示圖像特征:均值亮度、標(biāo)準(zhǔn)差對(duì)比度和協(xié)方差.把不同模型的實(shí)驗(yàn)結(jié)果圖分別和標(biāo)準(zhǔn)劑量CT圖像作比較,計(jì)算相應(yīng)的PSNR和SSIM.兩個(gè)指標(biāo)值越高,說明圖像降噪效果越顯著.
圖6 腹部橫截面CT圖像Fig.6 Transverse CT images of the abdomen
4.3 實(shí)驗(yàn)結(jié)果量化分析
4.3.1 人眼視覺評(píng)價(jià)
基于人眼視覺評(píng)價(jià)的實(shí)驗(yàn)結(jié)果如圖7所示,通過5個(gè)不同降噪算法的對(duì)比對(duì)本模型的結(jié)果進(jìn)行評(píng)估.其中兩種傳統(tǒng)算法包括三維塊匹配算法[24](BM3D)和非局部均值法[25](NLM),這兩種降噪算法最為經(jīng)典并且在傳統(tǒng)算法中效果最佳.除此之外,還和低劑量CT圖像降噪領(lǐng)域主流的深度學(xué)習(xí)模型進(jìn)行了比較,模型包括前饋去噪卷積神經(jīng)網(wǎng)絡(luò)(DnCNN)[26]、生成對(duì)抗網(wǎng)絡(luò)(GAN)[17]以及帶有殘差結(jié)構(gòu)的生成對(duì)抗網(wǎng)絡(luò)(GAN+Resnet).如圖8所示,實(shí)驗(yàn)選取了代表性切片圖像(前5張和后6張分別為圖6和圖7的白色矩形區(qū)域).不同的算法表現(xiàn)出不同的降噪能力.從圖7(a)和圖8(f) 可知,BM3D雖然有效地降低了噪聲,但會(huì)導(dǎo)致實(shí)驗(yàn)結(jié)果圖像過于平滑而失真,丟失了很多圖像的細(xì)節(jié)信息.例如,圖8(f)的紅色箭頭所指區(qū)域,在NDCT和深度學(xué)習(xí)算法處理的圖像中有明顯的陰影,而在BM3D方法中陰影就不是很明顯.NLM的降噪效果不如BM3D,泊松噪聲和高斯模糊都沒有得到有效的去除.和傳統(tǒng)的降噪算法相比,深度學(xué)習(xí)算法在視覺上更接近NDCT圖像.DnCNN在降噪上取得了不錯(cuò)的效果,但是丟失了部分邊緣信息.并且從圖8(h)可以看出,DnCNN引入了一些偽影.GAN不僅成功地映射了數(shù)據(jù)分布而且保留了圖像重要的信息.帶有殘差網(wǎng)絡(luò)的GAN+Resnet和GAN的實(shí)驗(yàn)結(jié)果圖像較接近,均取得到顯著的降噪效果.如圖7(f)和圖8(k)所示,三生成器的生成對(duì)抗網(wǎng)絡(luò)產(chǎn)生的圖像從視覺上最接近NDCT圖像,表明TriGAN模型和BM3D,NLM以及DnCNN深度學(xué)習(xí)模型相比較,降噪效果最佳
圖7 不同模型的降噪效果Fig.7 Denoised images using different methods
.
圖8 不同圖像的感興趣區(qū)域Fig.8 Zoomed ROI of different CT images
4.3.2 定量分析
本文采用峰值信噪比(PSNR)和結(jié)構(gòu)相似性(SSIM)作為圖像降噪質(zhì)量的量化評(píng)價(jià)指標(biāo).具體的數(shù)值如表1所示,其中第2列和第3列數(shù)值對(duì)應(yīng)圖7,第4列和第5列數(shù)值對(duì)應(yīng)圖8.顯然,深度學(xué)習(xí)模型的指標(biāo)數(shù)值均高于傳統(tǒng)算法.因此,深度學(xué)習(xí)模型比傳統(tǒng)降噪算法更適用于低劑量CT圖像降噪.采用GAN和帶有殘差網(wǎng)絡(luò)的GAN(GAN+Resnet)降噪后的圖像數(shù)值相近,因?yàn)闅埐罹W(wǎng)絡(luò)主要是加速網(wǎng)絡(luò)收斂,對(duì)降噪質(zhì)量不會(huì)有明顯的影響.多生成器的并行結(jié)構(gòu)使得TriGAN模型在PSNR和SSIM兩大指標(biāo)上均為最佳,PSNR值為26.67.與傳統(tǒng)算法BM3D、NLM相比平均提高了約30%,與深度學(xué)習(xí)模型相比平均提高了4.5%;SSIM值為0.98,比傳統(tǒng)算法BM3D、NLM平均提高了10%,比深度學(xué)習(xí)模型提高了1.5%.
表1 圖7和圖8的定量指標(biāo)分析Table 1 Quantitative results ofFig.7 andFig.8
4.3.3 統(tǒng)計(jì)特性分析
為了進(jìn)一步了解不同算法的降噪效果,本文通過計(jì)算亨氏單位的平均CT數(shù)(Mean)和標(biāo)準(zhǔn)差(SD)來檢驗(yàn)其統(tǒng)計(jì)特性.在理想的情況下,降噪算法的Mean和SD應(yīng)該盡可能接近黃金標(biāo)準(zhǔn).在實(shí)驗(yàn)中,標(biāo)準(zhǔn)劑量CT圖像(NDCT)作為黃金標(biāo)準(zhǔn),因?yàn)镹DCT圖像在數(shù)據(jù)集中有最好的圖像質(zhì)量.實(shí)驗(yàn)分別計(jì)算了圖6,圖7和圖8的Mean和SD.如表2所示,表格前2列為圖8的指標(biāo),前5行后2列為圖6的指標(biāo),后6行后2列為圖7的指標(biāo).BM3D的標(biāo)準(zhǔn)差明顯小于NDCT標(biāo)準(zhǔn)差,說明BM3D生成的圖像過于平滑.NLM的均值和標(biāo)準(zhǔn)差比NDCT高出近11和14,表明其并沒有優(yōu)良的降噪能力并可能引入了偽影.GAN和帶有殘差網(wǎng)絡(luò)的GAN(GAN+Resnet)與傳統(tǒng)的降噪算法相比均更接近NDCT的指標(biāo).由于DnCNN丟失了圖像部分邊緣信息且產(chǎn)生了偽影,DnCNN的標(biāo)準(zhǔn)差很小.
表2 圖6,圖7和圖8的統(tǒng)計(jì)特性Table 2 Statistical property inFig.6,fig.7 andFig.8
4.3.4 模型收斂性
本文分別計(jì)算了GAN、帶殘差網(wǎng)絡(luò)的GAN (GAN+Resnet)和TriGAN的Wasserstein估計(jì)值.如圖9所示,隨著迭代次數(shù)的增加,Wasserstein估計(jì)值均逐漸減少,并在迭代10000次后趨于穩(wěn)定.帶有殘差網(wǎng)絡(luò)的GAN(GAN+Resnet)在訓(xùn)練初始階段,Wasserstein估計(jì)值下降的更快并且和GAN有著相近的Wasserstein估計(jì)值,進(jìn)一步證明了殘差網(wǎng)絡(luò)收斂的有效性.TriGAN的殘差模塊和譜歸一化均加速了收斂.
圖9 Wasserstein收斂估計(jì)Fig.9 Wasserstein estimation convergence
本文介紹了一種基于多生成器的生成對(duì)抗網(wǎng)絡(luò)的降噪 模型(TriGAN).例如,BM3D 會(huì)過度平滑圖像并丟失一些重要信息.深度卷積神經(jīng)網(wǎng)絡(luò)能更好地?cái)M合復(fù)雜的噪聲分布.然而,簡(jiǎn)單卷積層疊加的降噪效果是非常有限的.因此,本文引入了生成對(duì)抗深度學(xué)習(xí)模型,在CT圖像降噪的同時(shí)能更有效地保留原始圖像的真實(shí)信息和細(xì)節(jié)特征.由于CT圖像的噪聲由不同類型的噪聲分布組成,本文提出了一種三生成器的結(jié)構(gòu)擬合不同的噪聲.此外,還引入了以像素為單位的均方誤差損失,以保證重要的信息不丟失.殘差網(wǎng)絡(luò)和譜歸一化對(duì)神經(jīng)網(wǎng)絡(luò)的收斂性和穩(wěn)定性產(chǎn)生了積極作用.