史再峰,李慧龍,程?明,曹清潔,王子菊
基于SDN-GMM網(wǎng)絡(luò)的低劑量雙能CT投影數(shù)據(jù)去噪方法
史再峰1, 2,李慧龍1,程?明1,曹清潔3,王子菊1
(1. 天津大學(xué)微電子學(xué)院,天津 300072;2. 天津市成像與感知微電子技術(shù)重點實驗室,天津 300072;3. 天津師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,天津 300387)
低劑量雙能計算機斷層掃描成像(DECT)技術(shù)可以在提供人體內(nèi)部結(jié)構(gòu)及組織成分信息的同時減少X射線輻射劑量. 然而,劑量的降低會導(dǎo)致DECT重建圖像中出現(xiàn)大量的噪聲及偽影,從而影響對疾病的精確診斷. 為實現(xiàn)在低劑量條件下重建出高質(zhì)量的DECT圖像,提出了一種采用混合高斯模型的正弦圖去噪網(wǎng)絡(luò)來進行偽影及噪聲消除. 該網(wǎng)絡(luò)由兩部分構(gòu)成:一部分通過殘差學(xué)習(xí)以有監(jiān)督的方式對校準后低劑量與正常劑量下DECT投影數(shù)據(jù)的映射關(guān)系進行擬合;另一部分采用混合高斯模型以無監(jiān)督學(xué)習(xí)的方式提取DECT投影數(shù)據(jù)中噪聲的分布模型. 采用這種監(jiān)督與無監(jiān)督學(xué)習(xí)結(jié)合的方式,不僅可以利用卷積運算的特征提取能力來擬合輸入與標簽之間任意復(fù)雜的映射關(guān)系,還可以在無標簽約束的情況下,利用輸入投影數(shù)據(jù)的自身分布規(guī)律來提高網(wǎng)絡(luò)模型去噪性能及其泛化能力. 實驗使用了XCAT生成的10名不同人體DECT投影數(shù)據(jù)對網(wǎng)絡(luò)模型進行訓(xùn)練及測試. 實驗結(jié)果表明,與正常劑量下獲得的重建圖像相比,該方法所獲得的去噪后圖像均方根誤差值低于6×10-3,峰值信噪比以及結(jié)構(gòu)相似性指數(shù)分別超過36.7dB和0.992. 相比于目前先進的低劑量CT噪聲去除方法,該方法得到的DECT重建圖像中組織結(jié)構(gòu)更加清晰,并且可保留更多的細節(jié)信息,可為后續(xù)醫(yī)療診斷提供精準參考.
雙能計算機斷層掃描成像;低劑量;殘差學(xué)習(xí);無監(jiān)督學(xué)習(xí);混合高斯模型
計算機斷層掃描成像(computed tomography,CT)由于可以提供患者的解剖結(jié)構(gòu)信息,現(xiàn)已成為現(xiàn)代醫(yī)學(xué)實踐中必不可少的工具[1].相比于傳統(tǒng)CT,雙能CT(dual-energy CT,DECT)能夠同時獲得兩個不同能量段下的衰減信息,進而在實現(xiàn)更加準確物質(zhì)識別的同時,提供定量的組織信息.然而,在CT檢查過程中較高的輻射劑量會增大患癌風(fēng)險[2],但降低輻射劑量又會在探測過程中引入更多的噪聲,從而影響疾病診斷.因此,目前已經(jīng)提出了許多方法來改善低劑量條件下CT圖像的質(zhì)量,主要可以分為3類:圖像重建之前對投影數(shù)據(jù)中噪聲進行建模分析的投影數(shù)據(jù)濾波算法[3],直接對重建后的CT圖像進行噪聲及偽影去除的圖像后處理算法[4],以及通過添加先驗信息實現(xiàn)低劑量CT圖像迭代重建的方法[5].這類傳統(tǒng)方法雖然可以在一定程度上去除重建后圖像中的噪聲及偽影,但是在CT探測過程中往往存在一些無法精準預(yù)測的隨機噪聲,因此該類方法的性能受到了一定程度的限制.相比于正常劑量下獲得的圖像依然存在圖像分辨率下降以及邊緣模糊等問題.
近幾年隨著深度學(xué)習(xí)技術(shù)的廣泛應(yīng)用[6-7],越來越多通過監(jiān)督學(xué)習(xí)實現(xiàn)低劑量CT圖像去噪的方法被提出[8].對于監(jiān)督學(xué)習(xí)而言,標簽的存在使得任意復(fù)雜的映射關(guān)系都可以通過網(wǎng)絡(luò)不斷的參數(shù)更新進行擬合,這極大地提升了對圖像中噪聲識別的準確性.Chen等[9]成功開發(fā)了帶有殘差學(xué)習(xí)的卷積自動編解碼網(wǎng)絡(luò)從而實現(xiàn)了從低劑量到正常劑量CT圖像的轉(zhuǎn)換.Wolterink等[10]將生成對抗網(wǎng)絡(luò)應(yīng)用于低劑量CT去噪,最終獲得了十分接近正常劑量下的重建圖像.此外,使用混合損失函數(shù)作為網(wǎng)絡(luò)訓(xùn)練目標的方法也被證明可以在圖像細節(jié)保留方面取得突出的效果[11-12].然而,受限于該領(lǐng)域可用數(shù)據(jù)集的數(shù)量,這些基于深度學(xué)習(xí)的方法在臨床應(yīng)用中的魯棒性仍然是個問題.研究表明[13]某些干擾或噪聲可能會誤導(dǎo)網(wǎng)絡(luò)的輸出結(jié)果,導(dǎo)致無法檢測到組織的已有病變.此外,由于監(jiān)督學(xué)習(xí)的目的在于擬合輸入和標簽之間的映射關(guān)系,網(wǎng)絡(luò)在訓(xùn)練過程中可能會忽略輸入數(shù)據(jù)自身的分布規(guī)律,進而導(dǎo)致訓(xùn)練好的網(wǎng)絡(luò)模型在測試集上效果不佳.尤其對于DECT而言,兩個能量區(qū)間下獲得的掃描數(shù)據(jù)具有高度的空間相關(guān)性和結(jié)構(gòu)相關(guān)性,這些信息十分有利于對劑量降低產(chǎn)生的噪聲進行精確識別.
因此,為了充分利用DECT投影數(shù)據(jù)分布信息以及在能譜維度上的信息相關(guān)性,本文提出一種結(jié)合混合高斯模型的DECT正弦圖噪聲去除網(wǎng)絡(luò)(sinogram denoising network with Gaussian mixture model,SDN-GMM)實現(xiàn)低劑量DECT圖像重建.該網(wǎng)絡(luò)由無監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)兩部分組成.由于經(jīng)過校準后的CT投影數(shù)據(jù)近似服從高斯分布[14],混合高斯模型可以在無標簽的情況下對噪聲建模,與此同時,網(wǎng)絡(luò)另一部分通過監(jiān)督學(xué)習(xí)的方式提取噪聲模型.將傳統(tǒng)方法與基于學(xué)習(xí)的方法相結(jié)合有利于融合兩種方法的優(yōu)勢,在精確擬合輸入與標簽之間復(fù)雜數(shù)據(jù)分布的同時,提高網(wǎng)絡(luò)模型的魯棒性.最終實現(xiàn)對投影數(shù)據(jù)噪聲分布的精確模擬,從而在低劑量條件下重建出高質(zhì)量的DECT圖像.
式中表示投影矩陣數(shù)量.然而,由于投影數(shù)據(jù)中的噪聲通常是量子噪聲與電子噪聲的混合,尤其對于DECT而言,兩種不同能量下的噪聲分布存在差異,因此很難僅僅通過傳統(tǒng)噪聲模型對復(fù)雜的噪聲分布進行精確建模.基于深度學(xué)習(xí)方法可以憑借強大的特征提取能力學(xué)習(xí)到任意的數(shù)據(jù)分布規(guī)律,其去噪性能只取決于訓(xùn)練樣本而與噪聲類型無關(guān).因此本文通過結(jié)合傳統(tǒng)噪聲模型與深度學(xué)習(xí)的方式對DECT投影數(shù)據(jù)中復(fù)雜的噪聲分布建模,最終實現(xiàn)高質(zhì)量的圖像重建.
所提出的SDN-GMM方法整體結(jié)構(gòu)如圖1所示,為了網(wǎng)絡(luò)在學(xué)習(xí)過程中可以充分利用不同能量區(qū)間數(shù)據(jù)的能譜相關(guān)性以及空間相關(guān)性,首先將低劑量DECT高能區(qū)間與低能區(qū)間的投影數(shù)據(jù)矩陣疊加成雙通道的三維矩陣,之后輸入到由無監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)兩部分構(gòu)成的殘差網(wǎng)絡(luò)進行噪聲去除.其中,使用混合高斯模型在無標簽的情況下實現(xiàn)投影數(shù)據(jù)噪聲建模,同時,通過最小化1損失函數(shù)使網(wǎng)絡(luò)的輸出盡可能地接近標簽的數(shù)據(jù)分布.最終將去噪后的投影數(shù)據(jù)通過濾波反投影算法(filtered back projection,F(xiàn)BP)進行重建,得到高質(zhì)量的DECT診斷圖像.
由于在臨床X射線探測系統(tǒng)中,除對數(shù)變換外,還必須對采集到的投影數(shù)據(jù)進行校準,以提高重建圖像質(zhì)量,而校準后的投影數(shù)據(jù)近似服從高斯分布.因此,可以使用混合高斯模型對噪聲分布建模,如式(2)所示.
圖1?SDN-GMM 方法整體結(jié)構(gòu)
式中為TV正則化的系數(shù).為了方便模型的參數(shù)優(yōu)化,高斯模型的均值統(tǒng)一設(shè)為0.該混合高斯去噪模型可以通過使用與能量段匹配的高斯模型個數(shù)更加精確地提取不同能量段下噪聲的分布,進而基于投影數(shù)據(jù)分布特性完成對噪聲的建模.最后,該模型作為網(wǎng)絡(luò)無監(jiān)督學(xué)習(xí)部分的損失函數(shù)在反向傳播過程中實現(xiàn)對網(wǎng)絡(luò)中不同卷積層參數(shù)的更新.此外,筆者使用1范數(shù)作為網(wǎng)絡(luò)監(jiān)督學(xué)習(xí)部分的損失函數(shù),實現(xiàn)輸入低劑量DECT投影數(shù)據(jù)與標簽之間的差異最小化.相比于目前機器學(xué)習(xí)領(lǐng)域廣泛使用的2損失函數(shù),1損失函數(shù)不易受圖像中隨機噪聲所引起的較大誤差影響,因而能夠獲得較為穩(wěn)定的擬合效果.1損失函數(shù)如式(4)所示.
該損失函數(shù)通過最小化輸入投影數(shù)據(jù)矩陣與標簽之間每個數(shù)據(jù)點的絕對差值之和確保了去噪后數(shù)據(jù)矩陣中線性衰減系數(shù)的準確性.最終將無監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)部分結(jié)合,得到SDN-GMM網(wǎng)絡(luò)訓(xùn)練的損失函數(shù),如式(5)所示.
式中為平衡無監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)損失函數(shù)的超參數(shù).最終,通過不斷最小化S-G,既利用DECT投影數(shù)據(jù)分布背后的先驗信息來訓(xùn)練噪聲去除網(wǎng)絡(luò)模型,還可以在有標簽的情況下實現(xiàn)對復(fù)雜的噪聲分布精確擬合,進而提升SDN-GMM方法的魯棒性.
由于殘差網(wǎng)絡(luò)[15]可以很好地解決深度學(xué)習(xí)方法在訓(xùn)練過程中會遇到的梯度消失與梯度爆炸問題,因此筆者基于殘差網(wǎng)絡(luò)設(shè)計了SDN-GMM網(wǎng)絡(luò)結(jié)構(gòu),如圖2所示.網(wǎng)絡(luò)共由12個卷積層組成,其中第一層與最后一層卷積核通道數(shù)為2,滑動步長為1.中間層由5個殘差塊構(gòu)成,每個殘差塊由兩個通道數(shù)為16的卷積層構(gòu)成.網(wǎng)絡(luò)中的殘差塊以及整個網(wǎng)絡(luò)的輸入與輸出都通過跳躍連接的方式進行特征復(fù)用,以避免隨著網(wǎng)絡(luò)層數(shù)的加深而導(dǎo)致細節(jié)信息丟失.殘差學(xué)習(xí)的原理可由式(6)表示.
圖2?SDN-GMM 網(wǎng)絡(luò)結(jié)構(gòu)
式中:表示殘差塊的輸出;0與分別表示殘差塊的輸入以及內(nèi)部第個特征層;W表示殘差塊中第個特征層的權(quán)重參數(shù);表示實現(xiàn)特征提取的卷積過程.為了使網(wǎng)絡(luò)在學(xué)習(xí)過程中能夠提取更多細節(jié)信息進而增加對噪聲識別的準確性,筆者將低劑量DECT投影數(shù)據(jù)矩陣分割為64×64×2的補丁(patch)矩陣作為網(wǎng)絡(luò)的輸入.圖2中c代表卷積核通道數(shù),s表示卷積核的滑動步長.網(wǎng)絡(luò)中每個卷積層后都帶有線性整流單元(rectified linear unit,ReLu)作為激活函數(shù)來擬合模型中的非線性映射.此外,在ReLu后添加了批歸一化層(batch normalization,BN)來預(yù)防網(wǎng)絡(luò)在訓(xùn)練過程中可能出現(xiàn)的過擬合現(xiàn)象.
本實驗使用來自Duke University基于真實人體制作的4D XCAT人體模型[16]生成SDN-GMM網(wǎng)絡(luò)的訓(xùn)練和測試數(shù)據(jù)集.同時,為了提升網(wǎng)絡(luò)模型的魯棒性,筆者在模型庫中隨機選取了10名不同性別、年齡、身高和體重的人體作為被掃描物體.X射線光源由模擬工作在140kVp下的GE_Maxiray_125球管產(chǎn)生,并采用扇束掃描方式對被掃描人體進行間隔為1°的掃描.其中,光源到旋轉(zhuǎn)中心以及探測器到旋轉(zhuǎn)中心的距離均為59.5cm.被掃描區(qū)域大小為15cm×15cm.實驗中,使用Edge-on 型X射線探測器模?型[17]來提供來自兩個不同能量區(qū)間的投影數(shù)據(jù),并在光子的探測過程中模擬了X射線的吸收、散射和不同級別的隨機噪聲.
最終,通過上述掃描方式分別獲得了能量區(qū)間在20~80keV以及80~140keV的正常劑量和低劑量條件下的投影數(shù)據(jù).其中,為模擬低劑量條件下噪聲分布,入射光子數(shù)設(shè)為105.實驗使用來自8名不同人體胸部以及腹部斷層的320組正常劑量和低劑量雙能投影數(shù)據(jù)作為訓(xùn)練集,其余2名人體在低劑量條件下獲得的80組雙能投影數(shù)據(jù)作為測試集.此外,為了進一步擴充數(shù)據(jù)集,同時保證網(wǎng)絡(luò)在學(xué)習(xí)過程中能夠保留更多細節(jié)信息,筆者將獲得的投影數(shù)據(jù)矩陣分解成尺寸為64×64的重疊補丁矩陣作為網(wǎng)絡(luò)輸入,最后用于網(wǎng)絡(luò)訓(xùn)練的總補丁個數(shù)為12800.
本文所提出的網(wǎng)絡(luò)基于TensorFlow框架實現(xiàn),并使用NVIDIA RTX 2080顯卡對網(wǎng)絡(luò)進行總共180個周期的訓(xùn)練.模型的優(yōu)化使用期望最大化算法(expectation maximization,EM)實現(xiàn)[18],分為兩步:E和M.在E步驟中對混合模型中特定高斯模型的后驗分布進行計算,在M步驟中通過Adam梯度更新算法對混合高斯模型以及網(wǎng)絡(luò)訓(xùn)練參數(shù)進行更新.網(wǎng)絡(luò)訓(xùn)練的學(xué)習(xí)率在前60個周期為1×10-3,中間60個周期為1×10-4,最后60個周期為1×10-5,批量尺寸大小設(shè)置為16.本實驗中混合高斯模型中的模型個數(shù)設(shè)置為2,監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)的平衡參數(shù)和TV正則化系數(shù)分別設(shè)置為0.1以及?1×10-3.
為了評估所提出的SDN-GMM方法在低劑量DECT噪聲去除方面的有效性及其性能,本文分別選取了目前在傳統(tǒng)去噪方法和深度學(xué)習(xí)去噪方法中極具代表性的PWLS方法[3]、CNN方法[8]以及最先進的GAN方法[12]作為對比.此外,為驗證所加入的混合高斯模型對去噪性能有進一步的提升,筆者將不加GMM的SDN方法同樣作為一組對比實驗.最終的實驗結(jié)果分別通過主觀效果以及客觀指標進行評價,其中客觀評價指標包括均方根誤差(root mean square error,RMSE)、峰值信噪比(peak signal to noise ratio,PSNR)以及結(jié)構(gòu)相似性指數(shù)(structural similarity index measurement,SSIM).
2.3.1?主觀效果對比
從測試數(shù)據(jù)集中分別選取來自腹部和胸部兩個具有代表性的切片來展示所提出的SDN-GMM方法的噪聲及偽影去除效果,如圖3、圖4所示.其中第?1排為DECT在高能區(qū)間(80~140keV)的重建圖像,第2排為低能區(qū)間(20~80keV)下獲得的重建圖像.從圖中可以看到高能區(qū)間重建得到的圖像噪聲及偽影略少于低能圖像,這是由于光子能量較高時經(jīng)過組織的衰減較?。湍軈^(qū)間下重建的圖像具有更好的對比度,十分有利于對組織特征的識別.此外,為進一步展示不同算法在噪聲去除方面的差異,筆者分別在圖像中選取了兩個興趣區(qū)域(region of interest,ROI)進行放大,并使用紅色以及綠色方框在圖中進行了標注.本文的圖像基于不同組織的線性衰減系數(shù)顯示,窗寬均為[0,0.3] cm-1.
圖3?腹部切片不同算法去噪效果對比
圖4?胸部切片不同算法去噪效果對比
從圖3(a)中可以看出,輸入的低劑量DECT圖像具有十分明顯的噪聲以及偽影,這極大地影響了在診斷過程中對不同病灶以及組織特征的精確識別.圖3(b)顯示了經(jīng)過PWLS算法處理后的重建圖像,可以看到該方法雖然消除了大量的噪聲,但在組織結(jié)構(gòu)附近效果依然不太理想,尤其是在骨骼結(jié)構(gòu)邊緣還存在著部分偽影,圖像分辨率并不理想.而CNN、SDN、GAN以及SDN-GMM這些通過基于深度學(xué)習(xí)方法獲得的圖像幾乎沒有可見的噪聲以及偽影.但從圖3(c)中經(jīng)過CNN方法處理后的圖像中可以看到一些組織的結(jié)構(gòu)同樣受到了一定程度的平滑,使得組織細節(jié)變得模糊.這與該方法在訓(xùn)練過程中只使用均方差作為損失函數(shù)有關(guān),因為網(wǎng)絡(luò)在最小化均方差的過程中會忽略輸入與標簽數(shù)據(jù)之間較小的差異.圖3(d)中細微組織的模糊效應(yīng)有所改善,但從ROI區(qū)域中可以看到圖像中不同組織的邊界區(qū)域相較于標簽依然不夠清晰.而從經(jīng)過GAN和SDN-GMM方法處理得到的圖3(e)、(f)中可以看到,高能和低能重建圖像中在幾乎沒有可見噪聲及偽影的基礎(chǔ)上,不同組織之間的邊緣結(jié)構(gòu)也十分清晰.本文所提出的方法與最先進的去噪算法GAN均可以達到最接近標簽的噪聲及偽影去除效果.從整體上來看,SDN-GMM方法獲得的腹部圖像結(jié)構(gòu)清晰,組織細節(jié)信息恢復(fù)良好,可以為診斷過程中區(qū)分不同解剖結(jié)構(gòu)細節(jié)方面提供更加準確的信息.
此外,從圖4中的胸部切片重建圖像中可以進一步證明以上結(jié)論.通過圖4(b)~(e)與圖4(f)進行視覺對比可以看出,經(jīng)本文所提出的SDN-GMM方法處理后的圖像十分接近標簽,與此同時,圖像中胸部不同組織的結(jié)構(gòu)較為清晰,組織邊緣結(jié)構(gòu)信息也保留完整,這進一步驗證了所提出方法的有效性.從主觀上來看,本文提出的SDN-GMM方法可以獲得較好的去噪效果,這十分有利于為診斷者提供更加準確的組織信息.
2.3.2?客觀評測指標
為了以定量的方式比較不同算法在噪聲去除方面的性能,筆者分別計算了通過幾種對比方法處理后重建圖像與標簽之間的RMSE、PSNR以及SSIM指標.RMSE可以通過計算去噪后圖像與標簽圖像中每個對應(yīng)像素點的線性衰減系數(shù)差異來評估生成圖像與標簽的相似性,RMSE的值越小表示圖像越接近目標圖像.PSNR用來評價圖像中信號與背景噪聲的比率,比值越大證明生成的圖像質(zhì)量越好.SSIM主要測量兩幅圖像中的結(jié)構(gòu)相似性,其值越接近1表示結(jié)構(gòu)相似度越高.本文從測試集中隨機選取了兩組分別來自腹部以及胸部重建圖像的評價指標進行展示,如表1、表2所示.對比其他4種方法,SDN-GMM方法處理后的腹部以及胸部圖像RMSE值均為最低,其值均低于6×10-3.這表明重建后的DECT圖像最接近正常劑量下獲得的圖像.此外,通過本文所提出的方法進行去噪處理后,PSNR值可達36.73dB以上,與目前最先進的GAN方法相比十分接近,且明顯高于剩余的幾種對比方法,這充分表明生成的DECT重建圖像質(zhì)量較高,具備更高的診斷價值.在可以反映更多圖像細節(jié)的結(jié)構(gòu)相似性方面,經(jīng)過4種方法處理后的低劑量DECT圖像與標簽相比均有較高的SSIM值,其中GAN方法由于其網(wǎng)絡(luò)訓(xùn)練過程中的對抗特性,可以獲得圖像結(jié)構(gòu)上與標簽最接近的效果,因此具有最高的SSIM值.SDN-GMM方法在不同部位以及不同能量區(qū)間下的SSIM值可達0.992以上,這也進一步表明了該方法能夠在去噪的同時很好地保留不同組織的結(jié)構(gòu)細節(jié)信息.
表1?測試集胸部切片客觀評價指標
Tab.1?Evaluation index of chest slices in test set
表2?測試集腹部切片客觀評價指標
Tab.2?Evaluation index of abdominal slices in test set
圖5(a)、(b)分別為不同方法在所有高能區(qū)間以及低能區(qū)間測試集上各評價指標的平均測試結(jié)果,從統(tǒng)計圖中可以直觀地觀察到與其他4種對比方法相比,SDN-GMM算法在所有的測試集上依然能夠保持最低的RMSE、較高的PSNR以及SSIM值,這充分展示了該方法的魯棒性.通過對不同算法去噪性能的定量測評,進一步驗證了SDN-GMM能有效提高DECT低劑量圖像重建質(zhì)量且有很好的泛化能力.
2.3.3?線性衰減系數(shù)比較
為了進一步測試通過各種去噪算法獲得的DECT重建圖像中線性衰減系數(shù)的準確性,從測試集中隨機選取了一組切片繪制以像素位置為橫坐標的線性衰減系數(shù)變化圖,如圖6所示.其中,圖6(a)以及圖6(b)中的紅線表示隨機選取的投影路徑,圖6(c)和圖6(d)分別為不同噪聲去除方法在高能區(qū)間以及低能區(qū)間重建圖像的線性衰減系數(shù)變化曲線.從圖中可以看出本文所提出的SDN-GMM方法在所選投影路徑下線性衰減系數(shù)最接近標簽值,這說明該方法在去噪過程中并沒有增添其他類型噪聲,很好地還原了最真實的正常劑量下DECT圖像,方法性能優(yōu)于其他幾種對比方法.
圖6 不同算法在相同投影路徑上線性衰減系數(shù)變化曲線
2.3.4?不同噪聲等級測試
為了測試所提出的SDN-GMM方法在不同噪聲等級下的去噪表現(xiàn),筆者通過改變?nèi)肷涔庾訑?shù)模擬了不同劑量水平下的獲得的投影數(shù)據(jù).加噪聲后每條投影路徑上的投影值n可由式(7)計算.
式中:(·)表示服從Poisson分布的隨機函數(shù);表示X射線入射光子數(shù);表示正常劑量下每條投影路徑下的投影值.在仿真實驗中分別生成了從=106到=104共5個不同噪聲級別下的測試集對訓(xùn)練好的噪聲模型進行評估,最終結(jié)果在測試集上各評價指標的平均值如表3所示.從表3中可以看出雖然隨著噪聲等級的加大輸出圖像的峰值信噪比及結(jié)構(gòu)相似性指數(shù)有所下降,但從整體上來看,SDN-GMM方法在不同的噪聲水平下依然能夠保持較低的RMSE以及較高的PSNR以及SSIM值,進一步驗證了所提出方法的魯棒性.
表3 SDN-GMM在不同噪聲水平測試集下的評價指標
Tab.3 Evaluation index of SDN-GMM in test set with different noise levels
低劑量DECT重建圖像中存在大量的噪聲及偽影,這極大影響了對于病灶檢測的準確性.本文從低劑量DECT投影數(shù)據(jù)入手,采用混合高斯模型以及殘差學(xué)習(xí)對高、低能區(qū)間投影數(shù)據(jù)中的噪聲分布進行精確建模.通過將疊加后的投影數(shù)據(jù)作為SDN-GMM網(wǎng)絡(luò)輸入,使網(wǎng)絡(luò)在學(xué)習(xí)過程中能夠同時利用DECT投影數(shù)據(jù)分布的空間和能譜相關(guān)性來保留紋理特征.此外,監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)的結(jié)合可以在保證網(wǎng)絡(luò)模型去噪效果的同時,進一步提升模型的魯棒性.實驗結(jié)果表明,SDN-GMM方法獲得的去噪后圖像在主觀效果對比和客觀評價指標上都有較好的表現(xiàn),而且在不同的噪聲水平下也表現(xiàn)出了很好的泛化水平.該方法克服了目前大多數(shù)算法在進行噪聲去除過程中會損失圖像細節(jié)的問題,實現(xiàn)了低輻射劑量下雙能CT的高質(zhì)量圖像重建.
[1] Rubin G D. Computed tomography:Revolutionizing the practice of medicine for 40 years[J]. Radiology,2014,273(Suppl2):S45-S74.
[2] Brenner D J,Hall E J. Computed tomography—An increasing source of radiation exposure[J]. New England Journal of Medicine,2007,357(22):2277-2284.
[3] Xie Q,Zeng D,Zhao Q,et al. Robust low-dose CT sinogram preprocessing via exploiting noise-generating mechanism[J]. IEEE Transactions on Medical Imag-ing,2017,36(12):2487-2498.
[4] Chen Y,Yin X,Shi L,et al. Improving abdomen tumor low-dose CT images using a fast dictionary learning based processing[J]. Physics in Medicine & Biology,2013,58(16):5803-5820.
[5] Zhang Y,Wang Y,Zhang W,et al. Statistical iterative reconstruction using adaptive fractional order regularization[J]. Biomedical Optics Express,2016,7(3):1015-1029.
[6] 冀?中,趙可心,張鎖平,等. 基于空間變換雙線性網(wǎng)絡(luò)的細粒度魚類圖像分類[J]. 天津大學(xué)學(xué)報:自然科學(xué)與工程技術(shù)版,2019,52(5):475-482.
Ji Zhong,Zhao Kexin,Zhang Suoping,et al. Fine-grained fish image classification based on a bilinear network with spatial transformation[J]. Journal of Tianjin University:Science and Technology,2019,52(5):475-482(in Chinese).
[7] 曹玉珍,高晨陽,余?輝,等. 基于深度學(xué)習(xí)的癲癇腦電通道選擇與發(fā)作檢測[J]. 天津大學(xué)學(xué)報:自然科學(xué)與工程技術(shù)版,2020,53(4):426-432.
Cao Yuzhen,Gao Chenyang,Yu Hui,et al. Epileptic EEG channel selection and seizure detection based on deep learning[J]. Journal of Tianjin University:Science and Technology,2020,53(4):426-432(in Chinese).
[8] Hu C,Yi Z,Weihua Z,et al. Low-dose CT via convo-lutional neural network[J]. Biomedical Optics Express,2017,3(2):679-694.
[9] Chen H,Zhang Y,Kalra M K,et al. Low-dose CT with a residual encoder-decoder convolutional neural network(RED-CNN)[J]. IEEE Transactions on Medical Imaging,2017,36(12):2524-2535.
[10] Wolterink J M,Leiner T,Viergever M A,et al. Generative adversarial networks for noise reduction in low-dose CT[J]. IEEE Transactions on Medical Imaging,2017,36(12):2536-2545.
[11] Yang Q,Yan P,Zhang Y,et al. Low dose CT image denoising using a generative adversarial network with wasserstein distance and perceptual loss[J]. IEEE Transactions on Medical Imaging,2018,37(6):1348-1357.
[12] Ma Y,Wei B,F(xiàn)eng P,et al. Low-dose CT image denoising using a generative adversarial network with a hybrid loss function for noise learning[J]. IEEE Access,2020,8:67519-67529.
[13] Huang Y,Tobias W,Breininger K,et al. Some investigations on robustness of deep learning in limited angle tomography[C]//Medical Image Computing and Computer Assisted Intervention-MICCAI 2018. Granada,Spain,2018:145-153.
[14] Li T,Li X,Wang J,et al. Nonlinear sinogram smoothing for low-dose X-ray CT[J]. IEEE Transactions on Nuclear Science,2004,51(5):2505-2513.
[15] He K,Zhang X,Ren S,et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Las Vegas,USA,2016:770-778.
[16] Segars W P,Sturgeon G,Mendonca S,et al. 4D XCAT phantom for multimodality imaging research[J]. Medical Physics,2010,37(9):4902-4915.
[17] Shi Z,Yang H,Cong W,et al. An edge-on charge-transfer design for energy-resolved X-ray detection[J]. Physics in Medicine & Biology,2016,61(11):4183-4200.
[18] Dempster,Arthur P,Nan M,et al. Maximum likelihood from incomplete data via the EM algorithm[J]. Journal of the Royal Statistical Society:Series B(Methodological),1977,39(1):1-22.
A Projection Data Denoising Method Based on SDN-GMM Network for Low-Dose Dual-Energy Computed Tomography
Shi Zaifeng1, 2,Li Huilong1,Cheng Ming1, Cao Qingjie3,Wang Ziju1
(1. School of Microelectronics,Tianjin University,Tianjin 300072,China;2. Tianjin Key Laboratory of Imaging and Sensing Microelectronic Technology,Tianjin 300072,China;3. School of Mathematical Sciences,Tianjin Normal University,Tianjin 300387,China)
Low-dose dual-energy computed tomography(DECT)has the potential to provide information on human internal structure and tissue components and to reduce X-ray radiation. However,dose reduction often leads to extreme noise and artifacts in reconstructed images,which dramatically affects the accuracy of the diagnosis. In order to obtain high-quality reconstructed images from low-dose DECT projection data,a noise reduction network called sinogram denoising network with Gaussian mixture model(SDN-GMM)was proposed to eliminate artifacts and noise. Further,this network consists of two learning parts:the supervised and the unsupervised. In the supervised learning part,the relationship between calibrated low-dose and normal-dose projection data was determined by residual learning,while the unsupervised learning part extracted the noise distribution of DECT projection data via Gaussian Mixture Model. The combination of supervised and unsupervised learning not only can take full advantages of the feature extraction capability from convolution operation to suit any complex mapping relationship between the input and the label but can also make full use of the input data property to further enhance the efficiency and robustness of the network model. In the experiment,the DECT projection data from 10 different people acquired from XCAT were used to train and test the proposed network model. Compared with the normal-dose reconstructed images,the results revealed that the root-mean-square error(RMSE)value is lower than 6×10-3,and the peak signal-to-noise ratio(PSNR)and the structural similarity index measure(SSIM)are higher than 36.7 dB and 0.992,respectively. On the other hand,compared to the current advanced low-dose CT noise reduction methods,the DECT reconstructed images produced by proposed method have clearer tissue structure and can retain more detailed information,which will be more valuable for medical diagnosis.
dual-energy computed tomography;low dose;residual learning;unsupervised learning;Gaussian mixture model
TP391.4
A
0493-2137(2021)09-0899-08
10.11784/tdxbz202006048
2020-06-18;
2020-08-31.
史再峰(1977—??),男,博士,副教授.
史再峰,shizaifeng@tju.edu.cn.
國家自然科學(xué)基金資助項目(62071326,61674115).
Supported by the National Natural Science Foundation of China(No. 62071326,No. 61674115).
(責(zé)任編輯:王曉燕)