胡海 黎杰 王培 唐斌 王先良 楊強
宮頸癌是女性常見的惡性腫瘤,根據(jù)2018年對185個國家36種癌癥的統(tǒng)計結(jié)果顯示,全球?qū)m頸癌新發(fā)患者達到了569 847例,死亡患者達到了311 365例[1]。標(biāo)準(zhǔn)的宮頸癌放射治療模式是在進行外照射治療之后,通過后裝治療進行補量[2-3]。圖像引導(dǎo)的三維后裝是后裝治療技術(shù)的主流,施源器重建是三維后裝治療計劃設(shè)計的關(guān)鍵一步,現(xiàn)階段施源器重建都依靠物理師人工完成,存在著重建精度受物理師主觀因素影響大,重建速度慢的缺點。施源器重建的精度、患者從掃完定位CT到治療期間長時間的等待都會影響到患者的劑量分布[4-6],從而影響患者的治療效果。自動后裝治療計劃設(shè)計是未來發(fā)展的方向之一,在后裝治療計劃制定中,自動、精確、快速地重建施源器是尚未解決的問題。本文基于U-net網(wǎng)絡(luò)建立了一種用于分割三維CT圖像中施源器的深度學(xué)習(xí)模型,并通過戴斯相似性系數(shù)(DSC)、95百分位豪斯多夫距離(HD95)、相關(guān)體積差異(RVD)、精確率和召回率等參數(shù)對模型分割結(jié)果進行了評估,現(xiàn)報道如下。
本文回顧性研究了2019年12月—2020年10月間27例四川省腫瘤醫(yī)院已完成治療的宮頸癌患者的CT數(shù)據(jù),CT圖像的分辨率為0.1 cm×0.1 cm×0.3 cm。27例患者使用的均為金屬管柱施源器(Elekta applicator,no.084.350),CT層數(shù)范圍是70~94層,平均值為84層。施源器的標(biāo)注是由經(jīng)驗豐富的物理師在核通(Elekta AB,Stockholm,Sweden)治療計劃系統(tǒng)中進行,在每層CT中用直徑6 mm的圓圈勾畫出施源器的輪廓,進行標(biāo)注。患者含施源器標(biāo)注的CT層數(shù)在37~65層,平均為54層。最終得到規(guī)模為512×512×(54×27)的含有CT圖像和對應(yīng)施源器標(biāo)注圖像(以下稱真值圖)的數(shù)據(jù)集,按15∶2∶10將數(shù)據(jù)集劃分為訓(xùn)練集、驗證集和測試集。在標(biāo)注時考慮到施源器連接端(下段)和頂端(上段)不同的結(jié)構(gòu)特征,選擇施源器的連接端(圖1a)和頂端(圖1b)進行標(biāo)注展示,圖1c和圖1d為其對應(yīng)的真值圖。
圖1 施源器標(biāo)注和對應(yīng)的標(biāo)注圖像(真值圖)
對訓(xùn)練集和驗證集中的CT圖像進行直方圖均衡化操作,增強圖像中施源器和背景之間的對比度,使施源器的特征更加明顯。由于施源器通常位于CT圖像的中間部位,為加快訓(xùn)練速度,對CT圖像及其對應(yīng)的真值圖進行裁剪處理,裁剪是每層圖像的幾何中心,上下左右裁剪尺寸均為128,得到規(guī)模分別為256×256×(58×15),256×256×(59×2)的訓(xùn)練集和驗證集,其中256×256為裁剪后CT圖像和真值圖的尺寸,15例訓(xùn)練集患者平均樣本數(shù)為58,2例驗證集患者的平均樣本數(shù)為59。對CT圖像和真值圖進行歸一化處理,使其所有數(shù)據(jù)落在0~1之間。通過Keras的數(shù)據(jù)增強接口,對訓(xùn)練集CT圖像和真值圖進行相同的旋轉(zhuǎn)、放大和平移等操作,完成數(shù)據(jù)增強。最終得到訓(xùn)練集和驗證集的規(guī)模分別為256×256×(116×15),256×256×(59×2),116為經(jīng)過數(shù)據(jù)增強后訓(xùn)練集每例患者的平均樣本數(shù)量。
1.3.1 模型的構(gòu)建 模型基于經(jīng)典U-net網(wǎng)絡(luò)結(jié)構(gòu)建成[7],總共由10個部分組成。模型輸入為256×256×1的CT圖像,前5層為下采樣層,每層包含兩次卷積操作和一次最大池化操作。6~9層為上采樣層,每層在反卷積操作后通過跳躍連接層(Skip connection)將底層信息和高層信息融合,接著進行兩次卷積操作。卷積核的大小為3×3,反卷積核的大小和最大池化核的大小為2×2,步長均為1,激活函數(shù)為Relu。第10層通過1×1卷積核將跨通道的特征進行整合,激活函數(shù)為sigmoid,最后輸出256×256×1的二維預(yù)測圖(圖2)。
圖2 U-net網(wǎng)絡(luò)結(jié)構(gòu)
1.3.2 模型的編譯 模型編譯中優(yōu)化器選擇Adam(Adaptive Moment Estimation)[8],利用梯度的一階矩估計和二階矩估計動態(tài)調(diào)整每個參數(shù)的學(xué)習(xí)率,經(jīng)過偏執(zhí)校正,每次迭代后學(xué)習(xí)率都有確定范圍,使得參數(shù)比較完整。監(jiān)測(Metrics)選擇DSC,定義如下:
公式中A為預(yù)測圖,B為真值圖,λ則為Laplace平滑因子。為了減少過擬合和避免出現(xiàn)分母為0的情況,本研究λ=1。
損失函數(shù)(Loss function)選擇Ls(Dice loss),Ls定義如下:
Ls=1-DSC
將預(yù)處理過后的訓(xùn)練集和驗證集放入網(wǎng)絡(luò)中進行訓(xùn)練,訓(xùn)練在一臺intel Core i7-7700HQ CPU @ 2.80GHz,GPU NVIDIA GeForce GTX 1050ti,8GB RAM的計算機上完成,批處理(Batch size)為8,輪次(Epoch)為200次,初始學(xué)習(xí)率(Learning rate)為0.0001,通過監(jiān)測學(xué)習(xí)過程對學(xué)習(xí)率進行動態(tài)調(diào)整。訓(xùn)練結(jié)束后,將測試集的數(shù)據(jù)輸入網(wǎng)絡(luò)進行分割,得到相應(yīng)患者的分割結(jié)果并對其進行評估(圖3)。
圖3 U-net訓(xùn)練預(yù)測流程
1.5.1 DSC 施源器的重建精度取決于施源器的分割精度。因此為了評估分割效果,采取五種方式進行評估[9-11]。模型的編譯部分已對DSC進行了定義,它用于度量兩個樣本的相似性,取值范圍為[0,1]。0代表基本不相似,1代表兩個樣本相似度高,分割結(jié)果非常好。在實際預(yù)測中,每例患者有70~90層CT圖像,因此對DSC求均值及標(biāo)準(zhǔn)差(以下評估方式均采取相同處理)。
1.5.2 豪斯多夫距離(Hausdorff distance,HD)
由于DSC預(yù)測圖內(nèi)部填充比較敏感,故還得計算對邊界比較敏感的HD來評估模型。給定歐式空間中的兩樣本A和B,HD用來衡量這兩個樣本間的距離,計算公式如下:
HD(A,B)=max(D(A,B),D(B,A))
式中:
D(A,B)=maxa∈Aminb∈B||a-b||
式中A為預(yù)測圖,B為真值圖,a,b分別為A,B里面的元素。為了消除預(yù)測圖和真值圖之間離群值的影響,計算HD的95個百分位得到HD95。
1.5.3 RVD RVD定義如下:
λ為Laplace平滑因子,λ在評估過程中取1,避免出現(xiàn)分母為0的情況。
1.5.4 精確率和召回率 精確率是在被所有預(yù)測為正的樣本中實際為正樣品的概率,公式如下:
召回率為實際為正的樣本中被預(yù)測為正樣本的概率:
模型在25個輪次之后,訓(xùn)練集和驗證集上損失函數(shù)已收斂到較低水平。在200輪次后,訓(xùn)練集損失函數(shù)降到0.07,驗證集上損失函數(shù)降到0.1,訓(xùn)練集上DSC達到了0.93,驗證集上DSC達到了0.90,表明該模型對施源器特征的學(xué)習(xí)效果較好。訓(xùn)練總共用時7小時。訓(xùn)練過程中訓(xùn)練集、驗證集損失曲線在200個輪次之后的結(jié)果顯示模型已收斂(圖4)。
圖4 訓(xùn)練和驗證損失曲線
將訓(xùn)練模型對測試集10例患者進行分割。以第1、2例患者為例,兩例患者施源器連接端和頂端的分割結(jié)果較佳(圖5)。
圖5 預(yù)測分割結(jié)果
測試集10例安有金屬管柱施源器的患者分割效果評估參數(shù)都較理想,DSC平均為0.90,HD95最大為2.85 mm,最小為0.86 mm,平均為1.26 mm,RVD、準(zhǔn)確率和召回率平均則分別為-0.06,0.94和0.88?;颊叻指铑A(yù)測時間最長為6 s,最短時間為4 s,平均為5 s(表1)。
表1 10例患者的評估結(jié)果
施源器作為患者和放射源之間的紐帶,在后裝治療中的重要性不言而喻。施源器的重建質(zhì)量對整個治療計劃起著關(guān)鍵性的作用[12]。本研究基于U-net框架構(gòu)建模型,將CT圖像和真值圖進行預(yù)處理后輸入模型,讓模型學(xué)習(xí)施源器的特征信息,再將特征信息應(yīng)用到新的患者上。通過對模型分割結(jié)果的多重評估,證明該方法可行可靠,可以快速準(zhǔn)確的分割出施源器。通過模型分割施源器僅需要5 s左右,DSC精度也可達到0.90。
近年來隨著計算機硬件的發(fā)展,深度學(xué)習(xí)逐漸在不同的領(lǐng)域大放光彩,不同的網(wǎng)絡(luò)被開發(fā)出來解決各種問題。2015年Ronneberger等[7]首次提出了U-net網(wǎng)絡(luò),適合小數(shù)據(jù)集的圖像分割,針對于像素級分類,整個網(wǎng)絡(luò)分為編碼和解碼部分,通過跳躍連接(Skip connection)進行特征融合。由于U-net的特點,U-net網(wǎng)絡(luò)模型被廣泛應(yīng)用于醫(yī)學(xué)圖像分割領(lǐng)域[13],因此本研究選擇U-net網(wǎng)絡(luò)。通過將深度學(xué)習(xí)技術(shù)與三維后裝技術(shù)結(jié)合起來,完成計劃制定中施源器的快速精確重建,降低物理師在重建過程中產(chǎn)生的人為誤差,使得制作的計劃更為精準(zhǔn),也為患者的治療提供更好的保障。
目前國內(nèi)外對后裝治療中施源器分割的研究還比較少。國內(nèi),朱琳等[14]采用基于灰度值的自動跟蹤算法重建施源器,在保證正確重建施源器的前提下,平均節(jié)省了1/2的施源器重建時間。國外,Zhang等[15]構(gòu)建了Attention網(wǎng)絡(luò)將其應(yīng)用到超聲引導(dǎo)的高劑量率前列腺后裝治療中,成功地分割定位出插值針在超聲圖像中的位置,本研究借助了其思路,完成了在宮頸后裝中對管柱施源器的分割。Zaffino等[9]通過構(gòu)建三維U-net網(wǎng)絡(luò),完成了核磁引導(dǎo)的宮頸癌后裝中的插值針的重建,最后的DSC達到了0.6左右。本研究與之相比,DSC更高,且本研究根據(jù)醫(yī)院的實際情況,由于管柱施源器使用頻率高,故針對性的對其進行分割重建,為治療效果的提升添磚加瓦。
后裝治療計劃制定的自動化是未來發(fā)展的方向,計劃制定流程包括器官勾畫、施源器重建、劑量計算、劑量優(yōu)化和計劃評估等。前期課題組已經(jīng)完成了器官勾畫、劑量計算與劑量優(yōu)化的工作[16-19]。本研究可與前期工作進行整合,實現(xiàn)計劃制定的自動化,提升工作效率。
本研究還有少量的不足之處,具體體現(xiàn)在以下幾個方面:(1)只對金屬管柱施源器進行了研究。臨床中的施源器種類繁多,核磁三管和金屬三管施源器等應(yīng)用也較為廣泛,該模型不一定適用于其他施源器。但是在具備了本研究基礎(chǔ)的情況下,可以很快開展其他不同種類施源器的分割工作;(2)當(dāng)前患者數(shù)據(jù)量較少,僅有15例患者的數(shù)據(jù)用來訓(xùn)練,可以進一步搜集數(shù)據(jù),完善當(dāng)前工作,使得分割效果更加精確;(3)施源器重建的目的是為了確保在臨床中的可用性,然而本研究目前只進行了施源器的分割工作,還未進行施源器的重建驗證。但是通過對比施源器分割的精度,推測施源器重建的精度足以滿足臨床需求。臨床中施源器的自動重建、重建偏差對患者劑量的影響和施源器重建模型的評估是本課題組正在開展的工作。
綜上所述,本文通過構(gòu)建U-net模型,研究后裝治療計劃中施源器重建工作,現(xiàn)階段成功完成金屬管柱施源器的分割,并對分割結(jié)果通過不同方式進行了評估。結(jié)果顯示該模型分割效果較好,分割的各種評估參數(shù)都較佳,滿足臨床上施源器的重建。施源器的精準(zhǔn)分割是能否精確重建最為關(guān)鍵的一步,該模型完成的施源器精確分割對后面實現(xiàn)治療計劃制定自動化流程中的施源器重建具有重大意義。