【作 者】郭雯 ,鞠忠建,楊微,谷珊珊,周瑾,叢小虎,劉杰,戴相昆
1 武漢大學(xué) 物理科學(xué)與技術(shù)學(xué)院,武漢市,430072
2 中國人民解放軍總醫(yī)院第一醫(yī)學(xué)中心 放療科,北京市,100853
3 北京東方瑞云科技有限公司,北京市,100020
宮頸癌是中國女性第二大常見癌癥,近年來發(fā)病率與死亡率呈上升趨勢[1]。放療是宮頸癌治療中重要治療技術(shù),它既能使患者得到根治,亦能在術(shù)后對(duì)病灶瘤床進(jìn)行控制[2-4]。
精確勾畫臨床靶區(qū)體積(clinical target volume,CTV)在放療過程中起著關(guān)鍵作用,直接影響患者預(yù)后。目前,勾畫CTV由放療科醫(yī)師基于CT圖像手動(dòng)完成。
近年來,使用深度學(xué)習(xí)進(jìn)行病灶自動(dòng)識(shí)別勾畫備受關(guān)注,并在鼻咽癌、直腸癌等部位獲得很大進(jìn)展[5-8]。宮頸癌CTV區(qū)域除包括影像學(xué)可見的病變之外,還包含亞臨床病變區(qū)域和可能侵及區(qū)域,受侵范圍不一和器官充盈程度都會(huì)影響勾畫。相關(guān)研究進(jìn)展緩慢,未有結(jié)果報(bào)道。
本研究嘗試使用在女性盆腔分割領(lǐng)域表現(xiàn)優(yōu)異的密集全連接卷積神經(jīng)網(wǎng)絡(luò)(dense V-Net),基于CT圖像自動(dòng)勾畫宮頸癌患者CTV。通過8項(xiàng)參數(shù)評(píng)估自動(dòng)勾畫效果,試圖為臨床醫(yī)師提供預(yù)勾畫,進(jìn)而用于臨床。
對(duì)中國人民解放軍總醫(yī)院第一醫(yī)學(xué)中心放療科2016年5月到2019年6月收治的宮頸癌術(shù)后患者進(jìn)行篩選。選擇分期接近、CTV勾畫范圍大致相同的病例。共選取IB期和IIA期(FIGO 2018分期)患者共145例。根據(jù)RTOG CTV勾畫標(biāo)準(zhǔn),CTV范圍包括子宮體、全陰道、宮頸病變和雙側(cè)宮旁,以及髂總、髂內(nèi)、髂外閉孔和骶前淋巴引流區(qū)。
所有患者的C T圖像均由SIMENS SOMATOM Definition AS大孔徑CT機(jī)掃描獲取,掃描范圍為肝頂至?xí)幭露?,層?shù)為85~120,層厚5 mm。掃描參數(shù)為管電壓120 kV、管電流400 mAs,重建體素值為512×512×k。掃描時(shí),患者仰臥位,熱體膜固定。
CTV手動(dòng)勾畫由2名主治醫(yī)師完成,再經(jīng)1名高級(jí)主任醫(yī)師修改和審核通過。隨機(jī)選取其中120例作為訓(xùn)練集,剩余的25例患者CT圖像作為測試集。
Dense V-Net融合了Dense Net[9-11]和V-Net[12-13]兩個(gè)深度學(xué)習(xí)模型[14],網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。它最大的優(yōu)點(diǎn)是使用了密集連接、水平連接和融合卷積。
其一,密集連接卷積第xl層的輸入包含了前面x0,x1,…,xl-1層的所有輸出,網(wǎng)絡(luò)每層都可以直接訪問前面各層的特征映射,這有助于網(wǎng)絡(luò)結(jié)構(gòu)加深,提高各層圖像特征的利用率;dropout結(jié)構(gòu)明確了每次密集連接所保留的圖像信息,減少冗余特征映射學(xué)習(xí),使用更少參數(shù)即可達(dá)到理想的訓(xùn)練結(jié)果;批量歸一化(batch normalization,BN)也減少了少樣本訓(xùn)練集的過度擬合。
圖1 Dense V-Net結(jié)構(gòu)Fig.1 Dense V-Net structure diagram
其二,水平連接將上、下采樣的卷積操作進(jìn)行串聯(lián),增強(qiáng)輸出圖像細(xì)節(jié)、加深圖像輪廓,同時(shí)縮短網(wǎng)絡(luò)收斂時(shí)間;在卷積操作中使用殘差連接,打破網(wǎng)絡(luò)對(duì)稱性,增強(qiáng)梯度計(jì)算的敏感性;最終預(yù)測時(shí),執(zhí)行1×1×1的卷積運(yùn)算,使用以戴斯相似性系數(shù)(dice similarity coefficient, DSC)為目標(biāo)函數(shù)的soft-max層,輸出前景和背景區(qū)域的概率分割圖像。
其三,融合卷積時(shí)使用3×3×3的卷積核,使用修正線性單元(rectified linear unit,ReLu)作為激活函數(shù),使圖像特征被充分利用,加強(qiáng)分割效果,得到與原始輸入圖像大小相同的輸出結(jié)果[15]。
該融合網(wǎng)絡(luò)包含了兩種單一網(wǎng)絡(luò)的優(yōu)點(diǎn)。Dense Net的結(jié)構(gòu)保證了圖像各層擁有最大信息流動(dòng),使得參數(shù)可被其后所有層調(diào)用,提高圖像特征利用率,在減少冗余信息的同時(shí)加速目標(biāo)函數(shù)收斂;對(duì)三種分辨率圖像執(zhí)行卷積和串聯(lián)的操作有助于多尺度提取特征,為圖像分割結(jié)果加入更多細(xì)節(jié)和全局信息。V-Net的結(jié)構(gòu)則保證了在訓(xùn)練數(shù)據(jù)集較少的情況下,輸出預(yù)測亦可保留更多圖像細(xì)節(jié),保持圖像預(yù)測準(zhǔn)確性。當(dāng)網(wǎng)絡(luò)層次加深時(shí),深層分割結(jié)果仍被不斷擴(kuò)大的感受野約束,減少過擬合。
首先,對(duì)C T圖像進(jìn)行預(yù)處理。舍棄邊緣冗余,截取每層橫斷面位于中心部分的320×320,并通過雙線性插值進(jìn)行重采樣,將訓(xùn)練樣本分辨率降低到256×256×k。以提高單個(gè)訓(xùn)練數(shù)據(jù)中有效數(shù)據(jù)比例,從而提高訓(xùn)練精度、縮訓(xùn)練時(shí)間短。
接著,執(zhí)行數(shù)據(jù)增強(qiáng)。對(duì)訓(xùn)練樣本進(jìn)行抽樣和旋轉(zhuǎn):對(duì)每個(gè)病例的CT圖像隨機(jī)抽取連續(xù)的64層,得到10~20個(gè)訓(xùn)練樣本;沿x,y,z軸分別對(duì)樣本進(jìn)行±10o以內(nèi)的隨機(jī)角度旋轉(zhuǎn),進(jìn)一步擴(kuò)展數(shù)據(jù)容量。從而在增加樣本數(shù)量的同時(shí)使訓(xùn)練結(jié)果更具廣泛性和精確性。
最后,執(zhí)行網(wǎng)絡(luò)訓(xùn)練與勾畫驗(yàn)證,流程如圖2所示。分別訓(xùn)練和優(yōu)化V-Net和Dense Net,當(dāng)二者的損失函數(shù)最優(yōu)時(shí),對(duì)融合層進(jìn)行微調(diào),使Dense V-Net在最短時(shí)間內(nèi)達(dá)到最好的融合效果。
圖2 網(wǎng)絡(luò)訓(xùn)練及勾畫驗(yàn)證流程Fig.2 Network training and sketching verification flow chart
數(shù)據(jù)的訓(xùn)練、評(píng)估、測試均在搭載雙NVIDIA (GTX 1080)圖形顯卡的服務(wù)器上運(yùn)行,所用算法基于TensorFlow系統(tǒng)構(gòu)架,使用Python語言編寫和調(diào)整。使用DSC值作為損失函數(shù),初始學(xué)習(xí)效率設(shè)為0.0005,學(xué)習(xí)速率衰減因子為0.5,衰減步長為1000,迭代次數(shù)設(shè)為10000。
對(duì)自動(dòng)勾畫的整體評(píng)估使用D S C[16]進(jìn)行。為描述更多細(xì)節(jié)信息,使用另外7項(xiàng)最具代表性的參數(shù)評(píng)價(jià)自動(dòng)勾畫精度,分別是衡量兩種勾畫輪廓偏移程度的3項(xiàng)參數(shù):質(zhì)心偏差(deviation of centroid,DC)、豪斯多夫距離(Hausdorff distance,HD)[17]和最小平均距離(minimum average distance,MAD),以及衡量兩種勾畫體積差異程度的4項(xiàng)參數(shù),即體積差異性系數(shù)(deviation of volume,△V)、敏感性指數(shù) (sensitivity index,SI)、包容性指數(shù)(inclusiveness index,Incl)[18]和杰卡德距離(Jaccard distance,JD)[19]。
將圖像與訓(xùn)練結(jié)果傳入MIM.Maestro 6.6.5軟件獲取勾畫信息,依托該平臺(tái)對(duì)兩勾畫的評(píng)估參數(shù)進(jìn)行計(jì)算。使用SPSS 20.0軟件進(jìn)行Dense V-Net和兩個(gè)單一網(wǎng)絡(luò)的8項(xiàng)評(píng)估參數(shù)的單因素方差分析。
使用Dense V-Net自動(dòng)勾畫CTV的8項(xiàng)參數(shù)統(tǒng)計(jì)結(jié)果如表1所示,散點(diǎn)箱型圖如圖3所示。
表1 Dense V-Net自動(dòng)勾畫參數(shù)Tab.1 Dense V-Net automatically draws parameters
DSC評(píng)價(jià)了兩勾畫重合部分占總勾畫的比例,當(dāng)DSC值大于0.75時(shí),兩區(qū)域重合度較高[20]。25例結(jié)果僅2例略小于該標(biāo)準(zhǔn),中位值和平均值均大于0.8,最大值達(dá)到0.88。說明自動(dòng)勾畫與手動(dòng)勾畫整體相似度較高。
圖3 8項(xiàng)參數(shù)散點(diǎn)箱型圖Fig.3 8 The parameters scatter box diagram
在輪廓整體偏移表現(xiàn)中,自動(dòng)勾畫效果較穩(wěn)定。DC衡量兩勾畫輪廓的質(zhì)心偏差,平均值為4.4 mm,小于5 mm的掃描層厚。HD表示兩勾畫輪廓最短距離的最大值,統(tǒng)計(jì)發(fā)現(xiàn)未出現(xiàn)極端點(diǎn),說明自動(dòng)勾畫不存在極端錯(cuò)誤識(shí)別;標(biāo)準(zhǔn)差較小,說明勾畫效果穩(wěn)定。MAD表示兩勾畫輪廓最小距離的平均值,結(jié)果均在毫米量級(jí),說明非準(zhǔn)確自動(dòng)勾畫區(qū)對(duì)兩勾畫輪廓偏差影響不大。
在評(píng)估自動(dòng)勾畫輪廓方位準(zhǔn)確性的基礎(chǔ)上,使用△V、SI、IncI和JD對(duì)各個(gè)方位的勾畫體積進(jìn)一步評(píng)價(jià)?!鱒表示兩勾畫體積差異占手動(dòng)勾畫的比例,用于評(píng)價(jià)網(wǎng)絡(luò)的容積穩(wěn)定性,其平均值為0.13,說明兩勾畫體積差別??;最大值為0.35,表明該自動(dòng)勾畫存在部分甚至完全包容手動(dòng)勾畫的現(xiàn)象。SI和IncI表示兩勾畫重合體積分別占手動(dòng)和自動(dòng)勾畫體積的比例,SI和IncI平均值分別為0.84和0.77,表明兩勾畫重合度較高;相比之下SI略大,說明自動(dòng)勾畫體積整體大于手動(dòng)勾畫體積;二者最小值分別為0.71和0.65,表明相應(yīng)樣本存在較大的重合度背離。JD表示兩勾畫交集占其并集大小的補(bǔ)集,JD值分布集中,標(biāo)準(zhǔn)差為0.05,表明兩勾畫體積偏移程度小,網(wǎng)絡(luò)對(duì)樣本特征識(shí)別充分。
將融合網(wǎng)絡(luò)對(duì)標(biāo)單一網(wǎng)絡(luò)進(jìn)行對(duì)比,統(tǒng)計(jì)結(jié)果及單因素方差分析結(jié)果如表2所示。由各參數(shù)特性可知,融合網(wǎng)絡(luò)的自動(dòng)勾畫相似度顯著高于單一網(wǎng)絡(luò);具有代表性的評(píng)價(jià)參數(shù)如DSC、HD、JD等,結(jié)果具有顯著差異性(P<0.01),其他幾個(gè)參數(shù)部分具有統(tǒng)計(jì)學(xué)差異。因此,使用融合網(wǎng)絡(luò)自動(dòng)勾畫具有更小體積偏差、更少范圍的錯(cuò)誤識(shí)別,以及較低的質(zhì)心偏差、較高的容積穩(wěn)定性;標(biāo)準(zhǔn)偏差的差別表明融合網(wǎng)絡(luò)具有更強(qiáng)的勾畫穩(wěn)定性和特征學(xué)習(xí)能力。
表2 網(wǎng)絡(luò)勾畫8項(xiàng)參數(shù)(Xmean±SD)以及單一網(wǎng)絡(luò)對(duì)融合網(wǎng)絡(luò)的單因素方差分析結(jié)果Tab.2 The 8 parameters of network delineation(Xmean±SD)and the single-factor analysis of variance of the single network to the converged network
使用融合網(wǎng)絡(luò)自動(dòng)勾畫與醫(yī)生手動(dòng)勾畫的對(duì)比結(jié)果在圖4中展示??梢钥闯鰞煞N勾畫的結(jié)果具有很高的重合度,進(jìn)一步說明了Dense V-Net可以在CT圖像中實(shí)現(xiàn)較好的CTV自動(dòng)勾畫。
圖4 患者CT圖像及勾畫結(jié)果Fig.4 Patient CT image and sketching results
從評(píng)價(jià)參數(shù)分析,當(dāng)DSC整體趨于穩(wěn)定時(shí),通過分析其他參數(shù)進(jìn)一步判斷偏差存在原因,發(fā)現(xiàn)本網(wǎng)絡(luò)在部分結(jié)構(gòu)上分割能力較弱。由圖3(c)、(e)、(f)可知,HD、△V和SI存在極端值。HD的極端值表明可能出現(xiàn)極端錯(cuò)誤識(shí)別或局部較大勾畫偏差,經(jīng)查發(fā)現(xiàn)其原因是自動(dòng)勾畫出現(xiàn)缺失:在冠狀面,自動(dòng)勾畫的上界均遠(yuǎn)低于手動(dòng)勾畫;△V的極端值意味著兩勾畫體積差異較大,查看圖像發(fā)現(xiàn)該自動(dòng)勾畫范圍過大,在多數(shù)區(qū)域基本全包含手動(dòng)勾畫;SI的極端值可能由自動(dòng)勾畫準(zhǔn)確率過低造成,為自動(dòng)勾畫與手動(dòng)勾畫比值過小與勾畫不準(zhǔn)確性并存所致。
分析具體的分割結(jié)果,網(wǎng)絡(luò)對(duì)以下3種結(jié)構(gòu)分割能力較差。如圖5所示,骶前淋巴引流區(qū)分叉處下緣及梨狀肌上端前界部位的自動(dòng)勾畫普遍誤差較大,網(wǎng)絡(luò)往往不能準(zhǔn)確識(shí)別該分界,在梨狀肌及第三骶椎前緣處產(chǎn)生冗余勾畫。另外,對(duì)膀胱后壁與直腸前壁的處理部分存在誤差,這是由于醫(yī)生手動(dòng)勾畫時(shí),會(huì)根據(jù)病人憋尿程度不同將CTV前界適當(dāng)外擴(kuò)(一般向膀胱后壁延伸1~2 cm不等的距離),而自動(dòng)勾畫只關(guān)注到該部位顯著的解剖差異。此外,有少數(shù)病例由于病程導(dǎo)致陰道受侵,醫(yī)生在實(shí)際勾畫時(shí)往往將腹股溝區(qū)少量淋巴囊腫劃入CTV一并勾畫,這也是網(wǎng)絡(luò)難以處理的。
圖5 三種勾畫差異較大情況的患者CT橫斷面圖像與勾畫比較Fig.5 CT cross-sectional images of patients and comparison of delineations in three conditions of huge difference
深度學(xué)習(xí)分割病變區(qū)域是醫(yī)學(xué)圖像領(lǐng)域的研究熱點(diǎn),國際上已經(jīng)有許多使用該方法勾畫患者影像學(xué)可見病變區(qū)域的報(bào)道,如ALOM等[7]使用遞歸殘余卷積神經(jīng)網(wǎng)絡(luò)(R2U-Net)自動(dòng)分割肺部CT圖像的腫瘤,平均DSC值為98.32%。盡管如此,對(duì)CTV的識(shí)別與勾畫仍是研究難點(diǎn):首先,CTV除可見的解剖結(jié)構(gòu)之外,還包含亞臨床病變區(qū)域和可能侵及區(qū)域。其次,CTV形狀受個(gè)體差異、病灶位置與分期影響較大。即使分期相同,腫瘤侵犯范圍及淋巴累及范圍不同,勾畫范圍也會(huì)有所不同。另外,患者腸道位置變化、膀胱充盈形態(tài)也將對(duì)CTV的勾畫造成影響。
判別和勾畫宮頸癌患者的CTV臨床意義顯著。雖然目前已有部分開拓性研究[2-5],但是其主要應(yīng)用于患者自體圖像勾畫、圖像引導(dǎo)放療或再程計(jì)劃劑量疊加評(píng)價(jià),無法勾畫新患者的CTV。受限于臨床樣本量稀少及實(shí)現(xiàn)困難,基于CT圖像自動(dòng)勾畫新宮頸癌患者CTV的研究進(jìn)展緩慢,未見有相關(guān)結(jié)果報(bào)道。
本研究采用深度學(xué)習(xí)方法對(duì)宮頸癌盆腔放療患者CT圖像的CTV進(jìn)行自動(dòng)勾畫。為提高準(zhǔn)確度,使用對(duì)高形變軟組織器官具有較好自動(dòng)分割效果[14]的Dense V-Net融合算法。從研究結(jié)果來看,在訓(xùn)練樣本有限的情況下,Dense V-Net對(duì)CTV的特征能充分學(xué)習(xí),自動(dòng)勾畫宮頸癌CTV的效果較為理想,在進(jìn)行宮頸癌放療計(jì)劃設(shè)計(jì)時(shí),該網(wǎng)絡(luò)可實(shí)現(xiàn)CTV自動(dòng)預(yù)勾畫,將大大提高臨床工作效率。
然而,該網(wǎng)絡(luò)仍然存在較多局限性。其一,醫(yī)學(xué)樣本個(gè)體差異極大,有少數(shù)病例會(huì)出現(xiàn)特異性較大的CTV勾畫,而網(wǎng)絡(luò)在進(jìn)行特征學(xué)習(xí)時(shí)傾向于忽略這些異常信息,限制了Dense V-Net對(duì)各種復(fù)雜情況的兼容性。其二,本研究僅關(guān)注術(shù)后IB期和IIA期的宮頸癌勾畫,對(duì)更為復(fù)雜的臨床實(shí)際病例的自動(dòng)勾畫效果仍待明確。其三,由于對(duì)CTV包含的腫瘤潛在侵及區(qū)判斷,尤其是需要照射的淋巴結(jié)數(shù)量,依賴于醫(yī)生的臨床經(jīng)驗(yàn),因而不同醫(yī)生對(duì)同一患者CTV的勾畫存在不同理解,限制了網(wǎng)絡(luò)的普適性。
Dense V-Net自動(dòng)分割宮頸癌CTV各評(píng)價(jià)參數(shù)穩(wěn)定、趨近最優(yōu),DSC最高可達(dá)0.88。勾畫結(jié)果經(jīng)臨床盲評(píng),超過初級(jí)醫(yī)生勾畫水平,經(jīng)過較少修改,方可達(dá)到臨床要求。后續(xù)研究中,有望通過增加樣本數(shù)量和病例多樣性,采取進(jìn)一步增加網(wǎng)絡(luò)深度、微調(diào)網(wǎng)絡(luò)參數(shù)等措施,進(jìn)一步提高Dense V-Net的兼容性和普適性,實(shí)現(xiàn)更好的CTV勾畫效果。