【作者】姜筱璇,余行,鄧中華,朱智慧,傅玉川
四川大學(xué)華西醫(yī)院 放療科,成都市,610041
隨著人工智能技術(shù)的快速發(fā)展,基于神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)影像處理應(yīng)用也變得更加廣泛[1-2],其在放射治療領(lǐng)域中的典型應(yīng)用之一就是針對醫(yī)學(xué)影像中解剖結(jié)構(gòu)(腫瘤靶區(qū)和危及器官)的自動分割,以達到減少放療醫(yī)生的勾畫時間、顯著提升放療流程效率的目的[3]。目前臨床上主流的自動分割方式有基于圖集模板和基于深度學(xué)習(xí)(deep learning,DL)的分割,其中基于圖集的自動分割效果取決于患者影像與圖集的相似性,而基于DL的算法不依賴于先驗輪廓,能夠自主對圖像數(shù)據(jù)進行學(xué)習(xí),相較于基于圖集的分割模式,基于DL的自動分割準(zhǔn)確性和效率均更高[4-5]。
然而,DL自動分割算法在魯棒性和穩(wěn)定性方面仍需進一步研究,文獻報道不同的圖像獲取途徑和重建協(xié)議會對DL的性能產(chǎn)生影響[6]。放射治療流程中靶區(qū)與器官勾畫、計劃設(shè)計和劑量計算等均建立在CT(computed tomography,CT)圖像的基礎(chǔ)上,而臨床使用的不同CT重建協(xié)議參數(shù)會造成圖像質(zhì)量的差異,進而影響DL的穩(wěn)定性。臨床上廣泛采用的濾波反投影法(filter back projection,FBP)重建速度快且易于實現(xiàn),但對圖像噪聲敏感,重建之后的圖像噪聲高、條紋偽影明顯,空間分辨力可檢測性較差。近年來由GE Healthcare公司推出的多模型迭代重建(adaptive statistical iterative reconstruction-VEO,ASiR-V)算法采用了更為先進的系統(tǒng)噪聲模型,同時納入被掃描物體模型和物理模型來降低圖像噪聲,提高空間分辨率[7-8];另一個能夠改變圖像質(zhì)量的參量是重建卷積核(convolution kernel),臨床應(yīng)用中可根據(jù)實際需求選擇不同類型的卷積核[9]。在放射診斷學(xué)中,ZHAO等[10]的研究證明基于DL的方法相比影像組學(xué)在肺腺癌診斷的表現(xiàn),更容易受到自適應(yīng)統(tǒng)計迭代重建技術(shù)(adaptive statistical iterative reconstruction,ASiR)與卷積核參數(shù)的影響;BLAZIS等[11]的研究結(jié)果也表明,基于DL的肺結(jié)節(jié)檢測系統(tǒng)在迭代重建算法生成的圖像和FBP圖像之間表現(xiàn)存在差異。相比于傳統(tǒng)的FBP算法,ASiR-V和卷積核重建參數(shù)對CT影像自動分割的影響目前尚不明確,有必要對其穩(wěn)定性進行評估。本研究使用DL分割算法,在使用不同參數(shù)重建的盆腔CT影像上,對危及器官(organs at risk,OAR)進行自動分割,將分割結(jié)果與FBP圖像的分割結(jié)果進行比較,探究重建算法參數(shù)對CT影像自動分割穩(wěn)定性的影響。
選取2020年11月至12月在四川大學(xué)華西醫(yī)院放療科接受盆腔放療的腫瘤患者20例,男12例,女8例,平均年齡為(62.3±12.6)歲。所有患者均采取仰臥位、體部熱塑膜進行體位固定,雙手交叉置于頭頂。
CT定位采用256排Revolution CT(GE Healthcare,美國)掃描儀,設(shè)置管電壓為120 kVp,采用自動管電流調(diào)制技術(shù),探測器寬度為80 mm,螺距為0.992:1,轉(zhuǎn)速為0.5 s/r,單層影像尺寸為512×512像素,掃描層厚為0.625 mm,重建層厚為3 mm。增強CT圖像掃描時,對比劑使用碘佛醇(350 mgI/mL),流速為1.8~2 mL/s,動脈期掃描延遲約40 s。掃描范圍自胸10椎體至坐骨結(jié)節(jié)下5 cm。
ASiR-V結(jié)合了上一代的ASiR與基于模型的迭代重建(model-based iterative reconstruction,MBIR,商品名VEO)的優(yōu)勢,三種不同迭代重建算法的模型差異,如圖1所示。ASiR-V在MBIR的基礎(chǔ)上舍棄了重建過程中耗時最久的光學(xué)模型[8],因此重建速度與FBP算法相當(dāng)。ASiR-V采用先進的噪聲模型將數(shù)據(jù)采集系統(tǒng)中的電子噪聲、光子噪聲和重建圖像的噪聲譜均考慮在內(nèi)。與傳統(tǒng)的迭代重建算法相比,ASiR-V能夠在降低劑量的同時保證一定的空間分辨率。ASiR-V的參數(shù)可以在0~100%范圍內(nèi)進行選擇,重建后的圖像由FBP重建和ASiR-V迭代重建共同組成,例如30% ASiR-V的圖像由30% ASiR-V重建與70% FBP重建組成。
圖1 三種迭代重建算法模型差異比較Fig.1 Comparison of three iterative reconstruction algorithms models
重建卷積核又稱濾波函數(shù),是指CT圖像重建中在反投影前修改投影數(shù)據(jù)頻率的過程,其作用是補償CT影像采集過程中數(shù)據(jù)采樣不均勻性造成的模糊,并恢復(fù)或增強成像對象結(jié)構(gòu)的邊緣信息。卷積核的選擇會影響圖像處理的質(zhì)量,其應(yīng)用主要體現(xiàn)在對像素噪聲及圖像分辨率的處理效果上。如在臨床實踐中,“Soft Kernel”的應(yīng)用雖然可以減少圖像噪聲,但為保證低對比度的細節(jié),削弱了圖像的清晰度。
在本研究中,所有患者均僅進行了一次CT掃描,以FBP重建圖像作為基準(zhǔn),使用ASiR-V(包括30%、60%、90%三種)和卷積核(包括Stnd、Soft、Detail三種)交叉重建出9組圖像。
利用AiContour智能勾畫系統(tǒng)(Version 3.1.10.0,LinkingMed,中國)完成每個病人10組圖像上的OAR自動分割工作,其中包括3個軟組織器官(膀胱、腸袋、小腸)和5個骨性器官(左、右股骨頭,左、右股骨,骨盆)。本智能勾畫系統(tǒng)主要由分類加分割的兩階段算法執(zhí)行體系構(gòu)成,其分割網(wǎng)絡(luò)為U-Net和ResNet結(jié)合的網(wǎng)絡(luò)架構(gòu)。
DSC系數(shù)(dice similarity coefficient)是最常見的用于評估圖像分割效果的指標(biāo)[12]。在圖像分割中,DSC是指兩結(jié)構(gòu)相交面積占二者總面積的百分比,由于OAR是具有一定體積的三維結(jié)構(gòu),因此在使用DSC時應(yīng)計算體積上的重合度。DSC的具體計算公式如下:
通過式(1)計算得到的DSC是一個取值范圍在0到1之間的參數(shù),DSC結(jié)果越大,說明分割結(jié)果相似性越高。在本研究中,將FBP圖像上DL分割的結(jié)構(gòu)作為參考標(biāo)準(zhǔn),其余9幅圖像上的結(jié)構(gòu)均分別與之比較得到各自的DSC結(jié)果。
Hausdorff距離(Hausdorff distance,HD)作為一種相似性度量,對分割結(jié)果的位置差異敏感,在二維平面中,HD是指從一個集合到另一個集合之間最近點的所有距離的最大值[13]。本研究采用95%HD值,表示第九十五百分位上的邊界間的距離。
采用SPSS Statistics 25.0(IBM,美國)進行統(tǒng)計學(xué)分析,計量資料使用均數(shù)±標(biāo)準(zhǔn)差表示。非正態(tài)分布數(shù)據(jù)選用非參數(shù)Friedman M檢驗來進行差異顯著性檢驗和兩兩比較,P值由Bonferroni校正后得到,P<0.05表示差異具有統(tǒng)計學(xué)意義。
利用DL自動分割的9組重建圖像結(jié)果與FBP圖像結(jié)果的DSC值進行比較,如表1所示,每組圖像所有器官的DSC均值均高于0.9。其中,與周圍組織具有高對比度的骨性結(jié)構(gòu),在每種重建算法下自動分割的結(jié)構(gòu)相似性均較高(DSC均值大于0.97),且差異范圍均在2%以內(nèi)。膀胱DSC均值較高(大于0.95),30% ASiR-V與Stnd卷積核重建圖像上的膀胱結(jié)構(gòu)與FBP圖像上的膀胱結(jié)構(gòu)最為接近,而90% ASiR-V與Stnd卷積核重建所得圖像的分割結(jié)果與參考標(biāo)準(zhǔn)相似性最低。小腸DSC值在9種重建圖像間的偏差為6.0%,且與FBP圖像上分割結(jié)果最相似的重建參數(shù)為30% ASiR-V與Stnd卷積核。DL算法在腸袋分割的表現(xiàn)呈現(xiàn)出了穩(wěn)定的結(jié)果,最高DSC(30% ASiR-V與Stnd卷積核)與最低DSC(90% ASiR-V與Soft卷積核)的差異為1.2%。DL在不同迭代重建算法CT圖像上的分割差異,如圖2所示。其中:膀胱由黑色填充標(biāo)注,腸袋由白色框線標(biāo)注,小腸由白色填充標(biāo)注。圖2(a)和(b)分別為DL在FBP、90% ASiR-V和Soft卷積核重建圖像上的自動分割結(jié)果。與FBP的分割結(jié)果相比,在90% ASiR-V與Soft卷積核重建后的圖像中,小腸的分割相似性遠低于腸袋。
圖2 DL在不同迭代重建算法CT圖像上的自動分割差異(同一層面)Fig.2 Difference of auto-segmentation on CT images with different iterative reconstruction algorithms by neural network (on the same layer)
表1 九種重建算法自動分割結(jié)果與FBP圖像自動分割結(jié)果比較的DSC值Tab.1 DSC of auto-segmentation results between nine reconstruction algorithms and FBP
當(dāng)卷積核確定時,隨著ASiR-V迭代次數(shù)的增加,所有器官分割結(jié)果的DSC均呈現(xiàn)下降趨勢;同樣的,下降趨勢在每一個卷積核都存在,但統(tǒng)計學(xué)差異只存在于部分組間,如軟組織結(jié)構(gòu)在所有的卷積核重建下,30%ASiR-V與90%ASiR-V的組間比較差異均具有統(tǒng)計學(xué)意義(P<0.05)。當(dāng)ASiR-V迭代次數(shù)確定時,不同卷積核重建影像對自動分割影響的統(tǒng)計學(xué)差異主要存在于Soft和Stnd、Soft和Detail之間。除左股骨頭90% ASiR-V重建協(xié)議外,其余Stnd和Detail卷積核之間的兩兩比較尚未發(fā)現(xiàn)差異具有統(tǒng)計學(xué)意義。
除小腸外,所有軟組織結(jié)構(gòu)和骨性結(jié)構(gòu)的HD值均在90% ASiR-V重建圖像中最高(見表2),且當(dāng)卷積核固定時,不同ASiR-V參數(shù)組間比較的差異均具有統(tǒng)計學(xué)意義(P<0.05)。
表2 九種重建算法自動分割結(jié)果與FBP圖像自動分割結(jié)果比較的Hausdorff距離Tab.2 HD of auto-segmentation results between nine reconstruction algorithms and FBP
迭代重建算法作為一種新穎的CT重建技術(shù),在圖像噪聲抑制、輻射劑量降低和空間分辨率提高等方面均有明顯的效果[14]。傳統(tǒng)FBP重建作為解析算法的代表,在輻射劑量降低時無法克服噪聲增加的矛盾[15]?,F(xiàn)有文獻表明,基于ASiR-V的圖像重建可以獲得良好的客觀與主觀評價[16],同時也是迭代算法代替?zhèn)鹘y(tǒng)解析算法的新方向。為減少腫瘤患者的受照劑量,并提高醫(yī)生勾畫工作的舒適度,一些中心會使用迭代算法,如針對Philips公司iDose4迭代重建算法在放療CT影像的器官輪廓識別、劑量測定等方面的研究表明,iDose4迭代算法能夠與FBP圖像的CT數(shù)保持一致,且不影響靶區(qū)和危及器官勾畫的準(zhǔn)確性,可以用于放射治療定位和計劃設(shè)計[17-18]。因此本研究探討了現(xiàn)有的DL自動分割方法運用在不同重建算法參數(shù)的圖像上能否保持其穩(wěn)定性,從而使臨床獲益更多。
不同MBIR重建參數(shù)影像對盆腔OAR分割的研究結(jié)果表明,影像重建參數(shù)對自動分割的穩(wěn)定性存在影響[19],這與我們的研究結(jié)果相似。截至目前,尚未有針對ASiR-V和卷積核組合重建算法參數(shù)對放療CT影像自動分割影響的研究。
本研究旨在探究多種ASiR-V與卷積核組合形成的重建算法參數(shù)得到的圖像對深度學(xué)習(xí)自動分割結(jié)果穩(wěn)定性的影響。DSC的結(jié)果顯示,DL對軟組織的分割結(jié)果受重建參數(shù)影響更明顯,例如在某些病例中小腸在90% ASiR-V重建協(xié)議下,分割的結(jié)果與FBP圖像比,DSC值僅有0.6807,而DSC值大于0.7時才可認(rèn)為參考結(jié)構(gòu)和被測結(jié)構(gòu)相似度良好。這可能是因為腸道是腔型結(jié)構(gòu),腔內(nèi)內(nèi)容物的變化與訓(xùn)練網(wǎng)絡(luò)時的訓(xùn)練集差異較大導(dǎo)致分割不佳,因此自動分割結(jié)果在各個重建圖像上的差異都比較大。小腸的分割結(jié)果與FBP最接近的重建算法為30% ASiR-V與Detail卷積核的組合,但在同為30% ASiR-V的卷積核組間比較中尚未發(fā)現(xiàn)統(tǒng)計學(xué)差異。這表明雖然卷積核不同,DL在針對小腸這種變異度較大的結(jié)構(gòu)時,自動分割功能受卷積核影響可忽略不計。對于所有軟組織結(jié)構(gòu),DL在Soft卷積核重建圖像下均未能表現(xiàn)出良好的分割結(jié)果。因此與放射診斷學(xué)不同,相比于Stnd與Detail卷積核,Soft卷積核不能使軟組織結(jié)構(gòu)在自動分割階段獲益更多;此外,HD的結(jié)果證明,90% ASiR-V或Soft卷積核重建圖像中的自動分割結(jié)果在OAR邊緣處理方面與FBP圖像的結(jié)果相似性低,這表明了DL在過于“平滑”的圖像中對器官組織邊緣的識別能力不佳。在研究中針對腸道結(jié)構(gòu),選擇了腸袋和小腸兩種結(jié)構(gòu)進行比較,DL的表現(xiàn)在腸袋中較穩(wěn)定,分割結(jié)果良好,也有研究得出相似結(jié)果[20],因此臨床中醫(yī)生偏好以腸袋代替小腸作為限制劑量的目標(biāo)結(jié)構(gòu)。骨性結(jié)構(gòu)的自動分割受到CT重建參數(shù)的影響較小,且在臨床工作中,醫(yī)生手動勾畫時間相對較短,因此該部分影響可以被忽略。
本研究僅選擇了20例病例展開分析,樣本量較小,這是本研究的不足之一。另外,本研究目前僅得出ASiR-V與卷積核組合的重建后的CT對DL穩(wěn)定性存在影響的結(jié)論,關(guān)于如何提升DL的分割準(zhǔn)確性仍需進一步研究,即優(yōu)化預(yù)處理的算法以應(yīng)對因CT圖像重建參數(shù)與訓(xùn)練集不同而導(dǎo)致分割不準(zhǔn)確的情況。
ASiR-V與卷積核對放射治療盆腔OAR自動分割穩(wěn)定性在軟組織結(jié)構(gòu)中影響較大,尤其對空腔結(jié)構(gòu)的小腸影響較大,對于膀胱、腸袋等影響較小,對骨性結(jié)構(gòu)影響更小,臨床可以通過醫(yī)生手動修改來彌補差異。更高的迭代次數(shù)雖然能夠降低圖像噪聲,但影響了深度學(xué)習(xí)的分割質(zhì)量,且容易出現(xiàn)偽影,因此不推薦使用;重建卷積核對分割穩(wěn)定性具有一定影響,但造成的差異較小。在實際應(yīng)用中需在圖像質(zhì)量與分割質(zhì)量中尋求平衡,探索更適合放射治療影像的CT重建算法,同時需要改進DL的算法以達到能夠在不同重建參數(shù)形成的CT上均實現(xiàn)良好分割結(jié)果的目的。