曹世鵬,王大獎,王驍踴,陳天祿,沈九零,劉 暉,4*
(1.西藏大學(xué)理學(xué)院,3.宇宙線教育部重點實驗室,西藏 拉薩 850000;2.武漢大學(xué)中南醫(yī)院腫瘤放化療科,湖北 武漢 430071;4.武漢大學(xué)物理科學(xué)與技術(shù)學(xué)院,湖北 武漢 430072)
現(xiàn)代加速器的發(fā)展和強度調(diào)控放射治療的運用使放射治療(簡稱放療)中的輻射靶區(qū)劑量越來越趨于精準,這就要求對于勾畫目標及危及器官(organ at risk,OAR)需要有較高精確度,對目標體積和OAR進行精確的空間描述,在使腫瘤細胞獲得高度適形輻射劑量的同時保護健康組織,防止急性放射損傷及相關(guān)并發(fā)癥。傳統(tǒng)人工勾畫OAR方法耗時、費力,且觀察者內(nèi)和觀察者間均存在差異[1]。隨著計算機算法的發(fā)展,大量自動勾畫軟件被開發(fā)出來[2],目前自動和半自動勾畫已達到較高精度,且可重復(fù)性強[3-4];主要包括基于圖譜的自動勾畫方法[5-6]和基于人工智能的自動勾畫方法[7-8],其臨床表現(xiàn)不盡相同[9]。本研究評價AccuContour和United Imaging軟件自動勾畫胸部OAR的差異。
1.1 數(shù)據(jù)來源 病例來源于癌癥影像檔案館(The Cancer Imaging Archive,TCIA)的公開數(shù)據(jù)集(http://doi.org/10.7937/K9/TCIA.2017.3r3fvz08.),包括來自3個機構(gòu)的60例非小細胞肺癌患者(每個機構(gòu)各20例),其中男33例,女27例,年齡37~92歲,共60個數(shù)據(jù)集。本研究以來自其中24例(男10例、女14例)的24個數(shù)據(jù)集作為測試數(shù)據(jù)集,每個數(shù)據(jù)集包括一組DICOM CT圖像文件和一個DICOM RTSTRUCT文件。胸部軸位CT掃描參數(shù):層厚1 mm/2.5 mm/3 mm,層數(shù)103~279,F(xiàn)OV 50 cm×50 cm,重建冠狀位及矢狀位圖像,重建矩陣512×512。DICOM RTSTRUCT文件提供用于評估分割性能的手動勾畫輪廓;OAR包括心臟、左肺、右肺、食管和脊髓。由1名主任醫(yī)師對手動勾畫的輪廓進行質(zhì)量檢查,并加以編輯,使其盡可能符合RTOG 1106輪廓指南[10]。所選數(shù)據(jù)集均未用于開發(fā)兩種待評估軟件。
1.2 自動勾畫軟件 AccuContour 3.0自動勾畫軟件由Manteia數(shù)據(jù)科技有限公司開發(fā),為基于人工智能深度學(xué)習(xí)的自動勾畫軟件,通過建立圖像分割模型,并基于一定量的訓(xùn)練數(shù)據(jù)集對模型進行訓(xùn)練;對訓(xùn)練所得模型的驗證參數(shù)進行分析,選取訓(xùn)練效果最佳的訓(xùn)練模型作為最終的OAR自動勾畫模型。
United Imaging勾畫軟件由上海聯(lián)影智能醫(yī)療科技有限公司開發(fā),是基于聯(lián)影智能自主研發(fā)的分割算法開發(fā)研制的自動勾畫系統(tǒng),支持全自動分割OAR和靶區(qū),完成以大量訓(xùn)練數(shù)據(jù)集進行的訓(xùn)練后投入臨床使用。上述2種軟件均由軟件公司訓(xùn)練完成,并獲得正版授權(quán)許可。
1.3 評估參數(shù) 采用MIM 6.7.14軟件,獲取勾畫時間、豪斯多夫距離(Hausdorff distance,HD)、形狀相似性指數(shù)(dice similarity coefficient,DSC)及平均最小距離(mean distance to agreement,MDA);以測試數(shù)據(jù)集中人工勾畫的OAR輪廓作為“金標準”,評價自動勾畫OAR輪廓的準確性。
HD用于度量體積輪廓中2個輪廓(A和B)之間的最大失配程度;二維平面中,HD為2個子集之間最近點所有距離中的最大值,對輪廓之間個別部位的差異尤為敏感,其值越小,代表勾畫效果越優(yōu)[11],見公式(1)。DSC用于度量標準體積重疊,通過計算2個輪廓(A和B)之間相互重疊部分的體積與2個輪廓體積之和的比值來描述輪廓之間的重合程度,其值越大代,表勾畫效果越優(yōu)[2,11],見公式(2)。MDA是代表每個體素從一個結(jié)構(gòu)(A)表面到另一個結(jié)構(gòu)(B)表面的平均最短距離的幾何參數(shù)[12],理想情況下MDA=0,見公式(3)。
(1)
(2)
MDA(A,B)=
(3)
1.4 統(tǒng)計學(xué)分析 采用SPSS 26.0統(tǒng)計分析軟件。以±s表示服從正態(tài)分布的計量資料,采用配對t檢驗比較各參數(shù)差異;以中位數(shù)(上下四分位數(shù))表示不服從正態(tài)分布的計量資料,采用Wilcoxon秩和檢驗比較各參數(shù)差異。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 AccuContour軟件 平均勾畫時間(37.271±6.166)s;食管和脊髓的DSC較低,中位數(shù)分別為0.692和0.767,且MDA中位數(shù)>2.0 mm;心臟和左、右肺DSC中位數(shù)均>0.9,左、右肺MDA中位數(shù)<2.0 mm,心臟平均MDA稍高,為(2.385±0.747)mm;HD中位數(shù)在心臟最低(15.003 mm),在脊髓最高,為45.248 mm,見表1。自動勾畫的心臟和肺與輪廓手動勾畫輪廓的重合度較好;食管、脊髓勾畫效果相對較差,手動勾畫輪廓中,脊髓下緣延伸至L2下緣或脊髓最下端,而自動勾畫方法對于下端層面勾畫不足,僅顯示胸椎范圍內(nèi)的脊髓,見圖1。
2.2 United Imaging軟件 平均勾畫時間為20.333±1.195)s;食管和脊髓的DSC較低,中位數(shù)分別為0.790和0.789,且脊髓MDA中位數(shù)>3.0 mm;心臟平均DSC>0.8,其平均MDA稍高,為(3.434±1.106)mm;左、右肺DSC中位數(shù)均>0.9,且MDA<2.0 mm;食管的HD中位數(shù)最低(11.898 mm),脊髓最高,為46.572 mm,見表1。自動勾畫的心臟邊界中包含更多血管層面;肺部的自動勾畫與手動勾畫邊界重合度好,但未排除肺部氣管和腫瘤;自動勾畫對于食管上下界的識別不穩(wěn)定,輪廓勾畫效果稍差;自動勾畫脊髓效果較差,上緣超出手動勾畫包含的全部脊髓范圍較多,見圖1。
圖1 患者男,非小細胞肺癌 A~C.依次為AccuContour軟件(藍色)與手動勾畫(紅色)的軸位(A)、矢狀位(B)及冠狀位(C)胸部CT圖像中的OAR;D~F.依次為United Imaging軟件(黃色)與手動勾畫(紅色)的軸位(D)、矢狀位(E)及冠狀位(F)胸部CT圖像中的OAR
2.3 差異分析 United Imaging軟件勾畫時間明顯短于AccuContour軟件(t=-14.781,P=0.005)。2種軟件勾畫心臟的HD、DSC及MDA差異均有統(tǒng)計學(xué)意義(P均<0.05)。United Imaging軟件勾畫的左肺DSC明顯大于AccuContour軟件(P<0.05)、MDA明顯小于AccuContour軟件(P<0.05);AccuContour軟件勾畫的右肺HD明顯小于United Imaging(P<0.05)。2種軟件勾畫的食管HD、DSC及MDA差異均有統(tǒng)計學(xué)意義(P均<0.05),勾畫脊髓的各項參數(shù)差異均無統(tǒng)計學(xué)意義(P均>0.05),見表1。
表1 AccuContour與United Imaging自動勾畫軟件勾畫OAR的準確度比較
自動勾畫軟件的出現(xiàn)使得放療效率獲得大幅提升,但不同軟件之間勾畫結(jié)果的差異可能影響放療計劃中的劑量計算結(jié)果和對OAR的保護。勾畫體積的增多勢必造成對OAR可耐受劑量的高估。本研究結(jié)果顯示,2種軟件對肺部的勾畫效果最佳,DSC均>0.95,DSC>0.7即表明2個輪廓重復(fù)性尚可,分割效果可接受[13];2種軟件勾畫心臟的效果表現(xiàn)較好,但United Imaging自動勾畫的上邊界包含了更多的血管層面,與手動勾畫的上邊界符合度較差,平均MDA稍高為(3.434±1.106)mm。對比分析發(fā)現(xiàn),AccuContour軟件勾畫心臟及右肺的效果優(yōu)于United Imaging,United Imaging軟件勾畫左肺的效果優(yōu)于AccuContour。
根據(jù)RTOG 1106指南[10],脊髓勾畫輪廓的上緣延伸至環(huán)狀軟骨的上方或環(huán)形軟骨下緣,下緣延伸至L2的下緣。2種軟件勾畫食管和脊髓的效果較差,HD均較高,AccuContour軟件自動勾畫食管的DSC為0.692,低于0.7;United Imaging軟件勾畫脊髓上下界普遍超出手動勾畫,AccuContour軟件勾畫脊髓上下界范圍則小于手動勾畫。脊髓的耐受量存在體積效應(yīng),脊髓勾畫過多或過少將造成體積效應(yīng)的低估或高估。對比分析發(fā)現(xiàn),United Imaging軟件勾畫食管的效果優(yōu)于AccuContour;2種軟件勾畫脊髓效果無顯著差異。2種軟件勾畫邊界的差異可能受訓(xùn)練數(shù)據(jù)集和勾畫算法的影響。因此,在自動勾畫軟件的訓(xùn)練過程中,訓(xùn)練數(shù)據(jù)集的選擇和處理顯得尤為重要。根據(jù)勾畫部位不同,結(jié)合勾畫指南精確確定訓(xùn)練集中OAR的勾畫邊界可能將得到更好的訓(xùn)練結(jié)果,進而減少對自動勾畫結(jié)果的手動編輯。
本研究中,United Imaging軟件耗時較AccuContour更少,但秒級的時間差別在臨床工作中實際意義較小,大部分結(jié)構(gòu)的自動勾畫結(jié)果均需手動調(diào)整后才能用于臨床。因此,自動勾畫的軟件勾畫時間和所需的手動修改時間總和對評價勾畫軟件的勾畫能力更有意義,是未來需進一步探究的方向。
綜上,不同軟件的差異受軟件所用算法、訓(xùn)練數(shù)據(jù)集以及訓(xùn)練強度的影響,AccuContour3.0和United Imaging軟件自動勾畫效果在不同部位的表現(xiàn)存在差異且各有所長;二者勾畫肺部和心臟效果較好,食道和脊髓效果稍差。本研究缺乏定性評價研究,定性評價自動勾畫達到臨床可接受標準所需的編輯時間以及自動勾畫輪廓對劑量分布的影響是未來進一步探究的方向。此外,如何結(jié)合機構(gòu)的需求選擇合適的軟件、結(jié)合機構(gòu)內(nèi)數(shù)據(jù)集和多機構(gòu)數(shù)據(jù)集對自動勾畫軟件做進一步訓(xùn)練也需進一步探討。
中國醫(yī)學(xué)影像技術(shù)2021年11期