丁奕,盧超,王霄霄,陳建,單秀紅
(1. 江蘇大學醫(yī)學院,江蘇 鎮(zhèn)江 212013; 2. 江蘇大學附屬人民醫(yī)院影像科,江蘇 鎮(zhèn)江 212002)
胃癌的發(fā)病率在所有惡性腫瘤中處于第5位,而死亡率處于第3位,男性發(fā)病率約為女性的2倍以上[1]。Lauren分型是胃癌臨床組織病理學簡單有效的分類方法之一。根據(jù)胃癌的組織形態(tài)學和細胞特性,Lauren分型分為腸型、彌漫型和混合型 。研究表明腸型胃癌患者預后優(yōu)于彌漫型,彌漫型胃癌復發(fā)率高于腸型[2]。如果術前能預測是腸型或彌漫型,對治療方案的選擇、預后的評估及生活質量的提高有重要意義。
影像組學是一種從醫(yī)學圖像中提取和分析大量高級定量成像特征的高通量方法,它的出現(xiàn)為腫瘤的個體化診療提供了新的思路,包括在腫瘤的診斷與鑒別診斷[3-4]、腫瘤轉移預測[4-5]、療效評價[6-7]、預后及生存率預測[8-9]等方面都顯示出了很好的前景。Liu等[10]對基于CT的紋理分析的研究表明,動脈期的熵和標準差以及門脈期的最大衰減、平均衰減和模式等特征,可以為胃癌Lauren分型的預測提供重要幫助。Ma等[11]通過計算腫瘤動態(tài)增強MRI圖像感興趣區(qū)(region of interest,ROI)中的細胞外和血管外體積分數(shù),發(fā)現(xiàn)彌漫型胃癌患者的體積分數(shù)高于腸型。目前還未見利用瘤內與瘤周的信息構建影像組學模型用于術前預測胃癌Lauren分型的研究。本研究擬構建并驗證一個結合瘤內、瘤周和部分臨床信息的CT影像組學模型,用于術前預測胃癌的Lauren分型。
本次回顧性研究由江蘇大學附屬人民醫(yī)院倫理審查委員會批準,收集2011年12月至2017年12月連續(xù)就診的經(jīng)病理學檢查證實的胃癌患者1 097例。納入標準: ① 組織病理學檢查證實為胃癌; ② 手術前1周內行標準的腹部增強CT檢查。排除標準: ① 接受過任何針對胃癌的治療(n=184); ② 合并其他類型腹部腫瘤(n=7); ③ 臨床資料不全(n=26); ④ 低張力藥物禁忌證,如青光眼、前列腺肥大等(n=11); ⑤ 碘對比劑過敏史(n=7); ⑥ Lauren分型混合型(n=323)。最后共有539例入組,按照7 ∶3的比例被隨機分為訓練集和驗證集。收集患者的臨床資料,包括年齡、性別、病理學Lauren分型、CT-T分期、CT-N分期。CT-T分期及CT-N分期根據(jù)國際抗癌聯(lián)合會與美國癌癥聯(lián)合委員會的指導方針確定。
所有患者均采用西門子公司Siemens Sensation 64層及飛利浦Briliance 256層螺旋CT進行掃描,掃描參數(shù):電壓120 kV,電流220~250 mA,圖像層厚0.625 mm和0.5 mm?;颊邫z查前空腹8 h,CT掃描前10 min肌注鹽酸山莨菪堿20 mg,口服溫開水800~1 000 mL,以使胃部充盈,經(jīng)肘靜脈注射非離子型對比劑碘海醇(碘濃度270 mg/100 mL),注射總量為1.5 mL/kg,注射速率為3.0 mL/s,注射后35 s采集動脈期圖像,70 s采集靜脈期圖像。
收集靜脈期CT圖像,導入ITK-SNAP軟件。進行最大層面ROI的手工分割,首先由兩名影像科腹部組主治醫(yī)師分別對所有的目標病灶進行手動分割,然后由影像科主任醫(yī)師對所有的目標病灶進行校對。分割范圍應該覆蓋整個腫瘤區(qū)域。一個月后從539例胃癌病例中隨機選擇30例由上述3位影像科醫(yī)師重復以上分割過程,以便進行可靠性和再現(xiàn)性測試。將分割完成的腫瘤ROI導出存儲為DICOMG格式的圖像。同時在每位患者CT圖像上勾畫的邊界上自動創(chuàng)建一個周圍環(huán)。
利用Python軟件對ROI內的影像組學特征進行提取,所有CT圖像在特征提取前均以3.0 mm×3.0 mm×3.0 mm的像素間距重新采樣,以保證像素大小和切片厚度的正確性。從每位患者CT圖像中的瘤內及瘤周區(qū)域提取影像組學特征,包括形狀特征、一階特征和紋理特征。
首先對提取的特征進行預處理,利用平均值替代缺失值及異常值。其次采用z-score方法,根據(jù)訓練隊列中患者的平均值和標準差參數(shù),對大量影像組學特征進行標準化。再次采用組內相關系數(shù)(intraclass correlation coefficient,ICC)來評價兩次圖像分割的影像組學特征的一致性[12],本研究認為ICC>0.75提示為一致性較好的特征。最后采用10倍交叉驗證的最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸選擇出最優(yōu)的特征組合。
將篩選出的瘤內及瘤周的最優(yōu)特征輸入多變量Logistic回歸,通過將各回歸系數(shù)加權后的相應特征相加,得出影像組學標簽。影像組學模型結合了影像組學標簽、CT-T分期、CT-N分期及年齡構建而成。同時根據(jù)上述最優(yōu)影像組學特征中的瘤內及瘤周特征,分別建立基于瘤內及瘤周的模型。臨床模型1基于CT-T分期和CT-N分期建立。臨床模型2基于CT-T分期、CT-N分期及年齡構建,由于臨床模型2由具有顯著統(tǒng)計學差異的臨床特征建立,因此可以驗證影像組學標簽對影像組學模型的增量值。所有模型都是在訓練集上建立,并在驗證集上進行測試。
在訓練集和驗證集中使用ROC曲線來評估模型的預測能力。使用Delong檢驗比較模型之間預測性能。采用校準曲線驗證模型預測能力與實際結果的匹配性,同時采用決策曲線證明本次研究臨床信息的有效性[13]。使用綜合判別改善指數(shù)(integrated discrimination improvement,IDI)對影像組學模型的分類能力進行評估。最后基于最優(yōu)模型生成影像組學諾模圖,實現(xiàn)模型可視化從而應用于臨床。
所有的統(tǒng)計學分析均使用R軟件(版本3.4.3,https:∥www.r.project.org)進行。在單因素分析中連續(xù)臨床因素變量(年齡)采用t檢驗;分類變量(性別、CT-T分期、CT-N分期)采用χ2檢驗或Fisher精確檢驗。雙側P值<0.05為差異具有統(tǒng)計學意義。
訓練集及驗證集之間Lauren分型類別分布無統(tǒng)計學差異(P=0.566 6)。通過訓練集中的單因素分析,確定了預測Lauren分型的臨床特征為年齡、CT-T分期及CT-N分期。訓練集和驗證集的臨床特征見表1。
從所有病例的CT圖像中共提取瘤內及瘤周影像組學特征2 074(1 037+1 037)個。對所提取的特征進行預處理及z-score方法標準化,然后以ICC>0.75為可靠性標準,提取出232個瘤內特征和206個瘤周特征,采用LASSO回歸對影像組學特征進行降維,篩選出3個最優(yōu)特征組合,包括兩個基于瘤內的一階特征(original_firstorder,wavelet.LL_firstorder)和一個基于瘤周的形狀特征(original_shape_Maximum2DDiameterSlice),以此構建影像組學標簽。
基于上述臨床及影像組學特征,本研究構建了6個預測模型:基于CT-T分期及CT-N分期的臨床模型1;基于CT-T分期、CT-N分期及年齡的臨床模型2;基于瘤內影像組學特征模型;基于瘤周的影像組學特征模型;基于瘤內及瘤周特征的影像組學標簽;基于臨床特征及影像組學標簽的影像組學模型。
通過ROC曲線對6個模型進行分析,結果顯示影像組學模型表現(xiàn)優(yōu)于其他模型。訓練集AUC為0.745,驗證集AUC為0.758,均高于其他模型。訓練集準確度為0.716,驗證集準確度為0.673,均高于其他模型。見圖1、表2。至此確定影像組學模型為術前預測胃癌Lauren分型的最佳模型。模型生成的諾模圖可以實現(xiàn)模型的可視化(圖2),通過該諾模圖可以實現(xiàn)胃癌術前Lauren分型的個性化預測,計算出的數(shù)值越高,則認為彌漫型胃癌的可能性越高。
關于影像組學模型與影像組學標簽之間的關系,盡管驗證集中Delong檢驗顯示影像組學模型和影像組學標簽之間沒有顯著的統(tǒng)計學差異(P=0.120 4),但是驗證集中5.71%的IDI顯示出影像組學模型較影像組學標簽的提升。此外在驗證集中,影像組學模型相較于臨床模型2,17.73%的IDI和Delong檢驗P值<0.000 1顯示影像組學標簽給影像組學模型帶來的提升。Delong檢驗結果見圖3。
表1 訓練集和驗證集的臨床資料比較
圖1 訓練集及驗證集中的ROC曲線
圖2 影像組學諾模圖
影像組學模型的校準曲線顯示出良好的適應度(圖4A)。與閾值概率范圍在1以內的兩種臨床方案相比,驗證集中的決策曲線分析(圖4B)表明影像組學模型在指導不同Lauren分型胃癌患者的治療時增加了更多益處。
術前Lauren分型對治療方案的選擇有重要影響。彌漫型胃癌的浸潤范圍通常超過邊界數(shù)厘米,因此彌漫型胃癌的切除范圍較大,切口邊緣距腫瘤邊緣約8~10 cm[14]。另一方面,彌漫型胃癌通常比腸型預后差[15]。因此,在術前準確預測Lauren分型尤為重要。目前術前Lauren分型主要依靠胃鏡病理活檢,但術前胃鏡病理活檢因活檢組織標本較少,結果并不能讓人滿意。研究顯示術前胃鏡活檢與手術標本的Lauren分型符合率僅為64.7%[16]。因此,研究者們試圖突破傳統(tǒng)方法,尋求創(chuàng)新的檢查和治療方案。
表2 訓練集及驗證集模型預測性能比較
A:訓練集;B:驗證集;標紅的方框表示兩個模型之間的P值<0.05
A:訓練集和驗證集的校準曲線;B:驗證集中的影像組學模型、臨床模型1及臨床模型2的決策曲線分析
本研究結果顯示影像組學模型可以作為一種有效工具,用于術前預測胃癌Lauren分型,并獲得良好的診斷效能。與單一基于瘤內影像組學特征模型相比,影像組學標簽預測性能稍高(AUC為0.659和 0.715)。研究顯示腸型胃癌和彌漫型胃癌的組織學改變不僅在腫瘤區(qū)有顯著差異[17],而且在癌周胃黏膜也有顯著差異。與彌漫型胃黏膜相比,腸型毗鄰胃黏膜很少有正?;蚪咏5慕Y構。彌漫型胃癌周圍黏膜常有多層褶皺,被胃表面上皮覆蓋。然而,類似的褶皺形成很少在腸型中遇到。因此,我們認為結合瘤周影像組學特征的影像組學標簽可以為術前預測胃癌Lauren分型提供更全面和準確的信息。
對訓練集中病例的分析顯示,Lauren分型與年齡、CT-T分期和CT-N分期顯著相關。通過對可視化的影像組學諾模圖的解讀,可以發(fā)現(xiàn)彌漫型胃癌的發(fā)生更可能與年齡小、CT-T分期及CT-N分期級別高有關。這些結果與先前的研究一致[17-18]。
與其他Lauren分型的無創(chuàng)研究相比,在訓練集和驗證集中,影像組學模型AUC分別為0.745和0.758,具有良好的鑒別性能。Liu等[19]回顧性分析了69例胃癌患者的MRI圖像發(fā)現(xiàn)胃癌的平均及最小表觀彌散系數(shù)值顯著低于正常胃壁,不同Lauren分型胃癌患者的平均及最小表觀彌散系數(shù)值有顯著性差異。Ma等[11]分析32例胃癌病例,計算出腫瘤動態(tài)增強磁共振圖像ROI細胞外和血管外體積分數(shù),發(fā)現(xiàn)彌漫型胃癌的體積分數(shù)高于腸型。然而,他們的研究由于病例數(shù)較少和沒有進行模型構建,無法應用。
綜上所述,本研究基于瘤內及瘤周的影像組學特征、CT-T分期、CT-N分期、年齡構建的影像組學諾模圖,可以用于個性化的術前預測胃癌患者的Lauren分型,輔助臨床決策的制定。本研究是一項回顧性研究,存在如下不足: ① 僅對門脈期的CT圖像進行影像組學特征提取。② 只分析了腫瘤最大層面圖像。③ 分割的CT圖像層厚是0.625 mm和0.5 mm,對直徑2 cm以下的胃癌分割圖像的容積效應明顯。④ 因為存在特征干擾將Lauren分型中的混合型撤除,但臨床上混合型的比例并不少。