周永進,高瑞杰,江春燕,2,鄧晶晶,夏水偉,沈少博,王祖飛,紀建松
1.浙江大學麗水醫(yī)院 放射科 浙江省影像診斷與介入微創(chuàng)研究重點實驗室,浙江 麗水 323000;2.松陽縣人民醫(yī)院 放射科,浙江 麗水 323400;3麗水市人民醫(yī)院 放射科,浙江 麗水 323000
非功能性胰腺神經內分泌腫瘤(n o nfunctional pancreatic neuroendocrine tumors,NF-pNETs)是一種高度異質性、侵襲性生長的腫瘤[1],而實性假乳頭狀瘤(solid pseudopapillary tumors, SPTs)是良性或低度惡性腫瘤[2],相比較而言NF-pNETs的5年生存率(約65%)顯著低于SPTs(95%)[3]。雖然手術切除是二者的主要治療手段,但對于不可切除的NF-pNETs通常需采用化療或靶向治療[1],而SPTs目前尚無化療指征[4]。由于此二者的治療策略和預后不同,因此,對NF-pNETs和SPTs進行區(qū)分是必要的。雖然,SPTs常呈進行性強化,且NF-pNETs動脈期表現(xiàn)為顯著均勻或環(huán)形強化[2],但是,NF-pNETs有時亦可表現(xiàn)為低增強,并且兩種腫瘤均可有鈣化和囊變[5],此時二者的區(qū)分存在困難。隨著計算機技術的發(fā)展,影像組學技術已被廣泛應用于醫(yī)學領域并致力于臨床轉化應用[6]。通過對醫(yī)學原始圖片的腫瘤區(qū)域提取紋理特征,定量分析病灶灰度分布情況,可以非侵入性地獲得比肉眼觀察更多的客觀特征,從而可以定量評估腫瘤的異質性。本研究通過基于CT平掃和增強圖像的影像組學技術來區(qū)分NF-pNETs和SPTs,以期輔助臨床提供更為有效通用的定量方法。
1.1 一般資料 回顧性分析2008年6月至2021年4 月浙江大學麗水醫(yī)院、麗水市人民醫(yī)院、松陽縣人民醫(yī)院符合以下標準的患者。納入標準:①經病理證實為NF-pNETs或SPTs的患者,NF-pNETs需結合臨床特征證實;②治療前行常規(guī)CT平掃+三期增強檢查。排除標準:①CT圖像偽影累及病灶,影響定量測量要求;②病灶過小(<1 cm),無法勾畫病灶VOI。87例患者納入研究,NF-pNETs 53例,年齡(54.3±12.4)歲;SPTs 34例,年齡(34.9±13.1)歲。本研究通過了浙江大學麗水醫(yī)院倫理委員會的批準(科研倫審2022第89號)。
1.2 檢查方法 多排螺旋CT包括PHLIPS、GE、TOSHIBA公司16排以上CT掃描儀,管電壓120 kV、管電流220~250 mAs,螺距0.8,層厚5 mm。所有患者均在治療前行常規(guī)腹部或胰腺平掃+增強掃描。平掃后,經肘靜脈以3 mL/s注射非離子型對比劑碘海醇,注射劑量1.5 mL/kg,注射后于25~35 s、45~60 s、135~150 s行動脈期、門脈期及延遲期增強掃描。
1.3 常規(guī)CT征象分析 由2名經驗豐富的高年資醫(yī)師在不知道患者病理結果的情況下對所有圖像進行判讀,遇到分歧時經商議達成一致。評估的內容包括腫瘤部位、大小、質地(囊性、囊實性或實性)、邊緣(清晰或模糊)、胰管擴張、淋巴結及肝轉移情況。腫瘤質地實性為強化實質達腫瘤90%及以上,囊實性為強化實質在90%以下;CT強化幅度值為各期強化值減去相應平掃CT值;胰管擴張標準為直徑大于3 mm[7]。
1.4 影像組學特征提取 由于掃描方案及設備不同,為最大限度地減少對組學特征影響,應用A.K.軟件(GE, Artificial Intelligence Kit)中的線性插值算法進行等向同性重采樣,體素大小為1 mm×1 mm×1 mm,對CT平掃、動脈期、靜脈期圖像進行均一化處理[8]。將原始DICOM圖片傳至ITK-SNAP軟件(版本3.6.0,https://www.itksnap.org/),由2名分別有8年和10年工作經驗的腹部放射診斷主治醫(yī)師逐層手動勾畫ROI,融合成VOI,勾畫時包括全部腫瘤組織,包括囊變、壞死及出血成分,全面評估腫瘤異質性(見圖1)。
圖1 NF-pNETs和SPTs患者CT動脈期的VOI勾畫
A.K.軟件提取腫瘤VOI紋理特征。紋理特征包括直方圖類、紋理特征類(texture)、形狀特征類(form factor)、灰度共生矩陣(gray-level cooccurrence matrix, GLCM)、步長矩陣類(gray-level run-length matrix, RLM)和灰度區(qū)域大小矩陣類(gray-level-size-zone matrix, GLSZM),共396個特征參數(shù)。
1.5 影像組學模型及列線圖構建 采用組內相關系數(shù)(intraclass correlation coefficient, ICC)對2 名醫(yī)師提取的特征進行一致性評估,ICC大于0.75為一致性比較好[9]。采用最大相關-最小冗余(max-relevance and min-redundancy, mRMR)、套索算法(least absolute shrinkage and selection operator, LASSO)和10折交叉驗證進行特征篩選保留最優(yōu)的特征。對最后保留的放射紋理特征構建影像組學標簽(Rad-score)。應用多因素Logistic回歸對臨床特征和Rad-score構建鑒別診斷影像組學列線圖。分類指標使用敏感度和特異度進行評估,性能指標還包括受試者工作特征(receiver operating characteristic, ROC)曲線下面積(area under curve, AUC),AUC的值越大分類效果越好,并采用Delong檢驗比較各模型的AUC值。采用決策曲線分析(decision curve analysis, DCA)計算列線圖及各特異因子在不同閾值概率下的凈效益情況,以評價影像組學預測模型的臨床應用價值。
1.6 統(tǒng)計學處理方法 采用R 3.4.4進行統(tǒng)計分析。采用隨機數(shù)字表法將87例患者以7:3比例分成訓練組62例和驗證組25例,Shapiro-Wilk檢驗是否符合正態(tài)分布和Levene方差齊性檢驗,計量資料符合正態(tài)分布的用±s表示,2組間比較采用獨立樣本t檢驗;不符合正態(tài)分布采用M(P25,P75)表示,2 組間比較用Man-WhitneyU檢驗;計數(shù)資料用例表示,2組間比較采用χ2檢驗或Fishers精確檢驗。P<0.05為差異有統(tǒng)計學意義。
2.1 一般資料 納入的87例患者中,NF-pNET患者53例,SPTs患者34例,二者的年齡、性別、病灶最大徑差異有統(tǒng)計學意義(P<0.05)。影像學特征中病灶部位、形態(tài)、鈣化與否的差異有統(tǒng)計學意義(P<0.05)。見表1。
表1 SPTs組和NF-pNETs組的臨床及CT征象比較
2.2 CT圖像紋理特征的影像組學模型構建 2名醫(yī)師勾畫的VOI提取的CT紋理特征一致性好,平掃ICC范圍為0.758~0.802,動脈期ICC范圍為0.845~0.877,延遲期ICC范圍為0.806~0.841。對提取的396個特征采用mRMR去冗余、LASSO和10折交叉驗證篩選后保留最優(yōu)特征,CT平掃、動脈期、延遲期圖像最終保留特征分別為8個、6個、7個,綜合模型最終保留10個特征,包括了7個動脈期特征和3個延遲期特征,基于上述特征形成影像組學Radscore(見表2)。
表2 篩選出的影像組學特征及系數(shù)
2.3 影像組學模型鑒別診斷效能比較分析 篩選最后保留的CT平掃、動脈期、延遲期紋理特征和三者聯(lián)合形成的Rad-score構建的影像組學模型,訓練組AUC分別為0.85(95%CI=0.75~0.94)、0.92(95%CI=0.85~0.99)、0.85(95%CI=0.76~0.95)和0.94(95%CI=0.88~0.99),驗證組AUC分別為0.75(95%CI=0.56~0.95)、0.89(95%CI=0.77~1.00)、0.83(95%CI=0.63~1.00)和0.90(95%CI=0.78~1.00),CT平掃構建的模型AUC值最小,三者聯(lián)合構建的模型AUC最大。通過Delong檢驗比較各模型的AUC值,三者聯(lián)合Radscore構建的模型與CT平掃模型的差異有統(tǒng)計學意義(Z=2.1698,P=0.030),CT動脈期、延遲期模型及三者聯(lián)合模型兩兩比較差異無統(tǒng)計學意義(P>0.05),見圖2。隨后,運用綜合模型Rad-score和臨床特征構建影像-臨床綜合影像組學模型,訓練組和驗證組中的AUC分別為0.97(95%CI=0.94~1.00)和0.92(95%CI=0.81~1.00)。見圖3。
圖2 CT平掃、動脈期、延遲期及三者聯(lián)合影像組學模型的ROC曲線
圖3 臨床模型、影像組學模型和綜合模型的ROC曲線
2.4 列線圖及臨床應用效力 多因素Logistic回歸分析顯示年齡、性別和腫瘤最大徑是患NF-pNETs的影響因素。為了給臨床醫(yī)師提供一個簡單便捷的工具,根據(jù)基于CT圖像的影像組學Radscore、年齡、性別和腫瘤最大徑構建綜合模型,繪制列線圖(見圖4)。DCA顯示,在閾值概率大于0.45的情況下,胰腺NF-pNETs和SPTs患者可以從該預測模型中獲益(見圖5)。
圖4 綜合影像組學列線圖
圖5 基于各模型影像組學的決策曲線
NF-pNETs是異質性高、侵襲性生長的腫瘤,SPTs為良性或低度侵襲性、預后良好的腫瘤。NFpNETs因侵襲性更強,外科手術方式更為激進,包括胰腺切除術和淋巴結清掃從而實現(xiàn)腫瘤切緣陰性;且當NF-pNETs合并肝轉移,患者的5年生存率顯著下降,僅為15~25%[10];從影像學定性方面判斷,NF-pNETs約有30%表現(xiàn)為低強化,和(或)伴有鈣化、囊性變[5],而SPTs亦表現(xiàn)相似,此時二者的區(qū)分存在困難。因此,借助基于CT影像組學獲取高通量數(shù)據(jù)的微觀差異將有助于區(qū)分二者,幫助臨床醫(yī)師制定手術計劃和選擇聯(lián)合治療方案。
本研究結果顯示,NF-pNETs患者和SPTs患者臨床特征中性別、年齡、鈣化和腫瘤大小差異有統(tǒng)計學意義,與之前的報道[11-12]基本一致,NF-pNETs多見于中老年人,SPTs以青年女性更為常見,且SPTs鈣化較NF-pNETs更為常見。WANG等[12]研究顯示年齡、鈣化是診斷SPTs的獨立預測因子,聯(lián)合鑒別診斷SPTs和乏血供pNETs的敏感度為100%,特異度為63.6%,AUC為0.865。雖然臨床及影像學定性特征有助于鑒別二者,但是,對于不典型的NF-pNETs和SPTs的區(qū)分仍有困難。
LIU等[11]運用基于增強延遲期CT圖像的紋理分析聯(lián)合臨床、影像特征對NF-pNETs和SPTs進行了鑒別,診斷效能顯示AUC為0.88,敏感度、特異度為88.89%、88.89%。與之不同,本研究對常規(guī)CT平掃和增強圖像提取病灶紋理特征,聯(lián)合了臨床特征區(qū)分NF-pNETs和SPTs,結果顯示綜合影像組學列線圖模型的診斷效能最佳,訓練組和驗證組AUC為0.97、0.92,優(yōu)于單純的基于CT平掃、動脈期或延遲期的影像組學模型(見圖2),表明綜合影像組學列線圖可有效地區(qū)分二者。動脈期、延遲期主要反映腫瘤血供、間質成分的強化特點,動脈期與腫瘤血管強化顯著相關,而靜脈期隨著對比劑的流入,腫瘤間質成分逐漸強化,因而在腫瘤功能毛細血管再生和反映腫瘤實質異質性方面有顯著優(yōu)勢[13],因而綜合多序列提取放射學紋理特征能更好地反映腫瘤內部細微特征及其異質性。另外,放射紋理特征建立的影像組學聯(lián)合臨床特征亦增強了模型的魯棒性,本研究中聯(lián)合了CT平掃、動脈期及延遲期的Radscore和臨床特征構建影像-臨床綜合影像組學模型,訓練組和驗證組中的AUC為0.97、0.92顯著高于單純的影像組學模型(AUC為0.94、0.90)和臨床模型(AUC為0.91、0.85)。多項研究[14-16]顯示基于臨床、放射紋理特征二者聯(lián)合構建的影像組學模型聯(lián)合模型優(yōu)于單純的臨床或影像組學模型,本研究結果與之一致,綜合影像組學模型優(yōu)勢更著,這有助于輔助臨床術前NF-pNETs和SPTs的個體化診斷。
為避免純數(shù)學指標(AUC等)對模型評估的抽象性,本研究形成了易于使用的可視化的影像組學列線圖,訓練組和驗證組中,綜合模型影像組學列線圖預測符合率顯著高于基于CT平掃、動脈期、延遲期,表明綜合模型影像組學列線圖具有較高的預測效能。同時,采用DCA來評估模型在所有可能風險閾值下的預測凈收益,從而評估各種風險閾值的影響[17]。DCA結果顯示,在閾值概率大于0.45的情況下,應用腫瘤與胰腺的CT影像組學列線圖差異來區(qū)分SPTs與NF-pNETs,比將所有患者當作SPTs或當作NF-NETs進行治療有更多的益處。
本研究的局限性:①樣本量較少,尤其是SPTs患者數(shù)量,可能導致建模過擬合,對模型的穩(wěn)定性造成一定的影響。②采用了不同的廠家或型號的螺旋CT掃描儀的數(shù)據(jù)圖像質量可能不一致,但是主要參數(shù)基本一致。③雖然納入了一些臨床特征,但是仍有一部分影像學特征未納入,未來我們將結合多種臨床和影像學特征,建立一個更為完善的診斷模型。
綜上所述,本研究基于CT平掃和增強圖像聯(lián)合臨床特征構建影像組學列線圖術前區(qū)分NF-pNETs和SPTs,顯示出其對識別需要監(jiān)測或手術切除的患者具有很大的潛力。