王玫,李寧,張祁,石峰,吳交交,馮琪,丁忠祥,4
(1.浙江大學(xué)醫(yī)學(xué)院附屬杭州市第一人民醫(yī)院放射科,浙江 杭州 310006;2.浙江中醫(yī)藥大學(xué)附屬第一醫(yī)院醫(yī)學(xué)影像科,浙江 杭州 310006;3.上海聯(lián)影智能醫(yī)療科技有限公司,上海 200232;4.浙江省臨床腫瘤藥理與毒理學(xué)研究重點實驗室,浙江 杭州 310006)
膀胱癌的發(fā)病率在我國的生殖泌尿系統(tǒng)腫瘤中居首位,根據(jù)是否存在肌層浸潤,其手術(shù)方案不同,非肌層浸潤性膀胱癌(Non-muscle invasive bladder cancer,NMIBC)一般運用經(jīng)尿道腫瘤電切術(shù),而肌層浸潤性膀胱癌(Muscle invasive bladder cancer,MIBC)因其復(fù)發(fā)率較高、容易遠處轉(zhuǎn)移等特性,多使用根治性膀胱切除術(shù)[1]。目前臨床上確定膀胱癌肌層浸潤的金標(biāo)準是膀胱鏡活檢,但這是一項有創(chuàng)檢查,依靠操作醫(yī)師的經(jīng)驗,實施不當(dāng)可能會導(dǎo)致對膀胱癌分期的低估[2-3],耽誤病情,導(dǎo)致不良的臨床結(jié)果[4]。因此,尋找一種無創(chuàng)且客觀的方法判斷膀胱癌術(shù)前是否存在肌層浸潤,對治療策略的制定尤為重要。
研究證明MRI 在術(shù)前膀胱癌肌層浸潤的評估中具有重要價值[5]。2018 年歐洲泌尿外科學(xué)會、日本腹部放射學(xué)會以及歐洲泌尿影像學(xué)會一起發(fā)表膀胱影像報告和數(shù)據(jù)系統(tǒng)(Vesical imaging-reporting and data system,VI-RADS)[6],使用多參數(shù)MRI 評分系統(tǒng)判斷肌層受侵的概率。但是目前VI-RADS評分中多為定性診斷,幾乎沒有用于預(yù)測肌層浸潤的定量指標(biāo)[7],這使最后的結(jié)果偏于主觀。近些年有研究發(fā)現(xiàn),腫瘤與膀胱壁之間的接觸長度(也稱腫瘤-壁界面)提示存在肌層浸潤的風(fēng)險,可作為腫瘤分期的定量指標(biāo)[8]。目前人工智能和影像組學(xué)正不斷發(fā)展,已廣泛運用在腫瘤領(lǐng)域[9-10],可以從影像圖像中提取大量客觀、定量的組學(xué)特征,用于疾病的診斷、療效的評估及預(yù)后預(yù)測。綜上所述,本研究將基于多參數(shù)MRI 運用影像組學(xué)方法構(gòu)建相關(guān)模型,以實現(xiàn)術(shù)前對膀胱癌是否存在肌層浸潤進行準確預(yù)測。
本研究收集來自杭州市第一人民醫(yī)院2014 年6 月—2021 年7 月符合入組標(biāo)準的膀胱癌患者。本研究方案通過醫(yī)院的倫理委員會批準。
所有病例均行MR T2WI、DWI 及增強掃描,并在MRI 檢查后1 月內(nèi)取得術(shù)后病理結(jié)果,排除檢查前做過臨床治療及圖像偽影較重不符合納入標(biāo)準的病例。本研究共收集膀胱癌患者225例,其中男176例,女49例,年齡32~96歲,平均(69.38±11.74)歲。根據(jù)TNM 分期,以T2a 期(侵犯淺肌層)作肌層浸潤的分界, 1.2.1 MRI 掃描 所有病例掃描采用的均是德國西門子Verio 3.0T MR 掃描儀,掃描之前膀胱需適度充盈。MRI參數(shù)詳見表1。 表1 膀胱MRI 掃描參數(shù) 1.2.2 腫瘤-壁界面 定義為患者仰臥位時膀胱壁與腫瘤之間接觸最大的曲線長度(圖1a),取兩次測量結(jié)果的平均值,分別在3 組圖像中進行測量。 1.2.3 圖像分析 本研究使用聯(lián)影智能科研平臺系統(tǒng)(版本V1.4)進行組學(xué)分析,將病例的影像和臨床數(shù)據(jù)均導(dǎo)入該平臺的膀胱癌數(shù)據(jù)集中,分析的重要環(huán)節(jié)包含圖像分割、特征篩選及機器建模。 圖像分割:分別由1 位主治醫(yī)師和1 位副主任醫(yī)師進行勾畫,在數(shù)據(jù)集界面中進入影像標(biāo)注界面,在T2WI 及DWI、增強圖像上分別手動逐層勾畫腫瘤區(qū)域(MR 增強圖像選用動脈期作為勾畫對象,因固有層的低信號線早期連續(xù)性的中斷提示肌層受侵),即感興趣區(qū)(ROI),最后融合為1 個三維的ROI(圖1b~1d)。由于一部分病例的膀胱中有多個瘤體,為了減少由于多個病變中提取的潛在偏倚,本次選擇體積最大的瘤體進行勾畫。兩位醫(yī)師在勾畫前對病理分型并不知情,對兩者勾畫的ROI 結(jié)果實施組間的一致性分析。 特征篩選及機器建模:在聯(lián)影智能科研平臺的組學(xué)模塊界面上對上述勾畫的ROI 區(qū)域進行組學(xué)特征提取。包括一階特征參數(shù)(灰度直方圖的統(tǒng)計學(xué)特征)和二階特征參數(shù)(紋理特征)兩大類,共118 個特征,并聯(lián)合25 個圖像濾波器(如拉普拉斯銳化、小波等)提取特征,由不同的維度反映病灶的形狀復(fù)雜度,最終從T2WI、DWI 和增強圖像中各提取2 600個特征。同時手動加入8 個其他一般特征(腫瘤-壁界面、臨床特征)。為了避免分組的樣本偏差,按5 倍交叉-驗證方法把膀胱癌病例分成訓(xùn)練集以及測試集,把樣本隨機均分為5組,每組NMIBC 和MIBC病例比例是一致的,每次挑選其中1 組作為測試集,剩余4 組用于訓(xùn)練集作為模型訓(xùn)練,并重復(fù)上述步驟5次,由此生成5 個與訓(xùn)練集和測試集不同的折疊,計算它們結(jié)果的平均值作為模型平均且穩(wěn)健的評估。特征預(yù)處理應(yīng)用z 分數(shù)歸一法,特征篩選應(yīng)用最小絕對收縮與選擇算子(Lasso)的方法。 Nomogram 模型建立和外部驗證:基于Lasso 所選特征的初步分類得到的概率值與有意義的其他一般特征聯(lián)合構(gòu)建Nomogram 模型,分類器選用Logis-tic 回歸算法。 在外部數(shù)據(jù)集中驗證模型的診斷效能,病例來自浙江中醫(yī)藥大學(xué)附屬第一醫(yī)院,共收集病例40例,其中男31例,女9例,年齡37~90歲,平均(73.42±11.77)歲。40 例中,MIBC 18例,NMIBC 22 例。 統(tǒng)計學(xué)分析應(yīng)用SPSS 軟件。多組比較運用非參數(shù)檢驗——Kruskal-Wallis 檢驗。組內(nèi)相關(guān)系數(shù)(ICC)分析用于驗證兩位醫(yī)師勾畫結(jié)果的一致性,ICC≥0.75 提示具有優(yōu)良的組間一致性。受試者工作特征(Receiver operating characteristic,ROC)曲線用于評價模型的診斷效果,同時得出曲線下面積(Area under curve,AUC)、準確度、特異度。通過校準曲線評價分類的準確性。 通過聯(lián)影智能科研平臺對特征進行篩選,在其他一般特征中(腫瘤-壁界面、臨床特征),發(fā)現(xiàn)腫瘤-壁界面對兩組的鑒別有明顯的診斷價值,而兩組間的臨床特征(包括性別、年齡、遺傳、是否吸煙、有無膀胱刺激癥、肉眼或鏡下血尿以及癌胚抗原(CEA))無明顯鑒別診斷價值。 3 組圖像中腫瘤-壁界面測量值比較無統(tǒng)計學(xué)差異(P>0.05),最后選用3 組的平均值。 根據(jù)兩位放射科醫(yī)生的一致性結(jié)果進行分析,在3 組參數(shù)圖像的2 600 個組學(xué)特征中,T2WI 2 490個(95.8%)、DWI 2 349 個(90.3%)、增強掃描2 501個(96.2%)具備優(yōu)良的組間一致性(ICC≥0.75)。本研究最后選擇副主任醫(yī)師的勾畫結(jié)果實施進一步組學(xué)分析。 對T2WI、DWI 及增強圖像中的影像學(xué)特征進行降維篩選,分別得到8 個、6 個和13 個有意義的特征,后基于多參數(shù)聯(lián)合篩選出6 個有意義的特征(表2),根據(jù)Lasso 所選特征初步分類得到各自的概率值。在各參數(shù)的訓(xùn)練集及測試集中,兩組間的概率值均存在統(tǒng)計學(xué)差異(P<0.05)。 表2 多參數(shù)聯(lián)合篩選的組學(xué)特征 基于概率值構(gòu)建模型,比較3 組單參數(shù)模型和多參數(shù)聯(lián)合模型的診斷性能(圖2),結(jié)果顯示除了多參數(shù)模型和T2WI 單參數(shù)模型沒有統(tǒng)計學(xué)差異,其余兩兩組間比較均有差異,并且在AUC 數(shù)值上多參數(shù)模型具有最好的診斷結(jié)果(表3)。 表3 各模型的AUC值 上述結(jié)果顯示Nomogram 模型和單獨的組學(xué)模型、其他一般特征模型相比,具有更優(yōu)越的診斷性能(圖3a)。在訓(xùn)練集和測試集中,Nomogram 模型的AUC 分別為0.892、0.875,靈敏度分別為0.765、0.75,特異度分別為0.844、0.824。構(gòu)建基于Probability 和腫瘤-壁界面多指標(biāo)聯(lián)合診斷的Nomogram列線圖,將復(fù)雜方程可視化(圖3b)。模型的校準曲線提示肌層浸潤的預(yù)測結(jié)果(圖3c)。 運用外部數(shù)據(jù)驗證Nomogram 模型的診斷性能。模型的ROC 曲線及可視化混淆矩陣證明模型具有較好的分類預(yù)測性能(圖4),其AUC 值為0.846,靈敏度為0.722,特異度為0.818。 本研究中,我們運用ROC 曲線比較單參數(shù)和多參數(shù)模型的診斷性能,發(fā)現(xiàn)后者具有最好的診斷結(jié)果,因此,實驗選用多參數(shù)聯(lián)合的概率值,與有意義的其他一般特征(腫瘤-壁界面)聯(lián)合構(gòu)建Nomogram模型,該模型較單獨的組學(xué)模型和其他一般特征模型具有更好的診斷性能,在訓(xùn)練集、內(nèi)部驗證集和外部驗證集中均表現(xiàn)優(yōu)異。從多參數(shù)聯(lián)合中篩選出6個有意義的組學(xué)特征,分屬于4 大類參數(shù),F(xiàn)irstorder參數(shù)中的Skewness 特征表示偏度,描述平均灰度值的不對稱性分布,正負均可,Uniformity 描述圖像矩陣的均勻性;Glszm 參數(shù)表示量化圖像中的灰度區(qū)域,其中的Zone Entropy 特征代表測量區(qū)域大小、灰度級的分布不確定性,值越大意味著紋理的異質(zhì)性越大;Glrlm 參數(shù)表示測量具有一致灰度值的連續(xù)像素長度分布;Gldm 參數(shù)量化圖像中相同灰度值的散布比例[11]。Firstorder 為一階特征參數(shù),后3 類為二階或高階特征參數(shù),描述了腫瘤圖像紋理的粗糙、復(fù)雜程度,提取人眼無法獲取的信息,定量描述病變區(qū)域的宏觀特性及微觀異質(zhì)性[12],提示肌層的浸潤情況。 在特征篩選中除了組學(xué)特征外,還發(fā)現(xiàn)其他一般特征中的腫瘤-壁界面也是膀胱癌肌層浸潤有用的預(yù)測因素。歐洲泌尿外科協(xié)會建議將腫瘤大小3 cm作為NMIBC 危險進展的閾值[13],而腫瘤大小與其形態(tài)相關(guān)。但本研究中,并沒有篩選出與形態(tài)學(xué)有關(guān)的組學(xué)特征,我們認為這與腫瘤-壁界面也代表一種形態(tài)學(xué)參數(shù)有關(guān),其表現(xiàn)出的信息更能代表腫瘤的真實狀態(tài),而組學(xué)中形態(tài)學(xué)特征沒有表現(xiàn)出與腫瘤-壁界面相當(dāng)?shù)脑\斷性能。因此,在共同篩選中被淘汰。同時,腫瘤-壁界面這個定量指標(biāo)已用于其他腫瘤的分期診斷,如肺癌[14]、前列腺癌[15]等,但膀胱癌和他們的發(fā)生機制有所不同,膀胱癌本就生長在膀胱壁上,而上述癌癥僅在進展后才接觸到胸膜等類似結(jié)構(gòu)。本研究結(jié)果支持這種關(guān)聯(lián)也適用于膀胱癌,Ahn等[8]的結(jié)果也驗證了這一點。 研究結(jié)果發(fā)現(xiàn)在AUC 值上多參數(shù)模型具有最優(yōu)的預(yù)測性能,這與既往的研究結(jié)果一致[16],但在統(tǒng)計學(xué)上與T2WI 單參數(shù)模型沒有顯著差異,我們認為這與樣本量不足有關(guān),更多的訓(xùn)練數(shù)據(jù)會使模型精度大大提高[17]。根據(jù)上述結(jié)果,我們選用多參數(shù)聯(lián)合的概率值與腫瘤-壁界面聯(lián)合構(gòu)建Nomogram 模型,發(fā)現(xiàn)較單獨的組學(xué)模型和其他特征模型具有更好的診斷性能。Zheng等[16]研究結(jié)果顯示影像組學(xué)與有診斷意義的臨床特征結(jié)合可以改善膀胱癌肌層浸潤預(yù)測模型的準確性,進一步支持了我們的研究結(jié)果。 本研究仍存在不足之處:①本研究是回顧性的實驗,數(shù)據(jù)集相對較小,并且存在選擇的偏倚,后續(xù)可以進行前瞻性研究,進一步收集病例來驗證結(jié)論;②腫瘤-壁界面的測量可能會受腫瘤的位置及重力的影響,后續(xù)可以通過多體位掃描獲得更多圖像,進行進一步分析;③在未來的研究中希望通過不同廠家的MR 設(shè)備或者不同磁場強度的MR 掃描,可以進一步驗證模型結(jié)果。 綜上所述,影像組學(xué)是預(yù)測膀胱癌肌層浸潤的有用工具,基于多參數(shù)MRI 和腫瘤-壁界面構(gòu)建的Nomogram 模型具有較好的診斷性能及可重復(fù)性,可以協(xié)助臨床醫(yī)生做出有效評估。1.2 方法
1.3 統(tǒng)計學(xué)方法
2 結(jié)果
2.1 一般資料
2.2 腫瘤-壁界面
2.3 一致性分析
2.4 組學(xué)特征篩選及模型建立
2.5 外部數(shù)據(jù)集驗證
3 討論