陳 杭,范 明,厲力華
(杭州電子科技大學(xué)生物醫(yī)學(xué)工程與儀器研究所,浙江 杭州 310018)
在全球女性癌癥患者中,乳腺癌所占的比例最高,不僅發(fā)病率和死亡率最高,對(duì)應(yīng)的患者群也逐漸趨于年輕化[1-3]。隨著新輔助化療技術(shù)在臨床治療中的廣泛應(yīng)用,這種技術(shù)已成為乳腺癌綜合治療的重要組成部分。新輔助化療后反應(yīng)良好的患者,生存率明顯提高[4]。但是,新輔助化療技術(shù)依然存在一些問題,比如部分乳腺癌患者在進(jìn)行新輔助化療后取得的化療效果并不理想[5],為減少這部分化療無效患者的痛苦,對(duì)療效進(jìn)行早期預(yù)測(cè)十分重要。乳腺癌新輔助化療療效評(píng)價(jià)主要有臨床評(píng)價(jià)和病理組織學(xué)評(píng)價(jià)。其中臨床評(píng)價(jià)主要通過臨床觸診和影像學(xué)測(cè)量等方式進(jìn)行,受施診醫(yī)師臨床經(jīng)驗(yàn)和個(gè)人主觀因素影響較大,評(píng)價(jià)結(jié)果不夠客觀。相比之下,病理組織學(xué)評(píng)價(jià)被稱為化療后腫瘤反應(yīng)的金標(biāo)準(zhǔn),在療效評(píng)價(jià)上的診斷結(jié)果更為準(zhǔn)確[6]。臨床中,病理組織學(xué)評(píng)價(jià)主要使用Miller & Payne (MP)分級(jí)系統(tǒng),MP分級(jí)將化療后反應(yīng)分為5級(jí)[7]。為了準(zhǔn)確評(píng)價(jià)新輔助化療的療效,本文研究中使用了病理組織學(xué)評(píng)價(jià)。
磁共振成像(Magnetic Resonance Imaging, MRI)技術(shù)對(duì)乳腺癌的診斷具有較高的靈敏度和特異性,無放射性損傷,提供的信息豐富,在乳腺癌診療中發(fā)揮著重要作用[8-9]。MRI具有多種參數(shù)成像方式,其中動(dòng)態(tài)增強(qiáng)磁共振成像(Dynamic Contrast Enhancement MRI, DCE-MRI)不僅可以獲得病變的形態(tài)學(xué)特征信息,還可以反映病變組織的生理性變化情況[10]。在乳腺癌診療中,僅依賴施診醫(yī)師的臨床經(jīng)驗(yàn)對(duì)影像進(jìn)行分析,不能對(duì)乳腺癌的病理信息進(jìn)行精準(zhǔn)判斷[11]。隨著大數(shù)據(jù)技術(shù)與醫(yī)學(xué)影像輔助診斷的有機(jī)融合,誕生了新的影像組學(xué)方法,通過從影像中提取各類特征,有效解決了腫瘤異質(zhì)性難以定量評(píng)估的問題。將影像組學(xué)用于輔助臨床診斷和治療決策,可以有效提高治療的準(zhǔn)確性[12-13]。
因新輔助化療過程持續(xù)數(shù)月,需進(jìn)行6~8個(gè)療程,所以對(duì)療效進(jìn)行早期預(yù)測(cè)十分必要。目前已有研究使用影像組學(xué)方法證明乳腺DCE-MRI影像可用于新輔助化療療效的預(yù)測(cè)[14-15],但暫無研究嘗試將化療前和化療早期(化療進(jìn)行2個(gè)療程后)影像進(jìn)行對(duì)比研究。本文對(duì)化療前和化療早期DCE-MRI影像分別進(jìn)行療效預(yù)測(cè)研究,并對(duì)兩者的預(yù)測(cè)結(jié)果進(jìn)行綜合評(píng)估比較。研究中,為避免不同化療方案對(duì)結(jié)果產(chǎn)生影響,選擇行PCH新輔助化療方案(紫杉醇+卡鉑+赫賽汀)對(duì)乳腺癌病例進(jìn)行研究。
本研究所使用病例來自復(fù)旦腫瘤醫(yī)院,共計(jì)61例,均為女性,年齡范圍為27~66歲,平均年齡約為49歲。采集對(duì)象為BI-RADS 3級(jí)及3級(jí)以上行PCH新輔助化療方案的乳腺癌病例,在進(jìn)行首次MRI檢查之前,均未進(jìn)行任何乳腺相關(guān)的化療和手術(shù),且新輔助化療治療過程和數(shù)次磁共振檢查都在復(fù)旦腫瘤醫(yī)院進(jìn)行。研究過程中將化療療效MP分級(jí)為1級(jí)、2級(jí)、3級(jí)的病例劃分為化療無反應(yīng)(Non-response),MP分級(jí)為4級(jí)、5級(jí)的病例劃分為化療有反應(yīng)(Response),劃分后數(shù)據(jù)集中共有40例化療無反應(yīng),21例化療有反應(yīng)。探究病例基本信息與化療療效的關(guān)聯(lián),對(duì)絕經(jīng)情況和家族史情況使用卡方檢驗(yàn),得到P值分別為0.963 6和0.005 7,表明絕經(jīng)情況與化療療效的關(guān)聯(lián)并不顯著,但家族史情況與療效具有顯著關(guān)聯(lián);對(duì)年齡使用方差分析方法獲得P值為0.340 5,說明年齡和化療療效之間的關(guān)聯(lián)也不顯著。病例基本信息的統(tǒng)計(jì)和分布如表1所示。
表1 病例信息統(tǒng)計(jì)
本研究影像數(shù)據(jù)采自復(fù)旦腫瘤醫(yī)院放射科,所使用的設(shè)備均為德國(guó)西門子公司3.0T超導(dǎo)型磁共振掃描設(shè)備。動(dòng)態(tài)增強(qiáng)掃描的參數(shù)設(shè)置如下:重復(fù)時(shí)間(Time of Repetition, TR)為4.5 ms,回波時(shí)間(Time of Echo, TE)為1.56 ms,翻轉(zhuǎn)角度(Flip Angle, FA)為10°,視野(Field of View, FOV)為360 mm×360 mm,采集矩陣(Acquisition Matrix, AM)為384×384,層厚(Slice Thickness, ST)為2.2 mm,空間分辨率為0.937 5 mm。在注射造影劑后約90 s開始拍攝增強(qiáng)序列,增強(qiáng)序列間隔約43 s,采集的增強(qiáng)前序列和增強(qiáng)后序列影像參數(shù)相同,每個(gè)序列均包含80張影像。
從乳腺癌病例的多次MRI影像中取出距離新輔助化療開始前最近的DCE-MRI影像作為化療前影像;取出化療2周期后的影像,作為化療早期影像。對(duì)于2次DCE-MRI影像,先采用參數(shù)自適應(yīng)的空間模糊C均值算法對(duì)病灶進(jìn)行粗分割,再使用馬爾科夫隨機(jī)場(chǎng)方法對(duì)病灶進(jìn)行細(xì)分割[16],分割示例見圖1,分割完后得到2次影像的三維病灶區(qū)域。病灶區(qū)域特征提取過程主要基于開源的Pyradiomics[17]。對(duì)化療前、化療早期的2次DCE-MRI三維病灶區(qū)域進(jìn)行影像學(xué)特征提取時(shí)使用了蒙片序列(增強(qiáng)前序列)和增強(qiáng)序列,每一序列都能提取得到102維特征:其中形態(tài)特征(Shape)有14維;一階統(tǒng)計(jì)特征有18維;灰度共生矩陣24維;灰度游程長(zhǎng)度矩陣16維;灰度大小區(qū)域矩陣16維;灰度依賴矩陣14維。
圖1 同一患者在化療前和化療早期影像上的腫瘤邊界分割示例
在對(duì)化療前、化療早期DCE-MRI影像特征分別進(jìn)行新輔助化療療效預(yù)測(cè)分析時(shí),先對(duì)2次影像提取得到的每一維特征進(jìn)行單變量預(yù)測(cè)分析;再充分利用特征之間的互補(bǔ)信息,對(duì)2次影像的形態(tài)特征、統(tǒng)計(jì)特征、紋理特征以及全部特征進(jìn)行多變量預(yù)測(cè)分析。
1.4.1 模型訓(xùn)練與評(píng)估
單變量和多變量預(yù)測(cè)分析都在留一法交叉驗(yàn)證(Leave-One-Out Cross-Validation,LOOCV)方法下使用支持向量機(jī)(Support Vector Machines,SVM)模型進(jìn)行訓(xùn)練,即在樣本量為k的數(shù)據(jù)集中,抽取1個(gè)樣本作為測(cè)試集,剩下的k-1個(gè)樣本作為訓(xùn)練集;使用訓(xùn)練集構(gòu)建基于SVM的預(yù)測(cè)模型,再將測(cè)試集輸入訓(xùn)練好的預(yù)測(cè)模型中獲得預(yù)測(cè)結(jié)果的概率值;進(jìn)行k次循環(huán),循環(huán)結(jié)束后即可獲得k個(gè)預(yù)測(cè)結(jié)果的概率值[18]。訓(xùn)練過程中,SVM模型的最優(yōu)參數(shù)由優(yōu)化后的網(wǎng)格搜索法(Grid Search Method,GSM)確定,網(wǎng)格搜索法是基于一定的空間范圍按照給定的步長(zhǎng)搜索所有的參數(shù)組合,而優(yōu)化后的網(wǎng)格搜索法是先使用大步長(zhǎng)粗略搜索可能的參數(shù)組合,再使用小步長(zhǎng)精確搜索,采用十折交叉驗(yàn)證方法對(duì)數(shù)據(jù)集進(jìn)行測(cè)試,最終確定最優(yōu)的SVM參數(shù)。
對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行評(píng)估時(shí),依據(jù)病例新輔助化療療效的實(shí)際標(biāo)簽值,繪制預(yù)測(cè)結(jié)果的受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC),計(jì)算ROC曲線下對(duì)應(yīng)的面積值(Area Under the ROC,AUC)。然后使用統(tǒng)計(jì)學(xué)方法進(jìn)一步評(píng)估:通過約登指數(shù)(Youden Index, YI)選擇ROC曲線的最佳閾值,得到對(duì)應(yīng)混淆矩陣后,計(jì)算敏感性(sensitivity)、特異性(specificity)和F1分?jǐn)?shù)(F1-score);通過Bootstrap自舉法,計(jì)算最優(yōu)特征子集AUC值的95%置信區(qū)間。
1.4.2 單變量預(yù)測(cè)分析
對(duì)化療前、化療早期DCE-MRI影像提取得到的每一維特征進(jìn)行單變量預(yù)測(cè)分析,通過計(jì)算預(yù)測(cè)結(jié)果的AUC值,對(duì)各個(gè)特征預(yù)測(cè)化療療效的性能進(jìn)行比較。同時(shí),使用統(tǒng)計(jì)學(xué)方法探究每一維影像特征與化療療效之間的關(guān)聯(lián),當(dāng)t檢驗(yàn)得到的P<0.05時(shí),認(rèn)為該特征與化療療效具有顯著的關(guān)聯(lián);而P值越小,則認(rèn)為關(guān)聯(lián)越顯著。
1.4.3 多變量預(yù)測(cè)分析
在多變量預(yù)測(cè)分析之前,為減少影像特征之間的冗余情況,對(duì)化療前、化療早期的2次影像特征集使用皮爾遜相關(guān)系數(shù)法進(jìn)行特征初步篩選,即計(jì)算兩兩特征之間的Pearson相關(guān)系數(shù),以相關(guān)系數(shù)為指標(biāo),剔除相關(guān)系數(shù)大于0.9的冗余特征集,具體過程如下:計(jì)算兩兩特征間相關(guān)系數(shù),當(dāng)有2個(gè)特征之間的相關(guān)系數(shù)大于0.9時(shí),分別計(jì)算這2個(gè)特征與其他全部特征的相關(guān)系數(shù)并求和,然后挑選總和較大的特征進(jìn)行剔除。進(jìn)行特征初步篩選后,對(duì)2次影像的形態(tài)特征、統(tǒng)計(jì)特征、紋理特征以及全部特征分別進(jìn)行多變量預(yù)測(cè)分析。
進(jìn)行多變量預(yù)測(cè)分析時(shí),先對(duì)特征進(jìn)行排序,根據(jù)排序結(jié)果,構(gòu)建不同的多維特征組合;然后對(duì)不同特征組合分別建立多變量預(yù)測(cè)模型;比較各個(gè)模型預(yù)測(cè)結(jié)果的AUC值從而獲得最優(yōu)特征子集;最后使用統(tǒng)計(jì)學(xué)方法對(duì)最優(yōu)特征子集建立的預(yù)測(cè)模型進(jìn)行綜合評(píng)估。在實(shí)際訓(xùn)練中,采用支持向量機(jī)遞歸特征消除算法(SVM-Recursive Feature Elimination,SVM-RFE),按照重要性對(duì)特征進(jìn)行排序;隨后根據(jù)排序結(jié)果,構(gòu)建不同的多特征組合;比較不同多特征組合的訓(xùn)練結(jié)果,得到最優(yōu)特征子集,再對(duì)最優(yōu)特征子集預(yù)測(cè)模型進(jìn)一步評(píng)估。
在對(duì)化療前、化療早期DCE-MRI提取得到的影像特征分別進(jìn)行單變量預(yù)測(cè)分析時(shí),化療前影像最優(yōu)的單特征分別為形態(tài)特征中的腫瘤體積(Voxel Volume)特征和紋理特征中的大小區(qū)域不均勻標(biāo)準(zhǔn)化(Size Zone Non Uniformity Normalized)特征,2個(gè)特征預(yù)測(cè)結(jié)果的AUC值分別為0.749和0.743;而化療早期影像最優(yōu)的單特征分別為紋理特征中的大面積高灰度級(jí)增強(qiáng)(Large Area High Gray Level Emphasis)特征和形態(tài)特征中的最小軸長(zhǎng)(Least Axis Length)特征,預(yù)測(cè)結(jié)果的AUC值分別為0.779和0.757。
注:不標(biāo)示表示P>0.05,“*”表示P<0.05,“**”表示P<0.01,“***”表示P<0.001。圖2 化療前后影像特征對(duì)比盒形圖
分別繪制紋理特征中大面積高灰度級(jí)增強(qiáng)特征的盒形圖以及形態(tài)特征中最小軸長(zhǎng)特征的盒形圖,如圖2所示。
由圖2(a)可知,在化療前影像中,紋理特征大面積高灰度級(jí)增強(qiáng)特征的值在化療無反應(yīng)和有反應(yīng)兩組中的分布差異并不明顯;但在化療早期影像中,在化療有反應(yīng)的患者中的值明顯小于化療無反應(yīng)患者中的值。使用t檢驗(yàn)方法研究該特征與化療療效的關(guān)聯(lián),在化療前影像中得到P=0.394,關(guān)聯(lián)不顯著;而在化療早期影像中P<0.001,具有顯著關(guān)聯(lián)。同理,由圖2(b)可知,在化療早期影像中,形態(tài)特征最小軸長(zhǎng)特征在化療有反應(yīng)患者中的值小于無反應(yīng)患者中的值,其t檢驗(yàn)P=0.002;但在化療前影像中該特征分布差異并不顯著(P=0.210)。
從最優(yōu)單特征預(yù)測(cè)結(jié)果比較可知,化療早期影像在單變量預(yù)測(cè)中的性能要優(yōu)于化療前影像;在使用統(tǒng)計(jì)學(xué)方法研究每一維特征與化療療效的關(guān)聯(lián)時(shí),化療早期影像有多個(gè)特征的t檢驗(yàn)P值小于0.05,與化療前影像相比,與化療療效的關(guān)聯(lián)更為顯著。此外,化療早期影像紋理特征中的大面積高灰度級(jí)增強(qiáng)特征不僅與化療療效具有顯著關(guān)聯(lián),而且在單特征預(yù)測(cè)分析中也獲得了最優(yōu)的預(yù)測(cè)結(jié)果。
對(duì)化療前影像、化療早期影像各類特征分別進(jìn)行多變量預(yù)測(cè)分析,計(jì)算各個(gè)預(yù)測(cè)模型的AUC值、95%置信區(qū)間、敏感性、特異性以及F1值,結(jié)果如表2所示?;熐癉CE-MRI影像全部特征的多變量預(yù)測(cè)結(jié)果AUC值為0.779,對(duì)應(yīng)的95%置信區(qū)間為0.650~0.908,其敏感性、特異性、F1值分別為0.714,0.825,0.698。相比于化療前影像,化療早期影像在對(duì)全部特征進(jìn)行多變量預(yù)測(cè)分析時(shí)取得了更好的預(yù)測(cè)結(jié)果,除了在特異性上與化療前影像相同,在AUC值、敏感性以及F1值上都優(yōu)于化療前影像?;熢缙谟跋袢刻卣鞫嘧兞款A(yù)測(cè)結(jié)果AUC值為0.881,對(duì)應(yīng)的95%置信區(qū)間為0.793~0.969,其敏感性、特異性、F1值分別為0.905,0.825,0.809。由表2可見,從全部特征中挑選出最優(yōu)特征子集,其預(yù)測(cè)結(jié)果的AUC值都要優(yōu)于從形態(tài)特征、統(tǒng)計(jì)特征和紋理特征各自挑選出的最優(yōu)特征子集;推測(cè)是因?yàn)樾螒B(tài)、統(tǒng)計(jì)和紋理特征與化療療效都存在一定關(guān)聯(lián),這3類特征存在互補(bǔ)信息,融合后的模型在新輔助化療療效預(yù)測(cè)中具有更好的準(zhǔn)確性。
表2 化療前后影像多變量預(yù)測(cè)結(jié)果
化療前影像、化療早期影像特征多變量預(yù)測(cè)結(jié)果AUC值(95%置信區(qū)間)的比較結(jié)果如圖3所示。從圖3可以看出,無論是化療前影像還是化療早期影像,統(tǒng)計(jì)特征的多變量預(yù)測(cè)結(jié)果AUC值都高于紋理特征和形態(tài)特征,而形態(tài)特征的AUC值最低。此外,與化療前影像相比,在預(yù)測(cè)新輔助化療療效時(shí),化療早期影像不僅在全部特征的多變量預(yù)測(cè)結(jié)果中,而且在形態(tài)特征、統(tǒng)計(jì)特征和紋理特征各自的多變量預(yù)測(cè)結(jié)果中,均較有更好的預(yù)測(cè)性能。
圖3 化療前后影像各類特征預(yù)測(cè)結(jié)果 AUC(95%置信區(qū)間)
分別繪制形態(tài)特征、統(tǒng)計(jì)特征、紋理特征以及全部特征的ROC曲線對(duì)比如圖4所示。在4張對(duì)比圖中,化療早期影像ROC曲線都較化療前影像更偏向于坐標(biāo)左上方,說明基于化療早期影像訓(xùn)練得到的預(yù)測(cè)模型,在預(yù)測(cè)新輔助化療療效時(shí)具有更好的分類性能。
圖4 化療前后影像各類特征ROC曲線
關(guān)于乳腺癌新輔助化療療效預(yù)測(cè)的相關(guān)研究已取得一定進(jìn)展,通過影像組學(xué)分析方法對(duì)化療療效進(jìn)行預(yù)測(cè)研究表明,乳腺DCE-MRI影像與新輔助化療療效具有一定關(guān)聯(lián)[19-22],但憑借化療前影像對(duì)療效進(jìn)行預(yù)測(cè),在本文數(shù)據(jù)集中無法取得理想的預(yù)測(cè)結(jié)果。本文分別對(duì)行PCH新輔助化療方案的乳腺癌患者化療前、化療早期DCE-MRI影像展開療效預(yù)測(cè)研究。研究結(jié)果表明,化療前、化療早期影像均與療效存在一定關(guān)聯(lián),但化療早期影像關(guān)聯(lián)更為顯著,在進(jìn)行療效預(yù)測(cè)時(shí)可獲得更為準(zhǔn)確的預(yù)測(cè)結(jié)果。但是,本文的研究存在一定的局限性,首先,乳腺DCE-MRI影像的病灶區(qū)域主要依賴放射科醫(yī)生對(duì)腫瘤區(qū)域進(jìn)行手動(dòng)標(biāo)注,使得病灶區(qū)域分割結(jié)果存在主觀差異性;其次,研究過程中樣本量規(guī)模較小,預(yù)測(cè)模型的魯棒性需要有更多的數(shù)據(jù)進(jìn)行驗(yàn)證。在后續(xù)研究中,計(jì)劃將化療前、化療早期影像特征進(jìn)行聯(lián)合,利用互補(bǔ)信息進(jìn)一步提升新輔助化療療效預(yù)測(cè)準(zhǔn)確性。