張少茹,周云舒,張若弟,劉世莉,陳曉華,王卓,陳志強
原發(fā)性中樞神經(jīng)系統(tǒng)淋巴瘤(primary central nervous system lymphoma, PCNSL)是一種罕見的淋巴結外非霍奇金淋巴瘤,局限在中樞神經(jīng)系統(tǒng),其與腦膠質瘤都具有惡性程度高、預后差的特點[1]。非典型PCNSL 常常伴有壞死、囊變等,無壞死或很少壞死的非典型腦膠質瘤也可能模仿典型PCNSL,盡管它們在影像學表現(xiàn)上有一些可區(qū)分的特征,但這些特征是主觀的,依賴于放射科醫(yī)生的專業(yè)知識和經(jīng)驗[2-4]。目前,疑似PCNSL的標準診斷方法包括立體定向活檢和組織病理學分析,然而,這種方法是侵入性的[5],此外PCNSL 的治療與其他原發(fā)性中樞神經(jīng)系統(tǒng)腫瘤有很大的不同,對于新診斷的PCNSL患者采用甲氨蝶呤的大劑量聯(lián)合治療并在誘導治療時采用包含利妥昔單抗的方案是目前我國專家的治療共識[6],而腦膠質瘤的主要治療方案則是大體全切除后進行放、化療[7-8],因此早期且準確無創(chuàng)的診斷可以避免不必要的手術。影像組學作為新型的研究領域使醫(yī)學成像從一種簡單的診斷工具轉變?yōu)榫薮蟮呐R床數(shù)據(jù)的來源,影像組學在腫瘤診斷、分級、預后和預測基因分型等方面提供了重要幫助[9-13],且這種方法是非侵入性的,可以獲得腫瘤中潛在的信息[14-16]。一些功能MRI 技術能為腫瘤的鑒別診斷提供信息,但由于測量方法缺乏標準化,可能存在個體間的差異性,且這些先進序列會延長掃描時間、增加額外的費用,相比之下影像組學特征是定量的數(shù)值特征且常規(guī)序列的應用范圍更廣泛[17],不同MRI 序列以及腫瘤分割區(qū)域的選擇對影像組學模型性能的影響仍然值得探究[18]。本研究旨在探討多參數(shù)MR影像組學模型能否在術前無創(chuàng)性地鑒別PCNSL 和高級別膠質瘤,確定不同MRI序列模型是否具有同等或更優(yōu)的預測性能以及不同腫瘤ROI的勾畫對預測模型性能的影響。
回顧性分析2016 年1 月至2022 年7 月期間于寧夏醫(yī)科大學總醫(yī)院接受手術或立體定向活檢的高級別膠質瘤和PCNSL 患者病例。納入標準:(1)年齡≥18 歲;(2)接受手術切除或活檢后病理證實為PCNSL或高級別膠質瘤;(3)所有PCNSL 均為彌漫性大B 細胞型,所有患者均具有免疫能力;(4)術前進行常規(guī)MRI 掃描。排除標準:(1)有其他腦腫瘤或外傷病史;(2)疑似或確診的周圍性淋巴瘤;(3)術前接受糖皮質激素、放療或化療的患者;(4)非強化病灶及腫瘤直徑<1 cm 的患者。本研究遵守《赫爾辛基宣言》,經(jīng)寧夏醫(yī)科大學總醫(yī)院倫理委員會批準(批準文號:KYLL-2022-0591),免除受試者知情同意。
使用GE SIGNA EXCITE 3.0 T MR掃描儀和8通道頭部相控陣線圈進行圖像采集。T1WI 掃描參數(shù):TR/TE 2076 ms/27 ms;T2WI 掃描參數(shù):TR/TE 4600 ms/107 ms;T2 液體衰減反轉恢復(fluid-attenuated inversion-recovery, FLAIR)掃 描 參 數(shù):TR/TE 7800 ms/140 ms;對比增強(contrast enhancement,CE)T1WI 掃描參數(shù):TR/TE 2300 ms/13 ms;以上序列FOV 均為240 mm×240 mm, 層厚、層間距均為6.0 mm、1.0 mm。對比劑使用釓噴酸葡胺,劑量為0.1 mmol/kg,注射流速2.0 mL/s。
腫瘤的分割是由一名具有3 年放射學經(jīng)驗的醫(yī)學研究者使用3D-Slicer(http://www.Slicer.org, version 5.0.3)軟 件 在 軸 位CE-T1WI、T2 FLAIR 圖像進行逐層手動勾畫,并由另一位經(jīng)驗豐富的神經(jīng)放射學家進行驗證。ROI1 包括腫瘤核心(壞死、囊變和增強區(qū)域)排除瘤周水腫,ROI2 包括腫瘤核心及瘤周水腫區(qū),于軸位CE-T1WI 圖像進行ROI1 的勾畫,T2 FLAIR 圖像分別進行兩種ROI 的勾畫,ROI1 的勾畫暫且稱為T2 FLAIR1,ROI2 的勾畫稱為T2 FLAIR2,對于多發(fā)病變選取較大病灶進行ROI勾畫(圖1)。預處理對于提取穩(wěn)定的特征和獲得可重復性的結果至關重要,本研究將所有體素重新采樣到1 mm×1 mm×1 mm,隨后使用灰度離散化處理(bin寬度為25),將連續(xù)圖像轉換為離散的整數(shù)值來減少掃描方案等的影響。
圖1 使用3D-Slicer軟件手動逐層勾畫ROI。1A 為T2 FLAIR 上勾畫腫瘤核心的ROI,1B 為T2 FLAIR 上勾畫腫瘤核心及瘤周水腫的ROI,1C 為CE-T1WI上勾畫腫瘤核心的ROI。Fig.1 Using the 3D-slicer to manually delineate ROI layer by layer.1A is ROI which delineated the core of the tumor on the T2 FLAIR, 1B is ROI which delineated the core of the tumor and peritumoral edema on the T2 FLAIR, 1C is ROI which delineated the core of the tumor on the CE-T1WI.
淋巴瘤是一種相對少見但高度惡性的腫瘤,本研究納入病例中淋巴瘤較少,造成了數(shù)據(jù)的不平衡,對于大多數(shù)基于機器學習的分類模型,這種不平衡可能導致預測精度較低,本研究采用合成少數(shù)類過采樣技術[19]來解決此類問題。
使 用Python 軟 件(http://www.python.org,version 3.7)中的“PyRadiomics”包進行特征的提取,分別從CE-T1WI及T2 FLAIR序列各提取1037個特征,特征類型及數(shù)量如下:14個形態(tài)學特征;18個一階統(tǒng)計特征;75個紋理特征,5種特征類型分別為灰度共現(xiàn)矩陣(gray-level co-occurrence matrix, GLCM)、灰度運行長度矩陣(gray-level run length matrix, GLRLM)、灰度尺寸區(qū)域矩陣(gray-level size zone matrix,GLSZM)、灰 度 依 賴 矩 陣(gray level dependence matrix, GLDM)和鄰域灰度差分矩陣(neighborhood gray-tone difference matrix, NGTDM),內置濾波器小波、平方、指數(shù)都在五個特征類別上啟用。
由于與樣本量相比我們提取了大量的特征集,集中高度相關的特征以避免共線性是非常重要的,本研究的特征選擇過程如下:(1)使用單變量選擇法初始篩選出差異有統(tǒng)計學意義(P<0.05)的特征;(2)采用皮爾遜相關性分析剔除|r|≥0.4 的特征;(3)采用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator, LASSO)正則化去除共線特征;(4)采用多元逐步回歸保留最小Akaike 信息準則(Akaike Information Criterion,AIC)的特征集,通過對選定特征按其各自的系數(shù)加權后進行線性組合來計算每個患者的影像組學評分。在進行特征分析前,所有的特征都經(jīng)過Z-分數(shù)(Z-score)標準化:Z=x-μ/σ,其中μ為平均值,σ為體素值的標準差。
采用邏輯回歸(logistic regression, LR)方法構建分類模型,分別構建基于CE-T1WI、T2 FLAIR1和T2 FLAIR2 及CE-T1WI+T2 FLAIR1 共4 個影像組學模型,通過計算準確率、敏感度、特異度和ROC曲線下面積(area under the curve, AUC)來評估分類器的預測性能。
所有的統(tǒng)計分析均使用R 軟件(http://www.r-project.org, version 4.1.2),采用Mann-WhitneyU檢驗、卡方檢驗或Fisher精確檢驗對高級別膠質瘤與PCNSL、訓練集與驗證集的臨床及影像學特征之間的差異性進行統(tǒng)計學分析,P<0.05 認為差異有統(tǒng)計學意義。
本研究共納入99 例高級別膠質瘤和PCNSL 病例,分為訓練集(n=69)和驗證集(n=30),其中高級別膠質瘤73例,PCNSL 26例,腫瘤是否累及皮質在高級別膠質瘤和PCNSL 之間的差異具有統(tǒng)計學意義(P<0.05),與PCNSL相比,膠質瘤更易累及皮質(表1);在訓練組與驗證組之間,除了腫瘤的位置在兩者之間存在略微的差異外,其他臨床及影像學特征之間無顯著性差異(P>0.05)。
表1 高級別膠質瘤及原發(fā)性中樞神經(jīng)系統(tǒng)淋巴瘤臨床及影像學特征之間的比較Tab.1 Comparison of clinical and imaging features between high-grade glioma and primary central nervous system lymphoma
采用10 折交叉驗證的LASSO 算法保留非零系數(shù)的影像組學特征,其中CE-T1WI、T2 FLAIR1、T2 FLAIR2 及CE-T1WI+T2 FLAIR1 序列分別保留12、11、6、15個組學特征(表2)。
表2 構建聯(lián)合模型的關鍵影像組學特征及其特征系數(shù)Tab.2 The key radiomics features and their corresponding coefficients from the combined radiomics model
各模型的ROC曲線如圖2所示,單序列模型中,基于CE-T1WI 構建預測模型效能優(yōu)于T2 FLAIR1 和T2 FLAIR2 模型,其在訓練集及驗證集的AUC 值分別為0.952 vs.0.915 vs.0.852 和0.949 vs.0.898 vs.0.841,準確率分別為92% vs.86% vs.80%和90%vs.77% vs.67%;本研究所構建的4個影像組學模型中,基于CE-T1WI+T2 FLAIR1構建的聯(lián)合模型預測性能優(yōu)于各單序列模型,其在訓練集及驗證集的AUC值分別為0.978和0.983,準確率分別為94%和93%(表3)。
表3 各序列影像組學模型鑒別高級別膠質瘤與原發(fā)中樞神經(jīng)系統(tǒng)淋巴瘤的性能評價表Tab.3 The performance of radiomics models in differentiating primary central nervous system lymphoma from high-grade glioma
圖2 各序列影像組學模型在訓練集及驗證集的受試者工作特征曲線,2A為訓練集,2B為驗證集。Fig.2 The receiver operating characteristic curves of the each radiomics model in the training and testing set.2A is training set, and 2B is testing set.
本研究基于CE-T1WI、T2 FLAIR1、T2 FLAIR2 及CE-T1WI+T2 FLAIR1 序列構建LR 模型用于術前無創(chuàng)性區(qū)分高級別膠質瘤和PCNSL,結果表明多參數(shù)MRI影像組學模型能在術前無創(chuàng)性鑒別高級別膠質瘤及PCNSL,不同序列預測性能不同,各單序列模型中,CE-T1WI模型預測性能優(yōu)于T2 FLAIR模型;基于腫瘤核心特征所構建模型的預測性能優(yōu)于基于全腫瘤提取特征;CE-T1WI+T2 FLAIR1 構建的聯(lián)合模型能更進一步地提高預測模型的性能,能為術前區(qū)分高級別膠質瘤及PCNSL提供一種可靠且無創(chuàng)的方法。
本研究中高級別膠質瘤與PCNSL兩隊列性別及年齡之間無明顯差異(P>0.05),但有研究[6]指出,兩者都多見于男性,這可能與我們納入的病例太少有關,膠質瘤較PCNSL更易累及皮質[20-21],這也與本研究一致。
紋理特征是通過評估圖像中像素的灰度強度和位置來量化腫瘤內的異質性[22-23],在最終篩選的非零影像組學特征中CE-T1WI序列的“GLRLM”獲得了最高的權重,它是利用不同的波長、振幅和頻率來識別圖像內的紋理屬性,它評估ROI 中像素或體素的百分比,反映不同灰度和運行長度的運行分布,“GLRLM”已被證實可以用來鑒別PCNSL 與膠質瘤[24]。基于單體素或像素分析得到的一階特征如熵、峰度等也有助于兩者的鑒別[25],內置濾波器對原始圖像進行過濾和噪聲的去除,這些轉化的特征可以反映腫瘤微環(huán)境中的細胞學特征或分子的特異性表達[26],可以補充紋理信息來鑒別膠質瘤與PCNSL。
本研究分別以腫瘤核心區(qū)和腫瘤核心包含瘤周水腫區(qū)提取的特征構建了基于T2 FLAIR序列的組學模型,結果發(fā)現(xiàn)以腫瘤核心區(qū)域特征建立的組學模型性能較優(yōu)越,PRIYA 等[18]從多個腫瘤的亞區(qū)域提取影像組學特征并構建腫瘤的分類模型,其中大多數(shù)高性能的特征是來自壞死和增強區(qū)域,即腫瘤核心,與本研究結論一致。有研究[27]對CE-T1WI 序列腫瘤壞死和實體增強(排除瘤周水腫)區(qū)域的特征進行紋理分析,最終得到交叉驗證的平均AUC值為0.924,但其模型性能略低于本研究,原因可能是因為以上研究主要對于一階特征進行了紋理分析,未涉及二階及高階特征。腫瘤的異質性不僅局限于腫瘤的實體還涉及水腫區(qū)域[19],KIM 等[28]利用CE-T1WI 序列腫瘤核心區(qū)域特征及T2WI 及ADC 序列腫瘤核心加瘤周水腫區(qū)域特征成功構建多參數(shù)LR 模型,其在訓練組及驗證組AUC 分別為0.979 和0.956。有研究指出[26]增加腫瘤增強邊緣10 mm 內的影像組學特征區(qū)分膠質母細胞瘤、淋巴瘤、腦內轉移瘤的分類模型得到了比僅使用瘤內和水腫區(qū)域特征的模型更高的性能,因此后續(xù)的研究中需要繼續(xù)探討腫瘤瘤周特征對鑒別PCNSL及其他神經(jīng)系統(tǒng)腫瘤的價值。
最近的一項Meta 分析[4]指出不管是機器學習還是深度學習在PCNSL 和膠質母細胞瘤鑒別方面表現(xiàn)良好,AUC 值在89.0%~98.2%之間,準確率最高為97.9%,最低為82.0%,其中基于不同MRI 序列建立的影像組學模型預測性能不同。本研究建立的多個影像組學模型在區(qū)分高級別膠質瘤與PCNSL 方面都表現(xiàn)出良好的診斷效能,其中CE-T1WI模型是最佳的單序列模型。XIA 等[29]基于CE-T1WI、FLAIR、DWI、ADC 序列建立了多參數(shù)影像組學模型鑒別膠質母細胞瘤及PCNSL,在單序列模型中,基于CE-T1WI序列建立的模型獲得最高的AUC 值,AUC 值為0.937,該研究所得最佳的聯(lián)合序列模型為CE-T1WI+ADC 序列,其AUC 值為0.943,本研究所建立預測性能略高于以上研究,主要原因為以上研究利用腫瘤核心外加瘤周水腫區(qū)域的影像組學特征建立預測模型,而本研究建立的最佳單序列模型及聯(lián)合模型主要基于腫瘤核心特征構建。BATHLA 等[30]分別建立了基于T1WI、T2WI、FLAIR、ADC 及CE-T1WI 的單序列模型及多個序列組合模型,其中基于ADC、FLAIR 及CE-T1WI 構建的聯(lián)合模型的預測效能最佳。由于我們的研究中具有ADC 序列的病例較少,本文未探討ADC 序列的價值,在后續(xù)的研究中會繼續(xù)該序列的探討。有研究[31]構建多參數(shù)的卷積神經(jīng)網(wǎng)絡(convolution neural network, CNN)模型,基于FLAIR的CNN模型性能不如CE-T1WI模型,這可能是由于FLAIR 的水腫模式與腫瘤類型的相關性不如增強模式強。多項研究表明CE-T1WI 影像組學模型具有良好的診斷效能,此外多參數(shù)MR 影像組學模型通常優(yōu)于單一序列[27,32-34],CE-T1WI 是腦腫瘤診斷中首選的MRI序列,其包含了腫瘤中局部血管生成和血腦屏障破壞的信息,可以清晰地顯示腫瘤實體和壞死[6,35],且多參數(shù)的影像組學模型可以提供更多關于腫瘤生物學異質性的信息[28,36]。
本研究還存在以下局限性。(1)本研究的樣本量小,且沒有設立外部驗證組,不可避免地存在模型的過擬合問題,在后續(xù)的研究中會繼續(xù)擴大研究隊列并增加外部驗證組以提高預測模型的準確性及穩(wěn)定性;(2)本研究納入的臨床及影像學特征較少,因此未構建臨床預測模型;(3)本文僅構建用于區(qū)分PCNSL 與高級別膠質瘤的影像組學模型,PCNSL 還需要與其他中樞神經(jīng)系統(tǒng)疾病進行鑒別,例如單發(fā)轉移瘤、多發(fā)性硬化和腫瘤脫髓鞘等疾病,因此在后續(xù)的研究中可以增加多分類任務的研究;(4)本研究只是探討了腫瘤核心與全腫瘤區(qū)域組學特征對預測模型的影響,未進一步探討腫瘤更小亞區(qū)域特征對區(qū)分膠質瘤與PCNSL的價值,今后還需要進一步探究腫瘤更小亞區(qū)域特征對模型性能的影響;(5)本研究只構建了常規(guī)MRI序列的組學模型,后續(xù)還需探討功能MRI序列在區(qū)分PCNSL及高級別膠質瘤中的價值。
多參數(shù)MR 影像組學模型在區(qū)分PCNSL 和高級別膠質瘤方面具有良好的診斷效能,基于不同的MRI序列及腫瘤亞區(qū)域特征構建影像組學模型,其性能不同;在單序列模型中,基于CT-T1WI 模型預測效能最佳,聯(lián)合模型預測性能優(yōu)于單一序列模型;腫瘤核心區(qū)域特征與腫瘤的分類任務更相關。
作者利益沖突聲明:全體作者均聲明無利益沖突。
作者貢獻聲明:陳志強設計本研究的方案,對稿件重要內容進行了修改,獲得了寧夏回族自治區(qū)重點研發(fā)計劃項目、寧夏回族自治區(qū)自然科學基金和教育部春暉項目的基金資助;張少茹負責試驗操作,試驗參數(shù)調整,起草和撰寫論文,獲取、分析或解釋本研究的數(shù)據(jù);周云舒、張若弟、劉世莉、陳曉華、王卓參與本研究的數(shù)據(jù)收集、整理和分析,對論文主要內容進行核對;全體作者都同意發(fā)表最后的修改稿,同意對本研究的所有方面負責,確保本研究的準確性和誠信。