杜尚凇, 王可欣, 聞聃, 李昌欣, 張曉東, 王霄英
癲癇是反復發(fā)作的神經(jīng)元異常放電所致的暫時性中樞神經(jīng)系統(tǒng)功能失常。我國癲癇患病率為1.7‰~8.5‰,其中50%在9歲前起病[1]。多數(shù)癲癇患者經(jīng)過正規(guī)的抗癲癇藥治療(antiepileptic drugs ,AEDs)后發(fā)作可得到控制,經(jīng)過2種以上種抗癲癇藥治療后仍難以控制發(fā)作的稱為藥物難治性癲癇(drug resistance epilepsy,DRE)[2],我國約20%~30%的癲癇患者[3]為藥物難治性癲癇。約有50%的藥物難治性癲癇患者通過外科手術切除致癇灶或術后聯(lián)合抗癲癇藥物治療,可以很好地控制癲癇發(fā)作[3,4]。
MRI是藥物難治性癲癇術前評估的重要方法之一[5]。在MRI圖像上如能發(fā)現(xiàn)異常信號并提示致癇病灶的范圍,有利于完整切除致癇灶,是影響患兒預后的重要因素之一[6,7]。兒童難治性癲癇中最常見的病因為局灶性皮質發(fā)育不良(focal cortical dysplasia,F(xiàn)CD),其次為輕微的皮質發(fā)育畸形(mild malformations of cortical development,mMCD)[8,9],F(xiàn)CD為MCD中最常見的類型[10]。 FCD/MCD在MRI圖像上的特征性表現(xiàn)主要包括局部皮質增厚、灰白質分界不清、腦回異常、腦溝裂增寬、皮層下異常信號等[11,12]。由于FCD/MCD的影像學診斷受場強、成像質量、診斷者水平等多種因素影響,影像診斷FCD/MCD的準確性較差,據(jù)統(tǒng)計約40%的病例術前影像診斷有誤[13],迫切需要通過技術手段提高FCD/MCD的影像定位能力。
近年來大量影像組學研究探索了不同成像方式下的應用價值,涉及X線、超聲、CT、MRI和PET研究等。研究結果表明影像組學技術可用于疾病診斷[14-17]、疾病風險分層[18-20]、預后評估[21]和治療反應預測[22]等。大多數(shù)研究針對腫瘤性疾病,也有不少關注非腫瘤性疾病。本研究的目的是探索基于3D T1WI序列的影像組學模型對兒童局灶性皮質發(fā)育不良(focal nodular dysplasia,F(xiàn)CD)及皮質發(fā)育畸形(malformations of cortical development,MCD)病灶的預測效能。
1.數(shù)據(jù)入組
本回顧性研究獲得了醫(yī)院倫理委員會的批準[批件號:2019(170)]。從PACS 系統(tǒng)搜集2015年3月至2020年8月因藥物難治性癲癇行手術切除病灶的患者。入組標準:①年齡1~18歲;②患兒行癲癇灶切除術,據(jù)國際抗癲癇聯(lián)盟(International League Against Epilepsy,ILAE) 研究制定的分類標準[23]診斷為FCD/MCD的患兒;③患兒術前在本院行顱腦3D T1WI檢查。排除標準:①圖像偽影重;②病灶體積過小無法勾畫輪廓;③既往患有其他可導致癲癇并表現(xiàn)為大腦實質信號異常的疾病,如缺血缺氧性腦病、結節(jié)性硬化、腦炎等;④既往顱腦外傷、手術史。最終46例數(shù)據(jù)納入研究。其中男28例,女18例,平均年齡7.2歲。病灶位于左側大腦半球者24例,位于右側大腦半球者22例;位于額葉23例,顳葉及海馬9例,中央?yún)^(qū)4例,頂葉1例,枕葉1例,額頂葉4例,額頂顳葉、頂枕顳葉、頂顳葉、額頂島葉、顳島葉各1例。病理結果為FCD的39例(39/46),MCD 7例(7/46);其中FCD Ⅰa 2(2/46),F(xiàn)CD Ⅰb 4(4/46),F(xiàn)CD Ⅱa 11(11/46),F(xiàn)CD Ⅱb 13(13/46),F(xiàn)CD Ⅲa 1(1/46),未分型的FCD 8例(8/46)。使用3.0T MR掃描儀(Philips Medical Systems,Achieva)采集頭顱3D T1WI圖像。使用8通道頭線圈,掃描序列為MPRageAX SENSE,TR 8.1 ms,TE 3.72 ms,ETL 205,TA 8度,F(xiàn)OV 22 cm,矩陣256×256,層厚1 mm,層面內(nèi)分辨率0.85×0.85 mm。
2.數(shù)據(jù)標注和測量
使用ITK-SNAP 3.8.0軟件(http://www.itksnap.org)標注FCD/MCD病灶。由一位醫(yī)生(影像工作3年)首先標注,再由一位高年資醫(yī)生(影像工作>20年)檢查并修改標注。結合術后病理結果在圖像上標注FCD/MCD病灶區(qū)域作為正樣本,在對側大腦半球相同水平標注大小、位置接近的對照區(qū)域作為負樣本。
3.影像組學模型訓練
所有程序均在python3.2版本上運行。使用pyradiomics軟件包(https://pyradiomics.readthedocs.io/en/latest/)提取特征,將所提取出的特征用于建立組學模型。建模過程包括:圖像處理、數(shù)據(jù)歸一化、特征降維、特征選擇、訓練分類器等步驟[24](表1)。按照7:3的比例將數(shù)據(jù)隨機分為訓練集(train set)和測試集(test set),進行影像組學建模和測試。根據(jù)測試集的預測性能來選擇最佳的模型參數(shù)。
表1 訓練影像組學模型的參數(shù)
4.分類模型評價
計算分類模型中每個樣本的組學得分(rad-score),應用sigmoidal函數(shù)將組學得分轉換為FCD的概率P(P介于0~1之間)。使用受試者工作特征曲線(receiver operating characteristic,ROC)來評估模型預測的性能。
5.統(tǒng)計描述
采用R1.1.456、Medcalc15.8軟件進行統(tǒng)計分析。采用Shapiro-Wilk正態(tài)性檢驗,符合正態(tài)分布的計量資料采用獨立樣本t檢驗,以均值±標準差表示,不符合正態(tài)分布的連續(xù)變量采用Wilcoxon秩和檢驗,表示為中位數(shù)(四分位間距)。P<0.05認為差異有統(tǒng)計學意義。
1.樣本特征(圖1)
圖1 槽口箱形圖。規(guī)一化之后的FCD病灶和對照區(qū)域的比較。V1:FCD/MCD病灶體積;V2:對照區(qū)域體積;X1:FCD/MCD病灶最小徑;X2:對照區(qū)域最小徑;Y1:FCD/MCD病灶中間徑;Y2:對照區(qū)域中間徑;Z1:FCD/MCD病灶最大徑;Z2:對照區(qū)域最大徑。同一變量比較的箱形圖,槽口區(qū)域如有交叉則代表該變量在兩組間差異無統(tǒng)計學意義(P>0.05)。從圖中可以看出FCD/MCD病灶與對區(qū)域比較,其體積和三維徑線的差異均無統(tǒng)計學意義。 圖2 影像組學模型的ROC曲線 訓練集的AUC為0.997,最佳截斷點0.312。測試集的AUC為0.851,最佳截斷點0.958。
46個FCD/MCD病灶的三維徑線分別為3.2 cm(95%CI:2.9~3.4)、4.1 cm(95%CI:3.8~4.4)和5.9 cm(95%CI:5.3~6.5),46個對照病灶的三維徑線分別為4.2 cm(95%CI:3.5~4.7)、4.9 cm(95%CI:4.2~5.5)和6.6 cm(95%CI:5.8~7.3),兩兩比較差異均無統(tǒng)計學意義(P>0.05)。46個FCD/MCD病灶的體積為17.9 cm3(95%CI:14.4~21.3),46個對照病灶的體積為18.8 cm3(95%CI:14.5~23.2),差異無統(tǒng)計學意義(統(tǒng)計量=46,P=0.904)。
2.影像組學模型結果
特征提取:從3D T1WI圖像中共提取1070個特征,包括14個形狀(shape)特征,216個一階(first order)特征,以及840個紋理(texture)特征,包括灰度共生矩陣(gray-level co-occurrence matrix,glcm)、灰度依賴矩陣(gray-level dependent matrix,gldm)、灰度游程矩陣(gray-level run length matrix,glrlm)、灰度大小區(qū)域矩陣(gray-level size zone matrix,glszm)等。
模型訓練:使用全部可選參數(shù)訓練模型后,據(jù)測試集最佳結果篩選出最終模型參數(shù):使用MinMax方法進行特征值的規(guī)一化,以PCC對特征排序,以RFE方法選擇最重要的20個特征,輸入XGBoost分類器。
預測結果:訓練集的AUC為0.997,最佳截斷點為0.312。測試集的AUC為0.851,最佳截斷點為0.958(圖2~4)。
FCD/MCD是兒童藥物難治性癲癇最常見的病因之一,術前病灶的準確定位是影響手術效果的重要原因。目前臨床常用的定位方法除了癥狀學定位,主要有視頻腦電圖(video-electroencephalography,vEEG)、立體三維腦電圖(stereo-encephalography,sEEG)、腦磁圖(magnetoencephalography,MEG)、MRI、SPECT、PET等,其中vEEG和MRI是癲癇患者的常規(guī)檢查[25]。其中MRI可輔助定位病灶并確定病灶范圍,但受多種因素影響,準確率較低。本研究嘗試實現(xiàn)疑似病灶的自動識別,從而提高FCD/MCD病灶的檢出率,及早發(fā)現(xiàn)病灶并手術切除,從而改善患兒的預后。
在影像上對致癇灶的定位對讀片者的經(jīng)驗要求較高,因此既往不少研究嘗試使用圖像分析的方法識別致癇灶。算法主要包括基于體素的形態(tài)測量算法(voxel-based morphometry algorithm,VBM)、基于表面的形態(tài)測量算法(surface-based morphometry algorithm,SBM)以及基于體素特征提取的后處理工具[26]。SEOK-JUN等[13]結合表面分析運用線性判定模型對手術病理證實為FCDⅡ型的MRI圖像進行機器識別,敏感度達74%。本研究嘗試以影像組學模型來預測FCD/MCD病灶,測試集中AUC達到0.851,提示影像組學方法對本病的預測可能效果更好,有必要進一步研究。
圖3 測試集病例1。男,3歲,間斷局灶性癲癇發(fā)作1年余,多種抗癲癇藥物均控制不佳,腦電圖示清醒期右側Ro1andic區(qū)及中線區(qū)棘波、棘慢波、多棘波、慢波發(fā)放,監(jiān)測到4次右側起始的局灶性發(fā)作。PET-CT:右側額葉深部皮層局部密度增高,葡萄糖代謝減低;右側額葉(中央前回下部)葡萄糖代謝明顯減低。MRI:右側額下回局灶性皮質發(fā)育不良。于本院行右額葉病灶切除術,術后病理:(額下回后部、額中回后部、中央前溝溝底病灶)送檢腦組織,考慮為局灶皮質發(fā)育不良ⅡB(FCDⅡB)。R為右側。a)軸面3D T1WI圖像; b) 軸面圖像標注的FCD病灶(藍色)和對照區(qū)域(黃色); c) 冠狀面3D T1WI圖像; d) 冠狀面3D T1WI圖像示的FCD病灶區(qū)域(藍色)和對照區(qū)域(黃色); e) 標注區(qū)域的3D顯示。該病例中影像組學模型對藍色區(qū)域預測為FCD的概率是0.807,對黃色區(qū)域預測為FCD的概率是0.019。 圖4 測試集病例2。男,3歲,間斷局灶性癲癇發(fā)作2年余,抗癲癇藥控制不佳, 腦電圖:左側前顳、前中顳異常放電;MRI:左側海馬異常信號。PET-CT:左側海馬葡糖代謝明顯減低,于本院行左側顳葉、海馬病灶切除術,術后病理:局灶皮質發(fā)育不良IIa型(Type Ⅱa)。R為右側。a)軸面3D T1WI圖像;b)軸面圖像標注的FCD病灶(藍色)和對照區(qū)域(黃色);c)冠狀面3D T1WI圖像;d)冠狀面3D T1WI圖像上示的FCD病灶區(qū)域(藍色)和對照區(qū)域(黃色);e)標注區(qū)域的3D顯示。該病例中影像組學模型對藍色區(qū)域預測為FCD的概率是0.938,對黃色區(qū)域預測為FCD的概率是0.017。
3D T1WI是檢出FCD/MCD病灶的最佳序列之一[27],在實際臨床工作中影像醫(yī)生主觀評估也是以3D T1WI結合其他序列來檢測FCD/MCD,這是本研究采用該序列的原因。未來模型應用的場景是針對難治性癲癇、影像檢查目的是除外FCD/MCD的患者,掃描完成后由影像醫(yī)生讀片。影像醫(yī)生讀片過程中如發(fā)現(xiàn)疑似病灶,或讀片未見疑似病灶但臨床檢查結果(如腦電圖、PET等)懷疑某處有疑似病灶,則醫(yī)生在該區(qū)域手工標注,標注后的圖像用本研究提出的影像組學模型預測,返回該區(qū)域為FCD/MCD的概率。影像醫(yī)生綜合臨床檢查結果、本人讀片、影像組學概率做出綜合判斷,將結果發(fā)布給臨床醫(yī)生用于后續(xù)診治。
影像組學研究過程中強調(diào)方法的標準化。本研究使用了顯示FCD/MCD公認的3D T1WI圖像,圖像獲取方法參考了本領域的相關規(guī)范[28,29]。特征提取采用了主流的Pyradiomics程序包,所提取的圖像特征符合圖像生物標志物標準化(image biomarker standardization initiative,IBSI)的基本要求[30]。入組病例全部選擇了有手術病理證實的數(shù)據(jù),根據(jù)手術區(qū)域標注病灶定位可靠。影像組學感興趣區(qū)(region of interest,ROI)的選擇有多種可能性如整個目標臟器、在圖像范圍內(nèi)隨機生成、病灶周邊區(qū)域等[16,18],本研究以大腦半球對稱區(qū)域為對照組的ROI,是考慮到雙側大腦半球的結構是對稱的,可規(guī)避解剖結構不一致而導致的偏倚。結果顯示病灶組與對照組的大小無明顯差異,說明手工標注的對照組是匹配的,因此所提取的影像組學特征主要是反映了病灶本身的性質,未受到解剖差異的影響。本研究Dice系數(shù)均較高,可能存在擬合(overfitting)問題。機器學習中過擬合現(xiàn)象通常由訓練集的數(shù)量級小于模型的復雜程度導致[31],造成模型的泛化能力下降。最常用的避免過擬合的方法是增強數(shù)據(jù),包括增加數(shù)據(jù)量、及人為增加噪聲等[32];由于本研究為初步研究,可獲得的數(shù)據(jù)量少,且未能加入外部驗證數(shù)據(jù),有待后續(xù)增加數(shù)據(jù)量評估并提高模型的泛化能力。在影像組學模型篩選中,由于Lasso分類器的特性,可避免對樣本的過度解釋[33],降低過擬合,由于本研究中采用Lasso分類器的模型中,測試集AUC最高為0.82,與本研究最終采用的模型效能有一定差距,故未選用。
本研究的局限性:①樣本數(shù)較少,需要繼續(xù)獲取本院或來自多中心的較大樣本量來驗證和完善模型;②癲癇患兒的反復發(fā)作可對大腦發(fā)育造成影響如造成局部腦實質的萎縮,本研究沒有考慮病程長短、治療過程等對研究結果可能產(chǎn)生的影響,應在獲取足夠樣本后對病例進行分類,從而完善模型;③部分顳葉病灶的檢出可能受到顱底偽影的干擾,盡管在篩選病例時已經(jīng)注意排除質量較差的圖像,但仍不能完全避免,同樣需在獲取足夠病例后根據(jù)病灶位置進行分類學習;④FCD/MCD的不同分型影像學表現(xiàn)略有差異,有待進一步根據(jù)病理類型進行分類學習。
總之,本研究初步證明了基于機器學習的3D T1WI影像組學標簽可較準確地識別標注范圍內(nèi)的可能的灰白質異常,并可用于難治性癲癇患兒的輔助影像學診斷。