萬 濤 趙 輝 李德玉 馬 軍 武春雪 蒙 茗 秦曾昌
1(北京航空航天大學生物與醫(yī)學工程學院,北京 100191)
2(北京航空航天大學生物醫(yī)學工程高精尖創(chuàng)新中心,北京 100191)
3(首都醫(yī)科大學附屬北京天壇醫(yī)院放射科,北京 100050)
4(北京航空航天大學自動化科學與電氣工程學院,北京 100191)
垂體瘤是顱內(nèi)常見的良性腫瘤,居顱內(nèi)腫瘤發(fā)病率的第3 位[1]。腦垂體瘤不僅會影響患者的生長發(fā)育和生殖,還會對其周圍的結構造成損害,使患者視力減退、失明、偏癱、頭痛以及產(chǎn)生腦積水等。目前垂體瘤的治療主要以開顱手術和經(jīng)蝶竇入路兩種手術方式。腫瘤質(zhì)地是選擇手術方式的重要考慮因素,并且會影響手術難度和全切率[2]。垂體瘤的質(zhì)地通常較軟,一般選擇內(nèi)窺鏡經(jīng)蝶竇吸除或者刮除,但大約有10%的腺瘤的質(zhì)地表現(xiàn)較韌,不適合經(jīng)蝶竇手術[3]。磁共振影像(magnetic resonance imaging,MRI)是診斷垂腺瘤的主要影像學檢查方法,是術前判斷腫瘤質(zhì)地的理想方式[4]。
目前研究大多使用單一MRI 圖像的信號強度來判斷垂體瘤質(zhì)地[5]。例如,T2 加權(T2-weighted,T2-w)圖像高信號和低信號分別表示腫瘤質(zhì)軟和質(zhì)韌[6]。然后,有臨床研究顯示,由于垂體瘤內(nèi)部質(zhì)地分布不均勻,纖維化程度不同,使得腫瘤呈現(xiàn)出不同的紋理分布,導致有部分質(zhì)地韌的腫瘤表現(xiàn)為T2-w 高信號[7]。此外,MRI 的人工判讀具有主觀性強、效率低等缺點。因此,研究基于多參數(shù)磁共振圖像(multi-parameter magnetic resonance imaging,MP-MRI) 的計算機輔助診斷(computer-aided diagnosis,CAD)方法,為評估垂體瘤質(zhì)地提供了新思路。
結合影像組學的CAD 技術,是采用自動化算法高通量地提取大量影像信息,實現(xiàn)腫瘤分割、特征提取與模型建立[8-9]。憑借對海量影像數(shù)據(jù)信息進行更深層次的挖掘、預測和分析,以輔助醫(yī)師做出最準確的診斷。該方法已經(jīng)較廣泛地應用于腦膠質(zhì)瘤[10]、肺癌[11]、乳腺癌[12]、心血管病[13]等,實現(xiàn)對疾病的診斷、檢測、分類和分級。然而,目前仍然缺乏對于垂體瘤質(zhì)地術前評估的影像組學方法研究。
本研究提出一種基于MP-MRI 的影像組學方法,與以往利用單一序列MRI 圖像的磁共振信號強度去判斷垂體瘤質(zhì)地不同,通過提取多種類的MPMRI 圖像紋理特征,采用特征選擇方法和合適的分類器,發(fā)現(xiàn)有效區(qū)分質(zhì)軟和質(zhì)韌腦腫瘤的重要圖像特征,從而為垂體瘤的術前評估提供影像學參考,有助于臨床醫(yī)師制定合理的手術方案,改善患者的療效和預后。
選取2012年1月—2015年7月間在首都醫(yī)科大學附屬北京天壇醫(yī)院經(jīng)手術切除的垂體腺瘤患者共106 例。數(shù)據(jù)均去隱私化。排除標準:1)術前接受化療或者放療(2 例);2)臨床或影像資料不全(20 例)。最終入組的84 例,包括男性39 名,女性45 名,年齡為(42.8±11.5)歲。所有患者經(jīng)MR 平掃及增強掃描,術后病理檢查確診。每位患者包括T1 加權(T1-weighted,T1-w)、T1 加權對比增強(T1-weighted contrast enhanced,T1-w-e)以及T2-w 等3種參數(shù)的MRI。將84 例患者按照質(zhì)地分為了兩組:質(zhì)地軟組(n=44)和質(zhì)地韌組(n=40)。
所有患者均使用超高場強3.0 T MRI 掃描儀(MAGNETOM TrioTim;Siemens,Berlin,Germany),常規(guī)行軸位T1-w(TR 2 000 ms,TE 9.8 ms)及T2-w(TR 4 500 ms,TE 84 ms)掃描,掃描層厚為5.0 mm,層間距為6.5 mm,F(xiàn)OV:240 mm×240 mm,矩陣為384×324。增強掃描采用T1WI 行軸位(參數(shù)同平掃),矩陣512×512。對比劑采用靜脈注射釓噴酸葡胺,0.1 mol/kg。
由一位具有10年以上經(jīng)驗的神經(jīng)放射學醫(yī)師在T2-w 圖像上手動勾畫出腫瘤區(qū)域(如圖1所示的紅色實線包圍區(qū)域)。在標注過程中考慮到實質(zhì)性垂體瘤侵襲性生長的情況,剔除了腫瘤內(nèi)部出現(xiàn)出血、壞死及囊變的部分。
圖1 圖像標注示意(以T2-w 圖像為例)Fig.1 Illustration of image annotation (in T2-w images)
提出了一種基于MP-MRI 的影像組學方法,用來區(qū)分腦垂體瘤質(zhì)軟和質(zhì)韌,輔助術前評估。
方法流程如圖2所示,其中包括3 個主要部分:1)圖像預處理,獲得MP-MRI 的腫瘤區(qū)域;2)MPMRI 特征提取,識別重要的影像組學特征;3)垂體瘤質(zhì)地分類,驗證MP-MRI 特征的有效性。
圖2 垂體瘤質(zhì)地術前評估流程Fig.2 Flow chart of preoperative evaluation of pituitary macroadenomas
1.4.1 圖像預處理
1)圖像配準。由于常規(guī)掃描和增強掃描參數(shù)存在差異,因此需要將T1-w 和T1-w-e 與T2-w 進行配準,達到與T2-w 中標注的空間位置和解剖位置一致,便于后續(xù)特征提取。采用常用的基于互信息配準方法[13],使用Powell 算法作為優(yōu)化方法。
2)圖像灰度標準化。針對MRI 圖像采集條件不同產(chǎn)生的圖像灰度差異,采用了μ±3σ的灰度標準化方法[14],其中μ和σ分別表示腫瘤區(qū)域的灰度平均值和標準差。將灰度值在μ±3σ范圍之外的像素點刪除。該方法能夠提高特征提取以及統(tǒng)計分析的可靠性[11]。
1.4.2 MP-MRI 特征提取
分別對T1-w、T2-w、T1-w-e 的腫瘤區(qū)域提取了6種紋理特征[12-13,15-16],包括局部二值模式(local binary patterns,LBP)、方向梯度直方圖(histogram of oriented gradient,HOG)、灰度共生矩陣(gray-level co-occurrence matrix,GLCM)、灰度游程矩陣(graylevel run-length matrix,GLRLM)、Gabor 濾波器、非抽樣雙樹復小波變換(undecimated dual-tree complex wavelet transforms,UDT-CWT),共296 維特征,具體如表1所示。
表1 所提取的MP-MRI 影像組學特征描述Tab.1 Description of radiomics features from MP-MRI
1)局部二值模式。LBP 特征通過對比鄰域窗口內(nèi)周圍像素點的灰度值與中心像素點灰度值的大小獲得8 位二進制序列,表示為
式中,W為鄰域窗口,gp為鄰域窗口內(nèi)第p像素點的灰度值,gc為中心像素點的灰度值,S為符號函數(shù)。
本研究計算了等價局部二值模式(uniform LBP)[14],將二進制序列中1 到0 的變化定義為等價模式和非等價模式,將256 維的LBP 特征降低為59 維。
2)方向梯度直方圖。HOG 是一種常用的局部紋理描述算子,用來描述垂體瘤軟韌質(zhì)地在梯度方向的分布變化特性。其具體計算過程包括:(1)獲得原圖像的梯度圖像,計算像素的幅值和方向;(2)將梯度圖像分為若干個圖像塊,每一圖像塊劃分為大小均勻的單元;(3)統(tǒng)計單元內(nèi)的所有像素的梯度方向和大小,獲得每個單元的統(tǒng)計直方圖,即特征向量;(4)通過歸一化后得到圖像塊和增幅圖的特征向量[13]。該特征向量作為圖像的HOG 特征。
3)灰度共生矩陣。GLCM 是由圖像中灰度對的聯(lián)合概率密度構成的矩陣,能夠捕捉細微的局部紋理變化。基于GLCM,在4 個方向上計算了4 種常用的紋理特征,包括能量、熵、對比度、同質(zhì)性,分別反映腫瘤區(qū)域的灰度分布均勻程度、信息量大小、紋理強弱、紋理變化度等特性。除此以外,計算4 個紋理特征在4 個方向上的均值,共計20 維特征。
4)灰度游程矩陣。GLRLM 是灰度值行程的長度所組成的矩陣,反映了圖像灰度關于方向,相鄰間隔和變化幅度等綜合信息[15]。基于GLRLM,在4個方向計算了11 種圖像特征用來描述垂體瘤的局部紋理模式和灰度排列規(guī)則,包括短游程優(yōu)勢、長游程優(yōu)勢、灰度不均勻性、長游程不均勻性、游程百分比、低灰度級游程優(yōu)勢、高灰度級游程優(yōu)勢、短游程低灰度級優(yōu)勢、短游程高灰度級優(yōu)勢、長游程低灰度級優(yōu)勢、長游程高灰度級優(yōu)勢。
5)Gabor 濾波器。Gabor 變換通過改變方向和尺度參數(shù)獲得多尺度紋理特征,其二維函數(shù)表示為
式中,u=xcosθ+ysinθ,v=-ycosθ+xsinθ,θ是方向角,1/λ是正弦函數(shù)的頻率,δu和δv分別表示高斯包絡在u軸(平行于θ)和v軸(垂直于θ)的標準差。
本研究選取了5 個尺度和8 個方向[18],從而構成40 個濾波通道。在每個通道計算均值和標準差,構成80 維的Gabor 特征向量。
6)非抽樣雙樹復小波變換。與傳統(tǒng)的小波變換相比較,UDT-CWT 變換具有平移不變性和良好的方向選擇性[16]。對于大小為nw×nh的圖像,每一個小波子帶圖像Wk,θ都包含復小波系數(shù)的實部和虛部,其中k∈{1,2,…,K},K的大小由圖像大小決定[17],圖像越大導致分解尺度越多。經(jīng)過UDTCWT 變換之后,通過實部和虛部的小波子帶系數(shù)計算2 種統(tǒng)計特征,包括均值和標準差,形成48 維UDT-CWT 特征。
1.4.3 垂體瘤質(zhì)地分類
1)特征選擇。本研究提取了296 維紋理特征,不僅計算量增加,而且導致后續(xù)的分類結果出現(xiàn)過擬合的現(xiàn)象。因此,采用最大相關最小冗余算法(maximal relevance-minimal redundancy,mRMR)[18],選取區(qū)分腫瘤質(zhì)地軟韌的最優(yōu)特征組合,從而達到提高分類模型泛化能力以及降低過擬合的目的。mRMR 方法以互信息為選擇準則,根據(jù)特征和標簽之間的相關性最大和特征子集之間的冗余度最小原則對特征進行排序。
為了消除特征之間的量綱影響,將原始特征歸一化至[-1,1]范圍內(nèi)。在訓練集上采用mRMR 特征選擇方法識別重要的圖像特征,所選取的特征作為分類器的輸入,用來識別質(zhì)軟和質(zhì)韌的垂體瘤。
2)分類器設計。支持向量機(support vector machine,SVM)和隨機森林(random forest,RF)是應用廣泛的兩種分類方法。因此,使用SVM 和RF 識別腫瘤的軟韌質(zhì)地,將實驗數(shù)據(jù)劃分為訓練集(60%),驗證集(10%),測試集(30%),使用十折交叉驗證算法的有效性。針對SVM,采用徑向基核函數(shù)的方法將訓練樣本從原始空間轉換到一個線性可分的高維空間。在RF 算法中,決策樹數(shù)目和樹的最大深度是兩個關鍵參數(shù)。
3)參數(shù)設置。采用自動搜索方法獲得分類器的最優(yōu)參數(shù)組合。圖3顯示了分類準確率隨參數(shù)選擇的變化情況。本研究中,SVM 分類器的核函數(shù)參數(shù)以及懲罰參數(shù)分別設置為0.01 和100,以及RF分類器的決策樹數(shù)目和樹的最大深度設置為500和30。
圖3 分類準確率隨分類器參數(shù)選擇變化的三維圖(特征數(shù)目為25)。(a)SVM;(b)RFFig.3 3D diagram of classification accuracy with the choice of parameters of classifiers (feature number is 25).(a) SVM;(b) RF
1.4.4 分類性能評價指標
分類性能使用準確率(accuracy,ACC)、敏感性(sensitivity,SN)、特異性(specificity,SP)、和受試者工作特征曲線下面積(area under the curve,AUC)等4 種指標進行量化。評價指標數(shù)值越接近1,表明分類器性能越好。
表2分別列出了基于不同MRI 圖像組合的特征選擇結果(排名前10 的圖像特征)。此外,將從MP-MRI 組合中選取的4 種特征中排名最前的特征在不同質(zhì)地的垂體瘤圖像中進行可視化(如圖4所示),便于更好的分析特征在不同圖像中的表征差異。
表2 特征選擇排名前10 的MP-MRI 圖像特征Tab.2 Top 10 MP-MRI features after feature selection
圖4 MP-MRI 特征可視化Fig.4 Illustration of the color encoded MP-MRI feature images
采用SVM 和RF 分類器對垂體瘤質(zhì)地進行識別和分類。表3展示的結果為使用mRMR 方法選取的25 維最優(yōu)特征作為輸入。對比了單一MRI 圖像與多參數(shù)MRI 圖像組合的分類性能,發(fā)現(xiàn)與SVM比較,RF 取得了更好的分類準確率。因此,基于RF分類器,評估了不同數(shù)量的特征對垂體瘤質(zhì)地分類的影響。通過選取不同數(shù)量的mRMR 最優(yōu)特征組合對RF 分類器進行了分類實驗,結果見表4。
表3 SVM 和RF 分類性能比較Tab.3 Comparison of classification performance between SVM and RF
表4 不同特征維數(shù)對應RF 分類指標Tab.4 RF classification index corresponding to different feature dimensions
使用自舉法(bootstrap)方法,進行100 次重復抽樣,計算性能指標的95%置信區(qū)間。所獲分類結果與前期研究工作[6,19]中報道的3 位影像科醫(yī)生基于單一MRI 序列影像的診斷結果進行比較,結果見表5。
表5 分類結果與影像科醫(yī)生診斷結果的比較Tab.5 Comparison between classification results and radiologists′ diagnosis
本研究提出了一種基于多參數(shù)磁共振影像組學特征的腦垂體瘤質(zhì)地術前評估方法,結合傳統(tǒng)圖像處理算法與機器學習技術,發(fā)現(xiàn)識別垂體瘤質(zhì)地的重要MP-MRI 圖像特征,從而較準確地早期判定質(zhì)軟與質(zhì)韌腫瘤,有助于垂體瘤療效和預后的改善。
以往研究發(fā)現(xiàn),垂體瘤的質(zhì)地與其膠原成分有關,膠原成分越高,其纖維化越嚴重,腫瘤質(zhì)地越堅韌[2,20-21]。垂體瘤的纖維質(zhì)地或是囊變組織內(nèi)蛋白含量高的液體均可導致垂體瘤的T2-w 低信號。因此,T2-w 低信號可提示垂體瘤的纖維質(zhì)地。本研究發(fā)現(xiàn)在不同的MRI 圖像組合中,有更多的來自T2-w的圖像特征被選取為最優(yōu)特征,表明與T1-w 和T1-w-e 序列相比,T2-w 影像學表現(xiàn)能夠更好地反映垂體瘤質(zhì)地在圖像表征的差異。
本研究發(fā)現(xiàn),與質(zhì)軟腫瘤相比,質(zhì)韌腫瘤的異質(zhì)性更強,即腫瘤內(nèi)部更加不均勻,說明質(zhì)韌腫瘤紋理更加粗糙。主要原因是質(zhì)韌垂體瘤纖維化程度較高,因此在腫瘤區(qū)域內(nèi)表現(xiàn)出增強的結構變化。并且,對比不同MP-MRI 軟韌腫瘤的特征可視化,發(fā)現(xiàn)T2-w 圖像上的軟韌垂體腺瘤特征的差異性更加顯著,更具有鑒別性,這和前期的研究結果是一致的[2,22]。
相同的特征應用于不同MP-MRI 圖像顯示不同的特征表現(xiàn),能夠較好地區(qū)分不同質(zhì)地的垂體瘤,但其在質(zhì)軟和質(zhì)韌腫瘤的紋理結構表達上具有明顯的差異性,說明MP-MRI 組合與單一MRI 相比可以提供更加全面的腫瘤質(zhì)地信息。與影像科醫(yī)生基于單一MRI 圖像診斷結果對比[6,19],發(fā)現(xiàn)影像組學方法在分類準確率方面有明顯提升,表明結合MP-MRI 圖像特征有助于形成鑒別軟韌垂體瘤的影像學標志物,為醫(yī)生提供較準確的臨床輔助參考。
此外,研究發(fā)現(xiàn)隨著特征數(shù)量的增加分類準確率會逐漸提高,直到達到最高的分類指標,隨后下降。主要原因是高維輸入特征可能會使樣本訓練過擬合,導致分類的預測性能較差,該現(xiàn)象稱為“維度災難”[13]。本研究通過對MP-MRI 的多維特征進行分析,提取了一組影像組學特征,有助于形成一套有效的圖像標記物,從而準確地識別腦垂體瘤的軟韌質(zhì)地。
本研究的局限之處主要體現(xiàn)在以下兩個方面:一是所用的樣本量偏少,來自同一醫(yī)院,對圖像特征的分類性能驗證有一定的限制作用;二是由于采集的數(shù)據(jù)掃描層厚和層間距較大,所提取的特征沒有考慮到腫瘤的空間結構信息。后續(xù)的工作考慮收集多來源數(shù)據(jù),加入腫瘤的空間整體信息,進一步提高分類的準確率和魯棒性。
垂體瘤的治療主要以手術為主,其中有開顱手術和經(jīng)蝶竇入路兩種手術方式,且經(jīng)蝶竇入路手術已成為首要的手術方法。然而部分腫瘤質(zhì)地堅韌,導致無法全部切除病灶。腫瘤殘留不但無法有效解除腫瘤對周圍神經(jīng)的壓迫,且殘余腫瘤亦極易復發(fā)。因此,早期明確垂體瘤質(zhì)地對手術方案制定和改善療效具有重要臨床意義。本研究提出了一種基于MP-MRI 的影像組學方法,實現(xiàn)垂體瘤質(zhì)地的輔助術前評估。實驗結果表明相較于單一MRI 圖像,多參數(shù)磁共振圖像的紋理特征組合能夠有效和準確區(qū)分垂體瘤的軟韌質(zhì)地,從而為手術入路的選擇提供影像學依據(jù),有助于幫助醫(yī)師制定合理的手術方案。