李惠明 張軍*
膠質(zhì)瘤是成人中最常見的原發(fā)性腦腫瘤[1],高級別膠質(zhì)瘤的放化療后中位生存時間僅12.8個月[2],膠質(zhì)瘤的分級診斷、放化療后影像學評估、對膠質(zhì)瘤生存期的預(yù)測一直是臨床及科研工作者關(guān)注的重點。MRI是目前臨床上診斷及評估腦膠質(zhì)瘤最重要的方法,但有時膠質(zhì)瘤的影像表現(xiàn)不典型會使得診斷及其與一些非腫瘤組織(例如瘤周水腫和治療后改變)的鑒別變得困難,人工診斷及評價膠質(zhì)瘤需要耗費大量的時間和精力,而基于影像組學的人工智能(artificial intelligence,AI)技術(shù)診斷膠質(zhì)瘤有助于提高診斷效率。
AI是人類智能在機器上的模擬,即讓計算機“學習”和“解決”問題。目前階段的AI十分依賴于大數(shù)據(jù),醫(yī)學影像學的大數(shù)據(jù)即影像組學。影像組學是高通量地從醫(yī)學影像中提取大量特征,采用自動或半自動分析方法將影像數(shù)據(jù)轉(zhuǎn)化為具有高分辨率的可挖掘數(shù)據(jù)集[3]。相較于僅僅從視覺層面解讀醫(yī)學影像,影像組學可深入挖掘影像的生物學本質(zhì),并提供臨床決策支持。影像組學工作流程如圖1所示。采用不同算法可以實現(xiàn)計算機“學習”影像組學的大數(shù)據(jù),將影像學特征整合至預(yù)測模型,提高整合效率和精確度,進而實現(xiàn)AI“診斷”。
1.1 工作流程 主要包括圖像預(yù)處理、圖像分割和特征提取。預(yù)處理包括圖像去噪、圖像增強等操作。圖像分割是基于像素的特征(如顏色、形狀或紋理)將圖像劃分為不同區(qū)域以挖掘信息,精確地將膠質(zhì)瘤瘤體的不同成分進行分割,不僅可以輔助分級診斷與鑒別診斷,還可以為評估治療反應(yīng)、預(yù)測生存期提供重要的證據(jù)。圖像分割通常分為手動分割、半自動分割和全自動分割[4]。一般采用圖像質(zhì)量參數(shù)或Dice系數(shù)對圖像分割結(jié)果進行評價,分割結(jié)果近似完美時Dice系數(shù)值無限趨近于1。單純應(yīng)用AI技術(shù)進行圖像分割發(fā)展得較為成熟,采用多種算法結(jié)合的方式進行分割可得到較為精準的分割結(jié)果。圖像分割后同一區(qū)域內(nèi)的圖像應(yīng)具有相似的圖像特征,需將定量圖像特征提取出來并分析整合。常用的圖像特征包括形狀、紋理等。形狀特征的提取與圖像分割工作有部分的重疊。紋理特征是一種全局特征,有助于判斷腫瘤內(nèi)部異質(zhì)性。紋理特征包括一階和二階統(tǒng)計量。一階統(tǒng)計量直方圖可用于描述圖像中像素的灰度紋理分布,但一個直方圖可能對應(yīng)于幾個圖像,圖像精度不足。灰度共生矩陣(gray-level co-occurrence matrix,GLCM)是二階統(tǒng)計量的數(shù)值矩陣,可認為是兩個像素灰度級對的聯(lián)合直方圖。其他算法模型,例如馬爾可夫隨機場(Markov random field,MRF)、模型法、小波變換等在圖像特征提取方面也具有較好的效能。
1.2 分類器及模型 在圖像分割和特征提取之后,應(yīng)將上述結(jié)果推入數(shù)學或統(tǒng)計模型輸出最終分類結(jié)果。機器學習(machine learning,ML)是實現(xiàn)分類器功能的重要方法,分為監(jiān)督學習(原理見圖2)和無監(jiān)督學習。監(jiān)督學習的主要模型有隨機森林(random forest,RF)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)、支持向量機(support vector machine,SVM)、邏輯回歸(logistic regression,LR)等。 ANN 是受生物神經(jīng)網(wǎng)絡(luò)啟發(fā)而開發(fā)的一種經(jīng)典的機器學習方法,由輸入層、隱藏層和輸出層構(gòu)成,當隱藏層發(fā)展到多層時便稱之為深度學習 (deep learning,DL)。近年來基于DL的AI技術(shù)在膠質(zhì)瘤診斷中的應(yīng)用發(fā)展迅速,其中卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)應(yīng)用較為廣泛。SVM特別適合用于處理分類問題,基于不同的圖像特征建立的SVM模型可實現(xiàn)多種分類目的,是目前膠質(zhì)瘤分級診斷中應(yīng)用最廣泛的分類器,多項研究證明SVM分類性能優(yōu)于其他分類器(見表1)。
圖1 影像組學工作流程圖
圖2 機器學習之監(jiān)督學習示意圖
表1 AI對膠質(zhì)瘤分級診斷的研究及其診斷效能
無監(jiān)督學習的輸入數(shù)據(jù)無標記,輸出結(jié)果也未知,目的不是為了產(chǎn)生一個分類系統(tǒng),而是讓計算機自己訓練找出數(shù)據(jù)集的規(guī)律性。其中最龐大的分支為聚類,基于聚類算法的無監(jiān)督學習模型也可以實現(xiàn)膠質(zhì)瘤的分級診斷。貝葉斯網(wǎng)絡(luò)以概率為核心代表疾病和癥狀之間的概率關(guān)系。Hu等[13]應(yīng)用貝葉斯網(wǎng)絡(luò)將腦膠質(zhì)瘤增強T1WI圖像特征整合至分類診斷預(yù)測模型中,也實現(xiàn)了對膠質(zhì)瘤的分級診斷[準確度92.86%,受試者操作特征曲線下面積(AUC)0.957 7]。
LR是一種尤其適用于解決兩分類問題的分類器模型,其中當應(yīng)用“L1正則化”生成一個稀疏權(quán)值矩陣后該模型也可以用于特征選擇。對于膠質(zhì)瘤分級診斷,有研究[7]應(yīng)用訓練后的LR、SVM及RF模型,最終分類結(jié)果的AUC分別為0.901 0、0.886 6、0.921 3,由此可見,膠質(zhì)瘤的高低級別分級診斷這種兩分類問題應(yīng)用邏輯模型也可得出較為滿意的結(jié)果。
1.3 數(shù)據(jù)庫及數(shù)據(jù)解析 影像組學的數(shù)據(jù)庫應(yīng)該是多中心高通量的、整合的數(shù)據(jù)庫,不僅涵蓋影像學的圖像及信息,還需要包括臨床數(shù)據(jù)、病理學數(shù)據(jù)等,尤其是分子水平的信息,并在專業(yè)人士的指導下實現(xiàn)數(shù)據(jù)共享,以求更加規(guī)范、安全使用數(shù)據(jù)庫信息。對于數(shù)據(jù)庫內(nèi)大數(shù)據(jù)解析,則需要相關(guān)的高級統(tǒng)計學及計算機專業(yè)人才,以便大數(shù)據(jù)得到最充分的應(yīng)用[14]。
2.1 分級診斷 膠質(zhì)瘤的分級診斷以及對瘤體不同成分(如出血、水腫等)的評估對于提供治療決策和預(yù)測預(yù)后至關(guān)重要[15]。目前AI領(lǐng)域已經(jīng)有大量的工作涉及膠質(zhì)瘤高低級別的分級診斷(表1)。基于AI的計算機輔助診斷系統(tǒng) (computer-aided diagnosis system,CAD)可以輔助放射科醫(yī)生的診斷工作。Hsieh等[16]研發(fā)的CAD應(yīng)用GLCM提取紋理特征,用以預(yù)測高低級別膠質(zhì)瘤 (AUC 0.89,準確度87%),應(yīng)用該系統(tǒng)后放射科醫(yī)師診斷準確度有明顯提高(AUC從0.81提高至0.90),證明該CAD不僅能夠輔助區(qū)分高低級別膠質(zhì)瘤,還能夠提高放射科醫(yī)師診斷的準確度,為AI走向臨床奠定基礎(chǔ)。
2.2 鑒別診斷 不典型膠質(zhì)瘤有時與其他腫瘤難以鑒別,例如顱內(nèi)淋巴瘤、轉(zhuǎn)移瘤等。Artzi等[17]回顧性分析439例膠質(zhì)母細胞瘤和腦轉(zhuǎn)移瘤病人的MRI特征,基于SVM等分類器建立預(yù)測模型,SVM模型預(yù)測組平均敏感度為0.86,AUC為0.96,并可以進一步鑒別膠質(zhì)母細胞瘤和腦轉(zhuǎn)移瘤亞型。Zacharaki等[18]對MR影像進行特征提取、特征選擇后,實現(xiàn)不同類型如膠質(zhì)瘤、轉(zhuǎn)移瘤及腦膜瘤等鑒別診斷,其準確度、敏感度和特異度分別為85%、87%和79%。Kunimatsu等[19]開發(fā)基于紋理特征的算法,通過對腦膠質(zhì)瘤及原發(fā)中樞神經(jīng)系統(tǒng)淋巴瘤T1WI增強影像進行紋理分析,實現(xiàn)輔助膠質(zhì)瘤與原發(fā)中樞神經(jīng)系統(tǒng)淋巴瘤的鑒別作用,該算法在訓練集內(nèi)的AUC最高可達0.99。
2.3 預(yù)后分析 腫瘤異質(zhì)性發(fā)生在分子水平,但異質(zhì)性可以通過醫(yī)學影像中觀察到的紋理宏觀反映,不同異質(zhì)性的腫瘤預(yù)后可有明顯差別。為了研究膠質(zhì)母細胞瘤病人腫瘤異質(zhì)性與病人生存時間的關(guān)系,Liu等[20]分別從長期生存和短期生存膠質(zhì)瘤病人的T1WI增強影像中提取了3種類型的紋理,隨后使用SVM學習不同紋理類型與腫瘤異質(zhì)性的關(guān)系,預(yù)測結(jié)果證明可以通過紋理特征評估腫瘤的異質(zhì)性程度,從而預(yù)測病人生存周期,但研究表明仍需要對算法進行進一步優(yōu)化來提高對于生存周期分組的準確性。Emblem等[21]進一步將確診膠質(zhì)瘤病人的生存期分為4組 (6個月,1、2、3年),基于腫瘤MR影像直方圖特征訓練SVM,測試組的SVM測試結(jié)果AUC為0.794~0.851,結(jié)果證明SVM可以實現(xiàn)根據(jù)影像精確預(yù)測生存期。
2.4 療效監(jiān)測 惡性膠質(zhì)瘤術(shù)后須放化療治療[22],但目前存在的一個問題是無法預(yù)測病人放化療后的療效反應(yīng)。Kickingereder等[23]從復(fù)發(fā)膠質(zhì)母細胞瘤病人的影像中提取了4 842個特征用以生成預(yù)測模型,用以對實驗組病人的無病進展生存期和總生存期進行分層。另一個較大的問題是難以區(qū)別治療后腫瘤進展 (true tumor progression,TTP)和假性進展(pseudoprogression,PSP)。 Qian 等[24]根據(jù)這一臨床現(xiàn)狀,應(yīng)用稀疏字典學習模型區(qū)分TTP及PSP的影像特征并用實驗組加以驗證,平均準確度為0.867,AUC 0.92。由此可見,該模型有望輔助臨床TTP及PSP的早期診斷,輔助監(jiān)測膠質(zhì)母細胞瘤的治療效果。另外,傳統(tǒng)MRI定性方法難以確定高級別膠質(zhì)瘤的浸潤邊緣,而Chang等[25]開發(fā)了一個全自動系統(tǒng),納入36例具有病理結(jié)果的MR影像訓練CNN模型,發(fā)現(xiàn)CNN可生成細胞密度圖譜,從而實現(xiàn)無創(chuàng)性識別膠質(zhì)瘤浸潤邊緣,這十分有利于病人的病情評估、膠質(zhì)瘤治療的療效監(jiān)測以及外科手術(shù)的進行。
2.5 分子水平診斷 影像基因組學表明影像特征與腫瘤基因、蛋白質(zhì)和分子改變息息相關(guān)[26-27],但其中隱含的信息僅依靠人眼并不能夠完全捕獲。AI算法可以輔助高效、精準地挖掘影像的潛在信息,從而將宏觀影像特點與微觀基因表達類型相關(guān)聯(lián),可更加精確地指導臨床,實現(xiàn)膠質(zhì)瘤的個體化治療,且較人工診斷具有明顯優(yōu)勢。膠質(zhì)瘤常見的基因突變有異檸檬酸脫氫酶 (isocitrate dehydrogenase,IDH)、表皮生長因子受體 (epidermal growth factor receptor,EGFR)等[1],不同的分子亞型在腫瘤的好發(fā)位置、治療敏感性等方面各有不同。
IDH1突變被認為與膠質(zhì)瘤的生存期關(guān)系密切。Wu等[28]應(yīng)用基于影像組學的分類模型預(yù)測IDH1突變狀態(tài)的膠質(zhì)瘤,結(jié)果顯示RF具有較高的預(yù)測性能(平均準確度0.885,AUC 0.931)。α地中海貧血伴智力低下綜合征(X-linked alpha thalassemia mental retardation syndrome,ATRX)基因表達對于低級別膠質(zhì)瘤分子分層具有臨床意義。Ren等[29]基于液體衰減反轉(zhuǎn)恢復(fù)(FLAIR)序列提取影像特征建立SVM預(yù)測模型,預(yù)測ATRX(-)的病人的準確度、AUC、敏感度、特異度分別為91.67%、0.926、94.74%、88.24%,亦證明該SVM預(yù)測模型可實現(xiàn)無創(chuàng)性預(yù)測低級別膠質(zhì)瘤ATRX基因表達。O6-甲基鳥嘌呤-DNA甲基轉(zhuǎn)移酶(O6-methylguanine-DNA methyltransferase,MGMT)的甲基化與膠質(zhì)瘤的瘤周水腫相關(guān)[30]。MGMT有助于DNA修復(fù),甲基化MGMT則會抑制DNA修復(fù),從而導致膠質(zhì)母細胞瘤對化療藥耐受。Korfiatis等[31]根據(jù)這一理論依據(jù)提取相關(guān)影像學紋理特征,結(jié)合SVM及RF分類器實現(xiàn)了預(yù)測膠質(zhì)母細胞瘤MGMT甲基化狀態(tài),亦證明影像學有可能成為簡便易行的無創(chuàng)性膠質(zhì)母細胞瘤MGMT甲基化的生物標志物。染色體1p/19q聯(lián)合缺失的膠質(zhì)瘤的影像表現(xiàn)具有一定的特點[32],且1p/19q聯(lián)合缺失的低級別膠質(zhì)瘤病人治療反應(yīng)好,生存期更長。Akkus等[33]應(yīng)用CNN預(yù)測MR影像中膠質(zhì)瘤的1p/19q染色體表型狀態(tài),預(yù)測結(jié)果敏感度93.3%、特異度82.22%、準確度87.7%。
AI技術(shù)代替人工實現(xiàn)高效精準地從多模態(tài)影像中挖掘大量特征并進行定量分析,建立影像數(shù)據(jù)與臨床特征關(guān)系,定量分析微觀分子與基因變化,為腦膠質(zhì)瘤的個體化診斷及評估提供了新發(fā)展方向。但目前的AI仍停留在以影像組學大數(shù)據(jù)為基礎(chǔ)的“機器智能”的水平,尚有許多算法與模型有待進一步優(yōu)化與探索,而數(shù)據(jù)庫尚不完備等問題仍然存在。相信隨著醫(yī)學影像學數(shù)據(jù)的不斷積累和標準化,以及各類圖像分割、特征提取等方法的迅速發(fā)展,AI技術(shù)實現(xiàn)真正的“人工智能”將會走向臨床實現(xiàn)輔助診斷和精準醫(yī)療。