陳緒珠,馬軍
影像組學(xué)是指從醫(yī)學(xué)圖像中提取高通量定量特征從而實(shí)現(xiàn)對(duì)腫瘤表型的綜合量化,也就是用量化的影像學(xué)特征反映腫瘤的表型[1-4]。本文就影像組學(xué)在醫(yī)學(xué)影像數(shù)據(jù)的應(yīng)用原理和在腦膠質(zhì)瘤的應(yīng)用現(xiàn)狀、存在的問(wèn)題及發(fā)展前景進(jìn)行綜述。
作為放射學(xué)、計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)等多學(xué)科交叉的產(chǎn)物,影像組學(xué)的產(chǎn)生既有現(xiàn)實(shí)的主觀需求,也有客觀條件為基礎(chǔ)。主觀上,影像學(xué)的現(xiàn)狀是量化的數(shù)據(jù)非常有限,對(duì)圖像的解讀主要依靠專(zhuān)業(yè)人員的視覺(jué)評(píng)價(jià),結(jié)果往往是描述性、主觀和非定量的。因此,客觀、定量評(píng)價(jià)醫(yī)學(xué)圖像具有迫切的現(xiàn)實(shí)需求??陀^上,醫(yī)學(xué)成像設(shè)備硬件和軟件的改進(jìn)、醫(yī)院數(shù)字化的發(fā)展、電子病歷的使用、圖像存儲(chǔ)與傳輸系統(tǒng)(picture archiving and communication system,PACS)的便捷和數(shù)學(xué)算法的進(jìn)步以及計(jì)算機(jī)能力的提高,使得高通量提取數(shù)字信息成為可能,這為影像組學(xué)的產(chǎn)生提供了現(xiàn)實(shí)基礎(chǔ)和硬件支撐。另一方面,在大數(shù)據(jù)時(shí)代,醫(yī)學(xué)研究和臨床數(shù)據(jù)科學(xué)的新領(lǐng)域正在形成,多學(xué)科交叉的應(yīng)用使得多種數(shù)據(jù)資源的融合以實(shí)現(xiàn)個(gè)體化診斷和治療成為可能,這為影像組學(xué)提供了具體的應(yīng)用前景。
影像組學(xué)處理的數(shù)據(jù)盡可能標(biāo)準(zhǔn)化,這就要求獲取數(shù)據(jù)的機(jī)器型號(hào)盡量統(tǒng)一,掃描所用的參數(shù)要有較好的一致性。影像組學(xué)的工作流程大體分4步:圖像的獲取、感興趣區(qū)(region of interest,ROI)分割、特征提取、建模及有效性驗(yàn)證(圖1)。圖像的獲取和ROI分割為影像檢查和診斷領(lǐng)域,特征提取牽涉到計(jì)算機(jī)視覺(jué),提取前可有圖像預(yù)處理和濾過(guò),但不是必須的[5]。模型的建立和驗(yàn)證涉及機(jī)器學(xué)習(xí)或人工智能,因此影像組學(xué)為多學(xué)科交叉的產(chǎn)物。圖像可來(lái)自超聲、CT、MRI及正電子發(fā)射計(jì)算機(jī)斷層顯像(positron emission tomography,PET),其中CT和PET的應(yīng)用較MRI廣泛。ROI分割分為手動(dòng)分割、半自動(dòng)分割及自動(dòng)分割3種,以高水平的閱片者進(jìn)行手動(dòng)分割最準(zhǔn)確,但是耗時(shí)且有個(gè)體差異,用軟件進(jìn)行自動(dòng)分割減輕了人力負(fù)擔(dān),但是不能用于病理狀態(tài)下,尤其是腫瘤邊界不清時(shí)[1,5-8]。特征提取是借助計(jì)算機(jī)視覺(jué),在像素水平上將圖像轉(zhuǎn)化為大量量化的數(shù)據(jù)再進(jìn)行分類(lèi)和分析。這些特征分為不同的類(lèi)型:形狀特征、一階統(tǒng)計(jì)、二階統(tǒng)計(jì)及高階統(tǒng)計(jì)輸出[1]。形狀特征主要依賴(lài)所用的分割方法,指標(biāo)包括大小、形狀等;一階統(tǒng)計(jì)來(lái)自圖像像素強(qiáng)度的柱狀圖,主要體現(xiàn)像素值的分布而不考慮它們的空間關(guān)系,常以直方圖為基礎(chǔ),產(chǎn)生的指標(biāo)有平均值、標(biāo)準(zhǔn)差、熵、偏態(tài)峰及正態(tài)峰等;二階統(tǒng)計(jì)即紋理或灰度變量特征,主要體現(xiàn)分割的區(qū)域內(nèi)相同灰度或強(qiáng)度像素間的空間關(guān)系,反映病變的異質(zhì)性[5,8],多用于模式識(shí)別中;高階統(tǒng)計(jì)是利用過(guò)濾網(wǎng)格提取圖像的重復(fù)性或非重復(fù)性模型,常用的濾過(guò)有拉普拉斯算法的高斯濾過(guò)、Gabor濾過(guò)、小波變換及分形維數(shù)。影像組學(xué)模型的建立和驗(yàn)證需要足夠量的數(shù)據(jù)才能完成,采用的方法有無(wú)監(jiān)督ML分析(采用熱點(diǎn)圖或聚類(lèi)分析,從數(shù)據(jù)中尋找自然結(jié)構(gòu)特征,不預(yù)設(shè)數(shù)據(jù)標(biāo)簽);監(jiān)督ML分類(lèi)器,如通用線性模型、隨機(jī)森林法、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等;介于兩者之間的半監(jiān)督學(xué)習(xí)[5,9]。半監(jiān)督學(xué)習(xí)為特定任務(wù)設(shè)計(jì),用于類(lèi)別標(biāo)簽不明確時(shí)。正則化法用于控制模型的復(fù)雜度,避免過(guò)度擬合(為遷就樣本而使用多度復(fù)雜的函數(shù))。交叉驗(yàn)證常用于內(nèi)部驗(yàn)證,多使用受試者操作特征曲線下的面積進(jìn)行準(zhǔn)確性評(píng)價(jià)。
影像組學(xué)特征提取用的軟件有免費(fèi)的開(kāi)放軟件和商業(yè)化軟件兩大類(lèi),各種不同軟件的具體情況見(jiàn)表1。
神經(jīng)腫瘤的影像組學(xué)通過(guò)從影像陣列中提取定量信息,以加深對(duì)腦腫瘤的生物學(xué)行為和治療的理解,它的分析是以這樣的假說(shuō)為前提:腫瘤影像反映了腫瘤的形態(tài)學(xué)和微小尺度的生物學(xué)動(dòng)態(tài)變化,包括基因表達(dá)、瘤細(xì)胞增生和血管形成等。不同的組學(xué)量化標(biāo)簽具有不同的應(yīng)用價(jià)值(表2)。
影像組學(xué)特別適于評(píng)價(jià)高級(jí)別膠質(zhì)瘤,主要用于病變的診斷、預(yù)后判斷和療效評(píng)估等方面。在膠質(zhì)瘤的診斷方面,可細(xì)分為鑒別診斷、腫瘤基因表達(dá)狀態(tài)的判斷等。具體地說(shuō),膠母的影像組學(xué)特征可區(qū)分放射性壞死和腫瘤復(fù)發(fā),預(yù)測(cè)患者生存期的長(zhǎng)短等。Wu等[10]借助于影像組學(xué)方法實(shí)現(xiàn)了膠質(zhì)母細(xì)胞瘤和原發(fā)性中樞神經(jīng)系統(tǒng)淋巴瘤的鑒別。Li等[11]利用影像組學(xué)方法對(duì)膠質(zhì)母細(xì)胞瘤的MGMT甲基化進(jìn)行了預(yù)測(cè),準(zhǔn)確率高達(dá)80%。Rathore等[12]對(duì)膠質(zhì)母細(xì)胞瘤瘤周水腫區(qū)進(jìn)行影像組學(xué)分析后發(fā)現(xiàn),該方法能有效判斷腫瘤復(fù)發(fā)。以Li等[13]為首的研究團(tuán)隊(duì)和德國(guó)的Kickingereder等[14]研究小組借助于影像組學(xué)分析,各自實(shí)現(xiàn)了對(duì)膠質(zhì)母細(xì)胞瘤患者的預(yù)后判斷。
表1 影像組學(xué)分析軟件包(截至2016年8月)Tab. 1 Currently available software packages for radiomics analysis (August 2016)
表2 腦腫瘤影像組學(xué)的量化特征及其臨床意義Tab. 2 Examples of quantitative features with their potential clinical relevance
對(duì)膠母的影像組學(xué)研究,圖像采集多為MRI常規(guī)序列:T2WI、FLAIR及增強(qiáng)掃描T1WI。增強(qiáng)圖像能顯示腫瘤的大體邊界,及早發(fā)現(xiàn)小的轉(zhuǎn)移灶,且自增強(qiáng)掃描T1WI圖像提取的特征對(duì)膠質(zhì)瘤患者預(yù)后判斷價(jià)值高于平掃的T2WI圖像數(shù)據(jù),因此影像組學(xué)分析常集中在增強(qiáng)圖像上[9]。
截至2018年4月8日,在pubmed上輸入關(guān)鍵詞“radiomics AND glioma”檢索到19篇文獻(xiàn),輸入關(guān)鍵詞“radiomics AND glioblastoma”得到26篇文獻(xiàn),去掉重疊部分,共40篇文獻(xiàn)。這些文獻(xiàn)的研究?jī)?nèi)容依次是:基因(蛋白)表達(dá)的預(yù)測(cè)(32.5%,13/40)、患者的預(yù)后判斷(20%,8/40)、綜述(15%,6/40)、組學(xué)方法的改進(jìn)(12.5%,5/40)、病變的診斷(10%,4/40)、病理分級(jí)(5%,2/40)和療效評(píng)估(5%,2/40)。從文章所在雜志的層次上看,按照2017年度的MedSci (http://www.medsci.cn/sci/)查詢(xún)結(jié)果,除了5篇文獻(xiàn)為非Science Citation Index (SCI)雜志外,SCI影響因子3~4.9分的文獻(xiàn)有17篇,影響因子<3分的有12篇,≥5分的文獻(xiàn)有6篇。從文章發(fā)表年份上看,2015年1篇,2016年6篇,2017年22篇,2018年(1月至4月8日)11篇。上述文獻(xiàn)的第一作者所在地分別為中國(guó)(40%,16/40)、美國(guó)(30%,12/40)、歐洲(20%,8/40)和韓國(guó)(10%,4/40)。
對(duì)上述文獻(xiàn)進(jìn)一步分析表明,腦膠質(zhì)瘤的影像組學(xué)研究特點(diǎn)是起步較晚,發(fā)展迅速;研究?jī)?nèi)容相對(duì)集中(基因或蛋白表達(dá)的判斷、預(yù)后判斷、診斷與鑒別診斷3個(gè)方向占比62.5%);高水平的研究較少(雜志影響因子≥5分僅占15%)[6-7,9,15-18]及研究者群體相對(duì)集中(中國(guó)、美國(guó)、歐洲占90%)。對(duì)中國(guó)學(xué)者而言,對(duì)膠質(zhì)瘤的影像組學(xué)研究特點(diǎn)是跟蹤應(yīng)用能力較強(qiáng)(40%的比率,位居第一);研究的科學(xué)問(wèn)題仍在國(guó)外同行的研究范圍內(nèi)(膠質(zhì)瘤分級(jí)1篇,基因表達(dá)9篇,方法改進(jìn)1篇,診斷3篇,預(yù)后判斷2篇),有待創(chuàng)新;投稿的目標(biāo)雜志相對(duì)集中(Journal of Magnetic Resonance Imaging 3篇[19-21],European Radiology 4篇[11,22-24],2種雜志占比43.7%);研究水平有待提高(論文發(fā)表的雜志影響因子3~4.9分11篇,占68.8%,≥5分 0篇)。
目前的研究多為回顧性的,無(wú)前瞻性研究。當(dāng)前影像數(shù)據(jù)以像素為基礎(chǔ)的分析需要對(duì)腫瘤進(jìn)行整體分割,這是該方法研究和臨床應(yīng)用的瓶頸。此外,機(jī)器學(xué)習(xí)的發(fā)展和驗(yàn)證需要大量的、注釋完好的數(shù)據(jù)庫(kù),因此,多學(xué)科的努力和多中心的合作是必要的。對(duì)影像數(shù)據(jù)的質(zhì)量評(píng)價(jià)是非常重要的,因?yàn)檫@直接影響影像組學(xué)結(jié)果的準(zhǔn)確性。多種數(shù)據(jù)來(lái)源(如不同的醫(yī)療機(jī)構(gòu))、不同的數(shù)據(jù)類(lèi)型(如多種成像參數(shù)的數(shù)據(jù))使得分享和集中管理這些數(shù)據(jù)成為復(fù)雜的問(wèn)題。另外,影像組學(xué)的結(jié)果難以比較,因?yàn)槿狈?biāo)準(zhǔn)化的方法來(lái)引導(dǎo)圖像的定量分析。因此,將不同成像方案和參數(shù)的數(shù)據(jù)標(biāo)準(zhǔn)化是必要的。影像組學(xué)臨床應(yīng)用的挑戰(zhàn)在于圖像采集方案的標(biāo)準(zhǔn)化、準(zhǔn)確的圖像配準(zhǔn)和腫瘤分割。
總之,影像組學(xué)為腦膠質(zhì)瘤的影像學(xué)研究提供了全新的方法,該方法能從現(xiàn)有的影像資料中提取大量的量化信息,極大提升了現(xiàn)有成像模式的價(jià)值。未來(lái)隨著自身的進(jìn)一步完善,影像組學(xué)將在膠質(zhì)瘤的研究中發(fā)揮更大作用。