楊浩然,馬密密,曹新山
近年來(lái),隨著標(biāo)準(zhǔn)化掃描協(xié)議和人工智能的不斷發(fā)展,從圖像中獲取更多定量信息以實(shí)現(xiàn)自動(dòng)化和可重復(fù)性分析成為了一種可能,因此影像組學(xué)應(yīng)運(yùn)而生。影像組學(xué)是一個(gè)新興的醫(yī)工交叉研究領(lǐng)域,其概念最早由荷蘭學(xué)者Lambin等[1]于2012年提出,即從醫(yī)學(xué)圖像中提取高通量特征,采用計(jì)算機(jī)算法將影像學(xué)數(shù)據(jù)轉(zhuǎn)化為具有高分辨率的可挖掘數(shù)據(jù)空間的學(xué)科。
原發(fā)性肝癌是我國(guó)目前第4 位常見(jiàn)惡性腫瘤及第2 位腫瘤致死病因。其中肝細(xì)胞癌(hepatocellular carcinoma,HCC)占75%~85%[2]。肝癌在空間和時(shí)間上是異質(zhì)性的,侵入性檢查不能提供全面信息,肝細(xì)胞癌的診斷特別是早期診斷在較大程度上依靠無(wú)創(chuàng)影像[3-4],新興的影像組學(xué)尤其是基于影像組學(xué)的肝細(xì)胞癌多中心研究逐步開(kāi)展并取得了較大成績(jī)。
本文基于影像組學(xué)的肝細(xì)胞癌多中心研究最新進(jìn)展進(jìn)行綜述。
從計(jì)算機(jī)輔助診斷系統(tǒng)到影像組學(xué),是一個(gè)圖像可轉(zhuǎn)換量化數(shù)據(jù)不斷增多,醫(yī)學(xué)成像數(shù)據(jù)信息整合程度不斷加深的過(guò)程。影像組學(xué)的本質(zhì)是對(duì)擁有高通量特征的醫(yī)學(xué)圖像進(jìn)行定量化分析[5]。由于惡性腫瘤在空間和時(shí)間上的異質(zhì)性[6],穿刺活檢等有創(chuàng)檢查不能體現(xiàn)腫瘤的預(yù)后及預(yù)測(cè)治療反應(yīng)等信息。目前臨床上需要精確分層,對(duì)常規(guī)影像學(xué)數(shù)據(jù)量化分析主要是惡性腫瘤。從圖像中提取影像組學(xué)特征,設(shè)置算法對(duì)數(shù)據(jù)進(jìn)行分類(lèi),根據(jù)數(shù)據(jù)之間潛在的關(guān)系生成復(fù)雜的推斷,學(xué)習(xí)數(shù)據(jù)中的模式,利用學(xué)習(xí)的模式進(jìn)行決策,總結(jié)出診斷性實(shí)驗(yàn)?zāi)P汀_@個(gè)過(guò)程被定義為機(jī)器學(xué)習(xí)[7]。隨著算法的改進(jìn),深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的分支逐步應(yīng)用于醫(yī)學(xué)領(lǐng)域[8]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是深度算法的一種,其結(jié)構(gòu)類(lèi)似于生物神經(jīng)系統(tǒng),可以自動(dòng)從數(shù)據(jù)中學(xué)習(xí)區(qū)分特征,模仿人進(jìn)行決策,推進(jìn)了組學(xué)模型臨床應(yīng)用的進(jìn)程[9]。
影像組學(xué)是圖像分析,圖像是基礎(chǔ),標(biāo)準(zhǔn)化高質(zhì)量影像圖像的獲取與重建是影像組學(xué)研究的先決條件[10],絕大多數(shù)影像組學(xué)研究是在單一醫(yī)療科研機(jī)構(gòu)中進(jìn)行,這固然可以降低因掃描機(jī)型及參數(shù)不一致等因素造成的圖像所攜帶組學(xué)特征信息誤差,卻也降低了研究的可重復(fù)性與泛化能力[11]。確定影像組學(xué)模型潛在臨床價(jià)值,開(kāi)展大型多中心研究成為熱點(diǎn),它是實(shí)現(xiàn)影像組學(xué)方法向臨床環(huán)境更快轉(zhuǎn)移的重要途徑和目標(biāo)。
多中心研究指由多個(gè)單位的研究者合作,按同一個(gè)方案同時(shí)進(jìn)行的研究。它的主要優(yōu)點(diǎn)是具有更大的數(shù)據(jù)集和從不同樣本中獲得的結(jié)果具有更高的統(tǒng)計(jì)相關(guān)性。然而從幾個(gè)中心收集數(shù)據(jù)是復(fù)雜的,無(wú)論圖像是本地存儲(chǔ)還是利用分布式學(xué)習(xí)[12]存儲(chǔ)和分析在一個(gè)中央數(shù)據(jù)庫(kù)、掃描器模型、采集協(xié)議和重建設(shè)置的可變性在目前的臨床實(shí)踐中是不可避免的。大多數(shù)組學(xué)特征已被證明對(duì)這些因素的變化敏感[13]。將它們集中起來(lái)進(jìn)行統(tǒng)計(jì)分析并建立的模型要么隱藏現(xiàn)有的相關(guān)性,要么產(chǎn)生錯(cuò)誤發(fā)現(xiàn)[14]。因此不同成像方案之間不能立即進(jìn)行比較,需要協(xié)調(diào)策略對(duì)各獨(dú)立數(shù)據(jù)進(jìn)行整合,這類(lèi)協(xié)調(diào)策略簡(jiǎn)稱(chēng)為標(biāo)準(zhǔn)化,它的實(shí)現(xiàn)形式可以分為兩個(gè)思路,一種旨在消除或減少在組學(xué)特征提取之前圖像之間的差異,方法是圖像標(biāo)準(zhǔn)化;另一種旨在消除或減少提取特征和提取特征后特征之間的差異,方法是修改算法或后驗(yàn)處理。前者對(duì)應(yīng)了圖像域協(xié)調(diào)策略,包括標(biāo)準(zhǔn)化成像,特定條件下的規(guī)范化合并,以及圖像預(yù)處理。后者對(duì)應(yīng)了特征域協(xié)調(diào)策略,可分為根據(jù)可靠性選擇組學(xué)特征和去除無(wú)關(guān)因素校正方法。上述協(xié)調(diào)策略各有其優(yōu)勢(shì)與不足,可根據(jù)臨床實(shí)踐單獨(dú)或聯(lián)合應(yīng)用于影像組學(xué)多中心研究。
影像組學(xué)在肝細(xì)胞癌診斷和與其他肝臟疾病鑒別上顯示出了較大潛力[15]。王禹博等[16]用擴(kuò)散加權(quán)成像建立的影像組學(xué)特征模型對(duì)肝細(xì)胞癌和肝血管瘤進(jìn)行鑒別。Gu等[17]使用支持向量機(jī)建立MRI 組學(xué)列線圖模型識(shí)別肝細(xì)胞癌潛在標(biāo)志物。上述模型實(shí)現(xiàn)臨床應(yīng)用還需要驗(yàn)證,但它們提供了一個(gè)思路,即通過(guò)MRI 影像組學(xué)多中心研究訓(xùn)練一種精準(zhǔn)診斷肝細(xì)胞癌的無(wú)創(chuàng)手段[18]。
術(shù)前的病理分級(jí)預(yù)測(cè)是對(duì)腫瘤治療方式進(jìn)行評(píng)估選擇的有效手段。許露露等[19]、Hui 等[20]用紋理分析比較術(shù)前MRI 紋理與肝細(xì)胞癌的相關(guān)性,推測(cè)肝細(xì)胞癌的早期復(fù)發(fā)。基于影像組學(xué)評(píng)估肝癌病理特征[21],可指導(dǎo)臨床作出合理的治療選擇。微血管浸潤(rùn)(microvascular invasion,MVI)是手術(shù)切除后復(fù)發(fā)因素之一,目前只能通過(guò)術(shù)后病理切片診斷。段亞陽(yáng)等[22]、Jiang 等[23]使用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法,建立多組結(jié)合模型預(yù)測(cè)MVI 狀態(tài)。兩組研究均驗(yàn)證了瘤周特征對(duì)預(yù)測(cè)MVI 的重要影響,也提及當(dāng)前MVI 組學(xué)研究的局限,為開(kāi)展多中心研究拓展了思考方向。
借鑒影像組學(xué)研究臨床意義,結(jié)合多中心研究改進(jìn)驗(yàn)證,是開(kāi)展多中心研究的重要方式。具有潛在臨床應(yīng)用意義的肝細(xì)胞癌術(shù)后預(yù)測(cè)分為兩個(gè)方向,一是預(yù)測(cè)肝癌早期復(fù)發(fā)和術(shù)后生存期。李琳等[24]用支持向量機(jī)、隨機(jī)森林[25]等機(jī)器學(xué)習(xí)方法對(duì)影響患者生存和復(fù)發(fā)的因素做了分析解釋?zhuān)琙hang 等[26]、Huang等[27]開(kāi)發(fā)釓塞酸增強(qiáng)MRI組學(xué)特征模型,對(duì)肝癌術(shù)后發(fā)展進(jìn)行預(yù)測(cè)。另一個(gè)是探究經(jīng)導(dǎo)管肝動(dòng)脈化療栓塞術(shù)(transcatheter arterial chemoembolization,TACE)后肝癌患者預(yù)后情況。Sun 等[28]基于術(shù)前多參數(shù)MRI 提取組學(xué)特征,建立影像組學(xué)模型提示TACE 治療的預(yù)后情況。Song 等[29]建立增強(qiáng)MRI 影像組學(xué)-臨床聯(lián)合模型(clinical radiomics combination,CRC)預(yù)測(cè)術(shù)后復(fù)發(fā)情況。
肝細(xì)胞癌多發(fā)生在肝硬化患者中,影像組學(xué)作為無(wú)創(chuàng)性肝硬化結(jié)節(jié)的良惡性鑒別方法,對(duì)HCC 的篩查、評(píng)估和治療具有重要價(jià)值。Mokrane 等[30]選擇來(lái)自27 個(gè)機(jī)構(gòu)的178 個(gè)肝硬化病例,經(jīng)圖像標(biāo)準(zhǔn)化處理后,對(duì)多期肝硬化結(jié)節(jié)分割提取特征,使用機(jī)器學(xué)習(xí)方法對(duì)特征進(jìn)行篩選,建立模型。訓(xùn)練后的組學(xué)模型經(jīng)過(guò)多折交叉實(shí)驗(yàn)驗(yàn)證,展現(xiàn)了在多中心環(huán)境中的良好效能。該模型能夠適用多中心研究有一個(gè)關(guān)鍵因素是掃描采集參數(shù)雖存在不同,但在分割和門(mén)靜脈造影增強(qiáng)方面,在動(dòng)脈期和門(mén)靜脈期之間變化中結(jié)節(jié)的某一影像組學(xué)特征是穩(wěn)定的。值得注意的是,本研究模型診斷效能主要體現(xiàn)在一個(gè)組學(xué)特征,該特征區(qū)分良惡性病變有較高的準(zhǔn)確率,但肝癌與其他惡性腫瘤存在重疊。后續(xù)研究可以通過(guò)引入非影像組學(xué)參數(shù),增加模型維度。
MVI是肝細(xì)胞癌手術(shù)切除后長(zhǎng)期生存和復(fù)發(fā)的重要指標(biāo),因此準(zhǔn)確評(píng)估MVI在監(jiān)測(cè)HCC預(yù)后中意義重大。Zhang等[31]納入了來(lái)自?xún)蓚€(gè)獨(dú)立機(jī)構(gòu)的637例患者。使用Z-scores方法對(duì)測(cè)試集和獨(dú)立驗(yàn)證集的特征根據(jù)訓(xùn)練隊(duì)列的均值和標(biāo)準(zhǔn)差進(jìn)行歸一化,以消除特征之間價(jià)值尺度不一帶來(lái)的差異。在多中心試驗(yàn)中,試驗(yàn)者為了使用來(lái)自不同獨(dú)立機(jī)構(gòu)的數(shù)據(jù),使用了歸一化方法。對(duì)每個(gè)數(shù)據(jù)集的特征分別規(guī)格化,這樣做消除了數(shù)據(jù)集之間的特征變異性,構(gòu)造的影像組學(xué)特征不會(huì)過(guò)度擬合。并用多變量Logistic回歸開(kāi)發(fā)了預(yù)測(cè)MVI狀態(tài)和風(fēng)險(xiǎn)的兩個(gè)影像組學(xué)模型,得出灰度行距矩陣-長(zhǎng)行程高灰度強(qiáng)調(diào)度是預(yù)測(cè)MVI 的一個(gè)重要的跨模影像組學(xué)特征。該研究使用二維ROI 提取特征,缺少三維分段的相關(guān)信息,另外沒(méi)有對(duì)HCC 的形態(tài)學(xué)特征進(jìn)行評(píng)估。在未來(lái)的研究中應(yīng)嘗試比較二維和三維成像數(shù)據(jù)的MVI評(píng)價(jià)模型的預(yù)測(cè)性能。
術(shù)后復(fù)查是HCC 切除術(shù)后的患者主要死因,預(yù)后分級(jí)是個(gè)體化治療的關(guān)鍵,然而目前尚無(wú)公認(rèn)的HCC 風(fēng)險(xiǎn)分層方法。據(jù)Ji 等[32]了解的信息,其團(tuán)隊(duì)研究是第一個(gè)使用影像組學(xué)預(yù)測(cè)早期HCC手術(shù)切除后復(fù)發(fā)的多機(jī)構(gòu)研究,他們從3個(gè)獨(dú)立機(jī)構(gòu)收集了470 例患者提取的3384 個(gè)工程特征,使用聚合的機(jī)器學(xué)習(xí)框架確定了一個(gè)有3 個(gè)特征的影像組學(xué)模型。與不使用影像組學(xué)的競(jìng)爭(zhēng)模型和廣泛使用的分期系統(tǒng)相比,該模型結(jié)合臨床來(lái)源后準(zhǔn)確地預(yù)測(cè)了術(shù)前或術(shù)后HCC 的復(fù)發(fā),并可給出復(fù)發(fā)風(fēng)險(xiǎn)低、中、高的3 個(gè)風(fēng)險(xiǎn)層次,顯示了其優(yōu)越的預(yù)測(cè)性能。Wang 等[33]將201 例肝癌患者納入多中心研究,從術(shù)前MRI 中提取組學(xué)特征。采用隨機(jī)森林方法構(gòu)筑組學(xué)特征模型,開(kāi)發(fā)了一個(gè)結(jié)合組學(xué)特征和臨床危險(xiǎn)因素的影像組學(xué)模型。以上研究都強(qiáng)調(diào)了影像組學(xué)和現(xiàn)有變量的互補(bǔ)性,證明了使用多中心試驗(yàn)建立影像組學(xué)模型對(duì)肝細(xì)胞癌預(yù)后預(yù)測(cè)是可行的。外科醫(yī)生可據(jù)風(fēng)險(xiǎn)高低進(jìn)而選擇肝部分切除術(shù)或肝動(dòng)脈化療栓塞。Meng 等[34]的回顧性研究納入了接受TACE 作為初始治療的162例不可切除的初治HCC患者的多中心數(shù)據(jù),從動(dòng)脈期和門(mén)脈期的圖像的瘤內(nèi)和瘤周區(qū)域提取影像組學(xué)特征。使用最小絕對(duì)收縮和選擇算子方法(least absolute shrinkage and selection operator,LASSO)對(duì)組學(xué)特征降維,并在訓(xùn)練隊(duì)列中進(jìn)行特征歸一化,使用單因素多因素回歸分析確定組學(xué)特征和臨床生存因素之間的聯(lián)系,開(kāi)發(fā)了CRC模型。經(jīng)過(guò)一致性指數(shù)分析,驗(yàn)證了影像組學(xué)特征可以作為預(yù)測(cè)接受TACE 的HCC 患者預(yù)后情況的獨(dú)立生物學(xué)指標(biāo),結(jié)合臨床模型后預(yù)測(cè)效果表現(xiàn)更好。Jin 等[35]針對(duì)TACE 術(shù)后肝外播散和血管侵犯的預(yù)測(cè),引入了3 個(gè)機(jī)構(gòu)256 例接受TACE 作為首選治療的患者,提取組學(xué)特征后,對(duì)所有圖像重采樣標(biāo)準(zhǔn)化體素間距,使用固定bin 值離散化,以歸一化體素強(qiáng)度。該研究同樣建立了CRC 模型。根據(jù)決策曲線分析,該影像組學(xué)研究可以作為臨床判斷術(shù)后風(fēng)險(xiǎn)的工具提供可靠預(yù)測(cè)。值得一提的是,上述研究均未探討深度學(xué)習(xí)方法,深度學(xué)習(xí)可以根據(jù)臨床目標(biāo)自動(dòng)學(xué)習(xí)圖像中的特征表示。應(yīng)當(dāng)在以后的研究中引入深度學(xué)習(xí),提高多中心影像組學(xué)模型診斷效能。
最新的肝癌影像組學(xué)中多中心研究已經(jīng)涉及早期診斷和鑒別診斷、評(píng)估MVI、術(shù)后預(yù)測(cè)等方面。已經(jīng)囊括了影像組學(xué)研究的幾個(gè)主要方向,還具有多中心樣本建模的高魯棒性和外部驗(yàn)證的強(qiáng)可重復(fù)性等優(yōu)勢(shì)。筆者總結(jié)影像組學(xué)現(xiàn)有應(yīng)用,思考開(kāi)展多中心研究的實(shí)用性和可行性。基于MRI 的肝癌影像組學(xué)多中心研究還較少,這可能受限于MRI 在肝癌診斷中的應(yīng)用少于多期增強(qiáng)CT檢查和不同機(jī)構(gòu)MRI序列參數(shù)的不統(tǒng)一。本研究列舉了部分多中心研究的協(xié)調(diào)策略,諸如標(biāo)準(zhǔn)化成像、圖像規(guī)范化合并、Z-score 特征選擇等。在機(jī)器學(xué)習(xí)的訓(xùn)練過(guò)程中,圖像預(yù)處理也是一種常見(jiàn)標(biāo)準(zhǔn)化方法,在相同尺度的特征下,機(jī)器學(xué)習(xí)具有更好的表現(xiàn)。經(jīng)多中心訓(xùn)練組內(nèi)外部驗(yàn)證,這些方法表現(xiàn)出消除不同數(shù)據(jù)集之間特征變異性的優(yōu)勢(shì)。建立的多中心組學(xué)模型,與臨床因素結(jié)合后對(duì)預(yù)測(cè)效果的提升,可以看到選擇協(xié)調(diào)策略在多中心研究的潛在作用。這就為影像組學(xué)結(jié)合臨床提供了良好的條件。
開(kāi)展大型多中心研究是加快影像組學(xué)方法在臨床應(yīng)用的關(guān)鍵。然而,現(xiàn)有肝癌影像組學(xué)多中心的研究確存在一定局限性。在數(shù)據(jù)層面,部分研究存在選擇偏倚,影響整合數(shù)據(jù)的可信度。在工程層面,復(fù)雜的算法涉及工學(xué)領(lǐng)域,臨床醫(yī)生等獨(dú)立研究人員無(wú)法對(duì)模型校準(zhǔn)和改進(jìn)。由此可見(jiàn),影像組學(xué)擴(kuò)展到臨床仍有許多問(wèn)題亟待解決,需要放射科醫(yī)生與多學(xué)科研究人員密切配合。未來(lái),隨著成像標(biāo)準(zhǔn)化協(xié)議的普及,以及機(jī)器學(xué)習(xí)、多中心數(shù)據(jù)融合技術(shù)的發(fā)展,擁有高效、無(wú)創(chuàng)等優(yōu)勢(shì)的影像組學(xué)方法將有望優(yōu)化肝癌醫(yī)療決策,造?;颊摺?/p>
作者利益沖突聲明:全體作者均聲明無(wú)利益沖突。