石晟銘,肖玲清,馬佳琪,劉晗,武玉鵬,李曉夫*
直腸癌(rectal cancer, RC)是全球最常見的癌癥之一,在所有胃腸道腫瘤中的發(fā)病率居于第二位,也是世界上第三大癌癥相關死亡原因[1]。RC 的精確化診治對提高RC 患者的遠期生存至關重要[2]。MRI作為RC 的重要影像學檢查之一,能夠清晰顯示腫瘤的形態(tài)與位置、淋巴結狀態(tài)、壁外血管浸潤和直腸系膜筋膜受累等。但是僅依靠常規(guī)MRI的形態(tài)學特征仍不足以反映腫瘤的異質性特征,無法制訂個體化治療策略,而如彌散加權成像(diffusion weighted imaging,DWI),體 素 內 不 相 干 運 動(intravoxel incoherent motion, IVIM)和彌散峰度成像(diffusion kurtosis imaging, DKI)等功能MRI雖能在一定程度上反映病變內的生物病理信息,但其可重復性和可再現(xiàn)性還有待進一步提高[3]。因此,開發(fā)一種圖像挖掘的新方法,以實現(xiàn)RC 的準確診斷和治療是一個巨大的挑戰(zhàn)。近年來,隨著人工智能(artificial intelligence, AI)技術的迅速發(fā)展,以深度學習(deep learning, DL)為代表的機器學習越來越多地應用于醫(yī)學領域[4-6],DL可以對大量的RC 圖像進行深度挖掘和分析,并將其與臨床結果結合,從而提高對RC 的診斷準確性和效率。利用DL 技術對RC 進行術前診斷具有重要的臨床意義。然而,目前尚未有系統(tǒng)的研究綜合評估DL技術在RC 預測方面的應用,因此我們對預測模型的整體效果尚不清楚。本文從評估RC 分期、治療反應、RC 分割和基因分型四個方面入手,總結了基于MRI的DL在RC研究方面的進展,旨在優(yōu)化RC患者的診療策略制訂,并對未來的科研方向提出展望。
DL 是機器學習的一種,最早由機器學習大師HINTON 等[7]在2006年提出。DL 的本質是構建含有多隱層的機器學習架構模型,通過大規(guī)模數(shù)據(jù)進行訓練,得到大量具有代表性的特征信息,從而對樣本進行分類和預測[8]。其工作流程一般可以分為三個階段:(1)圖像數(shù)據(jù)的預處理;(2)模型訓練、驗證和測試;(3)模型評估[9]。其中圖像數(shù)據(jù)預處理是DL 的核心工作,包括降噪、數(shù)據(jù)歸一化、特征選擇和提取[10]。良好的模型其穩(wěn)定性更好,采用多中心測試集,其目的是評估模型的泛化能力,有助于模型的推廣。為了訓練模型,通常將模型分為三個部分:訓練集,驗證集和測試集。訓練集能夠使模型學習擬合分類器的數(shù)據(jù)參數(shù),驗證集用于防止過擬合,而測試集用于評估模型的性能。最后模型評估用來確定該模型是否可以很好地實現(xiàn)研究目標。
目前DL 的發(fā)展較為迅速,已在語音識別、人臉識別、圖像分類等方面取得顯著進展。自2015 年以來,人們發(fā)現(xiàn)使用基于醫(yī)學成像技術的AI 模型可通過增強目視能力以達到比放射科醫(yī)生更低的錯誤率[11]。與傳統(tǒng)的機器學習技術不同,DL 不需要操作人員手動提取和選擇特征,其可以直接處理原始數(shù)據(jù)并自動識別自己所需要的特征[12]。在算法應用方面,目前幾種典型的DL 算法主要包括卷積神經網絡(convolutional neural networks, CNN)、循環(huán)神經網絡(recurrent neural network, RNN)、生成對抗網絡(generative adversarial network, GAN)和深度強化學習(deep reinforcement learning, DRL)[13-14]。
MRI 因具有良好的軟組織分辨率及較高的空間分辨率,目前已經成為術前RC 分期評估的重要影像檢查方式[15]。隨著影像學技術的不斷進步,RC 術前診斷的準確性大大提高。但不同醫(yī)院的放射科醫(yī)生診斷水平不同,會導致MRI 圖像的結果判讀受到影響。近年來,DL 技術在圖像閱讀方面的發(fā)展為此提供了新的解決方法[16]。WU 等[17]使用基于區(qū)域的快速卷積神經網絡(faster region-based convolutional neural networks, Faster R-CNN)來構建RC 的T 分期自動診斷平臺。該平臺在每個掃描平面的每個階段都展現(xiàn)出良好的性能,受試者工作特性(receiver operator characteristic, ROC)曲線下面積(area under the curve, AUC)在水平面為0.99,矢狀面為0.97,冠狀面為0.98。Faster R-CNN 的診斷平臺在RC 的T 分期診斷方面達到了專業(yè)放射科醫(yī)生的水準,但是該研究僅將模型應用于T2WI序列,添加其他序列是否可以提高DL 模型的分類精度,有待進一步研究。在一項回顧性研究中,WEI等[18]構建基于多參數(shù)(DCE、T2WI和DWI)卷積神經網絡的DL 模型,并與單參數(shù)DL 模型、臨床模型和放射科醫(yī)師診斷模型進行對照。最終多參數(shù)模型的AUC 為0.854,顯著高于放射科醫(yī)師診斷模型(AUC 為0.678)、臨床模型(AUC 為0.747)和單參數(shù)DL 模型,包括T2WI 模型(AUC 為0.735)、DWI 模型(AUC 為0.759)和DCE 模型(AUC為0.789)。淋巴結轉移(lymph node metastasis,LNM)的預測及評估一直以來都是研究熱點。常規(guī)MRI 形態(tài)學:如淋巴結的大小、形狀和邊緣,均不足以對LNM 做出準確診斷。為預測T1~T2 期RC 患者的LNM,WAN 等[19]建立了基于T2WI 圖像的四個二維和三維的殘差網絡(ResNet 18,ResNet 50,ResNet 101和ResNet 152)DL模型,并進行訓練和測試,以識別LNM。研究表明,基于3D 網絡架構的ResNet 101 模型在預測LNM 方面展現(xiàn)出最佳性能(AUC 為0.79),顯著高于放射醫(yī)師(AUC為0.54),該模型在預測T1~T2期RC患者的LNM方面優(yōu)于放射科醫(yī)生。
從上述幾項研究中可以看出,基于不同感興趣區(qū)(region of interest, ROI)和不同MRI 序列的AI 在評估RC 患者的T 分期方面表現(xiàn)出了良好的性能,有望成為術前T分期的重要工具之一。然而,這些研究中的MRI 圖像都是在單中心的3.0 T MRI 掃描設備上獲取的,這可能限制了模型的推廣性。
新輔助治療(neoadjuvant therapy, NAT)是局部晚期直腸癌(locally advanced rectal cancer, LARC)患者標準治療的必要組成部分,用于降低原發(fā)腫瘤的分期和手術切除后局部復發(fā)的風險,并可改善預后。隨著不同NAT 方案的應用,大約10%~30%的LARC患者可能出現(xiàn)病理完全緩解(pathologic complete response, pCR),臨床、內鏡和放射學建議對上述患者實行觀察和等待策略,以避免手術切除帶來的不良并發(fā)癥影響[20]。FU 等[21]從患者的高分辨率T2WI 和DWI 圖像中提取放射組學特征,開發(fā)了基于機器學習和DL 的放射組學模型,并將它們與臨床特征相結合,用于預測腫瘤殘留。結果顯示,臨床+DWI+DL模型的預測效果最好(準確度84%±5%,敏感度94%±13%,特異度79%±4%)。這種方法可以作為一種術前評估工具,以協(xié)助臨床醫(yī)生在術前階段對RC 患者進行病情評估并制訂精確的個性化治療計劃。在一項預測RC 遠處轉移(distant metastasis, DM)的研究中,LIU[22]回顧收集了235 例接受新輔助放化療(neoadjuvant chemoradiotherapy, nCRT)的患者,通過遷移學習,構建了基于多參數(shù)MRI的DL放射組學模型。將深部MRI信息與臨床病理因素結合起來構建列線圖,以獲得更好的預測結果。在驗證集中,C指數(shù)為0.747,3年時遠處無轉移生存期的AUC為0.894,這表明DL放射組學模型在預測DM方面表現(xiàn)良好,顯示其在預測接受nCRT的LARC患者的DM方面具有很大的潛力。在一項多中心研究中,JIANG等[23]收集了三個獨立的患者隊列,使用ViT 技術來構建DL 模型用于預測NAT后RC患者的生存率,在內部測試集的高風險組中最佳模型的風險比為3.0,在外部測試集中為2.3,并且構建多模態(tài)模型進一步提高了模型性能。結果表明,該模型能夠預測RC 患者的生存率,并可作為術前風險分層工具。
預測NAT 后LARC 患者的pCR 已成為當下研究的熱點,JANG 等[24]基于放化療后的T2WI圖像,開發(fā)了兩個DL 模型,分別用于預測pCR 和完全緩解(complete response, CR)。在測試集中評估DL 模型的預測性能,并與高年資放射科醫(yī)生和放射腫瘤科醫(yī)生的預測結果進行比較。結果顯示該模型預測pCR 的AUC、敏感度、特異度、陽性預測值、陰性預測值和準確度分別為0.76、30%、96%、67%、87% 和85%,預測CR 方面分別為0.72、54%、81%、60%、77%和71.7%。研究發(fā)現(xiàn)與觀察醫(yī)生相比,DL 模型在預測pCR 和CR 方面表現(xiàn)出更好的性能。此外,還有很多DL 模型[25-27]已被開發(fā)用來預測NAT 后LARC 患者的pCR,并且都展現(xiàn)出較好的性能。
因此,可以得出結論,DL 作為一種潛在的定量工具,在評估LARC 患者的pCR 方面具有重要的價值,它可以通過選擇那些可能從輔助化療中受益的患者,并協(xié)助臨床醫(yī)生選擇最佳化療方案來幫助制訂個體化的治療策略。然而上述幾項研究的ROI 都是手動勾畫的,這很大程度上依賴于影像科醫(yī)生的經驗,容易造成主觀上的錯誤,需要進一步的研究來建立一個可靠的自動分割網絡。
隨著DL 算法的興起,其在醫(yī)學圖像處理領域,特別是腫瘤病灶的分割方面引起了廣泛的關注。近年來,以全卷積神經網絡為代表的DL 已經在醫(yī)學圖像分割任務中取得了頻繁的成功,特別是使用流行的U-Net 架構[28]。DESILVIO 等[29]根據(jù)特定區(qū)域的背景開發(fā)了一種U-Net DL 模型,它可以在RC 治療后的T2WI圖像中自動分割直腸外壁、內腔和直腸周圍脂肪區(qū)域。在多機構評價中發(fā)現(xiàn)特定區(qū)域的U-Net(腸壁骰子相似度系數(shù)為0.920,腸腔骰子相似度系數(shù)為0.895)與多名放射科醫(yī)生(腸壁骰子相似度系數(shù)為0.946,腸腔骰子相似度系數(shù)為0.873)在圖像分割方面表現(xiàn)相當,并且與多類U-Net 相比,此模型的性能提高了20%,該模型對于準確評估體內腫瘤范圍和劃分直腸結構具有重要實用價值。由于傳統(tǒng)的U-Net網絡提取的高級特征往往不能包括足夠的輪廓信息,為了進一步提高圖像分割精度,LI等[30]通過對傳統(tǒng)U-Net 網絡進行改進,設計了一種新型的U-Net 網絡:(1)用壓縮和激勵網絡(squeeze-and-Excitation networks ,SENet)替換了編碼器;(2)在最后一個編碼器之后添加了一個全局池化層;(3)在每個解碼器中添加了空間和通道壓縮與激發(fā)注意力機制模塊;(4)最后將每個解碼器的輸出結果連接起來。研究發(fā)現(xiàn)該模型能夠進行準確且高效的RC分割和輪廓分割。在一項最近的研究中,DOU 等[31]設計了一種注意力融合U-Net DL模型,該模型以多參數(shù)MRI圖像為輸入,通過嵌入注意力融合模塊,有效地融合了多參數(shù)MRI圖像的特征。試驗結果顯示,該模型的骰子相似度系數(shù)為0.821±0.065,是目前最先進的RC圖像分割方法。
綜上所述,初步的研究結果顯示,基于MRI 的DL 在分割RC 病灶方面取得了良好的成果,具有廣闊的臨床應用前景。然而,上述試驗所提出的方法均是設計用于2D 圖像分割的。與之相比,MRI 圖像在醫(yī)學實踐中通常是3D 圖像。由于該方法可能無法正確處理沒有腫瘤區(qū)域的情況,這可能導致誤分割的問題。其次,由于測試集的規(guī)模相對有限,因此無法充分代表不同醫(yī)療中心和MRI 設備之間的差異。未來,添加來自不同醫(yī)療中心和MRI 設備的更多數(shù)據(jù),并且開發(fā)基于3D 卷積的分割模型,可能會更有意義。
研究表明,在約35%~50%的RC 中發(fā)現(xiàn)KRAS突變,這與侵襲性腫瘤生物學行為、對表皮生長因子抑制劑的耐藥性和總體生存率降低相關[32]。表皮生長因子受體抗體(如西妥昔單抗和帕尼單抗)能夠改善野生型KRAS患者的結局,而在突變型KRAS患者中卻觀察到了負面影響[33]。因此,美國國立綜合癌癥網絡(national comprehensive cancer network, NCCN)指南[34]建議不應向具有突變型KRAS/NRAS/BRAF的患者提供諸如西妥昔單抗或帕尼單抗的抗癌藥物。由于原發(fā)腫瘤不同區(qū)域內的遺傳異質性可能發(fā)生變化[35],所以開發(fā)一種無創(chuàng)易行的方法,通過提供實時監(jiān)測的組織學評估來預測KRAS突變狀態(tài)具有重要價值。SONG等[36]提出了一種多任務注意力模型來識別RC患者中的KRAS突變,該模型主要由分割子網絡和識別子網絡組成。研究發(fā)現(xiàn)該模型對于KRAS突變識別的準確度為89.95%±1.23%,敏感度為89.29%±1.79%,特異度為90.53%±2.45%,AUC 為0.9573±0.0502。結果表明,此模型在識別KRAS 基因突變中表現(xiàn)出較好的性能。LIU等[37]使用MobileNetV2架構構建了兩種DL 模型:(1)T2WI 圖像模型;(2)T2WI和臨床因素的組合模型。在測試集中臨床模型、T2WI 圖像模型和組合模型的AUC 分別為0.668、0.765 和0.841。結果表明,結合T2WI 和臨床因素的組合模型顯示出最佳的診斷性能。因此,它可以作為一種補充方法,無創(chuàng)評估RC的KRAS突變。同樣值得注意的基因分型還有微衛(wèi)星不穩(wěn)定性(microsatellite instability, MSI),由于其對RC預后和治療的重要價值而受到廣泛關注。MSI 是由一個或多個錯配修復(mismatch repair, MMR)基因丟失導致的結果。研究顯示,具有MSI的RC 患者預后略優(yōu)于具有微衛(wèi)星穩(wěn)定性(microsatellite stability, MSS)的患者,但卻無法從5-氟尿嘧啶的輔助化療中獲益[38]。因此MSI 的檢出對RC 患者的個性化治療具有重要意義[39]。然而,標準的遺傳學和免疫組織化學檢測不僅耗時長,而且診斷活檢通常需要特定設備,限制了其實用性[40]。因此,蘇木精和伊紅染色(hematoxylin-eosin, H&E)組織切片的目視檢查仍然是MSI 檢測的常用方法。最近,基于H&E 染色組織學全切片圖像的DL 模型已被開發(fā)用于預測RC 的MSI,KATHER 等[41]開發(fā)了第一個用于預測RC MSI 狀態(tài)的全自動DL 模型,并展現(xiàn)出不錯的預測能力。ECHLE 等[40]分析了DL 模型在RC H&E 染色載玻片上檢測MSI 的應用,構建了一個新的DL模型,其與KATHER等先前開發(fā)的模型的預測性能相當。近來,陸續(xù)又有很多新模型[42-44]被開發(fā)并得到驗證,它們以用時更少、成本更低以及更加精準的方法預測RC MSI。然而,這些方法仍然依賴于活檢或手術標本,并且不能避免瘤內異質性的影響。因此,開發(fā)一種無創(chuàng)、易重復的方法用于術前預測MS 狀態(tài)具有重要的臨床意義。針對這一問題,ZHANG 等[45]使用改進后的MobileNetV2 架構構建基于術前T2WI圖像的單純影像學模型、臨床變量模型、整合臨床變量和圖像特征的組合模型,來無創(chuàng)預測MSI 狀態(tài)。結果顯示,在測試集中,臨床變量模型對MSI預測的準確度為37.5%,AUC值為0.573,單純影像學模型和組合模型對MSI 預測的準確度分別為75.0%和85.4%,AUC 值分別為0.820 和0.868。兩種DL 模型的表現(xiàn)都優(yōu)于臨床變量模型,尤其是整合臨床變量和圖像特征的組合模型實現(xiàn)了最佳的預測性能。然而,兩個DL 模型間的預測性能沒有顯著差異,這可能與臨床變量未能為模型提供重要信息有關。該研究表明,基于高分辨率T2WI 圖像的DL 模型對預測RC患者的MSI狀態(tài)具有廣闊的前景。
上述研究顯示,結合臨床因素和T2WI 的DL 模型顯示出良好的評價性能。因此,這可能作為一種非侵入性評估的補充方法,用于預測基因分型。然而,這兩項研究都僅使用T2WI單獨開發(fā)DL模型,對多參數(shù)MRI 在改善DL 模型診斷性能方面的價值需要進一步探討。此外,目前在基因分型方面,基于MRI 的DL 技術的研究相對較少,未來可能會成為一個值得關注的研究熱點。
DL 作為一門新興且發(fā)展迅速的技術在醫(yī)學領域中的研究正不斷深入?;贛RI的DL 在提高RC患者分期診斷的準確性、評估治療反應、預測復發(fā)和預后等方面已經顯示出極大的潛力,具有廣闊的研究前景。然而,目前的研究仍然存在諸多挑戰(zhàn)。第一,不同儀器掃描參數(shù)、患者個體間差異以及圖像提取技術等不同均可對DL 相關研究的可重復性及穩(wěn)定性產生較大影響,導致最終所構建模型的可信度降低。第二,提高模型性能是構建DL 模型的一個關鍵問題。未來,可以結合多模態(tài)(CT、MRI、病理切片、基因組學等)和多時間(治療前和治療后)數(shù)據(jù),并在臨床實踐中進行大規(guī)模驗證,以進一步提高模型的預測能力。第三,雖然DL 中的無監(jiān)督和自監(jiān)督方法不需要耗時耗力的圖像特征提取,但受限于復雜的醫(yī)學結構、醫(yī)學場景和圖像質量參差不齊等因素,現(xiàn)有算法還不能在高精度全自動的工作流程中達到高標準的醫(yī)學要求。第四,模型的穩(wěn)健性和泛化能力也是影響DL 在臨床應用中的重要因素。目前大多數(shù)研究僅基于少量數(shù)據(jù)和單中心數(shù)據(jù)源,如果模型的性能能夠在多中心大數(shù)據(jù)集中得到進一步驗證,那么所構建的模型可以為RC 患者的個性化治療提供更好的指導。
綜上所述,DL 已經在RC 的分期、新輔助治療后評估、病灶分割以及對基因分型的術前無創(chuàng)預測研究等方面取得一定進展。相信隨著更先進算法的應用、更大樣本量以及多中心數(shù)據(jù)加入,穩(wěn)定性及準確性更高的模型一定會被開發(fā),使DL 在RC 的研究方面發(fā)揮出獨特優(yōu)勢,為精準化、個性化治療策略實施提供新的診斷模式。
作者利益沖突聲明:全體作者均聲明無利益沖突。
作者貢獻聲明:李曉夫設計本綜述的框架,參與稿件重要內容的修改,獲得了新疆生產建設兵團財政科技計劃項目資助;石晟銘參與研究的構思和設計,數(shù)據(jù)的收集、整理、分析和解釋,撰寫論文并參與論文重要內容的修改;肖玲清、馬佳琪、劉晗、武玉鵬參與研究的構思和設計,數(shù)據(jù)的收集、整理、分析和解釋,參與論文重要內容的修改;全體作者都同意最后的修改稿發(fā)表,都同意對本研究的所有方面負責,確保本研究的準確性和誠信。