田大偉,王效春,張輝,譚艷*
癌癥是當今世界最主要的公共衛(wèi)生問題,在我國有逐年上升的趨勢[1]。病理學反映了腫瘤的進展,能夠識別并提供與腫瘤相關的表型信息。常規(guī)的病理醫(yī)生在顯微鏡下對組織的微觀結構進行觀察以進行組織學評估。然而,人眼識別細微組織變化的能力有限,可能會出現(xiàn)觀察者內和觀察者間差異[2],另外這一手動過程繁瑣且耗時,分析結果可能受到病理醫(yī)生經驗水平和主觀因素的影響,過度疲勞有時也會產生誤診[3-4]。
近年來,隨著人工智能在臨床癌癥研究中的廣泛應用[5],影像組學從腫瘤MRI 數(shù)據中提取強度、紋理等特征建立診斷、預后和治療反應的預測模型?;谌斯ぶ悄艿臄?shù)字病理學能夠使用自動分析圖像的技術快速檢查和量化組織切片,識別病理信息并突出顯示感興趣和需要重點關注的區(qū)域,學習病理組織圖像更深層的特征,同時減少了人工篩選所需的時間,從而更高效地完成腫瘤的檢測、分類和預測[6-9]。將影像組學特征與患者的臨床病理信息融合構建的腫瘤預測模型,能更好地預測腫瘤的侵襲性,揭示了影像與患者的預后聯(lián)系[10]。本文就數(shù)字病理學到人工智能的發(fā)展以及在腫瘤診療中的應用,病理信息在MRI中的作用和未來展望作一綜述。
數(shù)字病理學[11]使用全切片數(shù)字掃描技術獲得高分辨率圖像,應用計算機將病理組織切片轉換為高質量的數(shù)字圖像,即全切片數(shù)字化圖像(whole slide image,WSI)。數(shù)字病理學不僅減少了病理醫(yī)生的工作量,將他們從單調、易出錯的涂片篩選中解放出來,提高了他們的診斷能力并提供更多有價值的信息,還能降低患者病理切片識別錯誤和丟失的風險,更迅速獲取外部意見,改進了遠程病理會診和信息的共享,實現(xiàn)了切片的數(shù)字化管理[12]。在數(shù)字病理學的基礎上,WSI 構建的豐富的數(shù)據集為人工智能技術在病理學中的應用創(chuàng)造了條件,與人工智能的融合發(fā)展成為數(shù)字病理學發(fā)展的重要方向。
機器學習是人工智能的子集,從大量數(shù)據中學習并構建預測模型,利用機器學習可以從腫瘤組織圖像中提取與患者預后相關的信息,對腫瘤的預后做出科學的判斷[13]。深度學習是機器學習中一種基于數(shù)據進行表征學習的方法,包含多層神經元組成的深度神經網絡,可以學習圖像數(shù)據的深層次規(guī)律,深度學習算法可以增強圖像的分析能力,在腫瘤的診斷、轉移、預后等方面有所幫助[14]。卷積神經網絡(convolutional neural network,CNN)是一種有助于圖像分類的深度學習方法,在CNN 的輔助下計算機能夠自動識別圖像的最佳特征,這些特征能夠在不依賴大量預處理或人類知識的情況下直接分類[15]。人工智能與醫(yī)學圖像的結合是目前醫(yī)療領域研究的新熱點,在腫瘤的臨床研究中達到了新的高度。
在病理學中,人工智能輔助診斷提高了病理的數(shù)字化程度,可用于腫瘤的分類診斷、分級、預后預測和治療。目前,其在膠質瘤、乳腺癌、肺癌、腎癌、肝癌、前列腺癌、大腸癌、鼻咽癌、淋巴瘤、黑色素瘤、間皮瘤等多種腫瘤疾病中展開了研究。基于人工智能的病理學在腫瘤中的應用將隨著技術的發(fā)展不斷擴大,進一步開發(fā)新的診斷模式和治療手段。
準確的腫瘤分類能夠及早輔助腫瘤治療的決策和實施。Liao 等[16]從491 張?zhí)K木精-伊紅(H&E)切片提取了1733 個定量圖像特征,建立基于機器學習的模型成功將肝癌與鄰近的正常組織區(qū)分開,測試組中受試者操作特征AUC 為0.988,驗證組中AUC 為0.886。Sun 等[17]利用遷移學習從322 張肝病理組織圖像中獲得特征,然后結合多示例學習進行分類,將肝臟組織病理圖像區(qū)分為腫瘤和正常組織,準確率為0.98。
基于人工智能的病理學不僅能將腫瘤與正常組織區(qū)分開,對于腫瘤亞型的分類、腫瘤與其他異常結構的區(qū)分也有很大的幫助。Tabibu 等[18]開發(fā)了一個基于支持向量機的深度學習框架,選擇了1584例腎癌切片圖像,卷積神經網絡在WSI上將透明細胞癌和嫌色細胞癌與正常組織區(qū)分開,準確率分別為93.39%和87.34%,最佳AUC 分別為0.98 和0.95,區(qū)分透明細胞癌、嫌色細胞癌和乳頭狀細胞癌的分類準確率達到94.07%,最佳AUC達到0.93。Han等[19]提出了一種基于類結構的深度卷積神經網絡的分類方法對82 例患者的7909 張乳腺癌組織病理圖像進行多分類,平均準確率為93.2%。Syrykh等[20]設計了一個深度學習框架,使用378例H&E染色的淋巴結WSIs進行訓練、驗證、測試,準確區(qū)分濾泡淋巴瘤和濾泡增生,AUC 為0.99。Hekler 等[21]使用卷積神經網絡對595 例包含痣和黑色素瘤患者的H&E切片進行分類,用100例切片對結果進行測試并與11 名病理醫(yī)生進行比較,CNN 的敏感度為76%,特異度為60%,準確度為68%,靈敏度和準確度均超過病理醫(yī)生。
基于人工智能的病理學降低了圖像數(shù)據的高冗余度,能夠處理數(shù)據的不平衡問題,快速識別病理組織圖像中的癌性組織和腫瘤亞型的結構差異?;谌斯ぶ悄艿哪P湍軌蜃詣舆M行腫瘤亞型和正常組織的區(qū)分,較于病理醫(yī)生提高了診斷的準確性,通過客觀分析降低了病理醫(yī)生間的可變性、不一致性,提高了腫瘤分類的效率。
Rathore 等[22]從735 例神經膠質瘤患者的WSIs 中提取臨床特征、圖像特征和紋理特征來訓練支持向量機模型,使用多層預測模型將神經膠質瘤分為Ⅱ-Ⅳ級,準確度為91.48%,敏感度為93.47%,特異度為85.36%,最佳AUC 為0.927。Lucas等[23]利用WSI中的像素和腫瘤腺體的實質性變化訓練CNN,使用CNN 對96 個前列腺活檢組織切片進行自動Gleason 分級,區(qū)分GP≥4 與GP≤3 的準確率、靈敏度和特異度分別為90%、77%和94%。Poojitha 等[24]提出了一種深度學習的新型混合架構,其中包含3 個神經卷積網絡,對前列腺癌進行Gleason分級的準確度達到了0.98。Khoshdeli 等[25]使用兩種基于卷積神經網絡的模型對2461例WSIs進行分類,深層卷積神經網絡的模型能夠從中將部分腎癌WSIs 分為低級別顆粒腫瘤和高級別透明細胞癌,準確度為0.99。
組織病理學是腫瘤分級的金標準,這一過程繁瑣且具有主觀性,人工智能的應用能夠改善分級的流程,克服不可重復性,且診斷準確率高于一般的病理醫(yī)生。基于深度學習能夠從圖像中提取有助于分級的組織學特征,如微血管增值水平、有絲分裂活性、壞死等。如果結合放射學特征和臨床特征會進一步提升分級水平。
人工智能技術加快了病理醫(yī)生對病理圖像的評估,增加了預測的客觀性和可重復性。Courtiol 等[26]開發(fā)了一種基于深度卷積神經網絡的方法,不需要病理醫(yī)生局部注釋就能分析WSI,對間皮瘤患者的WSIs進行預處理,使用WSIs的圖像塊預測總生存期(overall survival,OS),平均c-指數(shù)>0.64。發(fā)現(xiàn)有助于預測預后的區(qū)域主要位于基質。Kather等[27]通過遷移學習利用手動勾畫得到的HE 圖像訓練CNN,使用得到的模型從862張I-IV期大腸癌組織切片圖像中提取具有臨床注釋的組織特征,在多變量Cox 回歸模型中計算了一個“深層間質評分”,這是總生存期[風險比(hazard ratio,HR):1.99]的獨立預測因子。結果表明,CNN 能夠根據病理組織圖像評估腫瘤微環(huán)境并預測預后。這些研究證實了腫瘤微環(huán)境在預測腫瘤預后方面的重要性。
Campanella 等[28]開發(fā)了一個在多示例學習方法下結合卷積神經網絡和遞歸神經網絡的深度學習框架,在44732 張WSIs 的數(shù)據集上進行評估。對前列腺癌、基底細胞癌和乳腺癌腋窩淋巴結轉移的檢測,AUC 均在0.98 以上。Zadeh Shirazi等[29]開發(fā)了一個基于CNN的分類器,根據組織病理圖像將腦腫瘤患者的生存期分類(Ⅰ-Ⅳ期),在訓練組和驗證組中得到了0.99和0.8的準確度,最佳AUC為1。Yu等[30]設計了一個自動化工作流程,從2480個肺腺癌和鱗癌的WSIs中提取了9879 個定量圖像特征,使用機器學習方法選擇特征并將Ⅰ期肺癌患者分為短期生存組和長期生存組。研究表明,自動選擇的病理圖像特征能夠預測肺癌的預后。Skrede 等[31]基于深度學習直接分析常規(guī)的H&E 切片開發(fā)了一種預測早期結直腸癌切除術后患者預后的生物標志物,將II 期和III 期患者分為不同的預后組。在驗證隊列中,預后差和預后良好的HR 為3.83,調整后的HR 為3.04。結果表明這一標志物優(yōu)于現(xiàn)有的分子和形態(tài)學預測標志物,改善了風險分層。
基于人工智能的病理學從組織病理圖像中提取客觀特征,建立機器學習分類器來預測腫瘤的生存結果,快速將患者分為不同的預后組,間接地輔助治療或評估患者的治療情況。這種能力優(yōu)于根據腫瘤分級和分期判斷預后的效果。
Liu 等[32]利用神經網絡對從843 例鼻咽癌患者的訓練組中提取的病理微觀特征進行分析,根據受試者操作特征將患者分為高危和低危兩組。結果顯示,高危組5 年無進展生存期(progression-free-survival,PFS)較低危組差,分別為28.1%和86.4% (HR 為10.03)。低危組中接受誘導化療聯(lián)合同期放化療和接受同期放化療的患者5年PFS相差不大(HR為0.67)。同時,高危組中接受誘導化療聯(lián)合同期放化療的患者5 年PFS 高于單獨接受同期放化療的患者(HR 為0.50)。結果證明病理微觀特征有助于指導鼻咽癌患者的治療決策。
神經膠質瘤的等級和亞型與微血管高度相關,Li 等[33]提出了一種檢測和量化膠質瘤中微血管的基于自動深度學習的方法,使用350例神經膠質瘤患者的WSIs,用全卷積網絡進行微血管分割并進行識別、特征提取和分析。膠質母細胞瘤中微血管密度和微血管面積分別為95%和170%。結果表明該方法可以精確地提取微血管的特征,從而指導是否采用放化療或抗血管生成的靶向治療。
基于深度學習,診斷性的病理學通過預測患者的生存風險進行分組、量化腫瘤微觀結構均可以指導患者的治療。需要注意的是,微觀特征輔助治療的原理不明確,復雜病理圖像的分割錯誤和過度計數(shù)會對結果產生偏差,抗血管生成的研究較少,有待進一步的研究和驗證。
影像組學中的病理信息包括病理分化程度、腫瘤標志物、免疫組化標志物、腫瘤分期等。結合定性和定量MRI 特征與病理信息可以預測腫瘤患者的預后,促進個性化治療。Zhao等[34]結合47例膽管癌患者的影像組學特征、增強MRI、血管內皮生長因子受體構建聯(lián)合模型,顯著提高了影像組學模型的預測性能,AUC、靈敏度、特異度分別為0.949、0.875、0.774。Cui 等[35]從186 例局部晚期直腸癌放化療前的T2WI、增強T1WI、ADC 圖中提取1188 個影像特征,結合病理信息構建了影像組學諾模圖,較單獨的影像組學標簽預測效果更好,最佳AUC 為0.966。另外,結合病理信息的影像組學模型在鑒別非小細胞肺鱗癌和腺癌[36]、預測淋巴結轉移[37]等方面也可優(yōu)化影像組學模型。
隨著傳統(tǒng)病理數(shù)據與MRI 的結合應用,影像組學模型可以更好地量化腫瘤異質性,改善患者的危險分層以提高個性化診療水平,發(fā)揮其在精準醫(yī)療中的作用。目前人工智能分析大多基于單獨的病理圖像或MRI 圖像,尚無基于人工智能的微觀病理圖像及宏觀MRI 圖像的綜合量化分析研究,多層次的人工智能綜合分析有望成為未來的研究方向。
人工智能技術的發(fā)展為現(xiàn)代病理學提供了新的方向和挑戰(zhàn),越來越多的參與了病理醫(yī)生的診斷和決策。但仍有一些局限性,由于人工智能算法的限制、數(shù)據來源的差異、患者的組織學形態(tài)和特征不同,目前沒有統(tǒng)一的組織病理學診斷模式和應用于不同類型腫瘤的診斷模型;基于人工智能的病理學對圖像質量的要求比較高,而構建大量帶注釋的高質量圖像非常昂貴且耗時,質量不合格會影響特征的提取和數(shù)據的分析;病理圖像通常有噪聲。
隨著數(shù)字病理學的發(fā)展,基于更大、更豐富的數(shù)據集,構建性能更佳的人工智能預測模型,探索深層的網絡結構優(yōu)化模型并提高分類和預后性能。未來的研究應該朝著多學科交叉方向發(fā)展,人工智能不僅基于病理圖像數(shù)據分析,還能整合影像量化特征和基因信息,基于人工智能的腫瘤多層次、多維度的綜合量化研究有待探索。
綜上所述,基于人工智能的病理學應用于腫瘤的分類、分級、預后預測、放化療和靶向治療的指導,提高了診斷的效率和準確性,實現(xiàn)了更快速、更精確的腫瘤診療。傳統(tǒng)病理數(shù)據結合MRI 影像組學的應用能改善患者的危險分層并提高個性化診療水平。人工智能基于微觀病理及基因、宏觀MRI 的多層次綜合量化分析研究,將是今后腫瘤精準診療的研究趨勢。
作者利益沖突聲明:全體作者均聲明無利益沖突。