陳勇濤,賈 軒,蔡建庭
(1 浙江大學醫(yī)學院附屬第二醫(yī)院消化內科 浙江 杭州 310009)
(2 浙江大學醫(yī)學院 浙江 杭州 310011)
消化道惡性疾病在中國以及全世界癌癥相關發(fā)病率、病死率榜上居高不下。消化內鏡是消化道疾病早期診斷、治療的重要手段。近年來,內鏡技術如窄帶成像、放大內鏡等迅速發(fā)展,內鏡醫(yī)生可以在鏡下直觀地發(fā)現(xiàn)胃腸道黏膜的病變。但是,我國不同地區(qū)醫(yī)生資源分配不平衡,各種內鏡醫(yī)生的臨床技術水平存在較大差距,消化道疾病檢出率相對較低。人工智能(artificial intelligence,AI)具有快速數據處理和強大的圖像特征提取能力,符合對圖像處理有高度需求的消化內鏡領域的要求,借助AI 技術在消化領域的發(fā)展有望解決這些問題。
“AI”概念首次提出于1956 年的達特茅斯大會上,標志著現(xiàn)代AI 科技的出現(xiàn)。但AI 在之后的近半個世紀發(fā)展中幾經曲折,直至2016 年,AlphaGo 打敗了韓國頂級圍棋高手,才標志著AI 時代的來臨。AI 屬于計算機技術學科中的一個分支,重點在于對語音識別、圖片辨別以及自然語言的處理。機器學習也是AI 系統(tǒng)中的一種,它可以通過對目標原始數據進行特征提取、篩選,并根據篩選出來的特征訓練模型、驗證模型。傳統(tǒng)的機器學習需要通過人為地對研究對象進行特征提取,其算法效果受研究人員提取的特征質量影響,存在一定主觀偏倚。以卷積神經系統(tǒng)(convolutional neural networks,CNN)為代表的深度學習網絡可以通過自主學習,自動提取圖像特征彌補這一缺陷,是目前研究的熱門。目前AI 技術已經運用于部分的臨床實踐中。2016 年,Gulshan 等運用深度學習方法,創(chuàng)建了一種可以自動檢測糖尿病視網膜病變的算法模型。2017 年Esteva 等開發(fā)出了一套AI 皮膚癌診斷系統(tǒng),其功能可與皮膚病專家相媲美。未來,AI 可協(xié)助臨床工作者迅速鑒別、判斷臨床病情,提升治療準確性,降低錯誤治療、漏診發(fā)生率,實現(xiàn)醫(yī)療水平的大幅度提升。
Barrett 食管是食管腺癌的癌前病變,目前主要通過白光胃鏡與病理活檢對其進行確診,存在較高漏診率,De Groof 等構建了一個深度學習模型,使用包含超過49 萬張內鏡胃腸道靜態(tài)圖像的數據庫對該模型進行訓練。通過與非專家級內窺鏡醫(yī)生比較,發(fā)現(xiàn)該模型的病灶識別準確率更高,并且可以97%的患者中發(fā)現(xiàn)最佳活檢部位。
食管癌位居世界腫瘤發(fā)病率排行第8 位,腫瘤相關死亡數的第6 位。在我國,食管癌居腫瘤發(fā)病率的第6位,腫瘤相關死亡數的第4 位。目前診斷食管癌的方法主要包括白光內鏡、NBI、碘染色等技術,但漏診率高達40%。Horie 等構建了AI 食管癌檢測系統(tǒng),并回顧性收集來源于384 例患者的8 428 張食管癌圖像對AI 系統(tǒng)進行訓練,將來自47 位食管癌患者和50 例非食管癌患者共1 118 張圖像作為測試集,測試結果顯示,該系統(tǒng)檢測食管癌的靈敏度達到98%,同時可以98%的準確度區(qū)分早期和晚期癌癥。食管癌的浸潤深度評估對治療手段的選擇具有重大的參考意義。Nakagawa 等通過使用大量臨床數據構建了基于AI 的食管癌浸潤深度評估系統(tǒng)并對其進行測試,測試結果顯示AI 系統(tǒng)對浸潤深度具有良好的判斷能力。
幽門螺桿菌(helicobacter pylori, Hp)的感染與多種消化系統(tǒng)疾病相關,其早期發(fā)現(xiàn)根除可降低人們罹患萎縮性胃炎等疾病的風險。Itoh 等開發(fā)了一套AI 系統(tǒng)用于Hp 檢測,測試結果顯示該系統(tǒng)對Hp 檢測的敏感性是86.7%,特異性是86.7%,受試者工作特征曲線下面積(area under curve, AUC)是0.956。Bang 等對AI 用于識別幽門螺桿菌的相關文獻進行了系統(tǒng)回顧,共納入8 篇文獻,包含1 719 名受試對象。分析結果顯示AI 預測Hp 的綜合敏感性、特異性和AUC 分別為0.87、0.86和0.92。張雅瓊等對AI 在慢性萎縮性胃炎方面進行了研究,其共回顧性收集5 470 張來自1 699 例患者的胃竇部圖像,包含3 042 張萎縮性胃炎,2 428 張非萎縮性胃炎,AI 慢性萎縮性胃炎識別系統(tǒng)測試結果顯示,該模型對慢性萎縮性胃炎檢測的準確度、敏感度、特異度分別是0.9424,0.9458,0.9401,優(yōu)于3 位內鏡專家的識別能力。
胃癌居全球發(fā)病率的第5 位,病死率的第4 位,居我國發(fā)病率第3 位,病死率第3 位。胃癌發(fā)病率高、轉移早,早期治療預后好,中晚期預后均不佳。Ikenoyama 等使用2 940 張測試圖像構建了自動識別胃早癌的AI 系統(tǒng),同67 位內鏡醫(yī)生比較對胃早期癌的識別能力。結果顯示,相較于內鏡醫(yī)生,CNN 可以在更短的時間內發(fā)現(xiàn)更多的早期胃癌病灶。同時,有學者將AI 應用于胃癌浸潤深度的評估。Hamada 等通過卷積神經系統(tǒng)構建了評估胃癌浸潤深度的AI 系統(tǒng),經過大量數據的測試,其敏感性、特異性、準確度分別可達到84.9%,70.7%,78.9%。
小腸疾病診斷主要依靠膠囊內鏡。膠囊內鏡攝片量大,對閱片能力要求高。經驗豐富的內鏡醫(yī)生閱片時間可控制在20 min 內,而缺乏經驗的醫(yī)生閱片時間可長達2 h,AI 的發(fā)展可有效提高閱片效率。Aoki 等使用5 360 張小腸鏡圖像構建出AI 系統(tǒng)。使用10 440 張小腸鏡圖像作為測試集對系統(tǒng)進行測試,該系統(tǒng)對測試圖像分析總用時233 s,糜爛、潰瘍檢出的AUC 值為0.958,對病灶檢出的靈敏度、特異度、準確性分別為88.2%、90.9%和90.8%。
結腸腺瘤性息肉是結腸癌的癌前病變,其檢出率每增加1%,結直腸癌發(fā)病率減少3%~6%。不同年資內鏡醫(yī)生結腸息肉的檢出率可波動7%~53%,提升結腸息肉的檢出率至關重要。Lui 等通過前瞻性試驗在52 例腸鏡檢查過程中應用AI 系統(tǒng)實時探測息肉,實驗結果顯示AI 系統(tǒng)可以防止多達80%的腺瘤漏診,初步證明了AI 技術在臨床的實用性。
炎癥性腸病包括潰瘍性結腸炎、克羅恩病。AI 技術在該領域的研究主要集中于疾病的預測、診斷以及預后的評估。Maeda 等開發(fā)了用于預測組織學炎癥的CAD系統(tǒng),通過回顧性收集187 例潰瘍性結腸炎的患者的內鏡圖像以及對應部位的活檢樣本。將其中87 例患者圖像用于機器模型的訓練,剩余100 位患者的圖像用于測試,結果顯示CAD 系統(tǒng)對潰瘍性結腸炎的診斷準確率達91.0%。Tong 等構建深度學習系統(tǒng),通過測試發(fā)現(xiàn)其對潰瘍性結腸炎、克羅恩病具有良好的鑒別性能。
結直腸癌居全球發(fā)病率及癌癥相關病死率的第3位,是導致人類死亡的重要原因。Luo 等將AI 用于對結直腸癌浸潤深度的評估,通過將7 734 張普通白光內鏡圖像對構建的AI 系統(tǒng)進行測試,并將包含156 個病灶的1 634 張圖像作為測試集驗證AI 系統(tǒng)的識別能力,結果顯示,該系統(tǒng)在預測非浸潤性和淺表浸潤性腫瘤及區(qū)分淺表腫瘤和深度侵襲性早期結直腸癌中結果均良好。
AI 技術具備計算機強大的計算能力,可以更加高效地提取研究對象的臨床特征。同時,通過深度學習系統(tǒng),AI 可以實現(xiàn)自主學習,診斷能力可以與專家相媲美。具備以上兩項優(yōu)勢,AI 可以在更短的時間更加高效地完成指令任務。但是,AI 技術仍然存在不少缺陷:(1)目前大部分研究為單中心研究,易導致研究結果過擬合,缺乏泛化能力。(2)大多數研究為回顧性研究,所構建的AI 系統(tǒng)在臨床實踐應用效果仍未知。(3)選圖多為靜息圖像,將AI 應用于臨床要求其達到能在動態(tài)視頻中準確識別病灶。(4)選圖多為白光內鏡圖像,但早期胃癌等病灶在放大內鏡、染色內鏡等特殊內鏡下診斷準確率更高,AI 在特殊內鏡中的應用研究仍有待加強。綜上所述,目前大多數AI 技術相關研究仍處于探索階段,尚未推廣到實際臨床應用中,未來需要開展更多的前瞻性、多中心研究來推動AI 技術在內鏡領域的發(fā)展。