雷婷, 謝紅寧
中山大學附屬第一醫(yī)院超聲科(廣東廣州 510080)
智能的概念最初被描述為計算機程序執(zhí)行與人類智能相關的過程的能力,如推理、學習、適應、感官交互理解。19世紀50年代Turing[1]在一份研討會論文中提出測試機器是否具有智能的方法,如機器能夠與人類展開對話而不被評估者辨別出其機器身份,那么稱這臺機器具有“智能”。隨后McCarthy等[2]提出“人工智能(artificial intelligence,AI)”這一特指名詞。傳統(tǒng)的計算機算法(如電子計算器)設置好既定的規(guī)則,每次都執(zhí)行相同的功能,AI算法則自動從訓練數據中學習規(guī)則(函數)。當今AI作為人臉識別技術、虛擬助手語音識別(如亞馬遜的Alexa、蘋果的Siri、谷歌的Assistant和微軟的Cortana、汽車自動駕駛等)的基礎,已廣泛應用于我們的日常生活中。人機對弈的里程碑事件包括1997年“深藍”電腦擊敗了國際象棋世界冠軍Gary Kasparov、2016年擊敗了中國職業(yè)圍棋手李世石(9段)[3]。在醫(yī)學領域,AI因其具有從大數據中獲取規(guī)律的能力,可用于篩查、預測、分診、診斷、藥物開發(fā)、治療、監(jiān)測和影像識別等,目前已在新藥研發(fā)[4-5]、臨床決策[6-8]、醫(yī)學影像判讀[9-10]等各方面發(fā)揮著助力作用。已獲得美國食品和藥物管理局批準的AI圖像分析軟件呈指數遞增,如檢測心律失常的智能手表、自動提取關鍵診斷圖像的智能軟件等。產前超聲是醫(yī)學影像AI領域的難點,受孕周、胎位、超聲特有的聲衰減等影響,圖像標準化程度低、特征描述困難,從而導致機器學習的特征工程準確性低。深度學習是先進AI技術的代表,在圖像模式識別方面表現尤其出色,通過模仿人腦的結構設計,可自動提取底層特征,避免了人為圖像分割導致特征工程準確性低的影響。因此,借助深度學習技術極有可能在這項勞動密集型任務中突破瓶頸,為智能化圖像識別提供更為深遠的幫助。本文整合這兩個領域的基本理論知識,介紹AI基本概念,探討AI與產前超聲領域結合的研究進展、機遇與挑戰(zhàn)、未來趨勢。旨在加強產前超聲領域與AI領域專業(yè)人士之間的跨學科交流,進一步挖掘AI在產前超聲領域發(fā)展的巨大潛力。
廣義的AI指機器具備任何與人類相似的思考、學習、推理的能力,即機器從數據和經驗中學習規(guī)律,從而達到可提供新的數據和經驗的能力。狹義的AI是機器執(zhí)行特定任務的能力,如圖像檢測、翻譯、國際象棋等。
機器學習是AI的一個分支,可理解為隨數據量增多而逐漸改進統(tǒng)計方法,以獲得最佳模型(函數/規(guī)律),最終達到預測未知狀況的目的[11]。換而言之,大數據支持是機器獲得智能的基礎,而醫(yī)學影像在常規(guī)臨床實踐中積累的大數據庫為機器學習提供了豐富的資源。根據學習方式不同又可分為:監(jiān)督學習、無監(jiān)督學習和強化學習。監(jiān)督學習中訓練數據是具有標簽的,機器根據已有的數據標簽,找到輸入和輸出結果之間的關系;無監(jiān)督學習中訓練數據是不需要標記的,機器通過聚類的方式從數據中尋找某種內在共性,從而分類數據;強化學習不直接給出解決方案,通過試錯、激勵的方式以達成回報最大化。
深度學習是機器學習的另一分支。在深度學習中,輸入和輸出由多層隱藏層連接,也稱為卷積神經網絡(convolutional neural networks,CNN),是一種受生物神經網絡啟發(fā)的計算算法。深度學習神經網絡含有多層隱藏層,可自動提取底層特征,使人眼無法分辨的抽象信息得以保真學習[12-13]。因此,其應用于醫(yī)學影像AI識別時,可以有效避免人為圖像分割導致的特征工程準確性低。
隨著人們對先天性畸形產前篩查重要性的認知逐步加深,產前超聲篩查需求持續(xù)增長,而要達到專業(yè)產前超聲篩查所需能力的培訓時間長,導致產前超聲工作者的工作負荷急劇增加。因而,提高產前超聲篩查效能的迫切需求成為了AI在產前超聲領域發(fā)展的主要驅動力。目前,產前超聲AI領域的研究進展主要呈現在以下方面:產前超聲篩查切面識別與定位、生長指標與解剖結構的自動測量、鑒定圖像的標準化程度、部分標準切面的正常異常的分類識別等。
2.1 產前超聲篩查切面智能識別與定位 產前超聲篩查切面智能識別是指計算機通過大量學習已知數據的類別標簽,實現超聲圖像輸入后切面的自動分類,如圖像是腹圍切面還是頭顱切面,這是進一步測量、診斷異常的基礎。而篩查切面的定位是指機器能在視頻流或眾多掃查切面中定位到所需的診斷切面。
早在2017年,Yu等[14]借助深度學習CNN的結構優(yōu)勢,配合遷移學習策略和針對性的數據增強技術,實現了胎兒顏面正中矢狀面、雙眼水平面、鼻唇冠狀面的分類識別,經測試該模型的受試者曲線下面積達0.979~0.999。同年,Chen等[15]應用卷積和遞歸神經網絡的新型復合框架實現在圖片和視頻集中對腹圍切面、雙眼橫切面、四腔心切面的自動分類識別。英國帝國理工學院Baumgartner等[16]通過深度學習弱監(jiān)督學習模式,建立了CNN模型SonoNet,實現了自由掃查時13個胎兒標準切面的自動識別,圖像召回率達90.9%。
該項技術的實現將有利于引導經驗不足的操作人員獲取胎兒篩查的標準切面,全面提高產前超聲醫(yī)師培訓效能,緩解全球范圍內專業(yè)產前超聲工作者短缺的壓力。甚至在緊急情況下,非產前超聲專業(yè)醫(yī)療工作者基于AI輔助也可獲取篩查切面進行基本的產前超聲篩查。
2.2 胎兒生長指標及解剖結構的自動測量 計算機自動測量的基礎是根據超聲圖像中不同區(qū)域所展示的回聲強弱、空間紋理、結構形狀、邊緣連續(xù)性等特征,把目標圖像中特征性解剖結構從其周圍的背景中抽離出來。將深度學習自動分割優(yōu)勢應用于標準切面自動測量,展現出良好的性能。目前很多的超聲儀器都配備自動測量AI軟件,包括頸項透明層、生長發(fā)育指標、側腦室等的測量。如Chen等[17]基于CNN對胎兒顱腦側腦室的像素級分割,實現了側腦室寬徑準確測量,誤差僅1.8 mm。荷蘭拉德堡德大學團隊[18]基于VGG-Net的網絡,自動分割胎兒顱骨光環(huán),再通過U-Net網絡來自動測量胎兒頭圍,最后以參考頭圍的Hadlock曲線來確定孕周,實現孕周的自動估算。Kagan等[19]對比了人工與半自動測量頸項透明層厚度在不同經驗醫(yī)師間重復性的差異,發(fā)現自動化測量技術有利于經驗不足的操作人員對頸項透明層進行更為準確的評估。
基于自動分割特征圖像,AI技術準確的自動測量將簡化所有超聲工作者平時的操作步驟,節(jié)約檢查時間而將更多的注意力專注于特征性結構或病灶。
2.3 產前超聲篩查切面的標準化程度質控 產前超聲篩查切面的標準化程度質控是指判斷超聲圖像是否顯示了標準切面所必須顯示的結構,是避免誤診與漏診的基礎,也是培訓專業(yè)的產前超聲工作者的關鍵。
通過將醫(yī)學邏輯轉化為計算機語言進行圖像的量化質控,我國深圳大學團隊產出了出色成果。其中,Wu等[20]將AI檢測技術應用于胎兒腹圍切面的標準化程度質控。首先基于CNN定位圖像中胎兒腹部橫切面,再基于標準的腹圍切面需顯示胃泡、臍靜脈等關鍵結構,對關鍵結構的顯示進行量化評分。該研究所研發(fā)的FUIQA網絡對腹圍切面的質控評分與3名專家的主觀評價相接近。Lin等[21]提出基于候選區(qū)域快速卷積神經網絡多任務學習框架MFR-CNN對顱腦橫切面內的丘腦、外側裂、脈絡膜叢,側腦室后角、透明隔腔、第三腦室進行分類及定位檢測,結合圖像放大程度對切面進行量化評分。以交并比>0.7為定位準確,該模型對切面中結構定位準確率達80%以上,平均分析時間為0.5 s。Dong等[22]建立的胎兒四腔心切面質控評分的神經網絡綜合考慮了圖像的增益、放大程度以及圖像所必須顯示的關鍵結構等因素。如果同時檢測到:4個腔室、肺靜脈回流角,心尖、乳頭肌、兩側各顯示1條肋骨,且增益及放大程度合適,機器則判斷為標準四腔心切面。其定量質控胎兒四腔心切面內部驗證精度93.52%,外部驗證精度達81.2%。
2.4 正常與異常產前超聲圖像的自動分類識別 胎兒異常的診斷是AI在產前超聲領域的最難點:首先胎兒畸形的產前診斷通常需要多切面聯合診斷,單一平面信息量少,AI算法需要解決動態(tài)、聯想、立體識別等方面的難題。此外,胎兒畸形的病變種類很多,每種畸形變化不一,相對來說單一病種數據量少,AI識別也面臨數據量不足的困境。
近兩年,研究者們開始嘗試于胎兒心臟及顱腦的正異常分類或部分異常類型診斷方面作出突破。2020年,Gong等[23]在建立胎兒先心病AI篩查模型中,首次引入了異常四腔心切面的圖片訓練,驗證結果表明AI在分類正常與異常四腔心圖像的表現超過了低年資及中年資醫(yī)師,僅次于高年資醫(yī)師。Arnaout等[24]建立的神經網絡在識別5個胎兒心臟標準切面基礎上,實現了正常與16種先心病的智能分辨,曲線下面積為0.99,敏感度為95%[95%置信區(qū)間(CI)84%~99%],特異度為96%(95%CI95%~97%)。Xie等[25]基于深度學習卷積神經網絡對胎兒顱腦超聲圖像進行正異常分類,該分類系統(tǒng)測試結果顯示正常與異常顱腦橫切面分類準確率達96.31%,明顯超過既往文獻報道的80%。熱力圖病灶定位結果顯示61.62%達到精確定位,24.65%定位到與病灶緊鄰的位置。同一課題組Lin等[26]通過分割和標記超過21 500張?zhí)猴B腦超聲圖像進一步提出了胎兒顱腦異常實時AI輔助診斷系統(tǒng),該系統(tǒng)可以在常規(guī)超聲掃查中自動識別胎兒顱腦橫切面及切面內特征性解剖標志,并根據圖像檢測9大種不同顱內異常。該系統(tǒng)的受試者工作特征曲線下面積為0.81~0.95。
上述研究成果表明,基于機器視覺中的多項任務(分類、分割、檢測),AI技術在產前超聲領域的研究已逐漸從正常切面的定位識別過渡至異常聲像的分類診斷,并有望模擬經驗豐富的產前超聲醫(yī)師,權衡多種圖像參數的同時辨別偽影,指導正確的臨床決策。
AI技術在產前超聲領域的研究進展充分展現了AI技術的優(yōu)勢及有望減輕產前超聲工作者負荷的潛能。然而,將AI引入臨床實踐仍然面臨諸多挑戰(zhàn),特別是對AI模型普適性的考證及一些目前尚無法避免的倫理問題的解決是將研究成果轉化為生產力的必要準備。
首先,AI模型的普適性問題:(1)單一中心獲取的訓練數據所建立的模型能否適用于不同的產前篩查與診斷的場景;(2)為中孕期設計的AI模型很難適用于早孕、晚孕的超聲檢查;(3)大多數AI模型是通過“監(jiān)督學習”推導出來的,這意味著醫(yī)師標注的準確性將影響模型的準確性。人類參與不可避免地在學習過程中引入主觀偏差,得到的模型也可能受標注偏倚影響。因此,未來的AI模型無論是針對訓練集的標注、還是驗證數據集的底層標簽,均需考慮制定合適的準則對質量進行把關。AI的適用性也需根據訓練及驗證數據制定嚴格規(guī)范,未來開展大規(guī)模多中心的臨床研究將成為AI進入臨床實踐的必經之路。
此外,真實場景的臨床思維不僅考慮圖像的特征,還會根據年齡、家族史、既往史、其他指標進行多因素整合分析,而AI模型只針對訓練過的特征進行預測,不考慮其他因素。因此,未來醫(yī)療AI領域的研究重點將是構建AI集成圖像和電子病歷的“個性化影像診斷”。
另外,AI在產前超聲的應用,或者說在醫(yī)學的應用,不可避免地會遇到一些倫理問題,例如AI應用到臨床需要達到多高的準確率、AI所產生的醫(yī)療風險將由誰承擔,需要研究者們進一步建立行業(yè)標準來規(guī)范這些問題。
AI在產前超聲領域的研究進展,提示其有望改善篩查與診斷的工作流程、增加產前超聲診斷者診斷的信心、提高產前篩查效能。未來的AI開發(fā)者和產前超聲專業(yè)人員需進一步加強跨學科交流,將潛力轉化為生產力,并聯合多學科共同制定標準化的行業(yè)規(guī)范,規(guī)范這一新興領域的行業(yè)標準。
利益相關聲明:本文作者無相關利益沖突。
作者貢獻說明:謝紅寧負責提出選題及論文設計,并對論文進行修改;雷婷起草了本論文。