胡守興
當(dāng)今,由大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)開啟了新一波人工智能熱潮,大數(shù)據(jù)、人工智能技術(shù)在疾病預(yù)防篩查和診斷方面的應(yīng)用日趨成熟。本文圍繞醫(yī)療和體檢行業(yè),提出雙驅(qū)動(dòng)的“人工智能+健康醫(yī)療”的平臺(tái),同時(shí),從影像診斷的角度以肺結(jié)節(jié)檢測(cè)的案例出發(fā),研究有關(guān)的技術(shù)現(xiàn)狀。最后對(duì)雙驅(qū)動(dòng)平臺(tái)技術(shù)和應(yīng)用進(jìn)行展望,并提出一些建議。
一、人工智能概述
早在1950年,Alan Turing在《計(jì)算機(jī)器與智能》中就闡述了對(duì)人工智能的思考。1956年,“人工智能”這個(gè)詞首次出現(xiàn)在達(dá)特茅斯會(huì)議上,標(biāo)志著其作為一個(gè)研究領(lǐng)域的正式誕生。之后人工智能的發(fā)展經(jīng)歷過一次一次的低谷期。隨著大數(shù)據(jù)的積聚、理論算法的革新、計(jì)算能力的提升,人工智能在很多應(yīng)用領(lǐng)域取得了突破性進(jìn)展,尤其是深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)研究中的一個(gè)新興領(lǐng)域,起初由Hinton等人于2006年提出。2012年,杰弗里·辛頓的學(xué)生IIya Sutskever和Alex Krizhevsky在圖片分類比賽ImageNet中,使用深度學(xué)習(xí)打敗了Google團(tuán)隊(duì),深度學(xué)習(xí)的應(yīng)用,使得圖片識(shí)別錯(cuò)誤率下降了14%。同年,谷歌首席架構(gòu)師Jeff Dean和斯坦福大學(xué)教授AndrewNg主導(dǎo)著名的GoogleBrain項(xiàng)目,采用16萬CPU來構(gòu)建一個(gè)深層神經(jīng)網(wǎng)絡(luò),并將其應(yīng)用于圖像和語音的識(shí)別,并獲成功。
二、人工智能+健康醫(yī)療
人工智能是一種很好的工具,能夠緩解大健康產(chǎn)業(yè)醫(yī)生資源緊缺的問題,緩解漏診誤診的問題,提高醫(yī)生工作效率,醫(yī)院可以利用人工智能進(jìn)行范圍內(nèi)居民健康管理。通過人工智能還可以模擬醫(yī)生診療過程并給出診療建議,比如服用日常藥物,掛什么科,或者就近聯(lián)系醫(yī)生等,滿足常見病咨詢需求。這也給患者和醫(yī)生節(jié)省了大量的時(shí)間,也保證了生命的安全。隨著社會(huì)的高速發(fā)展,人們?cè)絹碓秸J(rèn)識(shí)到“防患于未然”,日常保健、定期體檢的重要性。對(duì)于健康的重要性,“預(yù)防優(yōu)先”的健康觀念日益深入人心,個(gè)人體檢的意愿及頻次必將進(jìn)一步提升。
三、雙驅(qū)動(dòng)“人工智能+健康醫(yī)療”平臺(tái)
醫(yī)療人工智能平臺(tái)的建設(shè)輔助醫(yī)療機(jī)構(gòu)提升服務(wù)水平,平衡醫(yī)療資源,緩解就醫(yī)壓力,特別是醫(yī)療資源匱乏的區(qū)域。醫(yī)療機(jī)構(gòu)根據(jù)自身信息化水平選擇不同的建設(shè)模式,幫助提升自身的醫(yī)療服務(wù)水平。人工智能平臺(tái)由數(shù)據(jù)、算力、開源框架和算法以及各種技術(shù)構(gòu)成,計(jì)算能力為人工智能平臺(tái)的運(yùn)算速度提供保障。其中算法、數(shù)據(jù)和算力、深度學(xué)習(xí)是帶動(dòng)本輪人工智能產(chǎn)業(yè)發(fā)展的“三駕馬車”。開源框架是算法的工程體現(xiàn)。
數(shù)據(jù)驅(qū)動(dòng)在輔助醫(yī)療影像診斷技術(shù),其應(yīng)用包括而不限于腦瘤分割、肺結(jié)節(jié)檢測(cè)、阿茲海默癥檢測(cè)、淋巴結(jié)檢測(cè)、肺支氣管擴(kuò)張檢測(cè)、X光胸片疾病檢測(cè)、肝超聲檢測(cè)。以肺結(jié)節(jié)醫(yī)療影像數(shù)據(jù)為例,每位患者平均擁有20~30張片子,在自動(dòng)識(shí)別肺結(jié)節(jié)時(shí)常用的計(jì)算機(jī)視覺模型如殘差神經(jīng)網(wǎng)絡(luò),它可以使數(shù)十層甚至上百層的神經(jīng)網(wǎng)絡(luò)的訓(xùn)練成為可能,這對(duì)計(jì)算能力提出了很高的要求。龐大的數(shù)據(jù)量致使計(jì)算機(jī)的運(yùn)算時(shí)間變得漫長,因此搭建一個(gè)超算平臺(tái)不僅能縮短運(yùn)算時(shí)間,也能提升醫(yī)療的效率,降低患者的等待時(shí)間,可謂至關(guān)重要。
知識(shí)驅(qū)動(dòng)的構(gòu)建,構(gòu)建了醫(yī)療診斷圖譜,醫(yī)療診斷圖譜的落地是非常有價(jià)值的。知識(shí)圖譜是典型的大數(shù)據(jù)時(shí)代產(chǎn)物,大規(guī)模語義網(wǎng)絡(luò)與大數(shù)據(jù)技術(shù)、深度學(xué)習(xí)技術(shù)相結(jié)合,正在成為推動(dòng)人工智能發(fā)展的核心驅(qū)動(dòng)力,醫(yī)學(xué)知識(shí)圖譜中具備了知識(shí)表示、知識(shí)抽取、知識(shí)融合和知識(shí)推理這4個(gè)模塊的關(guān)鍵技術(shù)和研究進(jìn)展進(jìn)行綜述。
開源的Neo4j、Twitter的FlockD、sones的GraphDB等。模式層構(gòu)建在數(shù)據(jù)層之上,是知識(shí)圖譜的核心。比如業(yè)界的百度的醫(yī)療大腦和IBM Watson提供了行業(yè)解決方案。
四、人工智能影像輔助診斷
人工智能已經(jīng)在肺結(jié)節(jié)、甲狀腺結(jié)節(jié)、乳腺癌、冠狀動(dòng)脈斑塊、皮膚癌、眼底病、病理等領(lǐng)域取得了諸多成果。早期的肺癌是沒有任何癥狀的,中國70%~80%的肺癌病人一發(fā)現(xiàn)就是晚期,失去了手術(shù)治療的機(jī)會(huì),越來越多的肺結(jié)節(jié)在檢查中被發(fā)現(xiàn),雖然大部分肺結(jié)節(jié)為良性病變,但仍有較高比例的早期肺癌,因此需高度重視肺結(jié)節(jié)的篩查。
肺結(jié)節(jié)篩查工作量大,易漏診誤診,早在人工智能技術(shù)出現(xiàn)之前,人們已經(jīng)嘗試通過各種方式提高影像診斷效率,其中以CAD(計(jì)算機(jī)輔助決策系統(tǒng))應(yīng)用最為廣泛,它通過專家提取特征,制定分類規(guī)則,建立各種復(fù)雜嚴(yán)密的數(shù)學(xué)模型,實(shí)現(xiàn)了對(duì)影像的自動(dòng)分析。公開的有代表性的系統(tǒng)有:ISICAD、SubsolidCAD、LargeCAD、ETROCAD,它們僅能處理和識(shí)別非常有限的影像表現(xiàn),魯棒性差,無法自動(dòng)深層次學(xué)習(xí)和優(yōu)化。
1.任務(wù)目標(biāo)
基于深度學(xué)習(xí)的人工智能影像分析技術(shù)解決了傳統(tǒng)CAD的不足,通過廣泛的影像大數(shù)據(jù)訓(xùn)練,從底層提取特征,能夠?qū)崿F(xiàn)對(duì)更加多樣化的影像表現(xiàn)識(shí)別并不斷自動(dòng)優(yōu)化?;谌斯ぶ悄苄碌慕鉀Q方案給醫(yī)學(xué)影像分析帶來諸多益處:
·高效的處理和分析影像速度,快速給出輔助判斷結(jié)果。
·良好的靈敏度(或召回率),降低篩檢中的漏診率。
2.數(shù)據(jù)集
LIDC-IDRI是由美國國家癌癥研究所(National Cancer Institute)發(fā)起收集的,目的是為了研究高危人群早期癌癥檢測(cè)。該數(shù)據(jù)集中,共收錄了1018個(gè)研究實(shí)例。對(duì)于每個(gè)實(shí)例中的圖像,都由4位經(jīng)驗(yàn)豐富的胸部放射科醫(yī)師進(jìn)行兩階段的診斷標(biāo)注,會(huì)標(biāo)注三種類別:① >=3mm的結(jié)節(jié),②<3mm的結(jié)節(jié),③>=3mm的非結(jié)節(jié)。
LUNA16發(fā)布于2016年,是肺部腫瘤檢測(cè)最常用的數(shù)據(jù)集之一,它包含888個(gè)CT圖像,1084個(gè)腫瘤,圖像質(zhì)量和腫瘤大小的范圍比較理想。數(shù)據(jù)分為10個(gè)subsets,subset包含89/88個(gè)CT scan。LUNA16的CT圖像取自LIDC/IDRI數(shù)據(jù)集,選取了三個(gè)以上放射。
Kaggle數(shù)據(jù)集中有1000張來自高?;颊叩牡蛣┝糠尾緾T圖像(dicom格式),每張圖像包含多個(gè)胸部的軸向切片;該比賽的任務(wù)是建立一種自動(dòng)化方法以確定患者是否會(huì)在1年內(nèi)被診斷出惡性腫瘤。
3.候選結(jié)節(jié)檢測(cè)
將高維CT圖降維到一些感興趣的區(qū)域, 比較高概率的召回/提取出候選區(qū)域ROI/region proposal,可以通過3D RPN或語義分割出來。
語義分割是一個(gè)活躍的研究領(lǐng)域,DCNN用于對(duì)圖像中的每個(gè)像素進(jìn)行單獨(dú)分類,這是由計(jì)算機(jī)視覺和醫(yī)學(xué)成像領(lǐng)域中不同的具有挑戰(zhàn)性的數(shù)據(jù)集所推動(dòng)。在深度學(xué)習(xí)革命之前,傳統(tǒng)的機(jī)器學(xué)習(xí)方法主要依靠手工設(shè)計(jì)的特征來獨(dú)立地對(duì)像素進(jìn)行分類。在過去的幾年里,人們提出了許多模型,證明基于FCN的CNN分割方法為自然圖像分割提供了優(yōu)越的性能。這種方法的主要缺點(diǎn)是多次執(zhí)行大量的像素重疊和相同的卷積。通過在非常大的數(shù)據(jù)集上對(duì)遞歸神經(jīng)網(wǎng)絡(luò)(RNN)進(jìn)行微調(diào),F(xiàn)CN的性能得到了改善。SegNet和DeepLab也是通用領(lǐng)域語義分割常用的方法。
然而,針對(duì)醫(yī)學(xué)圖像分割中存在的數(shù)據(jù)不足和類間不平衡等問題,提出了一些針對(duì)醫(yī)學(xué)圖像分割的深度學(xué)習(xí)模型。語義醫(yī)學(xué)圖像分割最早也是最流行的方法之一被稱為U-NET?;镜腢-NET模型是根據(jù)結(jié)構(gòu),網(wǎng)絡(luò)主要由卷積編碼和譯碼兩部分組成。在網(wǎng)絡(luò)的兩個(gè)部分中,基本的卷積操作在relu激活之后執(zhí)行。對(duì)于編碼單元中的向下采樣,執(zhí)行2×2最大池操作。在解碼階段,執(zhí)行卷積轉(zhuǎn)置(表示上卷積或去卷積)操作,對(duì)特征圖進(jìn)行上采樣。U-NET的第一個(gè)版本被用于從編碼單元crop and copy特征映射到解碼單元。U-NET模型為分割任務(wù)提供了幾個(gè)優(yōu)勢(shì)。首先,該模型允許同時(shí)使用全局位置和上下文。
其次,它使用很少的培訓(xùn)樣本,并為分段任務(wù)提供更好的性能。最后,端到端的管道在前向通道中處理整個(gè)圖像,并直接生成分割圖。這樣可以確保U-NET保留輸入圖像的完整上下文。
深度學(xué)習(xí)方法提出基于U-NET的可用于3D醫(yī)學(xué)圖像分割任務(wù)3D UNET體系結(jié)構(gòu),從稀疏標(biāo)注的體素圖像中學(xué)習(xí)。三維醫(yī)學(xué)圖像分割網(wǎng)絡(luò)另有研究V-NET,它由一個(gè)具有殘差連接的FCN組成。醫(yī)學(xué)圖像自動(dòng)分割方法res3dnet是基于殘差網(wǎng)絡(luò)的voxresnet在2016年提出,其中使用深voxewise殘留網(wǎng)絡(luò)進(jìn)行大腦分割。2017年Kaggle數(shù)據(jù)科學(xué)競(jìng)賽第一名獲獎(jiǎng)團(tuán)隊(duì)的則基于3D U-net模型提出了N-Net。
前饋路徑:由兩層卷積層和四個(gè)融合單元構(gòu)成。反饋路徑:由兩層反卷積(裝置卷積)層和兩個(gè)融合單元構(gòu)成。Location crop:位置信息可能影響是否為結(jié)節(jié)和是否為惡性的判斷,因而引入輸入數(shù)據(jù)。輸入數(shù)據(jù)大小,并隨機(jī)選擇兩種patch:一種為70%的輸入數(shù)據(jù)至少包含一個(gè)結(jié)節(jié),另一種為30%的輸入數(shù)據(jù)不含結(jié)節(jié)。其中,patch超出圖像部分用灰度值為170填充。
對(duì)于一些易誤診為結(jié)節(jié)的反例數(shù)據(jù),通過使用hard negative mining方法解決。將不同的patch輸入至網(wǎng)絡(luò)得到不同置信度的輸出映射;隨機(jī)選擇N個(gè)反例數(shù)據(jù)構(gòu)成候選池;侯選池中的數(shù)據(jù)以置信度值大小排序,且選出top-n的數(shù)據(jù)作為反例數(shù)據(jù)。輸出數(shù)據(jù)且使用非極大值抑制操作來重疊的proposal。損失函數(shù)為交叉熵函數(shù)。為了避免過擬合采用了數(shù)據(jù)增強(qiáng)和正則化操作。
4.置信檢測(cè)
由于第一階段產(chǎn)生的假陽性區(qū)域,最終將肺結(jié)節(jié)的識(shí)別結(jié)果提供給醫(yī)生作為診斷的參考,明確區(qū)分出結(jié)節(jié)與非結(jié)節(jié),以及確定結(jié)節(jié)的性質(zhì)(陽性或陰性腫瘤)。
置信檢測(cè)可以基于3D-NET(NET), 可對(duì)更豐富的空間信息進(jìn)行編碼,通過分層提取更有代表性的特征??梢詰?yīng)用深度殘差網(wǎng)絡(luò)或堆疊google inception來增強(qiáng)網(wǎng)絡(luò)的表達(dá)能力。
MV-CNN:使用多視角卷積神經(jīng)網(wǎng)絡(luò)(multiple view-convolution neural network)-MV-CNN對(duì)肺結(jié)節(jié)進(jìn)行分類。在傳統(tǒng)的圖像識(shí)別神經(jīng)網(wǎng)絡(luò)中,輸入通道的數(shù)量取決于圖像的顏色通道的數(shù)量。一般來說,用于分析CT的神經(jīng)網(wǎng)絡(luò)只有一個(gè)輸入通道,因?yàn)橐粋€(gè)CT掃描片是只有一個(gè)顏色通道的灰度圖像。肺部結(jié)節(jié)只是整個(gè)肺部CT圖像的一小部分,因此可以裁剪多個(gè)結(jié)節(jié)視圖,不同的視圖將提供不同的信息。具有小視場(chǎng)的斑塊可以提供結(jié)節(jié)的細(xì)節(jié),而具有大視場(chǎng)的斑塊可以提供腫瘤組織周圍的信息。
置信檢測(cè)模型一般采用3D深度卷積網(wǎng)絡(luò)且往往融合多尺度進(jìn)行集成訓(xùn)練提升分類的效果。集成學(xué)習(xí)(Ensemble learning)通過組合幾種模型來提高機(jī)器學(xué)習(xí)的效果。與單一模型相比,在許多著名的機(jī)器學(xué)習(xí)比賽(如 Netflix、KDD 2009 和 Kaggle比賽)中能夠取得很好的名次。LUNA16第二名組采用了多尺度的模型組合學(xué)習(xí)xgboost的思路,提高了學(xué)習(xí)的效果。訓(xùn)練過程還通過數(shù)據(jù)增強(qiáng)來防止過擬合。
5.性能評(píng)價(jià)
通過測(cè)量算法的檢測(cè)靈敏度和對(duì)應(yīng)的每次掃描的假陽性率來進(jìn)行評(píng)估。
五、行業(yè)和技術(shù)的發(fā)展期望
基于數(shù)據(jù)規(guī)模小、標(biāo)注質(zhì)量差、懂算法的不懂醫(yī)療的研發(fā)現(xiàn)狀,以及結(jié)合人工智能本身的特點(diǎn),談幾點(diǎn)個(gè)人的想法和建議:
1)目前數(shù)據(jù)是行業(yè)發(fā)展的瓶頸,數(shù)據(jù)積累與數(shù)據(jù)共通,是解決問題的關(guān)鍵;
2)人工智能模型和模式核心創(chuàng)新,降低對(duì)數(shù)據(jù)和人工標(biāo)注的依賴;
3)建設(shè)人才隊(duì)伍,包括科研人才、醫(yī)療專業(yè)性人才和工程化人才;
4)雙驅(qū)動(dòng)平臺(tái)建設(shè),打通業(yè)務(wù)和數(shù)據(jù)壁壘,構(gòu)建以知識(shí)驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)的優(yōu)勢(shì)互補(bǔ)的預(yù)防診斷系統(tǒng),并整合對(duì)接原有的HIS、PACS系統(tǒng);
5)從應(yīng)用看,醫(yī)療機(jī)器人、虛擬助手、風(fēng)險(xiǎn)預(yù)測(cè)、智能輔助診斷、細(xì)胞分析是未來的熱點(diǎn),但需要深耕細(xì)作,確保質(zhì)量和創(chuàng)新兩不誤。