孫海雙,楊曉燕,劉敏,代華平,王辰
1.吉林大學第一醫(yī)院呼吸與危重癥醫(yī)學科,吉林 長春 130021;2.中日友好醫(yī)院呼吸與危重癥醫(yī)學科 國家呼吸醫(yī)學中心 國家呼吸臨床研究中心 中國醫(yī)學科學院呼吸病學研究院,北京 100029;3.中國醫(yī)學科學院 北京協(xié)和醫(yī)學院,北京 100730;4.首都醫(yī)科大學,北京 100069;5.中日友好醫(yī)院放射診斷科,北京 100029;*通信作者 劉敏 mikie0763@126.com;代華平 daihuaping@ccmu.edu.cn
間質(zhì)性肺疾?。╥nterstitial lung disease,ILD)是一大類疾病的總稱,以肺泡和肺間質(zhì)廣泛的炎癥和纖維化為基本病變,最終可導致肺部結(jié)構(gòu)破壞和呼吸衰竭,嚴重威脅人類健康[1]。ILD有多個亞型,且不同亞型的自然病程、診療方法及預后差別較大[2]。目前診斷ILD主要依靠臨床-影像-病理3個方面相結(jié)合的模式。病理檢查是一種侵入性檢查方法,除給患者帶來身心與經(jīng)濟負擔外,還可能引起不同程度的并發(fā)癥。高分辨CT(high-resolution computed tomography,HRCT)能展現(xiàn)疾病的病灶形態(tài)及分布特點,實現(xiàn)對該疾病的初步診斷,具有清晰度高、無創(chuàng)性及可重復性等優(yōu)點,是ILD初步診斷及后期隨訪過程中評估疾病進程和預后的常用輔助檢查方法。然而,ILD的影像表現(xiàn)復雜,不同類型的ILD病灶極易混淆,且HRCT數(shù)據(jù)量較大,往往依靠醫(yī)師的主觀判斷;此外,我國醫(yī)療資源分配不均,醫(yī)師水平非同質(zhì)現(xiàn)象較為明顯,常導致ILD無法被及時、正確地診斷與評估。因此,開發(fā)自動算法識別不同類型的病灶,并進一步對病灶所占比例進行自動定量,提供更客觀、穩(wěn)定的結(jié)果,將極大地減輕醫(yī)師的負擔。本文擬深入分析人工智能改善ILD診斷評估的方式,重點是卷積神經(jīng)網(wǎng)絡(convolutional neural net-work,CNN)對ILD評估的研究進展。
1.1 人工智能的基本概念及在醫(yī)學中的應用 人工智能是當今科技發(fā)展最具代表性的前沿方向。作為可模擬人腦并對人類智能進行延伸的一類學習方法,人工智能技術(shù)目前已廣泛應用于醫(yī)學領域[3-9],在醫(yī)學影像診斷中的價值尤為突出。人工智能在部分領域中已接近甚至達到人類專家水平。人工智能輔助診斷已成為醫(yī)學發(fā)展的重要趨勢。
1.2 機器學習的基本概念及在醫(yī)學中的應用 機器學習是人工智能的一部分,是計算機在積累的數(shù)據(jù)中自動學習的人工智能領域。機器學習通過大量數(shù)據(jù)進行學習訓練,隨著經(jīng)驗的積累,具有更強的自主學習進化能力,而不是完全基于預先設定的規(guī)則,從而實現(xiàn)對模型準確率限制的突破,極大地提高了模型的效率。此外,機器學習允許被標記的放射學圖像作為輸入數(shù)據(jù),并為新出現(xiàn)的未知數(shù)據(jù)生成相應的標簽。
1.3 深度學習的基本概念 深度學習算法是機器學習的一個子集,深度學習因其能夠利用原始數(shù)據(jù)提取特征和預測結(jié)果而受到廣泛關注。深度學習意味著計算機擁有更復雜的多層算法,這些算法相互連接,并按重要性進行分層。實質(zhì)是構(gòu)建包含大量隱藏層的機器學習模型。這些層積累輸入數(shù)據(jù),并提供輸出,系統(tǒng)可以自主從輸入數(shù)據(jù)中學習到新的特征,并進行輸出,同時對模型進行優(yōu)化[10]。它可以通過海量訓練集學習有價值的特征,從而提升分類及診斷的準確性。然而,當隱藏層節(jié)點過多時,訓練時間會相應延長,導致泛化能力降低。此外,當訓練數(shù)據(jù)分類不平衡時,預測結(jié)果就出現(xiàn)偏倚,從而出現(xiàn)過擬合問題。這在某種程度上可以通過增加數(shù)據(jù)量、建立適量的隱藏層節(jié)點數(shù)、降維及減少模型復雜度改善。
1.4 CNN的基本概念 CNN作為監(jiān)督學習下的代表性深度學習模型,應用最為廣泛。CNN由3種結(jié)構(gòu)組成。其中卷積層利用特定大小的卷積核對深層次的特征進行提取和學習。池化層常位于卷積層的下一層,并對其提取到的特征進行壓縮和降維,以降低網(wǎng)絡參數(shù)的數(shù)量級,從而減少運算數(shù)據(jù)量[11]。而通過將提取到的特征以非線性的方式進行組合,并將其輸出,全連接層完成模型的最終步驟。近年,遷移學習打破訓練數(shù)據(jù)量不足對機器學習的限制,以前饋方式修正和優(yōu)化被其他數(shù)據(jù)訓練過的模型的低網(wǎng)絡層權(quán)重,再用現(xiàn)有數(shù)據(jù)訓練調(diào)整高網(wǎng)絡層權(quán)重。將遷移學習與CNN訓練相結(jié)合,可以降低算法對數(shù)據(jù)量的要求,縮短訓練時間,從而提高分類或診斷的準確性。圖1直觀展示了人工智能及其子領域的關系。概括來說,人工智能是用于開發(fā)和拓展人類智能的一項科學技術(shù);機器學習作為人工智能技術(shù)的一種,可以在沒有明確編程的情況下自動學習與優(yōu)化;深度學習是包含多層神經(jīng)網(wǎng)絡的機器學習技術(shù)。CNN作為一種前饋神經(jīng)網(wǎng)絡,是深度學習的代表算法之一。
圖1 人工智能的層次和子領域
HRCT可以通過展現(xiàn)ILD的病灶形態(tài)及分布特點,實現(xiàn)對該疾病的初步診斷,也是ILD隨訪過程中評估病情進展常用的輔助檢查。ILD在HRCT上的典型表現(xiàn)為網(wǎng)格影、蜂窩狀影、磨玻璃影、實變、微小結(jié)節(jié)、肺氣腫或以上各型的組合[12-13]。但在HRCT圖像上區(qū)分不同的肺組織模式極具挑戰(zhàn)性,尤其使用基于感興趣區(qū)的小樣本分類時,不同組織類別可能顯示相似的外觀,而同一組織類別的不同受試者之間可能存在顯著差異,因此當結(jié)果不確定或出現(xiàn)混合的影像學表現(xiàn)時,CNN往往需要大量的圖像樣本進行訓練。目前人工智能在ILD中的主要任務是肺部和病灶的分割以及疾病分類。
2.1 基于人工智能的ILD肺分割 準確的肺部分割是HRCT圖像分析的前提。分割錯誤導致的肺邊界不正確很可能影響后續(xù)分析。傳統(tǒng)的圖像處理方法對肺部疾病患者的肺邊界很難識別,因為這類疾病縮小了肺組織與周圍結(jié)構(gòu)的差別。為此,Park等[14]提出一種基于最先進的CNN分割架構(gòu)2D U-Net對包括隱源性機化性肺炎、尋常間質(zhì)性肺炎和非特異性間質(zhì)性肺炎在內(nèi)的ILD進行肺分割,并在單獨的訓練、驗證和測試集中對模型進行優(yōu)化。與傳統(tǒng)肺分割相比,深度學習方法顯示出更好的分割性能。然而對于肺門區(qū)域的分割仍有一定的偏差,即使在“金標準”中這種偏差也難以完全避免。未來的研究可以通過納入更大數(shù)量及更多種類的肺部疾病影像,設計更先進的模型強化對肺門區(qū)域的分割。
2.2 基于人工智能的ILD病灶分割 針對ILD的多種病灶,Anthimopoulos等[15]設計并訓練了最早的CNN之一,對ILD 6種病變模式與正常肺部組織的識別準確率達到85.5%,從而展示了深度學習對肺組織特異性的識別能力。但CNN尚不能良好地分辨紋理特征相似的肺間質(zhì)性病變,如易混淆的網(wǎng)格影、蜂窩狀影及磨玻璃影/網(wǎng)格影。但在臨床上,這些影像表現(xiàn)在區(qū)分非特異性間質(zhì)性肺炎和特發(fā)性肺纖維化中有重要意義。為了應對這些困難,Kim等[16]通過增加CNN卷積層的數(shù)量,準確率從81.27%提高至95.12%,降低了網(wǎng)格影/蜂窩狀影等易混淆模式之間的錯誤分辨率,并建議采用更復雜的深度學習方法診斷ILD。Wang等[17]提出一種多尺度旋轉(zhuǎn)不變的CNN算法,以克服患者在掃描過程中的運動和呼吸對肺體積大小的影響。錯誤率隨著CNN層數(shù)增加而降低,與Kim等[16]的研究類似。然而,這兩項研究相對復雜,需要大量的計算資源,對后期算法的應用及普及造成了一定困難。因此,基于有限的數(shù)據(jù)量及標注所需大量人力的現(xiàn)實問題,Huang等[12]采用無監(jiān)督的方式對未標注數(shù)據(jù)進行學習,并提出了一種新穎的兩階段遷移學習策略,成功降低了對訓練數(shù)據(jù)的需要和標注成本,促進深度學習在生物醫(yī)學領域的應用。此外,Bermejo-Peláez等[18]通過深度CNN的集合,納入2D、2.5D和3D架構(gòu),由此產(chǎn)生的集合性能對病灶識別平均敏感度達到91.41%,平均特異度為98.18%。隨著研究的深入,無監(jiān)督學習極大地減輕了人為標注所需的巨大工作量。同時,遷移學習通過增加樣本量解決了原始樣本數(shù)據(jù)短缺的問題?;谝陨霞夹g(shù)的改進,人工智能對病灶分類的準確性得到顯著提高,并為ILD疾病分類和預后評估提供了診斷基礎。
2.3 基于人工智能的ILD疾病分類 Walsh等[19]開發(fā)了一種具有人類專家水平的深度學習算法,用于在HRCT上對纖維化肺疾病進行分類。該算法的出色表現(xiàn)推動了深度學習在ILD診斷領域的研究進展。最近的一項研究[20]開發(fā)了一種基于機器學習的計算機輔助診斷算法對特發(fā)性肺纖維化進行分類,其準確率(81%)與放射科醫(yī)師相似,并且明顯高于Walsh等[19]的研究。由于不同類型ILD治療方法及預后差別較大,早期識別ILD的不同亞型有利于早期干預并改善預后,此外,人工智能在ILD分類中的應用,不僅可以減少不必要的有創(chuàng)檢查,也有利于評估預后,具有重要的臨床應用潛能。然而,上述研究主要專注于對ILD疾病的分類,而未對其進行精確的定量分析,這在疾病進展及預后評估中尤為重要。
2.4 基于人工智能的ILD嚴重程度評估 在人工智能逐步實現(xiàn)病灶識別及疾病分類的高準確率基礎上,其對于疾病嚴重程度的評估也取得了優(yōu)秀的成績。Zhang等[21]開發(fā)了一個基于胸片的CNN模型,對塵肺分期的準確率為92.7%,優(yōu)于兩組放射科醫(yī)師的準確率,這項開創(chuàng)性的工作在一定程度上證明了人工智能輔助醫(yī)學影像在職業(yè)性肺部疾病篩查和診斷中的可行性和有效性。與此同時,Aliboni等[22]開發(fā)了一種CNN算法以量化慢性過敏性肺炎的不同病灶模式,病灶分割準確率達到85.5%,同時證明纖維化的CT征象范圍與肺功能指數(shù)呈顯著負相關。人工智能對于ILD分期及定量分析具有里程碑式意義,對于臨床方案的制訂、實施和療效評估將具有重要的指導意義。然而,對于病灶定量分析的研究仍然缺乏,需要更多的研究結(jié)果對既往結(jié)論進行驗證。未來的研究應進一步擴大樣本量,對模型不斷進行優(yōu)化,并探索CNN在混合病灶檢測及量化上的性能。
基于人工智能的深度學習是實現(xiàn)精準醫(yī)療的重要手段。深度學習算法在ILD診斷中展現(xiàn)出良好的性能與應用潛能。在一些研究中,深度學習已經(jīng)達到甚至超出該領域?qū)<业脑\斷準確率。對于各類病變模式的識別在很大程度上降低了臨床醫(yī)師對邊緣化病變的錯誤診斷甚至漏診。尤其是對于ILD嚴重程度的評估具有重要臨床指導作用,并可以用于疾病發(fā)展的長期監(jiān)測。然而,深度學習在醫(yī)學影像中的應用仍然存在一些挑戰(zhàn)。首先,大規(guī)模醫(yī)學圖像的獲取較為困難,數(shù)據(jù)量的不足使算法容易出現(xiàn)過擬合問題。盡管遷移學習在一定程度上減少了算法對數(shù)據(jù)量的要求,但建立公共可用的醫(yī)學圖像數(shù)據(jù)庫仍然是最根本的解決辦法。其次,由于來自不同醫(yī)學中心的圖像質(zhì)量不盡相同,這對特征提取及結(jié)果輸出會產(chǎn)生一定影響,因此開發(fā)一種算法克服不同質(zhì)量圖像間的差異也是未來的研究方向。此外,深度學習是一種模擬人腦的算法,由于神經(jīng)網(wǎng)絡的相對不透明,很難可視化特定參數(shù)對算法最終輸出的貢獻。對于醫(yī)學這種要求極為嚴格和精確的科學,模型的可解釋性非常重要。因此,建立一種高質(zhì)量的標注的醫(yī)學圖像數(shù)據(jù)庫,開發(fā)更好的算法以可視化深層神經(jīng)網(wǎng)絡的內(nèi)部工作將是下一階段研究的熱點。相信隨著人工智能的進一步發(fā)展與完善,計算機輔助診斷技術(shù)將在醫(yī)學影像乃至整個醫(yī)學領域發(fā)揮關鍵作用。
利益沖突 所有作者均聲明不存在利益沖突