佟超 韓勇 馮巍 李偉銘 陶麗新 郭秀花
人工智能(artificial intelligence,AI)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。機(jī)器學(xué)習(xí)(machine learning,ML),是一種實(shí)現(xiàn)人工智能的方法,其應(yīng)用算法來解析數(shù)據(jù),像人一樣具有學(xué)習(xí)能力,對(duì)具體事件進(jìn)行決策和預(yù)測(cè)。而深度學(xué)習(xí)(deep learning,DL)是一種實(shí)現(xiàn)機(jī)器學(xué)習(xí)的技術(shù),是一種數(shù)據(jù)驅(qū)動(dòng)的自動(dòng)學(xué)習(xí)圖像中隱藏的高層次特征的方法,該方法能夠大幅度減少特征選擇時(shí)主觀因素的干擾;此外,該模型應(yīng)用了非線性層結(jié)構(gòu),能夠建立較為復(fù)雜的模型;另外,淺層神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)欠擬合,而DL可以通過增加網(wǎng)絡(luò)深度提高學(xué)習(xí)能力,使解決一些較復(fù)雜問題成為可能。因此,近些年該方法廣泛應(yīng)用于圖像分類、人臉識(shí)別及醫(yī)學(xué)圖像。
醫(yī)學(xué)圖像分割是DL應(yīng)用于醫(yī)學(xué)圖像分析的一個(gè)重要領(lǐng)域,它在圖像中自動(dòng)分割出感興趣區(qū)域,幫助后續(xù)的診斷及分析,有效避免醫(yī)生的主觀性影響[1]。腦腫瘤是指在顱腔中的異常生長(zhǎng)的新生物,對(duì)人體傷害非常大,常常產(chǎn)生頭痛、顱內(nèi)高壓等癥狀。由于根據(jù)腦腫瘤病理類型及發(fā)病部位的不同其治療方案也隨之改變,因此,正確對(duì)腦腫瘤進(jìn)行分割對(duì)其診治是十分重要的。Havaei 等[2]提出一種基于深度神經(jīng)網(wǎng)絡(luò)的全自動(dòng)腦圖像腫瘤分割方法,不僅在臨床診斷中有助于神經(jīng)系統(tǒng)疾病的評(píng)估,提高了模型速度,而且在基礎(chǔ)神經(jīng)科學(xué)研究中也具有重要作用。此外,毛雷[3]在研究中提出了基于卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)的腦腫瘤快速分割的方法,但由于磁共振成像(magnetic resonance imaging,MRI)像素類別不平衡而導(dǎo)致分割精度不高,針對(duì)該不足,又提出了基于深度級(jí)聯(lián)網(wǎng)絡(luò)的腦腫瘤分割方法,該方法能夠有效分割出完整的腦腫瘤區(qū)域,并大大提高了分割精度。
乳腺癌是由乳房組織惡性病變發(fā)展而成的癌癥,主要表現(xiàn)為乳房形狀改變、乳腺皮膚出現(xiàn)“橘皮樣改變“、乳頭溢液、無痛性腫塊等。乳腺癌是女性常見的惡性腫瘤之一,威脅女性的身心健康,是當(dāng)前社會(huì)的重大公共衛(wèi)生問題之一。Men等[4]為實(shí)現(xiàn)乳腺癌放射治療靶區(qū)的自動(dòng)分割,訓(xùn)練出一種深度殘差網(wǎng)絡(luò),該方法能夠準(zhǔn)確、快速分割出乳腺癌放療靶區(qū)。而在乳腺M(fèi)RI圖像上,腫塊型和非腫塊型之間形態(tài)差異較大,非腫塊型由于缺乏明確的邊界,診斷較為困難。目前缺乏針對(duì)非腫塊型乳腺腫瘤自動(dòng)分割的相關(guān)研究,針對(duì)該問題,馬偉等[5]研究出一套新的DL模型:首先利用YOLOv2良好的擬合性及運(yùn)行速度進(jìn)行粗監(jiān)測(cè);然后應(yīng)用SegNet模型進(jìn)行精細(xì)分割,為減少醫(yī)生工作量及輔助醫(yī)生診斷提供了可能。
肝癌是指發(fā)生于肝臟或從肝臟開始的惡性腫瘤,是目前我國(guó)高發(fā)的惡性腫瘤,主要表現(xiàn)為肋骨架右側(cè)下方疼痛,腹脹、黃疸、消瘦以及身體虛弱等。對(duì)肝臟腫瘤進(jìn)行精確分割是切除手術(shù)的第一步,但醫(yī)生手工勾畫病理區(qū)域由于邊界模糊問題使得分割較為困難。因此,Ahn等[6]為克服醫(yī)生手工勾畫病理區(qū)域的局限性,制定了基于深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolution neural network,DCNN)的肝癌自動(dòng)分割框架,結(jié)果表明該框架優(yōu)于手工勾畫。為解決CNN方法存在的計(jì)算量大、GPU內(nèi)存消耗大等問題,黃賽[7]提出了一種基于全卷積神經(jīng)網(wǎng)絡(luò)(fully convolutional networks,FCN)的U-net網(wǎng)絡(luò)模型,該模型能夠更精確地分割肝臟腫瘤。
淋巴結(jié)轉(zhuǎn)移是腫瘤最常見的轉(zhuǎn)移方式,一般先到達(dá)距離腫瘤最近的淋巴結(jié),隨后向相鄰的淋巴結(jié)擴(kuò)展。通過對(duì)轉(zhuǎn)移淋巴及腫大淋巴結(jié)進(jìn)行切割活檢,能夠有效進(jìn)行腫瘤病理分型,在腫瘤的診治中扮演著重要角色。因此,正確對(duì)淋巴結(jié)進(jìn)行分割對(duì)惡性腫瘤的診治發(fā)揮重要作用。Zhao等[8]提出了一個(gè)基于DL的多參數(shù)磁共振成像(mpMRI)全自動(dòng)淋巴結(jié)檢測(cè)與分割模型,該模型對(duì)于自動(dòng)分割淋巴結(jié)并對(duì)其進(jìn)行評(píng)估具有巨大潛力。淋巴瘤是起源于淋巴系統(tǒng)的惡性腫瘤,是由于淋巴細(xì)胞病變?cè)斐傻?。主要表現(xiàn)為無痛性淋巴結(jié)腫大、發(fā)熱、盜汗等癥狀。為實(shí)現(xiàn)淋巴瘤患者PET/CT中受累淋巴結(jié)的自動(dòng)分割,張璐等[9]提出了雙路全卷積神經(jīng)網(wǎng)絡(luò)——W-net,該方法對(duì)淋巴結(jié)具有更好的分割能力。
DL在醫(yī)學(xué)圖像分割領(lǐng)域的應(yīng)用還有很多。趙飛等[10]利用CNN對(duì)心臟CT圖像的感興趣區(qū)域進(jìn)行分割,該方法更有利于醫(yī)生對(duì)患者心臟健康狀況的判斷和對(duì)病變部位的觀察;由于肩關(guān)節(jié)MRI中骨結(jié)構(gòu)的精確分割對(duì)骨損傷的診治十分重要,劉云鵬等[11]應(yīng)用U-net和Alex Net對(duì)骨結(jié)構(gòu)進(jìn)行自動(dòng)分割;此外,冉昭等[12]利用U-net模型對(duì)直腸腫瘤MRI進(jìn)行全自動(dòng)分割,該模型能夠準(zhǔn)確勾畫腫瘤邊界。
如今,視功能損害眼病的發(fā)生會(huì)嚴(yán)重降低人們的生活質(zhì)量,因此,及時(shí)發(fā)現(xiàn)和治療微動(dòng)脈瘤是預(yù)防糖尿病視網(wǎng)膜病變等視功能損害眼病發(fā)展的關(guān)鍵步驟。Dai等[13]提出一個(gè)CNN模型,其利用臨床報(bào)告中的少量監(jiān)督信息,通過特征空間中的圖像來識(shí)別潛在的微動(dòng)脈瘤區(qū)域,該框架的準(zhǔn)確率為99.7%,具有一定的優(yōu)越性。在對(duì)成人糖尿病患者視網(wǎng)膜底圖像的評(píng)估中,Gulshan等[14]應(yīng)用DL創(chuàng)建了用于自動(dòng)檢測(cè)視網(wǎng)膜底照片中糖尿病性視網(wǎng)膜病變和糖尿病性黃斑水腫的算法,該算法對(duì)檢測(cè)糖尿病性視網(wǎng)膜病變具有較高的靈敏度和特異性。Ohsugi等[15]將CNN應(yīng)用于超寬視場(chǎng)眼底影像來偵測(cè)孔源性視網(wǎng)膜脫離,提高了偏遠(yuǎn)地區(qū)眼科門診的醫(yī)療水平。
肝癌是全世界癌癥相關(guān)死亡的第二大原因,人肝細(xì)胞癌(human hepatocellular carcinoma,HCC)是最常見的原發(fā)性肝癌。快速、可靠地檢測(cè)和診斷HCC可使這些患者更早開始治療并獲得更好的療效。有研究者提出了基于CNN,從6種常見肝臟病變類型中對(duì)具有典型影像學(xué)特征的病變進(jìn)行了分類診斷[16];Yasaka等[17]利用CNN的方法研究動(dòng)態(tài)造影劑增強(qiáng)CT對(duì)肝臟腫塊的鑒別診斷;茹仙古麗等[18]通過改進(jìn)CNN Inception V3 模型對(duì)肝臟組織切片圖像進(jìn)行分類,分類效果較好。
肺癌是最常見的癌癥死亡原因,肺癌篩查對(duì)降低肺癌死亡率具有重要意義。Ardila等[19]使用DCNN來學(xué)習(xí)特征,對(duì)肺癌進(jìn)行篩查,結(jié)果優(yōu)于6位放射科醫(yī)生;Ciompi等[20]提出一種基于多尺度卷積網(wǎng)絡(luò)的DL系統(tǒng),該系統(tǒng)能自動(dòng)對(duì)所有肺結(jié)節(jié)進(jìn)行分類;Jiang等[21]設(shè)計(jì)了一個(gè)四通道CNN模型,能夠有效提高肺結(jié)節(jié)的檢測(cè)性能,大大降低在大量圖像數(shù)據(jù)下的誤報(bào)率;Coudray等[22]訓(xùn)練了一個(gè)CNN模型,能夠準(zhǔn)確和自動(dòng)地對(duì)腺癌、鱗狀細(xì)胞癌或正常肺組織進(jìn)行多分類診斷,從而提高了精準(zhǔn)藥物使用范圍和性能。肺纖維化是肺部疾病的終末期改變,能導(dǎo)致肺功能進(jìn)行性喪失。有研究人員應(yīng)用CNN檢測(cè)慢性阻塞性肺疾病,并預(yù)測(cè)吸煙者的急性呼吸道疾病和死亡率,在肺纖維化疾病的診斷中起重要作用[23];Walsh等[24]開發(fā)了一種DL算法,該算法可在高分辨率CT上提供纖維性肺病的自動(dòng)分類,不僅成本低、可重復(fù),而且準(zhǔn)確性高。
DL所涉及的醫(yī)學(xué)圖像識(shí)別領(lǐng)域眾多,其在醫(yī)學(xué)方面產(chǎn)生著巨大影響。Nardelli等[25]提出利用三維卷積神經(jīng)網(wǎng)絡(luò)將胸部CT圖像中的血管分為動(dòng)脈和靜脈,整體準(zhǔn)確度達(dá)94%;Zreik等[26]應(yīng)用CNN以自動(dòng)識(shí)別功能性冠狀動(dòng)脈狹窄患者;Han等[27]應(yīng)用CNN學(xué)習(xí)算法對(duì)12種皮膚疾病的臨床圖像進(jìn)行分類,診斷敏感性得到提高;CNN在鑒別角質(zhì)形成細(xì)胞癌與良性脂溢性角化病,惡性黑色素瘤與良性痣這兩項(xiàng)任務(wù)上均達(dá)到了與所有測(cè)試過的專家相同的性能,表明其能對(duì)皮膚癌進(jìn)行分類,具有與皮膚科醫(yī)生相當(dāng)?shù)哪芰28];研究人員通過使用大腦的18F-氟脫氧葡萄糖PET,開發(fā)了用于早期預(yù)測(cè)阿爾茨海默病的DL算法,該模型具有100%敏感性、82%的特異性[29];Peng 等[30]基于CNN方法對(duì)晚期鼻咽癌的個(gè)體誘導(dǎo)化療價(jià)值進(jìn)行評(píng)估,可作為預(yù)測(cè)晚期鼻咽癌預(yù)后的有力工具;Jeyaraj等[31]通過研究患者的高光譜圖像,提出的CNN算法提高了口腔醫(yī)學(xué)診斷的復(fù)雜醫(yī)學(xué)圖像的診斷質(zhì)量;Lee等[32]將CNN用于甲狀腺癌頸淋巴結(jié)轉(zhuǎn)移的CT診斷,能在術(shù)前對(duì)甲狀腺癌患者的頸淋巴結(jié)轉(zhuǎn)移進(jìn)行準(zhǔn)確分類;Gandomkar等[33]利用深度殘差網(wǎng)絡(luò)對(duì)乳腺組織病理圖像進(jìn)行多類別診斷;Bien等[34]利用CNN對(duì)膝關(guān)節(jié)MRI檢查的臨床病理進(jìn)行分類。
DL的最新進(jìn)展為醫(yī)學(xué)圖像自動(dòng)分割與分析提供了新的思路,使人們能夠從數(shù)據(jù)中發(fā)現(xiàn)圖像中的形態(tài)或紋理模式,已經(jīng)在不同的醫(yī)學(xué)領(lǐng)域中取得了重大進(jìn)步。但是,由于DL模型的黑盒狀特征,直觀地理解和解釋所學(xué)習(xí)的模型仍然是一個(gè)需要解決的難題。對(duì)醫(yī)學(xué)圖像采用DL法進(jìn)行智能化分割診斷,具有廣闊的應(yīng)用空間和前景。