李艷紅 任俊宇 孫希文 黃海量
肺癌作為全球發(fā)病率第二、死亡率第一的惡性腫瘤,嚴(yán)重影響人類(lèi)健康。肺結(jié)節(jié)作為肺癌的初期表現(xiàn),及時(shí)地發(fā)現(xiàn)和準(zhǔn)確地診斷其良惡性使患者及早接受治療,避免錯(cuò)診漏診,對(duì)于肺癌防治及肺結(jié)節(jié)的治療具有重要的意義[1]。CT 圖像作為肺結(jié)節(jié)診斷的首選,具有無(wú)創(chuàng)及分辨率高等優(yōu)點(diǎn),美國(guó)肺部篩查試驗(yàn)的報(bào)告[2]表明,使用CT 圖像進(jìn)行診斷使得肺癌死亡率降低20%。但是由于肉眼難辨別肺結(jié)節(jié),早期肺癌從影像上不易診斷,仍然存在較高的誤診率和漏診率。隨著近年AI 技術(shù)的快速發(fā)展與應(yīng)用,其在肺結(jié)節(jié)的輔助診斷方面發(fā)揮著重大作用。
本研究借助文獻(xiàn)可視化工具CiteSpace 構(gòu)建各種可視化知識(shí)圖譜,梳理AI 輔助肺結(jié)節(jié)診斷的研究進(jìn)展,發(fā)現(xiàn)該領(lǐng)域的關(guān)鍵文獻(xiàn)、重點(diǎn)期刊、活躍作者、核心機(jī)構(gòu)等,厘清它們之間的合作情況以及自身狀態(tài),有助于該領(lǐng)域的研究者或科研團(tuán)隊(duì)把握發(fā)展方向,尋求更有效合作和科研成果的傳播,推動(dòng)AI 更好地賦能肺結(jié)節(jié)診斷。
以Web of Science (WOS)核心合集數(shù)據(jù)庫(kù)為檢索的數(shù)據(jù)來(lái)源。
檢索策略: 所有字段為(ai OR artificial intelligence OR deep learning OR machine learning OR computer - assisted diagnosis OR computer aided diagnosis) AND pulmonary nodule,獲得相關(guān)文獻(xiàn)1 468篇。
CiteSpace 5.5 R2 軟件選項(xiàng)設(shè)置如下。Time Slicing: from 2003 JAN to 2023 JAN, #Years Per Slice: 1; Selection Criteria: g-index, k=25。其含義為以1年為單位時(shí)間來(lái)劃分2003—2023年的數(shù)據(jù),取出每個(gè)單位時(shí)間內(nèi)g 指數(shù)為前25 的節(jié)點(diǎn)進(jìn)行可視化。
將檢索得到數(shù)據(jù)全記錄與引用的參考文獻(xiàn)從WOS 中導(dǎo)出后導(dǎo)入到CiteSpace,繪制相關(guān)可視化知識(shí)圖譜,依次分析合作作者、合作機(jī)構(gòu)、合作國(guó)家、作者共被引、期刊共被引、文獻(xiàn)共被引和關(guān)鍵詞共現(xiàn)。通過(guò)綜合對(duì)應(yīng)時(shí)間跨度內(nèi)結(jié)點(diǎn)的出現(xiàn)頻次、中心度以及突現(xiàn)性強(qiáng)度等參數(shù)分析AI 技術(shù)在輔助肺結(jié)節(jié)診斷方面的研究現(xiàn)狀、熱點(diǎn)及問(wèn)題。
對(duì)CiteSpace 軟件生成結(jié)果的說(shuō)明:合作圖譜和共被引圖譜中,N 表示節(jié)點(diǎn)/數(shù)量,出現(xiàn)頻次或被引頻次越多,N 值越大,相應(yīng)的節(jié)點(diǎn)就越大。采用節(jié)點(diǎn)的年輪表示方法,節(jié)點(diǎn)的年輪圓圈半徑表示不同年份發(fā)表論文或者被引的頻次,某一時(shí)間段年輪越寬,則對(duì)應(yīng)時(shí)間段出現(xiàn)或被引次數(shù)越高。E 表示節(jié)點(diǎn)之間的連線,連線存在表示出現(xiàn)或共引關(guān)系。連線的粗細(xì),表示共現(xiàn)或共引的強(qiáng)度,連線的顏色則對(duì)應(yīng)節(jié)點(diǎn)第一次共現(xiàn)或共引的時(shí)間。顏色從冷色到暖色的變化表示時(shí)間從早期到近期的變化[3]。CiteSpace 用中介中心性來(lái)測(cè)度節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要性。突現(xiàn)性強(qiáng)度是目標(biāo)在短時(shí)間內(nèi)呈快速上漲趨勢(shì)的情況,可以揭示研究熱點(diǎn)。共現(xiàn)或共被引圖譜中的紫色外圈標(biāo)注,表明該結(jié)點(diǎn)中心性大于0.1,代表一個(gè)領(lǐng)域的關(guān)鍵點(diǎn)或轉(zhuǎn)折點(diǎn)。
1.1 作者分布
作者共線可視化圖譜可以提供有影響力的研究團(tuán)隊(duì)和潛在的合作者信息,可以幫助研究者建立合作關(guān)系[4]。它根據(jù)施引文獻(xiàn)中作者合作的情況繪制,兩作者出現(xiàn)在同一篇文章中即視為一次合作。圖1 的作者共現(xiàn)圖譜中N=739,E=1 564。節(jié)點(diǎn)主要呈現(xiàn)5 簇分布,簇與簇之間界限清晰。圖2 是該領(lǐng)域中發(fā)文突現(xiàn)性強(qiáng)度較大的TOP10 作者,可見(jiàn)呈階段式更迭,我國(guó)學(xué)者占一席之地。李強(qiáng)是該領(lǐng)域發(fā)文量排名第十位的作者,曾引領(lǐng)研究熱點(diǎn)。在AI 輔助肺結(jié)節(jié)診斷發(fā)文量TOP10的作者中,排名第1位的發(fā)文量(26)遠(yuǎn)大于其他作者,第2 至10 位的作者發(fā)文量差距較小,中心性指標(biāo)均遠(yuǎn)小于0.1。
圖1 作者共現(xiàn)圖譜
圖2 突現(xiàn)性較高的TOP10作者
1.2 機(jī)構(gòu)分布
AI 輔助肺結(jié)節(jié)診斷方面發(fā)文量TOP10 的機(jī)構(gòu)以高校為主。TOP10 中,美國(guó)機(jī)構(gòu)3 所,為排名第1、7、8 的芝加哥大學(xué)、紐約大學(xué)、哈佛大學(xué)醫(yī)學(xué)院;韓國(guó)機(jī)構(gòu)2 所,為排名第4、10 的國(guó)立首爾大學(xué)、蔚山大學(xué);中國(guó)機(jī)構(gòu)5 所,為排名第2、3、5、6、9 的上海交通大學(xué)、復(fù)旦大學(xué)、東北大學(xué)、中國(guó)科學(xué)院以及華中科技大學(xué)。芝加哥大學(xué)于2003年開(kāi)啟該方面的研究,中心性最高,達(dá)0.14,為該研究領(lǐng)域的開(kāi)創(chuàng)者,且深耕于此領(lǐng)域的時(shí)間最長(zhǎng)。上海交通大學(xué)中心性?xún)H次于芝加哥大學(xué),為0.10,亦為該領(lǐng)域的核心研究機(jī)構(gòu)。圖3 機(jī)構(gòu)共現(xiàn)圖譜中N=549,E=936。左上方以芝加哥大學(xué)為代表的節(jié)點(diǎn)簇之間連線較多。右上角的中國(guó)研究機(jī)構(gòu)節(jié)點(diǎn)簇之間連線也較為緊密,但與國(guó)外研究機(jī)構(gòu)之間的連線較為稀疏。芝加哥大學(xué)是唯一一所具有紫色外圈的研究機(jī)構(gòu)。根據(jù)圖4 突現(xiàn)性分析,上海交通大學(xué)近3年科研成果井噴式出現(xiàn),發(fā)展迅速。
圖3 機(jī)構(gòu)共現(xiàn)圖譜
圖4 突現(xiàn)性較高的TOP 5機(jī)構(gòu)
1.3 國(guó)家分布
圖5 國(guó)家共現(xiàn)圖譜中N=62,E=270。德國(guó)、日本、巴基斯坦、意大利、美國(guó)這5 個(gè)國(guó)家內(nèi)圈均有較為明顯的紅色年輪,其中巴基斯坦、德國(guó)的紅色圈占年輪面積比例較大,它們?cè)缙跒榇祟I(lǐng)域做出較大貢獻(xiàn)。具有紫色外圈的國(guó)家有美國(guó)、中國(guó)、印度、英國(guó)、韓國(guó)、巴基斯坦,這6 個(gè)國(guó)家均具有大于等于0.1 的中心性,其值分別為0.69、0.16、0.15、0.12、0.10、0.10。AI 應(yīng)用于肺結(jié)節(jié)方面發(fā)文量最高的3 個(gè)國(guó)家分別是:中國(guó)(478 篇)、美國(guó)(466 篇)和日本(118 篇),中美兩國(guó)的發(fā)文量顯著高于位居第3 的日本。
圖5 國(guó)家共現(xiàn)圖譜
2.1 作者共被引
作者共被引分析通過(guò)分析不同作者發(fā)表的文獻(xiàn)同時(shí)被其他文獻(xiàn)引用的情況,從而確定作者之間研究主題的關(guān)系[5]。由圖6 作者共被引圖譜可知,代表早年被引作者的紫色節(jié)點(diǎn)聯(lián)系緊密,代表近年被引作者的紅黃色節(jié)點(diǎn)簇亦聯(lián)系緊密,二者之間有少量的相互交融,網(wǎng)絡(luò)的顏色逐漸過(guò)渡,過(guò)渡節(jié)點(diǎn)較大。紫色節(jié)點(diǎn)相對(duì)于紅黃色節(jié)點(diǎn)半徑都較小。根據(jù)圖7,突現(xiàn)性較高的TOP5 被引作者其突現(xiàn)性均出現(xiàn)在2018年及以后。文獻(xiàn)被引頻次排名前10 位作者都不具有大于0.1的中心性。
圖6 作者共被引圖譜
圖7 突現(xiàn)性較高的TOP5被引作者
2.2 期刊共被引
期刊共被引分析是指2 個(gè)期刊共同出現(xiàn)在第3 個(gè)期刊所發(fā)布施引文獻(xiàn)的參考文獻(xiàn)目錄中,通過(guò)它可以對(duì)期刊進(jìn)行定位和分類(lèi)[6]。由圖8 可知,突現(xiàn)性較高的TOP5 被引期刊其突現(xiàn)性均自2020年及以后出現(xiàn)。從圖9 期刊共被引圖譜可見(jiàn)節(jié)點(diǎn)數(shù)目和連線眾多,不同期刊之間均存在連線。在肺結(jié)節(jié)領(lǐng)域被引頻率排名前3 的期刊是RADIOLOGY、MED PHYS、IEEE T MED IMAGING,排名第5到10位的期刊被引頻次較相近,各期刊中心性均不超過(guò)0.1。
圖8 突現(xiàn)性較高的TOP5被引期刊
圖9 期刊共被引圖譜
2.3 文獻(xiàn)共被引
參考文獻(xiàn)共被引是指2 篇文獻(xiàn)共同出現(xiàn)在第3 篇施引文獻(xiàn)的參考文獻(xiàn)目錄中。圖10 文獻(xiàn)共被引知識(shí)圖譜中早期深色節(jié)點(diǎn)到近期淺色結(jié)點(diǎn)均勻過(guò)度,過(guò)度節(jié)點(diǎn)較大,與圖6 作者共被引圖譜類(lèi)似。除去相關(guān)指南和倡議,被引量位居前三的文獻(xiàn)分別為:低劑量CT 篩查降低肺癌死亡率,CT 圖像中肺結(jié)節(jié)檢測(cè):使用多視圖卷積網(wǎng)絡(luò)減少假陽(yáng)性,CT 圖像中肺結(jié)節(jié)自動(dòng)檢測(cè)算法的驗(yàn)證、比較和組合:LUNA16挑戰(zhàn)。各文獻(xiàn)的中心性指標(biāo)均尚未達(dá)到0.1。
圖10 文獻(xiàn)共被引圖譜
另外發(fā)現(xiàn),參考文獻(xiàn)突現(xiàn)性最持久的4 條文獻(xiàn)突現(xiàn)性集中出現(xiàn)在2003—2014年,其研究主題分別為:早期肺癌行動(dòng)項(xiàng)目:基線篩查的總體設(shè)計(jì)和結(jié)果;基于改進(jìn)模板匹配技術(shù)的螺旋CT圖像肺結(jié)節(jié)自動(dòng)檢測(cè);螺旋CT 肺結(jié)節(jié)自動(dòng)檢測(cè):計(jì)算機(jī)輔助診斷系統(tǒng)的臨床應(yīng)用;CT 掃描中肺結(jié)節(jié)的計(jì)算機(jī)檢測(cè)。自2017年以來(lái)突現(xiàn)性最強(qiáng)的兩篇文章研究主題分別為:低劑量胸部計(jì)算機(jī)斷層掃描三維深度學(xué)習(xí)的端到端肺癌篩查,2018年全球癌癥統(tǒng)計(jì)數(shù)據(jù):GLOBOCAN 估計(jì)全球185個(gè)國(guó)家36種癌癥的發(fā)病率和死亡率。
共現(xiàn)關(guān)鍵詞反映了AI在肺結(jié)節(jié)領(lǐng)域的研究重點(diǎn)。該領(lǐng)域出現(xiàn)頻次排名前20 的關(guān)鍵詞有:肺結(jié)節(jié),肺癌,分類(lèi),計(jì)算機(jī)輔助診斷,深度學(xué)習(xí),CT,診斷,劃分,計(jì)算機(jī)輔助檢測(cè),斷層攝影技術(shù),卷積神經(jīng)網(wǎng)絡(luò),胸部CT,自動(dòng)檢測(cè),CT 圖像等。由圖11 可見(jiàn),高頻出現(xiàn)詞之間聯(lián)系緊密。研究AI 輔助診斷肺結(jié)節(jié)2018—2023年出現(xiàn)的突現(xiàn)詞,發(fā)現(xiàn)突現(xiàn)強(qiáng)度較高的五個(gè)詞分別為:假陽(yáng)性減少,卷積神經(jīng)網(wǎng)絡(luò),機(jī)器學(xué)習(xí),深度學(xué)習(xí),人工智能。
圖11 關(guān)鍵詞聚類(lèi)標(biāo)簽圖譜
肺結(jié)節(jié)可指示多類(lèi)病灶的存在,諸如:腫瘤、炎癥、結(jié)核、結(jié)締組織疾病等,且結(jié)節(jié)形態(tài)各異、大小不一,肉眼識(shí)別大小至亞厘米級(jí)別的肺部小結(jié)節(jié)尤其困難,而密度較低的磨玻璃結(jié)節(jié)識(shí)別更加不易[7]。臨床醫(yī)生診斷識(shí)別肺結(jié)節(jié)需要耗費(fèi)大量時(shí)間精力,仍難以避免誤漏診現(xiàn)象。因此,借助AI算法等現(xiàn)代科技幫助臨床醫(yī)生識(shí)別診斷肺結(jié)節(jié),對(duì)提高就診效率和降低誤漏診率有重要意義。利用文獻(xiàn)可視化工具CiteSpace對(duì)相關(guān)文獻(xiàn)進(jìn)行分析,主要討論和結(jié)論如下:
已有諸多機(jī)構(gòu)開(kāi)展過(guò)或正在開(kāi)展AI 輔助肺結(jié)節(jié)診斷相關(guān)工作。研究機(jī)構(gòu)以高校為主,各國(guó)科研機(jī)構(gòu)之間的合作較少??蒲挟a(chǎn)出較多的機(jī)構(gòu)主要分布在美國(guó)、中國(guó)。美國(guó)作為較早將計(jì)算機(jī)輔助診斷應(yīng)用于臨床試驗(yàn)的國(guó)家,中心性位居第1 且遠(yuǎn)超其他國(guó)家,處于核心地位。芝加哥大學(xué)作為美國(guó)該領(lǐng)域研究的開(kāi)創(chuàng)者,自2003年開(kāi)始AI 輔助肺結(jié)節(jié)診斷的研究,研究成果自此至2009年激增,至今仍具有最高的機(jī)構(gòu)中心性。值得注意的是,以上海交通大學(xué)、復(fù)旦大學(xué)為首的中國(guó)研究機(jī)構(gòu)作為后起之秀,近10年來(lái)研究成果迅速增多。中國(guó)機(jī)構(gòu)目前發(fā)文量位居全球第1(478 篇),領(lǐng)先美國(guó)發(fā)文量(466 篇)。國(guó)內(nèi)各高校研究機(jī)構(gòu)的合作網(wǎng)絡(luò)較為緊密,但與國(guó)外起步較早的知名研究機(jī)構(gòu)合作較少。上海交通大學(xué)自2020年來(lái)研究成果激增,具有世界第2 名的中心性影響力。基于此,我國(guó)研究機(jī)構(gòu)應(yīng)積極利用國(guó)內(nèi)外已有研究成果,深化與國(guó)內(nèi)外研究機(jī)構(gòu)的合作,保持近年來(lái)迅猛的研究勢(shì)頭,爭(zhēng)取在AI 輔助肺結(jié)節(jié)診斷方面取得更廣泛的合作成果。
AI 輔助肺結(jié)節(jié)研究領(lǐng)域存在權(quán)威期刊,也有短期內(nèi)成長(zhǎng)的期刊,各期刊聯(lián)系廣泛,目前尚未出現(xiàn)核心期刊。RADIOLOGY 為該領(lǐng)域起步最早的期刊,在2003—2013年發(fā)展迅速,該時(shí)段對(duì)應(yīng)于美國(guó)研究機(jī)構(gòu)產(chǎn)出最多的時(shí)段。快速成長(zhǎng)型期刊集中出現(xiàn)在2020年以后,可能因?yàn)殛P(guān)注或迎合了切中該研究領(lǐng)域要害的核心技術(shù)。該研究該領(lǐng)域的期刊多元化發(fā)展,影響因子較高的期刊未必是核心期刊,如LECT NOTES COMPUT SC 的被引量位居第10 位,但其中心性高出被引量位居第1 名的RADIOLOGY 4 個(gè)百分點(diǎn)。提示研究學(xué)者關(guān)注權(quán)威期刊的同時(shí),也應(yīng)了解新興成長(zhǎng)的期刊。
該研究領(lǐng)域尚未出現(xiàn)核心作者和核心文獻(xiàn),各國(guó)研究正多線并行開(kāi)展。被引量高的和突現(xiàn)性強(qiáng)的文獻(xiàn)值得關(guān)注。2018年出現(xiàn)部分作者被引頻次激增的現(xiàn)象,可能因?yàn)橥瓿霈F(xiàn)了具有影響力的研究成果,是該研究領(lǐng)域的重要時(shí)點(diǎn)。早期研究學(xué)者與最新研究成果有聯(lián)系但較弱,算法的更迭帶來(lái)研究熱點(diǎn)和方向的變化。關(guān)鍵詞分析表明“神經(jīng)網(wǎng)絡(luò)算法”自2017年起逐漸被研究者們所關(guān)注,和“CT”“計(jì)算機(jī)輔助診斷”成為AI輔助肺結(jié)節(jié)研究領(lǐng)域中的熱點(diǎn)研究話題。該領(lǐng)域研究者應(yīng)結(jié)合近年AI 最新成果充分發(fā)掘潛在問(wèn)題,拓寬研究思路。
AI 在肺結(jié)節(jié)領(lǐng)域研究的重點(diǎn)是利用基于深度學(xué)習(xí)開(kāi)發(fā)的AI 軟件提取肺結(jié)節(jié)特征,對(duì)其進(jìn)行選擇和分類(lèi),減輕影像科醫(yī)師工作負(fù)擔(dān)的同時(shí)提升鑒別肺結(jié)節(jié)良惡性的精確度[8],以便進(jìn)行后續(xù)的病因診斷分析和治療工作。此領(lǐng)域受AI 算法迭代更新影響較大,后繼應(yīng)該更關(guān)注AI 算法等新技術(shù)的使用以及近年來(lái)新研究結(jié)果的迭代。我國(guó)醫(yī)學(xué)影像AI 產(chǎn)業(yè)仍處于發(fā)展階段,機(jī)遇與挑戰(zhàn)并存[9],我國(guó)科研機(jī)構(gòu)、團(tuán)體和學(xué)者應(yīng)繼續(xù)保持積極探索的態(tài)度,不囿于國(guó)界、機(jī)構(gòu)和專(zhuān)業(yè)范圍,在基礎(chǔ)診斷的基礎(chǔ)上,輔以AI新技術(shù)、新算法的應(yīng)用,力爭(zhēng)在AI 輔助肺結(jié)節(jié)診斷方面取得更大突破與進(jìn)步。
中國(guó)醫(yī)學(xué)計(jì)算機(jī)成像雜志2023年5期