付姣慧,常曉丹,沙俏麗,郭維亞
[1.大連市婦女兒童醫(yī)療中心(集團)放射科,遼寧 大連 116011;2.大連大學附屬中山醫(yī)院影像科,遼寧 大連 116001]
近年來,人工智能(artificial intelligence, AI)蓬勃發(fā)展,其與醫(yī)學影像學相結(jié)合,逐漸用于產(chǎn)業(yè)、教育及科研機構(gòu),并取得快速發(fā)展[1]。目前AI在醫(yī)學影像學領(lǐng)域的應(yīng)用已從簡單的識別圖像發(fā)展到基于醫(yī)學影像大數(shù)據(jù)對數(shù)據(jù)進行深入挖掘和應(yīng)用,并通過算法訓練分析圖像并得出診斷[2]。其中以深度卷積神經(jīng)網(wǎng)絡(luò)理論為核心的深度學習(deep learning, DL)模型具有更強的學習能力和獨立學習、進化能力,能通過大量學習數(shù)據(jù)突破 AI模型精度的瓶頸,以更有效地利用模型精準分析數(shù)據(jù)[1]。在醫(yī)學影像學領(lǐng)域,DL常用于建立篩選模型、診斷模型和治療計劃模型[3]。
文獻計量分析是利用數(shù)學、統(tǒng)計和制圖知識領(lǐng)域方法對相關(guān)文獻進行評估及分析的方法。本文利用Web of Science核心合集(Web of Science Core Collection,WoSCC)(https://webofknowledge.com/)數(shù)據(jù)庫,對已發(fā)表的關(guān)于DL用于醫(yī)學影像學研究的文獻進行計量分析,評估該領(lǐng)域最具影響力的文獻和科研熱點。
1.1 檢索策略 在線檢索《科學引文索引擴展》數(shù)據(jù)庫中的WoSCC(https://webofknowledge.com/)數(shù)據(jù)庫,檢索時間截止至2021年3月28日,檢索關(guān)鍵詞為“deep learning”和“medic* imag*”,檢索時間2011年—2020年,文獻類型和語言不限。對來自英格蘭、蘇格蘭、北愛爾蘭和威爾士的文獻進行單獨分析(而非視為英國),將來自中國香港地區(qū)的文獻納入中國進行整體分析。將檢索結(jié)果另存為帶有完整記錄和引用參考文獻的純文本文件,記錄其基本信息,包括國家、組織、作者、期刊、參考文獻、題目、摘要及關(guān)鍵詞。
1.2 文獻計量和可視化分析 采用VOSviewer 1.6.15軟件(www.vosviewer.com)對文獻進行計量和可視化分析,在線獲得VOSviewer V 1.6.15手冊(https://www.vosviewer.com/documentation/Manual_VOSviewer_1.6.15.pdf)。節(jié)點鏈接圖包括研究人員、期刊、個人出版物或重要主題詞,并可基于共同著作、共同引用或共同存在關(guān)系構(gòu)建。共檢出2 199篇包含完整研究結(jié)果的文獻,獲得以下指標:①每年發(fā)表論文數(shù)量;②發(fā)表論文和引用次數(shù)排名前10位的國家;③最具影響力的前10個研究機構(gòu);④發(fā)表論文最多的前10名作者和共引用作者(其文章被其他作者共同引用);⑤排名前10位的共引參考文獻。采用CiteSpace 5.6.R2(Drexel University, Philadelphia, PA)捕獲高引用關(guān)鍵詞,以之為研究前沿的預測指標。
2.1 總體趨勢 2011年—2020年發(fā)表的關(guān)于DL用于醫(yī)學影像學的文獻總數(shù)從0篇增加到1 233篇(圖1)。經(jīng)分析后提取頻次增長量最高的前25個關(guān)鍵詞,其中“fully convolutional network”一詞從2018年開始爆發(fā)性增長(圖2),與近3年發(fā)表的神經(jīng)卷積網(wǎng)絡(luò)相關(guān)論文發(fā)表量大幅增加一致。
圖1 2011年—2020年DL用于醫(yī)學影像學研究的各年度文獻發(fā)表量
圖2 2011年—2020年發(fā)表的DL用于醫(yī)學影像學研究文獻中頻次增長量最多的前25個關(guān)鍵詞(紅色為增長最快的年份)
2.2 國家文獻總量分析和科研合作網(wǎng)絡(luò) 2 199篇文獻來自86個國家及地區(qū)。如表1所示,從事醫(yī)學影像學AI研究最多的前3個國家中,中國的文獻數(shù)量最多,為689篇(689/2 199,31.33%),美國次之,為593篇(593/2 199,26.97%),之后為韓國,共173篇(173/2 199,7.87%)。引文分析結(jié)果顯示,在總被引頻次方面,美國居首位,為19 777次,其次是中國(8 674次)和荷蘭(5 404次)。
表1 2011年-2020年發(fā)表的DL用于醫(yī)學影像學文獻量排名前10位的國家及其總被引頻次
國家合作分析反映國家之間的交流程度及該領(lǐng)域中具有影響力的國家。節(jié)點圖中,國家的節(jié)點越大,代表其在該領(lǐng)域的影響力越高;節(jié)點之間鏈接的粗細和距離代表國家之間的合作關(guān)系。圖3顯示,在DL用于醫(yī)學影像學研究方面,中國與許多國家,如美國、英國、澳大利亞、日本和加拿大均有深入合作,而地理距離并非影響合作關(guān)系的主要因素。
圖3 將DL用于醫(yī)學影像學研究的國際合作情況(發(fā)表文獻最小數(shù)量設(shè)定為5篇;共納入86個國家及地區(qū),其中53個達到閾值) 圖4 將DL用于醫(yī)學影像學研究的主要研究機構(gòu)的協(xié)作網(wǎng)絡(luò)(將組織、機構(gòu)的最小文獻量設(shè)定為10篇,2 841個組織、機構(gòu)中,81個達到閾值,其中5個機構(gòu)由于不包含所分析字段數(shù)據(jù)而被排除)
2 199篇文獻來自于2 841個研究機構(gòu)。排名前10位的研究機構(gòu)共發(fā)表348篇文獻,占總數(shù)的15.83%(348/2 199)(表2)。圖4顯示將DL用于醫(yī)學影像學研究的各機構(gòu)的協(xié)作網(wǎng)絡(luò),節(jié)點大小對應(yīng)發(fā)表文獻數(shù)量,節(jié)點之間的鏈接表示協(xié)作關(guān)系,鏈接強度越高,代表協(xié)作越緊密。
表2 2011年-2020年發(fā)表的DL用于醫(yī)學影像學研究的文獻量排名前10位的機構(gòu)
2 199篇文章出自9 861名作者。全部作者中,SHEN DG(17篇)發(fā)表文獻量排名第一,其次是WANG G(14篇)和QIN(10篇),均為英文文獻。所有共引用作者中,LECUN Y據(jù)于首位,被共同引用892次,其次是HE K M(被共同引用865次)和KRIZHEVSKY A(被共同引用767次)(表3)。
表3 2011年-2020年發(fā)表的DL用于醫(yī)學影像學文獻量排名前10位的作者及共引用作者
通過對被引用參考文獻進行共引分析,可有效建立AI醫(yī)學影像知識庫。將引用參考文獻的最小被引用次數(shù)設(shè)置為50。2 199篇文獻共引用67 178條參考文獻,其中77條引用參考文獻達到閾值50。表4所列為被引用次數(shù)最多的10條參考文獻。
表4 2011年-2020年將DL用于醫(yī)學影像學研究的排名前10位的共引文獻
利用智能圖像識別技術(shù)可顯著減輕醫(yī)師工作量,但對于AI能否在綜合診斷和治療中提出更好的建議目前尚無定論。學術(shù)論文的數(shù)量可反映某個領(lǐng)域的發(fā)展趨勢。圖1所示,本研究納入2011年—2020年共2 199篇DL用于醫(yī)學影像學領(lǐng)域的研究文獻,且在過去十年中,年度發(fā)表文獻數(shù)量逐年增長,從0篇增加到1 233篇。上述變化與卷積神經(jīng)網(wǎng)絡(luò)的快速發(fā)展有關(guān)[4]。最強引文爆發(fā)的前25個關(guān)鍵詞如圖2所示,這些爆發(fā)關(guān)鍵詞被認為是該領(lǐng)域的前沿指標。圖2可以看出,醫(yī)學影像學研究主要針對的疾病為“brain tumor”“breast cancer”[5-6]“bladder cancer”“l(fā)ung cancer”及“l(fā)ung nodule”[7-8]。2016年“computer-aided detection ”[9-10]成為爆發(fā)性關(guān)鍵詞,2017年—2020年“l(fā)ung cancer”及“l(fā)ung nodule”成為爆發(fā)性關(guān)鍵詞。目前很多醫(yī)院已將肺結(jié)節(jié)篩查軟件用于臨床。AI已從單純自圖像中發(fā)現(xiàn)異常肺結(jié)節(jié)、乳腺結(jié)節(jié)發(fā)展到評估良、惡性結(jié)節(jié),而影像組學已從形態(tài)學拓展到基因?qū)W[11-12]。
國家層面上,中國在將DL用于醫(yī)學影像學研究領(lǐng)域中處于領(lǐng)先地位,已發(fā)表文獻占檢出文獻總量的31.33%,排名第一,其次為美國和韓國;而陳娟等[13]的統(tǒng)計結(jié)果有所不同,主要原因可能為陳娟等研究的數(shù)據(jù)截止時間點是2020年1月,而2020年1月—2021年3月是中國發(fā)表文獻數(shù)量大幅上升的階段。美國文獻的總被引頻次為19 777次,其次是中國(8 674次)和荷蘭(5 404次)。值得注意的是,荷蘭僅發(fā)表67篇文獻,非前10位國家,但引用量居世界第三。發(fā)文量最高的研究機構(gòu)是中國科學院,其次是斯坦福大學和哈佛醫(yī)學院。中國的發(fā)表文獻總量居世界第一,且多數(shù)文獻發(fā)表于英文SCI期刊[14-15]。
中國的發(fā)表文獻總量和機構(gòu)文獻總量均居世界第一,表明我國在AI醫(yī)學影像學領(lǐng)域具有核心優(yōu)勢和競爭力。分析原因,首先,算法是DL及AI的核心,而我國基礎(chǔ)教育階段重視數(shù)學學科;其次,我國影像學數(shù)據(jù)以30%年增長率增加,而影像科醫(yī)師的增加和診斷效率與之不匹配,故國內(nèi)醫(yī)院與公司對醫(yī)學影像學AI極其關(guān)注。盡管中國的文獻數(shù)量占據(jù)優(yōu)勢,但不論文獻影響力還是期刊影響力均有待提高,未來應(yīng)以此作為努力方向。