鄒陸曦,孫 玲
(1.徐州醫(yī)科大學(xué)管理學(xué)院,江蘇徐州 221000;2.徐州市中心醫(yī)院,徐州醫(yī)科大學(xué)徐州臨床學(xué)院,江蘇徐州 221006)
人工智能已經(jīng)助力醫(yī)學(xué)發(fā)展多年,近年來包括計算能力的指數(shù)級增長、大數(shù)據(jù)處理技術(shù)、使用電子健康記錄訪問大型臨床數(shù)據(jù)集以及機器學(xué)習(xí)等技術(shù)的突破,提高了人工智能改革醫(yī)學(xué)各個領(lǐng)域診斷和治療的精確度和能力[1]。
人工智能能夠提高醫(yī)療服務(wù)提供者的工作效率,使用人工智能的計算機系統(tǒng)有助于評估醫(yī)學(xué)影像和醫(yī)療大數(shù)據(jù),更新的機器學(xué)習(xí)技術(shù)促進(jìn)了自動診斷系統(tǒng)的發(fā)展[2]。人工智能由于能夠解釋更詳細(xì)和更全面的數(shù)據(jù),有可能進(jìn)一步提高患者的健康水平,因此,在醫(yī)學(xué)各個領(lǐng)域受到歡迎[3]。在不斷發(fā)展的現(xiàn)代醫(yī)學(xué)數(shù)字世界中,醫(yī)生需要人工智能的支持,訓(xùn)練有素的醫(yī)生不應(yīng)該擔(dān)心自己會被人工智能取代。隨著越來越多的學(xué)者加入,有關(guān)醫(yī)療人工智能研究的文獻(xiàn)也越來越多。那么,有關(guān)醫(yī)療人工智能研究的現(xiàn)狀和研究分布如何?研究問題主要涉及哪些方面?哪些是當(dāng)前研究的趨勢和熱點?探討這些問題對于進(jìn)一步揭示醫(yī)療人工智能的研究主題、現(xiàn)狀和研究趨勢具有重要意義。
可視化分析技術(shù)便于挖掘數(shù)據(jù)中的隱藏規(guī)律,是利用相關(guān)軟件將知識、數(shù)據(jù)和信息轉(zhuǎn)換為可視化圖集的過程。本研究利用Web of Science(WOS)數(shù)據(jù)庫核心集收集的數(shù)據(jù)對醫(yī)學(xué)人工智能研究的機構(gòu)、期刊、作者、參考文獻(xiàn)、當(dāng)前研究熱點和趨勢進(jìn)行分析和處理,利用可視化的網(wǎng)絡(luò)圖對WOS數(shù)據(jù)庫核心集數(shù)據(jù)進(jìn)行可視化分析,期望為我國的醫(yī)學(xué)人工智能研究提供參考。
以“artificial intelligence”“medicine”為檢索詞,檢索2001年1月1日至2020年12月31日在WOS數(shù)據(jù)庫核心集公開發(fā)表的文獻(xiàn)資料,檢索日期為2021年4月3日,檢索方式為“主題”(精確)。
根據(jù)納入、排除標(biāo)準(zhǔn)篩選檢索出的文獻(xiàn)資料。
納入標(biāo)準(zhǔn):發(fā)表時間為2001年1月1日至2020年12月31日;以英文語言發(fā)表的;已發(fā)表的原創(chuàng)性和綜述類期刊文章;研究內(nèi)容與人工智能醫(yī)療相關(guān)。排除標(biāo)準(zhǔn):與研究不相關(guān)文獻(xiàn);非英文形式發(fā)表的資料;會議通知、征稿啟事、圖書、報紙及學(xué)位論文等其他形式的資料。通過分析整理,根據(jù)納入及排除標(biāo)準(zhǔn)選擇出符合條件的1 450篇文章,每篇文章包含以下信息:標(biāo)題、作者、機構(gòu)、關(guān)鍵詞和引用文獻(xiàn)。
VOSviewer是荷蘭萊頓大學(xué)科技研究中心的Van Eck和Waltman開發(fā)的一款基于JAVA的知識圖譜可視化軟件,它能有效地構(gòu)建科學(xué)計量圖實現(xiàn)科技文獻(xiàn)計量的可視化,在易于解釋的共引用和共作者分析方法中具有強大的功能[4]。本研究采用VOSviewer 1.6對研究所合著、期刊共被引、作者共被引和參考文獻(xiàn)共被引進(jìn)行分析,利用關(guān)鍵詞疊加可視化圖來分析研究的熱點和趨勢。
在發(fā)文機構(gòu)方面,很多機構(gòu)都發(fā)表了有關(guān)醫(yī)學(xué)人工智能研究的文獻(xiàn)。機構(gòu)共現(xiàn)網(wǎng)絡(luò)(institution coauthorship)分析反映了研究領(lǐng)域中各機構(gòu)之間的影響和溝通[5]。本文根據(jù)機構(gòu)發(fā)表的文章數(shù)量對機構(gòu)進(jìn)行排名,醫(yī)學(xué)人工智能研究的機構(gòu)共現(xiàn)網(wǎng)絡(luò)圖如圖1所示。斯坦福大學(xué)(Stanford University)排名第一(37篇),其次是哈佛大學(xué)醫(yī)學(xué)院(Harvard Medical School)(36篇)和多倫多大學(xué)(University of Toronto)(30篇),這3個機構(gòu)在醫(yī)學(xué)人工智能相關(guān)出版物中的發(fā)文數(shù)量最多,是在醫(yī)學(xué)人工智能方面最具影響力的3個研究機構(gòu)。
圖1 發(fā)文機構(gòu)共現(xiàn)網(wǎng)絡(luò)圖
本研究使用VOSviewer繪制期刊共被引網(wǎng)絡(luò)。共被引意味著2個項目(如期刊、作者和參考資料)被引用在1個參考文獻(xiàn)中。共被引分析反映出2個共引用項目之間的頻率和關(guān)系[6]。期刊共被引分析可以研究學(xué)術(shù)期刊網(wǎng)絡(luò)的總體結(jié)構(gòu)和特點[7]。
具有50個節(jié)點的期刊共被引網(wǎng)絡(luò)圖如圖2所示。閾值是期刊的最低引用次數(shù),超過170次。圖中節(jié)點的大小代表收錄醫(yī)學(xué)人工智能期刊的活躍程度,即該期刊發(fā)表醫(yī)學(xué)人工智能文章的引用次數(shù)。通過節(jié)點之間的距離可反映節(jié)點之間的鏈路強度,較短的距離意味著節(jié)點之間擁有更強的關(guān)聯(lián)性和更高的引用頻率。
圖2 期刊共被引網(wǎng)絡(luò)圖
VOSviewer使用算法將網(wǎng)絡(luò)中的節(jié)點分配給聚類。該聚類技術(shù)是一種基于參數(shù)化和加權(quán)的模塊化的聚類變體[8]。聚類是一組密切相關(guān)的節(jié)點,具體計算方法參見文獻(xiàn)[4]。相同顏色的節(jié)點表示同一個聚類。
通過聚類分析,最大的3個集群分別是綠色、紅色和藍(lán)色。以大小排名靠前的每個聚類中節(jié)點(期刊)為例,綠色聚類包含Nature(1 368篇引用)和Science(691篇引用),代表自然科學(xué)類的綜合性期刊。紅色聚類包含New England Journal of Medicine(1 056篇引用)和Journal of the American Medical Association(JAMA,982篇引用),主要是醫(yī)學(xué)類期刊和以醫(yī)學(xué)為主的綜合類期刊。藍(lán)色聚類包含Radiology(833篇引用)和Medical Physics(420篇引用),代表核醫(yī)學(xué)等具體的學(xué)科應(yīng)用方面的期刊。如果節(jié)點引用越高,節(jié)點就越大,即如果出版物被引用的次數(shù)越多,對醫(yī)學(xué)人工智能研究的影響就越大。
本文根據(jù)納入的1 450篇醫(yī)學(xué)人工智能研究文獻(xiàn)的作者所發(fā)表文章的引用次數(shù)來排名。作者共被引(co-citation cited author)網(wǎng)絡(luò)圖中顯示了前50名高被引的作者,如圖3所示。最大的節(jié)點是作者Lecun,Y(215篇引用),揭示了他在醫(yī)學(xué)人工智能研究中的重要貢獻(xiàn)。2個節(jié)點(作者)之間較短的距離表明節(jié)點代表的作者之間有更高、更強的共被引用關(guān)系。具有相同顏色的圓圈表明這些作者發(fā)表的文章之間有類似的主題。其他研究人員與這些主要研究人員有直接或間接的聯(lián)系。
圖3 作者共被引分析網(wǎng)絡(luò)圖
當(dāng)2篇論文在1篇論文中同時被引用時,它們就建立了參考文獻(xiàn)共被引分析(reference co-citation analysis)[6]。本文根據(jù)引用文獻(xiàn)的數(shù)量進(jìn)行排名,構(gòu)建了一個包含100個節(jié)點的共被引關(guān)系圖(前100個共被引文獻(xiàn)),如圖4所示。節(jié)點的大小不僅揭示了其引文的數(shù)量,還揭示了它們與醫(yī)學(xué)人工智能研究的關(guān)系。例如,最大的節(jié)點,即Esteva等發(fā)表的題為Dermatologist-level classification of skin cancer with deep neural networks的文章,于2017年在Nature雜志上見刊[9]。該文章被本文納入的1 450篇醫(yī)學(xué)人工智能研究文獻(xiàn)引用179次,在WOS數(shù)據(jù)庫核心集中被引用3 135次。
圖4 參考文獻(xiàn)共被引分析圖
為了更好地展現(xiàn)2.1~2.4章節(jié)的分析結(jié)果,表1列出了發(fā)文機構(gòu)、發(fā)文期刊、作者共被引、參考文獻(xiàn)共被引前10名及具體的數(shù)量。
表1 發(fā)文機構(gòu)、發(fā)文期刊、作者共被引、參考文獻(xiàn)共被引前十名及數(shù)量
關(guān)鍵詞對研究熱點、新興趨勢和研究前沿進(jìn)行了合理的描述,它可以表示一個科學(xué)文獻(xiàn)的主要研究內(nèi)容,文字的頻率反映了研究的熱點。本文利用關(guān)鍵詞的疊加可視化圖來描述醫(yī)學(xué)人工智能研究的趨勢,如圖5所示,時間由遠(yuǎn)及近從藍(lán)紫色變?yōu)辄S色,節(jié)點文字越大,說明出現(xiàn)的次數(shù)越多。從圖5可以看出,醫(yī)學(xué)人工智能研究的主題(關(guān)鍵詞出現(xiàn)次數(shù))從主要關(guān)注“神經(jīng)網(wǎng)絡(luò)(neural networks)”(61次)、“診斷(diagnosis)”(131次)和各類“系統(tǒng)(system)”(75次),發(fā)展到關(guān)注“分類(classification)”(189次)、“預(yù)測(prediction)”(149次)和“生物標(biāo)記物(biomarkers)”(27次)。最近的醫(yī)學(xué)人工智能研究熱點則集中在“機器學(xué)習(xí)(machine learning)”(345次)、“深度學(xué)習(xí)(deep learning)”(176次)、“大數(shù)據(jù)(big data)”(136次)等大數(shù)據(jù)和人工智能醫(yī)療領(lǐng)域。而“癌癥(cancer)”(117次)、“精準(zhǔn)醫(yī)療(precision medicine)”(110次)、“放射學(xué)(radiology)”(30次)等是人工智能在醫(yī)學(xué)方面近幾年的主要研究方向。
圖5 關(guān)鍵詞疊加可視化圖
近年來,人工智能在計算機輔助診斷、疾病預(yù)后和醫(yī)療決策支持領(lǐng)域、重塑醫(yī)學(xué)成像和放療實踐方面取得了顯著成效[19]。精準(zhǔn)醫(yī)學(xué)有利于治療不太常見的疾病或幫助有特殊醫(yī)療需求的患者。未來,人工智能和精準(zhǔn)醫(yī)療的融合將徹底改變醫(yī)療健康領(lǐng)域[20]。人工智能使系統(tǒng)能夠推理和學(xué)習(xí),并通過增強智力來幫助臨床醫(yī)生決策。這種融合有助于解決精準(zhǔn)醫(yī)學(xué)面臨的問題,也有助于個性化診斷和預(yù)后。通過人工智能和醫(yī)學(xué)的融合,可為每個患者提供更好、更精確的醫(yī)療護(hù)理,同時減輕患者家庭和整個社會的經(jīng)濟負(fù)擔(dān)。
本文運用VOSviewer軟件對2001至2020年間醫(yī)學(xué)人工智能研究的1 450篇文獻(xiàn)進(jìn)行了梳理和挖掘,斯坦福大學(xué)、哈佛大學(xué)醫(yī)學(xué)院和多倫多大學(xué)是該領(lǐng)域的主要研究機構(gòu);與國外著名的研究機構(gòu)相比,我國的研究機構(gòu)在醫(yī)學(xué)人工智能方面的研究還需加強,國際影響力還有待提高。在發(fā)文期刊方面,Nature、JAMA和New England Journal of Medicine等雜志在醫(yī)學(xué)人工智能領(lǐng)域有著較高的影響力。在參考文獻(xiàn)共被引方面,Esteva,A等于2017年發(fā)表在Nature雜志上面的文章獲得了最多的被引用數(shù)量。在作者共被引方面,作者Lecun,Y獲得了最多的被引用數(shù)量,揭示了他在醫(yī)學(xué)人工智能研究中的重要貢獻(xiàn)。從研究中發(fā)現(xiàn),我國學(xué)者在該領(lǐng)域發(fā)表文章和引用情況還未進(jìn)入前列,還需要更多的研究投入。利用關(guān)鍵詞疊加可視化圖分析發(fā)現(xiàn),大數(shù)據(jù)、深度學(xué)習(xí)和精準(zhǔn)醫(yī)療等方面仍是目前醫(yī)學(xué)人工智能領(lǐng)域研究的熱點。
通過對以上分析圖中的關(guān)鍵節(jié)點的文獻(xiàn)研究,以及仔細(xì)研讀參考文獻(xiàn)共被引分析中排名靠前的文章,發(fā)現(xiàn)自2001年以來,人工智能及其在醫(yī)學(xué)上的應(yīng)用已經(jīng)取得重大進(jìn)展。通過對醫(yī)學(xué)人工智能文獻(xiàn)的可視化分析,可在一定程度上揭示近年來醫(yī)學(xué)人工智能的研究基礎(chǔ)。通過研究熱點與趨勢分析,近年來的醫(yī)學(xué)人工智能研究在深度學(xué)習(xí)方面發(fā)展迅速。深度學(xué)習(xí)是基于特定計算模型人工智能的一個子集,如深度卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò),在圖像和信號處理方面表現(xiàn)出卓越的性能。例如,在著名醫(yī)學(xué)雜志JAMA上的一篇研究提出了一種在視網(wǎng)膜眼底照片中檢測糖尿病視網(wǎng)膜病變的深度學(xué)習(xí)算法。深度學(xué)習(xí)在CT、MRI和核醫(yī)學(xué)方面預(yù)測肌肉骨骼疾病的臨床應(yīng)用日益增多,在藥物發(fā)現(xiàn)和基因組學(xué)方面應(yīng)用得更加深入。
人工智能正在越來越多地被應(yīng)用于藥物發(fā)現(xiàn)中。不僅為相關(guān)的科學(xué)家,而且為生物制藥行業(yè)和開發(fā)新藥過程帶來新的挑戰(zhàn)。已有研究總結(jié)了一組國際專家對利用人工智能發(fā)現(xiàn)小分子藥物的“重大挑戰(zhàn)”的看法,包括獲得適當(dāng)?shù)臄?shù)據(jù)集,生成新的假設(shè),以多目標(biāo)方式進(jìn)行優(yōu)化減少藥物研發(fā)、生產(chǎn)周期時間和改變研究文化[21]。神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù)正在出乎意料地發(fā)展,并不斷被應(yīng)用于藥物制劑的開發(fā)與制造[22],醫(yī)學(xué)人工智能正幫助廣大用戶、醫(yī)生、醫(yī)藥公司、醫(yī)療監(jiān)管機構(gòu)和保險公司做出明智的決策。
人工智能和精準(zhǔn)醫(yī)療的融合正改變著傳統(tǒng)醫(yī)療。大數(shù)據(jù)時代,精準(zhǔn)醫(yī)療方法可以識別不太常見的患者的表型[23]。Topol(2019)提出高性能醫(yī)學(xué):人類智能和人工智能融合的觀點[12]。人工智能利用復(fù)雜的計算和推理,使系統(tǒng)能夠推理和學(xué)習(xí),并通過增強智力來幫助臨床醫(yī)生決策。最近的文獻(xiàn)表明,這些醫(yī)學(xué)人工智能方面的探索研究將有助于解決精準(zhǔn)醫(yī)療面臨的困難和問題,結(jié)合來自患者癥狀、臨床史和生活方式的信息,有助于促進(jìn)個性化診斷[20]。
醫(yī)學(xué)人工智能在具體的疾病預(yù)測方面也改變著傳統(tǒng)醫(yī)療。例如,人工智能在胃腸病學(xué)中進(jìn)行內(nèi)鏡分析病變、檢測癌癥,并促進(jìn)在無線膠囊內(nèi)窺鏡期間對炎癥性病變或胃腸道出血的分析速度。人工智能還被用來測試和評估肝纖維化,并區(qū)分胰腺癌患者和胰腺炎患者[24]。在醫(yī)學(xué)影像學(xué)領(lǐng)域,龔尚瑾等[25](2020)以乳腺癌和腦部疾病為例分析了深度學(xué)習(xí)在國內(nèi)的應(yīng)用情況。2020年全球暴發(fā)新型冠狀病毒肺炎,該疾病開始蔓延到世界各地,成為一個國際公共衛(wèi)生問題。已有研究認(rèn)為利用潛在技術(shù)(包括人工智能)可以控制疫病大流行,有助于控制病毒的傳播[26]。
本研究存在一定的局限性,僅選取WOS數(shù)據(jù)庫核心集的文獻(xiàn)作為研究的文獻(xiàn)數(shù)據(jù)來源,而沒有納入其他外文數(shù)據(jù)庫,數(shù)據(jù)來源不夠豐富,具有一定的局限性和主觀性。其次,分析軟件僅采用VOSviewer分析數(shù)據(jù),多軟件協(xié)同分析可以使文章的內(nèi)容更加豐富多樣。未來的研究可以進(jìn)一步豐富數(shù)據(jù)來源,采用多軟件協(xié)同分析,可以結(jié)合國內(nèi)外的文獻(xiàn)作進(jìn)一步的分析與對比。
本研究分析了醫(yī)學(xué)人工智能研究的科學(xué)成果,探索了該領(lǐng)域2001—2020年的研究現(xiàn)狀和熱點?;赪OS數(shù)據(jù)庫核心集,利用可視化技術(shù)分析了醫(yī)學(xué)人工智能研究出版物的期刊、機構(gòu)、作者、參考文獻(xiàn)和關(guān)鍵詞。通過可視化分析,揭示了醫(yī)學(xué)人工智能領(lǐng)域研究的“圖譜”,為研究者了解醫(yī)學(xué)人工智能的研究領(lǐng)域提供了指引。