史紀元,田金徽,高 亞,許建國,李 崢
1中國醫(yī)學科學院北京協(xié)和醫(yī)學院護理學院,北京 100044 蘭州大學 2循證醫(yī)學中心 3甘肅省循證醫(yī)學與臨床轉化重點實驗室,蘭州 730000
人工智能(artificial intelligence,AI)是計算機科學的一個重要分支,通過利用機器模擬并延伸拓展人類的智能,使機器自身獲得思考、推理等學習能力,以輔助人類解決多種難題[1-2]。醫(yī)學領域中,AI的應用前景十分廣闊,在醫(yī)學影像識別、健康管理以及疾病診斷、預測與評估等方面均展現(xiàn)出了巨大潛力[3-5]。特別是深度學習與神經網絡取得的最新研究進展,使AI在醫(yī)學領域備受矚目[6-8]。鑒于AI與醫(yī)學領域逐漸交叉融合,國內外學者開展了大量AI相關隨機對照試驗(randomized controlled trial,RCT)醫(yī)學研究,但研究的主題和發(fā)展趨勢尚不清楚,探索醫(yī)學領域內AI相關RCT研究進展和熱點具有重要的臨床與科研指導價值。本研究通過檢索數(shù)據(jù)庫,對醫(yī)學領域內AI相關RCT研究的作者、研究機構與國家之間合作情況、研究主題等進行分析,以了解該領域研究現(xiàn)狀,并為后續(xù)開展相關研究提供借鑒。
計算機檢索PubMed數(shù)據(jù)庫,納入醫(yī)學和健康科學領域的所有AI相關RCT文獻。檢索策略:以“Randomized Controlled Trial”“Randomized Controlled Trials”“Artificial Intelligence”“Computational Intelligence”“Machine Intelligence”“Computer Reasoning”“Computer Vision Systems”“Deep Learning”“Natural Language Processing”“Computer Neural Network”“Sentiment Analysis”“Robot”等為關鍵詞,并采用關鍵詞與主題相結合的方式進行檢索,檢索時間為建庫至2021年12月1日。納入標準:(1)以“人工智能”和“醫(yī)學”為主題的RCT;(2)語種為英文。排除標準:會議論文、信件及評論文獻。
檢索完成后導出文獻,由2名研究人員閱讀摘要或全文后逐個對文獻進行篩選,如有分歧意見,通過討論或咨詢第3位研究人員進行解決。基于Web of Science數(shù)據(jù)庫獲取文獻發(fā)表時間、被引頻次、作者及所在研究機構與國家、關鍵詞信息,并使用在線分析功能進行整理分析。采用VOSviewer 1.6.17軟件提取文獻發(fā)表的期刊影響因子、作者、機構、國家及關鍵詞等信息,并生成高產國家(發(fā)文量≥20篇)、機構(發(fā)文量≥10篇)和作者(發(fā)文量≥3篇)合作的網絡圖以及高頻關鍵詞(出現(xiàn)頻次≥30次)的聚類網絡圖。網絡圖由節(jié)點和連線組成,節(jié)點表示國家、機構和關鍵詞等被分析的元素,不同顏色表示不同的聚類[9-10]。節(jié)點大小可反映元素出現(xiàn)的頻次,節(jié)點之間的連接代表合作、共現(xiàn)的關系[11-14]。采用Cite Space 5.8.R3軟件對文獻被引情況及關鍵詞進行突發(fā)性檢測。
采用Microsoft Office Excel 2016軟件進行數(shù)據(jù)整理。采用VOSviewer 1.6.17軟對文獻中的內容進行提取,并繪制研究機構合作網絡圖和關鍵詞聚類網絡圖。采用Cite Space 5.8.R3軟件繪制被引頻次和關鍵詞的突發(fā)情況檢測圖。發(fā)文量為計數(shù)資料,以頻數(shù)和百分數(shù)表示。
經檢索共獲得醫(yī)學領域內AI相關RCT文獻1174篇,發(fā)表時間分布于1989至2021年。其中2007年之前年發(fā)文量均未超過30篇,2008年、2014年、2017年、2018年、2020年發(fā)文量分別超過了30、60、80、100、200篇。雖然不同時間發(fā)表的AI相關RCT文獻數(shù)量有所波動,但年發(fā)文量整體呈逐漸增加的趨勢(2021年發(fā)文量有所降低可能與部分研究尚未正式發(fā)表有關),見圖1。
圖1 1174篇AI相關RCT醫(yī)學研究文獻年發(fā)文量分布情況
1174篇文獻共來自歐洲、美洲、亞洲等地區(qū)的61個國家。不同國家發(fā)表的文獻數(shù)量差異較大,其中發(fā)文量居前10位的國家依次為美國(37.22%,437篇)、意大利(10.90%,128篇)、韓國(8.86%,104篇)、德國(8.35%,98篇)、中國(7.84%,92篇)、英國(5.71%,67篇)、加拿大(5.20%,61篇)、荷蘭(4.34%,51篇)、日本(3.49%,41篇)、澳大利亞(3.41%,40篇)。
圖2為發(fā)文量≥20篇的國家合作網絡圖,可反映國家之間的合作情況。國家之間的合作主要分為 4 個團隊,其中第1個合作團隊由美國、中國、意大利、韓國和加拿大等國家組成,第2個合作團隊由德國、意大利、比利時等歐洲國家組成,第3個合作團隊由瑞士、荷蘭組成,第4個合作團隊由日本和英國組成?;诤献骶W絡圖可知,國家之間的合作主要以發(fā)達國家為主,僅中國和巴西作為發(fā)展中國家出現(xiàn)在了國家合作網絡圖中。
圖2 發(fā)文量≥20篇的國家合作情況網絡圖
共1794個機構參與了此1174篇AI相關RCT醫(yī)
AI:人工智能;RCT:隨機對照試驗
學研究,研究機構多來自發(fā)達國家的綜合性大學。發(fā)文量居前10位的研究機構分別為美國哈佛大學(2.98%,35篇)、韓國延世大學 (2.73%,32篇)、美國西北大學(2.21%,26篇)、美國麻省理工學院(2.13%,25篇)、美國斯坦福大學(1.96%,23篇)、美國華盛頓大學(1.70%,20篇)、美國加利福尼亞大學(1.62%,19篇)、美國馬里蘭大學(1.53%,18篇)、美國哥倫比亞大學(1.36%,16篇)、韓國首爾大學(1.28%,15篇)。中國發(fā)文最多的機構是中山大學(0.94%,11篇)。
對發(fā)文量≥10篇的39個研究機構進行合作情況分析,發(fā)現(xiàn)僅在27個研究機構之間形成了6個合作團體,其中大部分機構來自美國,說明總體而言研究機構之間的跨國合作不充分,不同團體之間的合作不密切。但在該研究領域中,美國知名機構參與最多且形成了較為緊密的合作關系(圖3)。
圖3 發(fā)文量≥10篇的研究機構合作情況網絡圖
1174篇AI相關RCT醫(yī)學研究涉及7288位作者。
其中發(fā)文量≥10篇的作者僅10位,分別為Krebs(22篇,美國麻省理工學院)、Calabro(11篇,意大利IRCCS神經中心)、Picelli (11篇,意大利維羅納大學)、Smania(11篇,意大利維羅納大學)、Lin(10篇,中國臺灣大學)、Broadbent(10篇,奧克蘭大學)、Kim(10篇,美國麻省理工學院)、Moyle(10篇,澳大利亞格里菲斯大學)、Volpe(10篇,意大利維羅納大學)、Waldner(10篇,意大利波爾扎諾自由大學)。對發(fā)文量≥3篇的258位作者合作情況分析后發(fā)現(xiàn),僅在49位作者之間形成了6個合作網絡,提示總體來說高產作者之間缺少合作。其中來自英國劍橋大學的Krebs發(fā)文量最多且與多個團體存在合作關系,提示其在該領域具有較大影響力。
最常見的關鍵詞為rehabilitation(康復,212次)、stroke(卒中,155次)、robotics(機器人技術,153次)、recovery (恢復,119次)、therapy(治療,92次)、reliability (可靠性、80次)、performance(性能,77次)。對出現(xiàn)頻次≥30的37個高頻關鍵詞進行聚類分析后發(fā)現(xiàn),其最終聚類為三類(圖4):第一個聚類包括stroke(卒中)、recovery(恢復)、robotics(機器人技術)、therapy(治療)、impairment(損傷)等9個關鍵詞,主要關注機器人技術在疾病治療中的應用效果;第二個聚類包括rehabilitation(康復)、exercise(鍛煉)、walking(步行)、gait(步態(tài))等8個關鍵詞,主要關注AI在康復訓練中的應用效果;第三個聚類包括machine learning(機器學習)、diagnosis(診斷)、outcomes(結局)、quality of life(生活質量)、performance(性能)、surgery(外科)等20個關鍵詞,主要關注機器學習在疾病診斷與管理中的應用效果。
圖4 頻次≥30次的高頻關鍵詞聚類網絡圖
1174篇RCT研究中,被引頻次分布于0~819,篇均被引頻次為36.09。其中被引頻次最高的文獻題目為Robot-assistedtherapyforlong-termupper-limbimpairmentafterstroke,該研究由Lo等于2010年發(fā)表于NEnglJMed上,主要介紹了機器人輔助治療腦卒中后長期上肢損傷的療效。被引頻次居前10位的研究見表1。
表1 被引頻次居前10位的AI相關RCT醫(yī)學研究
突發(fā)性引文是指文獻在一段時間內被頻繁引用[11,15],其可反映特定領域的發(fā)展動態(tài)和高影響力文獻,近年仍呈現(xiàn)突發(fā)高被引的引文可代表學科的研究前沿與熱點,據(jù)此可對未來發(fā)展趨勢進行預測。圖5呈現(xiàn)了突發(fā)強度居前20位的突發(fā)性引文,由此可知機器人輔助和機器學習是目前AI在醫(yī)學領域應用相關研究的重點關注方向。突發(fā)性引文首次
圖5 突發(fā)強度居前20位的AI相關RCT醫(yī)學研究引文
注:檢索時間為2021年12月1日;AI、RCT:同圖1
AI、RCT:同圖1
出現(xiàn)于2004年,突發(fā)強度最高的研究是由Lo等于2010年發(fā)表,該研究頻繁被引始于2011年,結束于2016年[16]。關鍵詞突發(fā)性檢測是指關鍵詞在一段時間內被頻繁使用的情況,其可反映特定領域的研究熱點與前沿。圖6呈現(xiàn)了突發(fā)強度居前30位的關鍵詞,其中突發(fā)強度最高的關鍵詞為“machine learning”(機器學習)。
圖6 突發(fā)強度居前30位的AI相關RCT醫(yī)學研究關鍵詞AI、RCT:同圖1
AI的發(fā)展趨勢方興未艾,其與醫(yī)學的交叉融合可謂是大勢所趨。為了解AI在醫(yī)學領域中的應用現(xiàn)狀,本研究基于PubMed數(shù)據(jù)庫,對1174篇AI相關RCT醫(yī)學研究在作者、研究機構、國家及其合作情況等方面進行了分析,發(fā)現(xiàn)開展該研究的作者及研究機構主要來自以美國為首的發(fā)達國家,高產作者、研究機構、國家之間的合作不緊密,研究的關鍵詞主要聚焦于機器人技術在疾病治療中的應用、AI在康復訓練中的應用以及機器學習在疾病診斷與管理中的應用等主題,其中機器人輔助和機器學習是近年來關注度較高的領域。
進入21世紀后,伴隨計算機性能獲得了極大突破,AI迎來了高速發(fā)展期,而其在醫(yī)學中的應用更是為該領域注入了新的活力?,F(xiàn)如今,AI已在醫(yī)學領域中的自然語言處理、圖像識別、慢性病管理、疾病診斷與預測等方面嶄露頭角,前景十分廣闊,且針對AI的醫(yī)學研究亦在如火如荼地進行。為快速了解該領域研究熱點與發(fā)展趨勢,本研究基于PubMed數(shù)據(jù)庫對醫(yī)學領域內AI相關RCT研究現(xiàn)狀進行了文獻計量學分析,結果發(fā)現(xiàn)AI相關RCT醫(yī)學研究數(shù)量整體呈逐年增長趨勢,且近年來增長趨勢更加顯著,如年發(fā)文量從1篇增至10篇和由10篇增至30篇,分別用了14年和5年時間,而從80篇增至100篇以及由100篇增至200篇分別僅用時1年和2年,這與AI發(fā)展現(xiàn)況密不可分。隨著循證醫(yī)學的快速發(fā)展和2006年深度學習概念的提出,AI相關RCT醫(yī)學研究年發(fā)文量整體快速增加,特別在2007年后增速加快,可能與機器學習在該時期得到高速發(fā)展以及深度學習方法得到完善有關[5-6],間接說明越來越多的學者認識到了AI在醫(yī)學領域的應用潛力,而關注度的增高必將推動該領域進一步發(fā)展。
1174篇RCT研究來自全球61個國家,超過半數(shù)國家的發(fā)文量≤5篇。發(fā)文量居前10位的國家中,4個來自歐洲、2個來自美洲、3個來自亞洲、1個來自澳洲,其發(fā)文量均≥40篇,提示對該領域的關注度存在明顯的國家聚集現(xiàn)象,發(fā)達國家對此較為關注。在對發(fā)文量≥20篇高產國家的合作情況進行分析發(fā)現(xiàn),國家之間的合作形成了4個較大的團隊,且合作主要出現(xiàn)在發(fā)達國家之間。在對研究機構和作者分布及其合作關系的分析中,亦得到了類似結果,發(fā)文量≥10篇的作者及研究機構主要來自發(fā)達國家,但存在不同作者、研究機構之間合作不充分、不密切的現(xiàn)象。AI作為交叉學科,常需跨學科合作,研究者不僅需加強團隊成員之間的合作,更應建立國際跨學科緊密合作關系。值得說明的是,作為美國麻省理工學院機械工程系的教授,Krebs長期從事輔助機器人的開發(fā)及其在交叉學科中應用的研究,其不僅發(fā)文量最多(22篇)且與其他研究團隊存在廣泛的合作關系,在該領域內具有重要影響力。
中國發(fā)文量居全球第5位(92篇),與美國、意大利、韓國、加拿大、澳大利亞和巴西合作較多,提示雖然我國AI相關RCT醫(yī)學研究起步較晚,但發(fā)展迅猛,為AI在醫(yī)學領域的應用作出了較大貢獻。此外,中國是發(fā)文量前10位中唯一一個發(fā)展中國家,亦從側面反映了國家的經濟和科技實力。我國作為高速發(fā)展的新興經濟和科技大國,更應緊盯世界科技發(fā)展前沿,增加與相關國家和機構的合作,為AI在醫(yī)學領域的應用提供更多高質量證據(jù)。
被引頻次和高頻關鍵詞可反映研究熱點分布及變化趨勢。本研究結果顯示,被引頻次最多、突發(fā)強度最高的文獻均為Robot-assistedtherapyforlong-termupper-limbimpairmentafterstroke[16],該論文介紹了機器人輔助治療可有效改善卒中患者長期上肢功能,引起了研究者對機器人輔助治療的關注,于2011至2016年被大量引用。通過突發(fā)性檢測可以看出,近年來機器人輔助和機器學習在醫(yī)學領域的應用是研究的重點方向。在對高頻關鍵詞的分析中,1174篇RCT研究最常見的關鍵詞為康復、卒中、機器人技術、診斷、治療、性能、可靠性等,提示研究方向主要關注疾病的診斷與治療方面。關鍵詞聚類分析結果顯示,目前研究主題主要聚焦于機器人技術在疾病治療中的應用、機器學習在疾病診斷和管理中的應用以及AI在康復訓練中的應用,亦提示研究主題有待拓展。關鍵詞突發(fā)性檢測結果表明,機器學習是近年來AI領域的研究熱點,引發(fā)了醫(yī)學研究人員的廣泛關注,并圍繞機器學習的應用效果評價展開了多項RCT研究,為臨床醫(yī)師今后進行相關研究提供了借鑒。
本研究局限性:(1)由于Cite Space等可視化軟件對文獻格式有要求,不同數(shù)據(jù)庫之間的格式存在差異,且中文數(shù)據(jù)庫導出數(shù)據(jù)時存在文獻信息不全的現(xiàn)象,導致分析軟件的大部分功能無法使用,故本文僅檢索了PubMed數(shù)據(jù)庫,未納入Embase、Scopus等英文數(shù)據(jù)庫以及中國知網、萬方數(shù)據(jù)知識服務平臺等中文數(shù)據(jù)庫信息,研究結果可能存在偏倚。(2)雖然已對數(shù)據(jù)分析結果進行仔細核對,但仍可能存在作者重名的現(xiàn)象,導致分析結果存在誤差。
近年來,科技進步帶來了數(shù)據(jù)存儲和計算能力的快速提升,智能算法不斷成熟,AI技術已在包括醫(yī)學在內的多領域大顯身手[11-12]。一般來說,RCT可較好地控制偏倚,研究質量和學術價值較高,可為臨床及相關衛(wèi)生政策的制訂提供重要參考信息。隨著SPIRIT-AI和CONSORT-AI等一系列AI臨床試驗報告規(guī)范問世[3-5],AI相關RCT研究已步入規(guī)范化發(fā)展的快車道[17]。目前,歐美國家在AI相關RCT醫(yī)學研究領域中處于領先地位,我國的研究者和研究機構在該方面亦表現(xiàn)出巨大潛力。我國學者應加強跟蹤AI的應用需求,掌握其在醫(yī)學領域中的應用現(xiàn)狀與發(fā)展趨勢,加強與國外科研機構合作,科學開展RCT研究并規(guī)范論文報告質量,進一步拓展AI在醫(yī)學領域中的應用。
作者貢獻:史紀元負責文獻檢索、數(shù)據(jù)分析、論文撰寫;高亞負責論文構思、文獻篩選、數(shù)據(jù)分析;許建國負責文獻篩選、數(shù)據(jù)分析;田金徽負責文獻檢索、論文修訂;李崢負責論文修訂與審核。
利益沖突:所有作者均聲明不存在利益沖突