陳曉煒,邢美園
(浙江大學(xué)醫(yī)學(xué)院附屬第一醫(yī)院圖書館,浙江 杭州 310003)
自20 世紀(jì)70 年代末首次規(guī)范醫(yī)學(xué)信息學(xué)(medical informatics,MI)學(xué)科名稱以來[1],國際醫(yī)學(xué)信息學(xué)領(lǐng)域發(fā)展迅速。我國于20 世紀(jì)80 年代起發(fā)展醫(yī)學(xué)信息學(xué)[2],科研學(xué)者積極開展相關(guān)研究,但研究成果及科研能力仍有較大提升空間。因此,分析國內(nèi)外醫(yī)學(xué)信息學(xué)領(lǐng)域高質(zhì)量論文的文獻(xiàn)特征信息有助于提升我國的科研質(zhì)量。目前已有研究采用文獻(xiàn)計量學(xué)對該領(lǐng)域的學(xué)科發(fā)展路徑[3]、發(fā)展趨勢、研究熱點、學(xué)科教育等[4-7]進(jìn)行深度剖析,但存在僅討論國內(nèi)醫(yī)學(xué)信息學(xué)發(fā)展、側(cè)重分析研究熱點及發(fā)展趨勢、發(fā)表時間較早、文獻(xiàn)質(zhì)量良莠不齊等不足。本研究以2022 年3 月10 日基本科學(xué)指標(biāo)(ESI)數(shù)據(jù)庫更新的醫(yī)學(xué)信息學(xué)高被引論文(Highly Cited Papers)為研究對象,對發(fā)文年限、期刊、作者、國家/地區(qū)、研究機(jī)構(gòu)、基金等文獻(xiàn)特征信息進(jìn)行分析總結(jié),利用Incites 平臺、VOSviewer_1.6.13 和CiteSpace 5.8.R3 可視化軟件進(jìn)行深入挖掘,以期追蹤核心國家、核心機(jī)構(gòu)、核心作者的科研表現(xiàn),揭示國際醫(yī)學(xué)信息學(xué)研究現(xiàn)狀,旨在為我國醫(yī)學(xué)信息學(xué)領(lǐng)域研究人員開展科研工作提供客觀數(shù)據(jù)支持。
1.1 數(shù)據(jù)來源 在Web of Science 核心合集的SCI 數(shù)據(jù)庫(Science Citation Index Expanded)中檢索醫(yī)學(xué)信息學(xué)領(lǐng)域相關(guān)文獻(xiàn),檢索式為“Web of Science 類別=Medical Informatics”,點擊“Highly Cited Papers”,共獲得ESI 高被引論文479 篇,其中8 篇為熱點論文,期刊論374 篇,綜述105 篇,會議7 篇。
1.2 方法 使用Microsoft Excel 和Incites 平臺整理統(tǒng)計文獻(xiàn)特征信息;Python 腳本對作者數(shù)據(jù)進(jìn)行歸并整理,僅統(tǒng)計位列第一的作者信息,整理歸并機(jī)構(gòu)數(shù)據(jù)時僅統(tǒng)計分析一級機(jī)構(gòu),并進(jìn)行人工確認(rèn)。同時,使用VOSviewer_1.6.13 和CiteSpace.5.8.R3 軟件繪制國家/地區(qū)合作網(wǎng)絡(luò)和科研機(jī)構(gòu)合作網(wǎng)絡(luò)圖譜。
2.1 發(fā)文年份特征 醫(yī)學(xué)信息學(xué)領(lǐng)域的總發(fā)文量和高被引論文數(shù)呈總體上升趨勢,2020 年尤為明顯。高被引論文的總被引次數(shù)為101 619 次,篇均被引次數(shù)為212.15 次,6 篇被引次數(shù)超過1000 次,29 篇超過500 次。根據(jù)文獻(xiàn)被引的時間累積效應(yīng),總被引次數(shù)和篇均被引次數(shù)呈逐年遞減趨勢。但在2012年和2013 年出現(xiàn)波動,分析發(fā)現(xiàn)這兩年引用頻次超過500 次的文獻(xiàn)分別為7 篇和8 篇,提示這兩年醫(yī)學(xué)信息學(xué)領(lǐng)域涌現(xiàn)出大量的優(yōu)秀科研成果,見表1。
表1 醫(yī)學(xué)信息學(xué)高被引論文年度分布(2011-2021 年)
2.2 期刊分布特征 479 篇高被引論文來源于24 種期刊,見表2。其中22 種為多學(xué)科期刊,發(fā)表數(shù)量最多的是JOURNAL OF MEDICAL INTERNET RESEARCH。從出版國家看,英國期刊最多(10 種),其次是美國(5 種)。從影響力看,14 種期刊在該領(lǐng)域中排名前50%,為JCR Q1 區(qū),6 種JCR Q2 區(qū),7 種2020 年影響因子大于5 分,LANCET DIGITAL HEALTH最高,為24.519,24 種期刊平均影響因子為5.01。近半數(shù)高被引論文發(fā)表在該領(lǐng)域5 分以上的期刊上(46.56%),表明醫(yī)學(xué)信息學(xué)研究逐漸受到學(xué)術(shù)界的重視。
表2 醫(yī)學(xué)信息學(xué)高被引論文發(fā)文期刊分布前10 位(2011-2021 年)
2.3 作者分布及合作 高被引論文中24 篇為獨著(5.01%),455 篇合著(94.99%)。文獻(xiàn)署名1~98 人不等,87.89%的文獻(xiàn)署名人數(shù)在2~10 人,署名4 人的最多(86 篇,17.95%)。利用VOSviewer 軟件對文獻(xiàn)合作數(shù)量大于3 篇的高被引論文進(jìn)行作者合作網(wǎng)絡(luò)分析,發(fā)現(xiàn)僅形成3 個合作團(tuán)體,且團(tuán)隊間合作較少,表明國際上該領(lǐng)域已形成一批專業(yè)研究團(tuán)隊,內(nèi)部合作較為密切,但需進(jìn)一步提升團(tuán)隊間合作意識。
分析核心作者發(fā)現(xiàn),該領(lǐng)域共有3 人以第一作者發(fā)表3 篇及以上高被引論文,見表3。20 人以第一作者發(fā)表2 篇,可認(rèn)為他們是目前國際醫(yī)學(xué)信息學(xué)領(lǐng)域的重要人物。加拿大多倫多大學(xué)的Peter C Austin 高被引論文數(shù)量最多,其次是英國劍橋大學(xué)的Dan Jackson 和加拿大西安大略大學(xué)的G Y Zou。雖然部分研究人員僅發(fā)表1 篇高被引論文,但不能忽視其對醫(yī)學(xué)信息學(xué)發(fā)展做出的貢獻(xiàn),如劍橋大學(xué)Ian R White2011 年發(fā)表的Multiple imputation using chained equations: Issues and guidance for practice[8]被引頻次達(dá)4244 次;范德比爾特大學(xué)Paul A Harris2019 年發(fā)表的The REDCap consortium: Building an international community of software platform partners[9]被引頻次達(dá)2209 次。
表3 醫(yī)學(xué)信息學(xué)一作高被引論文數(shù)超過3 篇的作者信息(2011-2021 年)
2.4 全球產(chǎn)出貢獻(xiàn)及國際合作研究 479 篇高被引論文共來自64 個國家/地區(qū)。美國最多,高被引論文數(shù)高達(dá)223 篇,其他高產(chǎn)出國家有英國、加拿大、我國和澳大利亞等,見表4。美國、英國和我國的總被引頻次均超過10 000 次;排名前10 的國家中僅我國、荷蘭、英國和美國的篇均被引次數(shù)指標(biāo)超過200 次。由此可見,我國醫(yī)學(xué)信息學(xué)發(fā)展迅速,高被引論文的數(shù)量、質(zhì)量及影響力均位于全球前列。
表4 醫(yī)學(xué)信息學(xué)高被引論文數(shù)量排名前10 國家/地區(qū)(2011-2021 年)
高被引論文數(shù)量及合作國家數(shù)量呈整體上升趨勢,24 篇獨著文獻(xiàn)涉及12 個國家/地區(qū),226 篇國家/地區(qū)內(nèi)合作文獻(xiàn)涉及26 個國家/地區(qū),229 篇國際合作文獻(xiàn)涉及64 個國家/地區(qū),見表5。對文獻(xiàn)合作數(shù)量大于3 篇的高被引論文進(jìn)行國家/地區(qū)合作網(wǎng)絡(luò)分析,見圖1,表明各國間科研合作密切,國際合作日益頻繁。CiteSpace 分析發(fā)現(xiàn)德國、比利時、南非、丹麥等國家節(jié)點的中介中心性較強(qiáng),見圖2,表明對醫(yī)學(xué)信息學(xué)領(lǐng)域高被引論文的合作網(wǎng)絡(luò)具有較大貢獻(xiàn)。
圖1 VOSviewer 醫(yī)學(xué)信息學(xué)高被引論文國際合作研究情況(2011-2021 年)
圖2 CiteSpace 醫(yī)學(xué)信息學(xué)高被引論文國際合作研究情況(2011-2021 年)
表5 醫(yī)學(xué)信息學(xué)高被引論文國際合作研究情況(2011-2021 年)
2.5 科研機(jī)構(gòu)產(chǎn)出及合作 479 篇高被引論文共涉及964 所科研機(jī)構(gòu),一作歸屬科研機(jī)構(gòu)306 所。排名前10 的研究機(jī)構(gòu)中6 所來自美國,4 所來自英國,1 所來自加拿大,見表6。哈佛大學(xué)、倫敦大學(xué)和多倫多大學(xué)的總被引次數(shù)均超過7000 次,篇均被引次數(shù)超過300 次的有倫敦大學(xué)、倫敦大學(xué)學(xué)院和英國醫(yī)學(xué)研究委員會生物統(tǒng)計學(xué)所,表明英國知名科研機(jī)構(gòu)雖然發(fā)文量不及美國,但文獻(xiàn)質(zhì)量及影響力不亞于美國。
表6 醫(yī)學(xué)信息學(xué)高被引論文數(shù)量排名前10 研究機(jī)構(gòu)(2011-2021 年)
我國共65 所科研機(jī)構(gòu)為醫(yī)學(xué)信息學(xué)高影響力科研產(chǎn)出作出貢獻(xiàn),其中大陸55 所、香港5 所、澳門1 所、臺灣4 所;54 所為高校/研究院、9 所為醫(yī)院、2所為政府部門。中國科學(xué)院發(fā)表文獻(xiàn)數(shù)量最多(5篇),其次是香港中文大學(xué)(4 篇),之后是北京理工大學(xué)、北京協(xié)和醫(yī)學(xué)院、華中科技大學(xué)、深圳大學(xué)、中山大學(xué)、溫州大學(xué)、香港理工大學(xué)和香港大學(xué)(3篇),提示高校/研究院是我國醫(yī)學(xué)信息學(xué)領(lǐng)域的研究主力軍,但整體科研水平及影響力仍有待進(jìn)一步提高。
為進(jìn)一步了解科研機(jī)構(gòu)合作情況,采用VOSviewer 軟件對合作數(shù)量大于3 篇的高被引論文進(jìn)行機(jī)構(gòu)合作網(wǎng)絡(luò)分析見圖3,發(fā)現(xiàn)哈佛大學(xué)、倫敦大學(xué)、加州大學(xué)、斯坦福大學(xué)等國際知名高校的科研合作網(wǎng)絡(luò)十分密集。CiteSpace 結(jié)果顯示,香港中文大學(xué)、約克大學(xué)、北卡羅來納大學(xué)、美國國立衛(wèi)生研究院、約翰斯·霍普金斯大學(xué)、西奈山伊坎醫(yī)學(xué)院的機(jī)構(gòu)節(jié)點中介中心性較強(qiáng),表明其對該領(lǐng)域科研合作網(wǎng)絡(luò)的貢獻(xiàn)十分突出。我國大陸科研機(jī)構(gòu)的合作水平較少,仍需重視培養(yǎng)科研團(tuán)隊合作能力及合作意識,拓展國際合作交流圈。
圖3 醫(yī)學(xué)信息學(xué)高被引論文機(jī)構(gòu)合作研究情況(2011-2021 年)
2.6 基金資助 基金資助文獻(xiàn)往往具有較高的研究水平和意義。高被引論文中共有334 篇獲得基金支持,總被引次數(shù)為73 775 次,篇均被引次數(shù)為220.88 次;145 篇無基金支持的高被引論文總被引次數(shù)為27 844 次,篇均被引次數(shù)為192.03 次。由圖4 可知,2011-2021 年基金資助的高被引論文數(shù)量呈總體上升趨勢,但占各年高被引論文總量的比例呈總體下降趨勢。綜上所述,基金資助對文獻(xiàn)質(zhì)量具有重要作用,但并非決定因素。
圖4 醫(yī)學(xué)信息學(xué)高被引論文基金分布情況(2011-2021 年)
基金資助機(jī)構(gòu)中排名前10 的資助機(jī)構(gòu)大部分歸屬于美國和英國,見表7。美國衛(wèi)生與公眾服務(wù)部和美國國立衛(wèi)生研究院資助的高被引論文數(shù)超過100 篇,歐盟委員會和英國科研創(chuàng)新辦公室資助超過50 篇。我國國家自然科學(xué)基金共資助19 篇高被引論文,排名第9,且資助時間均為2015 年之后。2015 年前后我國出臺了一系列醫(yī)療衛(wèi)生信息化建設(shè)的政策方針,如關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見[10]、“健康中國2030”規(guī)劃綱要[11]、“十三五”衛(wèi)生與健康規(guī)劃[12]等,表明政策支持有助于推我國醫(yī)學(xué)信息學(xué)的高質(zhì)量發(fā)展。
表7 醫(yī)學(xué)信息學(xué)高被引論文數(shù)量排名前10 的基金資助機(jī)構(gòu)(2011-2021 年)
本研究以ESI 數(shù)據(jù)庫為數(shù)據(jù)來源,基于文獻(xiàn)計量學(xué)對2011-2021 年醫(yī)學(xué)信息學(xué)高被引論文的文獻(xiàn)特征進(jìn)行分析,探討國際醫(yī)學(xué)信息學(xué)領(lǐng)域的研究態(tài)勢。研究發(fā)現(xiàn),近10 年醫(yī)學(xué)信息學(xué)的研究方向逐漸廣泛,發(fā)文量和高被引論文數(shù)量呈增長態(tài)勢,歐美等發(fā)達(dá)國家所占比重明顯,且大部分受基金資助,中國國家自然科學(xué)基金的資助文獻(xiàn)僅占3.97%。此外,該領(lǐng)域已形成明顯的國際科研態(tài)勢,美國、英國和我國的產(chǎn)出量、被引次數(shù)指標(biāo)均位于前列。高被引論文往往由多位來自不同科研機(jī)構(gòu)的科研人員以共同合作的方式完成,且以國際合作或國家/地區(qū)內(nèi)部合作為主,提示多方合作更利于完成高質(zhì)量論文。
現(xiàn)階段我國醫(yī)學(xué)信息學(xué)已處于高速發(fā)展階段。從2011-2012 年的零成果到2015-2021 年高被引論文數(shù)持續(xù)位列前5,2020 年達(dá)到高峰,7 篇文獻(xiàn)的被引數(shù)量超過200[13-19],表明在該領(lǐng)域我國已實現(xiàn)質(zhì)和量的飛躍,成為國際醫(yī)學(xué)信息學(xué)領(lǐng)域的高生產(chǎn)力和高影響力國家之一。從核心作者和科研機(jī)構(gòu)指標(biāo)上看,我國高被引論文雖多以團(tuán)隊合作形式完成,但與其他國家/科研機(jī)構(gòu)的合作較少,提示尚未完全形成高質(zhì)量的研究團(tuán)隊,需重視與知名高校和科研機(jī)構(gòu)的合作交流,拓展學(xué)術(shù)交流圈。此外,基金資助情況是反映一個國家對學(xué)科重視程度的指標(biāo)之一[20]。我國國家自然科學(xué)基金資助的高被引論文總數(shù)占比不到4%,占我國該領(lǐng)域基金資助ESI 高被引論文的50%,表明對醫(yī)學(xué)信息學(xué)學(xué)科發(fā)展的重視程度有待提高。
綜上所述,10 年來國際醫(yī)學(xué)信息學(xué)領(lǐng)域發(fā)展迅速,國家、機(jī)構(gòu)及作者間合作活躍。我國在該領(lǐng)域的科研水平和影響力提升顯著,但核心作者、國際/機(jī)構(gòu)間的合作層次不足,有待進(jìn)一步改善。積極關(guān)注高產(chǎn)國家的科研機(jī)構(gòu)、核心作者的科研動態(tài),及時掌握熱點前沿,加強(qiáng)知識交流意識,拓展研究方向,有助于推動國內(nèi)醫(yī)學(xué)信息學(xué)的發(fā)展。本文存在一定局限性,由于數(shù)據(jù)來源僅為Web of Science 核心合集SCI 數(shù)據(jù)庫,雖然保證了文獻(xiàn)質(zhì)量,但是數(shù)據(jù)范圍過窄。此外,由于醫(yī)學(xué)信息學(xué)為典型的跨學(xué)科領(lǐng)域,研究方向廣泛,部分高影響力文獻(xiàn)并未列入該類別,導(dǎo)致未納入研究范疇,可能影響結(jié)果的精確性。