,,
目前,探討國外醫(yī)學(xué)信息學(xué)領(lǐng)域研究前沿的文獻(xiàn)尚少,缺乏對國外該領(lǐng)域先進(jìn)理念和技術(shù)方法的了解,阻礙了我國醫(yī)學(xué)信息學(xué)領(lǐng)域的發(fā)展和進(jìn)步。因此,全面了解國外醫(yī)學(xué)信息學(xué)領(lǐng)域的研究前沿,對促進(jìn)我國相關(guān)領(lǐng)域的發(fā)展具有重要意義。
本文運用共詞聚類分析和知識圖譜,使用定性與定量方法,分析了近5年國外醫(yī)學(xué)信息學(xué)領(lǐng)域的研究前沿,以期為我國醫(yī)學(xué)信息學(xué)領(lǐng)域的發(fā)展提供參考和借鑒。
共詞分析是由法國國家科學(xué)研究中心的Callon M等人提出的[1]。共詞分析是以文獻(xiàn)中共現(xiàn)的詞語作為研究對象,研究詞間關(guān)聯(lián)度,建立起對知識網(wǎng)絡(luò)結(jié)構(gòu)的描述,從而揭示學(xué)科領(lǐng)域的結(jié)構(gòu)和研究前沿[2]。在共詞分析的基礎(chǔ)上,借助聚類算法,對共詞網(wǎng)絡(luò)中各詞語間的聯(lián)系強(qiáng)度進(jìn)行計算,根據(jù)聚類結(jié)果,將聯(lián)系相對緊密的詞語聚集起來,形成相對獨立的團(tuán)體-類團(tuán),代表學(xué)科領(lǐng)域中的一個分支[3]。共詞聚類分析是在共詞分析的基礎(chǔ)上,事先不指定聚類的標(biāo)準(zhǔn),客觀地劃分學(xué)科領(lǐng)域的研究內(nèi)容,因而作為本研究的研究方法[2]。
科學(xué)知識圖譜是近年來科學(xué)計量學(xué)、信息計量學(xué)等領(lǐng)域比較新興的研究方法,不僅能揭示知識來源及其發(fā)展規(guī)律,且以圖形表達(dá)相關(guān)領(lǐng)域知識結(jié)構(gòu)關(guān)系與演進(jìn)規(guī)律[4]。知識圖譜應(yīng)用數(shù)學(xué)、圖形學(xué)、信息可視化技術(shù)等理論和方法,與傳統(tǒng)科學(xué)計量學(xué)的共詞分析、引文分析等方法相結(jié)合,用可視化圖譜直觀地、形象地展示學(xué)科的結(jié)構(gòu)[5]。
繪制知識圖譜的工具較多。其中VOSviewer是由荷蘭萊頓大學(xué)Van Eck N J和Waltman L等學(xué)者開發(fā)的可視化軟件,被廣泛應(yīng)用于各類共現(xiàn)分析,能夠繪制作者、引文、詞語等共現(xiàn)圖譜,主要以距離、密度等解構(gòu)節(jié)點之間的關(guān)系[6]。本文利用VOSviewer生成標(biāo)簽視圖(Label View)和熱點密度圖(Density View),利用SPSS 19.0生成聚類樹圖。結(jié)合3個知識圖譜,綜合分析國外醫(yī)學(xué)信息學(xué)領(lǐng)域的研究前沿。
核心期刊具有權(quán)威性、前瞻性等特點,刊載文獻(xiàn)質(zhì)量較高,是研究學(xué)科結(jié)構(gòu)和前沿的可靠參考和依據(jù)。本文以2014年JCR中醫(yī)學(xué)信息學(xué)類別IF值最高的5種期刊(表1)作為數(shù)據(jù)來源。利用PubMed數(shù)據(jù)庫,檢索并導(dǎo)出該5種期刊2010-2014年刊載的文獻(xiàn),共計3 244篇。
表1 JCR醫(yī)學(xué)信息學(xué)類別中IF值最高的5種期刊載文量
2.2.1 截取高頻詞
為了簡化統(tǒng)計過程,同時減少低頻詞為統(tǒng)計過程帶來的不必要干擾,選擇高頻詞作為研究對象。目前高頻詞界值的確定尚未有統(tǒng)一的見解,主要有以下幾種方法:經(jīng)驗法、二八定律、齊普夫第二定律、g指數(shù)、高頻低頻詞界分公式等。經(jīng)過試驗,選擇由DonohueJ C提出的高頻低頻詞分界公式截取高頻詞[7]。計算公式為如下:
其中I1是詞頻為1的關(guān)鍵詞的個數(shù);T是高頻詞中的最低頻次,即高低頻分界。
運用BICOMB軟件統(tǒng)計主要主題詞的出現(xiàn)頻次,并根據(jù)高頻低頻詞界分公式截取高頻詞,共截取了54個高頻主題詞(見表2)。
表2 醫(yī)學(xué)信息學(xué)領(lǐng)域54個高頻主題詞
續(xù)表2
2.2.2 構(gòu)建共現(xiàn)矩陣
2.2.2.1 構(gòu)建原始共現(xiàn)矩陣
高頻主題詞一定程度上代表了近5年國外該領(lǐng)域?qū)W者關(guān)注的重點,但它們是孤立的點,不能很好地反映學(xué)科領(lǐng)域的結(jié)構(gòu)。因此,本文利用BICOMB軟件構(gòu)建了高頻主題詞的54*54共現(xiàn)矩陣。
2.2.2.2 構(gòu)建相似共現(xiàn)矩陣
原始共現(xiàn)矩陣中兩個主題詞共現(xiàn)頻次的大小受各自主題詞詞頻的影響,因而原始共現(xiàn)矩陣反映的是一種表象。為準(zhǔn)確揭示主題詞間的共現(xiàn)關(guān)系,需要對原始矩陣進(jìn)行包容化處理,使核心主題和非核心主題間的分界更加明顯[8]。常見的處理方法有包容指數(shù)法、臨近指數(shù)法、等價系數(shù)法、Ochiia系數(shù)法。經(jīng)試驗,Ochiia系數(shù)法最適合,Ochiia系數(shù)計算公式如下[9]:
其中Cij代表詞對Mi和Mj在文獻(xiàn)集合中共同出現(xiàn)的頻次,Ci代表詞Mi在文獻(xiàn)集合中的出現(xiàn)頻次,Cj代表詞Mj在文獻(xiàn)集合中的出現(xiàn)頻次。
本文利用共現(xiàn)網(wǎng)絡(luò)分析和熱點密度分析識別國外醫(yī)學(xué)信息學(xué)領(lǐng)域?qū)W者關(guān)注的熱點主題詞,利用共詞聚類分析劃分該領(lǐng)域的前沿研究方向,從詞和類團(tuán)兩個角度探測國外醫(yī)學(xué)信息學(xué)領(lǐng)域的研究前沿。
圖1為標(biāo)簽視圖(Label View),該圖譜展現(xiàn)了國外醫(yī)學(xué)信息學(xué)領(lǐng)域的共現(xiàn)網(wǎng)絡(luò)。其中節(jié)點及標(biāo)簽代表主題詞,節(jié)點和標(biāo)簽的大小取決于該節(jié)點的權(quán)重。權(quán)重越大,節(jié)點和標(biāo)簽越大,節(jié)點越重要。VOSviewer為避免標(biāo)簽重疊,只顯示子標(biāo)簽。節(jié)點間的連線代表節(jié)點間具有共現(xiàn)關(guān)系,當(dāng)鼠標(biāo)點在線條上時,顯示該線條所連接的節(jié)點及其共現(xiàn)頻次。
圖1標(biāo)簽視圖
由圖1可知,各節(jié)點權(quán)重不同,如Electronic Health Records,Decision Support Systems, Clinical,Natural Language Processing,Data Mining,Medical Record Linkage以及Information Storage and Retrieval等節(jié)點和標(biāo)簽都較大,具有較高的權(quán)重,在國外醫(yī)學(xué)信息學(xué)領(lǐng)域占重要地位。
圖2為國外醫(yī)學(xué)信息學(xué)領(lǐng)域的熱點密度圖(Density View)。圖中顏色代表密度,圖譜默認(rèn)呈現(xiàn)深線色。節(jié)點在領(lǐng)域中權(quán)重越大,顏色越深。相反,在領(lǐng)域中的權(quán)重越小,顏色越淺,因此通過顏色能夠直觀地辨別哪個區(qū)域比較重要[10]。
圖2熱點密度圖
由圖2可知,位于深色區(qū)域的主題詞是國外醫(yī)學(xué)信息學(xué)領(lǐng)域的重要研究主題。Electronic Health Records,Natural Language Processing,Data Mining,Medical Informatics,Medication Errors及Information Storage and Retrieval等詞位于顏色最深的區(qū)域,熱度最大,是國外醫(yī)學(xué)信息學(xué)領(lǐng)域最熱的研究前沿,其他顏色接近深色區(qū)域的主題詞也是該領(lǐng)域的重點研究主題。國外醫(yī)學(xué)信息學(xué)領(lǐng)域的熱點主題詞見表3。
表3 國外醫(yī)學(xué)信息學(xué)領(lǐng)域熱點主題詞
通過共現(xiàn)網(wǎng)絡(luò)圖和熱點密度圖可以識別哪些主題詞是國外醫(yī)學(xué)信息學(xué)領(lǐng)域?qū)W者關(guān)注的重點和熱點,但不能反映該領(lǐng)域的重要研究方向或領(lǐng)域分支。為此,本文利用SPSS 19.0對相似矩陣進(jìn)行聚類分析,采用系統(tǒng)聚類方法,度量標(biāo)準(zhǔn)的區(qū)間選擇平方Euclidean距離,繪制出聚類樹圖,根據(jù)聚類樹圖劃分出12個類團(tuán)(表4)。
表4 國外醫(yī)學(xué)信息學(xué)領(lǐng)域類團(tuán)列表
由表4的聚類結(jié)果可知,國外醫(yī)學(xué)信息學(xué)領(lǐng)域主要有12個前沿的研究方向:醫(yī)療決策支持系統(tǒng)和計算機(jī)輔助的藥物治療,決策支持,計算機(jī)安全和保密,電子健康檔案的自然語言處理和數(shù)據(jù)挖掘,醫(yī)療保健的態(tài)度、質(zhì)量和模式,病案系統(tǒng)及其聯(lián)動,信息系統(tǒng)及其整合,醫(yī)學(xué)信息學(xué)在計算生物學(xué)中的應(yīng)用,語義學(xué)和受控詞匯,遠(yuǎn)程醫(yī)療,人口監(jiān)測的統(tǒng)計模型及衛(wèi)生保健的成果評估。
通過分析國外醫(yī)學(xué)信息學(xué)領(lǐng)域的研究前沿,得出如下結(jié)論:國外醫(yī)學(xué)信息學(xué)領(lǐng)域的學(xué)者將數(shù)據(jù)挖掘、自然語言處理、決策支持、信息存儲與檢索、語義學(xué)、數(shù)據(jù)庫管理系統(tǒng)等計算機(jī)技術(shù)應(yīng)用到衛(wèi)生醫(yī)療領(lǐng)域,實現(xiàn)電子健康檔案、臨床決策支持、計算機(jī)輔助藥物治療以及遠(yuǎn)程醫(yī)療等,改善了衛(wèi)生醫(yī)療的效率和質(zhì)量。
對于計算機(jī)安全和保密的研究,以及對現(xiàn)有技術(shù)或系統(tǒng)的問題的研究也是前沿的主題,如電子處方導(dǎo)致用藥錯誤的研究等。關(guān)于臨床醫(yī)生的診療模式、醫(yī)療服務(wù)的態(tài)度和質(zhì)量、以患者為中心的醫(yī)療等研究也是國外醫(yī)學(xué)信息學(xué)領(lǐng)域的研究前沿。