劉偉彥
(澳大利亞蒙納士大學(xué) 信息技術(shù)學(xué)院,澳大利亞 墨爾本 3800)
知識圖譜是通過數(shù)據(jù)挖掘、信息分析、計量和圖形繪制等一系列處理,來可視化地展現(xiàn)某一領(lǐng)域的知識的方法,能起到相關(guān)數(shù)據(jù)分析和知識導(dǎo)航的作用,2005年引入我國以來,在我國勃然興起并獲得長足的發(fā)展。
科學(xué)知識圖譜是以知識域(knowledge domain)為對象,顯示科學(xué)知識的發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一種圖像。它既是可視化的知識圖形,又是序列化的知識譜系,顯示了知識單元或知識群之間網(wǎng)絡(luò)、結(jié)構(gòu)、互動、交叉、演化或衍生等諸多隱含的復(fù)雜關(guān)系,而這些關(guān)系正好表明了某些規(guī)律性和新的知識點(diǎn)。
知識圖譜是一種結(jié)構(gòu)化的語義知識庫,其價值在于通過推理,實現(xiàn)對現(xiàn)有的字符串模糊匹配,實現(xiàn)概念檢索,同時,對非結(jié)構(gòu)化知識,以圖形化方法,向運(yùn)用人員展示經(jīng)過分析、歸類、整理的知識,實現(xiàn)知識的結(jié)構(gòu)化。CiteSpace 作為分析、挖掘和可視科研文獻(xiàn)數(shù)據(jù)的應(yīng)用系統(tǒng),通過分析尋找某一學(xué)科領(lǐng)域的研究熱點(diǎn),選用頻次(Freq)和中心性(Centrality)進(jìn)行知識圖譜分析。
考慮到免疫學(xué)的主要內(nèi)容沒有具體的免疫活動,且為了保證數(shù)據(jù)的完整性與權(quán)威性,檢索條目為“免疫”“免疫學(xué)”。在中國知網(wǎng)上搜索相關(guān)內(nèi)容能搜索出將近9 萬條相關(guān)文獻(xiàn)記錄。同時在進(jìn)行時間相關(guān)的研究時,作者選擇以2003—2020年期間免疫學(xué)相關(guān)的研究領(lǐng)域進(jìn)行研究,并以一年為單位進(jìn)行時間切片,數(shù)據(jù)樣本選自中國學(xué)術(shù)期刊出版總庫(CNKI 總庫)。選擇相關(guān)性排序的前1 490 余篇論文作為研究素材,找出相關(guān)領(lǐng)域的研究熱點(diǎn)并轉(zhuǎn)化為可視化方式進(jìn)行呈現(xiàn),將此作為研究的主要對象。
關(guān)鍵詞一般能展示出論文的核心觀點(diǎn),對于掌握相關(guān)領(lǐng)域熱點(diǎn)有相當(dāng)大的幫助。為了了解免疫學(xué)在這段時間內(nèi)的研究熱點(diǎn)和新興領(lǐng)域并預(yù)測學(xué)科未來走勢,作者對所有論文進(jìn)行了爆發(fā)詞分析。具體操作為從中國知網(wǎng)查找2003年至2020年4月免疫學(xué)相關(guān)的文獻(xiàn),排除會議摘要和報道等,以“主題詞=*免疫*or *免疫學(xué)*”進(jìn)行檢索。共得檢索結(jié)果51 495 條,選擇相關(guān)性排序的前1 490 余篇論文作為研究素材,然后以refworks 的格式進(jìn)行保存,找出相關(guān)領(lǐng)域的研究熱點(diǎn)并轉(zhuǎn)化為可視化方式進(jìn)行呈現(xiàn),并將此作為本次研究的主要研究對象。
這里以標(biāo)題(title)、摘要(abstract)、作者關(guān)鍵詞(author keywords)和增補(bǔ)關(guān)鍵詞(keywords plus)作為聚類詞來源;聚類詞庫選擇爆發(fā)詞(burst terms);節(jié)點(diǎn)類型選擇關(guān)鍵詞(keyword),構(gòu)建知識圖譜,結(jié)果如圖1所示。
圖1 關(guān)鍵詞分析知識圖譜
圖1關(guān)鍵詞分析知識圖譜顯示了2003年至2020年期間免疫學(xué)相關(guān)論文中高頻出現(xiàn)的關(guān)鍵詞。包含306 個節(jié)點(diǎn),740條節(jié)點(diǎn)之間的連接。網(wǎng)絡(luò)密度0.015 9。出現(xiàn)次數(shù)較多的點(diǎn)由較大的節(jié)點(diǎn)表示。分析可知除免疫學(xué)、免疫外,疫苗、免疫細(xì)胞和免疫治療是出現(xiàn)次數(shù)較多且具有一定代表性的關(guān)鍵詞。這些關(guān)鍵詞可以大致反映出17年間免疫學(xué)涵蓋的研究范圍。由于其網(wǎng)絡(luò)密度較高,且大部分關(guān)鍵詞之間的連接都呈網(wǎng)狀我們可以推斷出這些不同的領(lǐng)域之間雖有較強(qiáng)的聯(lián)系。
知識圖譜的聚類分析可以將所有有關(guān)聯(lián)且屬于一個領(lǐng)域的知識點(diǎn)聚集起來形成聚類,以一個整體展現(xiàn)出來。這樣的顯示方式能更加明顯直觀地表現(xiàn)出學(xué)科構(gòu)成和領(lǐng)域間的關(guān)系。
這里以標(biāo)題(title)、摘要(abstract)、作者關(guān)鍵詞(author keywords)和增補(bǔ)關(guān)鍵詞(keywords plus)作為聚類詞來源;聚類詞庫選擇爆發(fā)詞(burst terms);節(jié)點(diǎn)類型選擇關(guān)鍵詞(keyword),進(jìn)行關(guān)鍵詞知識圖譜的構(gòu)建工作和聚類,結(jié)果如圖2所示。
圖2 免疫學(xué)聚類知識圖譜
圖2使用點(diǎn)來代表結(jié)點(diǎn),使用線來表示關(guān)系。這張圖中一共包含622 個節(jié)點(diǎn),874 條節(jié)點(diǎn)之間的連接。同時圖片以顏色的不同用以區(qū)分聚類的不同。我們可以看出免疫學(xué)是一門涵蓋領(lǐng)域相當(dāng)多的學(xué)科在對數(shù)據(jù)進(jìn)行聚類的時候,這里選擇的算法是基于目錄的聚類算法,該算法將免疫學(xué)分為11個類其中以涵蓋節(jié)點(diǎn)數(shù)量為評判標(biāo)準(zhǔn)最多的是免疫失敗、免疫治療、免疫、免疫學(xué)、免疫功能、免疫應(yīng)答、體液免疫和免疫原性這幾個類別。
圖2與表1均為CiteSpace 用基于目錄的聚類算法進(jìn)行的聚類分析圖。通過圖與表我們可以看出,免疫學(xué)的范圍非常寬泛,各個不同主題之間總是有很多聯(lián)系和共通點(diǎn)??傮w呈現(xiàn)一種獨(dú)特的網(wǎng)狀結(jié)構(gòu)。從包含節(jié)點(diǎn)數(shù)量來看,免疫失敗、免疫治療、免疫、免疫學(xué)、免疫功能、免疫應(yīng)答、體液免疫和免疫原性是免疫學(xué)幾個主要內(nèi)容。各個主要聚類相互重合的區(qū)域很大,可見各個學(xué)科之間聯(lián)系緊密,且經(jīng)常有同時包含多個據(jù)類內(nèi)容的中間學(xué)科,而免疫學(xué)這個整體也由這些小學(xué)科相互鏈接主要聚類構(gòu)成??梢钥闯?,這些聚類中也有少量僅與免疫學(xué)本身相關(guān)的獨(dú)立學(xué)科,如淋巴細(xì)胞凋亡和隱球菌的。
表1 關(guān)鍵詞共線網(wǎng)絡(luò)聚類表
對圖2的聚類圖譜進(jìn)行爆發(fā)點(diǎn)分析即可得到關(guān)鍵詞突現(xiàn)圖,如圖3所示。進(jìn)行結(jié)點(diǎn)分析可得表2關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)聚類表。
圖3 免疫學(xué)相關(guān)關(guān)鍵詞突現(xiàn)圖
表2 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)聚類表
分析表2我們可以看出,免疫學(xué)和免疫在2013年出現(xiàn),隨后于2014年左右又出現(xiàn)了免疫治療、免疫抑制等比較受人關(guān)注的新技術(shù)領(lǐng)域。在2020年之后,免疫學(xué)還迎來過一次教學(xué)改革,相關(guān)內(nèi)容也受到了較高的關(guān)注。
由圖3的爆發(fā)點(diǎn)分析我們可以得到如下結(jié)論:免疫學(xué)的研究主流大致變化軌跡是乙型(2013—2017)、肝炎(2013—2016)、免疫機(jī)制(2013—2015),隨后是肝炎疫苗(2014—2016)和動物模型(2014—2020),之后再有兒童(2015—2020)和免疫(2015—2017),最后安全性(2016—2020)、嬰兒(2016—2018)、免疫反應(yīng)(20916—2020。其中持續(xù)最久的研究內(nèi)容是動物模型,一共維持熱點(diǎn)長達(dá)6年之久。未成年人相關(guān)的熱點(diǎn)出現(xiàn)過兩次。
可見在將來,“動物模型”可能繼續(xù)是教育相關(guān)的免疫學(xué)熱門研究領(lǐng)域,而研究熱點(diǎn)則會集中于系統(tǒng)性紅斑狼瘡、醫(yī)學(xué)免疫學(xué)、類風(fēng)濕關(guān)節(jié)炎、病原生物與免疫學(xué)上。
為了更加直觀的顯示出聚類之間的聯(lián)系和時間關(guān)系,這里選擇利用CiteSpace 對免疫學(xué)聚類知識圖譜進(jìn)行分析,得到關(guān)鍵詞時線圖譜如圖4所示。
如圖4所示,免疫學(xué)的各個領(lǐng)域中最受關(guān)注的,被論文調(diào)用次數(shù)最多的其實是免疫治療、免疫、免疫學(xué)、體液免疫和免疫原性。隱球菌相關(guān)的領(lǐng)域也經(jīng)常被作為關(guān)鍵詞被引用。相關(guān)的熱點(diǎn)研究開始時間大都在2014年到2018年,只有基礎(chǔ)醫(yī)學(xué)和免疫學(xué)有較長的研究歷史。而在未來,免疫學(xué)相關(guān)的熱點(diǎn)研究可能主要集中于免疫治療、免疫、免疫學(xué)、體液免疫和免疫原性這兩門至今還是研究熱點(diǎn)的學(xué)科上。
圖4 免疫相關(guān)關(guān)鍵詞時線圖譜
免疫學(xué)是一門涵蓋范圍較廣,牽涉學(xué)科較多的科目。其主要的內(nèi)容分為免疫學(xué)、免疫治療、體液免疫和免疫原性幾大塊。按照免疫學(xué)總覽聚類知識圖譜分析方法,對免疫學(xué)的其他關(guān)聯(lián)分支,同樣能進(jìn)行深入分析。
醫(yī)學(xué)免疫學(xué)在17年間的研究領(lǐng)域內(nèi)出現(xiàn)過大量的研究熱點(diǎn)。同時醫(yī)學(xué)免疫學(xué)近年來出現(xiàn)過微信平臺和翻轉(zhuǎn)課堂這樣迎合時代潮流的項目,可謂是與時俱進(jìn)。預(yù)計將來的熱點(diǎn)研究將集中于微信公眾平臺、課程整合、翻轉(zhuǎn)課堂這幾個部分。
基礎(chǔ)醫(yī)學(xué)比較注重教育教學(xué)相關(guān)的研究,同時很多基礎(chǔ)醫(yī)學(xué)的論文也會提及基礎(chǔ)醫(yī)療保險的相關(guān)內(nèi)容,可見兩者之間的緊密聯(lián)系。其下的影響因素和虛擬仿真技術(shù)相關(guān)研究預(yù)計在將來會有進(jìn)一步的發(fā)展。
細(xì)胞免疫學(xué)十分平穩(wěn),但在17年里沒有大量爆發(fā)點(diǎn),可見其內(nèi)涵的領(lǐng)域大都已經(jīng)被相當(dāng)深入的研究過了。不過這些領(lǐng)域依舊被近年來的論文頻頻提起。在將來細(xì)胞免疫功能,巨噬細(xì)胞和癌癥相關(guān)的研究(如化療和胃癌)還會有新的發(fā)展。
這幾個主要內(nèi)容之間又有特殊的關(guān)系。免疫治療、免疫功能之間的關(guān)系十分緊密,因為它們包含很多共同研究內(nèi)容。而細(xì)胞學(xué)則是十分獨(dú)立的學(xué)科,它僅與免疫功能相關(guān)內(nèi)容有少量交集。同時免疫學(xué)這門學(xué)科與信息技術(shù),科技教育甚至醫(yī)療保險等其他領(lǐng)域的研究也有一定關(guān)聯(lián)。
免疫學(xué)作為一門古老而新興的學(xué)科如今依舊有相當(dāng)活躍的表現(xiàn),相關(guān)論文的發(fā)文量正穩(wěn)步增長。從事免疫學(xué)研究的機(jī)構(gòu)和個人也有很多。然而機(jī)構(gòu)之間和作者之間的合作較為稀少,合作進(jìn)行得不夠密切??傮w呈現(xiàn)出一種部分集中,整體分散的狀態(tài)。這可能對部分研究的進(jìn)行有負(fù)面作用。
在2020年左右,免疫學(xué)相關(guān)的教育教學(xué)發(fā)生了一些變化,在基礎(chǔ)醫(yī)學(xué)和醫(yī)學(xué)免疫學(xué)上有明顯表現(xiàn)。具體是基礎(chǔ)醫(yī)學(xué)教育方面的熱點(diǎn)結(jié)束,醫(yī)學(xué)免疫學(xué)隨即開始出現(xiàn)以改善教育教學(xué)為目的的研究。