文 卉 劉英杰
(湖北中醫(yī)藥大學(xué)圖書館,湖北 武漢 430065)
數(shù)字人文概念最先出現(xiàn)在2004年的《數(shù)字人文指南》, 其最初的核心特征之一就是使用計(jì)算機(jī)來解決傳統(tǒng)人文研究中遇到的、傳統(tǒng)手段無法解決的問題[1],而不是單純地將人文學(xué)科內(nèi)容進(jìn)行數(shù)字化存儲。 中醫(yī)先圣李時珍的代表作《本草綱目》,曾被達(dá)爾文譽(yù)為“中國古代的百科全書”,因此對《本草綱目》、李時珍及其醫(yī)學(xué)思想等進(jìn)行研究的文獻(xiàn)種目繁多,例如,莫亮波等從陰陽五行、天人相應(yīng)、培元固真及臟腑學(xué)說四個方面考辨《本草綱目》對《黃帝內(nèi)經(jīng)》的繼承與發(fā)揮[2];李載榮在其博士論文中詳細(xì)比較了《本草綱目》流傳過程中的三個不同版本體系及其在歐亞的傳播[3];王劍等從李時珍的家庭影響、求學(xué)經(jīng)歷、生活時代處著手,剖析其“天人和通”的醫(yī)道文化思想[4];趙方舟等提出李時珍的《瀕湖脈訣》中首創(chuàng)以陰陽屬性來分類脈象[5],還有其他學(xué)者研究李時珍生平、醫(yī)德或者考證著作《本草綱目》的附方、釋名等。 然而對于此類文獻(xiàn)的定量研究卻比較少, 為進(jìn)一步了解李時珍醫(yī)藥文化研究的熱點(diǎn)及區(qū)域分布情況, 本文基于文獻(xiàn)計(jì)量學(xué)理論及信息可視化技術(shù)的運(yùn)用,以中國知網(wǎng)(CNKI)平臺1970年至2020年的李時珍醫(yī)藥相關(guān)文獻(xiàn)為研究對象, 從數(shù)字人文角度對李時珍醫(yī)藥研究文獻(xiàn)的熱點(diǎn)及演化進(jìn)行分析,根據(jù)關(guān)鍵詞挖掘研究熱點(diǎn)及聚類歸納研究方向。
本文數(shù)據(jù)來源于中國知網(wǎng)(CNKI)數(shù)據(jù)庫,在中國知網(wǎng)數(shù)據(jù)庫“期刊”文獻(xiàn)檢索欄(跨庫:學(xué)術(shù)期刊、博碩)使用專業(yè)檢索,檢索式為SU=(李時珍+本草綱目+奇經(jīng)八脈考+瀕湖脈訣)AND KY=(東璧+瀕湖+李時珍+本草綱目+奇經(jīng)八脈考+瀕湖脈訣)AND TI=(東璧+瀕湖+李時珍+本草綱目+奇經(jīng)八脈考+瀕湖脈訣), 時間跨度為1970年01月01日至2020年07月01日, 檢索時間為2020年11月12日,得到中文數(shù)據(jù)1362條,其中學(xué)術(shù)期刊1002條,學(xué)位論文32條,按統(tǒng)一剔除標(biāo)準(zhǔn)(剔除無作者文獻(xiàn)、創(chuàng)刊詞、會議通知、蘄春地區(qū)發(fā)展類文獻(xiàn)等)手動刪除不相關(guān)數(shù)據(jù)后,共得到有效數(shù)據(jù)1181條。
本文從數(shù)字人文角度, 以定量與定性相結(jié)合的方法,深入剖析李時珍醫(yī)藥文化的研究熱點(diǎn)與區(qū)域分布。在定量研究方面,將在中國知網(wǎng)(CNKI)數(shù)據(jù)庫選取的全部文獻(xiàn)以Endnote格式導(dǎo)出(停用李時珍|時珍|本草綱目|《本草綱目》,高頻字段顯示個數(shù)100,矩陣大小設(shè)計(jì)100),導(dǎo)入文獻(xiàn)題錄統(tǒng)計(jì)分析工具軟件SATI4.0[6],得到去重后文獻(xiàn)1156篇, 對全部有效文獻(xiàn)進(jìn)行在線可視化分析,挖掘研究熱點(diǎn)、歸納研究方向。
2.1.1 年發(fā)文量
某一研究領(lǐng)域的全年文獻(xiàn)發(fā)表量能反映出該領(lǐng)域的研究發(fā)展趨勢及其受關(guān)注的程度。本文以一年為一個時間段進(jìn)行統(tǒng)計(jì), 在CNKI收錄的1970—2020年這段時間里,有關(guān)李時珍醫(yī)藥文化研究領(lǐng)域的全年文獻(xiàn)發(fā)文量有四個明顯的峰值, 分別是1983年36篇,1994年47篇,2006年56篇,2018年60篇。
2.1.2 重要發(fā)文機(jī)構(gòu)
全部有效文獻(xiàn)的發(fā)文機(jī)構(gòu)總數(shù)共920個, 獨(dú)立機(jī)構(gòu)數(shù)682個。其中總發(fā)文量>5的機(jī)構(gòu)有17個,利用SATI軟件制作高頻機(jī)構(gòu)知識圖譜(高頻網(wǎng)絡(luò)節(jié)點(diǎn):頻次排名大于或等于矩陣大小100), 進(jìn)行去除噪點(diǎn)處理后,可以觀察到8個互有關(guān)聯(lián)的研究群體, 其中以湖北中醫(yī)藥大學(xué)、 中國中醫(yī)科學(xué)院中國醫(yī)史文獻(xiàn)研究所、北京中醫(yī)藥大學(xué)為首的三個研究群體最為突出。
2.1.3 文獻(xiàn)來源
本文研究的1156條有效文獻(xiàn)來源于424種期刊,其中發(fā)文量大于10篇的有18種,已形成比較穩(wěn)定的文獻(xiàn)發(fā)表期刊群體。
1156 篇文獻(xiàn)總作者數(shù)1738位,其中獨(dú)立作者數(shù)1247位。 發(fā)文量大于等于5篇的作者有30位。 利用SATI軟件制作高頻作者知識圖譜 (高頻網(wǎng)絡(luò)節(jié)點(diǎn):頻次排名大于或等于矩陣大小100),可以看出作者群體中出現(xiàn)四個明顯的作者團(tuán)體:一個以王劍、梅全喜等為主;一個以張冰等為主;以鄭金生、張志斌等為主;最后一個袁一平等為主。同一作者團(tuán)體提示研究內(nèi)容或者主題相近,或研究領(lǐng)域出現(xiàn)密切關(guān)聯(lián)。
圖1
1156 條有效記錄中有基金支持的文獻(xiàn)去重后為53篇,分別來自19項(xiàng)基金支持,其中發(fā)表文獻(xiàn)量超過5篇的基金有三個:國家自然科學(xué)基金(16篇)、國家重點(diǎn)基礎(chǔ)研究發(fā)展規(guī)劃(973計(jì)劃)(9篇)、湖北省教育委員會科學(xué)研究計(jì)劃項(xiàng)目 (5篇)。 以時間為序來觀察,2019年獲得基金支持達(dá)到頂峰,年發(fā)表文獻(xiàn)15篇,其中藥物防毒警戒思想方面達(dá)5篇, 提示2019年中藥毒理研究、藥物防毒警戒為熱點(diǎn)研究項(xiàng)目。
關(guān)鍵詞是一篇文獻(xiàn)濃縮后的精華,可以從一定程度上反映出該文獻(xiàn)的研究中心與主題。利用SATI軟件將1156篇文獻(xiàn)的關(guān)鍵詞進(jìn)行聚類分析 (停用關(guān)鍵詞李時珍、時珍、本草綱目、《本草綱目》),根據(jù)高頻關(guān)鍵詞來發(fā)掘李時珍醫(yī)藥文化研究的熱點(diǎn)。從關(guān)鍵詞聚類分析表中發(fā)現(xiàn),李時珍醫(yī)藥研究主要分為2個聚類,第一個是以本草、中藥、版本、考證、王世貞、目錄學(xué)等詞為主的聚類;第二個是以中藥學(xué)、植物藥、中醫(yī)學(xué)、學(xué)術(shù)思想、張仲景、太醫(yī)院等詞為主的聚類。以上兩種聚類方式可以歸納出,李時珍醫(yī)藥文化研究主要分為兩個方向:一個是從??闭`的角度對李時珍的《本草綱目》進(jìn)行版本、醫(yī)藥、本草等的考證與補(bǔ)充;第二個是從歷史的角度對李時珍及其著作的出版、 內(nèi)容、醫(yī)學(xué)理論傳承、經(jīng)歷等進(jìn)行研究。
本文唯一的數(shù)據(jù)來源是中國知網(wǎng)(CNKI)平臺,因此在統(tǒng)計(jì)結(jié)果上必然不是完全精確的。但是依據(jù)現(xiàn)有結(jié)果,依舊可以看出《本草綱目》作為李時珍的巔峰巨著,對研究者有極大的吸引力,無論是它的版本流傳,還是正誤辨析,或者是補(bǔ)充拓展,都有相當(dāng)數(shù)量的文獻(xiàn)研究。 而在李時珍研究的發(fā)文方面,發(fā)文機(jī)構(gòu)和交流平臺亦已形成自己的領(lǐng)域,都聚集了一批高產(chǎn)作者長期致力于李時珍研究。遺憾的是無論是研究機(jī)構(gòu)還是作者本身,相互間的信息流動都略顯不足,絕大多數(shù)還是處于研究孤島的封閉式探索,出現(xiàn)重復(fù)研究或者資料采集困難的現(xiàn)象。本文運(yùn)用定量方法對李時珍研究進(jìn)行熱點(diǎn)分析, 可以看出數(shù)字人文研究方法,尤其是某些計(jì)算機(jī)軟件的運(yùn)用,不僅創(chuàng)新了傳統(tǒng)研究方法,也提供了新的研究視角。