高磊,崔國賢,彭劍,李金,曹曉蘭*
(1.湖南農(nóng)業(yè)大學(xué)信息與智能科學(xué)技術(shù)學(xué)院,湖南 長沙 410128;2.湖南農(nóng)業(yè)大學(xué)苧麻研究所,湖南 長沙 410128)
苧麻,蕁麻科苧麻屬多年生宿根性草本植物。苧麻葉是蛋白質(zhì)含量較高、營養(yǎng)豐富的飼料;苧麻根含有藥用成分“苧麻酸”,有補(bǔ)陰、安胎、治產(chǎn)前產(chǎn)后心煩,以及治疔瘡等作用;麻骨可作造紙?jiān)?,或制造家具和板壁等多種用途的纖維板,麻骨還可釀酒、制糖;麻殼可脫膠提取纖維,供紡織、造紙或修船填料之用。鮮麻皮上刮下的麻殼,可提取糠醛,而糠醛是化學(xué)工業(yè)的精煉溶液劑,又是樹脂塑料。中國苧麻種植面積及原麻總產(chǎn)量占世界的90%以上。苧麻產(chǎn)業(yè)發(fā)展在豐富紡織品市場、擴(kuò)大外貿(mào)出口規(guī)模、推動(dòng)傳統(tǒng)產(chǎn)業(yè)改造等方面具有極其重要的意義[1-3]。
文獻(xiàn)計(jì)量學(xué)是以文獻(xiàn)體系和文獻(xiàn)計(jì)量特征為研究對象,采用數(shù)學(xué)、統(tǒng)計(jì)學(xué)等計(jì)量方法研究文獻(xiàn)情報(bào)的分布結(jié)構(gòu)、數(shù)量關(guān)系、變化規(guī)律和定量管理,進(jìn)而探討科學(xué)技術(shù)的結(jié)構(gòu)、特征和規(guī)律的一門學(xué)科[4]。
知識(shí)圖譜用各種不同的圖形展現(xiàn)知識(shí)之間的結(jié)構(gòu)關(guān)系,同時(shí)顯示知識(shí)領(lǐng)域的發(fā)展和變化過程。通過對知識(shí)的挖掘、分析進(jìn)而進(jìn)行可視化,最終用圖譜的形式展示某一學(xué)科領(lǐng)域的主要研究內(nèi)容、發(fā)展歷史、前沿問題,使研究者對學(xué)科結(jié)構(gòu)、研究內(nèi)容、學(xué)科關(guān)系和研究熱點(diǎn)有清晰的把握,并可預(yù)測學(xué)科發(fā)展前沿和趨勢[5]。知識(shí)圖譜分析是將數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)量學(xué)、信息科學(xué)與可視化技術(shù)相結(jié)合的一種分析方法,在當(dāng)前大數(shù)據(jù)時(shí)代背景下發(fā)展迅速,已被廣泛應(yīng)用于各個(gè)領(lǐng)域。比如趙浩含等[6]基于文獻(xiàn)計(jì)量的國家麻類產(chǎn)業(yè)技術(shù)體系發(fā)展態(tài)勢分析與建議,以知識(shí)圖譜可視化的方式分析出國家麻類產(chǎn)業(yè)技術(shù)體系在促進(jìn)多元主體職能分工、加強(qiáng)科研與產(chǎn)業(yè)熱點(diǎn)結(jié)合、促進(jìn)麻類學(xué)科縱向深入和橫向拓展、強(qiáng)化依托單位支撐能力等方面發(fā)揮了重要作用。
CitespaceV軟件以引文分析和知識(shí)圖譜可視化技術(shù)為基礎(chǔ),實(shí)現(xiàn)了文獻(xiàn)計(jì)量學(xué)與知識(shí)圖譜分析技術(shù)的融合,被用于識(shí)別某一科學(xué)領(lǐng)域的關(guān)鍵文獻(xiàn)、熱點(diǎn)研究與前沿方向,探究學(xué)科之間的交互關(guān)系,對研究領(lǐng)域的學(xué)者做出評價(jià)[7]。
苧麻集生態(tài)、經(jīng)濟(jì)和社會(huì)效益于一體,具有廣闊的應(yīng)用前景,當(dāng)前中國對苧麻相關(guān)文獻(xiàn)的計(jì)量學(xué)研究仍處于空白。本文擬以CNKI數(shù)據(jù)庫為數(shù)據(jù)來源,使用Citespace V(5.7.R2)知識(shí)圖譜工具,對國內(nèi)1992~2020年的苧麻研究文獻(xiàn)進(jìn)行可視化分析,統(tǒng)計(jì)發(fā)文數(shù)量、主要作者、主要研究機(jī)構(gòu),并繪制文章作者的合作網(wǎng)絡(luò)圖譜,統(tǒng)計(jì)機(jī)構(gòu)發(fā)文量,建立研究熱點(diǎn)的關(guān)鍵詞共現(xiàn)、關(guān)鍵詞時(shí)區(qū)分布和突現(xiàn)關(guān)系表,梳理苧麻研究的知識(shí)基礎(chǔ)及發(fā)展脈絡(luò),揭示其研究熱點(diǎn)并預(yù)測其未來發(fā)展方向,以期為該領(lǐng)域后續(xù)的研究提供科學(xué)的參考和幫助。
本文數(shù)據(jù)來源于CNKI數(shù)據(jù)庫。在該庫中,綜合考慮文獻(xiàn)的質(zhì)量、數(shù)量和覆蓋范圍,選擇“科學(xué)引文索引(Science Citation Index,SCI)來源期刊、工程索引(The Engineering Index,EI)來源期刊、北大核心、CSSCI來源期刊、CSCD來源期刊”作為文獻(xiàn)來源,檢索條件設(shè)置為“主題”,檢索詞設(shè)置為“苧麻”,時(shí)間段限制在1992~2020年,共檢索到1786條記錄?!吨袊闃I(yè)科學(xué)》作為苧麻領(lǐng)域的權(quán)威期刊,由于2000年后不屬于上述數(shù)據(jù)庫,所以單獨(dú)再將檢索條件設(shè)置為“主題”,檢索詞設(shè)置為“苧麻”,文獻(xiàn)來源設(shè)置為“中國麻業(yè)科學(xué)”,時(shí)間段限制在2000~2020年,檢索到676條記錄。通過人工剔除非相關(guān)文章及去重操作后,最終納入有效記錄文獻(xiàn)共計(jì)2089篇,將有效記錄以Refworks格式導(dǎo)出,并運(yùn)用Citespace V軟件完成數(shù)據(jù)格式的轉(zhuǎn)換。
基于java平臺(tái)運(yùn)行的CiteSpace V軟件可以顯示知識(shí)單元或知識(shí)群之間網(wǎng)絡(luò)、互動(dòng)、交叉、演化或衍生等諸多隱含的復(fù)雜關(guān)系,并生成一系列可視化圖譜,以對相關(guān)領(lǐng)域的研究演化和發(fā)展前沿進(jìn)行探測[8]。本研究在 Citespace V參數(shù)設(shè)置中,時(shí)間跨度(Time Slicing)設(shè)為“1992~2020”,時(shí)間切片(Years Per Slice)設(shè)為 1,節(jié)點(diǎn)類型(Node Type)包括作者(Author)、機(jī)構(gòu)(Institution)、關(guān)鍵詞(Keyword),閾值(Top N)設(shè)為50。根據(jù)各節(jié)點(diǎn)參數(shù)設(shè)置,分別導(dǎo)出年度發(fā)表文獻(xiàn)分布情況、研究人員合作情況、關(guān)鍵詞共現(xiàn)、關(guān)鍵詞時(shí)區(qū)圖和突現(xiàn)關(guān)鍵詞的知識(shí)圖譜。
年度發(fā)表文獻(xiàn)的數(shù)量及變化趨勢總體反映了該領(lǐng)域的重要性和受關(guān)注程度。圖1顯示了從1992~2020年苧麻研究的年度發(fā)文量情況。結(jié)果顯示,本領(lǐng)域研究大致可分為三個(gè)階段。第一階段為1992~2003年,11年間有關(guān)苧麻的相關(guān)文獻(xiàn)數(shù)量波動(dòng)減少,2003年僅發(fā)表文章47篇,為最小值;第二階段為2004~2010年,年度發(fā)文量呈快速增長趨勢,并于2010年達(dá)到峰值,發(fā)表文章為103篇;第三階段為2011~2020年,年度發(fā)文量呈遞減趨勢。
圖1 苧麻研究發(fā)表文獻(xiàn)年度分布Fig.1 Annual distribution of ramie research publications
以“Author”為網(wǎng)絡(luò)節(jié)點(diǎn),生成888個(gè)節(jié)點(diǎn)、1872條連線的苧麻研究人員合作知識(shí)圖譜(圖2)。圖中每個(gè)節(jié)點(diǎn)代表1位作者,納入圖譜的作者共計(jì)888人,節(jié)點(diǎn)字體越大表明該作者發(fā)文量越多,而作者之間的連線反映兩者之間的合作關(guān)系,連線距離越近表示合作關(guān)系越緊密。進(jìn)一步對發(fā)文量大于等于30篇的作者進(jìn)行了統(tǒng)計(jì)(表1),其中熊和平發(fā)表文章最多,達(dá)到66篇。
表1 苧麻研究發(fā)文量≥30篇的作者Table 1 Authors with more than 30 articles on ramie research
圖2 研究人員合作共現(xiàn)圖譜Fig.2 Corporation network of researchers
從圖中可以看出,當(dāng)前苧麻研究領(lǐng)域形成兩個(gè)比較大的合作團(tuán)隊(duì),分別是以崔國賢、熊和平為核心的研究團(tuán)隊(duì),團(tuán)隊(duì)內(nèi)部合作密切,團(tuán)隊(duì)之間的合作也比較緊密,這可能與這兩個(gè)團(tuán)隊(duì)所處同一市區(qū)有關(guān)。
對1992~2020年發(fā)文量靠前的機(jī)構(gòu)進(jìn)行統(tǒng)計(jì)和排名(表2),從表2中可知,中國農(nóng)業(yè)科學(xué)院麻類研究所發(fā)文量最多,達(dá)到360篇,其次為湖南農(nóng)業(yè)大學(xué),發(fā)文176篇,東華大學(xué)位列第三,發(fā)文92篇。呈現(xiàn)出以中國農(nóng)業(yè)科學(xué)院麻類研究所為核心機(jī)構(gòu)引領(lǐng)苧麻的研究與應(yīng)用。
表2 1992~2020年苧麻研究高產(chǎn)機(jī)構(gòu)排名Table 2 Ranking of ramie research institutions from 1992-2020
2.3.1 共現(xiàn)分析
關(guān)鍵詞能代表文章的主題,而一個(gè)學(xué)科領(lǐng)域中,出現(xiàn)頻率高的關(guān)鍵詞就能代表該領(lǐng)域的研究熱點(diǎn),共詞分析法利用文獻(xiàn)集中詞匯對或名詞短語共同出現(xiàn)的情況,來確定該文獻(xiàn)集所代表學(xué)科中各主題之間的關(guān)系[9]。
以“Keyword”為網(wǎng)絡(luò)節(jié)點(diǎn),得到關(guān)鍵詞共現(xiàn)圖譜(圖3)。圖譜中共現(xiàn)關(guān)鍵詞有820個(gè),按頻次降序排序,統(tǒng)計(jì)頻次≥10的關(guān)鍵詞,共有28個(gè)(表3),除去檢索詞苧麻外,頻次前五的關(guān)鍵詞依次是苧麻纖維、苧麻織物、復(fù)合材料、麻纖維、力學(xué)性能。一般認(rèn)為,中心性>0.1的節(jié)點(diǎn)在網(wǎng)絡(luò)結(jié)構(gòu)中有重要的位置,在知識(shí)結(jié)構(gòu)的演變中扮演重要的角色。在表3中,中心性>0.1的關(guān)鍵詞有麻纖維(0.17)、苧麻纖維(0.14)、復(fù)合材料(0.11)。
表3 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)主信息表Table 3 The main information table of keywords co-occurrence network
圖3 苧麻研究關(guān)鍵詞共現(xiàn)圖譜Fig.3 Ramie research keywords co-occurrence graph
以關(guān)鍵詞為節(jié)點(diǎn)進(jìn)行的圖譜分析可以直接反映當(dāng)前苧麻研究的熱點(diǎn)。通過對關(guān)鍵詞共現(xiàn)圖譜進(jìn)行分析發(fā)現(xiàn),研究主要集中在苧麻作為紡織原料方面,苧麻纖維、苧麻織物是出現(xiàn)頻次最高的關(guān)鍵詞,其次是苧麻在復(fù)合材料領(lǐng)域的應(yīng)用、力學(xué)性能之類的研究。
2.3.2 分布時(shí)區(qū)分析
本文在關(guān)鍵詞圖譜的基礎(chǔ)上繪制時(shí)區(qū)分布圖(圖4),該圖將頻次較高的關(guān)鍵詞首次出現(xiàn)的年份進(jìn)行排列,反映了苧麻研究領(lǐng)域的發(fā)展態(tài)勢。從圖中可以看出,1992~2000年期間,對苧麻的服用特性的研究較多,苧麻纖維、苧麻織物等關(guān)鍵詞頻次較高,2000年以后,苧麻的研究熱點(diǎn)為生物工程和飼用研究,其中復(fù)合材料、力學(xué)性能、飼用苧麻等關(guān)鍵詞頻次較高。
圖4 苧麻研究時(shí)區(qū)分布Fig.4 Research on time zone distribution of ramie
2.3.3 關(guān)鍵詞突現(xiàn)分析
突現(xiàn)詞是指在短時(shí)間內(nèi)出現(xiàn)頻率驟增的關(guān)鍵詞,突發(fā)強(qiáng)度則是指在短時(shí)間內(nèi)出現(xiàn)頻率驟增的強(qiáng)度,對突現(xiàn)詞和突發(fā)強(qiáng)度分析可以體現(xiàn)研究前沿演進(jìn)路徑和交互關(guān)系[10]。在苧麻領(lǐng)域的關(guān)鍵詞突現(xiàn)中共出現(xiàn)25個(gè)突現(xiàn)詞(表4),其中,突發(fā)強(qiáng)度前5的關(guān)鍵詞為麻纖維、飼用苧麻、纖維支數(shù)、苧麻疫霉和產(chǎn)業(yè)化。
表4 關(guān)鍵詞突現(xiàn)Table 4 Keywords with citation bursts
從表中可以看出,21世紀(jì)之前,苧麻領(lǐng)域的研究主要集中在苧麻的服用特性,對苧麻織物、纖維品質(zhì)、纖維支數(shù)研究較多,而在進(jìn)入21世紀(jì)之后,對苧麻纖維的物理特性,以及生物工程方面的研究日益增多,苧麻在復(fù)合材料的應(yīng)用以及植物修復(fù)等方向的研究成為熱點(diǎn)。從2017年開始,飼用苧麻成為研究熱點(diǎn),苧麻在飼料方面的用途開始被推廣。
本研究主要考察苧麻在國內(nèi)的研究現(xiàn)狀,從1992~2003年,苧麻領(lǐng)域發(fā)文量波動(dòng)減少,在90年代初期、中期和末期,先后刮過三次“麻風(fēng)病”,中國的苧麻種植業(yè)和苧麻紡織業(yè)都付出了沉重的代價(jià)[11-12],苧麻領(lǐng)域的研究也處于低迷狀態(tài);從2004~2010年,苧麻發(fā)文量快速增長,結(jié)合苧麻研究時(shí)區(qū)分布圖來看,這一階段隨著對苧麻的物理生物特性等方向研究興起,以及2008年國家麻類產(chǎn)業(yè)技術(shù)體系的建設(shè),苧麻領(lǐng)域研究取得了快速的進(jìn)展;但2010~2020年這一階段,雖然發(fā)文量仍處于較高水平,但整體呈下降趨勢,這可能與近年來耕地面積的減少以及化纖、棉花等纖維材料的擠壓、苧麻種植規(guī)模顯著減小有關(guān)。苧麻化學(xué)脫膠污染環(huán)境,苧麻脫膠廠消失或整頓,也是苧麻發(fā)展下行的原因之一。
近年來隨著人工智能等新興技術(shù)的發(fā)展,利用無人機(jī)以及機(jī)器學(xué)習(xí)算法對苧麻進(jìn)行圖像識(shí)別,基于深度學(xué)習(xí)建立苧麻的數(shù)字模型、基于自然語言處理建立農(nóng)業(yè)知識(shí)問答系統(tǒng)等方向是值得我們?nèi)ヌ剿鞯?,結(jié)合各種新興技術(shù)是苧麻等作物未來重要的研究方向。
本文采用CiteSpace軟件主要對CNKI中文數(shù)據(jù)庫進(jìn)行分析,對國內(nèi)苧麻相關(guān)研究進(jìn)行關(guān)注,由于納入文獻(xiàn)樣本數(shù)量有限,并且經(jīng)過人為篩選出與主題不相關(guān)的文獻(xiàn),統(tǒng)計(jì)結(jié)果可能會(huì)存在主觀性。
本文在CNKI數(shù)據(jù)庫中選取1992~2020年以“苧麻”為主題的國內(nèi)研究期刊文獻(xiàn),利用知識(shí)圖譜可視化分析對苧麻研究的發(fā)文量、主要作者、熱點(diǎn)前沿等進(jìn)行數(shù)據(jù)挖掘和統(tǒng)計(jì)分析,提出苧麻發(fā)展需依托新興技術(shù),與智能農(nóng)業(yè)相結(jié)合這一方面可作為研究重點(diǎn),對麻產(chǎn)業(yè)發(fā)展有著重要的意義。