溫學(xué)兵, 姚佳宜, 王秋萍
(1. 沈陽師范大學(xué) 學(xué)報(bào)編輯部, 沈陽 110034;2. 沈陽師范大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院, 沈陽 110034;3. 沈陽師范大學(xué) 國際教育學(xué)院, 沈陽 110034)
科學(xué)知識(shí)圖譜((mapping knowledge domain)是通過將應(yīng)用數(shù)學(xué)、圖形學(xué)、信息可視化技術(shù)、信息科學(xué)等學(xué)科的理論與方法與計(jì)量學(xué)引文分析、共現(xiàn)分析等方法結(jié)合,并利用可視化的圖譜形象地展示學(xué)科的核心結(jié)構(gòu)、發(fā)展歷史、前沿領(lǐng)域以及整體知識(shí)架構(gòu)達(dá)到多學(xué)科融合目的的現(xiàn)代理論[1-3]。計(jì)算語言學(xué)通過建立形式化的數(shù)學(xué)模型,分析、處理自然語言,并在計(jì)算機(jī)上用程序來實(shí)現(xiàn)分析和處理的過程,從而達(dá)到以機(jī)器來模擬人的部分乃至全部語言能力的目的[4-6]。字母詞研究是計(jì)算語言學(xué)的一個(gè)重要研究領(lǐng)域,從1982年第一篇中文研究文獻(xiàn)發(fā)表開始,眾多學(xué)者進(jìn)行了深入研究,產(chǎn)生了大量的研究文獻(xiàn)[7-10]。CiteSpace是陳超美博士研發(fā)的一款功能強(qiáng)大的科學(xué)知識(shí)圖譜工具,它的問世大大推動(dòng)了科學(xué)知識(shí)圖譜方法在文獻(xiàn)計(jì)量中的應(yīng)用[11-15]。本文對(duì)計(jì)算語言學(xué)中的字母詞文獻(xiàn)進(jìn)行了梳理統(tǒng)計(jì),給出了圖文并茂的可視化分析。
本文研究對(duì)象為計(jì)算語言學(xué)中關(guān)于字母詞研究的文獻(xiàn),量化數(shù)據(jù)來自中國知網(wǎng)(CNKI)數(shù)據(jù)庫。本文檢索方式設(shè)定為“高級(jí)”,主題設(shè)定為“字母詞”,時(shí)間段設(shè)定為1982—2020年,選擇文獻(xiàn)語種為中文,剔除新聞報(bào)道、消息等無效文獻(xiàn),最終得到有效文獻(xiàn)1 197篇。其中,期刊文獻(xiàn)802篇,博、碩論文258篇,報(bào)紙文獻(xiàn)49篇,學(xué)術(shù)輯刊35篇,國內(nèi)會(huì)議文獻(xiàn)51篇,國際會(huì)議文獻(xiàn)2篇。
本文將運(yùn)用可視化軟件CiteSpace對(duì)字母詞研究文獻(xiàn)進(jìn)行計(jì)量學(xué)分析。CiteSpace軟件是陳超美教授開發(fā)的基于JAVA平臺(tái)的可視化應(yīng)用軟件,采用的是一種適于多元、分時(shí)、動(dòng)態(tài)的復(fù)雜網(wǎng)絡(luò)分析的新一代信息可視化技術(shù),在文獻(xiàn)統(tǒng)計(jì)上得到了越來越廣泛的應(yīng)用。
各個(gè)時(shí)間段的發(fā)文量能夠即時(shí)反映出該時(shí)間段內(nèi)某些科研名詞、工具、軟件等的使用程度,折射出某一科研領(lǐng)域的研究熱度,有時(shí)某些相關(guān)的社會(huì)事件也會(huì)在發(fā)文量上顯著地體現(xiàn)出來。圖1是字母詞研究的發(fā)文量統(tǒng)計(jì)表。
圖1 字母詞發(fā)文量統(tǒng)計(jì)Fig.1 Statistics of the number of letter words published
由圖1可以看出,從關(guān)于字母詞研究的第一篇研究論文發(fā)表的1982—2000年,國家的改革開放還不夠深入,主要由外來詞影響產(chǎn)生的字母詞的使用還不太廣泛,這一段時(shí)間段發(fā)表相關(guān)研究文獻(xiàn)不多,屬于字母詞研究起步階段。從2001—2011年,字母詞進(jìn)入了人們生活的方方面面,字母詞的研究討論也逐漸增多,發(fā)文量整體呈上升趨勢,屬于研究的探索階段,且文章較多關(guān)注基礎(chǔ)理論層面。2012年,“央視字母詞屏蔽門”事件引發(fā)了關(guān)于字母詞是否應(yīng)該使用和如何使用的大討論。2012年和2013年,屬于字母詞研究的井噴階段,大量的研究和討論文獻(xiàn)紛紛涌現(xiàn)。從2013年以后,隨著字母詞大討論的塵埃落定,字母詞研究開始呈下降趨勢。
被引頻次是指文獻(xiàn)發(fā)表后被其他文獻(xiàn)作為參考文獻(xiàn)引證過的數(shù)量,該數(shù)值的多少能夠反映出某一篇文獻(xiàn)學(xué)術(shù)質(zhì)量和社會(huì)影響力水平的高低。被引用頻次排名前10位的文獻(xiàn)如表1所示。
表1 被引用頻次排名前10位的文獻(xiàn)統(tǒng)計(jì)Table 1 Top 10 cited literatures
從文獻(xiàn)的被引頻次來看,劉涌泉的《關(guān)于漢語字母詞的問題》和《談?wù)勛帜冈~》分別被引334和246次;胡明揚(yáng)的《關(guān)于外文字母詞和原裝外文縮略語問題》被引218次。一般來說,被引頻次越高,文章的學(xué)術(shù)影響力和社會(huì)影響力越大,二者成正比例關(guān)系。
從發(fā)表刊物來看,被引頻次排名前10位的文獻(xiàn)中,有6篇刊登在《語言文字應(yīng)用》上,說明該刊是字母詞研究的主要陣地,在這一領(lǐng)域的研究中具有最高的影響力,學(xué)者以能把字母詞研究的成果發(fā)表在該刊為榮。
從文章內(nèi)容來看,對(duì)字母詞研究最具影響力的10篇文獻(xiàn)主要關(guān)注字母詞的使用和存在的問題,排名前10位的文獻(xiàn)中有5篇為對(duì)字母詞不同問題的探究。這些文獻(xiàn)都聚焦字母詞研究領(lǐng)域的熱點(diǎn)問題,對(duì)字母詞研究今后的研究方向具有引領(lǐng)作用。
本文運(yùn)用可視化軟件CiteSpace的關(guān)鍵詞共現(xiàn)技術(shù),將檢索到的文獻(xiàn)導(dǎo)入CiteSpaceV,設(shè)置時(shí)間跨度為1982—2020年,間隔分區(qū)時(shí)間設(shè)定為1年,節(jié)點(diǎn)類型設(shè)定為Key word,把閾值選為默認(rèn)值,得到了關(guān)于字母詞研究關(guān)鍵詞的詞頻統(tǒng)計(jì)、中心性列表和關(guān)鍵詞共現(xiàn)圖譜(表2和圖2)。
表2 字母詞前30個(gè)高頻關(guān)鍵詞Table 2 Top 30 high frequency keywords of letter words
表2為研究文獻(xiàn)中排名前30位的字母詞高頻關(guān)鍵詞,排名最高的為字母詞,頻次為379,且起始于1982年,其次為外來詞和規(guī)范,頻次分別為119和100。這說明字母詞的概念含義是學(xué)者著力最多的地方。
圖2是字母詞的關(guān)鍵詞共現(xiàn)圖譜,共有節(jié)點(diǎn)620個(gè),連接線1 257條。關(guān)鍵詞之間有連線代表2個(gè)關(guān)鍵詞之間是相互關(guān)聯(lián)的,且連線越粗說明2個(gè)關(guān)鍵詞的關(guān)聯(lián)程度越高;連線越細(xì),說明關(guān)聯(lián)程度越低;無連線,說明不相關(guān)。關(guān)鍵詞之間的節(jié)點(diǎn)越大,說明這個(gè)關(guān)鍵詞出現(xiàn)的頻次越高。很明顯,字母詞的節(jié)點(diǎn)最大,即它的頻次最高,其次為外來詞和規(guī)范。展示出來的關(guān)鍵詞字體的大小代表著中心性,字體越大的節(jié)點(diǎn)代表其和研究主題的相關(guān)性越強(qiáng)。圖2顯示,字母詞、外來詞、新詞語網(wǎng)絡(luò)語言等幾個(gè)詞的字體最大,說明這些詞語與字母詞研究的相關(guān)性最強(qiáng)。
圖2 字母詞關(guān)鍵詞共現(xiàn)圖譜Fig.2 Key words co-occurrence map of letter words
表3 作者發(fā)文量排名前10位統(tǒng)計(jì)情況
表3給出了從事字母詞研究的學(xué)者中發(fā)文量位居前10位的統(tǒng)計(jì)數(shù)據(jù)。從表3可以看出, 中國傳媒大學(xué)博士研究生導(dǎo)師、國家語言資源監(jiān)測研究中心有聲媒體語言分中心主任侯敏教授發(fā)表文章位居第1位, 其博士研究生王秋萍發(fā)表文章位居第2位, 二人合計(jì)發(fā)表文章15篇, 而發(fā)文量位居前10位的作者的總發(fā)文量為56篇, 2人發(fā)文量占到26.79%。 教育部陸續(xù)設(shè)立國家語言資源監(jiān)測與研究平面媒體、網(wǎng)絡(luò)媒體、有聲媒體、教育教材、少數(shù)民族語言等中心, 每年采集逾10億字?jǐn)?shù)據(jù), 為社會(huì)語言生活監(jiān)測與研究提供基礎(chǔ)資料。 侯敏教授研究團(tuán)隊(duì)多年利用語言信息處理技術(shù), 加上后期篩選, 從國家語言監(jiān)測語料庫中獲得年度新詞語, 并參與《中國語言生活狀況報(bào)告》編寫。 字母詞研究是其中一個(gè)研究內(nèi)容, 獲得了國家社會(huì)科學(xué)基金、教育部一般科研項(xiàng)目等多項(xiàng)國家級(jí)項(xiàng)目的支持, 所以產(chǎn)出了多篇研究文獻(xiàn)。
圖3是利用CiteSpaceV軟件給出的字母詞研究合作關(guān)系圖譜。
圖3 作者合作關(guān)系圖譜Fig.3 Network Atlas of author cooperation
從圖3可以看出,字母詞研究者之間的合作關(guān)系比較弱,也就是說,字母詞研究人員之間的合作研究行為較少,即使是師承關(guān)系的侯敏和王秋萍之間也很少。字母詞研究很多時(shí)候要利用計(jì)算機(jī)甚至是工作站進(jìn)行計(jì)算,要用到統(tǒng)計(jì)學(xué)和計(jì)算數(shù)學(xué)工具,建議研究者們加強(qiáng)合作,也許能產(chǎn)出更好的研究成果。
本文利用文獻(xiàn)計(jì)量學(xué)工具CiteSpace,基于中國知網(wǎng)數(shù)據(jù)庫,對(duì)近29年的計(jì)算語言學(xué)中的字母詞研究文獻(xiàn)進(jìn)行了梳理和統(tǒng)計(jì),獲得了關(guān)于各階段發(fā)表文獻(xiàn)數(shù)量趨勢、被引頻次、熱點(diǎn)主題、關(guān)鍵詞共被引、合作關(guān)系網(wǎng)絡(luò)等可視化的研究狀況,對(duì)于即將從事和正在從事字母詞研究的學(xué)者有一定的參考意義。