李 敏,劉 飛
(1.海南師范大學 圖書館,海南 ???571158;2.新疆醫(yī)科大學 圖書館,新疆 烏魯木齊 830017)
隨著中國城鎮(zhèn)化進程的不斷推進,普通話的普及對漢語方言文化的生存環(huán)境提出了嚴峻挑戰(zhàn)。如何理解和表征方言特征,傳承和發(fā)揚方言所承載的民族文化,成為語言學界迫在眉睫的重要任務。
語料庫是指經(jīng)過科學取樣和加工的大規(guī)模電子語言材料庫,漢語方言語料庫是指以漢語方言為語料基礎進行研究的大型語料數(shù)據(jù)庫。近四十年來,中國漢語方言語料庫取得了長足進展。漢語方言語料庫的研究在傳承中國各個民族語言,傳播漢語方言文化、增強民族自信中發(fā)揮巨大的作用。20世紀80年代,對方言語料庫的建設和應用開始起步[1];20世紀90年代末至二十一世紀初為漢語方言語料庫相關研究的初始階段,北京語言大學等機構建設了我國較早的方言語料庫,如“北京口語語料庫”等語料庫的產生[2],代表著漢語方言語料庫建設及應用研究步入正軌;2008年國家語委啟動了“中國語言資源有聲數(shù)據(jù)庫建設”項目后[3],把漢語方言語料庫相關研究推向了新的高度?,F(xiàn)在,漢語方言語料庫建設及應用研究已經(jīng)成為國內語言學及相關學科領域研究的前沿和熱點領域,其文獻數(shù)量不斷增加[4]。
文獻計量法是一種通過借助文獻的各種特征數(shù)量,采用相關數(shù)學和統(tǒng)計學的方法,定量地描述、評價和預測科學技術的發(fā)展動態(tài),凸顯出重要的方法論價值[5]。本文以漢語方言語料庫建設及應用為研究主題,基于文獻計量研究方法,分析漢語方言語料庫相關研究領域的發(fā)展現(xiàn)狀,分別從研究數(shù)量、研究機構、研究熱點等層面介紹了主要研究力量的研究信息,從而掌握漢語方言語料庫建設及應用的最新研究趨向,為后續(xù)研究提供文獻參考。
本文以中國知網(wǎng)數(shù)據(jù)庫CNKI為數(shù)據(jù)源分析漢語方言語料庫建設及應用研究態(tài)勢,時間段截取區(qū)間為1995年至2021年(完整的會計年度,即1995-01-01至2021-12-31)。在CNKI數(shù)據(jù)庫中以“語料庫”和“漢語方言語料庫”為主題詞進行檢索,為了數(shù)據(jù)的科學性和可靠性,均選擇核心論文期刊為數(shù)據(jù)來源,在CNKI數(shù)據(jù)庫中運用高級篩選機制“期刊來源”勾選為“SCI來源期刊”,“EI來源期刊”“北大核心”“CSSCI”和“CSDN”,并選擇研究時間段1995-01-01至2021-12-31。本研究按照不同年份對機構、期刊、作者等統(tǒng)計分類信息進行篩選,在Excel中進行數(shù)據(jù)整理和歸納計算。研究指標包括:研究主題、論文數(shù)、被引頻次等。
本文基于文獻計量學理論,運用中國知網(wǎng)可視化分析軟件進行文獻信息的挖掘和分析,進行文獻的關鍵詞共被引分析、高產作者分析和主要研究機構分析,形成可視化網(wǎng)絡圖譜,并進一步針對主要信息整理成表格,進而能夠從海量文獻中找到關鍵的信息。通過圖譜和表格信息可以觀察到某一學科領域的發(fā)展歷程和當前研究熱點,從而了解該領域最新研究動態(tài)[6]。
各個學科領域在一定時間內的論文產出數(shù)量是反映該學科知識積累程度和研究活躍程度的重要指標,代表了該學科研究領域最新的發(fā)展動態(tài)和走向。統(tǒng)計表明:當一門學科處于萌芽和快速發(fā)展階段時,其研究相應的文獻數(shù)量呈指數(shù)增長[12]。
語料庫,通俗含義下指的是語言材料庫,系統(tǒng)而全面的語言學是語料庫的建設的理論指導,對真實語言材料的搜集和整理是語言學得以發(fā)展的不竭動力,而方言語料又是幾千年來中國廣大地域上最原始、豐富的語料。根據(jù)2012年《中國語言地圖集》[7]的最新統(tǒng)計,我國共有10種漢語方言大區(qū)、17種方言區(qū)、98種方言片、168種方言小片。對漢語方言語料庫建設和應用的研究是語料庫研究最核心的部分,能夠最大程度的保護漢語方言話語語料的原生態(tài)屬性[8][13]。
本文選擇檢索條件為:(主題%=‘漢語語料庫’or題名%=‘漢語語料庫’)AND(發(fā)表時間Between(‘1995-01-01’,‘2021-12-31’))。結果表明:漢語方言語料庫建設及應用領域發(fā)文量呈逐年增加趨勢。1995—2006年為我國漢語語料庫建設和應用的探索期。在這一時期,隨著語料庫建設在中國的發(fā)展,漢語方言語料庫的建設和應用也與之同步發(fā)展,但是發(fā)文數(shù)量較少。這是因為隨著1955年“全國文字改革會議”和“現(xiàn)代漢語規(guī)范問題學術會議”的召開,全國實行推行普通話政策,在一定程度上對漢語方言的生存空間造成擠壓。1956年開始全國開展了各個方言片區(qū)的漢語方言普查工作,此次普查工作積累了豐富的方言材料和方言調查經(jīng)驗,為后期漢語方言建設和應用的研究奠定了基礎。2006—2015年為我國漢語方言建設和應用領域研究的成長期,對漢語方言語料庫的探索的文獻數(shù)量大幅度增加。進入21世紀以后,隨著城市化進程的加快,普通話的普及,漢語方言文化開始出現(xiàn)代際傳承的斷裂,方言文化瀕危,瀕危方言、弱小方言萎縮甚至消亡,我國各地方言的傳承和發(fā)展面臨前所未有的挑戰(zhàn),漢語方言語料庫的建設和應用成為學術界日益關注的重點[9]。2015—2021年間漢語方言語料庫建設和應用研究步入穩(wěn)定的發(fā)展期,但是數(shù)量上逐年下行,漢語方言語料庫的研究熱度有所下降[10-11]。
檢索發(fā)現(xiàn)共有40個機構參與了漢語方言語料庫的建設。主要的研究機構如表1所示。首先,對漢語方言語料庫建設和應用研究的機構大多是科研機構,如高校、社科院,尤其是處在少數(shù)民族區(qū)域。中國各大方言片區(qū)的大學承擔了漢語方言語料庫建設和應用的重任,對傳承中國漢語文化、保存漢語方言資源起到了重要的作用。其次,暨南大學和中國社會科學院語言文字應用研究所在論文數(shù)量及篇均被引頻次方面顯著超越其他研究機構,顯示了這兩個機構在中國漢語方言語料庫建設和應用領域強大的科技實力和學術影響力。再次,各個研究機構關注的研究主題側重點不同。概括來說,盡管不同的研究機構在不同的方言之間進行語料庫的探索和研究,但是重點研究主題的重心在不同的漢語方言語料庫、語音語料以及語法研究、方言語料庫的用途等層面。
表1 漢語方言語料庫建設和研究領域前5個機構的研究主題Table 1 Research topics of the top five institutions in the field of Chinese dialect corpus construction and research
關鍵詞是對文章內容的高度凝練和概括,可以說出現(xiàn)頻次較高的關鍵詞代表著學科的研究熱點和最新的研究趨勢。本文通過對高頻關鍵詞的挖掘和提取,運用中國知網(wǎng)CNKI計量可視化分析,創(chuàng)建了關鍵詞共建網(wǎng)絡,如圖2所示。
Figure 1 Annual distribution of research on the construction and application of Chinese dialect Corpus (1995—2021)圖1 漢語方言語料庫建設及應用相關研究發(fā)文量年度分布(1995—2021)
Figure 2 Hotspot distribution of Chinese literature research related to the construction and application of Chinese dialect corpus圖2 漢語方言語料庫建設及應用相關中文文獻研究熱點分布
不同的顏色代表不同的詞組,圓圈的大小代表出現(xiàn)的次數(shù),將出現(xiàn)頻次較高的關鍵詞根據(jù)不同的主題分類,匯總如表2。
表2 漢語方言語料庫建設及應用領域熱點關鍵詞Table 2 Hot keywords in the construction and application of Chinese dialect corpus
漢語方言語料庫建設和應用領域文獻的高頻關鍵詞主要圍繞四大主題進行,分別是現(xiàn)代漢語方言、方言語料庫、語料庫的建設、語料庫的應用。
在漢語方言語料庫的研究領域,主要研究來源是中國各個方言片區(qū)代表區(qū)域文化的地域方言,如中國的七大方言[14](官話方言、客家方言、閩方言、粵方言、贛方言、吳方言、湘方言),還有七大方言的次方言,次方言之下又產生的若干小片和方言點。這些方言體系是中國漢語方言語料庫的語料來源,通過建設語料庫的方式,促使方言文化傳承在城鎮(zhèn)化的快速進程中,尋找新的生存空間和傳承方式,中國漢語方言文化得以源遠流長[15-16]。
方言語料庫的研究內容是不同方言的語料,涵蓋了文學、戲劇、歷史傳說、祭祀禮儀、相聲小品、口語、讀物、地方傳統(tǒng)等各個領域,對語料研究的表現(xiàn)特征是研究句法、語法、詞匯、詞性、詞綴、不同音系、口語特征,最真實、全面地反映了各種方言特色[17]。
通過分析文獻發(fā)現(xiàn),語料庫的建設需要強大的技術支撐,因而和計算機發(fā)展的水平有很大關聯(lián)?,F(xiàn)有的漢語方言語料庫通過不斷更進的系統(tǒng)設計,已經(jīng)完善了語料庫的個性化功能開發(fā)、檢索平臺、數(shù)據(jù)加工、發(fā)布和安全設置、用戶體驗等多項實踐[18-19]。
漢語方言語料庫的應用主要是三大領域:一是語料庫語言學研究,主要內容有社會語言學、語言變遷、自然語言文本和處理、詞典編纂等;二是方言翻譯,主要有在線檢索、機器翻譯、語言教學和高校翻譯等;三是方言信息儲存,不斷更新和增加語料資源,保護漢語方言文化多樣性。
從學科角度來看,檢索到的漢語方言語料庫建設及應用研究文獻主要分布在兩大學科,分別是哲學與人文科學、社會科學:哲學與人文學科占比較大,文獻數(shù)量占比達到97.5%;而社會科學類比較匱乏,僅僅占比2.5%。主要涉及的類別有語言科學、語言研究、語言生態(tài)學、語言可持續(xù)發(fā)展等。
漢語方言語料庫建設及應用研究文獻的主要期刊見圖3。這些國內期刊主辦機構種類較多、分布較廣,居于前三位的有《世界漢語教學》《外語教學與研究》和《中國翻譯》:《世界漢語教學》收錄文獻最多,文獻數(shù)量占比達到26.19%;其次是《外語教學與研究》,文獻數(shù)量占比達到15.48%;第三位是《中國翻譯》,文獻數(shù)量占比達到7.14%。
Figure 3 Distribution and proportion of major journals in the construction of Chinese dialect corpus and applied research literature圖3 漢語方言語料庫建設及應用研究文獻的主要期刊分布及占比
對高產作者進行分析得到作者網(wǎng)絡圖譜,如圖4所示。可以看到,漢語方言語料庫建設及應用研究領域的高產作者數(shù)量相較而言偏少,大多集中在各個高校和中國社會科學院語言文字應用研究所,且分布并不均勻。
Figure 4 Network atlas of high-yielding authors in Chinese dialect corpus construction and application field圖4 漢語方言語料庫建設及應用領域高產作者網(wǎng)絡圖譜
進一步對高產作者網(wǎng)絡圖譜中文獻發(fā)文量較高的作者進行分析和歸納,在CNKI數(shù)據(jù)庫中以(主題%=‘漢語方言語料庫’or題名%=‘漢語方言語料庫’)AND(發(fā)表時間Between(‘1995-01-01’,‘2021-12-31’))為檢索條件,文獻數(shù)量居于前十位的關鍵作者檢索的結果如表3所示。
從表3中可以看出:居于首位的是彭澤潤教授,研究內容有漢語語言規(guī)劃、語言應用、研究方言事實描寫等,尤其是對交界區(qū)域的混合方言、三峽區(qū)域移民的方言接觸等問題,彭潤澤教授作出了卓越貢獻;居于第二位是詹伯慧教授,總被引和總下載次數(shù)均在較高水平,在漢語方言語料庫建設和應用領域具有較高的影響力,其的研究內容涉及語言學理論、漢語方言、方言辭書編纂、方言文字改革等多項內容,研究語言類別有閩、粵、客家等不同類型的方言;居于第三位的是吳福祥教授,其研究內容主要涉及漢語歷史語法和中國南方民族語言的語法演變等;居于第四位的是羅昕如教授,主要研究內容涉及漢語方言學、語法學、修辭學、應用語言學等,其為湖南漢語方言的發(fā)展和傳承做出了卓越的貢獻;居于第五位的是張金橋教授,主要從事傳承漢語方言的華語習得與認同研究,從漢語方言、古漢語等多個視角解釋海外不同區(qū)域的華語特征及形成原因。通過對關鍵作者的梳理,發(fā)現(xiàn)這些高產作者涉及的主題均在漢語方言語言學、漢語方言多樣性和可持續(xù)發(fā)展等領域。
隨著經(jīng)濟一體化、城鎮(zhèn)化的快速發(fā)展,中國漢語方言多樣性和持續(xù)性發(fā)展正面臨前所未有的沖擊,漢語方言語料庫建設及應用的研究逐漸成為各大高校和社會關注的熱點。本文運用文獻計量的方法,以中國知網(wǎng)CNKI檢索獲得的數(shù)據(jù)為數(shù)據(jù)來源,結合中國知網(wǎng)可視化分析軟件,通過檢索年限和主題詞的設置,從漢語方言語料庫建設和應用文獻數(shù)量和總體分析、主要研究機構、研究熱點以及文獻學科、來源期刊和高產作者分析等多視角的探究,系統(tǒng)全面地梳理了漢語方言語料庫建設及應用領域的最新研究動態(tài)。
通過分析發(fā)現(xiàn),漢語方言語料庫建設及應用研究領域的文獻數(shù)量近幾年取得了大幅度的增長,表明了漢語方言的研究正處在快速發(fā)展時期,但是文獻數(shù)量依然不足,研究成果的應用不夠深化,學術界對于漢語方言文化持續(xù)性和多樣性發(fā)展的重視程度依然需要提高[20]。
主要研究力量分析說明漢語方言語料庫建設及應用的研究參與者范圍狹窄,漢語方言文化的傳承和發(fā)展有賴于社會大眾共同參與和努力,決不能僅限于高校和其他科研機構的學術研究,且各個研究機構由于大多數(shù)的研究內容聚焦在自己區(qū)域所在的地域方言文化,研究范圍較窄,研究領域內各個機構之間合作少。各個研究機構和企業(yè)應該強化學術研究合作合力效應,深化該領域產學研一體化合作關系,為漢語方言語料庫建設及應用領域的快速發(fā)展培養(yǎng)提供助力。
研究熱點的角度分析結果表明,學者們對中國各個方言片區(qū)的派系方言研究和語料庫建設熱情較高,但是方言應用范圍面較窄,且對小片區(qū)方言及分支方言研究較少,且大部分僅僅用來語言學研究和在線翻譯、教學等用途。漢語方言語料庫的建設及應用研究范圍應該拓展,加強促進多種研究成果的產生。
在對文獻涉及的學科、來源期刊和高產作者分析中,發(fā)現(xiàn)漢語方言的分布只涉及兩個學科,主要載文期刊分類多,高產作者數(shù)量不足,且多為權威專家,學者分布有年齡斷層現(xiàn)象。高校應該提升漢語方言語料庫建設及應用的研究成果轉化率,進行更深入的漢語方言語言研究和語言應用研究。