孫光旭,張 義
(1.淮北師范大學 外國語學院;2.淮北師范大學 文學院,安徽 淮北 235000)
漢語方言是一道獨特且復雜的文化景觀。從歷史方言的地理發(fā)展情況看,不同方言在語音、詞匯和語法結(jié)構(gòu)上的異同以及其在地理上的不同分布,不僅對語言研究具有重要作用,更能反映歷史文化的歷史變遷。漢語方言是漢語發(fā)展不同階段的活化石,折射出了漢語史的局部面貌,前人在研究漢語史時,已注意到了方言材料的獨特價值,關(guān)注語言空間分布的差異,并開展方言的調(diào)查與記錄工作。在地理信息技術(shù)迅速發(fā)展、時空GIS技術(shù)不斷成熟的當下,將海量歷史方言材料與地理信息技術(shù)充分結(jié)合利用,直觀地展示漢語方言時空的變遷,將為漢語方言的進一步研究提供有益的幫助。
本文通過整合漢語歷史方言資料,采用時空GIS技術(shù),建立中國歷史方言地理信息系統(tǒng),以直觀的方式展示方言在地理空間上的變化,以期補證或驗證前人的研究,為進一步促進對漢語方言、漢語史的研究提供一些參考和新的視角。
方言數(shù)據(jù)是建成中國歷史方言地理信息系統(tǒng)的基礎(chǔ)。方言研究在我國有悠久的歷史、優(yōu)良的傳統(tǒng)。漢語方言文獻記錄歷經(jīng)幾千年不間斷地累積,可研究的漢語方言文獻數(shù)據(jù)材料已經(jīng)相當可觀。這些材料大致可以分為如下幾類:其一,歷史方言調(diào)查材料。包括自西漢揚雄以來歷代學者有意識進行的方言記錄。其二,方言性質(zhì)的歷史文獻。相比有意識的方言調(diào)查而言,歷代文獻中方言性質(zhì)的材料則更加豐富。歷代的經(jīng)書注疏、字書、韻書以及詩文、詞典、戲文、筆記、小說、野史、地方戲等各類文獻中包含著豐富的方言資料。其三,方音韻書或同音字表。經(jīng)典韻書或多或少也存在一些方音色彩,而明確標明實際方音的近代韻書數(shù)量更多。其四,地方志之方言章。
上述材料從地域、時間及內(nèi)容分布上來看,都比較零散,給研究者的利用帶來了很大的不便。其一,材料數(shù)據(jù)量龐大,沒有任何一個課題能夠占有或者利用全部的材料。這使得學者的所據(jù)材料在很大程度上是局部的、片面的,于是在進行漢語方言、漢語史的相關(guān)研究時,難免出現(xiàn)“摸象之惑”。其二,在現(xiàn)實的研究中,時空觀念的缺失,導致不能深入、全面、系統(tǒng)地考察語言歷時共時的演進過程,而忽視了漢語方言的時間或者空間屬性特征所致的錯誤比比皆是,如“葉韻說”以及切韻音系基礎(chǔ)方言的爭論等。其三,不同類型或者不同時間區(qū)域方言材料之間的內(nèi)在關(guān)系不能得到有效的關(guān)聯(lián),沒有一定的關(guān)系圖譜,則難以多類材料互證,在研究時就難以形成有效證據(jù)鏈。
直到19世紀末,在青年語法學派的倡導下,德國學者吉耶龍等人開始使用地圖的形式描述語言特征的空間分布。這一研究范式極具解釋力,為研究印歐語系的譜系分類提供了有力支持,并形成了一門新興的分支學科——地理語言學。地理語言學主要通過繪制方言地圖,直觀地展示方言特征在空間上的分布,研究者能從全局出發(fā),審視多因素交互背景下的語言變異機制。
GIS技術(shù)的興起從根本上改變了收集、顯示、存儲、轉(zhuǎn)換、分析和表達空間信息的方式,為解決上述問題提供了新的思路。然而,傳統(tǒng)的GIS并沒有真正做到時間、空間和方言屬性的整合。它只描述了語言在某一時刻的情況,無法顯示全程和預(yù)判其趨勢。而時空GIS的提出,為我們綜合利用海量歷史方言材料提供了可能。時空GIS具有空間和時空特點,時空GIS技術(shù)使信息的時間、空間和屬性三要素的集成得以實現(xiàn),使我們能夠重建、跟蹤、預(yù)測和模擬空間數(shù)據(jù)的歷史演變過程,這些特征與龐大且復雜的漢語方言數(shù)據(jù)融合性更好。
筆者嘗試采用時空GIS模型,以譚其驤《中國歷史地圖集》為底圖,制作中國歷史時態(tài)GIS數(shù)據(jù)庫,以揚雄《方言》為綱,建立歷史方言數(shù)據(jù)庫,同時創(chuàng)建一個非語言因素的數(shù)據(jù)庫,整合并構(gòu)建中國歷史方言的地理信息系統(tǒng)。[1]系統(tǒng)構(gòu)成如圖1:
圖1 中國歷史方言地理信息系統(tǒng)框架
以譚其驤的《中國歷史地圖集》為底圖,建立了中國歷史時態(tài)GIS數(shù)據(jù)庫。從原始社會到清末,該地圖集有304幅地圖和大約70000個準確的地名。內(nèi)容包括各民族政權(quán)的領(lǐng)土或活動范圍、行政區(qū)和一些部落的分布、秦朝以前可以考查的名稱的位置和范圍、秦朝以后縣級以上名稱情況,還有主要的河流、湖泊、山嶺及海岸線、島嶼等。它被公認為是我國到目前為止最為完整、權(quán)威的一部大型歷史地圖集,是我們構(gòu)建時空數(shù)據(jù)模型的最佳選擇。
幾千年來,受政治、經(jīng)濟等因素的影響,中國的版圖和行政區(qū)劃一直在不斷變化。由于行政區(qū)劃導致空間拓撲關(guān)系的廢除、更名、邊界變化和一系列復雜變化,很難實現(xiàn)對空間的時間表達。首先,語言是交際交流工具,長期穩(wěn)定無變化。其次,目前能夠掌握的歷史方言材料在時間上的分布是很不均勻的,大多數(shù)沒有精確到縣級程度。再次,雖然不同年代行政區(qū)的邊界和名稱都發(fā)生了很大變化,但行政區(qū)在全國范圍內(nèi)仍有相對穩(wěn)定的傳統(tǒng)邊界和相對較長的存在期。因此,我們認為太詳細的空間數(shù)據(jù)只會導致冗余。通過調(diào)整提高系統(tǒng)效率,根據(jù)現(xiàn)有方言數(shù)據(jù)的時空分布對空間粒度的選擇進行一些調(diào)整。
由于方言材料的空間離散性會造成數(shù)據(jù)的冗余問題,可以考慮將時間作為空間的一種屬性被附加到空間數(shù)據(jù)上,而離散的時空數(shù)據(jù)在傳統(tǒng)的靜態(tài)數(shù)據(jù)庫中通過某些算法關(guān)聯(lián)起來。對于歷史方言數(shù)據(jù)等時空粒度大、屬性數(shù)據(jù)量相對穩(wěn)定的系統(tǒng),其實現(xiàn)簡單便捷,對方言數(shù)據(jù)的處理具有較好的表現(xiàn)。
以揚雄《方言》為綱構(gòu)建語言信息數(shù)據(jù)庫。以揚雄《方言》為參照,主要有以下原因:首先,時間早?!斗窖浴肥堑谝徊俊白杂X”的方言調(diào)查專著。其次,收集的方言材料共計15卷,收錄了9000余字。第三,測區(qū)相對較寬。第四,后世有不少對其注釋或調(diào)查。至少有30多種注釋方言的文獻。比較這些資料,觀察方言詞匯隨時間變化分布情況,較易知曉揚雄時期到該文獻著錄時期的歷史變革。
需要說明的是,更為復雜的是與方言分布有關(guān)的地名體系。例如,揚雄《方言》中既包括行政區(qū)劃名稱也包括自然地理名稱;古代地名和漢代地名。我們有必要將不同類型和時間的地名系統(tǒng)轉(zhuǎn)換和統(tǒng)一為時空數(shù)據(jù)庫中可接受的時空ID,我們稱之為方言地域地名的識別過程,這樣才能保證空間數(shù)據(jù)和方言屬性數(shù)據(jù)的有機結(jié)合。
另外,與詞匯數(shù)據(jù)不同,語音數(shù)據(jù)具有特殊性。事實上,語音差異是單詞在不同時間和空間維度上的語音變化,即語音數(shù)據(jù)只能通過詞匯層面與特定的時空數(shù)據(jù)聯(lián)系起來。筆者認為,一方面,應(yīng)該考慮到所有漢語的語音元素,另一方面,在所有方言中都必須找到作為相關(guān)項目的詞。出于這一考慮,我們在中國社會科學院編制的《方言調(diào)查字表》中選擇了一些與揚雄《方言》交叉的詞匯。高本漢認為:“現(xiàn)代漢語方言,除了閩語之外都從《切韻》語言演化而來。”[2]通過調(diào)查《方言查字表》中各方言條目的表達情況,我們可以基本確定方言的語音特征。
人口遷移、民族融合、自然地理、行政區(qū)劃的演變和其他因素可能會對語言變異產(chǎn)生影響,但這些因素是離散的,必須單獨構(gòu)建數(shù)據(jù)庫??紤]到相關(guān)數(shù)據(jù)的多樣性,我們首先建立了一個人口遷移數(shù)據(jù)庫,后期在此庫的基礎(chǔ)上進行擴充。人口遷移流動對漢語方言形成發(fā)揮了重要作用。移民數(shù)據(jù)主要基于葛劍雄等人的《中國移民史》。這本書論述了從先秦到20世紀40年代的中國移民問題,列出了從公元前21世紀到新中國成立前的移民事件,闡釋了其過程和產(chǎn)生的影響。
在中國歷史上,移民存在遷入和遷出情況,各個地區(qū)特點存在差異,不同類型的移民對漢語方言的形成造成的影響存在差異。為了研究移民對方言的影響,移民事件作為數(shù)據(jù)庫中的唯一ID,需要標明移入移出地的ID、移入移出時間、移民人數(shù)和當?shù)卣Z言類型等因素。
以上數(shù)據(jù)可以通過系統(tǒng)中時間作為空間的屬性加入到空間數(shù)據(jù)。當與之對應(yīng)的空間ID確定后,方便確定時間。另外,方言和移民數(shù)據(jù)也是通過空間分布與地理數(shù)據(jù)關(guān)聯(lián)的。因此,有必要將轉(zhuǎn)換和統(tǒng)一成可接受的時空ID,以確??臻g數(shù)據(jù)和方言屬性數(shù)據(jù)能有機結(jié)合。具體模式如圖2:
圖2 方言對應(yīng)空間ID模式
第一,提供中國歷史方言地理信息系統(tǒng)數(shù)據(jù)框架,而非現(xiàn)成歷史方言數(shù)據(jù)。獲取歷史方言數(shù)據(jù)比現(xiàn)代方言數(shù)據(jù)更加困難,它只能通過研究大量歷史文獻獲得,其結(jié)論的可靠性有待檢驗,這些工作人力短時間很難全部完成。因此,搭建此平臺,研究者根據(jù)自己的研究,可以進行二次開發(fā)。經(jīng)過校正、改進和數(shù)據(jù)積累,形成符合中國歷史方言面貌的漢語歷史方言地理信息系統(tǒng)。系統(tǒng)的搭建分階段實施,對于數(shù)據(jù)量充分的時間段優(yōu)先處理入庫,其他數(shù)據(jù)待研究的推進而完善入庫。
第二,系統(tǒng)重分布,而非分區(qū)。真正有用的方言地圖是分布圖,而非分區(qū)圖。方言特征分布具有客觀性,而研究者的劃分是高度主觀的。不同的研究者選擇不同的標準,所以劃分是不同的。例如,根據(jù)揚雄的《方言》,林語堂分為14個區(qū)[3],羅常培、周祖謨分為7個區(qū)[4],劉君惠等分為12個區(qū)[5],司禮儀(Paul L-M Serruys)分為6個區(qū)[6]。分區(qū)是基于對多種語言特征分布的綜合調(diào)查的主觀判斷,系統(tǒng)無法提供分區(qū)功能。歷史方言地理信息系統(tǒng)構(gòu)建的目的是收集歷史方言特征的分布集,方言研究者依據(jù)數(shù)據(jù)判斷,并為他們進一步建立特定歷史時期的方言劃分提供輔助工具。
采用時空GIS技術(shù)構(gòu)建的中國歷史方言地理信息系統(tǒng),兼顧了方言的時空性,以更為立體直觀的方式呈現(xiàn),較之于傳統(tǒng)方言數(shù)據(jù)呈現(xiàn)方式具有很強的優(yōu)勢:
第一,動態(tài)顯示方言特征隨時間演變在空間上面的分布情況。傳統(tǒng)方言地圖無法很好地提供整體、動態(tài)的方言地理學研究需求。時空GIS技術(shù)的提出,為解決此難題提供了可能性。通過歷史方言地理信息系統(tǒng),我們可以多角度歷時地觀測漢語方言特征的演變以及共時分布,考察時空互動背景下漢語方言沿革與更替。例如,通過該系統(tǒng),我們可以動態(tài)觀察漢語入聲消失的過程。作為中國古代特有的語音,入聲在宋元時期逐漸消亡。當今在山西和部分南方地區(qū),還能搜尋到一些痕跡。由于普通話的普及,古入聲的痕跡更加弱化。這種演變不是突變的,它有一個漸變的過程,其在歷代方言材料的時空分布上有所體現(xiàn),在今天漢語方言的空間分布上也能觀察得到。例如,潮汕方言保留了入聲,并有一個以弱化狀態(tài)結(jié)尾的喉塞音韻尾。然而,在雷州的閩語中,許多古代入聲字已經(jīng)失去了入聲的韻尾,并被發(fā)音為陰聲韻母。通過比較發(fā)現(xiàn),這些詞在雷州閩方言中失去了入聲韻尾,而在潮汕方言中,它們是喉塞音韻尾的詞。在一些方言中也存在類似的情況,入聲仍然存在,但失去了區(qū)分意義的功能。所有這些都可以證明漢語入聲結(jié)尾的脫落(入聲消失)是有階段性的。傳統(tǒng)的方言學通常通過文字或紙質(zhì)地圖來描述這一過程。紙質(zhì)地圖只能顯示靜態(tài)結(jié)果,在方言地理信息系統(tǒng)幫助下,動態(tài)再現(xiàn)入聲消失過程,并能動畫模擬其過程。
第二,具有統(tǒng)計、分析、判斷和預(yù)測功能。方言數(shù)據(jù)庫強大的統(tǒng)計和分析功能使我們能夠計算方言數(shù)據(jù),在統(tǒng)計和分析的基礎(chǔ)上評估、判斷和預(yù)測方言演變,擬測某一中間時間的方言面貌。通過了解方言特征的起點和終點的分布,并結(jié)合歷史行政區(qū)的演變,我們大致在中間階段擬測其分布。[7]
第三,它以不同格式攜帶大量方言數(shù)據(jù)。方言地理信息系統(tǒng)軟件具有方言地圖無級縮放的功能,不受紙質(zhì)地圖不變比例的束縛。用戶既可查看語言的宏觀地理分布,又可查看方言的細微地理分布特征。不僅如此,還可以同時容納一個區(qū)域的所有地圖內(nèi)容,不需要地圖,也不需要分割,這解決了負載與地圖大小的矛盾。紙質(zhì)方言地圖攜帶的方言信息相對較少。因為地圖上的信息相對較多,符號太密集,很難讀取。但方言地理信息系統(tǒng)可任意調(diào)整地圖比例尺,根據(jù)需求放大地圖,精確掌握方言特征分布狀況。
第四,便捷添加、刪除方言數(shù)據(jù)、更改數(shù)據(jù)關(guān)系和結(jié)構(gòu)。隨著新方言事實的發(fā)現(xiàn)或原始方言數(shù)據(jù)存在訛誤,有必要及時更新或修正數(shù)據(jù)庫。這樣,方言研究的最新成果可以及時反映出來,基于現(xiàn)有方言地理信息系統(tǒng)數(shù)據(jù)進行深層次的研究。例如,鄭錦全先生將18個漢語方言點中的905個詞匯和737個方言點的聲調(diào)系統(tǒng)導入到計算機系統(tǒng)中。鄭錦全先生通過計算得到了每個方言點的相關(guān)系數(shù),并繪制了體現(xiàn)方言之間關(guān)系的樹形圖。[8]王士元先生在美國加州大學伯克利分校建立了“漢語方言計算機詞典”(簡稱DOC)。事實上,DOC是一個漢語語音數(shù)據(jù)的計算機數(shù)據(jù)庫,主要基于《漢語方音字匯》,共收錄2700多個單詞。每一個單詞都標記有中古音的開合、等級、韻律、音調(diào)類別,這些音調(diào)基于韻律書和韻律圖(如《切韻》),以及17個現(xiàn)代地方的方言發(fā)音。這個數(shù)據(jù)庫為王士元先生對“詞匯擴散”理論的論證[9],以及鄭錦全[8]、陸致極[10]、王士元等[11]對漢語方言之間關(guān)系的定量描述提供了豐富的信息資料。數(shù)據(jù)庫所提供的方言歷史數(shù)據(jù),相對于過去只是靠單一類型的靜態(tài)方言數(shù)據(jù),所獲得的結(jié)論更加科學。
通過構(gòu)建和利用漢語歷史方言地理信息系統(tǒng),研究人員可以將漢語置于廣闊的時空背景中,了解特定時期漢語方言特征的共時分布,快捷查詢方言特征的歷時演變和分布;直觀觀察方言點、段、區(qū)的歷史演變和替換,了解不同方言區(qū)之間的空間關(guān)系和歷時關(guān)系;研究方言的分區(qū)和劃界,調(diào)查方言的變化速度、方言的分化年代、相互影響的程度和不同語言之間的密切程度;它還可以驗證現(xiàn)有方言研究的正確性,預(yù)測漢語方言的發(fā)展趨勢;它還可以結(jié)合非語言因素來解釋語言的分布,并在此基礎(chǔ)上進一步探討語言變異的機制。在中國歷史的時空坐標下全面考察漢語方言的演變,對于漢語方言和漢語史的研究有重要的幫助。