羅 瓊
(凱里學(xué)院,貴州·凱里 556011)
地理信息系統(tǒng)(GIS) 起步于20世紀(jì)50—60年代,它具有數(shù)據(jù)采集、管理、分析、建模、可視化表達(dá)等功能,用于解決復(fù)雜的規(guī)劃、管理和決策問題。GIS是人文社會(huì)科學(xué)研究的一種信息化新方式,已廣泛應(yīng)用在人類學(xué)、經(jīng)濟(jì)學(xué)、歷史學(xué)、社會(huì)學(xué)等學(xué)科領(lǐng)域。目前國內(nèi)外均有基于GIS技術(shù)的語言地理信息系統(tǒng)研究,國外研究基于宏觀尺度的居多,國內(nèi)研究有基于宏觀的,也有基于微觀的,國內(nèi)學(xué)者張義、張維佳、潘悟云等在歷史方言地理信息系統(tǒng)構(gòu)建和現(xiàn)代方言共時(shí)研究方面都取得很多成果;但在小尺度下,對于涉及苗侗地區(qū)村域漢語方言地理信息系統(tǒng)的研究幾乎還沒有出現(xiàn)。
對少數(shù)民族地區(qū)漢語方言資源數(shù)字化工作進(jìn)行研究,充分挖掘方言資源信息,使其方言資源數(shù)據(jù)標(biāo)準(zhǔn)化、規(guī)范化、系統(tǒng)化,至少具有以下4個(gè)方面重要意義:一是為小尺度少數(shù)民族地區(qū)方言地理信息系統(tǒng)建立提供參考;二是為納入大尺度數(shù)字方言地理信息系統(tǒng)做好準(zhǔn)備;三是為當(dāng)?shù)卣块T和管理人員制定語言規(guī)劃提供決策支持;四是為保護(hù)和傳承優(yōu)秀的傳統(tǒng)文化資源及弘揚(yáng)民族文化自信提供有力保障。本研究以黔東南州為研究區(qū),針對村域漢語方言資源信息進(jìn)行數(shù)字化,建立漢語方言地理信息系統(tǒng),實(shí)現(xiàn)方言資源的信息化管理,為當(dāng)?shù)卣Z言政策制定提供決策支持和服務(wù),同時(shí)為融入全國方言地理信息系統(tǒng)平臺(tái)乃至全球方言地理信息系統(tǒng)平臺(tái)做好準(zhǔn)備。
黔東南苗族侗族自治州,地處貴州省東南部,以“原生態(tài)”聞名于世界,境內(nèi)居住著苗、侗、漢、布依、水、瑤、壯、土家等民族,少數(shù)民族人口占總?cè)丝诘?0%有余,其中苗族人口占比超過40%,侗族人口占比超過30%。
系統(tǒng)工作環(huán)境包括硬件環(huán)境配置、軟件環(huán)境配置及圖件資料。硬件配置包含計(jì)算機(jī),80G以上硬盤,2G以上內(nèi)存;軟件環(huán)境配置包括開發(fā)環(huán)境(Microsoft Visual Studio2005、MapInfo Professional、MapX4.5、Microsoft Visual C++6.0,Oracle9i) 和運(yùn)行環(huán)境(Microsoft Visual Studio 2005、Windows 2000 或Windows XP,Oracle9i);圖件資料包括黔東南州行政區(qū)劃圖、地形圖、水系圖、村鎮(zhèn)分布圖等。本系統(tǒng)中所獲取的數(shù)據(jù)主要有以下幾種方式: 一是利用國家基礎(chǔ)信息平臺(tái)提供的基礎(chǔ)底圖,經(jīng)過GIS軟件處理獲得;二是漢語方言數(shù)據(jù)來源于王貴生教授專著;三是通過手工在鍵盤上輸入地圖的屬性數(shù)據(jù)和其他圖表資料;四是利用百度地圖開放平臺(tái)獲取相關(guān)的地圖數(shù)據(jù)。
MapX 是一款OCX控件產(chǎn)品,屬于美國MapInfo 公司開發(fā),具有強(qiáng)大的地圖分析功能。因?yàn)樗且环N基于Windows操作系統(tǒng)的標(biāo)準(zhǔn)控件,其兼容性很好,故能在大部分標(biāo)準(zhǔn)的可視化開發(fā)環(huán)境進(jìn)行應(yīng)用,如Microsoft Visual C++、PowerBuilder等。開發(fā)人員可以選用任一對象語言,利用MapX和其結(jié)合進(jìn)行二次編程,實(shí)現(xiàn)通用GIS工具軟件提供的基本數(shù)據(jù)編輯等功能,同時(shí)可以不依賴于MapInfo軟件平臺(tái)而單獨(dú)運(yùn)行。
MapX 的空間數(shù)據(jù)結(jié)構(gòu),一方面從橫向來看,采用空間實(shí)體和空間索引相結(jié)合的方式??臻g實(shí)體主要包括點(diǎn)、線、面3種基本類型。點(diǎn)、線、面分別用對應(yīng)的坐標(biāo)表示;空間索引主要用于快速查詢坐標(biāo)對應(yīng)的實(shí)體及相關(guān)的數(shù)據(jù)。另一方面從縱向看,它是采用分層存放的方式進(jìn)行,目前分層是較成熟的數(shù)據(jù)組織管理方式。分層能在邏輯上區(qū)別不同要素,從而提高搜索速度,便于數(shù)據(jù)的靈活調(diào)用、管理及更新。
MapX 的顯著特點(diǎn)有5個(gè)方面:一是方便制作多種方式的專題地圖,包括直方圖、點(diǎn)密度、范圍圖等;二是方便瀏覽和查詢與地圖對象相連的各類數(shù)據(jù)信息;三是快速加入文本、符號、表格等信息,使地圖內(nèi)容更加豐富、完整;四是可以訪問遠(yuǎn)程空間數(shù)據(jù)服務(wù)器,如Oracle9i空間數(shù)據(jù)服務(wù)器擁有強(qiáng)大的查詢處理能力,在數(shù)據(jù)組織的性能方面也特別強(qiáng),將數(shù)據(jù)上傳到空間數(shù)據(jù)庫引擎中,使應(yīng)用程序的靈活性得到了增強(qiáng);五是使用FeatureFactory 對象,使得創(chuàng)建、聯(lián)節(jié)或刪除點(diǎn)、線、區(qū)域圖形對象非常方便。
將GIS軟件處理后的數(shù)據(jù)保存為tab 格式文件,對空間數(shù)據(jù)庫進(jìn)行設(shè)計(jì),而后建立系統(tǒng)數(shù)據(jù)庫;然后在Microsoft Visual Studio2005環(huán)境下用VC++6.0 語言在設(shè)計(jì)應(yīng)用程序并調(diào)試。整個(gè)流程如圖1所示。
圖1 系統(tǒng)設(shè)計(jì)流程圖
GIS 數(shù)據(jù)分為兩大類:一類是與地理對象的空間位置分布有關(guān)的數(shù)據(jù),稱為空間數(shù)據(jù);另一類是地理對象的非空間的屬性信息,比如地理對象的顏色、長度、面積等,稱為屬性數(shù)據(jù)。對于海量的GIS數(shù)據(jù),要實(shí)現(xiàn)對它們的高效組織與管理,是GIS日益廣泛應(yīng)用的迫切需求,也是GIS數(shù)據(jù)庫長期研究的主題之一。空間數(shù)據(jù)管理技術(shù)隨著GIS 和數(shù)據(jù)庫技術(shù)的發(fā)展而不斷發(fā)展。目前,數(shù)據(jù)管理的方法主要有5種,包括早期出現(xiàn)的后期逐步被取代的文件管理方式、廣泛應(yīng)用的文件與關(guān)系混合管理方式、比較成熟的全關(guān)系管理方式、面向?qū)ο箨P(guān)系管理方式、對象與關(guān)系數(shù)據(jù)庫管理方式等。采用對象關(guān)系型數(shù)據(jù)庫實(shí)現(xiàn)對GIS數(shù)據(jù)的管理,是在RDB和OODB之間權(quán)衡之后選擇的一種折中方案,它是一種較為理想的實(shí)現(xiàn)空間數(shù)據(jù)庫的方式。當(dāng)前,一些國際著名的數(shù)據(jù)庫公司如Oracle、SQL Server都推出了空間數(shù)據(jù)管理工具,本研究采用對象關(guān)系型數(shù)據(jù)庫Oracle Spatial來管理方言資源空間數(shù)據(jù)。
通過資源數(shù)據(jù)的分類編碼,可以實(shí)現(xiàn)方言資源數(shù)據(jù)的規(guī)范化。要對數(shù)據(jù)進(jìn)行有效管理,就必須對數(shù)據(jù)進(jìn)行分類及其編碼,它是實(shí)現(xiàn)信息化的一項(xiàng)重要而基礎(chǔ)的工作。本研究的基礎(chǔ)地理數(shù)據(jù)包含行政區(qū)劃圖、村鎮(zhèn)分布圖、水系圖、地形圖。根據(jù)研究區(qū)域特點(diǎn),各空間要素圖層代碼由6位組成,從左往右,第1位至第2位用于表達(dá)地理基本主題,即用英文單詞的首字母表示;第3位至第5位表達(dá)區(qū)域代碼;最后1位用于表達(dá)基本點(diǎn)、線、面要素特征,即分別用點(diǎn)P、線L、面S表示。如AD001S,AD(英文名稱第一個(gè)單詞的縮寫) 表示行政專題要素,001是黔東南區(qū)域代碼;S表示是面狀要素特征??臻g數(shù)據(jù)編碼如表1所示。
表1 空間數(shù)據(jù)編碼
系統(tǒng)中的屬性數(shù)據(jù)編碼包括村鎮(zhèn)編碼和方言屬性數(shù)據(jù)編碼。該系統(tǒng)的村鎮(zhèn)編碼由6位數(shù)組成,前4 位代碼為分幅的圖幅號,后兩位是自然村序列號。根據(jù)地形圖分幅與編號的方法,將研究區(qū)域按經(jīng)差30分,緯差20分劃分成8行6列共48幅圖(研究區(qū)邊界內(nèi)共42幅圖),圖幅按從左至右,從上至下的順序進(jìn)行編碼,第一幅(左上角) 編號為0101,最后一幅(左下角) 編號為0804。后2位代碼按落入圖幅的村鎮(zhèn)順序自西向東,自北向南依次進(jìn)行編碼,由于每個(gè)圖幅自然村不超過99個(gè),所以編碼范圍為01~99。如自然村編碼為010301,表示為圖幅號是0103幅,即第1行第3列,自然村的序號是1。
對于方言屬性數(shù)據(jù)編碼,由于目前尚沒有方言資源數(shù)據(jù)字典的標(biāo)準(zhǔn),本文參照已有標(biāo)準(zhǔn)的基礎(chǔ)上,從信息管理的角度建立方言資源的編碼方法與規(guī)則。根據(jù)情境的不同、研究區(qū)漢語方言的特點(diǎn)及所搜集的信息,將研究區(qū)的漢語方言資源信息使用線性分類法,分為3個(gè)級別,一級分類對應(yīng)使用情境的類別,有5個(gè)類別;二級分類對應(yīng)具體名稱,有45個(gè)類別,三級分類是具體對應(yīng)的方言說法,有300條。一級分類考慮到類別不超過100 類,所以采用兩位的碼長,范圍是01~99;二級分類考慮到每類常用口語詞匯不超過1000,因此二級分類每類編碼碼長為3位,范圍是001~999;三級分類考慮到的詞語對應(yīng)的方言說法不超過100種,所以采用兩位的碼長,范圍是01~99。具體編碼如表3所示,方言資源的編碼長共8位,第一位F,是方言拼音的首字母;第2至3位,是一級分類的編號;第4位至第6位,是二級分類的編號;第7 至8位,是三級分類的編號。如F0200103,F(xiàn)表示是方言的編碼;02表示屬于第2類——?jiǎng)又参铮?01——屬于第2 類中的第1 類——蜻蜓;03——表明屬于蜻蜓中的第3類,即蜻蜓方言里的第3 種方言說法。
表3 漢語方言資源分類表
屬性數(shù)據(jù)庫的表結(jié)構(gòu)如表2、表4、表5所示,表2 與表5通過方言編號進(jìn)行關(guān)聯(lián),表4與表5通過語句編號進(jìn)行關(guān)聯(lián);當(dāng)用戶點(diǎn)擊圖上任一點(diǎn)時(shí),即可聯(lián)結(jié)到相應(yīng)的方言信息。
表2 村鎮(zhèn)數(shù)據(jù)表結(jié)構(gòu)
表4 常用語句表結(jié)構(gòu)
表5 方言表結(jié)構(gòu)
Oracle 公司是全球知名的數(shù)據(jù)庫服務(wù)商,Oracle Spatial 是其開發(fā)的空間數(shù)據(jù)管理模塊,該模塊具備強(qiáng)大的數(shù)據(jù)存儲(chǔ)和編輯等功能,同時(shí)提供優(yōu)秀的空間索引機(jī)制,解決了傳統(tǒng)空間數(shù)據(jù)庫展現(xiàn)出來的種種問題。通過Oracle Spatial加載的每一個(gè)地圖,是以表的形式來進(jìn)行存儲(chǔ)的,每一個(gè)表是一組文件,一類是ID或IND索引文件,即索引機(jī)制生成的相關(guān)文件;另一類是TAB數(shù)據(jù)文件、DAT 文件、MAP文件,即用來存儲(chǔ)地圖屬性特征數(shù)據(jù)和關(guān)鍵空間信息描述。將tab格式文件的地圖數(shù)據(jù)導(dǎo)入到服務(wù)器端的Oracle Spatial中,數(shù)據(jù)上傳工具采用Mapinfo公司的數(shù)據(jù)轉(zhuǎn)化工具Easyloader。
系統(tǒng)應(yīng)用GIS技術(shù),把研究區(qū)的空間信息(區(qū)域)、人、方言資源(語言) 信息三者信息整合起來,為方言資源的保護(hù)和數(shù)字化工作提供服務(wù)和參考。根據(jù)需求,系統(tǒng)的功能總體框架圖如圖2所示。
圖2 系統(tǒng)功能總體框架圖
系統(tǒng)的7大主要功能簡述如下:
第一,地圖加載。系統(tǒng)可以實(shí)現(xiàn)任何區(qū)域資源地圖tab格式及mws格式文件的加載。如行政區(qū)劃圖、水系圖、地形圖、點(diǎn)位圖等;如選擇地圖加載選項(xiàng)卡,選擇要導(dǎo)入的tab數(shù)據(jù)所在的位置,點(diǎn)擊確定,就可以把所需要的數(shù)據(jù)加載到系統(tǒng)中,進(jìn)行顯示。
第二,地圖基本功能。在系統(tǒng)中,地圖的管理模式使用了分層結(jié)構(gòu)進(jìn)行組織,對可以自由實(shí)現(xiàn)對任一地圖的縮放、漫游、全圖等操作,也可以對圖層進(jìn)行顯示或者隱藏。如對于點(diǎn)位圖,可以在左邊區(qū)域的圖層框里點(diǎn)擊左鍵,就可以打上勾或者取消勾,圖層就能顯示或者隱藏;也可以通過放大、縮小等按鈕對地圖進(jìn)行查看,以便了解局部或全局的地圖信息。
第三,信息查詢功能。系統(tǒng)提供從屬性到圖形的查詢和圖形到屬性的查詢。如從屬性查圖形,若你想知道黔東南有哪些地方的人把“熱水”說成“Lai水”,那你就選擇方言中的“l(fā)ai水”選項(xiàng),可以準(zhǔn)確又快速顯示出說“Lai水”的區(qū)域位置;再如從圖形查屬性,點(diǎn)擊圖上任何1個(gè)點(diǎn)位,都可以查到該位置的人們常用語句的方言說法。
第四,經(jīng)緯度顯示功能。系統(tǒng)提供較準(zhǔn)確的經(jīng)緯度的顯示功能,便于進(jìn)行定位跟蹤及與其他系統(tǒng)集成應(yīng)用。如融合相關(guān)的語音資料、視頻資料,實(shí)現(xiàn)服務(wù)和系統(tǒng)功能的無縫對接。
第五,三維顯示。通過地形圖創(chuàng)建的數(shù)字高程模型,及顯示的方言分區(qū)圖,實(shí)現(xiàn)方言區(qū)域差異的三維顯示。從圖上可以看到地形對方言的影響,河流北岸與南岸,山脈的東邊與西邊,人們的方言對同一種事物叫法都不一樣,具有明顯的差異。如在苗嶺的北坡和南坡, 陽河的上游與下游,人們對西紅柿的說法都存在明顯的不同。
第六,報(bào)表輸出功能及生成專題圖功能。根據(jù)實(shí)際需要,系統(tǒng)可以輸出相關(guān)的表格。如常見生活語句方言與普通話對照表、方言對應(yīng)區(qū)域表等。也可以制作專題地圖。如對于每一個(gè)詞匯,可以制作方言分布圖;也可以通過用戶類別合并,生成黔東南方言分區(qū)圖。
第七,系統(tǒng)數(shù)據(jù)維護(hù)功能。由于地域不同,漢語方言信息量表現(xiàn)出大又非常復(fù)雜的特點(diǎn),因此在現(xiàn)有數(shù)據(jù)庫的建成基礎(chǔ)上,基礎(chǔ)資料仍需要不斷補(bǔ)充和豐富。因此本系統(tǒng)具有一定的開放性,系統(tǒng)管理員以及擁有權(quán)限的用戶,可以對各類信息數(shù)據(jù)進(jìn)行增加、修改、更新、刪除等操作,從而實(shí)現(xiàn)方言信息的不斷擴(kuò)充和完善,并獲取更多更完整的數(shù)據(jù),更好地做好方言數(shù)字化工作,以便保護(hù)和傳承好漢語方言資源和地方文化。
系統(tǒng)采用Windows2007為操作系統(tǒng)平臺(tái),以O(shè)racle Spatial 作為GIS數(shù)據(jù)服務(wù)器,通過Mapx+VC編寫程序來實(shí)現(xiàn)方言資源的信息化和數(shù)字化管理。
根據(jù)方言的特性及其在區(qū)域差異中的表現(xiàn),本文利用MapX及相關(guān)技術(shù)將人、方言及區(qū)域整合信息起來,利用Oracle Spatial空間數(shù)據(jù)處理模塊支持的Object-Relational Model模型,使用“一張表模式”,就能存儲(chǔ)和管理漢語方言資源的空間數(shù)據(jù)和屬性數(shù)據(jù),極大方便了系統(tǒng)的數(shù)據(jù)操作。同時(shí)借助Microsoft Visual C++6.0語言和MapInfo公司開發(fā)的MapX控件產(chǎn)品進(jìn)行二次開發(fā)實(shí)現(xiàn)方言資源管理,有效將人、方言及區(qū)域三方信息聯(lián)結(jié)起來,建立漢語方言地理信息系統(tǒng),從而為相關(guān)部分和人員提供空間數(shù)據(jù)和屬性數(shù)據(jù)的瀏覽、查詢、分析、制圖等功能,為制定語言政策和語言規(guī)劃提供相應(yīng)的技術(shù)支持,對苗侗地區(qū)方言的數(shù)字化尤其是漢語方言的數(shù)字化工作和漢語方言文化的保護(hù)將產(chǎn)生積極的影響。由于小尺度下地方方言原始數(shù)據(jù)獲取的工作量非常大,目前系統(tǒng)的村域方言數(shù)據(jù)有限,還有待進(jìn)一步更新和完善;隨著數(shù)據(jù)的豐富和增加,系統(tǒng)的功能仍需進(jìn)一步對技術(shù)進(jìn)行改善,使其更加有利于地方方言資源的保護(hù)、開發(fā)、利用及可持續(xù)發(fā)展的需要。