王成平 沈紫陽 孫某姑
摘要:論文研究首先在文獻(xiàn)整理、田野調(diào)查等基礎(chǔ)上完成了涼山州木里縣屋腳鄉(xiāng)彝族民歌、故事、克智等口頭經(jīng)典的文本與語音收集,其次參考語言信息處理、多媒體、數(shù)據(jù)庫等技術(shù)路線開展語料素材的整理與建庫,最后借助網(wǎng)頁編程與語料庫技術(shù),完成木里縣屋腳鄉(xiāng)彝族口傳經(jīng)典資源庫的建設(shè),以在線資源庫的形式展現(xiàn)彝族口傳經(jīng)典,為保護(hù)、展示、弘揚(yáng)民族語言傳統(tǒng)口傳文化的研究與創(chuàng)新提供了新的途徑與實踐探索。
關(guān)鍵詞:木里縣屋腳鄉(xiāng);彝族;口傳經(jīng)典;資源庫
一、前言
口傳經(jīng)典作為民族傳統(tǒng)經(jīng)典的精髓,借助民俗活動的平臺,以口耳相傳的形式傳播和傳承下來,是傳統(tǒng)民俗活動的重要組成部分,因此完整保存優(yōu)秀傳統(tǒng)經(jīng)典,具有深遠(yuǎn)意義。彝族口傳經(jīng)典具有較高的文學(xué)研究價值,能夠全面系統(tǒng)地展現(xiàn)彝族人民在生產(chǎn)生活中創(chuàng)造的民族傳統(tǒng)經(jīng)典文化;2005年聯(lián)合國教科文組織通過了《保護(hù)與促進(jìn)經(jīng)典表現(xiàn)形式多樣性公約》,受其推動,21世紀(jì)初,我國實施了“非物質(zhì)經(jīng)典遺產(chǎn)保護(hù)工程”,中國社會科學(xué)院成立“口承傳統(tǒng)研究中心”,積極開展對少數(shù)民族口傳經(jīng)典遺產(chǎn)現(xiàn)狀和發(fā)展態(tài)勢的調(diào)查、鑒別、研究、保護(hù)和宣傳。
彝族民間的口傳經(jīng)典大致由民俗與宗教經(jīng)典(如:畢摩經(jīng)等)、民間口傳文學(xué)(如:故事、諺語等)、思想教育(如:瑪木特依等)、民歌民謠(如:婚嫁歌、山歌等)等四部分組成,這些口傳經(jīng)典是國內(nèi)外眾多學(xué)者研究彝族文學(xué)藝術(shù)、文化民俗、歷史發(fā)展的重要文獻(xiàn)與素材。
彝族口傳經(jīng)典語庫就是“將彝族的零星散落在民間的彝族口傳經(jīng)典收集并轉(zhuǎn)換成文本資料后,按照語料庫存儲結(jié)構(gòu)的要求建立存儲以及管理口傳經(jīng)典資料,以便于查閱及使用的倉庫”,在研究內(nèi)容上:通過收集和整理彝族口傳經(jīng)典資料,可以探尋彝族經(jīng)典在這多民族聚居區(qū)域的歷史傳承,探究民族經(jīng)典的異同和相融等;在實現(xiàn)手段上:利用網(wǎng)頁編程與語料庫技術(shù)展示彝族口傳經(jīng)典文化,主要分為信息采集和語料庫的建設(shè)兩部分,前期以信息采集為主,整理、記錄生活中樸實、純正的口傳經(jīng)典;后期以語言的研究和語料庫的建設(shè)為主,利用信息技術(shù)來建立包含民歌、克智等文本語料,采用語料庫、多媒體等多維展現(xiàn)口傳經(jīng)典資源庫,論文研究思路結(jié)構(gòu)如圖1所示:
二、屋腳鄉(xiāng)彝族口傳經(jīng)典資源庫語料的收集整理
(一)屋腳鄉(xiāng)及其彝族口傳經(jīng)典概況
屋腳蒙古族鄉(xiāng)位于涼山州木里藏族自治縣境內(nèi)南部邊緣地帶,1984年四川省人民政府批準(zhǔn)建立屋腳蒙古族鄉(xiāng),其轄內(nèi)面積約307平方公里,轄內(nèi)2個行政村,是木里的五個民族鄉(xiāng)之一;“屋腳”系蒙古語音譯,意為“有牛的地方”,藏語稱“仁江”,居住著蒙古族、彝族、藏族、漢族、納西等5個少數(shù)民族,還原汁原味的留存著神秘而偉大的母系氏族文化,這里的母系氏族文化被美譽(yù)為“最后神奇的母系村落”;彝語北部方言圣乍話目前廣泛應(yīng)用于屋腳鄉(xiāng)片區(qū)彝族同胞的日常交流和生活生產(chǎn)當(dāng)中,當(dāng)?shù)氐牟刈?、蒙古族同胞中絕大多數(shù)都會簡單的彝語交流。
屋腳鄉(xiāng)彝族口傳經(jīng)典主要是以彝語北部方言所屬區(qū)域下的彝族史詩、民間故事(????)、妞妞(??)、克智(??)等經(jīng)典傳承為主,主要靠展演與吟誦的模式來表現(xiàn)出來,口傳經(jīng)典多為民俗活動、婚喪嫁娶、節(jié)慶聚會中所運(yùn)用到的 “妞妞哄”(???)、“克智”(??)和“阿依阿支”(????)等,除所傳承的彝族民俗經(jīng)典(包括婚俗、宗教信仰、喪俗、食俗、服飾經(jīng)典等)基本上與涼山其他地方大同小異,在遷徙和傳承時在民俗經(jīng)典活動中所表達(dá)出的口傳經(jīng)典有部分創(chuàng)新和演變。
(二)口傳經(jīng)典文本語料的選取
屋腳蒙古族鄉(xiāng)的彝族口傳經(jīng)典具有濃厚的多民族色彩以及地域特征,因此既要考慮當(dāng)?shù)乜趥鹘?jīng)典傳承人的民族和語言使用情況,而且還要考慮其在當(dāng)?shù)氐木幼r間等綜合因素進(jìn)行篩選發(fā)音人。
屋腳鄉(xiāng)彝族口傳經(jīng)典資源庫是由選取的彝文文本、漢語翻譯、彝語拼音三部分內(nèi)容構(gòu)成的:第一個部分涉及到彝文字3000個句子涵蓋33000個字符;第二部分是對以上彝文字的漢語翻譯,包括3000個句子涵蓋42900個字符;第三個部分是對彝文字的國際音標(biāo)標(biāo)注,涵蓋彝文國際音標(biāo)15733個涵蓋33000個字符數(shù)據(jù)量,合計完成10萬多個字符數(shù)據(jù)規(guī)模語料的整理。
(三)口傳經(jīng)典調(diào)查與數(shù)據(jù)采集
口傳經(jīng)典調(diào)查內(nèi)容,主要包括調(diào)查人員、調(diào)查時間、調(diào)查地點(diǎn)、調(diào)查內(nèi)容等,2017年11月3日,調(diào)查人員一行4人從成都出發(fā),最終于11月5日上午10點(diǎn)到達(dá)調(diào)查點(diǎn)屋腳蒙古族鄉(xiāng),11月4日至11日開展了為期7天的彝族口傳經(jīng)典的實地調(diào)研與語料采集。
傳承人的選定主要遵從以下幾個原則,首先選擇的對象是土生土長的當(dāng)?shù)厝?,對?dāng)?shù)氐淖匀缓腿宋沫h(huán)境相當(dāng)熟悉,能夠以地道的當(dāng)?shù)孛褡逭Z言進(jìn)行說和唱;其次特別是對當(dāng)?shù)氐囊妥蹇趥鹘?jīng)典有濃厚的感情,可以有效還原口傳經(jīng)典的真實和原生態(tài)。最后發(fā)音傳承人需口齒伶俐、思維清晰,具備勝任口傳經(jīng)典表述,符合口傳經(jīng)典采集工作開展的相關(guān)規(guī)范和要求。
彝族口傳經(jīng)典收集、整理的主要內(nèi)容為:流傳在屋腳蒙古族鄉(xiāng)的民歌、故事和克智;調(diào)研主體是藏族自治縣下蒙古族鄉(xiāng)流傳的彝族口傳經(jīng)典,從音頻、圖像、視頻等多維角度開展語料數(shù)據(jù)采集,做到有圖、有音有畫面,完成90段音頻資料的錄制,存儲量達(dá)到7.97GB,時長500分鐘;音頻資料基本呈現(xiàn)出:雜音少、音質(zhì)清晰的特征;視頻資料方面,共拍攝16段視頻,原視頻存儲量達(dá)到106.95GB,時長320分鐘;拍攝、整理照片資源2000余張。
(四)語料數(shù)據(jù)標(biāo)注與整理
語料數(shù)據(jù)標(biāo)注整理主要從語料文本提取、文本翻譯、歸納整理等三個方面來開展。
文本提取上獲取信息主要是音頻資料中攝取內(nèi)容,然后將音頻逐字逐句進(jìn)行提取轉(zhuǎn)化文本;文本翻譯上文本的翻譯有兩個過程,通過文字性的翻譯,文字性翻譯是將彝語口傳經(jīng)典的音頻資料經(jīng)過翻譯成漢語之后,以彝文和漢字的形式出現(xiàn);歸納整理上將提取出來的彝語文本進(jìn)行歸納,具體分為民歌、故事和克智三個模塊。
文本標(biāo)注內(nèi)容包括彝文拼音標(biāo)注、漢文翻譯,標(biāo)注采用“漢語(譯文)+彝語+彝語拼音”的方案模式,通過標(biāo)注,完成語料庫進(jìn)行文本內(nèi)容的展示,實現(xiàn)真正意義上的高“辨識度”的語料展示,如下表所示:
三、屋腳蒙古族鄉(xiāng)彝族口傳經(jīng)典資源庫的建設(shè)
(一)資源庫結(jié)構(gòu)
資源庫設(shè)計主要是對選取文本、制作音頻文件、視頻文件、圖片材料等資料的設(shè)計。在語料結(jié)構(gòu)上,內(nèi)容層次分明、布局合理,表現(xiàn)出當(dāng)?shù)乜诮?jīng)典面貌。
資源庫內(nèi)部結(jié)構(gòu),主要通過研究和發(fā)掘,挖掘出針對文本、圖像、語音、視頻等各個構(gòu)成成分的分析和展示,主要圍繞著:在收集第一手資料時,選擇的具有代表性的語料進(jìn)行采集;語料數(shù)據(jù)庫的研究和用于表現(xiàn)的方面主要體現(xiàn)在彝語口傳經(jīng)典經(jīng)典上面,目標(biāo)是實現(xiàn)以交互式多媒體的形式展現(xiàn)語料,通過分析屋腳鄉(xiāng)當(dāng)前留存的彝族口傳經(jīng)典的種類、數(shù)量、規(guī)模、演變和使用人群等,旨在研究當(dāng)?shù)乜趥鹘?jīng)典語料的特色性,豐富的彝族語言及文化資源資源庫。
資源庫具有存儲信息量大、表現(xiàn)形式多樣化、實時存取和多路并發(fā)等特點(diǎn),在建設(shè)進(jìn)程中,采用層次模型、網(wǎng)狀模型(超文本)、關(guān)系模型及對象模型來進(jìn)行組織。
研究成果為涵蓋文本、音頻、視頻、圖像的交互式的多媒體語料庫,通過人工的標(biāo)注和機(jī)器語言結(jié)合的方式,有助于使用者快捷方便檢索瀏覽語料庫,通過資源庫可以直觀的查詢和探訪到需要研究查看到屋腳鄉(xiāng)彝族經(jīng)典口傳內(nèi)容的多維度展示。
(二)資源庫文本音頻模塊
資源庫的文本音頻語料即為文本資料結(jié)合音頻文件,用以同步展示文本、語音介質(zhì)的語料集合,實現(xiàn)對屋腳鄉(xiāng)彝族口傳經(jīng)典的文本、語音材料的運(yùn)用和展示。
論文研究主要運(yùn)用JS腳本語言實現(xiàn)對資源庫的拓展運(yùn)用。在JS語言中主要運(yùn)用Json和Ajax、Jquery技術(shù)功能相結(jié)合,實現(xiàn)資源庫文本表格的查詢功能,即為分類檢索查詢功能;通過JS語言的連續(xù)的代碼運(yùn)用,即用ajax語句的get指令來獲取數(shù)據(jù),獲的語料庫data數(shù)據(jù)資料,然后通過目標(biāo)地址的調(diào)取,功能上實現(xiàn)對資源庫的數(shù)據(jù)內(nèi)容的提取查詢和檢索的功能。其中,根據(jù)語料語料的呈現(xiàn)方式,將語料通過表格的模式分成獨(dú)立的多個單句,從而在檢索查詢中,以獨(dú)立的詞條形式整條的進(jìn)行、查詢,如圖3所示:
資源庫中的語料是以單獨(dú)的篇章為個體進(jìn)行劃分,如圖3所示,資源庫以彝族口傳經(jīng)典阿依阿支進(jìn)行檢索、查詢、展示,語料庫數(shù)據(jù)表將以單句進(jìn)行編號進(jìn)行條目的劃分,通過片段的分類方式,可便捷的進(jìn)行查詢,完成編號、漢譯、彝文、拼音等內(nèi)容的整齊對應(yīng)的內(nèi)容展示,如圖4所示:
資源庫綜合運(yùn)用jquery、json、ajax等技術(shù)方案,并融合多種內(nèi)容提取方式,通過多次實驗獲得了一種簡便又快速的檢索查詢方法,具有實用性和便捷性的特點(diǎn),方便語料檢索與查詢;語音播放模塊,用該模塊可以實現(xiàn)對語音模塊的播放控制,可實現(xiàn)在線操作。
(三)資源庫視頻模塊
資源庫視頻語料主要是運(yùn)用網(wǎng)頁技術(shù)實現(xiàn)對彝族口傳經(jīng)典的視頻材料的播放和展示,主要通過外鏈?zhǔn)揭曨l播放模塊管控播放功能,直接實現(xiàn)對資源庫視頻的在線播放與管理,如圖5所示:
圖5界面功能可直觀便捷的找到需要播放的視頻文件,通過滑動圖像的風(fēng)格,附加視頻文件外部實現(xiàn)彝漢雙語的標(biāo)注,可便捷、快速實現(xiàn)視頻的查找,并可直觀實現(xiàn)播放、暫停、音量加減、視頻進(jìn)度拖動乃至全屏播放等功能;同時資源庫還具有語料信息生成數(shù)據(jù)表功能,這是資源庫的一個特色亮點(diǎn),通過該功能可以方便進(jìn)行有效的下載和修改校對等操作,具體實現(xiàn)的步驟:首先安插JS插件;其次,將靜態(tài)網(wǎng)頁的table標(biāo)簽的編號設(shè)置為classical_table;最后給按鈕賦予點(diǎn)擊事件指令,導(dǎo)出為Excel格式文件,如圖6所示:
(四)資源庫圖像模塊
資源庫的圖像模塊主要是運(yùn)用網(wǎng)頁技術(shù)將統(tǒng)一圖像格式為.jpg進(jìn)行歸類、在線查詢與展示,豐富了口傳經(jīng)典語料庫的內(nèi)容,用該模塊可以實現(xiàn)對圖像模塊的預(yù)覽控制,通過分類的管理模式,運(yùn)用<div>分類化技術(shù)實現(xiàn)對圖片的單獨(dú)整理和查詢預(yù)覽,如圖7所示:
四、結(jié)語
傳承和保護(hù)民族傳統(tǒng)經(jīng)典是世界非物質(zhì)經(jīng)典遺產(chǎn)保護(hù)的重要部分,語言與文化資源庫的實現(xiàn)為民族口傳經(jīng)典的數(shù)字化建設(shè)、為民族文化的多元性展示,為民族文化傳承的多維度創(chuàng)新研究提供了新的視角;論文研究運(yùn)用現(xiàn)代的信息處理技術(shù)收集散落在民間的傳統(tǒng)與口傳經(jīng)典,參考語言信息處理、多媒體、數(shù)據(jù)庫等技術(shù)路線開展語料素材的整理與建庫,借助網(wǎng)頁編程與語料庫技術(shù),完成10萬多字符數(shù)據(jù)量的木里縣屋腳鄉(xiāng)彝族口傳經(jīng)典資源庫的建設(shè),實現(xiàn)了以在線資源庫的形式來展現(xiàn)彝族口傳經(jīng)典,為信息化、數(shù)字化時代民族語言與傳統(tǒng)文化的傳播、發(fā)展與創(chuàng)新研究提供了新的實踐探索。
參考文獻(xiàn):
[1]沙馬打各.論口傳文學(xué)書面化過程中經(jīng)典要素的遺失——兼談彝族克智的收集與整理[J].西南民族大學(xué)學(xué)報(人文社科版),2008(08):45-48.
[2]楊正文.經(jīng)典遺產(chǎn)保護(hù)的關(guān)聯(lián)話語意義解析[J].西南民族大學(xué)學(xué)報(人文社會科學(xué)版),2014(7).
[3]王美英.涼山彝族口傳經(jīng)典保護(hù)發(fā)展困境與對策研究[J].西南民族大學(xué)學(xué)報(人文社科版),2015,36(12):51-57.
[4]蘇連科.彝族有聲語言與口傳經(jīng)典保護(hù)和傳承的數(shù)字化方法及其基礎(chǔ)理論研究[J].玉溪師范學(xué)院學(xué)報,2015,31(01):18-22.
[5]王成平.彝語言語料語料數(shù)據(jù)庫的設(shè)計與共享的實現(xiàn)[J].中文信息學(xué)報,2016,30(01):129-132+139.
[6]那書琦.彝族經(jīng)典在彝區(qū)城鎮(zhèn)化過程中的傳承與保護(hù)研究[D].成都:西華大學(xué),2016.
[7]黃行.中國語言語料多樣性及其創(chuàng)新與保護(hù)規(guī)劃[J].語言學(xué)研究,2017(01):17-24.
[9]曹志耘.跨越鴻溝——尋找語保最有效的方式[J].語言文字應(yīng)用,2017(2).
[9]丁石慶.中國語言資源保護(hù)工程語料資源的質(zhì)量、價值和效用——以少數(shù)民族語言材料為例[J].暨南學(xué)報(哲學(xué)社會科學(xué)版),2018.
項目名稱:教育部人文社會科學(xué)研究項目,項目編號:17YJA740051;西南民族大學(xué)中央高?;究蒲袠I(yè)務(wù)費(fèi)專項資金項目;項目編號:2016NGJPY07;民族語言文字信
息處理重點(diǎn)實驗室建設(shè)的研究成果。