翟力嬌 曹鈺紅 胡晗 陳逸寒 潘曉芙
摘要:應(yīng)互聯(lián)網(wǎng)時(shí)代信息技術(shù)的發(fā)展,方言的傳承也有了新的手段,但仍擺脫不了逐漸落寞的命運(yùn)。本文以信息技術(shù)時(shí)代比較普遍的方言保存形式——方言有聲語料庫為抓手,對(duì)相關(guān)方言保護(hù)研究項(xiàng)目進(jìn)行了解、對(duì)現(xiàn)有語料庫進(jìn)行使用體驗(yàn),以激發(fā)青少年對(duì)方言文化的興趣、深化群眾對(duì)方言的了解從而更好地保護(hù)方言文化。同時(shí),對(duì)現(xiàn)有方言有聲語料庫的優(yōu)點(diǎn)和不足進(jìn)行總結(jié)并提出建議,以望能對(duì)方言的保護(hù)和發(fā)展作出貢獻(xiàn)。
關(guān)鍵詞:方言保護(hù);有聲語料庫;互聯(lián)網(wǎng)思維;文化自信
一、引言
自十八大提出“文化自信”以來,中國就掀起了一股中華文化熱潮。方言作為語言中舉足輕重的一類,是文化的活化石,具有重要的文化傳承意義。保護(hù)并發(fā)展方言,是當(dāng)代大學(xué)生義不容辭的責(zé)任與義務(wù)。
但不可否認(rèn)的是,隨著互聯(lián)網(wǎng)時(shí)代的到來,地方方言的傳統(tǒng)傳播方式受到了較大的沖擊,舊有的傳播途徑、傳承媒介土崩瓦解;加之信息流轉(zhuǎn)速度的加快、規(guī)范普通話的普及、多種外語的流行等,方言的魅力被逐漸掩蓋,年輕人幾乎不再關(guān)注地方方言的興亡,方言文化也逐漸落寞。
為了更好地促進(jìn)方言的保護(hù)與傳承,社會(huì)各界紛紛行動(dòng)起來,利用互聯(lián)網(wǎng)高效的信息共享能力,建設(shè)了一個(gè)又一個(gè)方言語料庫,將身邊的方言資源匯總、整合,再投放到網(wǎng)絡(luò)當(dāng)中,以便于更多人了解并學(xué)習(xí)?;谏鲜銮闆r,本文特此對(duì)“互聯(lián)網(wǎng)思維下方言有聲語料庫對(duì)方言的保護(hù)與傳承”問題展開研究。
二、研究基礎(chǔ)
參與各地方言保護(hù)、傳承研究的研究人員多自行建立方言語料庫,充分研究方言的發(fā)音特點(diǎn),將方言語料庫的建設(shè)向系統(tǒng)化、專業(yè)化、學(xué)術(shù)化的方向邁進(jìn)。如陳琳(2020年)通過自建“《紅樓夢(mèng)》江淮方言漢英平行語料庫”的方式來研究《紅樓夢(mèng)》中的江淮方言[1]。他們考慮到了方言難以用書面文字形式記錄的問題,轉(zhuǎn)而借用語音資源進(jìn)行保存,語音語料多從本地影視作品中剪裁或邀請(qǐng)當(dāng)?shù)刂驹刚哌M(jìn)行錄制。為研究海南方言的語音識(shí)別問題,余旭文(2020年)邀請(qǐng)志愿者參與方言語音的錄制,經(jīng)語音切分后,進(jìn)行加噪、速度擾動(dòng)等語音增強(qiáng)手段增廣語料庫數(shù)據(jù)[2]。但這些專業(yè)學(xué)者構(gòu)建的方言語料庫傳播范圍極小,多是用于自身研究某一專業(yè)領(lǐng)域,對(duì)廣大網(wǎng)民了解、學(xué)習(xí)方言有聲語料庫起到的作用微乎其微。
也有部分研究互聯(lián)網(wǎng)思維下方言保存與傳承問題的人員參考了各地已建成的方言語料庫,如甘瑩(2017年)在論文中提及的天津方言語音檔案資料庫。她認(rèn)為已建檔語料庫存在內(nèi)容形式單一、方言個(gè)性特征提取不完善、文本化氣息過重、生活氣息不足等問題,提出了將語料庫建設(shè)專業(yè)化、內(nèi)容深度化,推進(jìn)方言語料庫的傳播和運(yùn)用,優(yōu)化語料庫的結(jié)構(gòu)和類別等解決措施[3]。
可見,已有研究大多僅集中在充分運(yùn)用數(shù)字技術(shù)上,對(duì)于互聯(lián)網(wǎng)特性的運(yùn)用考慮不夠全面。鄒曉燕、韓琨(2017年)提出了以高校教師和研究者作為突破口,發(fā)揮高校學(xué)生眾多、方言資源種類豐富的優(yōu)勢(shì),解決語料庫存儲(chǔ)方言語料種類少、加工處理工作量大這一問題的方法[4],但沒有意識(shí)到網(wǎng)絡(luò)上眾多網(wǎng)友所持的海量方言資源,未能找到利用共享信息的方式發(fā)動(dòng)網(wǎng)友完善方言語料資源的有效途徑。
本文將以現(xiàn)有的方言有聲語料庫為研究出發(fā)點(diǎn),充分探索現(xiàn)階段語料庫的建設(shè)狀況及優(yōu)缺點(diǎn),以互聯(lián)網(wǎng)特性為基礎(chǔ),著力找出互聯(lián)網(wǎng)思維下方言有聲語料庫建設(shè)的有效途徑,將互聯(lián)網(wǎng)開放性、共享性、多元化、交互性等特點(diǎn)融入語料庫建檔方法中。
三、問題與討論
經(jīng)過對(duì)大量方言語料庫的查找和試驗(yàn)后,我們收集了38個(gè)建設(shè)較完善且具有代表性的方言有聲語料庫信息,其中地方類、綜合類、藝術(shù)類語料庫分別占比47%、34%、19%。在18個(gè)地方類語料庫中,8個(gè)涉及粵方言,5個(gè)涉及吳方言,這也是總體方言有聲語料庫中語料資源最豐富的兩類方言。
基于調(diào)查試驗(yàn),我們認(rèn)為現(xiàn)階段方言有聲語料庫存在以下四個(gè)問題:
1.方言錄入形式單一
許多語料庫基本上都是對(duì)于方言單字、詞匯的方言發(fā)音的保存,收錄方式上多采用文字、注音、錄音音頻結(jié)合的形式,如“潮州音”、“潮州·母語”、“粵語發(fā)音在線學(xué)習(xí)網(wǎng)”等。
這較之前僅有文本資源的語料庫而言有了較大進(jìn)步,但形式上仍較為單一,應(yīng)當(dāng)增加方言資源錄入形式,豐富方言的保存途徑,使方言資源更加真實(shí)化、多樣化。如“粵語學(xué)習(xí)網(wǎng)”、中國語言資源保護(hù)工程采錄展示平臺(tái)等語料庫,增加了類型多樣的視頻資源,或是展示方言發(fā)音的嘴型變化,或是介紹方言所屬地的風(fēng)俗人情,引導(dǎo)網(wǎng)友深入了解方言背后的人文故事。
2.收錄詞匯不完整
對(duì)于用戶學(xué)習(xí)方言和應(yīng)用方言的需求而言,語料庫收錄的內(nèi)容是根基,是學(xué)習(xí)應(yīng)用的直接來源。在運(yùn)用語料庫的過程中,我們發(fā)現(xiàn)語料庫錄入的方言詞匯數(shù)量較少,現(xiàn)存的方言語料庫錄入的大多是一些比較典型、有代表性的方言單字、詞匯,收錄內(nèi)容有限。如“潮州音”只收錄了單字的解釋和發(fā)音,“潮州·母語”則是將搜索的詞組拆成單字提供解釋和發(fā)音,對(duì)于想要了解方言文化的使用者并不能起到良好的解釋作用,也破壞了方言詞匯本身所攜帶的文化內(nèi)涵;“粵語發(fā)音詞典”雖然對(duì)于常用語言做出分類,方便使用者按照日常用語和習(xí)慣分類進(jìn)行高效篩選和學(xué)習(xí),但是大多分類下的方言詞匯較少,且相關(guān)詞匯下的短語釋義不夠完善,存在詞組例句只出現(xiàn)詞組中單個(gè)字的釋義的情況,影響用戶學(xué)習(xí)效果。
除此之外,大多數(shù)方言有聲語料庫缺乏體現(xiàn)當(dāng)?shù)靥厣幕畹膬?nèi)容,只收錄了一些廣泛使用的方言資源,像“方言庫-江蘇省方志館”雖收錄了江蘇省大量地區(qū)的方言資源,但各個(gè)地區(qū)僅收錄了少數(shù)詞組的發(fā)音(如太陽、月亮、星星等),而許多當(dāng)?shù)靥厣脑~匯、短句未被收錄,使用者不能夠通過搜索的形式找到自己感興趣的方言資源,方言收錄碎片化,方言語料庫無法形成系統(tǒng)、有效的整體。
3.網(wǎng)站運(yùn)行維護(hù)困難
多數(shù)方言語料庫缺少專業(yè)人員維護(hù),常出現(xiàn)系統(tǒng)相斥、網(wǎng)頁崩潰、鏈接失效等問題。如“粵語發(fā)音詞典”為用戶提供了MP3、視頻教程以及推薦教材書目,但很多功能需要從美國網(wǎng)站安裝相關(guān)軟件,這與國內(nèi)大多數(shù)網(wǎng)站、軟件相排斥,使得用戶不得不放棄該網(wǎng)站,阻礙學(xué)習(xí)積極性。
還有不少語料庫缺乏有效的用戶反饋途徑,導(dǎo)致語料庫中漏洞百出,無法向使用者提供良好的使用體驗(yàn),極不利于方言語料庫的進(jìn)步和發(fā)展。如“廣州話口語”,雖收錄了約31萬字語料,提供的方言錄音多是從綜藝節(jié)目、電視劇等中截取,錄音資源真實(shí)化、生活化、趣味化,但缺少在線留言的途徑,運(yùn)行人員無法了解到用戶存在的需求和網(wǎng)站收錄語料的漏洞;有些網(wǎng)站雖有平臺(tái)留言、用戶交互交流渠道,但是用戶缺乏反饋與交互意識(shí)。如“吳語詞典”中設(shè)置了用戶相互交流的路徑和官方反饋郵箱,但大多數(shù)用戶遇到困難還是不知道在何處或者不懂得如何反饋,只是簡(jiǎn)單粗暴地選擇更換其他有聲方言語料庫。
另外,語料庫的維護(hù)成本昂貴。多數(shù)方言有聲語料庫為非盈利性質(zhì),為了正常運(yùn)行下去,有些語料庫在網(wǎng)頁鋪設(shè)了大量廣告,這可能會(huì)讓瀏覽語料庫的網(wǎng)友產(chǎn)生抵觸心理,不利于語料庫的長(zhǎng)期發(fā)展。類似“四川方言庫”這種個(gè)人因興趣而研究建立起的語料庫甚至因種種原因被暫停。
4.語料庫推廣度較低
在試驗(yàn)現(xiàn)存方言語料庫的過程中,對(duì)方言語料庫的有效尋找是最大的難題。大多數(shù)方言語料庫推廣度低,對(duì)方言有了解興趣的網(wǎng)友很難直接找到有豐富資源和滿足需要的方言語料庫。現(xiàn)存的較為官方的一些方言語料庫,如我國教育部、國家語委聯(lián)辦的中國語言資源采錄展示平臺(tái),由于開放權(quán)限限制,許多資源不能面向大眾開放。
大多數(shù)語料庫盡管已經(jīng)建設(shè)得較為完備,但因?yàn)橥茝V力度缺乏、瀏覽人數(shù)較少,已經(jīng)長(zhǎng)時(shí)間沒有更新內(nèi)容,這對(duì)于方言愛好者和方言的保存與傳承都是阻礙。“黃梅戲在線”是一個(gè)大型戲曲類語音分享學(xué)習(xí)平臺(tái),具有該方言的語料學(xué)習(xí)、視頻學(xué)習(xí)、新聞更新和用戶上傳自己作品等功能,但受制于推廣不夠和用戶使用缺乏等問題,該平臺(tái)現(xiàn)在處于停滯狀態(tài),新聞沒有及時(shí)更新,相關(guān)視頻學(xué)習(xí)資料有空白頁面、權(quán)限設(shè)置、空有標(biāo)題而無實(shí)質(zhì)內(nèi)容等問題。
方言的傳承與保護(hù)需要一定流量的推廣者,在一定量使用者的使用分析反饋中語料庫才能進(jìn)一步發(fā)展,在推廣度的加強(qiáng)中開發(fā)者才能更好及時(shí)有效豐富語料庫內(nèi)容,做到全面控制與發(fā)展。
四、建議與對(duì)策
方言保護(hù)問題,關(guān)系到中國傳統(tǒng)文化的繼承與發(fā)展,而有聲語料庫則是方言保護(hù)中比較重要的一筆。針對(duì)方言有聲語料庫存在的問題,提出以下改進(jìn)建議:
1.注意豐富方言收錄內(nèi)容,可利用互聯(lián)網(wǎng)互動(dòng)性傳播的特點(diǎn),鼓勵(lì)用戶通過在線平臺(tái)優(yōu)化語料庫。
參考吳語語料庫中的“吳語小詞典”。該網(wǎng)站的設(shè)計(jì)者思考十分全面,相比其他網(wǎng)站它還囊括了“吳語協(xié)會(huì)論壇”板塊,該版塊聚集了大量熱愛吳語、獻(xiàn)力保護(hù)吳語文化的網(wǎng)友,他們能在論壇中分享資源、交流討論;還專門設(shè)有“報(bào)錯(cuò)”板塊,用戶可以在該板塊下發(fā)帖,反應(yīng)該網(wǎng)站的錯(cuò)誤或補(bǔ)充建議,這是值得大部分網(wǎng)站學(xué)習(xí)借鑒的。再比如,“潮州音”、“潮州·母語”網(wǎng)站,用戶可以通過在線留言聯(lián)系到管理員為其在網(wǎng)站操作等基礎(chǔ)問題上答疑解惑,其中“潮州音”還向用戶開放了“我來錄音”功能,讓網(wǎng)友來提供更本土化的方言錄音。
只有高度重視用戶交互的重要性,紛繁復(fù)雜的方言語料庫才不會(huì)成為一座座零星的“孤島”。
2.注意方言語料資源趣味化,建議以生活對(duì)話、地方經(jīng)典文化片段為主。
調(diào)查發(fā)現(xiàn),使用者放棄使用語料庫或者對(duì)語料庫興趣不大的原因往往是大多數(shù)的語料庫學(xué)術(shù)性、專業(yè)性過強(qiáng)。相反,類似“梨園”、“京劇藝術(shù)網(wǎng)”這類的藝術(shù)趣味性很強(qiáng)的網(wǎng)站則更吸引普通用戶。在調(diào)查考證的支撐下,我們建議目的在于推向大眾的語料庫網(wǎng)站不要局限于簡(jiǎn)單字詞的查詢,要注意收錄方言語料資源的趣味化,甚至可以以生活對(duì)話、地方經(jīng)典文化片段(如戲曲)為主。這點(diǎn)可以參考“粵語發(fā)音學(xué)習(xí)網(wǎng)”,該網(wǎng)站在查詢字詞時(shí)增添了與之相關(guān)的影視中的語句,大大提高了網(wǎng)站的趣味性。
3.注意收錄方式多元化、系統(tǒng)化。
在實(shí)操和體驗(yàn)過程中,我們發(fā)現(xiàn)比較完善的語料庫網(wǎng)站大多是文字、音標(biāo)注音和音頻范讀三位一體的結(jié)構(gòu),而類似戲曲藝術(shù)類的網(wǎng)站往往是以視頻為主。那普通字詞查詢的工具類網(wǎng)站是否也可以結(jié)合相關(guān)視頻呢?比如視頻可以對(duì)該方言中所查詢字詞的歷史和語境應(yīng)用進(jìn)行一個(gè)系統(tǒng)的介紹,方便用戶理解。所以我們認(rèn)為,更為有效的收錄方式是將文字、注音、音頻、視頻一體化,提升語料收錄的質(zhì)量。
這并不是一個(gè)不簡(jiǎn)單的工程,但我們可以借助廣大熱心方言研究者和原住地使用居民的力量來共同完成這一工程。
4.注意信息碎片化問題,注重語料庫的開放共享。
方言語音是復(fù)雜多變的,不能簡(jiǎn)單地一以概之,有時(shí)同一方言區(qū)的不同村落間往往都存在較大的語音差異,所以在構(gòu)建方言有聲語料庫時(shí)應(yīng)當(dāng)注重信息的共享性和開放性,不拘泥于個(gè)別字詞但也能較為客觀全面地展現(xiàn)出該方言的全貌。如“吳語學(xué)堂”,其字音搜索功能考慮得非常專業(yè)且周到——考慮到不同吳語地區(qū)讀法有所不同,獨(dú)創(chuàng)性地設(shè)置了一個(gè)地圖讀音搜索的選項(xiàng),點(diǎn)擊“多地聯(lián)合查詢”,可以同時(shí)對(duì)比不同地區(qū)的讀音。
除了上例網(wǎng)站內(nèi)部網(wǎng)狀式搜索結(jié)構(gòu)的優(yōu)化,還可以與其他網(wǎng)站相互建立友情鏈接,采用頻道聚合形式,避免信息繭房影響方言語料的精確學(xué)習(xí)與傳播,從而更好適應(yīng)互聯(lián)網(wǎng)多樣性、互動(dòng)性、海量性、開放性的特點(diǎn),充分發(fā)揮出互聯(lián)網(wǎng)帶來的新的發(fā)展機(jī)遇。如兩個(gè)美國留學(xué)生司圓直和柯祎藍(lán)曾于2013年制作過一個(gè)名為“鄉(xiāng)音苑”的中國方言網(wǎng)站。各地的用戶可以用家鄉(xiāng)的方言說故事并上傳至網(wǎng)站,每一段上傳的音頻都會(huì)在地圖相應(yīng)的位置被標(biāo)出,形成由錄音組成的語言地圖,五顏六色的標(biāo)簽直觀地展示了這片土地上語言的豐富性。
對(duì)方言的有效保護(hù)與傳承可以讓文化傳承開出新花。在互聯(lián)網(wǎng)背景下,方言煥發(fā)了新的生機(jī)活力,但同時(shí),許多方言的意思在某種程度上被扭曲、破壞,網(wǎng)絡(luò)傳播的一知半解使其喪失了本來的意義。方言不應(yīng)當(dāng)是網(wǎng)絡(luò)土味、無厘頭無營養(yǎng)新詞的滋生土壤。我們研究方言有聲語料庫正是為了從源頭上實(shí)現(xiàn)對(duì)方言的保護(hù)與傳承,尋找方言文化的延續(xù)性,探訪歷史地理留給我們的根脈相傳的文化符碼和精神財(cái)富,用方言的魅力建立文化自信!
參考文獻(xiàn)
[1]陳琳.《紅樓夢(mèng)》江淮方言的異化翻譯——以霍克思譯本為例[J].淮南師范學(xué)院學(xué)報(bào),2020,22(05):48-53
[2]余旭文.基于深度學(xué)習(xí)的海南方言語音識(shí)別[D].海南大學(xué)碩士學(xué)位論文,2020
[3]甘瑩.語料庫視域下的天津方言建檔[J].山西檔案,2017(06):87-89
[4]鄒曉燕,韓琨.語言生態(tài)學(xué)視野下方言語料庫建設(shè)的路徑、實(shí)現(xiàn)與應(yīng)用——以贛方言為例[J].地方文化研究,2018(04):40-45
作者簡(jiǎn)介:
翟力嬌(2001-),女,漢族,江蘇常州人,南京審計(jì)大學(xué)本科在讀,漢語言文學(xué)專業(yè)