趙聰 胡博
摘 要全球化背景下外國游客在國內(nèi)旅游景區(qū)存在的語言障礙問題,本文擬基于Speech Kit、Text-to-Speech等語音翻譯平臺,研發(fā)黑龍江景區(qū)俄語、日語、朝鮮語智能語音講解系統(tǒng),以期方便外國游客赴龍江旅游,為其旅行帶來語言便利,旨在體現(xiàn)黑龍江省旅游服務(wù)產(chǎn)業(yè)的完善與健全,提升黑龍江省旅游形象。
關(guān)鍵詞 講解系統(tǒng), 語音合成,黑龍江旅游
旅游業(yè)和展覽業(yè)已經(jīng)成為一個我國新的經(jīng)濟(jì)增長點,然而,在游覽過程中,游客參觀只是低層次的感官性參觀和被動式參觀。[1]2020年8月黑龍江省人民政府正式發(fā)布《黑龍江省全域旅游發(fā)展總體規(guī)劃(2020—2030年)》。規(guī)劃指出“黑龍江省旅游資源底蘊優(yōu)勢明顯,但制約旅游業(yè)發(fā)展的瓶頸問題依然突出”,其中,標(biāo)識系統(tǒng)、游客咨詢、智慧旅游等旅游服務(wù)功能不健全為亟待解決的問題之一。在旅游市場需求的拉動以及先進(jìn)科學(xué)技術(shù)的推動下,旅游業(yè)發(fā)展呈現(xiàn)出許多新型業(yè)態(tài),即各種不同形式的旅游融合類型。[2]越來越多的游客傾向于個性化自助旅游,并且對游覽過程中的信息咨詢、交通指引和安全保障等公共服務(wù)需求日益增加。[3]本文研發(fā)的掃碼語音講解系統(tǒng)服務(wù)于黑龍江省對外旅游需求,為俄羅斯、日本、韓國、朝鮮等國游客提供景區(qū)智慧語音講解服務(wù)。本次多語種智能語音講解系統(tǒng)是研發(fā)依托語音識別技術(shù),經(jīng)過Yandex平臺Speech Kit、Google平臺Text-to-Speech等在線語音識別技術(shù)的運用,完成黑龍江景區(qū)多語種文字介紹到智能語音的合成,并借助“在線二維碼生成器”等軟件將語音轉(zhuǎn)換為二維碼。此系統(tǒng)可為外國游客消除境外游語言障礙,提升旅游質(zhì)量,有望提升入境游客人數(shù),有助于方便外國游客赴龍江旅游,為其旅行帶來便利,促進(jìn)我省旅游業(yè)發(fā)展。
多語種智能語音講解系統(tǒng)通過掃描二維碼的方式向游客傳遞文化旅游信息,無需耗費較大的人力物力和財力,更加低碳環(huán)保符合我國對環(huán)境與發(fā)展的政策。語音講解系統(tǒng)可統(tǒng)計瀏覽量等數(shù)據(jù),進(jìn)行大數(shù)據(jù)對接,有利于景區(qū)后期運營調(diào)整。同時,也減少了景區(qū)維護(hù)時間和成本,對景區(qū)的品牌宣傳和推廣起到一定的推動作用?;诙嗾Z種智能語音講解系統(tǒng),通過非接觸式語音操控方式,具有便利性、實用性和人性化的特點,存在廣闊的應(yīng)用價值。在該系統(tǒng)中具備景區(qū)地圖,避免景區(qū)規(guī)模過大導(dǎo)致游客迷路,能為游客快速提供信息位置,有助于節(jié)省游客在線路上花費的時間。在地圖上可將景區(qū)經(jīng)典景點,特色景點表現(xiàn)出來。
1智能語音講解系統(tǒng)設(shè)計
1.1智能語音講解系統(tǒng)工程框架建立設(shè)計
工程框架建立初期,我們確立了以文本分析、韻律生成與合成語音為組成部分的工程框架?;诖丝蚣?, 我們在文本輸入處輸入搜集、翻譯、校對好的外語文本,文本信息首先由文本輸入模塊讀入;接著文本分析模塊即文本的預(yù)處理模塊,主要完成自動分詞、語句處理、特殊符號的轉(zhuǎn)換、文本的切分等,然后將處理好的數(shù)據(jù)送入韻律生成模塊和合成語音模塊;韻律生成模塊根據(jù)各項合成規(guī)則規(guī)劃出目標(biāo)音高、音長、音強、停頓及語調(diào)等,將規(guī)劃的結(jié)果參數(shù)送入合成語音模塊;合成語音模塊利用合成算法合成出滿足目標(biāo)要求的音節(jié)波形數(shù)據(jù),將其拼接成語音流數(shù)據(jù)送入語音輸出模塊,最后由語音輸出模塊輸出語音并合成文件。
1.2智能語音講解系統(tǒng)研究思路
基于語音合成技術(shù)的智能講解系統(tǒng)作為智慧旅游景區(qū)的主項內(nèi)容,它需要具備語音識別和控制操作功能。本文的智能講解系統(tǒng)結(jié)構(gòu)的總體框圖 (圖1).主要由文本分析模塊、聲學(xué)參數(shù)生成模塊和二維碼生成器模塊四部分組成。
當(dāng)工作進(jìn)行時,翻譯人員在語音合成技術(shù)平臺輸入文本內(nèi)容,平臺通過聲學(xué)參數(shù)生成系統(tǒng)將文本內(nèi)容轉(zhuǎn)換為所需語言的語音包(如圖2)。最后以計算機圖像處理技術(shù)和在線二維碼生成器將語音包轉(zhuǎn)換為二維碼。
1.3智能語音講解系統(tǒng)內(nèi)容設(shè)計
文本分析模塊是本系統(tǒng)的核心模塊,本文采用由俄羅斯最大的搜索引擎及IT公司揚德克斯(Yandex)研發(fā)的Speech Kit以及Google集團(tuán)研發(fā)的 Text-to-Speech進(jìn)行語音識別。首先選取黑龍江省知名旅游資源,搜集關(guān)于旅游資源的信息。待收集整理信息之后將信息內(nèi)容輸入到文本框,平臺通過韻律預(yù)測和韻律模型技術(shù)進(jìn)行生成聲學(xué)參數(shù),時長預(yù)測以及播放內(nèi)容類型的自主選擇。技術(shù)人員借助二維碼生成器軟件將合成的語音轉(zhuǎn)換為二維碼。通過掃描二維碼生成為俄語,日語和朝語的靈活切換講解。
2智能語音講解系統(tǒng)的實現(xiàn)與測試
2.1系統(tǒng)功能的實現(xiàn)
團(tuán)隊選取以中央大街為中心的周邊最受外國游客歡迎的旅游目的地,其中包括馬迭爾冷飲廳、圣·索菲亞大教堂、華梅西餐廳、塔道斯西餐廳以及防洪紀(jì)念塔等。通過查閱相關(guān)書籍和利用網(wǎng)絡(luò)資源,搜集梳景點的簡介,確認(rèn)介紹內(nèi)容后將收集來的中文資料翻譯為俄語、日語和朝鮮語,然后進(jìn)行校對,確保翻譯好的外語資料信息準(zhǔn)確無誤、表達(dá)準(zhǔn)確、用詞得當(dāng)。最后借助Speech Kit和Text-to-Speech平臺生成所需語音,采用二維碼生成器軟件生成二維碼。最后將二維碼放置到相應(yīng)的景區(qū),作為國內(nèi)外旅客對景區(qū)了解的參考。當(dāng)游客通過手機掃描二維碼,首先出現(xiàn)俄語、日語和朝語的語音選擇,選擇完畢后會出現(xiàn)文字介紹,圖片展品和語音講解。掃碼語音講解系統(tǒng)原料簡單,打印方便,不會產(chǎn)生污染環(huán)境的現(xiàn)象。景區(qū)也無需花錢聘請導(dǎo)游指導(dǎo),解決了淡旺季景區(qū)內(nèi)部導(dǎo)游人數(shù)配置不平衡和導(dǎo)游水平參差不齊的問題,也避免了景區(qū)導(dǎo)游的吵鬧喧嘩,有利于提高游客的舒適度。
2.2系統(tǒng)功能的測試
在信息化數(shù)字化的時代背景下,相較于傳統(tǒng)的導(dǎo)游解說,掃碼導(dǎo)覽更加符合智能景區(qū)的建設(shè)趨勢。智能語音講解系統(tǒng)操作簡單,景區(qū)只需在展品旁貼上對應(yīng)二維碼。如若更換展品內(nèi)容,則只需通過語音講解系統(tǒng)智能合成新語音并打印二維碼即可。這有效避免了導(dǎo)游,宣傳講解單,自主講解器等花費成本。景區(qū)可把節(jié)省下的資源用于完善智慧景區(qū),提高自身知名度。通過智能語音講解系統(tǒng)生成的二維碼有利于游客的分享推廣。游客可以進(jìn)行自主導(dǎo)覽和回顧查看,可以加深游客記憶,同時游客可將手機上展覽信息分享到社交平臺,以達(dá)到幫助游客引流和宣傳的目的。通過實施掃碼語音講解系統(tǒng)有助于對接大數(shù)據(jù)。并且進(jìn)行大數(shù)據(jù)對接的同時減少了維護(hù)時間和成本,對景區(qū)的品牌宣傳和推廣起到一定的推動作用。它可以統(tǒng)計展品的瀏覽量等數(shù)據(jù),通過分析瀏覽量及時對展品進(jìn)行調(diào)整。
由于二維碼導(dǎo)覽需要手機聯(lián)網(wǎng)才可向游客展示文字,圖片和語音講解。在實際應(yīng)用中發(fā)現(xiàn)如下問題:1.搜查景點資料需要花費大量時間查閱眾多書籍來豐富景點內(nèi)涵。2.有些外國游客來到景區(qū)后由于手機的問題網(wǎng)絡(luò)無響應(yīng)或者景區(qū)游客較多,網(wǎng)絡(luò)超負(fù)荷導(dǎo)致用戶網(wǎng)絡(luò)不穩(wěn)定。這會對游客造成不佳的旅游體驗。為此我們采取如下方法;團(tuán)隊的翻譯人員努力提高搜尋景點資料效率,并重在總結(jié)景區(qū)精彩部分,使游客加深對景區(qū)的了解并致力于打造數(shù)字景區(qū)。為提高二維碼導(dǎo)覽效果和游客的旅游體驗感,景區(qū)可采用大機量的網(wǎng)關(guān)實現(xiàn)WIFI全面覆蓋,在高峰期游客流量大時,保證所有游客能順暢使用WIFI。同時應(yīng)在景區(qū)范圍內(nèi)統(tǒng)一WIFI名稱,以此便于景區(qū)進(jìn)行二維碼導(dǎo)覽講解及宣傳。二維碼導(dǎo)覽講解的流暢應(yīng)用可提高游客的體驗舒適度,WIFI全面覆蓋也會提高游客的評價滿意度,促進(jìn)加快打造智慧景區(qū)以及二維碼導(dǎo)覽講解的應(yīng)用推廣。促進(jìn)景區(qū)依托科學(xué)技術(shù)實施二維碼導(dǎo)覽系統(tǒng)來成為實現(xiàn)人與自然和諧發(fā)展的低碳智能運營景區(qū)。
3.討論
當(dāng)前智能語音講解系統(tǒng)發(fā)展的突飛猛進(jìn),智能語音講解系統(tǒng)與景區(qū)場景的結(jié)合應(yīng)用在促進(jìn)實現(xiàn)智慧景區(qū)等方面表現(xiàn)出巨大的潛力。但是該系統(tǒng)的應(yīng)用大多集中在景區(qū)或者博物館講解等方面,當(dāng)前應(yīng)用的范圍比較狹小。除此之外還可嘗試應(yīng)用在商場的產(chǎn)品介紹,有助于節(jié)省成本并減少人力資源。在當(dāng)前黑龍江省內(nèi)景區(qū)采用二維碼導(dǎo)覽講解系統(tǒng)并不多見,根據(jù)采用二維碼導(dǎo)覽系統(tǒng)的景區(qū)反饋,表示智能語音講解系統(tǒng)在提升游客體驗服務(wù),擴(kuò)展有客流量和提高景區(qū)資源轉(zhuǎn)化率等方面取得了不錯的效果。因此該系統(tǒng)的推廣應(yīng)用有助于打造智慧景區(qū)并給游客提供良好的游客體驗。本文根據(jù)當(dāng)前瀏覽景區(qū)游客的實際需求,創(chuàng)新性的將智能語音講解系統(tǒng)應(yīng)用于景區(qū)方面,并解決了景區(qū)采用智能語音講解系統(tǒng)所遇到的問題,使二維碼導(dǎo)覽系統(tǒng)應(yīng)用于景區(qū)所發(fā)揮出最佳的效益。在景區(qū)測試及應(yīng)用智能語音講解系統(tǒng)也表明二維碼導(dǎo)覽系統(tǒng)講解應(yīng)用于景區(qū)等方面是可行的,本系統(tǒng)在努力打造省內(nèi)智慧景區(qū)有積極意義,能夠一定程度上使景區(qū)掌握智慧旅游所需的智能講解系統(tǒng),大數(shù)據(jù)等核心科技以及共享網(wǎng)絡(luò)的全覆蓋并提高游客的用戶體驗度。同時智慧景區(qū)自身也得到了一定的推廣。旅游行業(yè)的轉(zhuǎn)型升級,有助于促進(jìn)景區(qū)數(shù)字化、智能化發(fā)展。游客對智能語音講解系統(tǒng)的運用,讓游客體驗更加豐富和完善的同時,打通用戶和景區(qū)之間的情感鏈接,增強用戶和景區(qū)之間的粘性。
眼下,隨著社會的不斷發(fā)展,國內(nèi)景區(qū)百花齊放,客戶對景區(qū)導(dǎo)覽系統(tǒng)設(shè)計提出的要求越來越高。正因為此現(xiàn)象的產(chǎn)生,有不少不良景區(qū)出于經(jīng)濟(jì)效益通過媒體互聯(lián)網(wǎng)不斷宣傳自身優(yōu)點導(dǎo)致不少國內(nèi)外游客盲目跟風(fēng),景區(qū)觀感并不強烈。好的景區(qū)并不僅僅在于宣傳,其自身更致力于打造智慧景區(qū),通過運用智能語音講解系統(tǒng)來提高自身競爭力。同時語言的多樣化選擇以及在景區(qū)導(dǎo)視系統(tǒng)設(shè)計中,采用的文字符號色彩材料比重等。景區(qū)的內(nèi)部結(jié)構(gòu)應(yīng)該對智能語音講解系統(tǒng)進(jìn)行合理的布局。在掃描二維碼之后出現(xiàn)的選擇語言界面和文字介紹可利用字體的感覺,大小等不同的組合來為游客營造出不同的效果。展示景點的圖片可以融入該景點的歷史底蘊和文化元素并選擇該景點著名景點雕像和藝術(shù)作品等。使景區(qū)的藝術(shù)氛圍更加的凝練,給游客創(chuàng)造出更好的游覽范圍。通過智能語音導(dǎo)覽系統(tǒng)上的圖片展示,有助于體現(xiàn)該景點歷史文化內(nèi)涵并傳遞文化信息,有助于促進(jìn)景區(qū)文化特色提升并為游客增強信息的沖擊力,并提升游客的認(rèn)知速度。簡單直接的語音講解可將景點的介紹總結(jié)出更精煉的語言,并結(jié)合該語言本國的日常用語,有助于加深外國游客對該景點的了解。同時結(jié)合語音本國的日常用語提高了團(tuán)隊翻譯人員搜集資料的難度,有助于翻譯人員翻譯水平的提升。與傳統(tǒng)景區(qū)導(dǎo)游不同,智能語音講解系統(tǒng)沒有人工導(dǎo)游,游客可根據(jù)自己的需求來選擇性收聽,講解配備精彩的圖片和文字,能給游客更生動詳細(xì)的介紹體驗,同時也避免了傳統(tǒng)導(dǎo)游擴(kuò)音器帶來的噪音,有助于改善游客體驗。
本文針對當(dāng)前景區(qū)以及游客所遇到的一些問題,提出并完善了基于語音合成技術(shù)的多語種智能語音講解系統(tǒng)的應(yīng)用。通過該系統(tǒng)的文字和圖片的介紹以及語音講解游客可以方便的獲得所觀看展品的信息,使游客的用戶體驗度達(dá)到最佳。同時相較于傳統(tǒng)景區(qū)枯燥的講解方式,智慧景區(qū)運用智能語音講解系統(tǒng)的勢頭越來越猛,游客對品質(zhì)游的追求水平提高。智能語音講解系統(tǒng)深度聚合人工智能,移動互聯(lián)網(wǎng)等技術(shù),讓游客通過手機即可獲取一對一的深度導(dǎo)覽服務(wù),滿足游客景區(qū)信息查找需求,充分體現(xiàn)了景區(qū)以游客為本。應(yīng)用該系統(tǒng)不僅能夠有效節(jié)約景區(qū)維護(hù)時間和成本,特別是對于中文不好的外國游客有更大的應(yīng)用價值。本文對智能語音講解系統(tǒng)中應(yīng)用進(jìn)行了初步研究,并驗證了該系統(tǒng)的可行性。同時也解決了對于應(yīng)用測試中出現(xiàn)的不足方面;景區(qū)可盡力采用大機量實現(xiàn)WIFI的全覆蓋,以便發(fā)揮出智能語音講解系統(tǒng)的最佳效果,完善我國景區(qū)服務(wù)產(chǎn)業(yè)。并提升景區(qū)的服務(wù)質(zhì)量并提高了有用戶的體驗度。
參考文獻(xiàn)
[1]王忠凱,盧選民,林茂寬,石韞玉.一種基于RFID的感應(yīng)式智能語音講解系統(tǒng)[J].計算機應(yīng)用與軟件,2012,29(06):242-243+270.
[2]麻學(xué)鋒,張世兵,龍茂興.旅游產(chǎn)業(yè)融合路徑分析[J].經(jīng)濟(jì)地理,2010,30(04):678-681.DOI:10.15957/j.cnki.jjdl.2010.04.028.
[3]張文元,談國新,孫傳明.一種景區(qū)智能導(dǎo)游系統(tǒng)的設(shè)計與實現(xiàn)[J].測繪地理信息,2018,43(05):79-84.DOI:10.14188/j.2095-6045.2017151.
本文是黑龍江省大學(xué)生創(chuàng)新創(chuàng)業(yè)項目《基于語音合成技術(shù)的“大美龍江任我行”多語種智能語音講解系統(tǒng)的設(shè)計與應(yīng)用》(s202110214025)階段性成果