鄧爽 姜軍 楊鳳志 沈家輝 王崇德
摘 要:隨著西藏旅游業(yè)和現(xiàn)代化的迅猛發(fā)展,越來越多的游客和求學(xué)者奔赴西藏,學(xué)習(xí)藏語,探索藏文化,便捷化的語音練習(xí)扮演著重要的角色。尤其,現(xiàn)在互聯(lián)網(wǎng)Android技術(shù)已經(jīng)相當(dāng)成熟,我們根據(jù)它的平臺(tái)特點(diǎn),為藏語口語練習(xí)項(xiàng)目提供了一套切實(shí)可行的方案,目的在于實(shí)現(xiàn)藏語發(fā)音練習(xí)系統(tǒng)的智能化、便利化和時(shí)尚化,最重要的是,能為喜愛藏語的大學(xué)生們提供學(xué)習(xí)藏語和攻克藏語一級(jí)的機(jī)會(huì)。
關(guān)鍵詞:藏語發(fā)音練習(xí) Android 移動(dòng)學(xué)習(xí)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1003-9082(2018)08-000-02
一、研究背景及現(xiàn)狀
隨著西藏旅游業(yè)和現(xiàn)代化的迅猛發(fā)展,越來越多的內(nèi)地學(xué)子趕赴西藏求學(xué),探索西藏文化;所以,藏語就是溝通這之間的橋梁;我們的目的就是通過便攜、普遍的移動(dòng)Android設(shè)備減輕大學(xué)生學(xué)習(xí)藏語的困難,使內(nèi)地同學(xué)能盡快的掌握藏語一級(jí),說出純正的藏語。
目前已存在很多類似的軟件系統(tǒng),例如有道藏語(豪華版)、掌中藏語等等,技術(shù)已經(jīng)相當(dāng)?shù)某墒?,但是專門針對(duì)大學(xué)生藏文一級(jí)和提升模塊的Android版藏語讀音校園應(yīng)用軟件并沒有出現(xiàn)。所以,我們?cè)O(shè)計(jì)了校園應(yīng)用藏語讀音練習(xí)軟件。
二、功能模塊的介紹與設(shè)計(jì)
1.Android平臺(tái)
Android平臺(tái)[1]是目前應(yīng)用最廣泛的開放源代碼操作系統(tǒng)之一,它的出現(xiàn)為移動(dòng)互聯(lián)網(wǎng)的蓬勃發(fā)展提供了有力的技術(shù)和環(huán)境支持。它最開始是被AndyRubin研發(fā)出的,為了應(yīng)用于手機(jī)等移動(dòng)設(shè)備;后來,被實(shí)力雄厚的Google公司收購(gòu)注資。漸漸地,Android平臺(tái)開始蔓延到其他各個(gè)領(lǐng)域,比如說平板電腦,游戲機(jī),電視等等。
Android系統(tǒng)如今占很大的市場(chǎng)份額的大部分原因是因?yàn)樗夹g(shù)的優(yōu)越性,用Linux開發(fā),包括應(yīng)用程序?qū)印?yīng)用程序框架層、系統(tǒng)運(yùn)行庫(kù)層和Linux內(nèi)核層,所有的程序都采用JAVA語言來編寫。
2.Eclipse
該系統(tǒng)我們選擇的開發(fā)環(huán)境是Eclipse[2]。Eclipse是一個(gè)開放源代碼,它的優(yōu)勢(shì)在于擁有Java開發(fā)工具(也叫JDK),而且自身還附帶了其他一些標(biāo)準(zhǔn)插件集;它的擴(kuò)展能力較強(qiáng),比其他的開發(fā)平臺(tái)來說更具靈活性。Eclipse的結(jié)構(gòu)體系不太復(fù)雜,是服務(wù)和框架體系,用途在于可經(jīng)過多數(shù)插件構(gòu)建開發(fā)環(huán)境。
3.語音信號(hào)的相關(guān)處理
在整個(gè)模塊中,對(duì)語音信號(hào)的處理尤為重要。氣流激勵(lì)聲道同時(shí)產(chǎn)生了語音信號(hào),也就是聲帶的運(yùn)動(dòng)產(chǎn)生了語音信號(hào),我們?cè)谶M(jìn)行預(yù)處理[3]時(shí),要從以下幾個(gè)方面進(jìn)行。
數(shù)字化處理[4]主要是用計(jì)算機(jī)將信號(hào)進(jìn)行分析和處理,變?yōu)殡x散的數(shù)字信號(hào)。該項(xiàng)目我們使用的Android系統(tǒng)移動(dòng)手機(jī)自帶的有語音信號(hào)輸入裝置和音頻處理芯片,能夠?qū)φZ音信號(hào)進(jìn)行相關(guān)采樣量化等一系列處理。該項(xiàng)目選擇了16位量化位數(shù)。
預(yù)加重處理主要是解決在實(shí)際應(yīng)用中語音信號(hào)由于受到聲門和周圍輻射的影響,在高頻部分發(fā)生衰減的問題。經(jīng)過預(yù)加重處理,可以增強(qiáng)高頻區(qū)域的信號(hào),使頻譜變得平坦,方便我們對(duì)參數(shù)進(jìn)行分析。這是預(yù)加重的傳遞函數(shù)和加重后的信號(hào)S2(n):
a表示預(yù)加重系數(shù),其值約為1,該項(xiàng)目取0.98。
分幀加窗處理,分幀指的是將信號(hào)分成許多小段,每一段稱為一幀,在局部,每幀可以看作平穩(wěn)的信號(hào),利于分析處理;加窗是將不連續(xù)信號(hào)變得連續(xù),我們選用的是漢明窗函數(shù):
語音部分的處理還有一個(gè)很重要的方面,即特征參數(shù)的選取,在這里將識(shí)別性能和可靠性的問題放在首位考慮,我們選取MFCC[5]作為特征參數(shù)。
4.B/S構(gòu)架的Android端體系統(tǒng)結(jié)構(gòu)
整個(gè)結(jié)構(gòu)由表現(xiàn)層,功能服務(wù)層和數(shù)據(jù)訪問層構(gòu)成。表現(xiàn)層主要是用于用戶客戶端的連接;功能服務(wù)層分為“基礎(chǔ)”,“詞組”,“句子”三大模塊;數(shù)據(jù)訪問層是由文字和語音共同組成的材料庫(kù)搭建,材料庫(kù)使用SQLITE數(shù)據(jù)庫(kù)存儲(chǔ)。
三、軟件的分析與設(shè)計(jì)
1.I/O模塊設(shè)計(jì)
針對(duì)該項(xiàng)目而言,語音的I/O模塊設(shè)計(jì)[6]也就是語音的錄制和播放是關(guān)鍵部分,采用的Android移動(dòng)系統(tǒng)自帶的有耳麥,就我們這個(gè)項(xiàng)目的語音錄制和播放來說,能有很好的效果,所以,最終選擇了Android手機(jī)自帶的耳麥作為語音錄制和播放的裝置。經(jīng)過性能的對(duì)比,我們選用了AudioRecord類和AudioTrack類的方法分別對(duì)語音信號(hào)進(jìn)行錄制和播放。最終的系統(tǒng)音頻格式是:采樣聲道是單聲道,采樣位數(shù)為16位,采樣頻率是8000Hz。
2.軟件的體系結(jié)構(gòu)圖
這是整個(gè)軟件的體系結(jié)構(gòu)圖,進(jìn)入初始界面后,有三個(gè)選項(xiàng)卡,選擇“基礎(chǔ)”,“詞組”,“句子”任意鍵進(jìn)入學(xué)習(xí)。軟件的制作最開始要進(jìn)行文字和語音的搜集;接著梳理JAVA整體構(gòu)架;然后將文字信息與讀音信息編號(hào)對(duì)應(yīng)存入數(shù)據(jù)庫(kù)中;再基于B/S的客戶端進(jìn)行編寫;最后進(jìn)行軟件的測(cè)試,改進(jìn)等等。
3.用戶界面設(shè)計(jì)
點(diǎn)擊這款A(yù)PP,進(jìn)入藏語讀音校園應(yīng)用練習(xí)軟件,會(huì)顯示本款軟件的主界面,如圖2。在整個(gè)主界面上面,根據(jù)藏語練習(xí)的基本要求,我們一共設(shè)置了三欄顯示,分別是:“基礎(chǔ)”類、“詞組”類和“句子”類。
4.軟件實(shí)現(xiàn)
如圖3進(jìn)入的是基礎(chǔ)練習(xí)界面,分為元音和輔音界面,點(diǎn)擊播放鍵,聲音將自動(dòng)播放,我們可以跟讀練習(xí)并記憶藏語基礎(chǔ);點(diǎn)擊停止鍵,聲音停止。
圖4顯示的是藏文書每一課的詞組,為日常單詞,選擇需要學(xué)習(xí)的課程,點(diǎn)擊進(jìn)入,切換播放和停止鍵。
圖5是每一課的句子,在藏文考試中,關(guān)于句子的考察比分很重,這就要求我們熟練的掌握藏文書中的大部分日常用語;點(diǎn)擊進(jìn)入“句子”界面后,選擇相應(yīng)的部分練習(xí)。
該校園應(yīng)用藏語讀音練習(xí)軟件的集成開發(fā)環(huán)境為Eclipse,而且該系統(tǒng)在真機(jī)上調(diào)試運(yùn)行是相當(dāng)迅速的,整個(gè)系統(tǒng)的開發(fā)運(yùn)行環(huán)境為:
PC操作系統(tǒng):WindowsXP(32bit) 音頻輸入:抗噪聲麥克風(fēng)
平臺(tái)軟件環(huán)境:AndroidOS5.0 編程語言:Java
開發(fā)組件:JDK6;Eclipse3.6(Helios);AndroidSDK1.6
四、總結(jié)與展望
1.總結(jié)
本文系統(tǒng)平臺(tái)是Android智能類的手機(jī),工作難點(diǎn)在于對(duì)語音內(nèi)容的正確提取,還有特征參數(shù)的選取。根據(jù)此前對(duì)系統(tǒng)進(jìn)行的開發(fā),現(xiàn)在將大概的工作成果和研究?jī)?nèi)容作如下闡釋:
(1)主要分析了Android系統(tǒng)的一些基本結(jié)構(gòu)體系、特性、應(yīng)用程序原理和工作機(jī)制等等。為了確定該系統(tǒng)的優(yōu)越性和開發(fā)的可行性,我們對(duì)Android系統(tǒng)的特征經(jīng)過了十分激烈的分析討論。
(2)著眼系統(tǒng)特點(diǎn),對(duì)系統(tǒng)識(shí)別算法進(jìn)行了相關(guān)設(shè)計(jì);探究語音技術(shù)識(shí)別理論,為Android系統(tǒng)校園應(yīng)用藏語發(fā)音練習(xí)系統(tǒng)提供了一套可行的設(shè)計(jì)方案。
(3)我們?cè)谙到y(tǒng)設(shè)計(jì)方案的基礎(chǔ)之上,實(shí)現(xiàn)了系統(tǒng)相關(guān)算法及軟件交互界面,而且在android移動(dòng)端,Android4.0平臺(tái)上運(yùn)行實(shí)現(xiàn)。經(jīng)過多次測(cè)試,系統(tǒng)中的發(fā)音評(píng)價(jià)和發(fā)音糾正部分效果良好,預(yù)期的基本功能實(shí)現(xiàn)。
2.展望
為了提高系統(tǒng)的抗噪聲能力,還需要進(jìn)一步研究和改進(jìn)語音端點(diǎn)檢測(cè)算法。優(yōu)化相關(guān)算法,減少內(nèi)存占有量,提高系統(tǒng)運(yùn)行效率和反應(yīng)速度。完善優(yōu)化交互界面,增加發(fā)音元素的數(shù)量,增加系統(tǒng)的實(shí)用價(jià)值。
參考文獻(xiàn)
[1]王朔.基于Android平臺(tái)的智能英語發(fā)音訓(xùn)練系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].南京郵電大學(xué),2013.
[2]周宇,尹生強(qiáng),王冬青等.基于Eclipse和Android系統(tǒng)的App開發(fā)平臺(tái)搭建研究[J].青島大學(xué)學(xué)報(bào)(工程技術(shù)版),2016,31(03):49-53.
[3]王璐.基于模塊化的語音信號(hào)預(yù)處理實(shí)現(xiàn)[D].大連理工大學(xué),2009.
[4]陳演平.語音信號(hào)的數(shù)字化噪聲抑制技術(shù)[J].電子技術(shù)應(yīng)用,2002(10):76-79.
[5]卓嘎,姜軍,邊巴旺堆.基于Matlab的藏語語音MFCC參數(shù)提取研究[J].西藏大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,32(01):58-62.
[6]馬獲蕾,湯海鳳.Android系統(tǒng)中SQLite數(shù)據(jù)庫(kù)的研究[J].電腦知識(shí)與技術(shù),2013,9(28):6243-6245+6256.
作者簡(jiǎn)介:鄧爽(1995-),女,四川綿陽,本科,學(xué)生,主要研究領(lǐng)域通信技術(shù)。
姜軍(1980-),男,四川遂寧,副教授,碩士,主要研究方向數(shù)字水印技術(shù),數(shù)字圖形圖像處理,通信技術(shù)等等。