孫亞鵬,海源,徐文權(quán)
(1.湖南科技大學(xué),湘潭 411201;2.湖南理工職業(yè)技術(shù)學(xué)院,湘潭 411104;3.安慶師范大學(xué),安慶 246133)
基于Android移動(dòng)智能終端的普通話評(píng)測(cè)App的設(shè)計(jì)與實(shí)現(xiàn)
孫亞鵬1,海源2,徐文權(quán)3
(1.湖南科技大學(xué),湘潭 411201;2.湖南理工職業(yè)技術(shù)學(xué)院,湘潭 411104;3.安慶師范大學(xué),安慶 246133)
開發(fā)一個(gè)普通話語音評(píng)測(cè)App,利用訊飛語音的接口,實(shí)現(xiàn)對(duì)普通話的智能評(píng)測(cè),對(duì)每段經(jīng)過預(yù)處理去噪增強(qiáng)的普通話語音進(jìn)行評(píng)測(cè)打分,讓普通話學(xué)習(xí)者能夠在任何時(shí)間任何地點(diǎn)無限制的學(xué)習(xí)普通話,并獲得實(shí)時(shí)評(píng)價(jià)和反饋,這將極大地方便廣大普通話的學(xué)習(xí)者,使得學(xué)習(xí)者能方便地在有指導(dǎo)、有反饋的狀態(tài)下學(xué)習(xí)普通話,對(duì)個(gè)人來說學(xué)習(xí)效率更加事半功倍,對(duì)推廣和普及普通話也有著很大的幫助效果,是一件非常有意義的工作。
湖南省2015年語言文字應(yīng)用研究專項(xiàng)課題(No.XYJ2015GA01)、湖南省普通高等學(xué)校教學(xué)改革研究項(xiàng)目(No.2014-281)
普通話的推廣和普及是國家的一項(xiàng)重要工作,如何利用現(xiàn)在大量的智能設(shè)備與無線網(wǎng)絡(luò)等科技產(chǎn)品來進(jìn)行普通話的學(xué)習(xí)和推廣是一項(xiàng)十分有意義的工作[1]。筆者結(jié)合自己多年教學(xué)管理和計(jì)算機(jī)教學(xué)的經(jīng)驗(yàn),利用無線網(wǎng)絡(luò)和智能技術(shù),開發(fā)了一個(gè)基于Android移動(dòng)終端的普通話評(píng)測(cè)App。
該App通過調(diào)用訊飛語音的語言評(píng)測(cè)接口,使得每次發(fā)音練習(xí)可以給出具體的評(píng)測(cè)分?jǐn)?shù),給出一個(gè)總體評(píng)價(jià)和每一個(gè)音節(jié)的情況,例如多讀了,少讀了,讀錯(cuò)了等。這些功能對(duì)于用戶來說是非常有幫助的,一方面可以了解自己發(fā)音的不足,另一方面又可以根據(jù)其進(jìn)行矯正發(fā)音。每次評(píng)測(cè)的單詞或句子可以自己設(shè)置,句子或單詞的來源是文件,只需要編輯好文件就可以實(shí)現(xiàn)特定的單詞句子的評(píng)測(cè)。有效利用了現(xiàn)今大數(shù)據(jù)無線網(wǎng)絡(luò)的有利條件來學(xué)習(xí)和推廣普通話。
利用MyEclipse2014開發(fā),使用Genymotion作為模擬器。MyEclipse是由Eclipse擴(kuò)展而來,集成了很多的開發(fā)工具,如Java EE、Java SE、C、Maven等[2-3]。功能十分強(qiáng)大,包括可視化開發(fā),所見即所得,代碼自動(dòng)生成,自動(dòng)格式化等功能。
科大訊飛語音,語音識(shí)別領(lǐng)域的專家,致力于解決人機(jī)交互的最佳方案[4-5]。只要能聯(lián)網(wǎng),就可以通過移動(dòng)互聯(lián)網(wǎng),或者互聯(lián)網(wǎng),在任意地點(diǎn),任意時(shí)間段,使用任意的設(shè)備,享受訊飛公司提供的“聽,說,讀,寫……”等多個(gè)智能服務(wù)?,F(xiàn)在,訊飛開放了多種功能接口給開發(fā)者,包括,語音合成接口,語音喚醒接口,語音識(shí)別接口,移動(dòng)應(yīng)用接口等多種服務(wù)[6-7]。筆者開發(fā)的App在語音識(shí)別時(shí)調(diào)用科大訊飛語音免費(fèi)接口。
首先通過移動(dòng)智能終端設(shè)備的麥克風(fēng),接受語音輸入,考慮到語音輸入時(shí)環(huán)境一般不是安靜的,存在噪聲,所以先進(jìn)行預(yù)處理,進(jìn)行濾波去噪,語音增強(qiáng),然后將經(jīng)過預(yù)處理的語音文件根據(jù)需要,進(jìn)行普通話評(píng)測(cè)[8-10]。調(diào)用了訊飛提供的免費(fèi)普通話語音評(píng)測(cè)接口,將經(jīng)過預(yù)處理的語音文件和文字信息發(fā)送給訊飛免費(fèi)語音識(shí)別接口,訊飛通過對(duì)比文字的標(biāo)準(zhǔn)發(fā)音和評(píng)測(cè)發(fā)音給出反饋評(píng)價(jià)并發(fā)送回移動(dòng)智能終端。普通話學(xué)習(xí)者可以根據(jù)反饋回的評(píng)價(jià)對(duì)自己的發(fā)音進(jìn)行糾正,通過移動(dòng)網(wǎng)絡(luò),可以在任何時(shí)間任何地點(diǎn)獲得實(shí)時(shí)的輔導(dǎo)。如下圖1所示。
圖1 系統(tǒng)框架圖
在人們進(jìn)行語言交談溝通的時(shí)候,往往大部分時(shí)候不是在安靜的場(chǎng)所,一般受到噪聲干擾的影響,這類是場(chǎng)景性的噪聲;另外在語音進(jìn)行處理、傳送等時(shí)候,人們往往都是采取的電子設(shè)備,這類設(shè)備本身的特性也不是完全理想化的設(shè)備,往往帶來一些波動(dòng),這也給語音文件帶來了噪聲。這樣語音技術(shù)的去噪增強(qiáng)就一一項(xiàng)很有必要和意義的工作。
語音信號(hào)的去噪增強(qiáng)技術(shù)已經(jīng)有很多學(xué)者專家提出了很多種有效的方法,根據(jù)本文所述系統(tǒng)的功能需求和特點(diǎn),考慮到去噪增強(qiáng)處理的效率和實(shí)時(shí)性要求,本文選擇使用改進(jìn)的卡爾曼濾波器進(jìn)行語音的去噪增強(qiáng)。
當(dāng)用戶進(jìn)入到語音識(shí)別的功能后,系統(tǒng)加載默認(rèn)的用來朗讀的評(píng)測(cè)文字。用戶可以重新選擇加載的文字,再進(jìn)行評(píng)測(cè)。
點(diǎn)擊閱讀后系統(tǒng)開始錄音,再次點(diǎn)擊就開始評(píng)測(cè),完成后會(huì)有詳細(xì)的結(jié)果給出。詳細(xì)的結(jié)果在App的中間輸出,對(duì)于每個(gè)音素都有評(píng)價(jià),一個(gè)音素占一個(gè)格子。不同的評(píng)價(jià)結(jié)果用不同的顏色標(biāo)注。一次評(píng)測(cè)結(jié)束后,重新選擇源文件。改變待測(cè)試的單詞或句子,進(jìn)行下一次評(píng)測(cè)。流程圖如圖2所示。
圖2 普通話評(píng)測(cè)流程圖
按照設(shè)計(jì)的方案,編寫代碼,實(shí)現(xiàn)App。進(jìn)入普通話評(píng)測(cè)后,即可對(duì)發(fā)送語音進(jìn)行標(biāo)準(zhǔn)普通話發(fā)音的對(duì)比和評(píng)價(jià),并且將反饋結(jié)果通過移動(dòng)無線網(wǎng)絡(luò)發(fā)回用戶終端,保存顯示。以下是準(zhǔn)確、多讀、漏讀、重復(fù)度等幾種典型的普通話發(fā)音評(píng)測(cè)結(jié)果的展示:
圖3 準(zhǔn)確朗讀 的顯示
圖4 多讀 的顯示
圖5 漏讀 的顯示
圖6 重復(fù)讀 的顯示
準(zhǔn)確朗讀的情況,在給定的文字的朗讀過程中,正確的朗讀,訊飛語音識(shí)別時(shí),將根據(jù)情況給出較高的分?jǐn)?shù)或者滿分,通過無線網(wǎng)絡(luò)反饋給智能移動(dòng)終端,最終在屏幕上反饋給用戶,如圖3。若干個(gè)字多讀的情況,在語音識(shí)別的過程中,將被識(shí)別發(fā)現(xiàn),導(dǎo)致評(píng)分降低,如圖4。若干個(gè)字漏讀的情況,訊飛語音識(shí)別時(shí),將會(huì)識(shí)別出這種錯(cuò)誤,導(dǎo)致評(píng)分降低,最終在屏幕上反饋給用戶,如圖5。若干個(gè)字重負(fù)讀的情況,訊飛語音識(shí)別時(shí),將會(huì)識(shí)別出這種錯(cuò)誤,導(dǎo)致評(píng)分降低,通過無線網(wǎng)絡(luò)反饋給智能移動(dòng)終端,最終在屏幕上反饋給用戶,如圖6。根據(jù)App的評(píng)價(jià),普通話學(xué)習(xí)者可以及時(shí)得到指導(dǎo)和評(píng)價(jià),糾正自己的發(fā)音,有利于學(xué)習(xí)效率的提高。
首先,對(duì)App進(jìn)行分析、研究,制定測(cè)試方案和計(jì)劃;其次,對(duì)測(cè)試用例進(jìn)行設(shè)計(jì),設(shè)計(jì)過程中要考慮配合開發(fā)的整個(gè)進(jìn)度,還有成本等等因素;再次,確認(rèn)系統(tǒng)錯(cuò)誤和缺陷,對(duì)發(fā)現(xiàn)的錯(cuò)誤和缺陷形成文本檔案;然后,修改去除錯(cuò)誤和缺陷,并對(duì)修改的部分進(jìn)行核實(shí)和再測(cè)試;最后,形成測(cè)試報(bào)告。
結(jié)合本系統(tǒng)的特點(diǎn)和各項(xiàng)實(shí)際情況,安排進(jìn)行了如下測(cè)試。以軟件內(nèi)部邏輯和結(jié)構(gòu)以及具體實(shí)現(xiàn)細(xì)節(jié)方面為側(cè)重的進(jìn)行了白盒和黑盒測(cè)試。以構(gòu)件和集成功能為側(cè)重的進(jìn)行了單元、集成和系統(tǒng)測(cè)試。還有考慮輸入的合法性方面為側(cè)重的進(jìn)行了邊界值的合法性測(cè)試。受到筆者個(gè)人水平和實(shí)際條件的限制,一些測(cè)試方法未能進(jìn)行,已安排和計(jì)劃的測(cè)試也可能存在不夠完善的地方。測(cè)試內(nèi)容表如表1。
表1 測(cè)試內(nèi)容表
由于在App開發(fā)設(shè)計(jì)的早期就有了測(cè)試的安排,所以在需求分析階段,對(duì)形成的需求進(jìn)行了核查,經(jīng)過這項(xiàng)工作,發(fā)現(xiàn)了需求分析過程中收集的一些不是太符合現(xiàn)階段國家普通話考試要求和形式的要求,經(jīng)過修改和再核實(shí)后,新的需求更加符合國家普通話考試的培訓(xùn)和練習(xí)。
對(duì)各個(gè)小功能模塊進(jìn)行測(cè)試的時(shí)候,發(fā)現(xiàn)的小問題比較多,但是都不是嚴(yán)重的錯(cuò)誤,基本都是類似數(shù)據(jù)格式定義不一致、條件語句邏輯不嚴(yán)密、邊界值控制不嚴(yán)格等這類問題,在開發(fā)過程中,進(jìn)行了調(diào)試和修改。但是不好的影響是,這類錯(cuò)誤由于隨手修改好了,并未歸入文檔進(jìn)行記錄。
在整體測(cè)試系統(tǒng)測(cè)試階段,集成無線通信和監(jiān)聽通信端口的時(shí)候,發(fā)生了一些錯(cuò)誤,經(jīng)過查實(shí)后發(fā)現(xiàn)是對(duì)訊飛的接口調(diào)用格式不夠了解所致,經(jīng)過查閱資料后對(duì)格式進(jìn)行修改后正確,并在修改后再次測(cè)試通過。
另外在最后的整體測(cè)試中還發(fā)現(xiàn)了一些人機(jī)交互不夠人性化的問題,例如在屏幕上顯示的字體過小,看起來比較費(fèi)力。一些界面沒有返回功能等,這類問題亦經(jīng)過多次調(diào)整修改完善。
在測(cè)試過程中發(fā)生的錯(cuò)誤主要包括了這些方面,需求分析不夠深入全面,對(duì)國家普通話考試形式和普通話學(xué)習(xí)者的學(xué)習(xí)習(xí)慣還沒有全面足夠的掌握;部分模塊的輸入值邊界檢查和控制不夠嚴(yán)格;代碼編寫過程當(dāng)中邏輯思維不夠嚴(yán)密,以及編寫的代碼可讀性不夠好;人性化的理念沒有貫穿整個(gè)開發(fā)過程當(dāng)中,造成一些界面編程完畢后又推倒重寫等??偟膩碚f該App基本完成了預(yù)期要達(dá)到的功能和目的,一些地方還有帶完善和優(yōu)化。
使用Android開發(fā)技術(shù),結(jié)合免費(fèi)的訊飛語音評(píng)測(cè)和語音輸入接口,完成了這個(gè)App的編碼和功能開發(fā)。按照預(yù)期,先對(duì)錄入的語音信號(hào)進(jìn)行卡爾曼濾波的去噪增強(qiáng)預(yù)處理,然后實(shí)現(xiàn)了普通話的評(píng)測(cè)功能,幫助人們糾正發(fā)音,實(shí)現(xiàn)了對(duì)普通話的評(píng)測(cè),打分。具體到每個(gè)音節(jié)。包括多讀,少讀,漏讀等。系統(tǒng)完成了預(yù)期的功能,但是還有很多改善的地方。第一,可以添加歷史評(píng)測(cè)記錄,以及錯(cuò)誤發(fā)音字的準(zhǔn)確發(fā)音提示。第二,在使用調(diào)查中發(fā)現(xiàn),普通話測(cè)試是有一定的固定范圍的,一般是在五十套題目中進(jìn)行隨機(jī)抽取組合,形成一套正式考試的試卷。在國家出版發(fā)行的普通話培訓(xùn)訓(xùn)練輔導(dǎo)教材上,大量的講述和覆蓋了這五十套題目。這樣可以考慮在練習(xí)過程中加入考試原題,并且模仿考試的隨機(jī)抽題組卷模式,在智能終端的題庫中,將五十套題目全部錄入題庫中去。這樣普通話的使用者可以更好地更加真實(shí)地進(jìn)行考試訓(xùn)練。筆者將在后續(xù)的工作中針對(duì)上述問題進(jìn)一步進(jìn)行改進(jìn),以期更好地滿足用戶需求。
參考文獻(xiàn):
[1]鄭世杰,張瓏,趙云雪,趙松.基于語音自動(dòng)評(píng)測(cè)的普通話學(xué)習(xí)系統(tǒng)研究[N].哈爾濱師范大學(xué)計(jì)算機(jī)科學(xué)與信息工程學(xué)院,2014,12.
[2]祖漪清.漢語連續(xù)語音數(shù)據(jù)庫的語料設(shè)計(jì)[N].中國社會(huì)科學(xué)院語言研究所,1998,3.
[3]文林.基于改進(jìn)MFCC的語音識(shí)別系統(tǒng)研究及設(shè)計(jì)[D].碩士學(xué)位論文,2011,05.
[4]李金領(lǐng).基于語音評(píng)測(cè)技術(shù)的普通話網(wǎng)絡(luò)考試系統(tǒng)實(shí)現(xiàn)[D].碩士學(xué)位論文,2011,10.
Design and Im p lementation of Mandarin E valuation B ased on Android Mobile I ntelligent T erm inal
SUN Ya-peng1,H AI Yuan2,X U Wen-quan3
(1.Hunan University of Science and Technology,Xiangtan 411201;2.Hunan Polytechnic Vocational College,Xiangtan 411104;3.Anqing Normal University,Anhui,Anqing 246133)
Develops a Mandarin speech evaluation App,uses the speech interface,realizes the intelligent evaluation of Mandarin,Mandarin speech to each section after preprocessing denoising and enhancement of evaluation score,makes Mandarin learners can atany time without lim鄄itation any place of learning Mandarin,and obtains real-time evaluation and feedback,thiswill greatly facilitate themajority of Mandarin learners,so that learners can easily in the guidance,feedback under the condition of learning Mandarin,for the individual learning effi鄄ciency ismore effective,for the promotion and popularization of Putonghua is also a great help,is a verymeaningful job.
孫亞鵬(1981-),男,湖南邵陽人,講師,博士生,從事領(lǐng)域?yàn)閺?fù)雜系統(tǒng)建模與優(yōu)化以及教學(xué)信息化
2017-03-21
2017-04-20
1007-1423(2017)13-0055-04
10.3969/j.issn.1007-1423.2017.13.013
卡爾曼濾波;Android;語音識(shí)別;普通話評(píng)測(cè)
Calman Filter;Android;Speech Recognition;Mandarin Evaluation