邵兵
【摘 要】計(jì)算機(jī)輔助教學(xué)系統(tǒng)可以將更加快捷、更加方便的語言學(xué)習(xí)平臺提供給學(xué)習(xí)者進(jìn)行外語口語學(xué)習(xí)。本文對外語口語訓(xùn)練中語音識別技術(shù)進(jìn)行研究,首先對外語口語學(xué)習(xí)中語音識別技術(shù)應(yīng)用的重要意義進(jìn)行分析,然后對語音識別技術(shù)中的一些關(guān)鍵技術(shù)進(jìn)行分析與研究,希望在今后的外語學(xué)習(xí)中學(xué)習(xí)者能夠正確運(yùn)用語音識別技術(shù)。
【關(guān)鍵詞】外語口語訓(xùn)練 ? ? ?語音識別技術(shù) ? ? 關(guān)鍵技術(shù) ? ? 研究
一、引言
隨著我國外語教學(xué)的不斷發(fā)展,各種外語口語教學(xué)工具與學(xué)習(xí)方法也應(yīng)運(yùn)而生。然而外語口語的學(xué)習(xí)對于學(xué)習(xí)者而言既是重點(diǎn)也是難點(diǎn),當(dāng)前的計(jì)算機(jī)輔助教學(xué)只是側(cè)重于外語單詞記憶教學(xué)與語法教學(xué),并且因?yàn)橥庹Z口語學(xué)習(xí)者的學(xué)習(xí)水平不一,在學(xué)習(xí)過程中很難將自己的不正確發(fā)音找出來。于是,在外語口語學(xué)習(xí)中就可以應(yīng)用語言識別技術(shù),該系統(tǒng)具備外語口語發(fā)音的糾正功能,學(xué)習(xí)者通過該系統(tǒng)進(jìn)行外語口語的學(xué)習(xí)與練習(xí),就能糾正自己錯誤的發(fā)音,避免因?yàn)槎啻五e誤發(fā)音而形成不良習(xí)慣。因此,對外語口語訓(xùn)練中語音識別技術(shù)進(jìn)行研究,能夠提高外語口語學(xué)習(xí)者的學(xué)習(xí)效率。
二、外語口語學(xué)習(xí)中語音識別技術(shù)應(yīng)用的重要意義
隨著中國改革開放程度的深化以及全球經(jīng)濟(jì)一體化的飛速發(fā)展,世界各國的交往越來越頻繁,學(xué)習(xí)并掌握一門外語,對于人們的工作與生活而言,已經(jīng)成為必不可少的工具。在學(xué)習(xí)外語的需求不斷增長的情況下,出現(xiàn)了各種外語教學(xué)方法、教學(xué)工具以及語言學(xué)校等,然而國人在外語學(xué)習(xí)過程中,外語的口語教學(xué)與學(xué)習(xí)一直是較難突破的難題,其主要原因有以下幾個方面:
(一)各種外語發(fā)音的特點(diǎn)與漢語發(fā)音的特點(diǎn)存在較大差異,因而可能導(dǎo)致國人在學(xué)習(xí)外語時由于受到母語的深厚影響而犯下許多自己根本無法察覺或者是很難察覺的發(fā)音錯誤。
(二)目前在國內(nèi)合格的外語口語教師還是很少,自己發(fā)音標(biāo)準(zhǔn)又能夠準(zhǔn)確地指導(dǎo)別人進(jìn)行口語學(xué)習(xí)的外語教師,即便是在一些大中城市的中小學(xué)中也相當(dāng)缺乏。同時,一般的媒體教學(xué)也不能夠針對學(xué)生的特定情況,有效地讓學(xué)生與教師互動進(jìn)行口語訓(xùn)練,只能夠單方面地進(jìn)行傳授,所以起到的作用也不是很有效。
外語口語訓(xùn)練中語音識別技術(shù)的應(yīng)用,讓軟件具備了矯正錯誤發(fā)音的功能,能夠?yàn)閷W(xué)習(xí)者及時改正錯誤的發(fā)音提供幫助,從而有效避免錯誤反復(fù)而變成一種惡性習(xí)慣,并使外語學(xué)習(xí)者口語學(xué)習(xí)的效率與效果得到一定程度的提高,獲得更大的市場價值與社會效益。
三、外語口語訓(xùn)練中語音識別的關(guān)鍵技術(shù)
(一)語音識別
在語音識別技術(shù)中,語音識別是第一步也是最重要的一步,接下來幾個步驟的精確度都會受其影響,它能夠在語法與音素模型的基礎(chǔ)上,將輸入的語音信號翻譯成單詞串。同時,許多基于計(jì)算機(jī)的語言訓(xùn)練活動都可以應(yīng)用這一部分,比如基于語音的選擇題或者是與計(jì)算機(jī)的對話訓(xùn)練等等。
(二)語音評分
在基于語音識別技術(shù)的外語口語學(xué)習(xí)系統(tǒng)中,語音評分技術(shù)是最基本也是最核心的組成部分。語音評分技術(shù)能夠評價并反饋學(xué)習(xí)者的口語發(fā)音情況,可以讓學(xué)習(xí)者通過反饋的結(jié)果對自己的學(xué)習(xí)結(jié)果進(jìn)行檢查。通常情況下,按照語音評分技術(shù),目前的外語口語學(xué)習(xí)系統(tǒng)主要可以分為兩種:一種是基于語音特征比較的評分方法,它通過將學(xué)習(xí)者的發(fā)音與標(biāo)準(zhǔn)語音進(jìn)行對比參考,從一個較為主觀的角度對一段語音質(zhì)量進(jìn)行評價,通常采用動態(tài)時間規(guī)整技術(shù)實(shí)現(xiàn),因?yàn)槠渚邆溥\(yùn)算量小的特點(diǎn),因而在嵌入式系統(tǒng)與手持設(shè)備中運(yùn)用較多;另一種是基于聲學(xué)模型的評分方法,它能夠通過語音識別技術(shù)將以計(jì)算發(fā)音質(zhì)量所需的小單元切割出來,然后再通過事先訓(xùn)練好的聲學(xué)模型與其進(jìn)行對比,最后根據(jù)評分機(jī)制對其評分,因?yàn)樵摲绞捷^為客觀,目前主流的外語口語學(xué)習(xí)系統(tǒng)中均采用這種技術(shù),其主要是基于隱馬爾可夫模型(HMM)技術(shù)實(shí)現(xiàn)。
如圖1,基于HMM的語音評分流程圖所示,其語音評分的關(guān)鍵技術(shù)分為以下幾步:
圖1 ?基于HMM的語音評分流程圖
1.首先,對學(xué)習(xí)者所輸入的語音進(jìn)行特征提取;
2.其次,將已經(jīng)訓(xùn)練好的HMM作為模板,再采用Viterbi算法將語言以計(jì)算發(fā)音質(zhì)量所需的小單元進(jìn)行分割,并強(qiáng)制對齊;
3.最后,采用不同的評分機(jī)制對不同的需要進(jìn)行評分,將評分結(jié)果得出。同時,在某些情況下,要注意將說話驗(yàn)證在語音評分開始時加入,從而將學(xué)習(xí)者發(fā)音內(nèi)容與標(biāo)準(zhǔn)發(fā)音完全不同的部分擋下,保證整個口語學(xué)習(xí)系統(tǒng)的可信度更高。此外,由于同樣的聲音可能代表的意義不同,因而在這些更加復(fù)雜的應(yīng)用中,需要將各種詞發(fā)生概率的大小、上下文的關(guān)系進(jìn)行綜合考慮,并將語言模型加入,從而為聲學(xué)模型的判斷提供更好的輔助。
(三)發(fā)音錯誤檢測與錯誤糾正
對于外語學(xué)習(xí)者而言,雖然知道系統(tǒng)能夠評價其發(fā)音質(zhì)量,但是單憑非母語學(xué)習(xí)者自己對其自身錯誤的所在還是不能清楚地了解到,對這個錯誤也不知道如何進(jìn)行糾正。因而,外語口語學(xué)習(xí)者需要通過系統(tǒng)對發(fā)音的錯誤進(jìn)行檢測與定位,并將相應(yīng)的錯誤糾正建議提供給學(xué)習(xí)者進(jìn)行有效糾正。
1.發(fā)音錯誤的檢測與定位
在外語口語訓(xùn)練中,導(dǎo)致錯誤發(fā)音的因素有很多。例如學(xué)習(xí)者不會發(fā)某種聲音,或者是受到其他語言拼讀方法的影響以及不能正確體會到兩種聲音的差別等等。語音識別器也是發(fā)音錯誤檢測中使用的一種方法,比如用母語訓(xùn)練的語音識別器,但是因?yàn)樵跊]有使用自適應(yīng)技術(shù)的情況下,學(xué)習(xí)者發(fā)音的識別錯誤也有可能會當(dāng)成是發(fā)音錯誤,因而這種方法就很難準(zhǔn)確地檢測到非母語學(xué)習(xí)者的發(fā)音是否正確。所以,目前對錯誤發(fā)音的檢測比較合理的一種做法是:首先以發(fā)音專家的知識為依據(jù),嚴(yán)格將容易出錯的發(fā)音進(jìn)行合理的分類,然后以不同的錯誤類型為依據(jù),將其相應(yīng)的檢測算法設(shè)計(jì)出來,最后用各種錯誤檢測算法對學(xué)習(xí)者的發(fā)音分別進(jìn)行檢測。
2.發(fā)音錯誤的糾正
系統(tǒng)將發(fā)音錯誤檢測出來后,同時就對學(xué)習(xí)者所犯的錯誤根據(jù)專家關(guān)于發(fā)音錯誤的知識給出相應(yīng)的錯誤提示與錯誤糾正建議。其中,對于這些發(fā)音專家知識的構(gòu)建而言,是通過事先收集大量的經(jīng)驗(yàn)數(shù)據(jù)而積累而成的,例如不同學(xué)習(xí)者的發(fā)音特點(diǎn)等,然后通過數(shù)據(jù)挖掘的聚類算法將不同學(xué)習(xí)者不同發(fā)音特征的聚類準(zhǔn)確地計(jì)算出來,再由專家客觀地評判分類的發(fā)音,最后將各聚類的改進(jìn)建議提出來。
(四)回饋展示
在基于語音識別技術(shù)的外語口語學(xué)習(xí)系統(tǒng)中,這一部分是整個系統(tǒng)對用戶的窗口,上述部分所產(chǎn)生的信息都可以通過分?jǐn)?shù)條或者是數(shù)字的形式為外語學(xué)習(xí)者展示出來。同時只有通過這個模塊,外語學(xué)習(xí)者才能夠從基于語音識別技術(shù)的外語口語學(xué)習(xí)系統(tǒng)中獲益,所以,整個系統(tǒng)的可用度都通過這一模塊設(shè)計(jì)的好壞來決定。
四、結(jié)語
總而言之,隨著社會經(jīng)濟(jì)與科學(xué)技術(shù)的快速發(fā)展,各種帶有語音識別技術(shù)的便攜式終端設(shè)備出現(xiàn)在人們的日常生活與學(xué)習(xí)中,為廣大外語愛好者與學(xué)習(xí)者提供了不受教師資源、地點(diǎn)以及時間等限制的智能外語學(xué)習(xí)系統(tǒng),有效地提高了外語學(xué)習(xí)者的學(xué)習(xí)效率與學(xué)習(xí)效果,相信在未來,也能夠?yàn)橥庹Z學(xué)習(xí)者們提供更快、更好的電子學(xué)習(xí)手段。
【參考文獻(xiàn)】
[1]盧永輝.語音識別技術(shù)在外語口語訓(xùn)練中的應(yīng)用[J].電腦知識與技術(shù),2014(04):836-837,843.
[2]吳艷艷.孤立詞語音識別的關(guān)鍵技術(shù)研究[D].青島:青島大學(xué),2012.
[3]涂惠燕.移動設(shè)備平臺上英語口語學(xué)習(xí)中的語音識別技術(shù)[D].上海:上海交通大學(xué),2011.
[4]孔菊芳.基于語音識別技術(shù)的英語學(xué)習(xí)網(wǎng)站分析[J].哈爾濱職業(yè)技術(shù)學(xué)院學(xué)報(bào),2012(05):65-66.
[5]司博宇.基于語音識別的構(gòu)音及語音障礙自動評估系統(tǒng)研制[D].上海:華東師范大學(xué),2014.