劉敏
基于機(jī)器學(xué)習(xí)的英語發(fā)音水平評價系統(tǒng)模塊化設(shè)計
劉敏
(宣城職業(yè)技術(shù)學(xué)院,安徽 宣城 242000)
以提升英語發(fā)音水平評價的精準(zhǔn)性為目標(biāo),研究基于機(jī)器學(xué)習(xí)對英語發(fā)音水平評價系統(tǒng)展開模塊化。將S3C2440A芯片作為系統(tǒng)的主要處理器,將英語口語錄音通過語音上傳模塊發(fā)送至評價模塊。在評價模塊中,通過多層小波特征尺度變換方法對發(fā)音信號實施濾波處理,并分解、提取其中的語調(diào)、語速、音準(zhǔn)、節(jié)奏以及情感特征,然后選取徑向基核函數(shù)作為支持向量機(jī)核函數(shù),結(jié)合特征提取結(jié)果,利用支持向量機(jī)方法實現(xiàn)英語發(fā)音水平評價,并將評價結(jié)果通過數(shù)據(jù)可視化模塊展示。測試結(jié)果表明,在采用該系統(tǒng)評價英語發(fā)音水平時,對不同錯讀音的誤判率均低于1%,證明其具有較高的評價精準(zhǔn)性。
機(jī)器學(xué)習(xí);英語;發(fā)音水平;評價系統(tǒng);模塊化設(shè)計;支持向量機(jī)
計算機(jī)已廣泛應(yīng)用于語言學(xué)習(xí)的語言評價以及語音識別中,語音識別技術(shù)是決定語言學(xué)習(xí)水平的重要體現(xiàn)。語言學(xué)習(xí)過程中語言信號數(shù)據(jù)量大,語音變化復(fù)雜,語音特征參數(shù)具有較高維度,導(dǎo)致語音特征較難識別[1-2]。語音評價與識別計算量過大,需要更高的硬件資源以及軟件資源實現(xiàn)海量語音信號高速處理。機(jī)器學(xué)習(xí)算法是目前廣泛應(yīng)用于眾多領(lǐng)域的高效算法[3-4],機(jī)器學(xué)習(xí)算法中的BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法具有較高的數(shù)據(jù)處理速度以及準(zhǔn)確度。將機(jī)器學(xué)習(xí)算法應(yīng)用于英語語音水平評價中,提升英語發(fā)音水平評價性能。
目前英語發(fā)音水平評價系統(tǒng)主要存在以下缺陷:大部分計算機(jī)輔助語言學(xué)習(xí)系統(tǒng)過于重視語法以及單詞學(xué)習(xí),忽視口語學(xué)習(xí)發(fā)音評價,口語評價指標(biāo)過少;英語口語具有較高的主觀意識,以緩慢速度作為英語口語考試評價指標(biāo),具有較低的穩(wěn)定性[5-6]。針對以上評價系統(tǒng)的缺陷,選取英語語音作為系統(tǒng)研究對象,對傳統(tǒng)英語發(fā)音水平評價系統(tǒng)實施改進(jìn),將語調(diào)、節(jié)奏、音準(zhǔn)、語速問題作為系統(tǒng)評價指標(biāo),利用支持向量機(jī)方法實現(xiàn)多指標(biāo)評價。采用高效的特征提取方法提取英語口語信號特征,令評價結(jié)果更加準(zhǔn)確、客觀。所研究系統(tǒng)具有較高應(yīng)用價值,避免英語口語水平評價過程中由于聲道擾動和畸變影響造成評估質(zhì)量下降的缺陷。李廣鳳研究了基于自動評價系統(tǒng)的多元反饋對英語作文修改的影響[7]。利用多元反饋方法提升英語評價性能,但該系統(tǒng)具有較高的計算復(fù)雜度,實時性較差;張慧丹研究基于大數(shù)據(jù)分析的英語泛在學(xué)習(xí)生態(tài)系統(tǒng)[8],充分利用大數(shù)據(jù)分析技術(shù)的高運(yùn)算水平,但系統(tǒng)可靠性較差。研究基于機(jī)器學(xué)習(xí)的英語發(fā)音水平評價系統(tǒng)模塊化設(shè)計,選取S3C2440A作為核心控制芯片,利用支持向量機(jī)方法實現(xiàn)英語口語水平最終評價。通過實驗驗證該系統(tǒng)具有較高的評價性能,可為英語學(xué)習(xí)者提供準(zhǔn)確、客觀的評價結(jié)果,可快速幫助學(xué)習(xí)者明確英語發(fā)音水平存在的缺陷,提升學(xué)習(xí)者的英語口語水平學(xué)習(xí)效率,具有較高的應(yīng)用性能。
基于英語發(fā)音水平評價需求,采用C/B-S架構(gòu)設(shè)計系統(tǒng)。學(xué)習(xí)者可利用手機(jī)客戶端以及電腦通過網(wǎng)頁瀏覽;教師、系統(tǒng)管理人員利用網(wǎng)頁實現(xiàn)數(shù)據(jù)交互。利用MVC架構(gòu)的ThinkPHP框架實現(xiàn)系統(tǒng)的網(wǎng)絡(luò)服務(wù)器開發(fā),通過所開發(fā)網(wǎng)絡(luò)服務(wù)器實現(xiàn)系統(tǒng)語音信號預(yù)處理、英語口語水平評價以及評價相關(guān)數(shù)據(jù)存儲等[9]。系統(tǒng)總體結(jié)構(gòu)圖如圖1所示。
英語發(fā)音水平評價系統(tǒng)包括用戶管理模塊、語音上傳模塊、評價模塊、數(shù)據(jù)可視化模塊以及數(shù)據(jù)庫模塊。
英語學(xué)習(xí)者通過語音上傳模塊實現(xiàn)口語表達(dá),將完成表達(dá)的口語上傳至系統(tǒng)。
系統(tǒng)的評價模塊對英語學(xué)習(xí)者英語口語錄音實施預(yù)處理,完成預(yù)處理后提取英語口語錄音中的語調(diào)、語速、音準(zhǔn)、節(jié)奏以及情感特征,通過機(jī)器學(xué)習(xí)算法中的支持向量機(jī)利用所提取特征實施綜合評價。評價結(jié)果利用數(shù)據(jù)可視化模塊展示至用戶[10],評價結(jié)果同時需保存至系統(tǒng)數(shù)據(jù)庫內(nèi),便于后續(xù)數(shù)據(jù)分析以及調(diào)用。
系統(tǒng)的數(shù)據(jù)可視化模塊將英語發(fā)音水平評價結(jié)果通過餅狀圖、折線圖、雷達(dá)圖以及條形圖等多種形式展示至用戶。英語口語水平評價結(jié)果中包含各指標(biāo)評價結(jié)果,令學(xué)習(xí)者通過評價結(jié)果直觀展示英語發(fā)音水平評價結(jié)果[11]。評價結(jié)果可輔助教學(xué)者明確不同學(xué)習(xí)者英語發(fā)音存在問題,為英語口語教學(xué)提供理論支持。
圖1 系統(tǒng)總體結(jié)構(gòu)圖
英語發(fā)音水平評價系統(tǒng)需要具有較高便攜性,硬件應(yīng)具有較高性能、較低的價格與功耗。選取ARM9 16/32位RISC處理器S3C2440A芯片作為系統(tǒng)的主要處理器該芯片具有較高的集成性;內(nèi)核為ARM920T嵌入式微處理器,包括AHB、BUS和鎖相環(huán)時鐘形成模塊等。處理器主頻可實現(xiàn)400MHz處理速度,可處理復(fù)雜度較高的運(yùn)算。
S3C2440A芯片具有外圍接口集成性能,令系統(tǒng)具有較高擴(kuò)展性,符合英語發(fā)音水平評價功能需求,降低系統(tǒng)成本。
系統(tǒng)硬件結(jié)構(gòu)圖如圖2所示。
圖2 系統(tǒng)硬件結(jié)構(gòu)圖
S3C2440A芯片是英語口語水平評價系統(tǒng)的主控以及語音處理芯片,系統(tǒng)的軟件模塊通過該芯片實現(xiàn),該芯片可實現(xiàn)系統(tǒng)的LCD顯示、用戶控制功能以及評價控制等功能。利用飛利浦公司基于音頻總線的UDA1341Ts音頻CODEC以及S3C2440A芯片作為系統(tǒng)主要硬件部分。S3C2440A微處理器和UDA1341Ts編解碼器均具有115音頻編碼解碼接口,可直接連通,提升系統(tǒng)簡便性。系統(tǒng)利用DMA作為信息發(fā)送與接收方式,實現(xiàn)英語口語實時錄音以及實時播放。選取AEM+Linux架構(gòu)作為系統(tǒng)工作架構(gòu),提升系統(tǒng)外圍擴(kuò)展水平以及處理水平。
UDA1341Ts編碼解碼器可前置放大、濾波和A/D轉(zhuǎn)換英語發(fā)音語音信號;數(shù)字信號通過S3C2440A微處理器實現(xiàn);語音信號利用DMA控制器傳遞至FIFO緩沖區(qū)至DMA緩沖區(qū),為微處理器處理提供方便。利用SDRAM以及Flash實現(xiàn)系統(tǒng)數(shù)據(jù)和應(yīng)用程序的運(yùn)行以及BIOS存儲。
1.3.1 聲音信號預(yù)處理與特征提取
綜合以上公式可得:
可得待評價英語口語發(fā)音信號小波熵特征量公式
1.3.2 支持向量機(jī)評價方法
支持向量機(jī)的最優(yōu)化問題公式如下:
引入核函數(shù)利用對偶最優(yōu)化問題解決最優(yōu)化問題可得公式如下:
選取徑向基核函數(shù)作為英語發(fā)音水平評價的核函數(shù),徑向基函數(shù)公式如下:
支持向量機(jī)的英語口語發(fā)音水平評價是數(shù)據(jù)泛化擬合問題,首先需要依據(jù)訓(xùn)練集建立分類模型[15],將待評價數(shù)據(jù)發(fā)送至已完成訓(xùn)練的數(shù)據(jù)集實施評價。
為檢測基于機(jī)器學(xué)習(xí)的英語發(fā)音水平評價系統(tǒng)模塊化設(shè)計結(jié)果的實際有效性,設(shè)計如下實驗。
實驗環(huán)境如下:選取某外國語學(xué)校商務(wù)英語專業(yè)某學(xué)生作為實驗對象,利用MATLAB軟件編程本文系統(tǒng)。采集8段該學(xué)生英語口語發(fā)音語音線性調(diào)頻信號,采集語音樣本時寬以及相對帶寬分別為1.5s以及0.5dB,采集不同聲帶發(fā)音的英語口語發(fā)音信號采集頻率以及基帶信號頻率分別為1024kHz以及3~9kHz。
為避免實驗結(jié)果出現(xiàn)過擬合問題,設(shè)置懲罰參數(shù)的范圍為0.1~0.5。在此基礎(chǔ)上,統(tǒng)計不同徑向基參數(shù)時,系統(tǒng)所采用支持向量機(jī)的分類性能,統(tǒng)計結(jié)果如圖3所示。
分析圖3可知,當(dāng)徑向基參數(shù)為18時,支持向量機(jī)分類性能達(dá)到最優(yōu)。因此,設(shè)置徑向基參數(shù)為18,統(tǒng)計不同懲罰參數(shù)時,系統(tǒng)所用支持向量機(jī)的分類性能,統(tǒng)計結(jié)果如圖4所示。
圖3 不同徑向基參數(shù)時支持向量機(jī)分類性能
圖4 不同懲罰參數(shù)時支持向量機(jī)分類性能
支持向量機(jī)良好的分類性能有助于系統(tǒng)對英語發(fā)音水平的精準(zhǔn)評價。綜合分析圖3, 4統(tǒng)計結(jié)果可以看出,當(dāng)徑向基參數(shù)為18、懲罰參數(shù)為0.3時,本文系統(tǒng)的支持向量機(jī)分類效果可達(dá)到最優(yōu)狀態(tài),因此系統(tǒng)設(shè)置支持向量機(jī)徑向基參數(shù)為18、懲罰參數(shù)為0.3。
在此基礎(chǔ)上,采用本文系統(tǒng)對采集到的8段語音英語發(fā)音水平展開評價,結(jié)果如表1所示。
表1 英語發(fā)音水平評價結(jié)果
表1實驗結(jié)果可以看出,本文系統(tǒng)可對8段語音的英語發(fā)音的語調(diào)、語速、音準(zhǔn)、節(jié)奏以及情感5項指標(biāo)做出有效評價,并利用各項指標(biāo)評價結(jié)果做出最終英語發(fā)音水平評價。本文系統(tǒng)可從不同方向評價學(xué)習(xí)者的英語發(fā)音水平,具有較高的評價有效性。
為進(jìn)一步驗證基于機(jī)器學(xué)習(xí)的英語發(fā)音水平評價系統(tǒng)模塊化設(shè)計結(jié)果的有效性,選取精確一致率、相鄰一致率以及Pearson相關(guān)系數(shù)作為性能評價的重要指標(biāo)。為更直觀展示本文系統(tǒng)評價性能,選取多元反饋系統(tǒng)(文獻(xiàn)[7]系統(tǒng))以及大數(shù)據(jù)分析系統(tǒng)(文獻(xiàn)[8]系統(tǒng))作為對比。英語發(fā)音水平評價實驗是針對相同英語語音樣本,考察不同系統(tǒng)評價與人工評價一致程度,其檢驗過程為:判斷人工評價置信度,人工評價結(jié)果為可信時,評價系統(tǒng)評價結(jié)果與人工評價結(jié)果間一致程度。
精確一致率公式如下:
相鄰一致性公式如下:
人工評價結(jié)果與系統(tǒng)評價結(jié)果等級差別為一級時的一致性為相鄰一致性。
采用3種系統(tǒng)評價該學(xué)生8段英語口語語音的發(fā)音水平,3種系統(tǒng)精確一致率對比結(jié)果如圖5所示。
采用3種系統(tǒng)評價該學(xué)生8段英語口語語音的發(fā)音水平,3種系統(tǒng)相鄰一致率對比結(jié)果如圖6所示。
圖5 精確一致率對比結(jié)果
圖6 相鄰一致率對比結(jié)果
采用3種系統(tǒng)評價該學(xué)生8段英語口語語音的發(fā)音水平,3種系統(tǒng)Pearson相關(guān)系數(shù)對比結(jié)果如圖7所示。
綜合分析圖5~7測試結(jié)果可以看出,采用本文系統(tǒng)評價8段英語發(fā)音水平的精確一致率、相鄰一致率以及Pearson相關(guān)系數(shù)均具有明顯高于兩種傳統(tǒng)系統(tǒng),系統(tǒng)測試結(jié)果有效驗證本文系統(tǒng)具有較高的評價性能。
圖7 Pearson相關(guān)系數(shù)對比結(jié)果
統(tǒng)計采用3種系統(tǒng)評價英語發(fā)音水平在不同錯讀音情況下的誤判率,評價結(jié)果如圖8所示。
圖8系統(tǒng)測試結(jié)果可以看出,采用本文系統(tǒng)評價該學(xué)生8段英語語音發(fā)音水平在不同錯讀音情況下的誤判率均明顯低于大數(shù)據(jù)分析系統(tǒng)以及多元反饋系統(tǒng)。
圖8 3種系統(tǒng)誤判率對比
本文系統(tǒng)評價該學(xué)生8段英語語音發(fā)音水平在不同錯讀音情況下誤判率均低于1%,測試結(jié)果有效說明本文系統(tǒng)可準(zhǔn)確判別英語語音中的錯讀音,評價結(jié)果更加精準(zhǔn)。
本研究選取S3C2440A芯片作為系統(tǒng)微處理器,選取多層小波特征尺度變化方法對英語口語發(fā)音信號實施降噪處理,依據(jù)調(diào)制脈沖的特征分解結(jié)果提取小波熵特征量,利用機(jī)器學(xué)習(xí)算法中的支持向量機(jī)實現(xiàn)英語口語發(fā)音水平評價。通過仿真測試驗證模塊化設(shè)計的英語發(fā)音水平評價系統(tǒng)具有較高的評價性能,發(fā)現(xiàn)其評價結(jié)果具有較高的準(zhǔn)確性以及可靠性,應(yīng)用價值較高。
雖然本研究取得了一定的效果,但英語發(fā)音水平評價系統(tǒng)在時效性等角度的應(yīng)用性能還有待提高。因此,在接下來的研究階段,將從提高評價時效性的角度對英語發(fā)音水平評價系統(tǒng)展開進(jìn)一步的優(yōu)化。
[1] 宋匡時,李翀,張士波. 一個輕量級分布式機(jī)器學(xué)習(xí)系統(tǒng)的設(shè)計與實現(xiàn)[J]. 計算機(jī)工程, 2020, 46(01): 201-207.
[2] 呂帥,李靖宇,李珺杰. 基于機(jī)器學(xué)習(xí)的建筑形體性能評價與修改輔助方法[J]. 建筑學(xué)報,2019, 605(02): 31-37.
[3] 張毅,張珉浩. 基于機(jī)器學(xué)習(xí)的能力評價與匹配研究[J]. 計算機(jī)工程與科學(xué),2019, 41(02): 363-369.
[4] 李克文,周廣悅,路慎強(qiáng),等. 一種基于機(jī)器學(xué)習(xí)的有利區(qū)評價新方法[J]. 特種油氣藏,2019, 26(03): 7-11.
[5] 李得立,李小磊,梁元,等. 基于機(jī)器學(xué)習(xí)算法的區(qū)域地質(zhì)環(huán)境承載力評價方法研究[J]. 中國礦業(yè),2018, 27(09): 75-81.
[6] 周祥明,陳員義,林苑,等. 基于機(jī)器學(xué)習(xí)的船舶吃水動態(tài)檢測系統(tǒng)設(shè)計[J]. 艦船科學(xué)技術(shù),2019, 41(10): 220-222.
[7] 李廣鳳. 基于自動評價系統(tǒng)的多元反饋對英語作文修改的影響研究[J]. 外語教學(xué),2019, 40(04): 72-76.
[8] 張慧丹. 基于大數(shù)據(jù)分析的英語泛在學(xué)習(xí)生態(tài)系統(tǒng)[J]. 教學(xué)與管理,2017(09): 107-109.
[9] 俞萍. 能力本位教育指導(dǎo)下的郵輪英語課程模塊化建設(shè)[J]. 商業(yè)經(jīng)濟(jì)研究,2018(18): 180-182.
[10] 歐陽琨. 基于CBE的高職院校公共英語教學(xué)實踐探究[J]. 職教論壇, 2017(35): 63-66.
[11] 李驍馳,趙祥模,徐志剛,等. 面向智能網(wǎng)聯(lián)交通系統(tǒng)的模塊化柔性試驗場[J]. 中國公路學(xué)報,2019, 32(06): 137-146.
[12] 劉森,牛子杰. 優(yōu)化英語語音教學(xué)多元評價模式的實證研究[J]. 外語教學(xué)理論與實踐,2018(04): 62-68.
[13] 陳卉. 英語專業(yè)翻譯課程形成性評價體系改革研究[J]. 外國語文,2017, 33(04): 133-136.
[14] 安鑫,張影,康安,等. 基于機(jī)器學(xué)習(xí)的異構(gòu)多核處理器系統(tǒng)在線映射方法[J]. 計算機(jī)應(yīng)用,2019, 39(06): 1753-1759.
[15] 安苗苗,肖狄虎. 基于摩托羅拉手機(jī)模塊化設(shè)計的定量評價研究[J]. 包裝工程,2018, 39(14): 172-176.
Modular design of English pronunciation evaluation system based on machine learning
LIU Min
(Xuancheng Vocational and Technical College, Anhui Xuancheng 242000, China)
With the goal of improving the accuracy of English pronunciation level evaluation, this study modularized the English pronunciation level evaluation system based on machine learning. S3C2440A chip is used as the main processor of the system, and the spoken English recording is sent to the evaluation module through the voice upload module. In the evaluation module, through layers of small potter character scale transform method for pronunciation signal filter processing, and decomposition, extract the intonation, speed, intonation, rhythm and emotional characteristics, and then radial basis kernel function is selected as the kernel function of support vector machine (SVM), combining feature extraction as a result, the method based on support vector machine (SVM) English pronunciation level evaluation, and evaluation result through data visualization module display. The test results show that the misjudgment rate of different mispronunciations is less than 1% when the system is used to evaluate English pronunciation level, which proves that the system has high evaluation accuracy.
machine learning;English;pronunciation level;evaluation system;modular design;support vector machine
2020-12-17
劉敏(1984-),女,安徽宣城人,碩士,講師,主要從事英語語言學(xué)、英漢翻譯、教學(xué)法研究,qq644169836@126.com。
TN912.3
A
1007-984X(2021)04-0016-06