蔣正鋒 李海強
摘? 要:針對新工科視域下工程專業(yè)對學(xué)生具有扎實理論基礎(chǔ),較強的實驗實踐操作能力,強烈工程創(chuàng)新意識的需求,探索抽象理論模型與具象實驗相結(jié)合的教學(xué)模式。設(shè)計隱馬爾科夫模型的實驗中,內(nèi)容涵蓋了數(shù)學(xué)與統(tǒng)計學(xué)、聲學(xué)與語言學(xué)、計算機與人工智能等多學(xué)科交叉的知識,通過逐步優(yōu)化多參數(shù)融合的隱馬爾科夫模型實驗,鍛煉了學(xué)生理論與實踐相結(jié)合,分析和解決復(fù)雜問題的能力,也解決了學(xué)生參與工程實踐與科研實踐的難題,將知識系統(tǒng)化、工程化、科研化,實現(xiàn)了新工科的培養(yǎng)理念。
關(guān)鍵詞:隱馬爾科夫模型;新工科;語音識別
中圖分類號:G642? ? ? ? 文獻標志碼:A? ? ? ? ? 文章編號:2096-000X(2021)21-0089-05
Abstract: In view of the needs of engineering majors in the field of new engineering, students have a solid theoretical foundation, strong experimental practice and engineering innovation consciousness, this paper explores a teaching mode that combines abstract theoretical models with concrete experiments. In the experiment of designing the hidden Markov model, the content covers the interdisciplinary knowledge of mathematics and statistics, acoustics and linguistics, computer and artificial intelligence. The Hidden Markov Model experiment with the gradual optimization of multi-parameter fusion exercises students' ability to combine theory and practice, to analyze and solve complex problems, also solves the problem of students participating in engineering practice and scientific research practice, systemizing, engineering, thus systematizing, engineering and scientific research knowledge and realizing the cultivation concept of new engineering.
Keywords: Hidden Markov Model; new engineering; speech recognition
為推動我國高等工程教育與產(chǎn)業(yè)發(fā)展更加緊密聯(lián)系,需對我國現(xiàn)階段的工程教育進行深入的改革和創(chuàng)新。2017年2月18日,教育部在復(fù)旦大學(xué)組織召開的工程教育戰(zhàn)略研討會議,開啟了我國新工科教育的探討,會議形成了《新工科建設(shè)復(fù)旦共識》文件[1-3]。隨著新一輪科技和產(chǎn)業(yè)革命驅(qū)動而形成與發(fā)展的新型經(jīng)濟,對我國的高等教育形成了新的挑戰(zhàn)[4]。而第四次工業(yè)革命的浪潮即將來臨,“互聯(lián)網(wǎng)+”、“一帶一路”倡議和“中國制造2025”等對我國高等教育改革發(fā)展提出新的要求,傳統(tǒng)類工科專業(yè)面臨著新的機遇和挑戰(zhàn)。教育部在2017年2月20日發(fā)布的《教育部高等教育司關(guān)于開展新工科研究與實踐的通知》指出,新型經(jīng)濟的出現(xiàn),對我國工程科技人員提出適應(yīng)新型經(jīng)濟的要求,從而需對我國高等工程教育進行改革。2017年4月8日在天津大學(xué)舉行了“新工科”建設(shè)的研討會,會后教育部發(fā)布了“新工科”建設(shè)行動綱領(lǐng)“天大行動”,行動綱領(lǐng)指明了“新工科”建設(shè)目標:“到2020年,探索并形成適應(yīng)新技術(shù),新產(chǎn)業(yè)和新經(jīng)濟發(fā)展的‘新工科模式;到2030年,將構(gòu)建完善的具有中國特色、有力地支持新型創(chuàng)新和發(fā)展的世界一流工程高等教育體系;到2050年形成具有中國特色、引領(lǐng)全球工程教育,建設(shè)成為世界工程創(chuàng)新中心和人才高地的工程教育強國”。為適應(yīng)新經(jīng)濟和新產(chǎn)業(yè)發(fā)展的需要,加強新型經(jīng)濟與工程教育的聯(lián)系,我國工程教育面臨一場挑戰(zhàn)與機遇并存的改革。加快新工科建設(shè),培養(yǎng)能面向未來,具有扎實的理論基礎(chǔ),較強的實踐動手能力,強烈工程創(chuàng)新意識的科技人才,適應(yīng)和引領(lǐng)新經(jīng)濟的發(fā)展[3-4]。針對綜合性復(fù)雜的隱馬爾科夫模型設(shè)計實驗,在掌握HTK(Hidden Markov Model Toolkit)的體系結(jié)構(gòu)與語音識別的基本原理基礎(chǔ)上,引入多參數(shù)融合對馬爾可夫模型逐步優(yōu)化的科研教學(xué)方法。使用HTK搭建一個基于隱馬爾科夫模型的離散數(shù)字語音識別系統(tǒng),融合了數(shù)學(xué)與統(tǒng)計學(xué)、聲學(xué)與語言學(xué)、計算機與人工智能等多學(xué)科前沿技術(shù)。通過MFCC(Mel Frequency Cepstral Coefficents)特征參數(shù)的維度、音節(jié)和聲韻母聲學(xué)模型、高斯混合分量個數(shù)等多參數(shù)的不同融合,逐步優(yōu)化隱馬爾科夫模型,鍛煉了學(xué)生的實踐能力和科研能力。以隱馬爾科夫模型設(shè)計實驗為紐帶,將所學(xué)知識系統(tǒng)化、工程化、科研化,實現(xiàn)了新工科的培養(yǎng)理念。
一、預(yù)備知識
(一)HMM在語音識別領(lǐng)域的地位
二十世紀八十年代時, 語音識別的重點放在大詞匯量、非特定人和連續(xù)語音上,識別算法從基于標準模板轉(zhuǎn)到基于統(tǒng)計模型的方法。語音具有時變性和短暫的平穩(wěn)性,而隱馬爾可夫模型能描述語音的這種特性,從而在語音識別領(lǐng)域引入馬爾可夫模型構(gòu)建聲學(xué)模型[5-6]。隨后其他的語音建模如HMM/VQ、HMM/高斯混合和HMM/人工神經(jīng)網(wǎng)絡(luò)模型在語音識別上取得突破性的進展,隨后HMM成為深度學(xué)習(xí)出現(xiàn)之前傳統(tǒng)語音識別技術(shù)中的主流技術(shù)[7-8]?;仡櫿Z音識別技術(shù)從實驗室走向應(yīng)用的發(fā)展過程,其中探索淺層神經(jīng)網(wǎng)絡(luò)、深度人工神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用繼續(xù)了多年,效果不理想,直到深度學(xué)習(xí)技術(shù)[8-9]在機器學(xué)習(xí)中的成功應(yīng)用才引起各個領(lǐng)域?qū)W者們的關(guān)注?;谏疃葘W(xué)習(xí)[10]的語音識別研究逐漸成為熱點[11]。雖深度學(xué)習(xí)技術(shù)已引入語音識別領(lǐng)域,但傳統(tǒng)大部分語音識別系統(tǒng)還是基于HMM的。