趙小燕,梁瑞宇,童瑩,包永強,王青云
摘? 要: 語音信號處理技術(shù)具有很強的專業(yè)性、先進性和實用性。將項目驅(qū)動教學法應用于語音信號處理課程教學,從項目設置、項目執(zhí)行和項目評價等方面探索其實施路徑,并以聲源定位為例,闡述教學實施過程。教學實踐表明,該模式有效激發(fā)了學生的學習積極性和主動性,提升了學生綜合應用知識的能力,為學生今后開展科研和開發(fā)工作打下了良好基礎。
關鍵詞: 語音信號處理; 項目驅(qū)動教學; 聲源定位; 教學實施
中圖分類號:G642? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2022)06-112-04
Exploration and application of project-driven teaching method
in the speech signal processing course
Zhao Xiaoyan, Liang Ruiyu, Tong Ying, Bao Yongqiang, Wang Qingyun
(School of Information and Communication Engineering, Nanjing Institute of Technology, Nanjing, Jiangsu 21167, China)
Abstract: The speech signal processing course is highly specialized, advanced and practical. The project-driven teaching method is applied to the teaching of this course, and its implementation path is explored in terms of project setting, project implementation and project evaluation. Taking sound source localization as an example, the teaching implementation process is described. The results of practical teaching show that the mode has effectively simulated students' learning enthusiasm and initiative, improved their ability to comprehensively apply knowledge, and laid a good foundation for students to carry out scientific research and development work in the future.
Key words: speech signal processing; project-driven teaching; sound source localization; teaching implementation
0 引言
語音信號處理技術(shù)是人類社會走向智能化的關鍵技術(shù)之一。語音信號處理以語音語言學和數(shù)字信號處理為基礎,與生理學、心理學、計算機科學、模式識別和人工智能等學科有著密切聯(lián)系[1,2]。語音信號處理是信息工程專業(yè)重要的專業(yè)課,具備專業(yè)性、先進性和實用性。傳統(tǒng)單一的教學模式(板書、多媒體課件展示等)難以實現(xiàn)對學生自學能力、理論聯(lián)系實際的能力、實踐能力和科研能力的培養(yǎng),加之課程的理論復雜、內(nèi)容更新快、學習難度大,很多學生的學習積極性和主動性不高,甚至產(chǎn)生了畏難和厭學情緒,教學效果不佳。本文探索在語音信號處理課程教學中采用項目驅(qū)動教學法,將教學內(nèi)容融入實際工程項目,讓學生主動參與教學活動、自主完成項目。本文以聲源定位為例,闡述具體教學實施過程。實踐表明,該教學方法顯著提高了教學效果。
1 項目驅(qū)動教學法在語音信號處理過程中的實施過程
語音信號處理課程的教學內(nèi)容包括語音信號處理基礎知識、分析方法及技術(shù)與應用三部分。語音信號處理基礎知識包括語音信號的產(chǎn)生、特性、數(shù)學模型等;分析方法包括預處理、倒譜分析、線性預測分析、特征參數(shù)估計等;技術(shù)與應用包括語音增強、語音識別、聲源定位等[3,4]。前兩部分內(nèi)容是本課程的基礎理論,采用傳統(tǒng)教學模式。第三部分內(nèi)容采用項目驅(qū)動教學模式,教師設計與教學內(nèi)容相關的實際項目,引導學生在完成項目的同時逐步完成課程內(nèi)容的學習[5]。項目驅(qū)動教學法以教師作為教學主導,以學生作為教學主體[6]。教師設計項目選題,細化任務點,指導和幫助學生執(zhí)行項目任務;學生自主學習,協(xié)作分工,完成項目任務。教學實施過程包括項目設置、項目執(zhí)行和項目評價三個步驟。
1.1 項目設置
教師設置與課程相關的項目選題,將知識點融入項目的不同環(huán)節(jié)。規(guī)劃項目時應充分考慮項目的專業(yè)性、可實施性、知識點覆蓋以及與實際應用的銜接。結(jié)合教學大綱要求,共設置了八個選題,分別是語音增強、語音合成、語音識別、說話人識別、情感識別、聲源定位、語音編碼和語音隱藏,涵蓋了本課程第三部分教學內(nèi)容。以聲源定位為例,教師將項目細分為四個環(huán)節(jié):房間聲學環(huán)境分析、基于時延差的聲源定位、基于可控波束形成的聲源定位和拓展任務,各環(huán)節(jié)循序漸進、環(huán)環(huán)相扣,每一個環(huán)節(jié)包含若干任務點,內(nèi)容涵蓋了聲源定位主要知識點和應用場景,兼顧理論性和實用性。學生組成3-4人的項目小組,自由選擇課題。
1.2 項目執(zhí)行
在項目執(zhí)行階段,學生帶著任務,先查閱資料、學習理論知識;然后分析項目內(nèi)容、分配任務、制定方案、完成項目;最后提交項目作品、撰寫項目報告,并進行匯報答辯。在此過程中,教師需及時關注項目進展,參與討論,幫助學生梳理理論知識,指導學生分析項目內(nèi)容,引導學生將理論知識應用于項目設計開發(fā),同時提供一些必備的資料,如數(shù)據(jù)庫、函數(shù)庫、參考文獻等。以聲源定位為例,學生查閱文獻資料,自學聲源定位的理論知識。然后,教師指導學生運用理論知識分析該項目的四個環(huán)節(jié)任務,包括房間聲學建模理論、時延差估計算法、波束形成理論等,逐步引導學生完善解決方案。最終,學生自主完成項目內(nèi)容,具體包括:方案設計、程序編寫、調(diào)試仿真、結(jié)果分析、成果演示、匯報答辯等。
1.3 項目評價
根據(jù)項目的完成情況進行評價,總結(jié)教學效果。項目評價包括:執(zhí)行情況(50%)、匯報答辯(30%)、項目報告(20%)。執(zhí)行情況主要考查方案制定情況、自主學習能力、知識綜合應用能力、實踐動手能力、項目完成質(zhì)量。匯報答辯主要考察學生的理論知識掌握程度和語言表達能力。答辯時要求學生匯報整個項目流程,演示項目成果,講解其涉及的理論知識。執(zhí)行情況和匯報答辯均采用教師評價、組間互評、組內(nèi)互評相結(jié)合的方式。項目報告主要考察報告的完整性、規(guī)范性、準確性和創(chuàng)新性,報告內(nèi)容包括課題背景、方案流程、算法原理、實現(xiàn)過程、結(jié)果分析、歸納總結(jié)、參考文獻等。
2 “聲源定位”教學設計
以聲源定位為例,說明項目驅(qū)動教學法在語音信號處理課程中的應用實踐。
2.1 房間聲學環(huán)境分析
建立靈活、合理的房間聲學模型對聲源定位算法的運行、評估具有重要的作用[2]。鏡像(Image)法是構(gòu)建室內(nèi)聲學環(huán)境模型最常用的方法之一,該方法通過建立房間脈沖響應模仿室內(nèi)聲學環(huán)境。教師幫助學生梳理房間聲學理論知識,學生用MATLAB語言實現(xiàn)Image算法,完成以下任務:
⑴ 總結(jié)影響房間脈沖響應的因素;
⑵ 從房間脈沖響應中獲取直達聲傳播時間;
⑶ 已知房間環(huán)境和聲源原始信號,模擬傳聲器接收信號。
圖1是不同混響時間的房間脈沖響應。由圖1可見,混響時間為0s時,聲學環(huán)境模型為理想自由聲場,聲波經(jīng)過一段傳播時間后直達接收點,傳聲器接收信號中只有直達聲。隨著混響時間增大,聲波在室內(nèi)各方向來回反射又逐漸衰減,接收信號包含直達聲和混響聲。后續(xù)“時延差估計算法”中所指的“時延”即指直達聲的傳播時間τ,其理論值為τ=d/c,其中d表示聲源到接收點的距離,c表示聲波傳播速度。
圖2是聲源原始語音信號和傳聲器接收信號,混響時間為0.3s,信噪比為20dB。具體實施過程為:將聲源信號與房間脈沖響應卷積,然后根據(jù)信噪比加上噪聲。學生可以通過音頻播放,對比原始信號和接收信號的差異,直觀感受混響時間對接收信號的影響。
該環(huán)節(jié)難度不高,學生可獨立完成。通過上述任務,可以完成以下知識點的教學:
⑴ 直達聲、混響聲、混響時間的概念,影響房間脈沖響應的因素;
⑵ 房間聲學環(huán)境的建模方法;
⑶ 已知房間環(huán)境和聲源原始信號,模擬傳聲器接收信號。
2.2 基于時延差的聲源定位
在獲得傳聲器接收信號的基礎上,引入下一個教學內(nèi)容,即如何利用接收信號實現(xiàn)聲源定位。定位方法主要有高分辨率譜估計法、可控波束形成法和基于時延差的方法。基于時延差的定位方法計算量小、易于實現(xiàn)、應用廣泛,因此項目從該方法入手,任務要求如下:①利用傳聲器陣列的接收信號,估計陣元間的時延差;②根據(jù)時延差和陣列幾何位置進行聲源定位。
基于時延差定位的第一步是進行時延差估計,其精度決定了定位系統(tǒng)的精度。廣義互相關法是一種經(jīng)典的時延差估計算法,該算法求兩信號之間的互功率譜,并在頻域內(nèi)給予一定的加權(quán),以抑制噪聲和混響的影響,再反變換到時域,得到兩信號之間的互相關函數(shù),通過檢測互相關函數(shù)的峰值估計時延差[2]。圖3為不同加權(quán)的廣義互相關函數(shù)。學生調(diào)整混響和噪聲環(huán)境,測試和分析各加權(quán)函數(shù)對噪聲和混響的抑制能力。基于時延差定位的第二步是根據(jù)測定的時延差和陣列幾何位置計算聲源位置,定位方法有球形插值法、線性相交法、最小二乘擬合法等。學生根據(jù)實際情況選擇算法,完成聲源定位任務。
該環(huán)節(jié)有一定難度,教師需要幫助學生梳理時延估計方法、最小二乘擬合等理論知識,指導學生進行算法特性分析,引導學生思考如何根據(jù)實際應用場景選擇合適的方法。通過上述任務,可以完成以下知識點的教學:
⑴ 廣義互相關法的概念、步驟;
⑵ 各種加權(quán)函數(shù)的特性;
⑶ 根據(jù)時延差確定聲源位置的方法。
2.3 基于可控波束形成的聲源定位
基于時延差的定位算法對噪聲和混響的魯棒性不強。為提高定位性能,引入下一個教學內(nèi)容,即采用可控波束形成法實現(xiàn)聲源定位,任務要求如下:
⑴ 實現(xiàn)可控波束形成聲源定位算法;
⑵ 測試不同聲學環(huán)境中可控波束形成法的定位精度和魯棒性;
⑶ 對比可控波束形成法和基于時延差定位方法的性能。
波束形成法用聲波的達到時延差控制波束方向,使輸出功率最大的波束方位即為聲源的方位。學生自學波束形成理論知識,用MATLAB語言實現(xiàn)相位變換加權(quán)的可控波束形成法。圖4為不同噪聲環(huán)境下,均勻圓陣的波束形成輸出功率。由圖可見,噪聲使空間功率譜呈現(xiàn)較多的局部峰值,對定位結(jié)果造成影響。
該環(huán)節(jié)有一定難度,教師需要幫助學生梳理波束形成理論知識,指導學生比較和評價不同算法,總結(jié)各算法的優(yōu)缺點和適用情境。通過上述任務,可以完成以下知識點的教學:
⑴ 波束形成的概念和計算流程;
⑵ 波束形成的輸出功率與廣義互相關之間的關系;
⑶ 算法運行的評價方法。
2.4 拓展任務
針對復雜聲學環(huán)境下的聲源定位,引導學生研究以下問題:
⑴ 將傳統(tǒng)定位算法與機器學習相結(jié)合,實現(xiàn)基于分類機制的定位;
⑵ 引入子帶的方式實現(xiàn)多聲源定位。
以上擴展任務可拓寬學生思路,培養(yǎng)學生創(chuàng)新思維和科研能力。
3 結(jié)束語
將項目驅(qū)動教學法應用于語音信號處理課程的教學,以教師作為教學主導,把教學內(nèi)容融入實際工程項目,讓學生自主完成項目,從而實現(xiàn)主動學習。教學實踐表明,該教學模式取得了很好的教學效果。首先,學生學習的積極性和主動性被激發(fā),師生間的教學互動得到加強;第二,學生實現(xiàn)了基礎理論知識與實際應用的銜接,自學能力、實踐能力、科研能力、綜合知識應用能力都得到提升;第三,學生之間的團隊協(xié)作精神得到加強;最后,學生的語言表達能力得到鍛煉。此教學模式在信息工程專業(yè)其他課程教學中具有一定的推廣和借鑒意義。當然,該教學模式還需要不斷完善,如何更好地融入工程教育理念,如何更科學精確地對學生進行考核和評價,如何將人工智能技術(shù)引入到課程教學,這些都需要進一步改進和探索。
參考文獻(References):
[1] 胡航.現(xiàn)代語音信號處理[M].電子工業(yè)出版社,2014
[2] 梁瑞宇,趙力,王青云.語音信號處理(C++版)[M]. 機械工業(yè),2018
[3] 梁瑞宇,包永強,唐閨臣,等.語音信號處理實踐課程的教學研究與改革[J].高教特刊,2019(13):73-75
[4] 王青云,梁瑞宇,趙力,馮月芹,包永強.實時語音信號處理教學與實驗方法研究[J]. 實驗室研究與探索,2019,38(9):186-189
[5] 蘭義華,齊慶磊,張振蓮.項目驅(qū)動的學習共同體教學模式在數(shù)據(jù)庫課程教學中的探索與實踐[J]. 計算機時代,2020(10):95-98
[6] 郝中騏,劉莉,史久林,萬生鵬.“雙創(chuàng)”背景下光電類課程微項目驅(qū)動教學研究[J].教育教學論壇,2021(17):148-151