黃菁彥 談一帆 熊偉 李沛秦
摘? ?要:作為電子信息類專業(yè)的核心課程之一,人工智能與模式識別課程理論性較強,抽象公式較多,教學存在一定難度。文章以知識點“K-means聚類”的教學為例,探討以具體案例引導學生開展課程實驗,并將課堂教學與課外競賽相結合,促進相關知識融會貫通并用于實踐。該方法在理論授課的基礎上,以案例實現和學科競賽為抓手,培養(yǎng)學生使用所學知識設計技術方案以及解決實際問題的能力。實踐證明,該方法可以充分激發(fā)學習興趣,加深學生對理論知識的理解,提升創(chuàng)新實踐能力。
關鍵詞:案例式教學;聚類分析;實驗設計
中圖分類號:G642 文獻標志碼:A? ? 文章編號:1673-8454(2021)22-0084-04
一、引言
人工智能與模式識別(Artificial Intelligence and Pattern Recognition,AIPR)是計算機科學、控制論、神經生理學、心理學等多個學科互相滲透而發(fā)展起來的一門綜合性交叉學科。其覆蓋領域十分廣泛,包括自然語言理解、機器定理證明、自動程序設計、博弈和決策、人工神經網絡等。作為理論性和前沿性都很強的學科,人工智能與模式識別在國民經濟和國防建設的各技術領域得到廣泛研究和應用,已經成為理工科電子信息類專業(yè)的核心專業(yè)課程之一。該課程涉及計算機技術、信號處理、控制論等專業(yè)知識,綜合性、交叉性強,教學難度較大。
案例式教學可以從解決實際工程問題的角度幫助學生深入理解內容抽象的算法原理,以及具有難度的編程實現過程[1]。以該課程的“聚類分析”一章為例,聚類是一種非監(jiān)督學習方法,將數據按照相似性進行重新組合而成為多個類的過程[2]。聚類的定義和計算過程具有系統(tǒng)而嚴謹的表達方式,其中涉及的相似度測度、線性代數運算等給理解增加了一定的難度,算法代碼實現過程也面臨著向量運算等困難。該課程教學團隊在授課過程中探索了以案例驅動,結合學科競賽,指導學生設計并實現基于K-means聚類算法解決實際問題的實踐教學方法。
二、K-means聚類算法簡述
K-means算法是人工智能與模式識別課程中經典的動態(tài)聚類算法,其基本思想是在樣本空間設置k個初始聚類中心,分別計算樣本到k個中心點的距離,根據距離大小劃分類別,通過迭代逐次更新聚類中心點,直到類別中心點不再發(fā)生變化或者變化范圍很小,迭代結束[3]。
1.數學定義
(1)任選k個模式特征矢量作為初始聚類中心:z(0)
1,z(0)
2,…,z(0)
k。
(2)將待聚類的模式特征矢量集{xi}中的模式逐個按最小距離原則劃分為k類中的某一類,即:如果d(m)
il? =[d(m)
ij? ](i=1,2,…,N,j=1,2,…,k)則判定xi∈ω(m+1)
l? ? ?,式中:d(m)
ij? 表示xi和ω(m)
j? ?中心z(m)
j? 的距離,上角標表示迭代次數。于是產生新的聚類ω(m+1)
j? ? ?(j=1,2,…,k)。
(3)計算重新聚類后的各類心
zm+1
j? ? ?=∑xi∈ω(m+1)
j? ? ?xi(j=1,2,…,k)
式中n(m+1)
j? ? ?為ω(m+1)
j? ? ?類所含模式的個數。
2.直觀表示
K-means聚類通常以歐氏距離為聚類依據,使各模式到其所判屬類別中心距離平方之和最小,算法簡單且收斂。模式呈現類內團狀分布,效果較好,故應用較多。以三維點陣為例,待聚類點和聚類迭代結束后的效果如圖1所示。
K-means聚類的算法原理簡單清晰,便于直觀地從相似性角度理解模式之間的劃分。但是其實現過程使用了較多的序號來區(qū)分不同的變量,以及同一變量的不同特征;而且對于實際問題中的待聚類數據,通常由多維特征構成,多維的變量組成成分也為特征的數據索引帶來困難。上述因素對學生理解和實現算法增加了難度。
三、案例式教學方案
在案例式教學方法中,學生一般應提前掌握課程有關的基本原理和知識,接著由教師根據課程教學目標和能力培養(yǎng)的需要,精心選擇和設計合適的案例,設置討論題目,然后由學生以小組為單位對案例進行研討,并將研討結論在班級內進行分享和評價,從而達到培養(yǎng)學生從工程化角度分析問題的能力[4]。在人工智能與模式識別課程教學過程中,教學團隊首先引入實踐案例開展實驗促進學生理解課堂知識,進一步地引導學生應用所學知識參加課外競賽,實現了“理解知識—創(chuàng)新應用”的升級。
1.以興趣激發(fā)為導向,開展實踐教學
在工科面向應用型學科中,學生通常很關注這門學科如何運用到工程中,即在學習原理后希望能夠通過實踐檢驗理論知識,進而加深理論理解。該課程與計算機視覺技術緊密相關,視覺圖像不僅比公式內容豐富、形式新穎,直觀感受的背后也是對定義公式的檢驗和進一步理解[5]。對學生而言,以圖像為目標開展實驗,比單純的理論推導和數據運算更具有吸引力,更能激發(fā)興趣。因此該課程從計算機視覺領域引入工程案例:基于圖像數據對人體手勢進行識別。該案例通過電腦攝像頭獲取手勢圖像,進而進行特征的采集和模式聚類處理,使枯燥的理論變得觸手可及,有助于推動學生融入實驗,真正理解知識。
該課程使用Matlab作為編程工具開展手勢圖像聚類實驗?;贛atlab平臺的OS camera應用程序可以獲取實時圖像和視頻信息;圖形用戶界面(Graphical User Interface,GUI)是通過圖形顯示的方式進行計算機操作的用戶界面,具有很好的人機交互性、美觀性和實用性。設計GUI程序,可以進一步增強程序的可參與度和直觀展示效果。通過GUI控件和攝像頭連接獲取實時圖像數據,并送入均值聚類程序進行處理,就可以對手勢動作進行聚類。
學生在教師的指導下,設計并實現了GUI程序自動或手動截取攝像頭捕獲的手勢圖像進行聚類處理。其中圖像分辨率為320×240,可以自行設置聚類的模式數量。GUI界面如圖2所示。
獲取到圖像數據后,即將數據傳遞給K-means聚類程序進行處理,最后將聚類結果轉換為圖像矩陣,并標上聚類結果。其中標號相同的圖像表示被劃分成了同一類。手勢圖像聚類結果如圖3所示。
通過設計并完成“手勢識別”這一案例實驗,學生不僅復習了課堂所學的理論知識,鍛煉了編程開發(fā)能力,而且發(fā)現要提高聚類的正確率,應該減少背景干擾,并加大手勢在圖像中的空間占比。該方法具有兩方面好處:一方面激勵學生主動查找資料,或是專心學習新知識,找到上述問題的理論依據;二是增加了工程實踐的經驗。
2.以課外競賽為推力,促進創(chuàng)新實踐
傳統(tǒng)教學以面授知識為主要手段,但往往互動式、探索式教學模式更能培養(yǎng)學生的綜合能力。面向學科競賽的現實目標,學生有強烈的意愿和剛性的需求來積極學習、主動交流和不斷探索。此外競賽課題的方案設計具有很好的啟發(fā)性和針對性,以小組為單位成立討論組有助于培養(yǎng)學生的團結協(xié)作能力,因此,學科競賽非常適合用于開展案例式教學。為了進一步提高學生的創(chuàng)新實踐能力,引導本科生提前開展科學研究與工程實踐,該課程教學團隊以2021年國際大學生數學建模競賽(MCM/ICM)為契機,指導學生結合競賽,深入開展教學內容的創(chuàng)新實踐。
MCM/ICM是一項具有全球影響力的高水平大學生學術賽事,其題目來自生產和科研中的實際問題,需要綜合運用數學知識、計算機技術以及其他相關知識,還需要隊員之間密切合作,集體發(fā)揮隊員的創(chuàng)造性思維能力和分析問題、解決問題的綜合能力。競賽以三人(本科生)為一組,在四天時間內,就指定問題完成從建立模型、求解、驗證到論文撰寫的全部工作,考察大學生創(chuàng)新能力、實踐能力和綜合素質。2021年MCM/ICM的大數據類題目提供了眾多歌曲十四個類型特征的量化數據,要求利用這些特征數據對歌曲和創(chuàng)作者劃分流派,總結概括流派之內的相似性和流派之間的區(qū)別。該課程教學團隊指導參賽學生設計并實現實驗方案,使用K-means聚類,對特征數據進行處理,完成競賽題目的要求。
原始數據來源于競賽提供的四個數據集,包含了約43000組藝術家與其追隨者的對應關系及其各自的流派歸屬,和不同藝術家創(chuàng)作的約十萬首歌曲的十四種音樂特征量化數據。題目要求根據所提供的音樂特征數據進行流派劃分。當前大數據分析相關課程的實驗教學大多存在與實踐應用脫節(jié)的問題,造成學生解決問題能力存在不足等情況[6]。而本題屬于MCM/ICM題目中的大數據類型,歌曲數量大,歌曲特征維度多,與政策類題目不同,不適合采用公式推導、逐個分析的方式??刹捎镁稻垲惖淖詣臃椒ㄌ幚泶罅繑祿?。
根據常識可知,音樂流派是音樂分類的重要依據,不同單曲基于音量、節(jié)拍、結點等數據可以表征彼此之間的相似程度。通過因子分析法提取主要影響因子可減小運算量,提高算法性能[7]。
教學團隊指導學生根據聚類分析相關知識,隨機選取五萬首歌曲的特征數據作為聚類樣本,剩下的五萬首歌曲特征數據用于測試。以因子分析法提取六個音樂特征為樣本特征數據。然后按照K-means聚類的步驟,根據題目要求,將模式總數設為20,隨機設定初始類心,聚類依據為歐氏距離,最大迭代次數為30,迭代完成后獲得了穩(wěn)定的類心。結果如圖4所示。
在測試組的五萬首歌曲中,聚類正確率約為87%。此外,通過類間類內距離比值評價聚類效果[8],按照上述聚類方式,類間距離與類內距離比值約為1.24,符合音樂流派劃分的實際規(guī)則,即流派內有一定的相似度,流派間有一定的區(qū)別,至此已經完成了題目的要求。盡管技術指標離該領域的頂級水準還有較大的距離,但作為本科階段學生,在極短的規(guī)定時間內將所學知識應用于競賽,完成選題、方案設計、編程實現、文檔撰寫等任務,顯然取得了明顯的正面意義,進一步深入理解了理論知識,培養(yǎng)了創(chuàng)新思維,鍛煉了綜合能力。
四、教學效果分析
以案例為載體,各類創(chuàng)新項目、學科競賽和科學研究為依托的實踐教學模式,可以培養(yǎng)學生的創(chuàng)新能力、思維能力、合作能力、科研能力、管理能力和工程意識[9]。
從學習效果角度來看,課堂手勢識別實驗幫助教學過程從理論公式推導的傳統(tǒng)課堂跳出來,以直觀便捷的實現形式刺激學習興趣,改善了人工智能與模式識別課程理論性較強、學生對部分知識點難以理解的問題,生動地解釋和檢驗了理論知識的正確性。學生在教師提供的參考代碼基礎上進行改進和擴展,通過對實時圖像的處理獲得了直觀感受,同時也提升了參與感和成就感,對課程理論有了更深刻的理解。音樂流派劃分實驗針對國際大學生數學建模競賽提出,并實現了技術方案。為了更好地完成比賽并從中學習大數據處理技術,在實驗中,學生主動尋求解決辦法,解決了編程過程中來自不同數據文件且多維的信息索引難題,使聚類分析能夠較好地自動提取和處理信息,研討并實踐了案例式教學理念。
從教學模式角度來看,以K-Means聚類為例的案例驅動并結合競賽的教學模式,能為學生提供更加多樣的能力訓練、教育環(huán)節(jié)及訓練方法,促進傳統(tǒng)以知識為核心的教育更加注重實踐能力培養(yǎng)。對于抽象的理論教學,可以適當降低教學難度,轉而以工程應用為目標導向,在實際應用中加強理解。教學對象往往希望可以獲得直觀感受和直接參與的機會,因此可以主動參與教學、主動討論理解、主動拓展運用。對核心知識對應的實現源代碼進行講解,使學生能夠全面學習數據模型、算法、數據結構等,有利于學生理解和分析知識點抽象理論的具體實現。通過介紹與應用緊密相關的科研項目,以及面向具體需求的工程實踐,可以提高學生“提出問題—分析問題—解決問題”的能力。
五、結語
大學生創(chuàng)新能力的培養(yǎng)是全面提高人才培養(yǎng)能力的重要內容。加快實踐環(huán)節(jié)改革,提升學生實踐能力的培養(yǎng)是繼續(xù)深化本科教學改革,全面提高教學質量的重要途徑[10]。人工智能與模式識別課程面向前沿熱點學科,其理論性、抽象性較強的特點往往給學生的理解和應用造成困難。在課堂教學中,教師如果拘泥于教學內容本身,忽視了學生關注點,會導致學生參與感較低,不利于提高學生學習興趣和學習效果。在案例式教學中,以創(chuàng)新實驗為基礎、以競賽課題為推力的教學模式,是典型的理論與實踐相結合過程。該方法在興趣的推動下,一方面加深學生對課程基本理論的理解,另一方面鍛煉學生的邏輯思維、軟件開發(fā)與項目管理等綜合技能,提升了學生的自主創(chuàng)新實踐能力。
參考文獻:
[1]余萍,韓東升,李然,等.案例式“通信電子電路”模塊化實驗方案設計與實踐[J].實驗技術與管理,2019,36(12):174-177.
[2]李珺,劉鶴,朱良寬.基于改進的K-means算法的關聯(lián)規(guī)則數據挖掘研究[J].小型微型計算機系統(tǒng),2021,42(1):15-19.
[3]曾俊.基于劃分的數據挖掘K-means聚類算法分析[J].現代電子技術,2020,43(3):14-17.
[4]彭德巍.人工智能課程實驗案例研究與實踐[J].大學教育,2021(2):71-74.
[5]孫???計算機視覺與人工智能產業(yè)發(fā)展[J].數碼設計(上),2020,9(7):5-6.
[6]王振武.基于阿里云大數據平臺的“數據挖掘”課程實驗教學方法探討[J].實驗室研究與探索,2018,37(6):192-196.
[7]潘鎮(zhèn)鋒.基于深度學習的MIDI音樂流派分類研究[D].廣東:華南理工大學,2019.
[8]文靜,曹妍,張琳,等.基于雙重遺傳的聚類分析算法研究[J].計算機工程與科學,2017,39(12):2320-2325.
[9]張曉光,湯文豪,王艷芬,等.數字信號處理案例教學法研究與實踐[J].實驗技術與管理,2018,35(5):214-217+235.
[10]教育部.教育部關于進一步深化本科教學改革全面提高教學質量的若干意見[J].中國大學教學,2007(3): 9-11.
(編輯:王曉明)