楊 澤
(廣東理工學院,廣東 肇慶 526100)
機器學習技術使得計算機賦予了人類的智慧,其應用已經涉及人們日常生活的各個方面。近些年來,隨著人工智能技術的發(fā)展,許多高校已經開設了人工智能專業(yè)課程,機器學習是人工智能的核心研究領域之一?,F(xiàn)如今,在智能教學、智能交通、智能建筑等領域更是離不開人工智能。國內缺乏人工智能方面的人才,所以,對高?!皺C器學習”課程的改革很有必要。
如何順應當前絕大多數(shù)高校培養(yǎng)計算機人才的發(fā)展目標,培養(yǎng)人工智能領域的人才成為當前高校的發(fā)展方向之一?!皺C器學習”作為人工智能領域中比較重要的核心課程,本身偏向于理論與實踐相結合,在傳統(tǒng)的理論教學中去輔助實踐,從而提高高校學生的主觀能動性。所以,培養(yǎng)大學生的動手實踐能力也就成為最主要的問題,這也是當前對于“機器學習”課程進行教學改革亟須解決的問題之一。
目前,許多高校的本科“機器學習”課程沒有清晰的教學目標,因此,課程改革的第一步就是對教學目標進行細化,分等級掌握該門課程的核心內容。
(1)學生要了解當前機器學習最前沿的技術以及分別可以處理的任務。(2)要掌握機器學習中的兩大分類,以及常見基本術語的含義,在監(jiān)督學習與無監(jiān)督學習中他們各自的一些經典算法,比如K近鄰、樸素貝葉斯、決策樹與隨機森林等,為進一步學習研究建立有關概念和方法打下理論基礎以及做好前期的鋪墊。(3)在掌握了常見的幾種算法后要能夠運用機器學習方法來分析實際問題(如手寫數(shù)字識別、推薦系統(tǒng)的設計、目標識別、紅綠燈檢測、房價預測等)。通過這種分級別去掌握的方式,使學生逐步掌握核心內容。要從具體的實例著手,使學生先去理解課本上最基本的理論知識和原理,然后用機器學習的基本框架去實現(xiàn)任務,突出理論與實踐相結合。
(1)“機器學習”是一門不僅停留在理論知識的課程,更偏向利用理論知識去解決實際問題的方式。所以,目前絕大多數(shù)高校課堂的教學方式需要調整,不能只由教師一味地教。基于對“機器學習”中基本知識概念的理解,以實踐和應用為手段,以提高能力為目標,適當改變老師的教學方法,在教學中采用老師與學生互動的方式,讓學生積極參與到學習過程中去。
(2)可以通過翻轉課堂來選擇基礎較好的、理解和掌握能力較高的學生。一方面,教師能夠掌握學生的學習狀況,并通過互動來提高其學習興趣。另一方面,可以使學生擺脫從被動接受知識到主動學習,徹底擺脫傳統(tǒng)無聊的填鴨式教學,改變學習角色。
課程內容的教學(例如機器學習中的十大經典算法)均從案例中得出,從特定的例子中去引出相關概念,介紹相關技術,通過該技術具體對案例進行實現(xiàn)并評價驗證。采用這樣一個主線的方式,課堂講解以提出具體需求案例,以算法框架形式給出本次課的主要內容,先讓學生有一個整體的學習框架,明確在學習中需要具體學習的知識。如在決策樹算法教學中,應給出該算法的應用場景案例,如圖1所示,假定推銷員從他多年的銷售經驗中知道消費者是否會購買汽車與年齡、性別和收入有著直接關系。
圖1 決策樹
通過分析示例,首先要弄清的是:(1)計算機要訓練模型的原始數(shù)據(jù),也就是訓練樣本集,目標任務就是構造一個能夠準確估計出消費者是否會買車的決策樹。(2)原始的數(shù)據(jù)是否需要預先進行處理。一般要對訓練樣本集要進行預處理,比如本例將年齡分為兩個階段:小于30和30歲以上;收入分為3個檔次:3 000 以下(低)、3 000~6 000(中)、6 000以上(高)。(3)計算機具體如何進行學習。選擇合適的算法來對預處理后的數(shù)據(jù)進行訓練模型,對于本例,經典ID3算法可用于首先計算當前節(jié)點中包含的所有樣本的熵不純度,確定樣本中的多個候選特征,并計算與每個特征相對應的每個樣本的熵不純度,其次分別計算并比較與每個特征相對應的熵不純度的減少量,即信息增益,并且選擇減少量最大的特征作為決策樹的根節(jié)點的特征,以構建第一級。分析其余的特征,用來構建決策樹的下一級。如果后繼節(jié)點僅包含單一類樣本,則分支的增長將停止,并且定義該節(jié)點是葉節(jié)點。如果后繼節(jié)點仍包含不同類別的樣本,則再次執(zhí)行上述步驟,直到每一個枝都到達葉節(jié)點。(4)計算機最終的學習效果??梢杂貌煌脑u價指標來衡量訓練出來的模型的效果,比如通過準確率、精確率、召回率、關系等評價指標來衡量。
本科生對于接受知識的能力有很大的不同,所以,傳統(tǒng)的考核方式如閉卷或開卷并不能真實地反映學生對于知識的接受程度。在實際的教學實踐過程中,最終理論的期末考試成績不應該直接作為考核學生對于這門課程的掌握情況的評判,老師應該在最終的考核方式中加入各種除了成績之外的其他評判標準,這樣有利于激發(fā)學生學習的積極性,也能幫助學生克服惰性。
除此之外,還可以鼓勵學生參與到老師的項目中去,更進一步鍛煉學生動手寫代碼的能力以及對論文的撰寫能力,對今后進行研究生階段的學習也有很大的幫助。對于本課程的期末綜合評定如表1所示,從各個方面、多個角度更加科學地評判每個學生的掌握情況。
表1 “機器學習”期末考核方式
人工智能時代機器學習是一個比較熱門的領域,該領域的人才也比較緊缺,要求不僅要掌握課本上的理論知識,更要注重實踐去解決實際問題,越來越多的學習者開始致力于該領域的研究。但由于其是一門對學科交叉涉及太多數(shù)學方面的知識,導致很多本科生很難進一步進行研究。高校對機器學習領域人才的培養(yǎng)不能與實踐脫離,應該積極與企業(yè)建立項目合作,讓學生投入真正的實踐中去,知道企業(yè)公司真正的需求,高校還可以引進一些有實際項目經驗的工程師來指導學生,從而在很大程度上幫學生更好地掌握和理解該領域前沿的知識。