范照勇,詹翠麗
(湖北商貿(mào)學(xué)院 人工智能學(xué)院, 武漢 430079)
在國(guó)家全面實(shí)施人工智能戰(zhàn)略的背景下,無(wú)論從國(guó)家政策還是從市場(chǎng)供給需求來(lái)看,加強(qiáng)人工智能人才培養(yǎng)、補(bǔ)齊人才短板,都是亟待解決的問題。近年來(lái),各高校紛紛設(shè)立了智能科學(xué)與技術(shù)、人工智能、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)等培養(yǎng)人工智能人才的相關(guān)專業(yè)[1,2]。2019年3月,教育部公布了2018年度全國(guó)普通高等學(xué)校本科專業(yè)備案和審批結(jié)果,35所高校獲首批建設(shè)人工智能本科專業(yè)的資格。從獲準(zhǔn)的高校名單來(lái)看,除了一些老牌名校之外,也有江蘇科技大學(xué)、安徽工程大學(xué)等專業(yè)特色鮮明的地方性高校??梢灶A(yù)見,在人工智能迎來(lái)第三次發(fā)展浪潮的背景下,將有更多高校結(jié)合發(fā)展定位與學(xué)科優(yōu)勢(shì)特色,探索適合于自身的人工智能專業(yè)建設(shè)之路。
人工智能多學(xué)科交叉、高度復(fù)雜、強(qiáng)滲透性的特點(diǎn)決定了其人才培養(yǎng)具有高度挑戰(zhàn)性,而其中人才培養(yǎng)方案和課程體系是保證人才培養(yǎng)質(zhì)量的前提[1]。從開設(shè)人工智能專業(yè)的應(yīng)用型高校培養(yǎng)方案看,對(duì)人工智能相關(guān)專業(yè)學(xué)生的工程知識(shí)要求可以歸納為:能夠?qū)?shù)學(xué)、自然科學(xué)、信息科學(xué)基礎(chǔ)和人工智能專業(yè)知識(shí)應(yīng)用于解決復(fù)雜人工智能工程問題。在課程設(shè)置上,著重強(qiáng)調(diào)知識(shí)的實(shí)用性,更加突出概率、統(tǒng)計(jì)、隨機(jī)過程、優(yōu)化理論等數(shù)學(xué)方法的重要性,同時(shí)開設(shè)了諸多人工智能和機(jī)器學(xué)習(xí)的算法及應(yīng)用實(shí)踐課程。然而,部分高校卻忽視了融合微積分、概率論和統(tǒng)計(jì)學(xué)等人工智能深度學(xué)習(xí)基本組成部分的信息論課程。對(duì)于人工智能相關(guān)專業(yè)學(xué)生的知識(shí)體系而言,這在一定程度上將會(huì)導(dǎo)致數(shù)學(xué)基礎(chǔ)和具體算法應(yīng)用之間“形成溝壑”,使得培養(yǎng)方案中先修人工智能數(shù)學(xué)基礎(chǔ)課程和后續(xù)人工智能應(yīng)用課程之間難以良好銜接。
本文針對(duì)應(yīng)用型高校人工智能相關(guān)專業(yè)課程體系的建設(shè)需求,分析信息論與人工智能的強(qiáng)關(guān)聯(lián)性,區(qū)分人工智能核心專業(yè)(人工智能、智能科學(xué)與技術(shù)、計(jì)算機(jī)科學(xué)與技術(shù)、通信、電子信息等)和“人工智能+”專業(yè)(金融、統(tǒng)計(jì)、電商、管理等),改革教學(xué)內(nèi)容、教學(xué)方法和考核方式,為學(xué)生學(xué)習(xí)后續(xù)課程和解決專業(yè)現(xiàn)實(shí)問題打下堅(jiān)實(shí)的理論基礎(chǔ)。
信息論是現(xiàn)代信息科學(xué)和計(jì)算機(jī)技術(shù)的重要基礎(chǔ)理論之一,源于對(duì)現(xiàn)代通信的深入研究[3]。1948年,香農(nóng)發(fā)表的學(xué)術(shù)論文“通信的數(shù)學(xué)理論”開啟了經(jīng)典信息理論,主要內(nèi)容包括信息度量理論、信源編碼理論、糾錯(cuò)編碼理論等。
此后,信息論作為一門獨(dú)立的學(xué)科不斷發(fā)展,新時(shí)代下的信息論所研究的內(nèi)容不僅僅包括信息的度量、獲取、處理等問題,還逐漸與其他相關(guān)領(lǐng)域融合,例如語(yǔ)義學(xué)、神經(jīng)心理學(xué)、語(yǔ)言學(xué)等等;應(yīng)用場(chǎng)景更是涉及到高校思想政治教育、科技英語(yǔ)翻譯、數(shù)字營(yíng)銷、經(jīng)濟(jì)學(xué)等各個(gè)領(lǐng)域[4-6]。但是,在高校本科教育階段,《信息論》課程依然僅僅面向通信工程專業(yè)學(xué)生講授。近年,也有相關(guān)院校逐步將信息論課程開設(shè)至網(wǎng)絡(luò)安全、計(jì)算機(jī)科學(xué)等與通信工程相近的專業(yè)[7]。
信息論是現(xiàn)代信息科學(xué)的重要組成部分,人工智能是一門研究如何使機(jī)器具有人類智能的學(xué)科,是當(dāng)下最熱門的行業(yè)方向,二者之間一直是“一體兩面”的關(guān)系。例如,對(duì)于人工智能領(lǐng)域的機(jī)器學(xué)習(xí),劍橋大學(xué)教授David MacKay說“Information theory and machine learning are the two sides of the same coin”[8]。信息論與機(jī)器學(xué)習(xí)同為涉及計(jì)算機(jī)科學(xué)和應(yīng)用數(shù)學(xué)等學(xué)科的分支領(lǐng)域,二者在起源和應(yīng)用上有很多相似之處。信息論方法在人工智能方向多種應(yīng)用算法中同樣有重要作用,特別對(duì)信息統(tǒng)計(jì)、數(shù)據(jù)挖掘等領(lǐng)域的發(fā)展有重要意義。
2.2.1 典型機(jī)器學(xué)習(xí)過程中信息論的運(yùn)用
在人工智能方法實(shí)際應(yīng)用中,通常需要利用信息論理論知識(shí)。類似機(jī)器學(xué)習(xí)、模式識(shí)別和深度學(xué)習(xí)等實(shí)現(xiàn)人工智能的具體手段,其原理與信息論的理論具有較強(qiáng)的關(guān)聯(lián)性。例如,對(duì)于人工智能領(lǐng)域常見的分類問題,為了提升智能識(shí)別效果,在數(shù)據(jù)準(zhǔn)備過程中,即將數(shù)據(jù)送入分類器前,需要利用信息度量標(biāo)準(zhǔn)——信息論中熵的概念來(lái)區(qū)分?jǐn)?shù)據(jù)中的有用信息或冗余消息,并通過分析進(jìn)一步提取具有代表性的特征,使得數(shù)據(jù)集更加合理。在貝葉斯網(wǎng)絡(luò)中,還可以使用交互信息來(lái)確定變量之間的關(guān)系結(jié)構(gòu)。為了提高識(shí)別速率,通常需要選擇適合的編碼技術(shù)(如壓縮編碼技術(shù))對(duì)數(shù)據(jù)進(jìn)行降維。模型評(píng)價(jià)過程中使用交叉熵作為作為損失函數(shù)計(jì)算預(yù)測(cè)偏離真實(shí)輸出情況。即交叉熵?fù)p失函數(shù)是深度學(xué)習(xí)框架中流行的損失函數(shù),最大信息增益(互信息)為構(gòu)建決策樹提供了理論基礎(chǔ),維特比算法廣泛應(yīng)用于自然語(yǔ)言處理和語(yǔ)音處理,編碼器-解碼器的概念廣泛使用于機(jī)器翻譯的卷積神經(jīng)網(wǎng)絡(luò)等模型中??梢钥闯?,信息論和編碼技術(shù)參與了整個(gè)模式識(shí)別過程中數(shù)據(jù)預(yù)處理、特征提取、模型評(píng)價(jià)等重要環(huán)節(jié)。因此,對(duì)于人工智能應(yīng)用型人才的培養(yǎng),不能僅強(qiáng)調(diào)眼前的“實(shí)用性”,在學(xué)習(xí)各類機(jī)器學(xué)習(xí)算法工具的同時(shí),理解和掌握好信息論的基本概念和理論,能夠?yàn)閷W(xué)生學(xué)習(xí)后續(xù)課程打下堅(jiān)實(shí)的理論基礎(chǔ),厚實(shí)培養(yǎng)人才的職業(yè)發(fā)展?jié)摿Α?/p>
2.2.2 基于信息論的機(jī)器學(xué)習(xí)原理
從前面的論述可以看出,信息論和人工智能,尤其是機(jī)器學(xué)習(xí)互有交叉,但主要是機(jī)器學(xué)習(xí)中借用信息論的方法以此拓展理論研究和應(yīng)用場(chǎng)景,比較典型的就是借鑒信息理論創(chuàng)造和改進(jìn)學(xué)習(xí)算法。事實(shí)上,當(dāng)前人工智能的基礎(chǔ)理論依然還在繼續(xù)深入研究之中。90年代初,信息論和人工智能專家鐘義信開始對(duì)人工智能理論進(jìn)行系統(tǒng)研究,出版著作《智能理論與技術(shù)》后又提出信息、知識(shí)、智能轉(zhuǎn)換理論、機(jī)制主義人工智能理論等,在國(guó)內(nèi)外產(chǎn)生重要影響。他曾經(jīng)指出“信息理論、知識(shí)理論、人工智能理論之間相互脫節(jié)的研究狀況, 不利于信息科學(xué)技術(shù)、知識(shí)科學(xué)技術(shù)和人工智能科學(xué)技術(shù)的發(fā)展, 更不利于信息理論、知識(shí)理論、智能理論的一體化研究,不能適應(yīng)現(xiàn)代科學(xué)技術(shù)和經(jīng)濟(jì)社會(huì)發(fā)展的需要”[9]。中國(guó)科學(xué)院自動(dòng)化研究所胡包鋼研究員提出:統(tǒng)計(jì)學(xué)與優(yōu)化理論主要是“怎么學(xué)”層面中的基礎(chǔ)理論,它們無(wú)法回答“學(xué)什么”這樣的機(jī)器學(xué)習(xí)中首要問題,而信息論將會(huì)扮演重要角色。他提出:機(jī)器學(xué)習(xí)中關(guān)于學(xué)習(xí)目標(biāo)選擇的計(jì)算表達(dá)均可以應(yīng)用信息(熵)理論函數(shù)優(yōu)化方式予以解釋或描述。如果將人類大腦以及神經(jīng)系統(tǒng)看成連接的網(wǎng)絡(luò)(如同現(xiàn)有的通信網(wǎng)絡(luò)),就能夠理解為什么信息論是不可或缺的基礎(chǔ)支撐之一[10]。信息論準(zhǔn)則已經(jīng)應(yīng)用在生成式對(duì)抗網(wǎng)絡(luò)(GAN)學(xué)習(xí)中,基于信息論的機(jī)器學(xué)習(xí)還將為人工智能研究帶來(lái)新的發(fā)展空間。在此基礎(chǔ)上,提出基于信息理論的機(jī)器學(xué)習(xí)原理,即基于信息理論為學(xué)習(xí)準(zhǔn)則的機(jī)器 (分類、聚類)學(xué)習(xí)原理就是將無(wú)序(類標(biāo)、特征)數(shù)據(jù)轉(zhuǎn)變?yōu)橛行?類標(biāo)、特征)數(shù)據(jù)的過程,其中轉(zhuǎn)變效果是以信息熵為測(cè)量尺度。
可見,無(wú)論是從應(yīng)用層面,還是從理論基礎(chǔ)層面來(lái)看,信息論都和人工智能息息相關(guān)。同時(shí),從香農(nóng)、鐘義信等信息論專家在人工智能領(lǐng)域的諸多建樹也可以看出,信息論基礎(chǔ)知識(shí)將對(duì)人工智能相關(guān)專業(yè)學(xué)生職業(yè)發(fā)展有重要影響。因此,信息理論是人工智能人才必須掌握的基礎(chǔ)知識(shí),也是人工智能相關(guān)專業(yè)不可或缺的專業(yè)基礎(chǔ)課程。
目前,各高校信息論課程目前僅針對(duì)通信專業(yè)開設(shè),近年一些高校才逐步在信息安全、計(jì)算機(jī)等專業(yè)開設(shè)?,F(xiàn)有的教材中不可避免地存在著通信中的一些術(shù)語(yǔ)和名詞,再加上書中有很煩瑣的數(shù)學(xué)證明,同時(shí)概率論、隨機(jī)過程和數(shù)理統(tǒng)計(jì)等先修課程也是應(yīng)用型高校學(xué)生普遍的薄弱環(huán)節(jié)。此外,在信息論教學(xué)中還存在實(shí)驗(yàn)設(shè)置不足和課程資源相對(duì)缺乏等問題。針對(duì)人工智能相關(guān)專業(yè)開設(shè)信息論課程,需要將信息論基礎(chǔ)知識(shí)與人工智能、機(jī)器學(xué)習(xí)應(yīng)用知識(shí)融合進(jìn)行教學(xué),才能達(dá)到理想的教學(xué)效果;同時(shí)對(duì)于人工智能核心專業(yè)和“人工智能+”專業(yè),培養(yǎng)目標(biāo)不同,所需的信息論基礎(chǔ)知識(shí)也不盡相同。為解決上述問題,需要從課程教學(xué)團(tuán)隊(duì)、課程教學(xué)體系建設(shè),實(shí)驗(yàn)資源開發(fā)、教學(xué)方法等方面著手進(jìn)行教學(xué)改革,實(shí)施跨專業(yè)信息論課程教學(xué)與建設(shè)的探索與實(shí)踐。
針對(duì)應(yīng)用型高校人才培養(yǎng)需求,圍繞人工智能產(chǎn)業(yè)鏈(技術(shù)鏈),本著專業(yè)技術(shù)相關(guān)、專業(yè)基礎(chǔ)相通、就業(yè)背景相同、環(huán)境資源共享原則構(gòu)建人工智能專業(yè)核心群,重點(diǎn)專業(yè)有人工智能、智能科學(xué)與技術(shù)、計(jì)算機(jī)科學(xué)與技術(shù)、通信、電子信息等專業(yè),這些專業(yè)分別定位人工智能的“云、管、端”產(chǎn)業(yè)鏈需求,涵蓋人工智能所需的云計(jì)算、分布式計(jì)算、大數(shù)據(jù)等技術(shù)要素,在人才培養(yǎng)過程中將其定位為人工智能核心專業(yè)。同時(shí),基于人工智能跨學(xué)科的特點(diǎn),從學(xué)科建設(shè)角度而言,重視人工智能與傳統(tǒng)學(xué)科的交叉融合,不僅有利于人工智能學(xué)科的特色發(fā)展,還可以輔助發(fā)掘金融、統(tǒng)計(jì)、電商、管理等相關(guān)學(xué)科專業(yè)的潛力,促進(jìn)彼此共同發(fā)展。研究認(rèn)為,通過人工智能實(shí)現(xiàn)跨越“大文大理”的學(xué)科融合創(chuàng)新存在現(xiàn)實(shí)可能性[11]?;趹?yīng)用型高校實(shí)際,可將金融、統(tǒng)計(jì)、電商、管理等人工智能交叉專業(yè)定位為“人工智能+”專業(yè)。
不同專業(yè)對(duì)信息論的要求完全不同,但其共同點(diǎn)就是各專業(yè)均要求對(duì)基礎(chǔ)信息理論進(jìn)行全面掌握,能夠運(yùn)用信息思維方法去解決經(jīng)濟(jì)、管理、語(yǔ)言處理等方面的問題。而對(duì)于核心專業(yè)而言,在此基礎(chǔ)上,還需要利用信息論原理,調(diào)整優(yōu)化算法模型。因此,在應(yīng)用型高校理論基礎(chǔ)知識(shí)“夠用即可”的前提下,著眼人工智能核心專業(yè)、“人工智能+”專業(yè)教學(xué)內(nèi)容差異,通過對(duì)信息論基礎(chǔ)知識(shí)的講授,引入與專業(yè)相關(guān)的應(yīng)用實(shí)例,將信息論與各專業(yè)相關(guān)聯(lián)的內(nèi)容,進(jìn)行總結(jié)、歸納和拓展,建立課程之間的交叉聯(lián)系,將不同科目的相關(guān)理論綜合起來(lái),聯(lián)系實(shí)際應(yīng)用,多舉例展現(xiàn),以提升學(xué)生的學(xué)習(xí)興趣。此外,信息論基礎(chǔ)知識(shí)的教學(xué)還需要順應(yīng)信息技術(shù)發(fā)展需求,在當(dāng)前信息處理和編碼技術(shù)普遍數(shù)字化的背景下,適當(dāng)刪減連續(xù)信源理論、連續(xù)信道容量等內(nèi)容,側(cè)重離散信源和離散信道理論,滿足智能時(shí)代人才培養(yǎng)需求。
信息論課程具有較強(qiáng)的理論性和抽象性,針對(duì)應(yīng)用型人才培養(yǎng),其教學(xué)需理論教學(xué)與實(shí)驗(yàn)教學(xué)并重。在理論教學(xué)中,強(qiáng)化概念理解、弱化公式推導(dǎo),并注重結(jié)合工程實(shí)例增強(qiáng)對(duì)基本概念的理解,例如通過文字信源和圖像信源的信源熵對(duì)比機(jī)器學(xué)習(xí)實(shí)例,講授圖像編碼的碼字需求,使學(xué)生理解圖像信源更大的不確定性,以及信息度量對(duì)編碼的意義,同時(shí)簡(jiǎn)要介紹人工智能自然語(yǔ)言處理和機(jī)器視覺案例,使學(xué)生獲得更多應(yīng)用和實(shí)踐的直觀感受。信息論是一門理論性很強(qiáng)的課程,理論教學(xué)過程以講授、公式推導(dǎo)等方法為主,但適當(dāng)采用現(xiàn)代教育技術(shù),如借助“微助教”、“雨課堂”等平臺(tái)實(shí)施教學(xué),輔助完成課堂教學(xué)管理、互動(dòng)、教學(xué)資源管理等工作,如課堂簽到、點(diǎn)答搶答、前課內(nèi)容復(fù)習(xí)測(cè)試、PPT/Flash等教學(xué)材料管理,既可以增加課堂互動(dòng)活躍氣氛以增強(qiáng)教學(xué)效果,又可提供學(xué)生自主學(xué)習(xí)、作業(yè)上傳的平臺(tái),對(duì)于學(xué)時(shí)安排較少的高??梢越鉀Q學(xué)時(shí)少與教學(xué)內(nèi)容容量大的矛盾,鼓勵(lì)學(xué)生自主學(xué)習(xí),發(fā)揮其學(xué)習(xí)的主體作用,還可為過程性考核提供原始數(shù)據(jù)。
在理論教學(xué)的同時(shí),還需注重信息論基本原理、基本方法的靈活應(yīng)用,結(jié)合實(shí)驗(yàn)教學(xué)培養(yǎng)學(xué)生的創(chuàng)新和實(shí)際動(dòng)手能力。對(duì)人工智能核心專業(yè),加強(qiáng)對(duì)課程的實(shí)驗(yàn)要求,在對(duì)已有算法的驗(yàn)證性實(shí)驗(yàn)基礎(chǔ)上,引導(dǎo)學(xué)生進(jìn)行綜合性、仿真性實(shí)驗(yàn)的設(shè)計(jì)。比如對(duì)無(wú)失真和限失真信源編碼、二進(jìn)制信道和高斯信道容量的計(jì)算進(jìn)行實(shí)驗(yàn)驗(yàn)證,甚至在壓縮編碼和信息安全方面自行設(shè)計(jì)一些實(shí)驗(yàn),在學(xué)會(huì)使用Matlab、 SystemView等仿真軟件的基礎(chǔ)上,應(yīng)用 C++ 、Python等程序語(yǔ)言進(jìn)行開發(fā)性試驗(yàn),以提高學(xué)生獨(dú)立思維和動(dòng)手能力。對(duì)人工智能+專業(yè),以信息熵計(jì)算、信源編碼等演示實(shí)驗(yàn)為主,增強(qiáng)學(xué)生對(duì)信息論基礎(chǔ)知識(shí)的直觀體驗(yàn)。
為了更準(zhǔn)確的檢驗(yàn)學(xué)生學(xué)習(xí)效果,采用過程性考核方法,更加重視學(xué)生的平時(shí)成績(jī)和實(shí)驗(yàn)考核成績(jī)。對(duì)學(xué)生的考核采用“考試+過程測(cè)評(píng)”的綜合評(píng)價(jià)方案,課程成績(jī)由“平時(shí)成績(jī)(20%)+實(shí)驗(yàn)成績(jī)(20%)+期末考試(60%)”三部分構(gòu)成。其中,平時(shí)成績(jī)涵蓋“微助教”平臺(tái)簽到情況、課堂復(fù)習(xí)小測(cè)試成績(jī)、課堂互動(dòng)答題成績(jī)、作業(yè)成績(jī),上機(jī)成績(jī)涵蓋實(shí)驗(yàn)課程過程的實(shí)施、代碼優(yōu)化和總結(jié)等各種形式實(shí)踐能力的考核(基礎(chǔ)上機(jī)實(shí)驗(yàn)成績(jī)50%,綜合創(chuàng)新實(shí)驗(yàn)50%),三個(gè)部分綜合評(píng)價(jià)學(xué)習(xí)效果。實(shí)驗(yàn)作業(yè)要求學(xué)生在信源編碼和信道編碼部分自選完成兩個(gè)實(shí)驗(yàn)題目,并寫出完整報(bào)告,說明原理和實(shí)現(xiàn)方法,提交程序和運(yùn)行結(jié)果。實(shí)驗(yàn)成績(jī)依據(jù)學(xué)生在實(shí)驗(yàn)過程中的動(dòng)手能力、分析與解決問題能力等給予不同的權(quán)重。期末考試注重考核學(xué)生對(duì)基本概念、原理和方法的掌握情況,弱化使用公式進(jìn)行機(jī)械計(jì)算。過程性方式通過對(duì)學(xué)生學(xué)習(xí)知識(shí)過程和綜合應(yīng)用能力形成過程進(jìn)行監(jiān)督和評(píng)價(jià),促使學(xué)生在學(xué)習(xí)的過程中持續(xù)用功,提升教學(xué)質(zhì)量和效果。
人工智能處于第四次科技革命的核心地位,在該領(lǐng)域的競(jìng)爭(zhēng)意味著一個(gè)國(guó)家未來(lái)綜合國(guó)力的較量。其中,人才的培養(yǎng)起著基礎(chǔ)性的支撐作用。本文通過分析信息論基礎(chǔ)理論在數(shù)據(jù)預(yù)處理、特征提取、模型評(píng)價(jià)等方面的應(yīng)用,結(jié)合基于信息論的機(jī)器學(xué)習(xí)原理,梳理了信息論課程與人工智能相關(guān)專業(yè)人才培養(yǎng)之間的強(qiáng)關(guān)聯(lián)性。結(jié)合應(yīng)用型高校人才培養(yǎng)實(shí)際,從教學(xué)內(nèi)容、教學(xué)方法、考核方式等方面實(shí)施教學(xué)改革探索,應(yīng)用技術(shù)特色鮮明,體現(xiàn)了多學(xué)科思維融合、產(chǎn)業(yè)技術(shù)與學(xué)科理論融合、跨專業(yè)能力融合、多學(xué)科項(xiàng)目實(shí)踐融合的新工科高水平課程的要求。以此為基礎(chǔ)實(shí)施信息論課程教學(xué),以學(xué)生發(fā)展為中心,創(chuàng)新教學(xué)方法,激發(fā)學(xué)生內(nèi)在潛力和學(xué)習(xí)動(dòng)力,從而保障跨學(xué)科、創(chuàng)新復(fù)合型應(yīng)用人才培養(yǎng)的質(zhì)量。