一、人工智能發(fā)展開端
1950年,英國計算機科學(xué)家、數(shù)學(xué)家、邏輯學(xué)家、“人工智能之父\"圖靈發(fā)表了題為\"ComputingMachineryandIntelligence\"的著名論文,提出“圖靈測試\"概念,首次引發(fā)人們對“機器思維\"這一跨時代概念的思考。最早的神經(jīng)網(wǎng)絡(luò)模型一般指1943年由McCulloch與Pitts兩位科學(xué)家提出的人工神經(jīng)元模型。該模型通過簡單模擬人類大腦神經(jīng)元間的相互連接模式,對不同神經(jīng)元狀態(tài)的變化進(jìn)行數(shù)字表示。1949年,加拿大科學(xué)家、心理學(xué)家Hebb發(fā)表了具有里程碑意義的赫布學(xué)習(xí)法則,該法則證明神經(jīng)元間的連接強度與神經(jīng)元的活躍度密切相關(guān),且隨神經(jīng)元活躍度的變化而變化,為神經(jīng)元模型在可變連接權(quán)重的結(jié)構(gòu)設(shè)計上提供了關(guān)鍵科學(xué)依據(jù)和理論基礎(chǔ)。1959年,美國科學(xué)家Samuel發(fā)表了人工智能領(lǐng)域的著名論文“Some Studies in Machine Learning Using theGameofCheckers”,該論文被認(rèn)為是人類歷史上首次使用\"機器學(xué)習(xí)\"這一理念,主要介紹了如何利用計算機代碼編寫跳棋程序,該程序能通過不斷調(diào)試學(xué)習(xí)優(yōu)化下棋策略,并于1962年成功戰(zhàn)勝美國跳棋冠軍,在人工智能和計算機領(lǐng)域引發(fā)轟動。
1957年,美國科學(xué)家Rosenblatt首次提出“感知機”概念。感知機的提出標(biāo)志著人工神經(jīng)網(wǎng)絡(luò)與機器學(xué)習(xí)的首次有機結(jié)合,它由單層神經(jīng)元結(jié)構(gòu)和閾值激活函數(shù)約束條件兩個關(guān)鍵部分組成,通過赫布學(xué)習(xí)法則實現(xiàn)權(quán)重更新,進(jìn)而實現(xiàn)神經(jīng)元間連接權(quán)重的自主調(diào)節(jié),完成從數(shù)據(jù)輸入到期望輸出的人工神經(jīng)網(wǎng)絡(luò)建模過程。隨后,研究者針對感知機無法進(jìn)行非線性運算的不足進(jìn)行模型改進(jìn),加拿大科學(xué)家Hinton提出多層感知機模型。該模型在原始感知機模型基礎(chǔ)上添加多層隱式結(jié)構(gòu)取代傳統(tǒng)單層神經(jīng)元結(jié)構(gòu),被認(rèn)為是人工智能歷史上最早的深度學(xué)習(xí)網(wǎng)絡(luò)原型。多層感知機從結(jié)構(gòu)設(shè)計上解決了復(fù)雜非線性運算的可用性問題,但復(fù)雜的隱層結(jié)構(gòu)使人工神經(jīng)網(wǎng)絡(luò)的參數(shù)呈指數(shù)級暴增,需要進(jìn)一步開展多層感知機的建模優(yōu)化及對應(yīng)訓(xùn)練策略的研究。因此,Rumelhart和Hinton等人于1986年提出具有開創(chuàng)性的誤差反向傳播算法。該算法的核心思想是對神經(jīng)網(wǎng)絡(luò)中各隱層的參數(shù)傳遞關(guān)系進(jìn)行基于梯度的表示與計算,利用Sigmoid函數(shù)進(jìn)行非線性映射,顯著降低了多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練復(fù)雜度,減少了模型訓(xùn)練過程的計算量,為后續(xù)人工智能模型訓(xùn)練過程奠定了重要理論基礎(chǔ),并被沿用至今。另外,1989年LeCun等人在當(dāng)時主流的全連接神經(jīng)網(wǎng)絡(luò)模型基礎(chǔ)上,提出著名的局部連接人工神經(jīng)網(wǎng)絡(luò)模型。與全連接神經(jīng)網(wǎng)絡(luò)模型相比,采用局部連接模式的人工神經(jīng)網(wǎng)絡(luò)模型在保持各神經(jīng)元間有效連接的前提下,顯著減少了不必要的神經(jīng)元連接,大幅降低了人工神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度。
二、人工智能發(fā)展里程碑
1991年,人工神經(jīng)網(wǎng)絡(luò)與機器學(xué)習(xí)的熱度呈現(xiàn)此消彼長態(tài)勢。人工智能領(lǐng)域的研究者在論證人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程時,發(fā)現(xiàn)網(wǎng)絡(luò)存在梯度消失問題,即誤差在反向傳播計算過程中以乘性方式傳播到前一層,經(jīng)Sigmoid函數(shù)變換后,誤差數(shù)值大幅度減小,甚至近乎為零,導(dǎo)致研究者無法對更復(fù)雜的神經(jīng)網(wǎng)絡(luò)進(jìn)行有效前饋訓(xùn)練。因此,在后來的十余年間,人工神經(jīng)網(wǎng)絡(luò)的研究熱度大幅降低,而基于統(tǒng)計學(xué)習(xí)的機器學(xué)習(xí)模型的研究熱度逐年上升。1960年,蘇聯(lián)研究者Vapnik提出經(jīng)典的支持向量機(SVM)的主要理論框架,其核心是解決和優(yōu)化最大邊界問題。1990年,美國科學(xué)家Boser等人提出SVM的核函數(shù)概念,將SVM模型應(yīng)用到人工智能相關(guān)問題的研究中。SVM的核心理念是利用核函數(shù)對輸入的信息進(jìn)行高維空間映射,提升輸入信息的特征區(qū)分度,常見核函數(shù)主要有線性核函數(shù)、多項式核函數(shù)、高斯核函數(shù)等。另外,研究者于1986年首次提出“決策樹\"這一經(jīng)典機器學(xué)習(xí)代表性模型。決策樹通過樹狀主干與枝葉結(jié)構(gòu)建模,對目標(biāo)對象的屬性特征與數(shù)值進(jìn)行基于關(guān)系表征的關(guān)聯(lián)映射。從各對象對應(yīng)的決策樹節(jié)點出發(fā),各分支路徑表示某一潛在的屬性特征,各葉子節(jié)點表示連接根節(jié)點與葉子節(jié)點的分支路徑對象數(shù)值。作為統(tǒng)計學(xué)習(xí)模型的常用方法之一,決策樹在各領(lǐng)域均有廣泛應(yīng)用。與決策樹采用的基于遞歸的數(shù)據(jù)集劃分與模型構(gòu)建過程相比,SVM模型通過高維空間映射對數(shù)據(jù)集進(jìn)行超平面劃分,不依賴于數(shù)據(jù)遞歸過程。Breiman等人于2001年提出隨機森林模型,其核心是將多個決策樹模型進(jìn)行基于集成學(xué)習(xí)的組合建模,通過投票機制實現(xiàn)模式識別結(jié)果的最優(yōu)輸出。該方法既能提升模型對數(shù)據(jù)集噪聲的適應(yīng)能力,又能減少模型對冗余特征的依賴性。隨機森林在建模過程中遵循隨機性原則,涵蓋數(shù)據(jù)選取的隨機性和特征選取的隨機性:數(shù)據(jù)選取的隨機性體現(xiàn)在模型基于有放回抽取樣本來構(gòu)建數(shù)據(jù)子集,各子集中樣本可重復(fù),因此每個樣本都可能被選中多次,各子集所包含的樣本豐富多樣;特征選取的隨機性體現(xiàn)在各決策樹在構(gòu)建過程中對候選特征進(jìn)行隨機選取,通過不同的候選特征構(gòu)建出不同的決策樹,進(jìn)而提升隨機森林的內(nèi)在多樣性,增強模型的魯棒性。隨機森林作為經(jīng)典機器學(xué)習(xí)模型中最為常用的方法之一,已在農(nóng)業(yè)、工業(yè)及商業(yè)等不同領(lǐng)域的模式識別與分類問題上得到廣泛應(yīng)用。
2006年是人工神經(jīng)網(wǎng)絡(luò)研究中具有里程碑意義的一年。這一年,計算機領(lǐng)域著名學(xué)者、加拿大科學(xué)家Hinton教授帶領(lǐng)研究團隊在Science上發(fā)表了題目為“Reducing the Dimensionality of Data with Neural"Networks\"的著名文章,提出“深度置信網(wǎng)絡(luò)\"模型。該模型通過貪心算法對深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行逐層訓(xùn)練,解決了深層網(wǎng)絡(luò)模型無法有效訓(xùn)練的問題。2010年,加拿大科學(xué)家Nair等人提出ReLU激活函數(shù),旨在減輕網(wǎng)絡(luò)模型訓(xùn)練過程中的梯度消失問題,這極大地提升了研究者對深度神經(jīng)網(wǎng)絡(luò)模型的關(guān)注度與研究興趣。2012年,美國谷歌研究團隊的Hinton等人在參加Imagenet國際圖像識別競賽時,開創(chuàng)性地提出AlexNet模型。該模型首次將ReLU函數(shù)引入深度神經(jīng)網(wǎng)絡(luò)模型,并采用基于有監(jiān)督學(xué)習(xí)的模型訓(xùn)練機制。最終,AlexNet模型在這次競賽中展現(xiàn)出遠(yuǎn)超經(jīng)典機器學(xué)習(xí)方法SVM模型的圖像識別性能,從此深度學(xué)習(xí)成為機器學(xué)習(xí)研究領(lǐng)域的重要熱點方向之一。2015年,Bengi、Hinton、LeCun等人證明可通過人為可控的模型訓(xùn)練方法有效解決深度學(xué)習(xí)模型訓(xùn)練過程中存在的局部極值問題,推動了深度學(xué)習(xí)模型研究的進(jìn)一步升溫。2016年,來自美國谷歌的DeepMind研究團隊提出AlphaGo算法,挑戰(zhàn)并擊敗多位著名圍棋選手,受到研究者和各界學(xué)者的廣泛關(guān)注。2020年,美國谷歌研究團隊進(jìn)一步提出適用于海量數(shù)據(jù)的模型訓(xùn)練優(yōu)化策略,為促進(jìn)深度學(xué)習(xí)模型的有效訓(xùn)練提供了全新思路。2024年,中國研究者創(chuàng)新性地提出DeepSeek大模型,在國內(nèi)外引起強烈反響。
三、人工智能發(fā)展前沿與其在教育考試領(lǐng)域的潛在應(yīng)用場景
人工智能的飛速發(fā)展離不開與各個應(yīng)用領(lǐng)域的緊密結(jié)合。教育考試是進(jìn)行人才選拔和培養(yǎng)的重要途徑。將前沿的人工智能技術(shù)引人傳統(tǒng)教育考試領(lǐng)域,不僅能提高教育考試各環(huán)節(jié)的有效性與效率,降低人工成本,為教師和學(xué)生減負(fù),還能為人工智能技術(shù)的進(jìn)一步發(fā)展提供更豐富的應(yīng)用環(huán)境,促進(jìn)人工智能與教育考試的有機結(jié)合。
人工智能技術(shù)主要以數(shù)據(jù)驅(qū)動為主。在教育考試中,常見的數(shù)據(jù)主要包括兩大類,即以傳統(tǒng)紙質(zhì)文字記錄為主的課本、試卷等文本資料,以及數(shù)字新媒體時代背景下的慕課、網(wǎng)課等音視頻資料。人工智能技術(shù)在涉及上述文本、音視頻資料的分析領(lǐng)域已積累諸多研究成果,能為下一步提升教育考試的智能化水平提供關(guān)鍵技術(shù)支撐。具體而言,人工智能的研究與應(yīng)用過程主要以特征設(shè)計與模型構(gòu)建兩個核心任務(wù)為主,當(dāng)前針對這兩個核心任務(wù)的研究熱點主要包括語義學(xué)習(xí)、小樣本學(xué)習(xí)等方向。以下分別對這兩個典型的人工智能發(fā)展前沿技術(shù)進(jìn)行闡述。
首先,語義學(xué)習(xí)是人工智能模型的熱門研究方向之一。在早期,語義學(xué)習(xí)通過對語句文本中的字符出現(xiàn)頻率進(jìn)行統(tǒng)計,識別文本所表達(dá)的語義。隨著音視頻影像技術(shù)的發(fā)展,語義學(xué)習(xí)開始在圖像、視頻等多源數(shù)據(jù)中開展相關(guān)識別研究與應(yīng)用。語義學(xué)習(xí)主要包含語義分割和語義融合兩類研究。語義分割研究主要關(guān)注基于語義的圖像分區(qū)問題,將圖像中不同內(nèi)容的區(qū)域進(jìn)行有效劃分。如Strudel等人提出基于上下文語義的分割模型,在室外場景的圖像目標(biāo)識別中展現(xiàn)出良好性能?;谡Z義融合的人工智能模型關(guān)注同一個或同一類對象在不同圖像中的差異化表達(dá)問題,通過將對象在不同圖像中的信息進(jìn)行有效融合,獲取更完整、準(zhǔn)確的內(nèi)容信息。Zhang等人提出考慮語義和空間分辨率差異的語義融合模型,通過多級特征提取提升模型在圖像語義理解應(yīng)用上的性能;Zheng等人提出基于編碼器模式的語義融合模型,通過加入編碼層提升模型對圖像內(nèi)容識別的精度。另外,以DeepSeek為代表的語義大模型不斷涌現(xiàn),其對輸入文字的語義理解能力遠(yuǎn)超早期的同類深度學(xué)習(xí)模型。
其次,小樣本學(xué)習(xí)是人工智能領(lǐng)域的另一個研究熱點?;谌斯ぶ悄芗夹g(shù)的深度學(xué)習(xí)模型往往需要海量數(shù)據(jù)與標(biāo)注樣本,且要求不同類型的對象樣本量盡可能均衡。然而,現(xiàn)實中受限于不同待分析目標(biāo)的出現(xiàn)頻率與發(fā)生概率,其對應(yīng)的數(shù)據(jù)往往難以滿足數(shù)據(jù)量均衡的要求,數(shù)據(jù)集通常存在樣本量不平衡的問題。此外,由于數(shù)據(jù)標(biāo)注通常需要在具有相關(guān)專業(yè)知識的專家指導(dǎo)下進(jìn)行,數(shù)據(jù)標(biāo)注成本很高,可供使用的數(shù)據(jù)標(biāo)注樣本極為有限,存在海量數(shù)據(jù)樣本量與稀缺標(biāo)注真值量相矛盾的問題。目前,小樣本學(xué)習(xí)主要包括基于度量的小樣本學(xué)習(xí)方法、基于模型的小樣本學(xué)習(xí)方法、基于過程優(yōu)化的小樣本學(xué)習(xí)方法三大類。基于度量的小樣本學(xué)習(xí)方法的核心思想是在基于人工智能的深度學(xué)習(xí)模型訓(xùn)練過程中加入特征空間的度量過程,通過對有限樣本進(jìn)行預(yù)處理,提升基于有限樣本的深度學(xué)習(xí)模型訓(xùn)練效果。如Vinyals等人提出MatchingNet小樣本深度學(xué)習(xí)網(wǎng)絡(luò)框架,通過對樣本集進(jìn)行子集劃分,提升模型的收斂速度與效果?;谀P偷男颖緦W(xué)習(xí)方法的核心理念是針對小樣本特點改進(jìn)模型設(shè)計,強化稀缺的數(shù)據(jù)與標(biāo)注真值間的關(guān)聯(lián)性。如Yue等人提出基于規(guī)則干預(yù)的小樣本學(xué)習(xí)模型,通過建立樣本與真值間的因果干預(yù)規(guī)則,提升模型在小樣本數(shù)據(jù)集上的性能?;趦?yōu)化的小樣本學(xué)習(xí)方法采用改進(jìn)模型訓(xùn)練策略的思路,促進(jìn)模型在小樣本條件下的收斂有效性。如Wang等人提出面向稀缺樣本條件的回歸核函數(shù)MetaNTK,通過改進(jìn)網(wǎng)絡(luò)神經(jīng)元的傳遞機制,提升模型的收斂效率。
針對上述人工智能模型技術(shù)理念,教育考試的相關(guān)研究者已開展廣泛研究工作。在教育考試的信息化能力提升方面,鐘茂生等人論述了當(dāng)前教育考試命題工作與人工智能技術(shù)相結(jié)合的多個關(guān)鍵環(huán)節(jié),為進(jìn)一步提升考試命題的智能化水平提供了思路參考;翟思羽等人梳理了教育考試數(shù)字化轉(zhuǎn)型過程中面臨的潛在挑戰(zhàn),并闡述了人工智能技術(shù)在教育考試的“教、學(xué)、評\"三個關(guān)鍵環(huán)節(jié)的重要作用。在教育考試的硬件設(shè)備方面,丁麗等人基于人工智能模型,對考試教室的室內(nèi)影像進(jìn)行智能分析,實現(xiàn)了教室照明系統(tǒng)的自動化調(diào)節(jié)控制;史萌等人針對當(dāng)前傳統(tǒng)教師在教學(xué)過程中存在的硬件運行痛點,探索了如何利用人工智能硬件提升課堂教學(xué)互動的有效性。在教育考試的無紙化備案與閱卷方面,理予等人基于構(gòu)建的人工智能網(wǎng)絡(luò)模型,提出面向考試資格認(rèn)定的證件核驗方案,提升了人證在線審核的效率;王冠等人基于人工智能大模型,構(gòu)建了面向教育考試的自動化閱卷模型,提升了電子化閱卷的效率。
四、結(jié)語
人工智能技術(shù)自20世紀(jì)被首次提出以來,已歷經(jīng)多個里程碑式的發(fā)展過程,并演化出面向不同領(lǐng)域、不同應(yīng)用場景的大數(shù)據(jù)分析模型。教育考試作為新時代育人體系的核心組成部分,通過在教育考試的不同關(guān)鍵環(huán)節(jié)引入更先進(jìn)、更安全的人工智能技術(shù),將極大提升教育考試的智能化水平與工作效率,更好地服務(wù)于國家的教書育人新方針,推動我國教育事業(yè)不斷邁向新高度。
參考文獻(xiàn):
[1]鐘茂生,劉蕾,熊鍵,等.智能技術(shù)賦能教育考試命題研究[J].招生考試研究,2024(01):1-13.
[2]翟思羽,李瑩.高校考試數(shù)字化轉(zhuǎn)型中的挑戰(zhàn)與應(yīng)對[J].高教論壇,2024(07):79-82.
[3]丁麗.基于圖像識別的教室照明節(jié)能控制系統(tǒng)設(shè)計[J].中國照明電器,2024(10):72-74.
[4]王野.基于深度學(xué)習(xí)算法的人證核驗解決方案[J].中國公共安全,2019(03):78-79.
[5]王冠,魏蘭.人工智能大模型技術(shù)在教育考試全題型閱卷中的應(yīng)用[J].教育測量與評價,2024(03):3-18