羅 純, 楊 晗, 李海雯,2, 紀(jì)晨然
(1. 上海應(yīng)用技術(shù)大學(xué) 理學(xué)院, 上海 201418; 2. 捷孚凱市場(chǎng)咨詢有限公司, 上海 200040;3. 濟(jì)南大學(xué) 生物科學(xué)與技術(shù)學(xué)院, 濟(jì)南 250022)
隨著現(xiàn)代信息技術(shù)的飛速進(jìn)步,人工智能時(shí)代已悄然而至。人工智能已逐漸滲透到社會(huì)的各個(gè)領(lǐng)域,如:金融、安保、零售、交通、教育等領(lǐng)域,無(wú)人駕駛、無(wú)人超市、智能機(jī)器人、AlphaGo、面部識(shí)別、智能音箱、人臉支付等已經(jīng)走進(jìn)人們的工作、學(xué)習(xí)和生活。人工智能在社會(huì)生活、工作方式甚至經(jīng)濟(jì)結(jié)構(gòu)等多個(gè)領(lǐng)域引起了深刻變革并將持續(xù)在未來(lái)的全球發(fā)展中起到舉足輕重的作用。在國(guó)際范圍內(nèi),人工智能引起了廣泛關(guān)注,并被多個(gè)國(guó)家提升為國(guó)家戰(zhàn)略,并出臺(tái)了相關(guān)政策和規(guī)劃,力爭(zhēng)搶占科技的制高點(diǎn)。
百年大計(jì),教育為本。教育作為民族復(fù)興、社會(huì)進(jìn)步的基石,一直是我國(guó)優(yōu)先發(fā)展的行業(yè)。為推動(dòng)教育智能化,我國(guó)在教育財(cái)政投入方面與教育科技政策方面雙管齊下。據(jù)國(guó)家統(tǒng)計(jì)局統(tǒng)計(jì)顯示,自2012年以來(lái)我國(guó)財(cái)政性教育經(jīng)費(fèi)支出在GDP中所占比例連續(xù)7年保持在4%以上。
數(shù)據(jù)挖掘、云計(jì)算、移動(dòng)計(jì)算、人工智能等新技術(shù)的廣泛應(yīng)用,為教育服務(wù)的發(fā)展帶來(lái)了全新的技術(shù)環(huán)境,人們需要綜合考慮了學(xué)習(xí)者的認(rèn)知水平、情感因素、學(xué)習(xí)動(dòng)機(jī)、個(gè)性差異、學(xué)習(xí)風(fēng)格等因素影響的個(gè)性化、智能化教育服務(wù)。技術(shù)正推動(dòng)著教育行業(yè)向著更加靈活、便捷、高效以及個(gè)性化的方向發(fā)展,新一輪教育科技革命和教育產(chǎn)業(yè)變革正在興起??梢灶A(yù)見(jiàn),在國(guó)家“互聯(lián)網(wǎng)+”的戰(zhàn)略推動(dòng)下,物聯(lián)網(wǎng)、云計(jì)算、數(shù)據(jù)挖掘、人工智能等信息技術(shù)的快速發(fā)展以及在教育中的廣泛應(yīng)用將為人工智能自適應(yīng)教育的發(fā)展帶來(lái)難得的歷史發(fā)展機(jī)遇。
基于時(shí)代大背景下,本文闡述了數(shù)據(jù)挖掘技術(shù)在人工智能自適應(yīng)教育中的主要應(yīng)用并結(jié)合相關(guān)教育學(xué)、心理學(xué)理論,利用數(shù)據(jù)挖掘技術(shù),構(gòu)建多元線性回歸模型,根據(jù)個(gè)體學(xué)習(xí)風(fēng)格匹配最優(yōu)學(xué)習(xí)策略,定制個(gè)性化學(xué)習(xí)方案。
人工智能的2大核心是機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘,而數(shù)據(jù)挖掘技術(shù)誕生至今,一直受到各行各業(yè)的廣泛關(guān)注。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展和廣泛應(yīng)用,如何對(duì)累積的海量數(shù)據(jù)信息進(jìn)行統(tǒng)計(jì)分析、利用及決策成為了迫切需要解決的問(wèn)題。正是數(shù)據(jù)挖掘技術(shù)的出現(xiàn)解決了海量數(shù)據(jù)的有效利用這一難題。人工智能自適應(yīng)教育的基本步驟可以概括為:搜集大數(shù)據(jù)——構(gòu)建學(xué)習(xí)模型——輸出學(xué)習(xí)建議。
圖1 人工智能自適應(yīng)教育系統(tǒng)基本原理
在流程中,構(gòu)建學(xué)習(xí)模型的過(guò)程最為復(fù)雜,需要從成千上萬(wàn)個(gè)相互連接的函數(shù)點(diǎn)中用數(shù)據(jù)挖掘方法找出其中的學(xué)習(xí)規(guī)則。這個(gè)過(guò)程的最大的難點(diǎn)之一就在于海量數(shù)據(jù)的處理和分析,而對(duì)大量數(shù)據(jù)的處理正離不開(kāi)數(shù)據(jù)挖掘技術(shù)。因此在人工智能自適應(yīng)教育領(lǐng)域,數(shù)據(jù)挖掘技術(shù)展現(xiàn)出較強(qiáng)的優(yōu)勢(shì)性。
人工智能自適應(yīng)教育的要求是自適應(yīng)教育系統(tǒng)擁有歸納及推理能力,可以大量定制個(gè)性化的學(xué)習(xí)方案。本模型將根據(jù)學(xué)生的個(gè)人學(xué)習(xí)行為及學(xué)習(xí)成果,為不同學(xué)習(xí)風(fēng)格生成匹配合適的學(xué)習(xí)策略,生成個(gè)性化學(xué)習(xí)方案。
本模型根據(jù)不同學(xué)生的不同學(xué)習(xí)行為及學(xué)習(xí)成果,輸出個(gè)性化的學(xué)習(xí)方案,分析對(duì)象為學(xué)生,所需的數(shù)據(jù)為學(xué)習(xí)者的學(xué)習(xí)風(fēng)格、學(xué)習(xí)策略以及學(xué)習(xí)成果。學(xué)習(xí)風(fēng)格是指不同學(xué)習(xí)者在學(xué)習(xí)過(guò)程中因每個(gè)個(gè)體差異化的個(gè)性特點(diǎn)、學(xué)習(xí)偏好,思維模式,知識(shí)接受能力,分析能力等因素表現(xiàn)出的帶有個(gè)體特征的學(xué)習(xí)方式。從不同維度出發(fā),所得到的學(xué)習(xí)風(fēng)格的類型也是截然不同的。目前已有70多種學(xué)習(xí)風(fēng)格被研究出來(lái)[1]。本文將采用由Richard M. Felder和Barbara A. Soloman設(shè)計(jì)的Felder-Silverman學(xué)習(xí)風(fēng)格問(wèn)卷[2](所羅門學(xué)習(xí)風(fēng)格量表)來(lái)收集學(xué)習(xí)風(fēng)格數(shù)據(jù)。該問(wèn)卷從信息加工、信息感知、信息輸入以及信息理解4個(gè)維度測(cè)量學(xué)生的學(xué)習(xí)風(fēng)格。每個(gè)維度設(shè)計(jì)了11個(gè)問(wèn)題,共計(jì)44個(gè)問(wèn)題;每個(gè)問(wèn)題有2個(gè)選項(xiàng),分別考查每個(gè)維度的2種類型,共計(jì)8種類型16種風(fēng)格。將每個(gè)問(wèn)題的答案以1和0表示,即選擇此項(xiàng)記為1,否則為0。
學(xué)習(xí)策略定義是學(xué)習(xí)者在學(xué)習(xí)活動(dòng)中有效學(xué)習(xí)的程序規(guī)則、方法技巧及調(diào)控方式。學(xué)習(xí)成果則是學(xué)習(xí)者通過(guò)學(xué)習(xí)活動(dòng)所得到的知識(shí)及感悟。本模型選取了復(fù)述策略、組織策略、元認(rèn)知策略、監(jiān)視策略、調(diào)節(jié)策略、資源管理策略、學(xué)習(xí)環(huán)境管理、努力管理、多向互動(dòng)八個(gè)學(xué)習(xí)策略作為觀察對(duì)象,針對(duì)每個(gè)策略設(shè)計(jì)了8個(gè)問(wèn)題,每個(gè)問(wèn)題都有很不符合、較不符合、不確定、較符合、很符合5個(gè)選項(xiàng),分別對(duì)應(yīng)1~5分,統(tǒng)計(jì)每個(gè)策略下8個(gè)問(wèn)題的總分作為該策略得分。
學(xué)習(xí)成果的最直觀的表現(xiàn)為學(xué)習(xí)成績(jī),因此將學(xué)習(xí)成績(jī)作為評(píng)估學(xué)習(xí)成果的標(biāo)準(zhǔn)。本模型將以學(xué)習(xí)者在班級(jí)內(nèi)的排名為標(biāo)準(zhǔn)計(jì)算其學(xué)習(xí)成果。問(wèn)卷上將班級(jí)排名這一問(wèn)題分為了5個(gè)選項(xiàng),A: top 5%,在模型計(jì)算中假設(shè)成績(jī)?yōu)?5分; B:top 20%,在模型計(jì)算中對(duì)應(yīng)成績(jī)?yōu)?5分;C: top 50%,對(duì)應(yīng)成績(jī)?yōu)?5;D: top 70%,模對(duì)應(yīng)成績(jī)?yōu)?5分;E:其他,對(duì)應(yīng)成績(jī)?yōu)?5分。
根據(jù)Felder-Silverman學(xué)習(xí)風(fēng)格問(wèn)卷評(píng)定規(guī)則,計(jì)算每種風(fēng)格總分,并將同一維度下的系數(shù)較大的風(fēng)格作為測(cè)試者在本維度下的學(xué)習(xí)風(fēng)格,并將2項(xiàng)之差作為風(fēng)格系數(shù),系數(shù)越高,風(fēng)格越強(qiáng)烈。評(píng)定所以答卷者的學(xué)習(xí)風(fēng)格,整理學(xué)習(xí)策略調(diào)查問(wèn)卷,將同一策略下的問(wèn)題得分相加,計(jì)算出每個(gè)策略的得分情況。對(duì)學(xué)習(xí)策略統(tǒng)計(jì)表進(jìn)行Z-score標(biāo)準(zhǔn)化處理,以消除量綱單位的影響,解決數(shù)據(jù)指標(biāo)之間的可比性[3]。
將學(xué)習(xí)策略設(shè)為解釋變量Xi,學(xué)習(xí)成績(jī)?cè)O(shè)為因變量Y,變量說(shuō)明如下表:
表1 變量說(shuō)明
構(gòu)建多元線性回歸模型:
Y=b0+b1X1+b2X2+b3X3+…+b9X9+ε
(1)
式中:b1,b2,…,b9分別為X1,X2,…,X9對(duì)成績(jī)Y的回歸系數(shù);b0為常數(shù)項(xiàng),表示為不可預(yù)測(cè)的隨機(jī)誤差。
根據(jù)問(wèn)卷結(jié)果,將學(xué)習(xí)策略得分及對(duì)應(yīng)的學(xué)習(xí)成績(jī)輸入SAS做回歸分析,結(jié)果如表2~4所示。
表2 回歸統(tǒng)計(jì)
由表2~4可得出如下多元線性回歸方程:
Y=46.04+3.03X1+3.19X2+3.47X3+2.65X4+2.01X5-1.56X6+2.88X7+3.27X8+2.61X9
對(duì)各變量回歸系數(shù)可得知,學(xué)習(xí)策略對(duì)學(xué)習(xí)成績(jī)的提升程度排序?yàn)椋涸J(rèn)知策略> 努力管理> 組織策略> 復(fù)述策略> 學(xué)習(xí)環(huán)境管理> 監(jiān)視策略> 多向互動(dòng)> 調(diào)節(jié)策略> 資源管理策略。
由表2可知,該模型判定系數(shù)為RSquare=89.67%,即學(xué)習(xí)成績(jī)變動(dòng)的原因有89.67%可以由學(xué)習(xí)策略來(lái)因素來(lái)解釋,只有10.33%的因素屬于隨機(jī)變動(dòng)誤差,因此認(rèn)為該模型擬合優(yōu)度較高。且由表3知,棄真概率P=3.23E-035<0.01,故置信度達(dá)99%以上。
表3 方差分析
根據(jù)表4可知,除了調(diào)節(jié)策略X5和資源管理策略X6,復(fù)述策略、組織策略、元認(rèn)知策略、監(jiān)視策略、學(xué)習(xí)環(huán)境管理、努力管理和多向互動(dòng)的檢驗(yàn)統(tǒng)計(jì)量都大于t,均對(duì)學(xué)習(xí)成績(jī)有顯著影響。
表4 回歸系數(shù)及回歸系數(shù)顯著性檢驗(yàn)
將在數(shù)據(jù)表中隨機(jī)抽取的未參與模型建立的數(shù)據(jù)代入線性回歸方程中計(jì)算結(jié)果,并將預(yù)測(cè)結(jié)果與實(shí)際結(jié)果相對(duì)比,以測(cè)試模型準(zhǔn)確性。
由表5可知,應(yīng)用模型輸出的結(jié)果與實(shí)際成績(jī)之間的誤差較小,擬合度較高,認(rèn)為該模型較為可靠,可以應(yīng)用于實(shí)際預(yù)測(cè)中。
表5 學(xué)習(xí)策略模型檢驗(yàn)結(jié)果
樣本中成功學(xué)習(xí)者(學(xué)習(xí)成績(jī)?cè)?5分及以上)共計(jì)46個(gè),統(tǒng)計(jì)不同風(fēng)格的成功學(xué)習(xí)者對(duì)學(xué)習(xí)策略的偏好。根據(jù)學(xué)習(xí)者學(xué)習(xí)策略測(cè)量問(wèn)卷,將每個(gè)學(xué)習(xí)者的各項(xiàng)策略得分以各項(xiàng)得分占其總分比例的形式表示,以使數(shù)據(jù)具有更強(qiáng)的可比性及關(guān)聯(lián)性。將學(xué)習(xí)風(fēng)格表示為其維度系數(shù),該維度下學(xué)習(xí)風(fēng)格越強(qiáng)烈,維度系數(shù)就越高。每個(gè)維度下的A型用正數(shù)表示,B型用負(fù)數(shù)表示。計(jì)算學(xué)習(xí)風(fēng)格與學(xué)習(xí)類型間的相關(guān)系數(shù),相關(guān)系數(shù)越接近于0,說(shuō)明相關(guān)性越小;相關(guān)系數(shù)為正,則說(shuō)明該學(xué)習(xí)策略與該維度學(xué)習(xí)風(fēng)格的A型相關(guān),反之則與B型相關(guān)。
表6 相關(guān)系數(shù)
圖2 學(xué)習(xí)風(fēng)格與策略匹配方案
根據(jù)回歸模型得出的學(xué)習(xí)策略對(duì)成績(jī)提升程度排名,剔除掉對(duì)成績(jī)影響較不顯著的調(diào)節(jié)策略與資源管理策略,結(jié)合不同類型學(xué)習(xí)者偏好的學(xué)習(xí)風(fēng)格,可為16種不同類型的學(xué)習(xí)者16種設(shè)計(jì)如下學(xué)習(xí)策略匹配方案[5-11]。
本文從人工智能自適應(yīng)教育的實(shí)用性角度出發(fā),基于數(shù)據(jù)挖掘方法為信息感知、輸入、接受、理解4個(gè)維度下的16種學(xué)習(xí)風(fēng)格匹配了最優(yōu)學(xué)習(xí)策略作為參考,在一定程度上可以滿足學(xué)習(xí)者的個(gè)性化學(xué)習(xí)需求。同時(shí),學(xué)習(xí)風(fēng)格與學(xué)習(xí)策略作為學(xué)習(xí)者的個(gè)體差異,人們從不同的研究角度、使用不同的研究方法提出了不同的劃分方式,本文僅采取了應(yīng)用較廣的2種理論,但該研究方法或許同樣適用于匹配其他理論的學(xué)習(xí)風(fēng)格與策略。
展望未來(lái),我們期望可以將人工智能、數(shù)據(jù)挖掘以及虛擬現(xiàn)實(shí)等技術(shù)相結(jié)合,搭建一套智能教育驅(qū)動(dòng)系統(tǒng)以輔助教學(xué),實(shí)現(xiàn)個(gè)性化課程、自適應(yīng)教學(xué)、學(xué)習(xí)習(xí)慣及方法養(yǎng)成、智能監(jiān)督等功能,將現(xiàn)代化技術(shù)應(yīng)用到教育工作中的方方面面,使得教育更加智能化; AI與教育的結(jié)合教育成為必然趨勢(shì),智慧教育驅(qū)動(dòng)未來(lái)。希望本文關(guān)于人工智能自適應(yīng)教育的基礎(chǔ)研究和理論部分能夠延伸到教育工作中,使得理論和應(yīng)用能夠更好結(jié)合。