李方圓+楊絮+張海+羅立成
● 自適應(yīng)教育超媒體課程系統(tǒng)開(kāi)發(fā)的現(xiàn)狀與問(wèn)題
自適應(yīng)教育超媒體系統(tǒng)(AEHS)是一種在線學(xué)習(xí)系統(tǒng),它根據(jù)每個(gè)學(xué)生的特點(diǎn)和需求,通過(guò)網(wǎng)絡(luò)平臺(tái)隨時(shí)向?qū)W生推薦最合適的教學(xué)內(nèi)容,以使學(xué)生的學(xué)習(xí)過(guò)程更容易。目前,AEHS已經(jīng)在不同的情境下成功使用,并且一些研究者已經(jīng)開(kāi)發(fā)了許多在線教育系統(tǒng)(如AHA、TANGOW、NavEx和CoMoLE等)。雖然大多數(shù)AEHS對(duì)學(xué)生不太適應(yīng)的一些課程進(jìn)行了測(cè)試和評(píng)估,但它在真實(shí)的教育環(huán)境中應(yīng)用的潛力并未被完全挖掘,而充分采用AEH技術(shù)的主要障礙是創(chuàng)建和測(cè)試自適應(yīng)課程。
自適應(yīng)課程創(chuàng)建的一個(gè)主要問(wèn)題是,教師需要分析自適應(yīng)課程如何才能在不同學(xué)生的學(xué)習(xí)特征中起作用。因此,設(shè)計(jì)專門(mén)用于支持自適應(yīng)系統(tǒng)開(kāi)發(fā)和評(píng)估的方法及工具對(duì)于教師來(lái)說(shuō)有很大的幫助。一些國(guó)外研究者提出了一種自適應(yīng)課程的生命周期螺旋開(kāi)發(fā)模型。在這一模型中,首先,教師(或教育內(nèi)容設(shè)計(jì)者)使用創(chuàng)作工具開(kāi)發(fā)課程,并將其加載到課程交付系統(tǒng)中;然后,將課程交付給學(xué)生,并搜集學(xué)生與系統(tǒng)(日志文件)的交互;接下來(lái),教師借助數(shù)據(jù)挖掘工具檢查日志文件,檢測(cè)課程可能失敗的地方或弱點(diǎn),并提出改進(jìn)課程的建議;最后,教師按照這些建議,利用創(chuàng)作工具對(duì)課程進(jìn)行相應(yīng)的修改,并再次在交付系統(tǒng)中加載課程。
用上述方法,教師可以改進(jìn)每個(gè)周期的課程。然而,方法雖然可行,但對(duì)于非專業(yè)用戶來(lái)說(shuō),使用數(shù)據(jù)挖掘工具分析交互數(shù)據(jù)并解釋結(jié)果可能是一個(gè)艱巨的任務(wù)。因此,要解決這一問(wèn)題,就需要幫助教師和課程設(shè)計(jì)者掌握分析數(shù)據(jù)的方法。本文將展示一些海外案例,介紹如何采用關(guān)鍵節(jié)點(diǎn)法、使用決策樹(shù)來(lái)協(xié)助開(kāi)發(fā)AEH課程。
● 使用關(guān)鍵節(jié)點(diǎn)法發(fā)現(xiàn)學(xué)習(xí)者的自適應(yīng)問(wèn)題
AEHS的學(xué)生模型屬性或維度與不同的AEH系統(tǒng),甚至同一系統(tǒng)的不同課程都是不同的,它們包括先前的知識(shí)、語(yǔ)言、年齡和學(xué)習(xí)風(fēng)格等,且學(xué)生模型的維度就是學(xué)生的特征。學(xué)生可以在自適應(yīng)課程中遵循不同的活動(dòng)路徑,教師可以從學(xué)生的活動(dòng)路徑中了解學(xué)生選擇的某些路徑是不是正確的學(xué)習(xí)方式,以及這些路徑是否與學(xué)生的特征相關(guān)。因此,在自適應(yīng)規(guī)則中尋找問(wèn)題的一種方法是,在用戶與AEHS的交互中尋找不良適應(yīng)的潛在癥狀。通過(guò)這些癥狀就能夠檢測(cè)到相關(guān)的自適應(yīng)問(wèn)題,而發(fā)現(xiàn)這些癥狀的方法則是數(shù)據(jù)挖掘技術(shù)(Web挖掘)。
關(guān)鍵節(jié)點(diǎn)法就是使用數(shù)據(jù)挖掘技術(shù)(決策樹(shù))尋找潛在的癥狀,以表明系統(tǒng)中存在適應(yīng)不良。該方法利用可讀輸出的C4.5算法,具體步驟如下:
①清理階段。選擇活動(dòng)類型為實(shí)際活動(dòng)或測(cè)試的記錄,所有條目必須包含每個(gè)活動(dòng)成功或失敗的指標(biāo)。
②應(yīng)用C4.5算法,具體參數(shù)如下:
屬性,學(xué)生模型的維度和活動(dòng)變量的名稱。
分類變量,成功變量指標(biāo)。此指標(biāo)表示學(xué)生是否通過(guò)了一個(gè)給定的實(shí)際活動(dòng)或測(cè)試。該變量有Yes和No兩個(gè)值,Yes表示學(xué)生成績(jī)高于教師指定的最低要求,否則其值為No。
③評(píng)估結(jié)果。生成決策樹(shù),該樹(shù)包含每個(gè)屬性的節(jié)點(diǎn)。換句話說(shuō),該樹(shù)由與學(xué)生基本特征維度相關(guān)的節(jié)點(diǎn)組成,并且節(jié)點(diǎn)與活動(dòng)變量的名稱相關(guān)。樹(shù)的葉子是分類變量的值也即成功指標(biāo)。然后根據(jù)指標(biāo)找出癥狀:選擇成功指標(biāo)的值為No的葉子,這些葉子表示學(xué)生在給定的某個(gè)活動(dòng)中失?。环治鰪南惹斑x擇的葉子到樹(shù)根的每個(gè)路徑。對(duì)于每個(gè)路徑,需要兩個(gè)步驟:①在路徑中查找具有活動(dòng)名稱的節(jié)點(diǎn)并存儲(chǔ)。自適應(yīng)問(wèn)題應(yīng)該與此活動(dòng)密切相關(guān)。②在路徑中找到學(xué)生基本特征的值。
● 關(guān)鍵節(jié)點(diǎn)法的兩個(gè)應(yīng)用案例
下面為海外研究中關(guān)鍵節(jié)點(diǎn)法應(yīng)用的兩個(gè)案例。這兩個(gè)案例使用了Simulog和Weka兩個(gè)工具。Simulog用于生成日志文件,Weka用于分析這些數(shù)據(jù)。Simulog是能夠模擬幾個(gè)學(xué)生基本特征的日志文件工具,其中包含不良適應(yīng)癥狀。Weka提供學(xué)習(xí)算法的實(shí)現(xiàn),如分類技術(shù)、關(guān)聯(lián)規(guī)則和聚類。此外,Weka包含的各種工具可用于預(yù)處理數(shù)據(jù)和數(shù)據(jù)可視化。在下面的案例中,日志文件是由一門(mén)有關(guān)交通規(guī)則的記錄良好的課程生成的。
第一個(gè)案例的數(shù)據(jù)是來(lái)自240個(gè)模擬學(xué)生的互動(dòng),第二個(gè)案例的數(shù)據(jù)是來(lái)自480名學(xué)生。
TANGOW教育系統(tǒng)中日志文件的條目由以下幾個(gè)屬性組成:戶名、基本特征、活動(dòng)、完成、等級(jí)、訪問(wèn)次數(shù)、行動(dòng)、活動(dòng)類型、合成時(shí)間、成功。如下表所示。
用戶名為s100的學(xué)生的條目示例為:
“s100,年輕,西班牙語(yǔ),新手,S_Ag_Exer,0.0,0.0,1,初次訪問(wèn),實(shí)踐活動(dòng),否”
“s100,年輕,西班牙語(yǔ),新手,S_Ag_Exer,0.0,0.0,1,離開(kāi)原子活動(dòng),實(shí)踐活動(dòng),否”
第一個(gè)條目顯示,具有“西班牙語(yǔ),新手,年輕”基本特征的學(xué)生s100參加了“交通警察標(biāo)志練習(xí)”活動(dòng)(S_Ag_Exer),完成0.0,等級(jí)0.0,是這次活動(dòng)的第一次訪問(wèn)。第二個(gè)條目表明,學(xué)生離開(kāi)這個(gè)活動(dòng),沒(méi)有完成活動(dòng)(完成=0.0),并且在練習(xí)中得分不足,為此,成功設(shè)定為否。
案例一:
研究者首先對(duì)Simulog生成的240名學(xué)生的數(shù)據(jù)進(jìn)行研究。交互數(shù)據(jù)包含的不良適應(yīng)的癥狀為70%具有“西班牙語(yǔ)、新手、年輕”基本特征的學(xué)生在“交通警察標(biāo)志練習(xí)”活動(dòng)中失敗。
接著,根據(jù)關(guān)鍵節(jié)點(diǎn)法分析數(shù)據(jù)。第一步(清理階段)是清理數(shù)據(jù)。它包括清除日志文件中不同于“LEAVE-ATOMIC”和“P”的活動(dòng),最后記錄集包含960條。第二步(應(yīng)用C4.5算法)是生成決策樹(shù)(如下頁(yè)圖1)。最后一步(評(píng)估結(jié)果)是找到節(jié)點(diǎn)活動(dòng)和學(xué)生基本特征,具體描述為:在樹(shù)中,只有一個(gè)葉子的值為No。這個(gè)葉子有77%的良好分類的例子,節(jié)點(diǎn)活動(dòng)的值是“S_Ag_Exer”,學(xué)生基本特征是“年輕”“新手”“西班牙語(yǔ)”。
決策樹(shù)表明很多學(xué)習(xí)西班牙語(yǔ)版本的課程,具有新手經(jīng)驗(yàn)且年輕的學(xué)生在S_Ag_Exer活動(dòng)中多次失敗,但需注意的是,該樹(shù)的良好分類例子的百分比很高。這一結(jié)果是由于當(dāng)學(xué)生與不良適應(yīng)癥狀無(wú)關(guān)時(shí),可變等級(jí)中缺乏隨機(jī)效應(yīng),因而學(xué)生總是能完成這一活動(dòng)。
案例二:
研究者首先對(duì)480名學(xué)生的數(shù)據(jù)進(jìn)行研究,由Simulog生成了兩個(gè)不良適應(yīng)的癥狀,并在可變等級(jí)中增加了隨機(jī)效應(yīng)。因此,在該案例中有兩個(gè)噪音來(lái)源,它們分別是癥狀的數(shù)量和隨機(jī)效應(yīng)。這些癥狀有60%具有“西班牙語(yǔ)、新手、年輕”基本特征的學(xué)生未能通過(guò)S_Ag_Exer(交通警察標(biāo)志練習(xí))活動(dòng),60%具有“英語(yǔ)、新手、年輕”基本特征的學(xué)生不能通過(guò)S_Circ_Exer(循環(huán)標(biāo)志練習(xí))活動(dòng)。
本案例中,關(guān)鍵節(jié)點(diǎn)法的第一步與案例一相同,都要實(shí)現(xiàn)清理數(shù)據(jù)(清理階段)。第二個(gè)步是應(yīng)用決策樹(shù)算法處理清理階段最后產(chǎn)生的1920個(gè)記錄(如圖2)。最后一步得到以下結(jié)果:
①在樹(shù)中找到值為No的兩個(gè)葉子。兩個(gè)活動(dòng)與兩個(gè)葉子相關(guān),因此可以找到兩個(gè)可能很強(qiáng)的不良適應(yīng)癥狀。
②第一個(gè)葉子的No與節(jié)點(diǎn)“活動(dòng)=S_Ag_Exer”相關(guān),學(xué)生的基本特征是變量“經(jīng)驗(yàn)=新手”“年齡=年輕”和“語(yǔ)言=西班牙語(yǔ)”。
③第二個(gè)葉子的No與節(jié)點(diǎn)“活動(dòng)=S_Circ_Exer”有關(guān),學(xué)生的基本特征是變量“經(jīng)驗(yàn)=新手”“語(yǔ)言=英語(yǔ)”和“年齡=年輕”。
檢測(cè)到兩個(gè)不良適應(yīng)的癥狀,由于兩個(gè)為No的葉子的良好分類例子的百分比(超過(guò)70%)相當(dāng)高,因此,學(xué)習(xí)西班牙語(yǔ)課程和英語(yǔ)課程的新手經(jīng)驗(yàn)的年輕學(xué)生分別在S_Ag_Exe、S_Circ_Exer活動(dòng)中都有很多困難。
● 結(jié)論
兩個(gè)案例旨在說(shuō)明決策樹(shù)技術(shù)是檢測(cè)自適應(yīng)程序潛在問(wèn)題癥狀的有用方法。案例一證明了決策樹(shù)的有效性,它可以在無(wú)噪聲的數(shù)據(jù)中檢測(cè)適應(yīng)不良的現(xiàn)有癥狀。案例二是以大量的學(xué)生為對(duì)象進(jìn)行研究,通過(guò)等級(jí)變量中的隨機(jī)因素將噪聲包含在數(shù)據(jù)中,使生成的數(shù)據(jù)更加接近現(xiàn)實(shí)。當(dāng)然,決策樹(shù)也有它的缺點(diǎn),因?yàn)樗惴–4.5處理的是概率事件,所以提取的信息可能不會(huì)完整。因此,未來(lái)的工作應(yīng)集中在測(cè)試決策樹(shù)與其他技術(shù)的組合上,如通過(guò)關(guān)聯(lián)規(guī)則為決策樹(shù)提供額外的信息,了解失敗的閾值指標(biāo)以表明學(xué)習(xí)者的不適應(yīng)癥狀。
基金項(xiàng)目:本論文獲得吉林省教育廳“十三五”社會(huì)科學(xué)研究規(guī)劃項(xiàng)目重點(diǎn)課題“基于數(shù)據(jù)挖掘的卓越教師能力結(jié)構(gòu)與培訓(xùn)研究”、東北師范大學(xué)本科教改研究課題“卓越新聞傳播人才創(chuàng)新培養(yǎng)模式與評(píng)價(jià)研究”、吉林省高等教育教學(xué)改革課題重點(diǎn)項(xiàng)目“卓越新聞傳播人才創(chuàng)新培養(yǎng)模式與評(píng)價(jià)研究”資助。