王 楠,張 瑋
(北京郵電大學(xué) 網(wǎng)絡(luò)教育學(xué)院,北京 100088)
隨著信息技術(shù)的不斷發(fā)展,教育信息化的水平也在不斷提高。越來越多的人開始使用網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),這些新技術(shù)的應(yīng)用也帶了教育數(shù)據(jù)的爆發(fā)式增長,探究數(shù)據(jù)的奧秘?zé)o疑將成為未來教育領(lǐng)域的研究熱點(diǎn)之一。學(xué)習(xí)分析、教育數(shù)據(jù)挖掘、教育大數(shù)據(jù)等方法的提出都是對這一數(shù)字時(shí)代的呼應(yīng)。網(wǎng)絡(luò)學(xué)習(xí)行為是發(fā)生于e-Learning環(huán)境中的、與學(xué)習(xí)相關(guān)的各種行為,其行為主體是學(xué)習(xí)者,行為客體則主要為數(shù)字化學(xué)習(xí)資源[1]。根據(jù)穆爾的學(xué)習(xí)行為交互分類理論,學(xué)習(xí)過程中有三種交互類型:學(xué)習(xí)者與學(xué)習(xí)內(nèi)容的交互、學(xué)習(xí)者與教師的交互、學(xué)習(xí)者與學(xué)習(xí)者的交互網(wǎng)絡(luò)學(xué)習(xí)交互行為。本研究所關(guān)注的資源應(yīng)用行為,其研究的主要對象就是關(guān)注學(xué)習(xí)者與學(xué)習(xí)資源的交互,相對于網(wǎng)絡(luò)學(xué)習(xí)行為而言,資源應(yīng)用行為更直接和具體,因而數(shù)據(jù)更容易被記錄和分析。
毫無疑問,數(shù)據(jù)分析方法和分析技術(shù)在在線教育領(lǐng)域的應(yīng)用已經(jīng)越來越多,其研究成果層出不窮,處于快速發(fā)展之中。比如社會網(wǎng)絡(luò)分析工具“SNAPP”能夠從學(xué)習(xí)管理系統(tǒng)中獲取數(shù)據(jù),通過可視化的方法顯示學(xué)生之間互動情況;同時(shí),已有內(nèi)容分析工具能夠利用視覺分析技術(shù),獲得學(xué)習(xí)者學(xué)習(xí)過程信息。本研究關(guān)注于網(wǎng)絡(luò)學(xué)習(xí)者資源應(yīng)用行為分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),一方面旨在彌補(bǔ)現(xiàn)有學(xué)習(xí)平臺分析功能的匱乏,已有的眾多在線學(xué)習(xí)平臺大多不具有深層次意義上的分析功能,或者甚至就沒有相應(yīng)功能,其分析過程和方法的標(biāo)準(zhǔn)化也根本無從談起;另一方面則是力圖使得面向?qū)W習(xí)者的行為分析可以更為便捷。
本研究的目的在于設(shè)計(jì)開發(fā)網(wǎng)絡(luò)學(xué)習(xí)者資源應(yīng)用行為分析系統(tǒng)?;谝延醒芯浚疚耐ㄟ^文獻(xiàn)分析對國內(nèi)外學(xué)者關(guān)于資源應(yīng)用行為分析模型以及主要分析方法進(jìn)行梳理,在此基礎(chǔ)之上提出了資源應(yīng)用行為分析框架,將分析過程分為描述型、診斷型和預(yù)測型,模型從宏觀角度對資源應(yīng)用分析系統(tǒng)的開發(fā)提供了建設(shè)性的意見;基于此框架,研究設(shè)計(jì)和開發(fā)了資源應(yīng)用行為分析工具,此工具實(shí)現(xiàn)接收教師或教學(xué)工作者上傳的資源應(yīng)用行為數(shù)據(jù),并通過系統(tǒng)內(nèi)部的分析過程反饋分析結(jié)果,最終實(shí)現(xiàn)描述型、診斷型和預(yù)測型三方面核心功能。本研究的技術(shù)路線經(jīng)歷了理論建構(gòu)、技術(shù)實(shí)現(xiàn)、應(yīng)用驗(yàn)證三個(gè)階段,相應(yīng)地綜合應(yīng)用了文獻(xiàn)分析、技術(shù)開發(fā)等研究方法。
理論建構(gòu)階段。主要研究了行為科學(xué)與行為主義學(xué)習(xí)理論、學(xué)習(xí)分析技術(shù)、學(xué)習(xí)者分類模型,并在此基礎(chǔ)之上,依據(jù)網(wǎng)絡(luò)學(xué)習(xí)者與學(xué)習(xí)資源交互的環(huán)境特點(diǎn),提出了網(wǎng)絡(luò)學(xué)習(xí)者資源應(yīng)用行為分析模型并建立了三個(gè)維度的分析方法。
技術(shù)實(shí)現(xiàn)階段。主要研究可視化技術(shù),數(shù)據(jù)分析方法,機(jī)器學(xué)習(xí)算法用來分析網(wǎng)絡(luò)學(xué)習(xí)者資源應(yīng)用行為數(shù)據(jù),以期評估學(xué)習(xí)過程,診斷學(xué)習(xí)情況,預(yù)測未來表現(xiàn)等。
應(yīng)用驗(yàn)證階段。主要是在資源應(yīng)用行為分析模型的基礎(chǔ)之上,通過使用Web開發(fā)技術(shù)以及數(shù)據(jù)分析方法、機(jī)器學(xué)習(xí)算法開發(fā)和實(shí)現(xiàn)網(wǎng)絡(luò)學(xué)習(xí)者資源應(yīng)用行為分析工具,工具能夠接收上傳的學(xué)習(xí)相關(guān)數(shù)據(jù),通過選擇不同的分析方法獲取分析結(jié)果。最后使用工具分析案例網(wǎng)院成人教育的數(shù)據(jù)和部分MOOC開源數(shù)據(jù)來驗(yàn)證工具的可用性。
國外對于資源應(yīng)用行為的研究更多偏向于應(yīng)用實(shí)踐方面。自2012年學(xué)習(xí)分析技術(shù)提出以來,越來越多的學(xué)者開始關(guān)注并研究學(xué)習(xí)者在網(wǎng)絡(luò)學(xué)習(xí)中的學(xué)習(xí)行為。美國普渡大學(xué)通過建立預(yù)測模型和使用相關(guān)可視化技術(shù),對學(xué)習(xí)者的學(xué)習(xí)情況進(jìn)行實(shí)時(shí)跟蹤,當(dāng)學(xué)習(xí)者可能出現(xiàn)學(xué)業(yè)不通過等危險(xiǎn)情況時(shí),可視化信號就會將此信息傳遞給教師和學(xué)生,以便改善學(xué)習(xí)者的學(xué)習(xí)效果[2]。A Anderson、D Huttenlocher等人通過對Coursera平臺上的課程數(shù)據(jù)分析得出課程參與度與學(xué)生績效的關(guān)系,優(yōu)秀學(xué)習(xí)者的學(xué)習(xí)習(xí)慣以及激勵機(jī)制對學(xué)生參與度的影響[3]。麻省理工學(xué)院的PJ Guo、J Kim、R Rubin分析了edX上690萬條視頻觀看記錄,統(tǒng)計(jì)分析后得出結(jié)論:少于六分鐘的視頻最吸引人[4]。本研究調(diào)研了現(xiàn)階段關(guān)于資源應(yīng)用行為的國內(nèi)研究,時(shí)間范圍從2004年到2016年,共搜索出1130篇文獻(xiàn)??v觀目前國內(nèi)的研究成果,發(fā)現(xiàn)大體可以分為以下幾個(gè)方向:
(1)關(guān)于網(wǎng)絡(luò)學(xué)習(xí)行為的理論研究,其中包括天津外國語大學(xué)楊麗娜等關(guān)于行為動機(jī)的研究,文中從心理因素、技術(shù)因素和資源因素三個(gè)方面建立了行為發(fā)生的前因模型,并對提出的因素進(jìn)行了驗(yàn)證[5];華中師范大學(xué)彭文輝在對學(xué)習(xí)行為內(nèi)涵深入研究的基礎(chǔ)上,提出了一個(gè)學(xué)習(xí)行為的OCCP分類模項(xiàng),以及網(wǎng)絡(luò)學(xué)習(xí)行為的“S-F-T”三維分類模型,這兩種模型是抽象和形式化描述學(xué)習(xí)行為序列的基礎(chǔ)[6]。遼寧師范大學(xué)李玉斌等學(xué)者以計(jì)劃行為理論為指導(dǎo),構(gòu)建起具有9個(gè)潛在變量的網(wǎng)絡(luò)學(xué)習(xí)行為模型(USEBM)[7]。
(2)關(guān)于網(wǎng)絡(luò)學(xué)習(xí)行為分析系統(tǒng)的研究,其中包括陜西師范大學(xué)王麗娜以對網(wǎng)絡(luò)學(xué)習(xí)行為系統(tǒng)分析為基礎(chǔ),結(jié)合網(wǎng)絡(luò)學(xué)習(xí)行為評價(jià)的目的和指標(biāo),設(shè)計(jì)了網(wǎng)絡(luò)學(xué)習(xí)行為的評價(jià)模型[8];華中師范大學(xué)黃克斌等通過分析常見的網(wǎng)絡(luò)學(xué)習(xí)行為量化參數(shù),設(shè)計(jì)了一個(gè)智能化的網(wǎng)絡(luò)學(xué)習(xí)行為分析系統(tǒng)[9];中南大學(xué)吳玲艷運(yùn)用Web Services和Web日志挖掘等技術(shù),設(shè)計(jì)并初步實(shí)現(xiàn)了包含行為采集、行為統(tǒng)計(jì)分析、學(xué)習(xí)評價(jià)三個(gè)模塊的網(wǎng)絡(luò)學(xué)習(xí)行為分析評價(jià)系統(tǒng)[10]。
(3)關(guān)于行為指標(biāo)的分析研究,國家開放大學(xué)魏順平等通過記錄學(xué)習(xí)者對網(wǎng)絡(luò)課程不同模塊的瀏覽及跳轉(zhuǎn)數(shù)據(jù),分析學(xué)生對資源的使用情況[11]。國防科學(xué)技術(shù)大學(xué)范潔通過對決策樹中C4.5算法的研究,提出了一種基于屬性相關(guān)性的C4.5決策樹規(guī)則生成算法預(yù)測學(xué)生成績[12]。東北師范大學(xué)馬杰等人運(yùn)用多元回歸分析預(yù)測與學(xué)生課程總分呈顯著相關(guān)的教學(xué)模塊,通過預(yù)測模型快速定位重點(diǎn)模塊,從而提高教學(xué)效果[13]。
綜上所述發(fā)現(xiàn),國內(nèi)外在資源應(yīng)用行為的研究上收獲頗豐。各種模型、各種系統(tǒng)、各種分析方法層出不窮。將這些研究仔細(xì)分析對比以后不難發(fā)現(xiàn),雖然學(xué)者們在各自研究的基礎(chǔ)上都取得了一些突破,但大家更多是依照自己的研究領(lǐng)域和方向,以及能夠獲得的資源設(shè)計(jì)分析系統(tǒng)和方法,而各種方法和系統(tǒng)之間差別較大,沒有形成一個(gè)統(tǒng)一的體系或者框架。這就導(dǎo)致研究成果的實(shí)踐性比較差?,F(xiàn)如今,越來越多人來到線上進(jìn)行學(xué)習(xí),但是在線平臺和系統(tǒng)的不同也導(dǎo)致了數(shù)據(jù)整合上的困難,雖然大數(shù)據(jù)分析技術(shù)已逐漸的成熟,但是在基礎(chǔ)設(shè)施的建設(shè)上如達(dá)不到一定的統(tǒng)一,這將使得未來對網(wǎng)絡(luò)學(xué)習(xí)者資源應(yīng)用的分析過程變得更加復(fù)雜。
本研究在對這些學(xué)習(xí)分析模型進(jìn)行分析總結(jié)的基礎(chǔ)之上,加之對學(xué)習(xí)者在網(wǎng)絡(luò)學(xué)習(xí)環(huán)境中的資源應(yīng)用行為進(jìn)行了相關(guān)研究,提出了網(wǎng)絡(luò)學(xué)習(xí)者資源應(yīng)用行為分析框架,如圖1所示。本模型主要借鑒了學(xué)習(xí)分析模型中的三個(gè)主要過程和循環(huán)結(jié)構(gòu)。
圖1 資源應(yīng)用行為分析框架
資源應(yīng)用行為的整個(gè)分析過程主要是由數(shù)據(jù)收集、數(shù)據(jù)分析和知識應(yīng)用三個(gè)部分組成。第一個(gè)階段是數(shù)據(jù)收集。收集的數(shù)據(jù)主要來自于在線學(xué)習(xí)平臺的數(shù)據(jù)庫以及日志文件,數(shù)據(jù)庫和日志文件里保留了學(xué)習(xí)者與網(wǎng)絡(luò)學(xué)習(xí)資源交互的大部分行為數(shù)據(jù)。由于數(shù)據(jù)的來源不同,所以需要將收集到的數(shù)據(jù)進(jìn)行相應(yīng)處理,其中包括標(biāo)準(zhǔn)化處理、刪除存在誤差的數(shù)據(jù)以及對空值進(jìn)行填充等。資源應(yīng)用行為分析模型中使用的數(shù)據(jù)是學(xué)習(xí)者與網(wǎng)絡(luò)學(xué)習(xí)資源交互時(shí)產(chǎn)生的行為數(shù)據(jù),這些數(shù)據(jù)可以根據(jù)不同的特點(diǎn)分為行為過程數(shù)據(jù)和行為結(jié)果數(shù)據(jù)。其中,行為過程數(shù)據(jù)是指網(wǎng)絡(luò)學(xué)習(xí)者在學(xué)習(xí)過程中與學(xué)習(xí)資源交互時(shí)產(chǎn)生的操作型數(shù)據(jù),例如:登陸時(shí)間、登陸時(shí)長、練習(xí)時(shí)長等。行為結(jié)果數(shù)據(jù)是指由一連串操作行為以后產(chǎn)生的結(jié)果型數(shù)據(jù)。例如:學(xué)生練習(xí)的成績、系統(tǒng)對學(xué)生的學(xué)習(xí)情況的評價(jià)、是否通過考試等。
第二個(gè)階段是數(shù)據(jù)分析。數(shù)據(jù)分析階段基于數(shù)據(jù)分析方法、機(jī)器學(xué)習(xí)算法等,對數(shù)據(jù)進(jìn)行分析。此模型中將數(shù)據(jù)分析分為三種不同類型的分析,主要包括:描述型分析、診斷型分析、預(yù)測型分析。描述型分析是根據(jù)事先分析的成果,將某些數(shù)據(jù)集中,以某種直觀、概括、全面的形式將需要表達(dá)的信息展現(xiàn)出來。教師可以通過這些直觀的結(jié)果迅速發(fā)現(xiàn)整個(gè)學(xué)習(xí)過程中的一些特點(diǎn),總結(jié)出一些規(guī)律等。由于學(xué)習(xí)者心理因素、成長環(huán)境等因素的不同,導(dǎo)致在在學(xué)習(xí)過程中表現(xiàn)出特點(diǎn)也有所差別,識別出這些不同不僅可以幫助教師更好的了解學(xué)習(xí)者,為個(gè)性化教學(xué)提供保障。診斷型分析就是利用資源應(yīng)用行為數(shù)據(jù)建立學(xué)習(xí)者分類模型,接著再根據(jù)模型對學(xué)習(xí)者進(jìn)行分類,并針對不同的學(xué)習(xí)者提供個(gè)性化的指導(dǎo)方法,改善學(xué)習(xí)結(jié)果。教師需要根據(jù)診斷的結(jié)果,按照學(xué)習(xí)者的偏好和習(xí)慣組織學(xué)習(xí)活動和資源,以便取得更好的教學(xué)效果。預(yù)測型分析主要是根據(jù)學(xué)習(xí)者在學(xué)習(xí)平臺中留下的行為數(shù)據(jù),使用機(jī)器學(xué)習(xí)算法建立數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,最終達(dá)到預(yù)測學(xué)習(xí)績效的目的。此類型的分析可以幫助教師找到那些可能無法通過考試的學(xué)習(xí)者,教師需要對這些學(xué)習(xí)者采取必要的措施以改善學(xué)習(xí)行為。
第三個(gè)階段就是知識應(yīng)用。知識應(yīng)用的對象主要是教師、學(xué)生以及從事教學(xué)相關(guān)的工作者。經(jīng)過相應(yīng)的數(shù)據(jù)分析以后,教師根據(jù)分析的結(jié)果,結(jié)合自身教學(xué)經(jīng)驗(yàn)和已知的學(xué)生特點(diǎn)進(jìn)行相應(yīng)的知識應(yīng)用。由于分析類型的不同,知識應(yīng)用的方法也不相同。可以分為可視化、個(gè)性化和預(yù)測三種??梢暬侵笇?shù)據(jù)庫中的數(shù)據(jù)用圖表的方式呈現(xiàn),利用計(jì)算機(jī)的處理能力將海量的數(shù)據(jù)轉(zhuǎn)換成直觀可見的圖形圖像,將復(fù)雜不容易理解的信息表示出來。個(gè)性化是根據(jù)診斷型分析中分析結(jié)果,通過網(wǎng)絡(luò)學(xué)習(xí)者在學(xué)習(xí)過程中資源應(yīng)用行為的不同表現(xiàn),診斷出屬于具體的類別,然后針對不同類型的學(xué)習(xí)者,提供個(gè)性化的指導(dǎo)方法。預(yù)測是將當(dāng)前學(xué)生的資源應(yīng)用行為放入預(yù)測型分析模型中,對學(xué)生下一階段學(xué)習(xí)結(jié)果或者學(xué)習(xí)行為進(jìn)行預(yù)測。
最后,模型還強(qiáng)調(diào)了循環(huán)結(jié)構(gòu),模型將知識應(yīng)用的結(jié)果反饋給收集數(shù)據(jù)、分析系統(tǒng)的管理者,或者教輔人員根據(jù)返回的結(jié)果重新設(shè)計(jì)和改善收集的數(shù)據(jù),提高分析的準(zhǔn)確度。需要注意的是,整個(gè)分析過程是在宏觀和微觀環(huán)境下工作的,這里的環(huán)境包含了影響整個(gè)分析過程的各方面要素條件。
根據(jù)資源應(yīng)用分析工具自身的特點(diǎn)和使用環(huán)境,整體的設(shè)計(jì)都需要遵循以下幾個(gè)原則:
(1)簡便性
分析工具的使用者大多是一些計(jì)算機(jī)技術(shù)能力較弱的教師,對于他們來說只需要掌握一些簡單的操作獲得自己想要的結(jié)果。所以在這個(gè)系統(tǒng)的功能設(shè)計(jì)和流程設(shè)計(jì)中一定要注意操作的簡便性,能夠使計(jì)算機(jī)水平一般的人也能夠使用此工具。
(2)獨(dú)立性
如上所說,工具的分析功能可能隨時(shí)需要調(diào)整,在這個(gè)過程中就需要注意系統(tǒng)的獨(dú)立性。其中每個(gè)分析功能需要獨(dú)立出來,當(dāng)系統(tǒng)需要改變某個(gè)分析方法的時(shí)候,要保證其能夠不影響其他功能的分析過程。
(3)可擴(kuò)展性
可擴(kuò)展性能夠保證系統(tǒng)對變化及時(shí)做出反應(yīng)。系統(tǒng)的功能不僅需要調(diào)整,更多的時(shí)候需要增加某個(gè)某塊或某種功能,此時(shí)較強(qiáng)的可擴(kuò)展性能夠使系統(tǒng)迅速適應(yīng)這種變化。
(4)準(zhǔn)確性
毋庸置疑,此工具最主要的功能就是分析方法的使用。而這些分析方法必須保證其一定的準(zhǔn)確性,只有正確的分析結(jié)果才能幫助教師了解和改善學(xué)習(xí)者的學(xué)習(xí)情況。
分析工具的整個(gè)工作過程可以看做是一個(gè)“黑盒”,工具的使用者只需要按照工具給出的格式上傳數(shù)據(jù),具體分析功能將交給系統(tǒng)來完成。使用者在上傳文件之后,點(diǎn)擊自己需要分析的部分就可以獲得相應(yīng)的分析結(jié)果。因此,根據(jù)系統(tǒng)功能確定系統(tǒng)的輸入和輸出,系統(tǒng)的輸入是用戶上傳的學(xué)習(xí)者相關(guān)數(shù)據(jù),系統(tǒng)的輸出是具體的分析結(jié)果,如圖2所示。
圖2 系統(tǒng)“黑盒”模型
基于前期研究成果和系統(tǒng)設(shè)計(jì)思路,該系統(tǒng)包括如下三個(gè)模塊:
(1)數(shù)據(jù)交互模塊
本模塊主要實(shí)現(xiàn)了用戶與服務(wù)器端數(shù)據(jù)交互的功能。數(shù)據(jù)交互模塊主要分為兩個(gè)部分:格式下載和數(shù)據(jù)上傳。格式下載是為了統(tǒng)一上傳的數(shù)據(jù)格式便于進(jìn)行分析。用戶可以通過頁面左上角的格式下載鏈接,下載本工具能夠支持的數(shù)據(jù)格式。數(shù)據(jù)的上傳主要是由教師或者教學(xué)工作者按照所要求格式將排版好的學(xué)習(xí)者行為數(shù)據(jù)上傳到服務(wù)器中。系統(tǒng)目前主要支持xlsx格式的Excel文檔和txt格式的文本文檔。上傳的文件不僅僅用于分析,還會保存在服務(wù)器中,為以后開發(fā)用戶管理系統(tǒng)做準(zhǔn)備。
(2)數(shù)據(jù)分析模塊
用戶上傳了數(shù)據(jù)以后,進(jìn)入分析主頁面,如圖3所示。顧名思義,此模塊實(shí)現(xiàn)了對于上傳數(shù)據(jù)的分析。按照前面建立的模型,將分析分為三種不同的類型:描述型分析、診斷型分析和預(yù)測型分析。
圖3 資源應(yīng)用行為分析主頁面
①描述型分析
描述型分析中有描述學(xué)習(xí)時(shí)間、發(fā)帖量、作業(yè)時(shí)間與成績關(guān)系的散點(diǎn)圖,此方法清晰展示了全部學(xué)習(xí)者資源應(yīng)用行為與成績的關(guān)系,由此可以發(fā)現(xiàn)行為對成績的影響;還有描述學(xué)生學(xué)習(xí)時(shí)間變化的折線圖,教師可以根據(jù)此圖發(fā)現(xiàn)后進(jìn)學(xué)生;以及描述資源偏好的直方圖,教師可以借助此結(jié)果進(jìn)行不同學(xué)習(xí)資源的推薦。圖4所示為描述型分析選擇頁面。
②診斷型分析
圖4 描述型分析選擇頁面
描述型分析包括了根據(jù)格雷戈克學(xué)習(xí)風(fēng)格模型的學(xué)習(xí)風(fēng)格診斷,根據(jù)威特金認(rèn)知風(fēng)格模型的認(rèn)知風(fēng)格診斷,以及國內(nèi)外文獻(xiàn)中已經(jīng)論證使用的學(xué)習(xí)困難診斷,作業(yè)完成效率診斷和穩(wěn)定性診斷。每一種診斷都是依據(jù)先前研究者的研究結(jié)果或在其基礎(chǔ)之上根據(jù)自身的研究環(huán)境和條件進(jìn)行學(xué)習(xí)者分類,并對不同的學(xué)習(xí)者提出了針對性建議。其中格雷戈克將學(xué)習(xí)者分為四種不同的學(xué)習(xí)風(fēng)格,包括喜歡通過直接的動手經(jīng)驗(yàn)學(xué)習(xí),希望教學(xué)組織得井然有序的具體──序列型風(fēng)格;能通過試誤法,從探索經(jīng)驗(yàn)中迅速得出結(jié)論的具體──隨機(jī)型;善于理解以邏輯序列呈示的詞語或符號信息的抽象——序列型;善于從演講中抓住要點(diǎn),理解意思,并能對演講者的聲調(diào)和演說風(fēng)格做出反應(yīng)的抽象──隨機(jī)型。威特金認(rèn)為風(fēng)格診斷將學(xué)習(xí)者的認(rèn)知風(fēng)格分為傾向于以外在參照作為信息加工依據(jù)的場依存型和傾向于更多利用內(nèi)在參照作為信息加工的依據(jù)場獨(dú)立型。學(xué)習(xí)困難診斷模型主要參照了國外學(xué)者Vincent Aleven等人設(shè)計(jì)的求助行為模型(help-seeking behavior Model)來診斷學(xué)生在學(xué)習(xí)過程中是否遇到問題,作業(yè)完成效率診斷和穩(wěn)定性診斷則使用了 José A.Ruipérez-Valiente、Pedro J.Mu?oz-Merino等人使用的數(shù)據(jù)分析方法進(jìn)行分析對比,發(fā)現(xiàn)存在問題的學(xué)習(xí)者。
③預(yù)測型分析
在預(yù)測型分析中,主要使用了關(guān)聯(lián)分析和分類決策樹兩種分析方法對網(wǎng)絡(luò)學(xué)習(xí)者的下一階段成績進(jìn)行預(yù)測。決策樹預(yù)測主要根據(jù)前一階段學(xué)習(xí)者的表現(xiàn),各個(gè)模塊的學(xué)習(xí)時(shí)間和成績來預(yù)測最終是否可以通過此課程。關(guān)聯(lián)分析主要是通過同學(xué)在各個(gè)章節(jié)的成績來預(yù)測章節(jié)之間是否存在關(guān)聯(lián)。圖5所示為預(yù)測型分析選擇頁面。
(3)知識應(yīng)用模塊
根據(jù)分析方法的不同,知識應(yīng)用也大致分為三種類型。針對描述型分析的結(jié)果將數(shù)據(jù)通過圖表的方式呈現(xiàn),利用計(jì)算機(jī)的處理能力對海量數(shù)據(jù)進(jìn)行處理、分析,最后轉(zhuǎn)換成客觀可見的圖表。診斷型分析的結(jié)果由兩種不同形式體現(xiàn),一種是反饋可視化的結(jié)果,通過圖表可以清晰判斷學(xué)習(xí)者的類型。另一種的分析結(jié)果會給用戶反饋學(xué)習(xí)者的診斷類型,而且針對不同學(xué)習(xí)者還會提供專業(yè)的建議。預(yù)測型分析則根據(jù)建立的預(yù)測模型反饋預(yù)測結(jié)果。
圖5 預(yù)測型分析選擇頁面
在技術(shù)支撐方面的研究點(diǎn)主要包括可視化、機(jī)器學(xué)習(xí)以及網(wǎng)頁設(shè)計(jì)技術(shù)。機(jī)器學(xué)習(xí)是本研究中開發(fā)分析工具的重點(diǎn)支撐技術(shù),可視化技術(shù)是分析結(jié)果呈現(xiàn)方面的研究重點(diǎn),網(wǎng)頁設(shè)計(jì)技術(shù)應(yīng)用在形成工具時(shí)的網(wǎng)頁顯示和交互。由于分析工具的特性以及前期對于兩種結(jié)構(gòu)的調(diào)研,最終選擇了B/S作為系統(tǒng)的架構(gòu)。其最大的優(yōu)點(diǎn)就是對系統(tǒng)使用者的友好。本研究考慮到開發(fā)周期和系統(tǒng)的維護(hù),選擇使用 “python”語言以及其開源框架“django”進(jìn)行開發(fā),可視化方面使用了“Google Char”,其具有良好的跨瀏覽器兼容性。系統(tǒng)數(shù)據(jù)交互功能的實(shí)現(xiàn),文件下載,主要是指用戶從服務(wù)器端將文件下載到本地的過程。本研究通過超鏈接獲取文件地址,然后“read”函數(shù)讀入文件,最后通過 “django”中“StreamingHttpRespons”對象傳輸?shù)綖g覽器中。其中在實(shí)現(xiàn)文件下載的過程中,方便處理較大的文件,使用了迭代器。數(shù)據(jù)上傳實(shí)現(xiàn)了將數(shù)據(jù)文件上傳到服務(wù)器中。當(dāng)“Django”處理一個(gè)上傳文件的時(shí)候,文件數(shù)據(jù)被放在“req.FILES”中,“Class FileForm”創(chuàng)建了一個(gè)能夠接收“req.FILES”文件數(shù)據(jù)的表單視圖。通過“POST”方式,可以獲取“req.FILES”文件,再使用“file”的寫操作將文件寫入服務(wù)器磁盤之中。系統(tǒng)通過正則表達(dá)式來判斷上傳文件的格式,符合格式的將可以進(jìn)行下一步分析工作。
以診斷型分析中的作業(yè)完成效率診斷為例。系統(tǒng)中,在相同時(shí)間內(nèi),得分較高的可以認(rèn)為效率高,在分?jǐn)?shù)同樣的情況時(shí),可以認(rèn)為花費(fèi)時(shí)間較少的效率較高。根據(jù)這個(gè)結(jié)論,本研究用“Score/Time”來表示效率。但是排出單次做題偶然性,又引入了嘗試次數(shù)此項(xiàng)數(shù)據(jù)。最終效率的計(jì)算公式為“Score×ATTEMPT_NUMBER/Time”(作業(yè)得分×嘗試次數(shù)/總時(shí)間),其中“ATTEMPT_NUMBER”表示嘗試某一章節(jié)練習(xí)的總次數(shù),“Time”代表這些嘗試所花費(fèi)的總時(shí)間,而“Score”代表了所有嘗試的總得分。從公式中可以發(fā)現(xiàn),算出的結(jié)果越大則可以認(rèn)為效率越高。如果某個(gè)學(xué)生多次嘗試某章節(jié)習(xí)題,雖然時(shí)間也隨著變多,但是隨著自己熟練度的增加,將“ATTEMPT_NUMBER/Time”提高,便可提高自己的效率。由于每門學(xué)科或者教學(xué)環(huán)境的差異,為了更準(zhǔn)確地找到效率突出的人,又加入平均值這個(gè)數(shù)據(jù)。通過把效率和平均值相比較就能找到那些“特殊的人”。此診斷方法只會反饋診斷結(jié)果,對于那些效率較低的人,則需要教師通過一些個(gè)性化的指導(dǎo)措辭來改善他們的行為[14]。最終反饋的可視化形式如圖6所示,橫坐標(biāo)代表每個(gè)學(xué)習(xí)者,縱坐標(biāo)代表了效率的數(shù)值。圖中的橫線表示平均水平。從圖中可以看出,第三個(gè)學(xué)生的學(xué)習(xí)效率超過橫線很多,可認(rèn)為學(xué)習(xí)效率較高,對于第六個(gè)學(xué)習(xí)者由于學(xué)習(xí)效率較低,教師需要通過單獨(dú)進(jìn)行溝通來改善此學(xué)習(xí)者的學(xué)習(xí)效率。
圖6 學(xué)習(xí)效率診斷反饋圖
為驗(yàn)證該系統(tǒng)的有效性,本研究中采用了兩方面數(shù)據(jù)來進(jìn)行測試,分別是基于edX平臺的開放學(xué)習(xí)者資源應(yīng)用行為數(shù)據(jù),以及某案例網(wǎng)絡(luò)教育學(xué)院成人教育數(shù)據(jù)。
該驗(yàn)證部分的MOOC數(shù)據(jù),來自于麻省理工學(xué)院在edX平臺上開設(shè)的計(jì)算機(jī)科學(xué)及編程導(dǎo)論課程,本研究選擇其在2013年春季學(xué)期參加此課程的學(xué)生資源應(yīng)用行為數(shù)據(jù)。此數(shù)據(jù)集是由MOOC課程的教輔人員整理后提供的“csv”文件。分析數(shù)據(jù)表中的屬性,大部分是學(xué)習(xí)行為結(jié)果數(shù)據(jù),對于診斷型和預(yù)測型的分析支持度不高,所以把這部分?jǐn)?shù)據(jù)進(jìn)行描述型分析的數(shù)據(jù)應(yīng)用。
本文工具驗(yàn)證使用的另一部分?jǐn)?shù)據(jù)是來自案例網(wǎng)絡(luò)教育學(xué)院成人遠(yuǎn)程教育學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)。這些數(shù)據(jù)都是直接來源于數(shù)據(jù)庫,未經(jīng)過任何整理。此部分?jǐn)?shù)據(jù)較為詳細(xì),由多個(gè)數(shù)據(jù)表構(gòu)成,由數(shù)據(jù)表顯示,數(shù)據(jù)庫里存儲了行為結(jié)果和行為過程兩個(gè)維度的多種數(shù)據(jù),所以此項(xiàng)數(shù)據(jù)可以被用來測試工具的描述型分析、診斷型分析和預(yù)測型分析三個(gè)部分。
通過分析MOOC數(shù)據(jù)的屬性,結(jié)合分析工具需要的數(shù)據(jù),以MOOC數(shù)據(jù)中的“”play_video”(觀看視頻的次數(shù))和“grade”(成績)兩個(gè)屬性為例,使用散點(diǎn)圖的呈現(xiàn)方式,探索視頻觀看次數(shù)與成績的關(guān)系。在使用分析工具之前,需要對數(shù)據(jù)進(jìn)行一些處理。通過把一些空值點(diǎn)和可能出現(xiàn)偏差的點(diǎn)刪除以后,還有三萬多條數(shù)據(jù),其中“Video_views”大于500的數(shù)據(jù)有1000多條,由于視頻觀看次數(shù)的跨度比較大,大部分?jǐn)?shù)據(jù)的“Video_views”集中在0-500,所以為了避免這部分?jǐn)?shù)據(jù)在生成圖像時(shí)影響結(jié)果,大于500的數(shù)據(jù)刪除。再通過分層抽樣選取1000個(gè)點(diǎn)使用分析工具,顯示結(jié)果如圖7所示。
圖7 MOOC數(shù)據(jù)描述型分析結(jié)果
從圖7中也可以發(fā)現(xiàn)以下幾個(gè)特點(diǎn):
(1)散點(diǎn)的分布沒有規(guī)律
從分析結(jié)果可以看出,散點(diǎn)的分布比較雜亂,但是由于學(xué)習(xí)者能力參差不齊,一部分學(xué)習(xí)者的能力較強(qiáng)或者有一定的基礎(chǔ),一部分的學(xué)習(xí)者學(xué)習(xí)能力較差或者對此領(lǐng)域沒有多少基礎(chǔ),所以導(dǎo)致圖雜亂無章,散點(diǎn)的分布沒有規(guī)律。
(2)兩個(gè)變量部分呈正相關(guān)關(guān)系
仔細(xì)觀察圖7,可以看出,較多的點(diǎn)集中在圖的左上三角,這就意味著,隨著視頻觀看次數(shù)的增多,學(xué)習(xí)成績也會有所提高。對于學(xué)習(xí)能力相近的人來說,成績與視頻觀看的次數(shù)呈現(xiàn)正相關(guān)關(guān)系。
(3)在橫軸的各個(gè)階段,成績?yōu)榱愕亩颊己艽蟊壤?/p>
圖7中顯示,各個(gè)視頻觀看次數(shù)階段的學(xué)習(xí)者都有未取得成績的。這也揭示了MOOC教育的一大弊端——學(xué)生的完成度較低。對于MOOC這種新型的教學(xué)模式來說,參與人數(shù)較多,但是完成度卻沒有保證。不過,從好的一方面考慮,可以認(rèn)為學(xué)習(xí)者是為了知識而學(xué)習(xí),并不是為了成績或者證書。
從案例網(wǎng)絡(luò)教育學(xué)院成人教育學(xué)習(xí)數(shù)據(jù)中提取所需要的屬性,同樣經(jīng)過刪除、抽樣等方法得到500個(gè)數(shù)據(jù),然后將其整理成Excel文件上傳到工具中,得到的分析結(jié)果如圖8所示。
圖8 案例網(wǎng)絡(luò)教育學(xué)院成人教育學(xué)習(xí)數(shù)據(jù)描述型分析結(jié)果
從圖8中,可以發(fā)現(xiàn)以下特點(diǎn):
(1)存在明顯的正相關(guān)趨勢
相比MOOC的分析結(jié)果,圖8中的正相關(guān)的趨勢更為明顯。說明了在成人教育中,大部分學(xué)習(xí)者的知識水平處于同一層次,這樣成績的好壞主要取決于個(gè)人的努力,所以當(dāng)觀看視頻的次數(shù)較多時(shí),會取得較高的成績。
(2)大部分成績分布在上三角
由于成人教育的目的是擴(kuò)大教育機(jī)會,提高國民素質(zhì),為那些由于各種原因失去受教育機(jī)會的人提供第二次獲取學(xué)歷的機(jī)會。所以其考核的難度設(shè)置的較低以保證大部分的學(xué)習(xí)者都能完成學(xué)業(yè)。只要按照老師的要求學(xué)習(xí),大部分的成績都能達(dá)到0.6-0.8之間。
由以上描述型分析可以看出,MOOC教育和成人教育的一些差異,MOOC教育和成人教育的目的不同,MOOC教育的意義在于使全世界各國都能接觸到世界一流的教育,其目的是知識的傳授,而成人教育的目的則是為一種較低水平的學(xué)歷教育。由于其目的的不同,學(xué)習(xí)者的構(gòu)成也有很大的區(qū)別。MOOC本身面對的就是世界各國各種水平的學(xué)習(xí)者,所以其學(xué)習(xí)過程會呈現(xiàn)較為隨機(jī)的狀態(tài)。而成人教育的學(xué)習(xí)者基本上都具有相同背景,所以表現(xiàn)出的規(guī)律性較強(qiáng)。
前面的章節(jié)已經(jīng)介紹了診斷型分析所需要的數(shù)據(jù),這里直接從數(shù)據(jù)庫提出相關(guān)數(shù)據(jù),進(jìn)行整理后上傳至工具中得到以下反饋結(jié)果。圖9顯示了學(xué)習(xí)風(fēng)格診斷的分析結(jié)果。從圖中可以看出分析結(jié)果分為兩個(gè)部分:診斷結(jié)果和建議。診斷結(jié)果部分顯示了每個(gè)學(xué)生對應(yīng)的學(xué)習(xí)風(fēng)格類型,建議部分描述各種所需要的應(yīng)對措施。教師可以根據(jù)學(xué)生的類型以及建議進(jìn)行個(gè)性化的指導(dǎo)。
圖9 學(xué)習(xí)風(fēng)格診斷結(jié)果
圖10顯示了學(xué)習(xí)效率診斷。這一分析需要教師根據(jù)結(jié)果自行判斷其需要采取的措施,例如在學(xué)習(xí)效率診斷中,發(fā)現(xiàn)3號學(xué)生的效率較高而6號學(xué)生的效率較低,教師可以以小組活動或者郵件告知等方式促使這兩個(gè)學(xué)習(xí)者進(jìn)行交流,以期改善6號學(xué)習(xí)者的學(xué)習(xí)效率。大多數(shù)情況下,在長期學(xué)習(xí)某門課時(shí),學(xué)習(xí)時(shí)間相對固定的學(xué)習(xí)者往往會取得較好的成績。通過穩(wěn)定性診斷,教師可以通知那些看似努力的同學(xué)(平均值比較高但方差比較大),改變自己的學(xué)習(xí)習(xí)慣可能會事半功倍。
圖10 學(xué)習(xí)效率診斷
本研究提取了案例學(xué)院特定課程四個(gè)模塊的學(xué)生學(xué)習(xí)成績作為預(yù)測型分析的數(shù)據(jù)。將這些數(shù)據(jù)上傳到工具以后選擇關(guān)聯(lián)分析。分析結(jié)果顯示:第一單元和第四單元、第三單元和第四單元之間的相關(guān)度較高,也就意味著學(xué)習(xí)者如果在第一單元中表現(xiàn)較好,很大概率在第四單元中有優(yōu)異的表現(xiàn)。通過使用真實(shí)數(shù)據(jù)對工具進(jìn)行試用后,發(fā)現(xiàn)工具的可用性較強(qiáng)。通過分析工具能清晰評價(jià)學(xué)生學(xué)習(xí)的整體情況以及課程設(shè)計(jì)的質(zhì)量,并且通過診斷型分析能找出不同學(xué)習(xí)者之間的差別,為個(gè)性化指導(dǎo)提供基礎(chǔ)。最后,教師可以使用預(yù)測型分析為危險(xiǎn)的學(xué)習(xí)者提供幫助,依據(jù)課程之間的關(guān)系更好地設(shè)計(jì)后續(xù)的課程等。
隨著計(jì)算機(jī)技術(shù)以及互聯(lián)網(wǎng)技術(shù)的發(fā)展,在線教育將會變得越來越普及,提高在線教育質(zhì)量以及實(shí)現(xiàn)個(gè)性化教學(xué)是未來在線教育發(fā)展的目標(biāo)。教育信息化的逐漸深入帶來了教育數(shù)據(jù)的爆發(fā)式增長,大數(shù)據(jù)、機(jī)器學(xué)習(xí)等技術(shù)也蓬勃發(fā)展。通過分析這些教育相關(guān)數(shù)據(jù),使實(shí)現(xiàn)個(gè)性化教學(xué)目標(biāo)成為可能。后續(xù)研究可以從如下幾個(gè)方面繼續(xù)開展:
本研究中也提到,分析工具實(shí)現(xiàn)了數(shù)據(jù)收集和數(shù)據(jù)分析的分離,這樣可以在不改變在線教育平臺系統(tǒng)結(jié)構(gòu)的情況下保證分析的統(tǒng)一性。但是相對造成了操作較繁瑣的問題,系統(tǒng)無法直接將收集的結(jié)果提交,而需要人工提交數(shù)據(jù),在操作過程中,需要花費(fèi)時(shí)間去處理數(shù)據(jù)格式等問題。未來需要對數(shù)據(jù)庫技術(shù)進(jìn)行深入研究,以實(shí)現(xiàn)在線教育平臺數(shù)據(jù)庫中的數(shù)據(jù)自動提交給分析工具,教師可在直接在工具中查看,不需要手動提交。
本研究的數(shù)據(jù)分析方法借鑒國內(nèi)外學(xué)者的不同研究,雖然他們在一定程度上證明了方法的可用性,但是由于各自研究的環(huán)境不同,在結(jié)果上肯定會出現(xiàn)一些偏差。而且由于本文是模型和工具的探索,無法掌握現(xiàn)研究階段所有的分析方法。因此建議后續(xù)研究中,可以嘗試使用不同的分析方法和算法,比較其差異性的同時(shí)逐步完善工具。
該分析工具雖然在界面有較好的交互,并在工具設(shè)計(jì)原則中注重用戶使用的簡便性,但是由于本研究在設(shè)計(jì)開發(fā)工具時(shí),缺少對用戶體驗(yàn)的研究。因此系統(tǒng)還需要針對用戶體驗(yàn),對頁面及部分功能模塊做適當(dāng)?shù)男薷摹?/p>