趙睿++王慶嶺
摘要:針對(duì)國(guó)內(nèi)外中等規(guī)模以上在線(xiàn)學(xué)習(xí)平臺(tái)課程完成率低、用戶(hù)流失嚴(yán)重的現(xiàn)象,分析了在線(xiàn)學(xué)習(xí)過(guò)程行為影響學(xué)習(xí)效果提升的關(guān)聯(lián)因素?;诖髷?shù)據(jù)技術(shù),構(gòu)建了在線(xiàn)學(xué)習(xí)過(guò)程行為分析模型總體框架和數(shù)據(jù)模型,依據(jù)行為科學(xué)和人工智能理論,完成了對(duì)在線(xiàn)學(xué)習(xí)行為的聚類(lèi)分析和關(guān)聯(lián)分析,最終,給出了個(gè)性化學(xué)習(xí)資源和教學(xué)策略的推薦,有效提高了在線(xiàn)課程資源的利用率和學(xué)習(xí)效果。
關(guān)鍵詞:大數(shù)據(jù);在線(xiàn)學(xué)習(xí)過(guò)程;數(shù)據(jù)模型;聚類(lèi)分析;課程推薦
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)30-0001-03
Design of Online Learning Process Behavior Analysis Frame Based on Big Data Technology
ZHAO Rui, WANG Qing-ling
(Department of Information Processing and Control Engineering, Lanzhou Petrochemical College of Vocational Technology, Lanzhou 730060, China)
Abstract:In view of the low completion rate and the serious loss of users in the online learning platform at home and abroad,analyzed the related factors that influence the learning effectiveness of online learning process behavior.Based on the big data technology, constructed the overall framework of online learning process behavior analysis model and the data model, on the basis of behavioral science and artificial intelligence theory, completed Cluster analysis and association analysis of online learning behaviors ,finally, recommended personalized learning resources and teaching strategies ,Effectively improved the utilization of online curriculum resources and learning results.
Key words:Big data; Online learning process; Data model;Cluster analysis;Course recommendation
隨著互聯(lián)網(wǎng)技術(shù)及教育信息化的快速發(fā)展,在線(xiàn)學(xué)習(xí)模式得到了學(xué)校、教師和學(xué)生的廣泛認(rèn)可,在線(xiàn)學(xué)習(xí)系統(tǒng)已成為教學(xué)單位的主要輔助教學(xué)平臺(tái)和職業(yè)素質(zhì)提升陣地,其注冊(cè)的學(xué)生人數(shù)和建設(shè)的課程資源出現(xiàn)了爆發(fā)式增長(zhǎng),在線(xiàn)學(xué)習(xí)平臺(tái)的應(yīng)用擴(kuò)展了教學(xué)手段、突破了教學(xué)活動(dòng)的時(shí)間和空間限制[1]。國(guó)內(nèi)外大多數(shù)在線(xiàn)學(xué)習(xí)平臺(tái)在應(yīng)用規(guī)模的增長(zhǎng)過(guò)程中,普遍出現(xiàn)了課程完成率低和用戶(hù)流失嚴(yán)重的現(xiàn)象 [2,3]。由于中等規(guī)模以上的在線(xiàn)學(xué)習(xí)平臺(tái)擁有較大的學(xué)生群和形式多樣的課程資源,本文依據(jù)大數(shù)據(jù)技術(shù),結(jié)合平臺(tái)數(shù)據(jù)庫(kù),采集Web服務(wù)器和客戶(hù)端形成的學(xué)習(xí)行為數(shù)據(jù),構(gòu)建在線(xiàn)學(xué)習(xí)行為數(shù)據(jù)分析模型,完成對(duì)在線(xiàn)學(xué)習(xí)行為的聚類(lèi)分析和關(guān)聯(lián)分析,給出個(gè)性化學(xué)習(xí)資源和教學(xué)策略的推薦。
1 構(gòu)建基于大數(shù)據(jù)技術(shù)的學(xué)習(xí)過(guò)程行為分析模型總體框架
1.1 在線(xiàn)學(xué)習(xí)過(guò)程
學(xué)習(xí)過(guò)程是在學(xué)習(xí)動(dòng)機(jī)指引下進(jìn)行的一系列學(xué)習(xí)活動(dòng),以滿(mǎn)足學(xué)生需要并獲取學(xué)習(xí)成果的過(guò)程[4]。在線(xiàn)學(xué)習(xí)過(guò)程是指學(xué)生在基于網(wǎng)絡(luò)環(huán)境開(kāi)發(fā)的集教、學(xué)活動(dòng)和課程資源為一體的平臺(tái)中,進(jìn)行自主學(xué)習(xí)和交互活動(dòng)的總稱(chēng)。學(xué)生根據(jù)自我動(dòng)機(jī)和學(xué)習(xí)需求,選擇在線(xiàn)課程,利用平臺(tái)工具進(jìn)行學(xué)習(xí)。
1.2 在線(xiàn)學(xué)習(xí)過(guò)程的大數(shù)據(jù)屬性
在線(xiàn)學(xué)習(xí)平臺(tái)經(jīng)過(guò)一段時(shí)間的運(yùn)行,平臺(tái)記錄的在線(xiàn)學(xué)習(xí)過(guò)程數(shù)據(jù)量大、類(lèi)型多,具有大數(shù)據(jù)的特性[5]。從量大、復(fù)雜的原始學(xué)習(xí)過(guò)程行為數(shù)據(jù)中挖掘?qū)W(xué)生具有監(jiān)控和引導(dǎo)作用的學(xué)習(xí)過(guò)程屬性,進(jìn)行分析和構(gòu)建數(shù)據(jù)模型。抽取的學(xué)習(xí)過(guò)程屬性要包含對(duì)資源的使用程度指標(biāo)和學(xué)習(xí)效果指標(biāo),具體屬性參數(shù)如表1所示。
1.3 構(gòu)建在線(xiàn)學(xué)習(xí)過(guò)程行為分析模型總體框架
利用大數(shù)據(jù)技術(shù),構(gòu)建在線(xiàn)學(xué)習(xí)過(guò)程行為分析模型總體框架,如圖1所示。首先,構(gòu)建在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)模型,完成數(shù)據(jù)采集和預(yù)處理。其次,設(shè)計(jì)在線(xiàn)學(xué)習(xí)過(guò)程行為分析模型橫向流程,包括采用K-means算法對(duì)學(xué)習(xí)過(guò)程行為數(shù)據(jù)進(jìn)行聚類(lèi)分析,個(gè)性化課程資源推薦,以及在線(xiàn)學(xué)習(xí)過(guò)程與學(xué)習(xí)效果關(guān)聯(lián)性挖掘等。最后,設(shè)計(jì)在線(xiàn)學(xué)習(xí)過(guò)程行為分析模型縱向流程,包括學(xué)習(xí)過(guò)程行為數(shù)據(jù)選取、預(yù)處理、分析方法選擇以及分析結(jié)果可視化等。
在線(xiàn)學(xué)習(xí)過(guò)程行為分析模型總體框架提供了研究學(xué)生在平臺(tái)中進(jìn)行的各類(lèi)學(xué)習(xí)過(guò)程,及學(xué)習(xí)過(guò)程行為分析模型建立流程。
2 在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)采集與預(yù)處理
2.1 在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)模型
在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)模型是學(xué)習(xí)過(guò)程的信息框架。根據(jù)在線(xiàn)學(xué)生的活動(dòng)等級(jí),將在線(xiàn)學(xué)習(xí)過(guò)程分為低級(jí)、中級(jí)和高級(jí)三個(gè)級(jí)別。低級(jí)在線(xiàn)學(xué)習(xí)過(guò)程是用戶(hù)在平臺(tái)中的一次性操作,如保存電子文檔、觀看視頻、收聽(tīng)音頻等操作。中級(jí)學(xué)習(xí)過(guò)程是用戶(hù)在平臺(tái)中的互動(dòng)操作,如在線(xiàn)交流、討論、提問(wèn)、解答及評(píng)價(jià)等操作。高級(jí)學(xué)習(xí)過(guò)程是用戶(hù)在平臺(tái)中利用已知知識(shí)完成綜合性問(wèn)題解答的操作,如對(duì)問(wèn)題的深加工、作品設(shè)計(jì)等操作。endprint
根據(jù)在線(xiàn)學(xué)習(xí)過(guò)程等級(jí)構(gòu)建的在線(xiàn)學(xué)習(xí)過(guò)程數(shù)據(jù)模型,如圖2所示。該數(shù)據(jù)模型具有多層次性,能夠更加深入分析在線(xiàn)學(xué)習(xí)過(guò)程的類(lèi)別、數(shù)據(jù)關(guān)系及數(shù)據(jù)定義格式,為學(xué)習(xí)過(guò)程行為的聚類(lèi)分析,課程資源推薦及學(xué)習(xí)過(guò)程與學(xué)習(xí)效果關(guān)聯(lián)分析提供基礎(chǔ)數(shù)據(jù)。
2.2 在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)采集
由于在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)復(fù)雜繁多,必須在后臺(tái)數(shù)據(jù)庫(kù)提供的基本課程及用戶(hù)數(shù)據(jù)基礎(chǔ)之上,結(jié)合從服務(wù)器端和客戶(hù)端采集的學(xué)習(xí)過(guò)程行為數(shù)據(jù),才能保障在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)的全面性和真實(shí)性。
1) 服務(wù)器端數(shù)據(jù)。學(xué)生登錄在線(xiàn)學(xué)習(xí)平臺(tái)選擇某門(mén)課程進(jìn)行學(xué)習(xí)時(shí),tomcate等Web服務(wù)器會(huì)利用系統(tǒng)日志記錄用戶(hù)的行為軌跡及各種操作,收集的信息包含學(xué)生的IP地址、登錄時(shí)間、在線(xiàn)時(shí)長(zhǎng)等。Web服務(wù)器系統(tǒng)日志采集用戶(hù)學(xué)習(xí)過(guò)程行為數(shù)據(jù)流程如圖3所示。
2) 客戶(hù)端數(shù)據(jù)。程序員可以利用Javascript等腳本語(yǔ)言及page、session、application等內(nèi)部對(duì)象實(shí)現(xiàn)對(duì)用戶(hù)數(shù)據(jù)收集,也可以借助一些具備數(shù)據(jù)收集功能的瀏覽器來(lái)采集平臺(tái)用戶(hù)的學(xué)習(xí)過(guò)程行為數(shù)據(jù)。
3) 學(xué)習(xí)平臺(tái)后臺(tái)數(shù)據(jù)庫(kù)。在線(xiàn)學(xué)習(xí)平臺(tái)的后臺(tái)數(shù)據(jù)庫(kù)MySQL記錄了用戶(hù)的基本信息以及學(xué)習(xí)課程的基本情況。
在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)由于存在不同的類(lèi)型,如結(jié)構(gòu)化、非結(jié)構(gòu)化及半結(jié)構(gòu)化,同時(shí),收集的源數(shù)據(jù)可能存在冗余、不完整、有噪聲的情況,需對(duì)原始學(xué)習(xí)過(guò)程行為數(shù)據(jù)進(jìn)行去重、去噪、轉(zhuǎn)換及缺失處理等數(shù)據(jù)預(yù)處理工作。
3 在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)的聚類(lèi)分析
由于學(xué)生在學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)需求以及學(xué)習(xí)方式等方面存在很大的差別,導(dǎo)致產(chǎn)生不同的學(xué)習(xí)行為。針對(duì)量大復(fù)雜學(xué)習(xí)活動(dòng)的分析,首要解決的是進(jìn)行學(xué)習(xí)過(guò)程行為數(shù)據(jù)的分類(lèi)。利用RFL分析方法構(gòu)建學(xué)習(xí)過(guò)程行為數(shù)據(jù)分類(lèi)指標(biāo)體系,使用K-means算法進(jìn)行學(xué)習(xí)過(guò)程行為數(shù)據(jù)聚類(lèi)分析,流程如圖4所示。
根據(jù)在線(xiàn)學(xué)習(xí)忠誠(chéng)度和學(xué)習(xí)效果,對(duì)學(xué)生學(xué)習(xí)過(guò)程行為數(shù)據(jù)進(jìn)行聚類(lèi)分析,將學(xué)生分為持續(xù)學(xué)習(xí)用戶(hù)、積極學(xué)習(xí)用戶(hù)等6種類(lèi)型。
1) 持續(xù)學(xué)習(xí)用戶(hù)。在線(xiàn)學(xué)習(xí)時(shí)間較長(zhǎng)、學(xué)習(xí)頻率較高,對(duì)課程擁有最高的忠誠(chéng)度,是平臺(tái)運(yùn)營(yíng)的主要競(jìng)爭(zhēng)力。
2) 積極學(xué)習(xí)用戶(hù)。在線(xiàn)學(xué)習(xí)總體學(xué)習(xí)時(shí)間較長(zhǎng)、頻率較高,但近期登錄平臺(tái)很少,對(duì)課程擁有良好的忠誠(chéng)度。
3) 獨(dú)立學(xué)習(xí)用戶(hù)。近期在線(xiàn)學(xué)習(xí)時(shí)間較長(zhǎng),但缺乏與同學(xué)的交流互動(dòng),對(duì)課程的忠誠(chéng)度一般。
4) 間斷學(xué)習(xí)用戶(hù)。在線(xiàn)學(xué)習(xí)次數(shù)較高但學(xué)習(xí)時(shí)間較短,對(duì)課程的忠誠(chéng)度較低。
5) 惰性學(xué)習(xí)用戶(hù)。在線(xiàn)學(xué)習(xí)時(shí)間較多,但次數(shù)少,對(duì)課程具有一定的忠誠(chéng)度。
6) 觀望學(xué)習(xí)用戶(hù)。學(xué)習(xí)進(jìn)度長(zhǎng)、在線(xiàn)學(xué)習(xí)次數(shù)很少且學(xué)習(xí)時(shí)間很短,對(duì)課程的忠誠(chéng)度最低。
在線(xiàn)學(xué)習(xí)平臺(tái)根據(jù)用戶(hù)類(lèi)型及時(shí)找出學(xué)習(xí)效果不佳的學(xué)生,提醒教師應(yīng)當(dāng)采取有效措施,如推薦合適的課程,來(lái)提高課程忠誠(chéng)度。
4 個(gè)性化課程推薦
根據(jù)課程學(xué)習(xí)過(guò)程行為數(shù)據(jù)的聚類(lèi)分析,進(jìn)行個(gè)性化的課程推薦,能夠增加在線(xiàn)學(xué)習(xí)資源的訪(fǎng)問(wèn)的機(jī)會(huì);能夠延長(zhǎng)用戶(hù)滯留學(xué)習(xí)時(shí)間,提高對(duì)學(xué)習(xí)平臺(tái)的粘性;能夠幫助學(xué)生發(fā)現(xiàn)感興趣的課程資源,提高學(xué)習(xí)的積極性。
在線(xiàn)學(xué)習(xí)平臺(tái)為不同學(xué)習(xí)需求和學(xué)習(xí)動(dòng)機(jī)的學(xué)生提供差異化的課程資源是平臺(tái)的基本服務(wù)和功能。平臺(tái)根據(jù)學(xué)生的興趣特征,采用PageRank算法找出代表性學(xué)生,為其推薦個(gè)性化的課程資源與內(nèi)容,具體流程如圖5所示。
圖5 個(gè)性化課程推薦流程
5 在線(xiàn)學(xué)習(xí)過(guò)程行為與學(xué)習(xí)效果的關(guān)聯(lián)規(guī)則分析
利用FRSAR(貝葉斯模糊粗糙集的屬性約簡(jiǎn))算法,對(duì)用戶(hù)學(xué)習(xí)行為與學(xué)習(xí)效果之間的關(guān)系進(jìn)行關(guān)聯(lián)分析,并用Apriori算法歸納出決策規(guī)則,為學(xué)生、老師及平臺(tái)管理者提供相應(yīng)的指導(dǎo)與對(duì)策[6]。例如,學(xué)生利用在線(xiàn)學(xué)習(xí)過(guò)程行為關(guān)聯(lián)性分析結(jié)果,調(diào)整學(xué)習(xí)計(jì)劃與進(jìn)程,提高學(xué)習(xí)進(jìn)度;教師利用關(guān)聯(lián)性分析結(jié)果向?qū)W生推薦適合的學(xué)習(xí)資源,改進(jìn)學(xué)習(xí)效果;平臺(tái)管理人員利用關(guān)聯(lián)性分析結(jié)果向?qū)W生推薦成功的學(xué)習(xí)經(jīng)驗(yàn),提供有針對(duì)性的教學(xué)策略。
6 分析結(jié)果可視化及應(yīng)用
將最終得到的學(xué)習(xí)過(guò)程行為分析結(jié)果呈現(xiàn)給學(xué)生、教師和其他結(jié)果需求者是在線(xiàn)學(xué)習(xí)過(guò)程行為分析中的一個(gè)重要環(huán)節(jié)。構(gòu)建在線(xiàn)學(xué)習(xí)過(guò)程行為分析模型要求注重對(duì)分析結(jié)果的呈現(xiàn)和表征,通過(guò)采用折線(xiàn)圖、條形圖、移動(dòng)點(diǎn)、圓餅圖等多種形式,將具體的分析結(jié)果以一種直觀易理解的方式呈現(xiàn)給學(xué)生、教師等,從而使他們能快速了解分析結(jié)果。通過(guò)觀察行為分析結(jié)果,能夠幫助學(xué)生進(jìn)行自我意識(shí)、自我反思和意義的建構(gòu)。教師可以根據(jù)分析結(jié)果反饋為學(xué)生重新設(shè)定學(xué)習(xí)路徑,通過(guò)互動(dòng)反饋可以進(jìn)一步掌握學(xué)生學(xué)習(xí)情況,實(shí)時(shí)調(diào)整教學(xué)內(nèi)容。平臺(tái)管理者通過(guò)分析結(jié)果可以?xún)?yōu)化平臺(tái)服務(wù)功能及支持工具,根據(jù)問(wèn)題學(xué)生的行為特征,設(shè)計(jì)出能夠及時(shí)解決學(xué)生流失問(wèn)題的措施服務(wù)及功能,為提高平臺(tái)用戶(hù)使用率提供一定的指導(dǎo)建議[8]。
7 結(jié)束語(yǔ)
采用大數(shù)據(jù)技術(shù),完成了學(xué)生在線(xiàn)學(xué)習(xí)過(guò)程行為數(shù)據(jù)的采集和預(yù)處理,構(gòu)建了數(shù)據(jù)分析模型,依據(jù)行為科學(xué)和人工智能理論對(duì)學(xué)習(xí)行為進(jìn)行界定和聚類(lèi)分析,實(shí)現(xiàn)了課程資源個(gè)性化推薦;依據(jù)學(xué)習(xí)行為與學(xué)習(xí)效果的關(guān)聯(lián)分析,實(shí)現(xiàn)了教學(xué)策略的定制化,解決了學(xué)生流失問(wèn)題,提高了學(xué)習(xí)效果和網(wǎng)絡(luò)課程資源利用率。
參考文獻(xiàn):
[1] 李爽,王增賢,喻忱.在線(xiàn)學(xué)習(xí)行為投入分析框架與測(cè)量指標(biāo)研究——基于LMS 數(shù)據(jù)的學(xué)習(xí)分析[J].開(kāi)放教育研究,2016,22(2):77-88.
[2] 姜強(qiáng),趙蔚,王朋嬌.基于大數(shù)據(jù)的個(gè)性化自適應(yīng)在線(xiàn)學(xué)習(xí)分析模型及實(shí)現(xiàn)[J].中國(guó)電化教育,2015,(1):85-92.
[3] 樊超,宗利永.MOOC在線(xiàn)學(xué)習(xí)行為的人類(lèi)動(dòng)力學(xué)分析[J].開(kāi)放教育研究,2016,22(2):53-58.
[4] 宗陽(yáng),孫洪濤,張享國(guó),等.MOOCs學(xué)習(xí)行為與學(xué)習(xí)效果的邏輯回歸分析[J].中國(guó)遠(yuǎn)程教育,2016,36(5):14-22.
[5] 田娜,陳明選.網(wǎng)絡(luò)教學(xué)平臺(tái)學(xué)生學(xué)習(xí)行為聚類(lèi)分析[J].中國(guó)遠(yuǎn)程教育,2014,(11):38-41.
[6] 施曉菁,梁循,孫曉蕾.基于在線(xiàn)評(píng)級(jí)和評(píng)論的評(píng)價(jià)者效用機(jī)制研究[J].中國(guó)管理科學(xué),2016,24(45):149-157.
[7] 榮輝桂,火生旭,胡春華.基于用戶(hù)相似度的協(xié)同過(guò)濾推薦算法[J].通信學(xué)報(bào),2014(2):16-24.
[8] 任泰明.高職院校院系級(jí)單位做好頂層設(shè)計(jì)、提高管理效率的探索與實(shí)踐[J].蘭州石化職業(yè)技術(shù)學(xué)院學(xué)報(bào),2016,16(4):37-38.