安 洋,李軍懷,王懷軍,殷仕剛
(西安理工大學(xué) a.信息化管理處,b.計(jì)算機(jī)科學(xué)與工程學(xué)院,西安 710048)
隨著物聯(lián)網(wǎng)、云計(jì)算、人工智能、大數(shù)據(jù)等技術(shù)的飛速發(fā)展,新一代信息技術(shù)深刻改變著人們的生產(chǎn)生活方式。大數(shù)據(jù)技術(shù)自全球推廣以來,對各行各業(yè)均產(chǎn)生了重要的影響。尤其是在教育行業(yè),利用大數(shù)據(jù)技術(shù)開展的各種分析應(yīng)用對于現(xiàn)階段各類學(xué)校的師生及學(xué)校管理人員等都有非常重要的意義[1]。
智能環(huán)境不僅改變了傳統(tǒng)教與學(xué)的方式,而且逐漸推動(dòng)教育理念、文化和生態(tài)的變革。積極推進(jìn)“大數(shù)據(jù)+教育”,堅(jiān)持信息技術(shù)與教育教學(xué)深度融合的核心理念,構(gòu)建數(shù)字化、智能化、個(gè)性化、終身化的教育體系,實(shí)現(xiàn)更加適合,更加可持續(xù)的教育[2-3]。
目前,高校教育教學(xué)普遍存在管理方式陳舊,效率低下,教學(xué)模式單一,缺乏個(gè)性化差異教學(xué)及考核測評體系不夠全面等問題。隨著各高校信息化建設(shè)的持續(xù)發(fā)展,從數(shù)字化校園建設(shè)階段步入智慧校園建設(shè)階段,學(xué)校管理、教學(xué)、科研等教育教學(xué)活動(dòng)中的每一個(gè)環(huán)節(jié),每分每秒都在產(chǎn)生各種各樣的數(shù)據(jù)[4]。作為學(xué)校的信息化部門,如何利用校園信息化環(huán)境中產(chǎn)生的大量數(shù)據(jù)來更好的輔助教育教學(xué),為學(xué)生提供更加智能化的學(xué)習(xí)體驗(yàn)成為本文的研究重點(diǎn)。
隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展與應(yīng)用,對學(xué)生日常生活學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)進(jìn)行采集,分析和處理,挖掘其潛在價(jià)值。本文依托學(xué)校數(shù)字化校園三大平臺,以學(xué)校公共數(shù)據(jù)庫為基礎(chǔ),將分散在學(xué)工、教務(wù)、財(cái)務(wù)、圖書、門禁、一卡通、校園網(wǎng)等系統(tǒng)中的學(xué)生教務(wù)考勤數(shù)據(jù)、學(xué)習(xí)成績數(shù)據(jù)、圖書館借閱數(shù)據(jù)、食堂就餐消費(fèi)數(shù)據(jù)、校園無線網(wǎng)絡(luò)定位、網(wǎng)絡(luò)日志等數(shù)據(jù)進(jìn)行采集存儲、分析計(jì)算。通過構(gòu)建學(xué)生行為與成績等主題間的關(guān)系模型,從不同維度挖掘、分析學(xué)生在校行為數(shù)據(jù)與學(xué)生成績、個(gè)性發(fā)展之間的關(guān)系,搭建學(xué)生在校行為綜合分析與服務(wù)平臺,為師生、各級管理機(jī)構(gòu)和校領(lǐng)導(dǎo)提供一個(gè)實(shí)時(shí)、全景式的數(shù)據(jù)分析和展現(xiàn)平臺,及時(shí)發(fā)現(xiàn)管理與教學(xué)活動(dòng)中存在的問題和規(guī)律,為學(xué)校各項(xiàng)決策提供輔助支持和依據(jù)。
現(xiàn)行高校教學(xué)管理大多主要依靠日常經(jīng)驗(yàn)和個(gè)人主觀意識進(jìn)行安排,管理方式陳舊,效率較低;教學(xué)模式主要采用線下課堂授課,以知識灌輸為主,缺乏興趣引導(dǎo),形式單一,無法實(shí)現(xiàn)個(gè)性差異化教學(xué);考核測評體系不夠全面,傳統(tǒng)的素質(zhì)測評體系形式單一,重結(jié)果輕過程,綜合素質(zhì)測評內(nèi)容陳舊。以上問題導(dǎo)致高校教育教學(xué)存在各種問題,不能很好地滿足師生需求。
隨著大數(shù)據(jù)技術(shù)的迅速普及,大數(shù)據(jù)+教育模式受到了專家學(xué)者的廣泛關(guān)注[5]。整合學(xué)校海量數(shù)據(jù),進(jìn)行跨域關(guān)聯(lián)、分析,為教育教學(xué)提供輔助,如:對學(xué)生上網(wǎng)行為與吃早餐和成績的關(guān)系預(yù)測學(xué)生下學(xué)期成績上升與下降趨勢,從而為學(xué)校開展個(gè)性化教育引導(dǎo)、教育資源優(yōu)化、教學(xué)方式改革、學(xué)生成長與發(fā)展預(yù)測等提供數(shù)據(jù)支撐。同時(shí),進(jìn)一步推動(dòng)教育改革向個(gè)性化、定量化、前置性預(yù)測的方向發(fā)展[6]。
大數(shù)據(jù)+教育模式相比于傳統(tǒng)教育環(huán)境下,對學(xué)生綜合分析方法有如下優(yōu)勢。
第一分析方法從主觀經(jīng)驗(yàn)判斷發(fā)展到客觀數(shù)據(jù)支持;
第二分析方式從總結(jié)性到伴隨性;
第三分析內(nèi)容從單一性到多元全面綜合性;
第四分析手段從人工到智能。
國內(nèi)對于大數(shù)據(jù)在學(xué)生行為綜合分析方面的研究也成為了眾多研究學(xué)者的研究重點(diǎn)。胡雅祺等人將大數(shù)據(jù)運(yùn)用于現(xiàn)代化教學(xué)中,幫助教師精準(zhǔn)掌握學(xué)生的學(xué)情;龔黎旰等人基于校園一卡通大數(shù)據(jù)對高校學(xué)生消費(fèi)行為進(jìn)行了分析;陳華等人對大數(shù)據(jù)視域下高職院校學(xué)生異常行為進(jìn)行了分析和研究[7];傲起等人采用大數(shù)據(jù)技術(shù)對高校學(xué)生網(wǎng)絡(luò)行為進(jìn)行了監(jiān)測,防止學(xué)生沉迷于網(wǎng)絡(luò)游戲[8]。本文以西安理工大學(xué)為例具體研究基于校園大數(shù)據(jù)的學(xué)生行為綜合分析與服務(wù)平臺設(shè)計(jì)與實(shí)現(xiàn)。
校園學(xué)生行為數(shù)據(jù)的積累為學(xué)生行為分析與預(yù)測提供了數(shù)據(jù)基礎(chǔ),如何運(yùn)用好這些數(shù)據(jù)對學(xué)生行為實(shí)現(xiàn)精準(zhǔn)、高效的感知、分析以及趨勢預(yù)測是本文研究的重點(diǎn)。針對以上問題,本文以學(xué)校線上業(yè)務(wù)系統(tǒng)、線下業(yè)務(wù)數(shù)據(jù)和日志數(shù)據(jù)為原始數(shù)據(jù)源,借助統(tǒng)一數(shù)據(jù)集成平臺、數(shù)據(jù)錄入工具及日志處理工具分別對三種數(shù)據(jù)源數(shù)據(jù)進(jìn)行處理與多源數(shù)據(jù)融合,形成基于主題的結(jié)構(gòu)化數(shù)據(jù)集存儲于Hadoop 數(shù)據(jù)倉庫中。其次,通過對原始數(shù)據(jù)預(yù)處理、統(tǒng)計(jì)、分析建立能夠完整刻畫學(xué)生個(gè)人特點(diǎn)以及其校園各方面行為的學(xué)生行為模型庫,結(jié)合機(jī)器學(xué)習(xí)、挖掘算法、特征模型、應(yīng)用模型、實(shí)時(shí)流計(jì)算等技術(shù),對學(xué)生行為進(jìn)行綜合分析。最后通過應(yīng)用層,將分析結(jié)果分模塊進(jìn)行呈現(xiàn)?;诖髷?shù)據(jù)的學(xué)生行為綜合分析與服務(wù)系統(tǒng)分為數(shù)據(jù)源、數(shù)據(jù)采集層、數(shù)據(jù)存儲層、數(shù)據(jù)處理層和應(yīng)用層,其總體結(jié)構(gòu)設(shè)計(jì)如圖1 所示。
圖1 平臺總體結(jié)構(gòu)設(shè)計(jì)
設(shè)計(jì)的平臺核心在于分布式數(shù)據(jù)處理與分析,流程如圖2 所示。首先對Hadoop 數(shù)據(jù)倉庫里的原始數(shù)據(jù)進(jìn)行預(yù)處理,這些數(shù)據(jù)包括考勤數(shù)據(jù)、成績數(shù)據(jù)、消費(fèi)數(shù)據(jù)、門禁數(shù)據(jù)、圖書數(shù)據(jù)、上網(wǎng)數(shù)據(jù)等,形成質(zhì)量較高、冗余度低的基本數(shù)據(jù)。其次,對于一些無需挖掘分析的數(shù)據(jù),我們僅僅進(jìn)行統(tǒng)計(jì)分析,并建立可視化模型,通過API 接口進(jìn)行發(fā)布,直觀的進(jìn)行應(yīng)用呈現(xiàn)。同時(shí),針對成績、消費(fèi)、考勤、圖書借閱等具有關(guān)聯(lián)關(guān)系或潛在數(shù)據(jù)價(jià)值的數(shù)據(jù)進(jìn)行深度挖掘分析,建立學(xué)生行為特征,基于提取的學(xué)生行為特征數(shù)據(jù)進(jìn)一步形成基于不同主題的分析模型庫(包括:預(yù)警模型、成績模型、消費(fèi)模型、軌跡模型等),結(jié)合聚類分析、關(guān)聯(lián)規(guī)則挖掘、協(xié)同過濾等機(jī)器學(xué)習(xí)算法對學(xué)生行為進(jìn)行深度分析,最后根據(jù)系統(tǒng)功能劃分分別進(jìn)行相關(guān)數(shù)據(jù)呈現(xiàn)。
圖2 分布式數(shù)據(jù)處理與分析流程
通過采集教務(wù)系統(tǒng)相關(guān)學(xué)生課程信息、成績信息、以及同專業(yè)學(xué)生成績信息等,實(shí)現(xiàn)對學(xué)生在校成績的趨勢分析,通過對比學(xué)生及同年級學(xué)生成績情況,幫助學(xué)生了解自身在校內(nèi)成績等級情況;整體呈現(xiàn)學(xué)生的個(gè)人信息,包括學(xué)生各個(gè)學(xué)期的課程表、上課情況、學(xué)生的基礎(chǔ)個(gè)人信息;采集校園一卡通數(shù)據(jù)及商戶信息,呈現(xiàn)學(xué)生個(gè)人消費(fèi)流水及消費(fèi)偏好、消費(fèi)項(xiàng)分布,通過對歷史消費(fèi)流水的分析,反饋學(xué)生消費(fèi)歷史及消費(fèi)發(fā)展情況,為后續(xù)分析學(xué)生近期在校狀態(tài)、學(xué)生獎(jiǎng)助學(xué)金評選、助學(xué)貸款申請等奠定數(shù)據(jù)基礎(chǔ);采集學(xué)生上網(wǎng)行為審計(jì)及上網(wǎng)認(rèn)證信息,對學(xué)生上網(wǎng)行為進(jìn)行分析,發(fā)現(xiàn)學(xué)生上網(wǎng)偏好、上網(wǎng)內(nèi)容分布及歷史上網(wǎng)流量和上網(wǎng)時(shí)長情況,基于這些信息來確定學(xué)生網(wǎng)絡(luò)使用習(xí)慣等,為后續(xù)評價(jià)學(xué)生日常行為習(xí)慣提供參考。
設(shè)計(jì)的基于大數(shù)據(jù)的學(xué)生行為綜合分析與服務(wù)平臺,功能結(jié)構(gòu)如圖3 所示。該系統(tǒng)在上文數(shù)據(jù)采集、轉(zhuǎn)換、預(yù)處理、數(shù)據(jù)建模、挖掘算法的基礎(chǔ)上進(jìn)行數(shù)據(jù)呈現(xiàn),主要分為綜合畫像、綜合預(yù)警、行為軌跡和精準(zhǔn)資助四部分。
圖3 系統(tǒng)功能結(jié)構(gòu)
綜合畫像:用大數(shù)據(jù)來描繪學(xué)生“個(gè)人畫像”和學(xué)?!叭后w畫像”。“個(gè)人畫像”展示了學(xué)生的學(xué)習(xí)、生活和成長軌跡,實(shí)現(xiàn)學(xué)生信息整合,讓學(xué)生管理部門能夠全面掌握學(xué)生的基本信息、學(xué)業(yè)成績、考勤情況、獎(jiǎng)懲情況、圖書借閱、預(yù)警信息、作息習(xí)慣、消費(fèi)情況、社交狀況、以及網(wǎng)絡(luò)使用等信息,實(shí)現(xiàn)不同個(gè)人的多維度對比,有助于老師或輔導(dǎo)員快速全面、全維度的認(rèn)識學(xué)生,全面提高學(xué)生管理工作的精細(xì)化。“群體畫像”包括生源分布、學(xué)生結(jié)構(gòu)、待處理預(yù)警數(shù)量、學(xué)院預(yù)警分布、圖書借閱次數(shù)、學(xué)生成績績點(diǎn)分布、近三年課程成績趨勢分析、圖書借閱關(guān)鍵詞排名、上網(wǎng)時(shí)長和時(shí)段分布、一卡通消費(fèi)趨勢分析、三餐就餐率、熱門窗口排名、就業(yè)去向分析等,能夠?qū)崿F(xiàn)對全?;蚰硨W(xué)院所有學(xué)生信息的概覽。
綜合預(yù)警:通過學(xué)生行為數(shù)據(jù),進(jìn)行學(xué)業(yè)預(yù)警、考勤預(yù)警、失聯(lián)預(yù)警、網(wǎng)絡(luò)預(yù)警等,讓學(xué)生工作預(yù)警更加精準(zhǔn)和有針對性,實(shí)現(xiàn)學(xué)生問題從“被動(dòng)管理”向“主動(dòng)預(yù)防”發(fā)展。跟蹤學(xué)生學(xué)習(xí)軌跡,進(jìn)行定量化分析,幫助學(xué)校把握學(xué)生學(xué)業(yè)知識理解程度與上課出勤率,進(jìn)行成績預(yù)測并預(yù)警掛科情況;配置學(xué)年完成條件,評估學(xué)業(yè)完成進(jìn)度,對完成度低、存在學(xué)業(yè)困難或出勤率低導(dǎo)致掛科率高的學(xué)生提供主動(dòng)式學(xué)業(yè)預(yù)警和考勤預(yù)警,提前引導(dǎo)。失聯(lián)預(yù)警是通過一卡通消費(fèi),無線網(wǎng)接入,圖書借閱和考勤門禁記錄等數(shù)據(jù),及時(shí)預(yù)警學(xué)生作息紊亂、行為異常等情況,可根據(jù)實(shí)際情況定義失聯(lián)輕重緩急程度,實(shí)現(xiàn)24 小時(shí)全天候預(yù)警,對學(xué)生的安全管理提供精細(xì)化數(shù)據(jù)支撐。對學(xué)生日常上網(wǎng)時(shí)長和時(shí)段進(jìn)行監(jiān)測,發(fā)現(xiàn)沉迷網(wǎng)絡(luò)、作息紊亂的學(xué)生予以網(wǎng)絡(luò)預(yù)警。
行為軌跡:基于全校所有學(xué)生、群體學(xué)生和重點(diǎn)人群的在校軌跡,結(jié)合百度地圖,提供分析學(xué)校的熱力分布、趨勢和學(xué)生軌跡校園活動(dòng)圖,并且分析各類群體和個(gè)人的熱門訪問地點(diǎn),發(fā)現(xiàn)群體間的行為區(qū)別,便于學(xué)校對不同群體和個(gè)人進(jìn)行針對性管理。
精準(zhǔn)資助:將學(xué)生在校消費(fèi)數(shù)據(jù)與建檔立卡情況相結(jié)合,利用大數(shù)據(jù)分析技術(shù),深入解析學(xué)生消費(fèi)水平、經(jīng)濟(jì)能力等,對學(xué)生經(jīng)濟(jì)情況進(jìn)行精準(zhǔn)化、個(gè)性化的綜合分析與評定,了解真實(shí)貧困狀態(tài),實(shí)現(xiàn)困難學(xué)生的精準(zhǔn)發(fā)現(xiàn)。同時(shí),對于已經(jīng)獲得貧困生資助的學(xué)生進(jìn)行動(dòng)態(tài)管理,實(shí)時(shí)對其在校消費(fèi)情況進(jìn)行分析,助力學(xué)校全方位、全過程的掌握學(xué)生經(jīng)濟(jì)水平,為學(xué)工處評定學(xué)校的獎(jiǎng)助補(bǔ)人員提供數(shù)據(jù)支撐。
實(shí)踐表明,本文提出的基于大數(shù)據(jù)的學(xué)生行為綜合分析與服務(wù)平臺能夠很好的輔助教育教學(xué)中的環(huán)節(jié),為師生、校領(lǐng)導(dǎo)提供客觀的數(shù)據(jù)分析結(jié)果,過程與結(jié)果并重,促進(jìn)教育服務(wù)供給精準(zhǔn)化、個(gè)性化和智能化。
高校信息化的不斷發(fā)展為師生提供了更加智能化、個(gè)性化的學(xué)習(xí)生活環(huán)境。通過大數(shù)據(jù)技術(shù)實(shí)現(xiàn)在校學(xué)生行為全過程的跟蹤監(jiān)測和無感式、伴隨性的數(shù)據(jù)采集,實(shí)現(xiàn)基于大數(shù)據(jù)的多維度綜合性智能化分析。本文依托學(xué)校數(shù)字化校園平臺研究并搭建了包含數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)預(yù)處理、數(shù)據(jù)建模、挖掘算法的基于大數(shù)據(jù)的學(xué)生行為綜合分析與服務(wù)平臺,通過構(gòu)建學(xué)生行為描述模型,利用深度學(xué)習(xí)的相關(guān)方法,分析學(xué)生在校學(xué)習(xí)、消費(fèi)等行為,為綜合全面的評價(jià)學(xué)生提供依據(jù),對學(xué)校教育教學(xué)質(zhì)量的提升具有促進(jìn)意義。