馬小剛
[摘 要] 目前高校信息化建設(shè)初見成效,各類信息管理系統(tǒng)建設(shè)較為完善,信息采集較為完整,并且個性化培養(yǎng)和個性化管理已經(jīng)成為高校育人的新方法、新途徑,如何快速準(zhǔn)確掌握學(xué)生的各項(xiàng)信息成為工作中的主要難點(diǎn)。本文提出了一種三方參與環(huán)境下基于數(shù)據(jù)挖掘技術(shù)的學(xué)工輔助系統(tǒng),可以在一定程度上提高輔導(dǎo)員的工作效率和工作準(zhǔn)確度。
[關(guān)鍵詞] 數(shù)據(jù)挖掘;輔導(dǎo)員;高校;信息管理系統(tǒng)
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 17. 071
[中圖分類號] G647;TP311 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1673 - 0194(2018)17- 0180- 03
1 前 言
隨著計算機(jī)技術(shù)的飛速發(fā)展,結(jié)合國家信息化發(fā)展整體戰(zhàn)略,高校信息化建設(shè)不斷完善,高校管理向“無紙化”方向邁進(jìn)[1-2]。目前,國內(nèi)各大高校里存在的信息系統(tǒng)多種多樣,例如,學(xué)工系統(tǒng)、教務(wù)管理系統(tǒng)、一卡通管理系統(tǒng)、資助管理系統(tǒng)等。高校建設(shè)的各種系統(tǒng)均完成了相應(yīng)的管理功能,高校中的各級管理者也都適應(yīng)了使用各類信息化系統(tǒng)開展管理工作,標(biāo)志著高校信息化基礎(chǔ)建設(shè)已經(jīng)初見成效。
目前,高校各類信息化系統(tǒng)大多是對數(shù)據(jù)庫中數(shù)據(jù)的簡單展示,無法展示這些數(shù)據(jù)背后所能夠代表的意義和結(jié)果。例如,高校輔導(dǎo)員想要得知一名學(xué)生的所有信息,就需要在所有系統(tǒng)中查詢該生的數(shù)據(jù),并人工對數(shù)據(jù)進(jìn)行測算或計算,最后將所有系統(tǒng)中的數(shù)據(jù)結(jié)果進(jìn)行匯總才能完整地表示出一名學(xué)生的信息。這使得工作量復(fù)雜且龐大,無法有效地幫助高校輔導(dǎo)員解決實(shí)際工作中的問題。因此設(shè)計一種能夠打通學(xué)校各類系統(tǒng),有效利用各系統(tǒng)中的數(shù)據(jù),并將數(shù)據(jù)結(jié)果“可視化”的系統(tǒng)就顯得尤為重要。
本文在高?,F(xiàn)有的各類信息化管理系統(tǒng)場景下,設(shè)計出一個三方參與的高校學(xué)工輔助系統(tǒng),該系統(tǒng)可以利用高?,F(xiàn)有數(shù)據(jù),對數(shù)據(jù)進(jìn)行深度挖掘,并對挖掘結(jié)果進(jìn)行“可視化”展示。一定程度上可以提高輔導(dǎo)員的工作效率和工作準(zhǔn)確性。
2 學(xué)工輔助系統(tǒng)設(shè)計
2.1 系統(tǒng)應(yīng)用場景
在高校目前的信息化環(huán)境下,輔導(dǎo)員、學(xué)工輔助系統(tǒng)和高?,F(xiàn)存的各類信息管理系統(tǒng)分別對應(yīng)了用戶、中間件和數(shù)據(jù)提供方,如圖1所示。
本系統(tǒng)整合了高?,F(xiàn)存的各類信息系統(tǒng),可以讓輔導(dǎo)員通過統(tǒng)一的界面對各個信息系統(tǒng)中的數(shù)據(jù)進(jìn)行查詢,并對查詢出的數(shù)據(jù)進(jìn)行一定的加工,用以展示數(shù)據(jù)背后所具有的聯(lián)系,從而提高輔導(dǎo)員的工作效率和工作精準(zhǔn)度。
2.2 系統(tǒng)功能設(shè)計
系統(tǒng)分為用戶模塊、數(shù)據(jù)交換模塊、數(shù)據(jù)處理模塊和數(shù)據(jù)展示模塊。其中,數(shù)據(jù)交換模塊為系統(tǒng)的基礎(chǔ)模塊,數(shù)據(jù)處理模塊為系統(tǒng)的核心模塊,這兩個模塊一起構(gòu)成了中間件服務(wù)。
用戶模塊負(fù)責(zé)對用戶的信息進(jìn)行維護(hù)、查詢和修改。
數(shù)據(jù)交換模塊負(fù)責(zé)對高?,F(xiàn)存的各類信息管理系統(tǒng)中的數(shù)據(jù)進(jìn)行預(yù)處理。目前,高校的各類信息系統(tǒng)由于建設(shè)時間不同、開發(fā)人員不同、業(yè)務(wù)需求不同等因素,各個系統(tǒng)中的數(shù)據(jù)存儲方式、數(shù)據(jù)內(nèi)容也不盡相同。因此在處理數(shù)據(jù)之前需要將各種系統(tǒng)中的數(shù)據(jù)盡可能地統(tǒng)一,并且盡可能地將同一名學(xué)生的數(shù)據(jù)進(jìn)行整合。數(shù)據(jù)交換模塊將各個系統(tǒng)中的數(shù)據(jù)庫作為子模塊,把子模塊中的數(shù)據(jù)集中調(diào)度,形成一套完整的數(shù)據(jù)庫,實(shí)現(xiàn)了學(xué)生在校園中所產(chǎn)生數(shù)據(jù)的統(tǒng)一存儲和統(tǒng)一管理,屏蔽了數(shù)據(jù)處理時的數(shù)據(jù)異構(gòu)問題。數(shù)據(jù)交換模塊如圖2所示。
圖2中集中數(shù)據(jù)交換部分負(fù)責(zé)將異構(gòu)的數(shù)據(jù)進(jìn)行清洗、整理和統(tǒng)一化,并集中存儲在數(shù)據(jù)庫中;統(tǒng)一數(shù)據(jù)存儲部分負(fù)責(zé)將數(shù)據(jù)調(diào)度中心處理好的數(shù)據(jù)進(jìn)行存儲,以備數(shù)據(jù)挖掘模塊調(diào)用。
高校各類信息系統(tǒng)中的數(shù)據(jù)產(chǎn)生,從時間維度上來看可分為動態(tài)數(shù)據(jù)和周期數(shù)據(jù)。例如,學(xué)生每天在校園中通過一卡通隨時隨地進(jìn)行消費(fèi),也可以隨時到圖書館借閱書籍,這類數(shù)據(jù)即為動態(tài)數(shù)據(jù),能夠表示學(xué)生短時間內(nèi)的需求;學(xué)生每個學(xué)期只有一次期末考試,期末考試成績以學(xué)期為周期產(chǎn)生,這類數(shù)據(jù)即為周期數(shù)據(jù),能夠表示學(xué)生長時間的成長走向。由于數(shù)據(jù)產(chǎn)生的周期不同,數(shù)據(jù)挖掘模塊不可能跟隨著學(xué)生動態(tài)數(shù)據(jù)的產(chǎn)生而進(jìn)行計算。一般情況下,數(shù)據(jù)挖掘模塊會最小以天為單位進(jìn)行計算。由于信息量較大,計算時間較長,而在這段時間內(nèi)也有可能產(chǎn)生動態(tài)數(shù)據(jù)從而影響計算數(shù)據(jù)時間維度上的一致性,同時為了有效防止數(shù)據(jù)因不可抗力或其他人為因素造成的丟失,因此使用雙數(shù)據(jù)庫設(shè)計,這兩個數(shù)據(jù)庫互為備份,而數(shù)據(jù)挖掘模塊每次僅對一個數(shù)據(jù)庫進(jìn)行計算并產(chǎn)生結(jié)果,在計算過程中到下次計算之前,另外一個數(shù)據(jù)庫接管這段時間內(nèi)的數(shù)據(jù)存儲需求。
為更好地幫助輔導(dǎo)員準(zhǔn)確了解學(xué)生,本系統(tǒng)引入“學(xué)生畫像”概念來展示學(xué)生各方面的信息。數(shù)據(jù)挖掘模塊負(fù)責(zé)對統(tǒng)一數(shù)據(jù)存儲部分所存儲的數(shù)據(jù)進(jìn)行計算,通過數(shù)據(jù)挖掘算法在大量無關(guān)數(shù)據(jù)中挖掘數(shù)據(jù)潛在的隱性關(guān)系[3],生成標(biāo)簽數(shù)據(jù),并利用標(biāo)簽數(shù)據(jù)生成“學(xué)生畫像”[4-5]。其算法流程描述如下:
步驟1:根據(jù)數(shù)據(jù)類別對數(shù)據(jù)進(jìn)行處理,并生成標(biāo)簽數(shù)據(jù);
步驟2:對生成的數(shù)據(jù)標(biāo)簽進(jìn)行關(guān)聯(lián)分析,生成動態(tài)關(guān)聯(lián)規(guī)則;
步驟3:對單一學(xué)生的所有數(shù)據(jù)進(jìn)行分析并與數(shù)據(jù)庫中已有的標(biāo)簽數(shù)據(jù)進(jìn)行關(guān)聯(lián),生成“學(xué)生畫像”;
步驟4:利用“學(xué)生畫像”的標(biāo)簽數(shù)據(jù)為學(xué)生以后的行為進(jìn)行預(yù)測。
數(shù)據(jù)展示模塊負(fù)責(zé)將數(shù)據(jù)挖掘模塊生成的標(biāo)簽數(shù)據(jù)與學(xué)生的基本信息以圖表的形式進(jìn)行展示,增加用戶體驗(yàn)度和信息傳遞量,降低用戶的使用難度,從一定程度上提高工作效率和工作準(zhǔn)確度。
利用本文設(shè)計方案建設(shè)的學(xué)工輔助系統(tǒng)優(yōu)勢在于能夠形成統(tǒng)一的數(shù)據(jù)存儲,屏蔽了不同系統(tǒng)的數(shù)據(jù)異構(gòu)性,同時高校內(nèi)各個信息管理系統(tǒng)無須進(jìn)行大規(guī)模業(yè)務(wù)調(diào)整,并具有一定程度上的容災(zāi)性。
3 學(xué)工輔助系統(tǒng)應(yīng)用分析
3.1 貧困生身份鑒別
學(xué)生資助是高校輔導(dǎo)員每年的重要工作之一,這項(xiàng)工作的難點(diǎn)是如何準(zhǔn)確地判斷貧困學(xué)生。目前輔導(dǎo)員判定貧困學(xué)生主要依靠三級評定制度來完成,即班級貧困認(rèn)定小組、專業(yè)貧困認(rèn)定小組和年級貧困認(rèn)定小組。由于有人工干預(yù),不免會有影響判斷的主觀因素產(chǎn)生,最終會導(dǎo)致認(rèn)定結(jié)果的不科學(xué)、不準(zhǔn)確。學(xué)工輔助系統(tǒng)利用學(xué)生的一日消費(fèi)數(shù)據(jù)、一周消費(fèi)數(shù)據(jù)和一月消費(fèi)數(shù)據(jù)對單一學(xué)生的消費(fèi)能力生成用戶畫像,同時對學(xué)生所在班級、所在專業(yè)、所在學(xué)院學(xué)生的日、周、月平均消費(fèi)能力進(jìn)行計算生成群體畫像。通過單一用戶畫像與群體畫像的匹配,推測學(xué)生的貧困級別,從而完成貧困生身份的鑒別工作。
3.2 學(xué)業(yè)警示
學(xué)生來學(xué)校的主要目的是學(xué)習(xí),而大學(xué)相比中小學(xué)的學(xué)習(xí)方式有很大的不同。很多學(xué)生在大學(xué)的環(huán)境中,往往由于過于“自由”而喪失學(xué)習(xí)動力和學(xué)習(xí)目標(biāo),家長對于學(xué)生在學(xué)校的情況又很難準(zhǔn)確知曉,即便是輔導(dǎo)員想要準(zhǔn)確了解每名學(xué)生的學(xué)習(xí)情況也很難做到。本系統(tǒng)可利用學(xué)生單一科目期末考試成績、學(xué)科類別平均成績、總體成績平均績點(diǎn)以及圖書館借閱數(shù)據(jù)等來生成學(xué)生的用戶畫像,同時將班級內(nèi)同學(xué)的單一科目期末考試平均成績、學(xué)科類別平均成績、總體成績平均績點(diǎn)和圖書館借閱數(shù)據(jù)等生成群體畫像,通過對比生成學(xué)生學(xué)業(yè)預(yù)警信息。輔導(dǎo)員可以通過學(xué)業(yè)預(yù)警信息及時與學(xué)生和家長展開談話和溝通工作,助力學(xué)生的成長成才。
3.3 心理危機(jī)預(yù)警
近年來,大學(xué)生由于心理問題引發(fā)的突發(fā)狀況頻頻發(fā)生,尤其是自殺傷人事件的發(fā)生率呈上升趨勢,給學(xué)生本人及其家庭帶來了極大的痛苦,同時給學(xué)生、學(xué)校和教學(xué)秩序造成了不良影響。目前,各高校都已初步形成了自己的心理危機(jī)預(yù)警體系,學(xué)校設(shè)置心理咨詢中心,學(xué)院設(shè)置心理咨詢分站,各個班級設(shè)置心理委員,目的就是及時發(fā)現(xiàn)可能存在心理危機(jī)的學(xué)生。即便是層層防控,還是有遺漏和疏忽的地方,這就需要有一個系統(tǒng)可以從學(xué)生的學(xué)業(yè)成績、家庭經(jīng)濟(jì)情況、學(xué)校生活情況、校園社交等方面綜合展示學(xué)生的各項(xiàng)狀態(tài),用以輔助發(fā)現(xiàn)可能有心理危機(jī)的學(xué)生。
學(xué)工輔助系統(tǒng)的應(yīng)用不僅限于以上三點(diǎn),同時服務(wù)對象也不僅為高校輔導(dǎo)員。由于系統(tǒng)連通學(xué)校各信息管理系統(tǒng),學(xué)生也可以用真實(shí)數(shù)據(jù)來預(yù)測自己的未來發(fā)展和職業(yè)規(guī)劃。因此,本系統(tǒng)是一個面向全校的開放性系統(tǒng),允許高校其他管理信息系統(tǒng)接入,通過對不同數(shù)據(jù)的組合分析,可以讓本系統(tǒng)具有更廣泛、更豐富的使用面和應(yīng)用場景。
4 學(xué)工輔助系統(tǒng)建設(shè)過程存在的問題
4.1 學(xué)工輔助系統(tǒng)與其他信息管理系統(tǒng)數(shù)據(jù)對接問題
學(xué)工輔助系統(tǒng)的建設(shè)基礎(chǔ)是建立數(shù)據(jù)交換模塊,建設(shè)數(shù)據(jù)交換模塊的主要困難是如何與高?,F(xiàn)有系統(tǒng)進(jìn)行對接。高校內(nèi)信息管理系統(tǒng)大多是不同開發(fā)者進(jìn)行開發(fā)的,部分信息管理系統(tǒng)已經(jīng)運(yùn)行多年,數(shù)據(jù)量十分龐大并且運(yùn)行效率低下,有些系統(tǒng)甚至早已失去官方維護(hù)服務(wù)。這種情況下建設(shè)數(shù)據(jù)交換模塊需要對高校各個信息管理系統(tǒng)進(jìn)行深入的了解,并將系統(tǒng)內(nèi)的核心數(shù)據(jù)進(jìn)行提取,對系統(tǒng)進(jìn)行小規(guī)模的二次開發(fā)。
4.2 數(shù)據(jù)選擇問題
在打通各個信息系統(tǒng)之后還需考慮數(shù)據(jù)去留和數(shù)據(jù)清洗問題。由于學(xué)生每天在學(xué)校產(chǎn)生的數(shù)據(jù)是多種多樣的,有些數(shù)據(jù)具有實(shí)際意義,有些數(shù)據(jù)反而會對系統(tǒng)運(yùn)行結(jié)果產(chǎn)生干擾。例如,利用消費(fèi)數(shù)據(jù)進(jìn)行貧困生身份識別,當(dāng)貧困生補(bǔ)助發(fā)放至學(xué)生的一卡通時,學(xué)生在某個時間段內(nèi)的消費(fèi)能力可能會有提升,這將會對他下一季度的貧困生身份鑒定產(chǎn)生影響。如何對已知數(shù)據(jù)進(jìn)行預(yù)處理,增加運(yùn)行結(jié)果的可信度也是學(xué)工輔助系統(tǒng)建設(shè)過程中需要考慮的問題。
4.3 業(yè)務(wù)判定標(biāo)準(zhǔn)問題
在系統(tǒng)建設(shè)過程中還需考慮各個業(yè)務(wù)標(biāo)準(zhǔn)的建設(shè)。例如,學(xué)生一個學(xué)期不通過的課程在2門及以上就要進(jìn)行學(xué)業(yè)預(yù)警;學(xué)生的消費(fèi)能力低于全校平均水平的三分之二即可認(rèn)定成為貧困生。每個新業(yè)務(wù)的增加都要考慮相對應(yīng)的判定標(biāo)準(zhǔn),這樣在建設(shè)過程中才能夠準(zhǔn)確把握系統(tǒng)建設(shè)的科學(xué)性和準(zhǔn)確性。
5 結(jié) 語
數(shù)據(jù)挖掘是一門較為成熟的學(xué)科,并在多個領(lǐng)域內(nèi)發(fā)揮出重要作用。目前,高校的信息化建設(shè)已經(jīng)初見成效,信息采集較為完整,信息數(shù)量非常龐大,人工已經(jīng)無法準(zhǔn)確處理每項(xiàng)數(shù)據(jù)。現(xiàn)在學(xué)生的思想較為開放,個性鮮明,一刀切的管理模式已經(jīng)不再適應(yīng)現(xiàn)在的大學(xué)校園。個性化培養(yǎng)、個性化管理模式已經(jīng)進(jìn)入高校人才培養(yǎng)的視野,在這種情況下,更需要準(zhǔn)確把握每一名學(xué)生的各項(xiàng)信息,有針對性地開展工作,幫助學(xué)生成長成才,這就需要一個全新的系統(tǒng)來輔助決策。本文設(shè)計了一種基于數(shù)據(jù)挖掘的學(xué)工輔助系統(tǒng),利用標(biāo)簽數(shù)據(jù)生成“學(xué)生畫像”并利用學(xué)生畫像來為學(xué)生進(jìn)行一系列信息和行為的預(yù)警和預(yù)測,為高校輔導(dǎo)員提供了個性化管理和個性化培養(yǎng)的新途徑。
主要參考文獻(xiàn)
[1]丁亦喆, 魏刃佳, 劉博,等. 移動互聯(lián)網(wǎng)中一種移動學(xué)習(xí)方案的設(shè)計與原型實(shí)現(xiàn)[J]. 計算機(jī)工程與科學(xué),2015,37(2):288-293.
[2]王征. 試析高校管理中應(yīng)用數(shù)據(jù)挖掘技術(shù)的途徑[J]. 教育現(xiàn)代化, 2018(2).
[3]蔡秀娟, 蔣艷榮. 模糊數(shù)據(jù)挖掘在高校學(xué)生管理中的應(yīng)用[J]. 華南農(nóng)業(yè)大學(xué)學(xué)報:社會科學(xué)版,2006,5(3):143-147.
[4]趙國亮, 陳曉軍, 李思奇,等. 基于數(shù)據(jù)分析高校學(xué)生自畫像的初探[J]. 數(shù)字技術(shù)與應(yīng)用, 2017(8):233-234.
[5]丁亦喆. 基于標(biāo)簽的個性化推薦方法研究[D].西安:陜西師范大學(xué), 2014.