片錦香 浦春鈺 孫煥良 侯靜
摘要:研究生教育數據每年在成倍地增長,信息的復雜性也在逐年提升,想獲得微觀、個體的研究生教育情況,需要將大數據技術應用到研究生教育質量評價體系中。應用大數據技術可以實現對每個學生的教育質量的微觀、個體化跟蹤和未來發(fā)展的預測,對于可能出現問題的學生起到了及時的警告作用。
關鍵詞:大數據;研究生;質量評價體系
中圖分類號:G643 文獻標志碼:A 文章編號:1674-9324(2016)26-0075-02
一、引言
隨著研究生數量大幅增長,研究生教育質量信息數據也越來越龐大。如何處理這些海量的研究生質量信息也成為教育管理者難以解決的問題。傳統(tǒng)的研究生教育質量評價體系只能宏觀地描述研究生的教育情況,這種描述不能將研究生教育質量數據的動態(tài)特性呈現出來。華東師范大學校長俞立中教授在接受采訪時說:“信息化不是一個技術,也不是一個技術的推廣,而是一種管理理念[1]。”這句話啟示我們信息時代下,可以將信息技術與教育管理理念相結合,提出更好的學生教育質量評價體系。大數據技術就是這些信息技術其中之一。大數據即一般軟件工具難以捕捉、管理和分析的海量數據,通過對海量數據的交換、整合、分析,發(fā)現新的知識、創(chuàng)造新的價值,帶來“大知識”、“大科技”、“大利潤”和“大發(fā)展”[2]。在大數據時代下,應用于商業(yè)領域的大數據技術給了我們啟發(fā),如果將大數據技術應用于研究生教育質量評價體系,可動態(tài)地跟蹤研究生教育的相關信息,對信息進行分析綜合,預測學生在培養(yǎng)過程中不同方面的發(fā)展趨勢。
二、研究生教育信息管理數據
研究生教育數據主要包含教學運行數據、社交活動記錄數據、基礎條件數據、畢業(yè)生質量數據等。這些數據與傳統(tǒng)數據相比具有動態(tài)、實時、量大的特點,對于如何處理海量數據查詢效率的問題已經迫在眉睫[3]。隨著研究生人數的大幅度增加,管理這些教育數據的過程也越來越復雜,學生的發(fā)展趨勢也變得難以預測。為了解決這些問題,我們可以通過利用數據挖掘技術挖掘出研究生教育的相關信息,及時、全面、更加細?;仃P注學生教育質量,并對未來可能發(fā)生的情況做出預警。
隨著計算機技術的飛速發(fā)展,利用數據挖掘技術[4],可以將學生的教育信息更加及時地反映出來,并利用數據的動態(tài)變化可以預測出數據的未來發(fā)展趨勢。大數據時代的到來,讓所有社會科學領域能夠借由前沿技術的發(fā)展從宏觀群體走向微觀個體,讓跟蹤每一個人的數據成為了可能,從而讓研究“人性”成為了可能。而對于教育研究者來說,我們將比任何時候都更接近發(fā)現真正的學生[5]。這將使教育研究領域從宏觀整體走向微觀個體,實現“個性化”教育。
例如,我們可以通過采集學生進出門禁系統(tǒng)的數據進行研究生行為模式挖掘,判斷學生是否在校內、是否按時進出教學樓、食堂消費消息提示是否經常吃早餐、及時判斷學生的學習狀態(tài)等;另外,通過采集研究生學業(yè)數據的分析,可以進行學術成績的預警和判斷,根據不同課程的成績及階段性的成果,預測學生在研究期間能獲得的學術成果,有針對性地進行科研計劃的調整;在研究生就業(yè)階段的數據分析也可以對學生的就業(yè)情況進行跟蹤和分析,通過在研究生階段的學習數據及學生就業(yè)情況數據,挖掘出研究階段的成績與就業(yè)發(fā)展情況之間的聯系,有利于預測在校學生的就業(yè)發(fā)展情況,便于給出更為適合的就業(yè)指導。
三、大數據時代下的研究生教育質量評價體系內容
傳統(tǒng)的研究生測評體系只能宏觀地整體地詮釋研究生教育情況,用于教育政策決策。然而想獲得微觀、個體的研究生教育情況則需要將大數據技術應用到研究生教育質量評價體系中。在大數據時代下,研究生教育質量體系應當增添其他方面內容。
研究生的教育信息數據是動態(tài)的,利用大數據技術可以將這種動態(tài)表現出來。如跟蹤學生的學業(yè)情況,將學生每一時刻的學習及科研成果和該學生的行為模式結合起來,描述出該學生學業(yè)方面的動態(tài)過程和最后畢業(yè)時可能產生的結果。將這二者的聯系用于與現在校學生作對比,預測現在校學生未來學業(yè)情況。
具體地說,比如現在有一個學生平時不總去實驗室、圖書館,考試成績不理想,他現階段的學業(yè)情況剛好跟一個完不成科研任務而影響畢業(yè)的學生的學業(yè)情況很相似,那么就可以預測出這個學生也很有可能不能畢業(yè)。這樣就可以及時地提醒該學生要抓緊學習,以免影響畢業(yè)。利用大數據技術跟蹤學生的學業(yè)情況可以及時有效地在未發(fā)生錯誤的情況下對學生進行提醒或警告。
學生畢業(yè)之后,跟蹤學生職業(yè)的發(fā)展數據,不僅僅跟蹤學生到哪里就業(yè),還要跟蹤學生畢業(yè)后十年或是二十年的職業(yè)發(fā)展數據。這些職業(yè)發(fā)展數據要包括學生職場生涯中的每一次升職、每一次提薪和每一次跳槽。同樣,數據中還應包括學生在職場中遇到的失敗,比如降職或是被解雇。將描述出的學生職業(yè)發(fā)展的動態(tài)信息與學生從入學以來整個研究生期間的教育信息聯系起來,分析這兩者的關系,以此為依據找到在校學生中和就業(yè)相掛鉤的學生,可以提前有意識地培養(yǎng)這些學生,提高就業(yè)質量。對于其他學生可以起到預警的作用,使學生提前了解到自己現階段的學習和工作方式對今后的就業(yè)可能會產生不利的影響,并給予及時的糾正或完善,提高就業(yè)率。
四、大數據挖掘技術在學生質量評估體系中的應用
數據挖掘是一個利用各種分析工具在海量數據中發(fā)現模型和數據之間關系的過程,這些模型和關系可以被企業(yè)用來分析風險、進行預測[6]。數據挖掘是一門交叉性學科。數據挖掘過程經過數據收集、數據處理、數據變換、數據挖掘、模式評估、知識表示一系列的過程。該過程不是一次完成的,其中的一些步驟或整個過程都是經過數次數次或反復進行的。采用的算法非常多,比較常見的有:關聯規(guī)則方式、決策樹方法方式、神經網絡方法方式、粗糙集方式、遺傳算法、模糊論方法、可視化技術等[7-8]。
1.關聯規(guī)則算法在研究生教育質量測評體系中
的應用。關聯規(guī)則算法可以運用在研究生的學業(yè)數據挖掘中。關聯規(guī)則算法可以分析出不及格課程之間存在的緊密的相關性。具體表現為某幾科課程成績同時不及格的情況下,其他一些課程成績不及格的機率很大。關聯規(guī)則算法還可以分析出一些較為基礎的課程對其他課程的學習影響很大,學習好這幾門課程對于學習好其余課程有很大的幫助。這種分析課程之間的相關性的算法對于降低學生的掛科機率,提高學生的課程成績有很大幫助。
2.決策樹分類算法在研究生教育質量測評體系
中的應用。利用決策樹分類理論構建研究生教育質量測評決策樹,實現教育質量測評定性分析。從決策樹中可以看出,在具有某種優(yōu)勢的群體中,具有另一種優(yōu)勢的人占很大比例。這樣可以推斷出具有前一種優(yōu)勢的人一般都具有后一種優(yōu)勢。利用決策樹分類算法可以分析出不同性質的就業(yè)方向的研究生一般具有的優(yōu)勢,以及讀博深造的研究生一般具有的優(yōu)勢。這樣可以根據分析結果提前對現在校研究生的就業(yè)和讀博的適合度進行大體上的判斷。決策樹分類算法為學生規(guī)劃畢業(yè)后的發(fā)展方向提供有力的輔助決策作用。
3.采用k-means算法的聚類挖掘在研究生教育質
量測評體系中的應用。采用k-means算法的聚類挖掘能分析出某一群體的特征行為。應用在研究生教育質量測評體系中,可以分析出現學業(yè)警告或是就業(yè)困難的學生群體的行為特征,以及科研方面有較大成果或是就業(yè)質量較好的學生群體的行為特征。利用這些行為特征能夠預測現在校學生的未來發(fā)展趨勢,對于可能會出現學業(yè)警告或是就業(yè)困難的學生可以起到預警作用,而對于未來發(fā)展可能比較好的學生,學校可以提前有意識地培養(yǎng)。
五、結束語
本文探討了大數據技術在研究生教育質量評價體系中的應用,以此實現對研究生教育信息的動態(tài)化、細?;枋?。研究生教育數據每年在成倍地增長,信息的復雜性也在逐年提升,應用大數據技術在這些繁雜的數據信息中提取有價值的信息并對數據信息分析綜合得到衍生信息是研究生教育質量評價體系很有前景的一個發(fā)展方向。應用大數據技術可以實現對每個學生的教育質量的微觀、個體化跟蹤和未來發(fā)展的預測,對于可能出現問題的學生起到了及時的警告作用。大數據技術為研究生的學業(yè)培養(yǎng)及就業(yè)指導提供了有力的依據,已成為研究生教育質量評價體系中不可或缺的一部分。
參考文獻:
[1]榮碧蘭.基于高校復雜科研信息的數據倉庫與知識發(fā)現應用研究[D].大連:大連海事大學,2010.
[2]涂子沛.大數據:正在到來的數據革命,以及它如何改變政府、商業(yè)與我們的生活[M].桂林:廣西師范大學出版社,2012.
[3]孫勝耀,聶利穎.基于數據挖掘的高校學生信息海量數據處理[J].電腦知識與技術,2011,(8):5823.
[4]張明.基于數據挖掘的(預警)學生狀況分析[D].武漢:武漢科技大學,2008.
[5]張韞.大數據改變教育[J].SHANGHAI EDUCATION,2013,(4):11.
[6]牛祥春.基于數據挖掘的學生綜合測評系統(tǒng)應用研究[D].山東:山東科技大學,2006.
[7]王欣.基于數據挖掘的高校學生培養(yǎng)及就業(yè)指導研究[D].成都:西南交通大學,2006.
[8]Janwei Han and Micheline Kamber.數據挖掘概念與技術[M].范明,孟小峰,譯.北京:機械工業(yè)出版社,2007.