【摘要】? ? 文章介紹了大數(shù)據(jù)的相關(guān)概念,闡述了目前高校在管理學(xué)生中使用大數(shù)據(jù)的現(xiàn)狀,對(duì)大數(shù)據(jù)環(huán)境下的高校學(xué)生行為數(shù)據(jù)分析系統(tǒng)進(jìn)行了總體設(shè)計(jì)和需求分析。
【關(guān)鍵詞】? ? 大數(shù)據(jù)? ? 數(shù)據(jù)分析系統(tǒng)
Abstract: This paper introduces the related concepts of large data, expounds the current situation of the use of large data in the management of college students, and analyzes the overall design and demand analysis of the college student behavior data analysis system under the large data environment.
Keywords: big data; data analysis system
一、大數(shù)據(jù)概述
隨著信息技術(shù)的飛速發(fā)展,人們生活及生產(chǎn)的各個(gè)方面都在不斷變化,同時(shí)產(chǎn)生了大量數(shù)據(jù)。為了實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的存儲(chǔ)、分析和處理,挖掘有價(jià)值信息,在新興的互聯(lián)網(wǎng)技術(shù)、計(jì)算機(jī)信息處理技術(shù)、物聯(lián)網(wǎng)技術(shù)的推動(dòng)下,大數(shù)據(jù)技術(shù)迅速誕生并發(fā)展成為社會(huì)各界關(guān)注的焦點(diǎn)。近年來(lái),在眾多大數(shù)據(jù)處理技術(shù)中,出現(xiàn)了Apache Hadoop、Spark、Flink等為代表的主流大數(shù)據(jù)處理技術(shù)和系統(tǒng)平臺(tái)[1]。利用這些平臺(tái)能有效處理企業(yè)及高校的各類數(shù)據(jù)問(wèn)題。
二、高校信息化水平概述
髙校作為走在信息化前沿的重要行業(yè),每年投入巨大,校園信息化建設(shè)不斷完善,各個(gè)學(xué)校已經(jīng)建立了眾多的應(yīng)用管理系統(tǒng)。這些系統(tǒng)經(jīng)過(guò)多年的積累,已經(jīng)形成了大量的應(yīng)用數(shù)據(jù),而據(jù)不完全統(tǒng)計(jì),國(guó)內(nèi)高校應(yīng)用系統(tǒng)沉淀的海量數(shù)據(jù)基本處于"沉睡"狀態(tài),結(jié)合我國(guó)教育大數(shù)據(jù)行業(yè)的發(fā)展,"喚醒"送些"沉睡"的高校數(shù)據(jù),使用大數(shù)據(jù)分析的方法,給高等院校的領(lǐng)導(dǎo)、老師、學(xué)生提供更加直觀的決策及管理依據(jù)變得越來(lái)越重要[2]。雖然國(guó)家高度重視教育信息化的建設(shè),但是各地教育信息化發(fā)展水平不均,并且各大高校對(duì)學(xué)生行為大數(shù)據(jù)分析進(jìn)行研究的程度和角度不同。南方某高校利用學(xué)生在可控社交網(wǎng)絡(luò)實(shí)驗(yàn)室上的行為數(shù)據(jù)以及學(xué)生在校的行為數(shù)據(jù)(微博、微信、郵箱、刷卡信息)進(jìn)行分析挖掘,以學(xué)生“體檢報(bào)告”的形式對(duì)行為進(jìn)行總結(jié),并在預(yù)警食堂突發(fā)事件和學(xué)生非正常離校方面取得了很大的進(jìn)展。他們對(duì)于學(xué)生行為數(shù)據(jù)分析維度單一、結(jié)果簡(jiǎn)單,不足以為教師、高校管理人員提供豐富的決策數(shù)據(jù)。結(jié)合大數(shù)據(jù)技術(shù),以學(xué)生行為數(shù)據(jù)為基礎(chǔ),構(gòu)建分析系統(tǒng),非常有必要,也很有意義。系統(tǒng)平臺(tái)能提高學(xué)生管理工作人員的工作效率和服務(wù)質(zhì)量[3],增進(jìn)學(xué)生管理工作人員對(duì)學(xué)生的進(jìn)一步了解,使得他們?cè)诠芾肀姸鄬W(xué)生時(shí)能做到有的放矢,有章可循,更好的服務(wù)學(xué)生成長(zhǎng)成才。
三、總體設(shè)計(jì)與需求分析
1、總體實(shí)施構(gòu)架。系統(tǒng)主要利用機(jī)器學(xué)習(xí)及大數(shù)據(jù)技術(shù),通過(guò)深層次分析學(xué)生在校期間產(chǎn)生的各類校園數(shù)據(jù),探索學(xué)生群體的行為模式分類方法、學(xué)生網(wǎng)絡(luò)評(píng)論的情感極性分類方法、學(xué)生特殊群體及異常行為判定的方法,為教師因材施教提供支持,使得學(xué)生管理工作人員可以及時(shí)的關(guān)注學(xué)生的行為發(fā)展,盡早做出決策,提升高校學(xué)生管理人員的工作效率、服務(wù)質(zhì)量。項(xiàng)目的實(shí)施架構(gòu)包括數(shù)據(jù)采集、數(shù)據(jù)分析、結(jié)果呈現(xiàn)三個(gè)部分:(1)構(gòu)建基于hadoop的大數(shù)據(jù)平臺(tái),為后續(xù)數(shù)據(jù)處理、分析提供基礎(chǔ)實(shí)驗(yàn)環(huán)境。(2)實(shí)現(xiàn)數(shù)據(jù)采集、清洗、存儲(chǔ)。 (3)分析數(shù)據(jù),呈現(xiàn)結(jié)果。
2、應(yīng)用功能規(guī)劃。(1)學(xué)生行為模式管理。研究使用機(jī)器學(xué)習(xí)中的K-means算法,結(jié)合服務(wù)器中的數(shù)據(jù),驗(yàn)證并實(shí)現(xiàn)高校學(xué)生行為模式分析。根據(jù)學(xué)生一卡通消費(fèi)數(shù)據(jù)、位置定位數(shù)據(jù),結(jié)合算法,進(jìn)行歸類,將學(xué)生行為模式劃分為優(yōu)良,中等,及格,不及格四個(gè)等級(jí)。(2)學(xué)生情感模式管理。研究使用基于依存關(guān)系分析的極性分類算法,結(jié)合服務(wù)器中的數(shù)據(jù),實(shí)現(xiàn)高校學(xué)生情感模式分類分析。(3)學(xué)生異常行為管理。使用SVM算法,結(jié)合服務(wù)器中的數(shù)據(jù),驗(yàn)證并實(shí)現(xiàn)高校學(xué)生特殊群體及異常行為分析。研究學(xué)生的基本信息、家庭信息、在校期間的學(xué)習(xí)成績(jī)記錄、一卡通日常消費(fèi)記錄、學(xué)生活動(dòng)記錄、輔導(dǎo)員與學(xué)生的深度輔導(dǎo)談話記錄等學(xué)生校園數(shù)據(jù),通過(guò)學(xué)生對(duì)比輔以以往經(jīng)驗(yàn),制定學(xué)生異常行為判定條件,對(duì)初判的重點(diǎn)類型的學(xué)生及時(shí)了解,一旦發(fā)現(xiàn)問(wèn)題,及時(shí)給與更多的關(guān)注,有效預(yù)防學(xué)生發(fā)生意外情況。
結(jié)語(yǔ):隨著大數(shù)據(jù)技術(shù)與應(yīng)用模式的快速發(fā)展,各類基于大數(shù)據(jù)構(gòu)建的系統(tǒng)已經(jīng)成為互聯(lián)網(wǎng)未來(lái)發(fā)展的一種重要方式。我國(guó)高校信息化正在進(jìn)行改革與創(chuàng)新,大數(shù)據(jù)技術(shù)在我國(guó)教育領(lǐng)域中將得到廣泛應(yīng)用,并發(fā)揮巨大作用。
作者簡(jiǎn)介:方勇(1983-)男,湖北鄂州人,講師,碩士,研究方向?yàn)橛?jì)算機(jī)應(yīng)用技術(shù)。
參? 考? 文? 獻(xiàn)
[1] 王紅,許春秀,廖明海.大數(shù)據(jù)在高校中的應(yīng)用研究機(jī).中國(guó)集體經(jīng)濟(jì),2014(34):134-135.
[2] 王華.淺析大數(shù)據(jù)在高校畢業(yè)生就業(yè)信息系統(tǒng)中的智能化應(yīng)用[J].企業(yè)技術(shù)開(kāi)發(fā):學(xué)術(shù)版,2015,34(2):82-84.
[3] 鄭曉薇,項(xiàng)明,張大為,等.基于節(jié)點(diǎn)能力的Hadoop集群任務(wù)自適應(yīng)調(diào)度方法[J].計(jì)算機(jī)研究與發(fā)展, 2014, 51(3):618-626.