方昕
摘要:我國經(jīng)濟在快速地發(fā)展,計算機科學(xué)技術(shù)也在不斷地發(fā)展,在高等院校,數(shù)據(jù)挖掘技術(shù)已經(jīng)被廣泛地應(yīng)用,信息技術(shù)在教學(xué)管理上具有至關(guān)重要的作用。網(wǎng)絡(luò)信息的進步和發(fā)展,促進7信息數(shù)據(jù)庫的擴大,所需信息數(shù)據(jù)搜索的難度也加大了。為了將搜索信息的速度和準確性有效地提升,必須要有先進且有效的方法。有效運用數(shù)據(jù)挖掘技術(shù),能夠在海量數(shù)據(jù)中,將隱藏知識和模式尋找到,有機地結(jié)合社經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)以及識別模式等相關(guān)方法進行應(yīng)用。從而使高校大量數(shù)據(jù)搜索難的問題得以有效地解決。
關(guān)鍵詞:數(shù)據(jù)挖掘 高校 大數(shù)據(jù) 應(yīng)用
前言
在高等院校的管理中,校園卡系統(tǒng)數(shù)據(jù)庫的累計中,怎樣挖掘大量的數(shù)據(jù)和將哪些可用信息進行挖掘,并且有針對性地進行分析,從而將具有實用價值的信息挖掘出來,無論對于高等院校資源配置優(yōu)化和教學(xué),還是輔助管理,都具有至關(guān)重要的作用。
一、大數(shù)據(jù)局限性
對高??ㄏ到y(tǒng)中的大量數(shù)據(jù)進行挖掘和分析的過程中,數(shù)據(jù)挖掘能夠?qū)嵱脙r值信息提供給高校的管理和教學(xué),但是,大數(shù)據(jù)也具有局限性和一定的風(fēng)險,這也是高校日后應(yīng)用和研究中需要解決的問題。
(一)大數(shù)據(jù)樣本代表性
學(xué)生生活的行為軌跡,也就是校園卡系統(tǒng)中大量的數(shù)據(jù),既有效又真實,但是,挖掘分析數(shù)據(jù)收集時,不可能將全部數(shù)據(jù)都收集到,誤差校正和測量方式能否盡如人意,選擇的樣本能否具有代表性,分析和抽樣過程中,必須要全面地考慮。
(二)大數(shù)據(jù)隱私性和安全性
高校師生日常生活,被數(shù)據(jù)化和系統(tǒng)地記錄,下一步就關(guān)系到個人信息的安全問題,并且提取師生數(shù)據(jù)信息時,師生隱私既要保護好,又要尊重可以有效運用保護隱私技術(shù)的敏感保護規(guī)則以及數(shù)據(jù)例如,利用特定值將原始數(shù)據(jù)敏感屬性值替換;分布式環(huán)境下,保護數(shù)據(jù)挖掘隱私;以及在數(shù)據(jù)挖掘算法中將隱私約束規(guī)則構(gòu)建起來。
(三)大數(shù)據(jù)有關(guān)誤差
利用模型和相關(guān)算法分析變量元素,運用大數(shù)據(jù)能夠?qū)⒑唵吻榫硺?gòu)建,但是,針對于復(fù)雜的系統(tǒng)而言,還達不到全面地解釋,偏差結(jié)論容易出現(xiàn),例如,認定學(xué)校貧困生輔助方面,若只通過高校卡消費數(shù)據(jù)對學(xué)生消費總額和就餐金額進行分析,金額認定越少,就認為是貧困生,兩者雖然有關(guān)聯(lián),但還是將學(xué)生校外實習(xí)和就餐的可能性忽視了,因此,結(jié)論還是不科學(xué),應(yīng)該對學(xué)生每天就餐的次數(shù)和時間以及選取整個時間段等相關(guān)因素全面地進行考慮。
二、數(shù)據(jù)挖掘在高校大數(shù)據(jù)中的應(yīng)用
(一)挖掘和分析充值消費類的數(shù)據(jù)
1.優(yōu)化教學(xué)和管理方式
與傳統(tǒng)大學(xué)英語教學(xué)相比較,藝術(shù)類院校英語教學(xué)差別還比較大,由于藝術(shù)類的專業(yè)特點,要求學(xué)生對于一些專業(yè)實踐活動必須要參加,學(xué)習(xí)英語課程上投入的時間比較少,對于學(xué)習(xí)英語比較輕視,有些學(xué)生一人學(xué)時,英語基礎(chǔ)就比較差,學(xué)校內(nèi)部水平的考試很多次都沒有通過,有的甚至畢業(yè)都沒有通過,導(dǎo)致領(lǐng)取畢業(yè)證書的時間延誤了,很大程度地影響了自身的就業(yè),根據(jù)學(xué)院和年級英語四級考試學(xué)生報告的信息,向英語教學(xué)部提供多次報名考試學(xué)生的名單,英語授課教師根據(jù)班里學(xué)生英語的水平分流進行教學(xué)對于不同水平學(xué)生,將不同要求提出來,對于臨近畢業(yè),校內(nèi)水平考試還沒有通過的學(xué)生信息進行挖掘分析,將信息向各院系統(tǒng)提供,以便及時地督促和提醒。
2.工作效率提升,財務(wù)人力節(jié)省
高等院校將支付寶和微信充值引入以后人工充值數(shù)據(jù)基本為零,財務(wù)部門每天去處理卡片異常和咨詢的只有10多個人根據(jù)這種情況,財務(wù)部門應(yīng)該將人工窗口工作時間及時地進行調(diào)整,原來每天8小時應(yīng)該改為上午l小時和下午l小時,節(jié)省下來的時間將其他財務(wù)業(yè)務(wù)進行開展,變相地將財務(wù)部門的人力增加。
3.輔助認定貧困學(xué)生
學(xué)生在一個共同的校園中學(xué)習(xí)和生活,無論是本人學(xué)習(xí)成績和家庭基本信息,還是日常校園消費和獎懲助貸等相關(guān)信息,這些數(shù)據(jù)都將學(xué)生在校的行為表現(xiàn)反映出來,通過對數(shù)據(jù)關(guān)聯(lián)和記錄進行分析,能夠?qū)⒂行W(xué)生家庭經(jīng)濟比較困難的特征獲得,對于學(xué)校的貧困生數(shù)量進行統(tǒng)計,將有力數(shù)據(jù)支撐提供給貧困生的認定工作,對于扶持貧困生政策制定上具有一定的輔助作用。有用信息挖掘以后,必須要人工精準地進行考察和分析。
4.提高采購圖書的質(zhì)量
高等院校每年購買新書時,都要將學(xué)院的師生邀請一共篩選圖書,但是,只能少數(shù)人作為代表進行選書,代表性不太,利用統(tǒng)計分析法,通過借閱書籍時間和類別以及次數(shù),對教師和學(xué)生的需求和愛好進行分析,將數(shù)據(jù)支持提供給圖書館采購,圖書館記錄以后,能夠?qū)D書館人流量進行統(tǒng)計,將圖書館內(nèi)學(xué)生停留時間清楚地進行顯示,經(jīng)過一段時間分析和觀察數(shù)據(jù),發(fā)觀圖書館總體的人流量比較少,不但調(diào)整了新進圖書的類別,在圖書館內(nèi)還將幾個主題閱讀角增設(shè)了,以便將閱讀的環(huán)境提高,將相應(yīng)措施有效地實施,很大程度地增長了學(xué)習(xí)流量和人館借書。
5.輔助確定獎學(xué)金金額和等級
通過分析數(shù)據(jù),可以了解到,高等院校學(xué)生將一些特殊消費除去的條件下,對平均每人每月的生活費綜合進行計算,大約為1000-2000元左右,將此作為參考,學(xué)生管理部門確定獎學(xué)金金額和等級時,應(yīng)該將一套科學(xué)的評定獎學(xué)金制度制定出來。
6.輔助食堂管理
有效運用聚類分析高??ㄏM數(shù)據(jù),能夠?qū)⑾M群體所關(guān)注的熱點盡快地找到,將哪個食堂窗口更加受歡迎統(tǒng)計出來,師生就在哪個時間段集中就餐從而將商戶售飯時間和窗口位置合理地進行調(diào)整,以防擁擠就餐,通過將學(xué)生就餐窗口和教職工群體就餐窗口的比例數(shù)據(jù)進行挖掘,對窗口飯菜質(zhì)量不斷地進行調(diào)整,這些日常數(shù)據(jù)能夠?qū)熒袨檫M行分析,既能夠?qū)⒑笄诓块T的工作質(zhì)量有效地提升,還能夠?qū)?shù)據(jù)支持提供給高校,從而使高校管理水平得以提高,高??茖W(xué)性和準確性的管理得以有效地保證。
(二)挖掘和分析身份識別類數(shù)據(jù)
1.強化上課考勤管理
有效應(yīng)用數(shù)據(jù)挖掘技術(shù),能夠分析學(xué)生上課出勤的情況,對學(xué)生各門課程出勤率進行統(tǒng)計,致使院系領(lǐng)導(dǎo)和任課教師都能夠?qū)⒏鲗W(xué)期學(xué)生上課情況,及時地了解和掌握,根據(jù)不同的缺勤率,向院系領(lǐng)導(dǎo)上報,給予相應(yīng)處理,另外,學(xué)生出勤率還應(yīng)該將學(xué)生管理部門提供,給合學(xué)生學(xué)習(xí)成績一起進行分析,作為對學(xué)生評優(yōu)輔助的依據(jù)。
2.加強學(xué)生的安全管理
通過對學(xué)生進出宿舍相關(guān)信息記錄的挖掘,可以對學(xué)生是哪些院系和哪些學(xué)生經(jīng)常晚上10點后才回來進行分析,是個人行為,還是集體行為,學(xué)生管理部門根據(jù)記錄的學(xué)生晚歸情況,對學(xué)生進行警告和采取相關(guān)的管理措施,經(jīng)常晚歸的學(xué)生,輔導(dǎo)員應(yīng)該適當?shù)剡M行教育和觀察,了解學(xué)生是否有特殊的原因,發(fā)現(xiàn)有異常情況,盡快進行干預(yù),學(xué)校宿舍如果有安全事故發(fā)生,通過記錄的特定時間段出入宿舍,將搜索的范圍縮小,從而使學(xué)生校內(nèi)安全得以保證。
3.強化校車的管理,輔助分配資源
將教師校車上的打卡時間和打卡次數(shù)等記錄進行一段時間的統(tǒng)計再結(jié)合教務(wù)系統(tǒng)中記錄的教師上課有效應(yīng)用數(shù)據(jù)挖掘的關(guān)聯(lián)算法,對各個運行路線校車各候車點人數(shù)和上車總?cè)藬?shù)進行分析,合理地調(diào)整候車點和路線,從而使各校車座位空閑率有效地降低,資源充分地利用,管理成本得以節(jié)約。
三、總結(jié)
綜上所述,在高校大數(shù)據(jù)中,有效應(yīng)用數(shù)據(jù)挖掘,能夠篩選高等院校校園卡系統(tǒng)中的大量數(shù)據(jù),將有價值信息更好地提取,并且在高校管理和教學(xué)中有效地應(yīng)用,將科學(xué)且合理的建設(shè)提供給高校決策和規(guī)劃教學(xué)。
參考文獻
[1]馮磊,大數(shù)據(jù)挖掘在高校圖書館個性化服務(wù)中應(yīng)用研究[J/OL].圖書館學(xué)刊,2019(01):109-112[2019-04-25].
[2]司雅楠.Mapreduce計算模式在高校大數(shù)據(jù)挖掘系統(tǒng)中的應(yīng)用[J].計算機產(chǎn)品與流通,2019(02):263 265.
[3]楊柳,大數(shù)據(jù)時代數(shù)據(jù)挖掘技術(shù)在高校檔案管理中的應(yīng)用[J].辦公室業(yè)務(wù),2018(17):119-120.
[4]王亞楠.大數(shù)據(jù)背景下數(shù)據(jù)挖掘技術(shù)在高校中的應(yīng)用——以校園卡系統(tǒng)為例[J].華中師范大學(xué)學(xué)報(自然科學(xué)版),2017(S1):9-12.