董婧
摘要:跨界整合高校教育狀態(tài)數(shù)據(jù),教育管理部門以及第三方相關(guān)數(shù)據(jù),利用機(jī)器學(xué)習(xí)、數(shù)學(xué)統(tǒng)計(jì)和神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘技術(shù),對(duì)高校教育海量數(shù)據(jù)進(jìn)行深層次挖掘和應(yīng)用,可以實(shí)現(xiàn)智慧學(xué)習(xí)、智慧評(píng)價(jià)和智慧服務(wù)。該文首先分析了教育大數(shù)據(jù)對(duì)高校教育教學(xué)管理的沖擊;其次,介紹了目前廣泛應(yīng)用的數(shù)據(jù)挖掘技術(shù);最后,通過挖掘?qū)W生就業(yè)大數(shù)據(jù)這一具體案例,說明了挖掘教育大數(shù)據(jù)的價(jià)值與廣泛應(yīng)用前景。
關(guān)鍵詞:教育大數(shù)據(jù);地方高校;數(shù)據(jù)挖掘技術(shù);智慧學(xué)習(xí);就業(yè)大數(shù)據(jù)
中圖分類號(hào):G642? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? 文章編號(hào):1009-3044(2019)02-0156-02
隨著信息通信技術(shù)的普及以及數(shù)據(jù)挖掘技術(shù)的不斷成熟,大數(shù)據(jù)時(shí)代已經(jīng)到來[1]。大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用也開始受到許多組織和專業(yè)人員的關(guān)注。尤其是在高校中,學(xué)習(xí)者學(xué)習(xí)方式變得更加多元化,如果沿用傳統(tǒng)的標(biāo)準(zhǔn)化學(xué)科設(shè)置、教學(xué)內(nèi)容、教學(xué)方法、考試制度和人才培養(yǎng)模式,容易忽視學(xué)生的個(gè)性特征和認(rèn)知發(fā)展[2]。教育大數(shù)據(jù)記錄和量化了學(xué)生的學(xué)習(xí)情況,若對(duì)海量教育數(shù)據(jù)進(jìn)行用戶學(xué)習(xí)行為的大數(shù)據(jù)分析,如通過建立自適應(yīng)學(xué)習(xí)系統(tǒng)評(píng)估解釋影響學(xué)習(xí)效果的重大因素,可以使教師有效整合零散的教學(xué)資源,真正理解每個(gè)學(xué)習(xí)者[3],并根據(jù)他們的個(gè)人特征,如學(xué)習(xí)習(xí)慣、學(xué)習(xí)興趣和學(xué)習(xí)偏好,提供準(zhǔn)確而有針對(duì)性的教學(xué);同時(shí)提供給學(xué)習(xí)者個(gè)性化的適應(yīng)性反饋,使每一個(gè)學(xué)習(xí)者挖掘出個(gè)人的學(xué)習(xí)偏好,為學(xué)習(xí)者推薦與其學(xué)習(xí)計(jì)劃最匹配的課程和教材,達(dá)到最佳學(xué)習(xí)效果,實(shí)現(xiàn)“智慧”學(xué)習(xí)[4]。通過數(shù)據(jù)跨界整合和跨界挖掘[5],可以很好改善落后的傳統(tǒng)教學(xué)關(guān)系,實(shí)現(xiàn)更具個(gè)性化的交互。
就業(yè)是高校工作的一個(gè)重中之重,對(duì)教育大數(shù)據(jù)的挖掘可以實(shí)現(xiàn)教育設(shè)備與資產(chǎn)的智能管理、學(xué)生就業(yè)與幫扶體系的完善,根據(jù)學(xué)生就業(yè)意愿實(shí)現(xiàn)精準(zhǔn)分析與推薦;大數(shù)據(jù)還可實(shí)現(xiàn)智慧科研,通過對(duì)科研大數(shù)據(jù)分析,促進(jìn)科研采購模式創(chuàng)新,提升文獻(xiàn)服務(wù)質(zhì)量,對(duì)不恰當(dāng)?shù)目蒲泄芾砟J郊皶r(shí)預(yù)警和轉(zhuǎn)型。
1教育大數(shù)據(jù)的數(shù)據(jù)來源
教育大數(shù)據(jù)來源于各個(gè)學(xué)院以及教輔部門搜集整理的各方面的資料,具體如下圖所示:
2教育大數(shù)據(jù)挖掘
2.1數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)大致可以分為機(jī)器學(xué)習(xí)、數(shù)據(jù)庫方法、集合論法、仿生物法和統(tǒng)計(jì)方法。機(jī)器學(xué)習(xí)主要包括支持向量機(jī)和歸納學(xué)習(xí)方法;數(shù)據(jù)庫方法主要包括多維數(shù)據(jù)分析法、OLAP等;集合論法主要包括粗糙集理論和模糊集理論;仿生物法主要包括神經(jīng)網(wǎng)絡(luò)、遺傳算法、蟻群算法等;統(tǒng)計(jì)方法主要包括回歸分析、相關(guān)分析、聚類分析、判別分析、因子分析、生存分析和決策樹模型等。
2.2數(shù)據(jù)挖掘案例
以學(xué)生就業(yè)大數(shù)據(jù)為例,數(shù)據(jù)來源于曲靖師范學(xué)院畢業(yè)生就業(yè)與培養(yǎng)質(zhì)量調(diào)查問卷(有效問卷3100余份),各個(gè)學(xué)院2017年度就業(yè)質(zhì)量年度報(bào)告,對(duì)于缺失數(shù)據(jù)采用機(jī)器學(xué)習(xí)中的基于python爬蟲程序自動(dòng)抓取學(xué)校辦公系統(tǒng)、教學(xué)數(shù)據(jù)和服務(wù)數(shù)據(jù)等相關(guān)信息,進(jìn)行數(shù)據(jù)預(yù)處理后,采用數(shù)學(xué)統(tǒng)計(jì)方法中的因子分析進(jìn)行分析,結(jié)果如圖所示:
可以看出,提取的公因子對(duì)變量CET4方差貢獻(xiàn)率為90%,第一主成分CET4特征根為3.019,前五個(gè)因子方差累積貢獻(xiàn)率為83.168%,特征值大于1,所以選擇前五個(gè)因子。非外國語學(xué)院學(xué)生通過大學(xué)英語四級(jí)考試、外國語學(xué)院學(xué)生統(tǒng)計(jì)大學(xué)英語(泰語)四級(jí)(專業(yè)四級(jí))對(duì)學(xué)生就業(yè)最有幫助,能夠有效促進(jìn)學(xué)生的就業(yè)質(zhì)量;其次是學(xué)院對(duì)就業(yè)經(jīng)費(fèi)投入的占比情況,投入經(jīng)費(fèi)多少也影響著學(xué)院的最終就業(yè)率,投入經(jīng)費(fèi)相對(duì)較多的部門其畢業(yè)生就業(yè)情況較優(yōu);再者是生源情況,非云南省籍學(xué)生思維更為活躍,個(gè)性獨(dú)特,通常綜合表現(xiàn)更為優(yōu)秀,更容易就業(yè);然后是學(xué)生獲得國家級(jí)省級(jí)獲獎(jiǎng),對(duì)學(xué)生就業(yè)有一定影響;最后是初次就業(yè)率,直接影響到學(xué)校總體的最終就業(yè)率。畢業(yè)生對(duì)就業(yè)服務(wù)工作滿意度等因子對(duì)學(xué)生就業(yè)情況也有一定影響,但不是主成份,學(xué)校應(yīng)對(duì)前五個(gè)因子特別重視,并采取有效的應(yīng)對(duì)政策以顯著促進(jìn)學(xué)生就業(yè)率及就業(yè)質(zhì)量。
3結(jié)論
高校中各學(xué)院和教輔部門存在海量的辦學(xué)狀態(tài)數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù),可以挖掘海量信息中潛在的價(jià)值,提供精準(zhǔn)服務(wù),支持科學(xué)決策。通過數(shù)據(jù)挖掘、分析、機(jī)器學(xué)習(xí)等技術(shù)展現(xiàn)教育大數(shù)據(jù)的價(jià)值,推動(dòng)教育發(fā)展創(chuàng)新,提高教育教學(xué)質(zhì)量,實(shí)現(xiàn)智慧教與學(xué),智慧服務(wù)和智慧評(píng)價(jià)。
參考文獻(xiàn):
[1]鄭慶華.高校教育大數(shù)據(jù)的分析挖掘與利用[J]. 中國教育信息化, 2016(13):28-31.
[2]馬月. 數(shù)據(jù)挖掘技術(shù)在教育信息化中的應(yīng)用研究[D],西安郵電大學(xué), 2014.
[3]王祖霖.大數(shù)據(jù)時(shí)代學(xué)生評(píng)價(jià)變革研究[D].湖南大學(xué), 2016.
[4]孫洪濤.教育大數(shù)據(jù)的核心技術(shù)、應(yīng)用現(xiàn)狀與發(fā)展趨勢(shì)[J].遠(yuǎn)程教育雜志, 2016(5):41-49.
[5]劉清堂,王洋,雷詩捷.教育大數(shù)據(jù)視角下的學(xué)習(xí)分析應(yīng)用研究與思考[J].遠(yuǎn)程教育雜志, 2017(3):71-77.