李志遠(yuǎn) 姚明菊 魏強(qiáng)
摘要:越來越多的高校開始使用大數(shù)據(jù)分析解決日常教學(xué)、管理中遇到的實(shí)際問題,通過對(duì)校園卡消費(fèi)、上網(wǎng)、考試成績(jī)等數(shù)據(jù)進(jìn)行分析,從而改進(jìn)學(xué)校的教學(xué)、管理等方面的問題。當(dāng)代的學(xué)生生長(zhǎng)于信息化時(shí)代,熱衷于使用計(jì)算機(jī)等設(shè)備來解決生活和學(xué)習(xí)中碰到的問題,對(duì)信息化的接受度較高,智慧校園的相關(guān)教學(xué)設(shè)施也使用較多。對(duì)當(dāng)代學(xué)生在校園生活中的行為特征數(shù)據(jù)進(jìn)行研究更有利于智慧校園的更進(jìn)一步建設(shè)。
關(guān)鍵詞:智慧校園;行為特征;多元線性回歸
中圖分類號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)22-0016-02
1 引言
2018年國(guó)家正式發(fā)布了《智慧校園總體框架》標(biāo)準(zhǔn),致力于構(gòu)建校園工作、學(xué)習(xí)和生活一體化的智慧校園正在全國(guó)多個(gè)高校逐步成型,從課堂到生活的教育理念已經(jīng)被廣為接受。高校智慧校園的建設(shè)模式大致相同,都是以教育為中心展開的,建設(shè)模式的不同也都有自己的優(yōu)點(diǎn)和缺點(diǎn)。智慧校園是在互聯(lián)網(wǎng)飛快發(fā)展基礎(chǔ)上建立的,通過大數(shù)據(jù)時(shí)代運(yùn)營(yíng),以提高高校校園的教育質(zhì)量,方便高校的信息管理,便捷師生的生活,運(yùn)用大數(shù)據(jù)技術(shù)建設(shè)智慧校園具備劃時(shí)代的意義[1-2]。
筆者所在的吉利學(xué)院作為新遷入四川的高校,其智慧校園環(huán)境在川內(nèi)來看也是建設(shè)比較優(yōu)秀的。相比傳統(tǒng)的僅僅以最后成績(jī)?cè)u(píng)定的程序設(shè)計(jì)類課程評(píng)價(jià)方法,如果能夠結(jié)合智慧校園環(huán)境下不同方向的學(xué)生的學(xué)習(xí)行為特征(上課、上網(wǎng)、門禁、課后習(xí)題提交等) 多維大數(shù)據(jù)進(jìn)行全方位分析,就能及時(shí)地衡量出各個(gè)行為畫像對(duì)成績(jī)的最終影響作用,為學(xué)院課程的教學(xué)管理和教學(xué)質(zhì)量的評(píng)價(jià)監(jiān)督提供決策依據(jù),同時(shí)也可對(duì)智慧校園的迭代建設(shè)提供數(shù)據(jù)支撐。在對(duì)吉利學(xué)院的學(xué)生評(píng)價(jià)完成后,依據(jù)其評(píng)價(jià)的質(zhì)量指標(biāo),可為其他智慧校園教學(xué)管理和校園建設(shè)做相關(guān)參考評(píng)價(jià)。
2 數(shù)據(jù)樣本采集
采集的數(shù)據(jù)以吉利學(xué)院在校大一和大二學(xué)生不同專業(yè)的學(xué)生行為數(shù)據(jù)為樣本,采集的多維數(shù)據(jù)樣本源由以下幾部分組成:
1) 場(chǎng)景數(shù)據(jù)。樣本所在的宿舍位置以及宿舍相關(guān)學(xué)生的年齡、地域、畢業(yè)院校等數(shù)據(jù)。吉利學(xué)院的宿舍分配方法采取學(xué)生自愿選宿舍和人為指派組成,并沒有充分考慮學(xué)生的興趣、性格、生活習(xí)慣等方面,引入場(chǎng)景數(shù)據(jù)可對(duì)場(chǎng)景環(huán)境對(duì)學(xué)生的成績(jī)影響進(jìn)行充分考量。
2) 門禁數(shù)據(jù)。樣本進(jìn)出宿舍、自習(xí)室、圖書館、教室的門禁時(shí)間,門禁數(shù)據(jù)可以有效衡量出樣本最終成績(jī)和門禁的數(shù)據(jù)相關(guān)性。
3) 出勤數(shù)據(jù)。樣本在課程學(xué)習(xí)的出勤率,包含其具體的出勤時(shí)間等。
4) 上網(wǎng)數(shù)據(jù)。在不涉及個(gè)人隱私的情況,對(duì)樣本的上網(wǎng)時(shí)間段進(jìn)行精準(zhǔn)采集,列出主要學(xué)習(xí)網(wǎng)站,從而分析樣本對(duì)于相關(guān)網(wǎng)絡(luò)學(xué)習(xí)平臺(tái)的學(xué)習(xí)情況。
5) 專業(yè)主要課程的學(xué)習(xí)數(shù)據(jù)。采集樣本專業(yè)主要課程的學(xué)習(xí)情況主數(shù)據(jù),主要包括上課的問答情況,作業(yè)完成情況等智能教育平臺(tái)導(dǎo)出來的多維數(shù)據(jù)。
3 數(shù)據(jù)存儲(chǔ)和多元分析
對(duì)樣本的行為特征進(jìn)行采集后,需要對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)和處理分析,因數(shù)據(jù)量較大,宜采用Hadoop+Spark平臺(tái)進(jìn)行數(shù)據(jù)的有效存儲(chǔ)。
Hadoop的MapReduce非常適合對(duì)大規(guī)模數(shù)據(jù)集合進(jìn)行批處理操作,只是其存在著延遲過高,無法進(jìn)行快速計(jì)算。Spark借鑒了Hadoop的MapReduce技術(shù),其適合分布式并行計(jì)算,然其并不適用于數(shù)據(jù)量巨大的情況。因此采用兩者結(jié)合的方法可同時(shí)兼顧大規(guī)模數(shù)據(jù)集處理和快速實(shí)時(shí)運(yùn)算的要求。
進(jìn)行數(shù)據(jù)分析時(shí),可以利用Python和SPSS等數(shù)據(jù)分析工具對(duì)數(shù)據(jù)進(jìn)行提取和篩選,在篩選時(shí)根據(jù)分析的主目的進(jìn)行數(shù)據(jù)的清洗、匯總。對(duì)龐大的后臺(tái)數(shù)據(jù)篩選后,利用多元回歸分析法,確定要評(píng)價(jià)的學(xué)生學(xué)習(xí)效果呈顯著正相關(guān)的指標(biāo),同時(shí)對(duì)指標(biāo)數(shù)據(jù)進(jìn)行權(quán)值量化,量化后的數(shù)據(jù)可對(duì)學(xué)生的作息時(shí)間規(guī)律性、努力程度、學(xué)習(xí)技能等多維度進(jìn)行分析,最終可以有效地對(duì)學(xué)生的教學(xué)管理和教學(xué)質(zhì)量進(jìn)行評(píng)價(jià)[3]。
采取的總體研究框架如圖1所示,評(píng)價(jià)方法的整體迭代關(guān)系如圖2所示。
4 多元線性回歸分析
學(xué)生行為特征數(shù)據(jù)由多個(gè)維度組成,多個(gè)維度抽取其關(guān)鍵因子構(gòu)成了多因素的組合模型,采取多元的線性回歸分析是一種比較好的評(píng)價(jià)預(yù)測(cè)方法。多元線性回歸是多種評(píng)價(jià)方法中最為基本的,較容易實(shí)現(xiàn)且效果較好的方法。學(xué)生的最終的行為受多種因素所影響,因此可以采取多元線性回歸分析法分析學(xué)生的平時(shí)的行為數(shù)據(jù)與結(jié)果表現(xiàn)的關(guān)系,篩選出最優(yōu)的特征數(shù)據(jù)去預(yù)估學(xué)生學(xué)習(xí)行為,并建立預(yù)測(cè)模型[4]。模型公式為:
[Y=a0+a1x1+a2x2+a3x3+…+anxn]? ? (1)
在公式(1) 中,Y為結(jié)果變量;x1到xn為各個(gè)變量因子;ai為各個(gè)變量因子所對(duì)應(yīng)的回歸系數(shù)。
根據(jù)上述公式,綜合分析后,選擇相應(yīng)的大一、大二的在校不同專業(yè)學(xué)生的特征數(shù)據(jù)作為變量因子參與計(jì)算,選擇的特征數(shù)據(jù)量如表1所示。
4.1 Python實(shí)現(xiàn)多元線性回歸
Python是一種模塊化的開源語(yǔ)言,其包羅萬象的模塊可以幫助用戶用最簡(jiǎn)單的代碼實(shí)現(xiàn)復(fù)雜的算法,本文采取Numpy模塊進(jìn)行數(shù)據(jù)集的矩陣預(yù)算,采用Pandas內(nèi)置的read_csv()函數(shù)實(shí)現(xiàn)對(duì)于數(shù)據(jù)集的讀取。采用sklearn模塊對(duì)數(shù)據(jù)集進(jìn)行訓(xùn)練和相應(yīng)的模型導(dǎo)入。其實(shí)現(xiàn)的核心代碼如下:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import linear_model
df=pd.DataFrame(“students.csv”)
model=linear_model.LinearRegression()
model.flit(df)
x_=df.iloc[:,[1,2,3]]
y_model.predict(x_)
plt.scatter(x_,y_)
plt.show()
利用上述的核心代碼對(duì)學(xué)生的樣本數(shù)據(jù)集進(jìn)行線性回歸預(yù)測(cè),結(jié)果如表2所示:
4.2 學(xué)生行為預(yù)測(cè)和誤差分析
利用上述表2得到的多元線性回歸預(yù)測(cè)模型對(duì)樣本學(xué)生的行為數(shù)據(jù)和其最終的成績(jī)分布進(jìn)行預(yù)測(cè),并使用Python的Matplotlib進(jìn)行繪圖,得到如圖3所示的實(shí)際學(xué)生成績(jī)值和預(yù)測(cè)值的對(duì)比圖。從圖3可以知道,當(dāng)數(shù)據(jù)樣本分布較為合理,且具有一定規(guī)模的時(shí)候,采用線性回歸分析法,可以一定量地預(yù)測(cè)出學(xué)生樣本最終成績(jī)和其行為數(shù)據(jù)的關(guān)系。
5 結(jié)束語(yǔ)
在當(dāng)前大數(shù)據(jù)普遍應(yīng)用的環(huán)境下,對(duì)智慧校園內(nèi)的學(xué)生行為特征大數(shù)據(jù)進(jìn)行分析非常迫切和重要[5],依照本文提出的數(shù)據(jù)采集維度和數(shù)據(jù)分析的方法,可有效探索解決學(xué)生行為數(shù)據(jù)對(duì)課程學(xué)習(xí)的影響因素,從而為進(jìn)一步的教學(xué)管理及教學(xué)評(píng)價(jià)打下良好的理論和實(shí)踐基礎(chǔ)。
參考文獻(xiàn):
[1] 趙磊磊,張黎,代蕊華.智慧校園的智能升級(jí):基于人工智能的智慧校園[J].現(xiàn)代教育技術(shù),2020,30(11):26-32.
[2] 楊萍,姚宇翔.智慧校園建設(shè)研究綜述[J].現(xiàn)代教育技術(shù),2019,29(1):18-24.
[3] 丁輝.Python基礎(chǔ)與大數(shù)據(jù)應(yīng)用[M].北京:人民郵電出版社,2020.
[4] 岳劉杰,齊慶杰.基于多元回歸分析的瓦斯?jié)舛阮A(yù)測(cè)[J].陜西煤炭,2022,41(1):1-4,9.
[5] 石川,丁杰,徐藝.新冠疫情常態(tài)化下的大學(xué)生校園環(huán)境行為特征調(diào)查研究[J].安徽建筑,2021,28(3):30-32.
【通聯(lián)編輯:謝媛媛】