王瑜晗 王乙如 劉超富 秦曉博 張子康 宋瑩
摘要:高校的學(xué)風(fēng)建設(shè)是高校辦學(xué)目標(biāo)中的重點(diǎn)建設(shè)對(duì)象,是體現(xiàn)高校辦學(xué)質(zhì)量的重要所在。這篇文章正以北京信息科技大學(xué)的學(xué)風(fēng)基礎(chǔ)數(shù)據(jù)為例,從不同維度對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析、計(jì)算及比較,發(fā)現(xiàn)和挖掘影響學(xué)風(fēng)建設(shè)的各種因素,提出有利于學(xué)風(fēng)建設(shè)的建議。
關(guān)鍵詞:大數(shù)據(jù);學(xué)風(fēng)建設(shè);關(guān)聯(lián)分析
中圖分類號(hào):G641 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2019)11-0188-04
0 引言
近年來,隨著“大數(shù)據(jù)”成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯,教育逐漸被認(rèn)為是大數(shù)據(jù)可以大有作為的一個(gè)重要應(yīng)用領(lǐng)域。利用大數(shù)據(jù)對(duì)學(xué)生的數(shù)據(jù)進(jìn)行分析,挖掘,可以得出有利于高校學(xué)風(fēng)建設(shè)的信息與知識(shí),探索加強(qiáng)和改進(jìn)學(xué)風(fēng)建設(shè)的有效途徑,為高校教學(xué)提供決策,推進(jìn)教育教學(xué)改革,提高學(xué)生的教育培養(yǎng)質(zhì)量。此外,優(yōu)良學(xué)風(fēng)是進(jìn)行教育改革的前提條件,加強(qiáng)學(xué)風(fēng)建設(shè)更是教育改革深入進(jìn)行的需要,但當(dāng)前高校學(xué)風(fēng)建設(shè)仍存在很多問題。
首先是理想和現(xiàn)實(shí)的落差,一些學(xué)生由于盲目報(bào)考專業(yè)以及入校后專業(yè)選擇上的限制,使許多學(xué)生往往學(xué)非所愿、學(xué)非所長,這些使他們消極苦悶、缺乏學(xué)習(xí)動(dòng)力。其次是不能盡快適應(yīng)大學(xué)的環(huán)境和學(xué)習(xí)方式。部分學(xué)生不能夠盡快適應(yīng)從高中到大學(xué)的角色轉(zhuǎn)變,不知如何合理規(guī)劃自己的生活,從而影響學(xué)習(xí)。再者是缺乏持之以恒、勤奮刻苦的學(xué)習(xí)精神,脫離了家長和老師束縛的大學(xué)生難免會(huì)放松對(duì)自己的要求。最后是學(xué)習(xí)目的不明確,學(xué)習(xí)態(tài)度不端正,功利性太強(qiáng)。有些學(xué)生缺乏人生目標(biāo)和理想信念,對(duì)自己的大學(xué)生活沒有合理的規(guī)劃,沒有明確的學(xué)習(xí)目的,導(dǎo)致學(xué)習(xí)動(dòng)力不足,與他人差距越來越大。
本項(xiàng)目主要是以本學(xué)校數(shù)據(jù)為主,在了解其他學(xué)校數(shù)據(jù)的基礎(chǔ)上,對(duì)學(xué)生的一些數(shù)據(jù)進(jìn)行分析、挖掘得出結(jié)論,提出一些加強(qiáng)和改進(jìn)高校學(xué)風(fēng)建設(shè)的指導(dǎo)意見,為高素質(zhì)人才培養(yǎng)打好基礎(chǔ),促進(jìn)高校人才培養(yǎng)的特色建設(shè)、品牌建設(shè),以及人才培養(yǎng)質(zhì)量的不斷提升。
1 高校學(xué)風(fēng)數(shù)據(jù)的獲取與預(yù)處理
1.1 影響因素的確定
學(xué)風(fēng)建設(shè)是一所學(xué)校發(fā)展的重中之重,基于當(dāng)前大學(xué)生的學(xué)風(fēng)問題,我們構(gòu)建了科學(xué)、全面、合理的評(píng)價(jià)模型,遵循科學(xué)性、導(dǎo)向性、全面性、可行性、發(fā)展性等原則,確定了評(píng)價(jià)體系的各個(gè)指標(biāo)要素:學(xué)校排名情況、出勤率、人均學(xué)習(xí)時(shí)間、圖書館借閱情況、參加社團(tuán)情況。
1.2 數(shù)據(jù)采集
我們通過進(jìn)入各大高校調(diào)研、對(duì)同學(xué)們發(fā)放調(diào)查問卷以及向相關(guān)老師獲取數(shù)據(jù)等方法進(jìn)行數(shù)據(jù)的采集,對(duì)于采集不到足夠數(shù)據(jù)的情況,我們隨機(jī)抽取現(xiàn)有數(shù)據(jù)進(jìn)行復(fù)制,獲得足夠大的數(shù)據(jù)量,保證結(jié)果的準(zhǔn)確度,我們發(fā)出問卷1800份,實(shí)際有效問卷1748份,此外我們還利用Python作為處理工具,收集到了各大高校的排名情況。
1.3 數(shù)據(jù)清洗
本項(xiàng)目的預(yù)處理選擇Python作為數(shù)據(jù)處理工具,首先查看元數(shù)據(jù)即調(diào)查問卷中我們所收集到的信息,另外是隨機(jī)抽取一部分的數(shù)據(jù),通過人工查看的方式,對(duì)數(shù)據(jù)本身做一個(gè)比較直觀的了解,并且初步發(fā)現(xiàn)一些問題,為之后的數(shù)據(jù)做準(zhǔn)備。
其次抽取部分?jǐn)?shù)據(jù)進(jìn)行刪除錯(cuò)誤字段來構(gòu)建模型,模型效果達(dá)到預(yù)期效果后,再在整體數(shù)據(jù)中進(jìn)行刪除錯(cuò)誤字段的操作,以免效果不理想對(duì)數(shù)據(jù)進(jìn)行損壞出現(xiàn)誤差。
然后進(jìn)行對(duì)異常值的處理,通過各項(xiàng)頻數(shù)分析判斷是否存在異常值,當(dāng)項(xiàng)目發(fā)現(xiàn)存在異常值之后,項(xiàng)目對(duì)各項(xiàng)數(shù)據(jù)分別求出其標(biāo)準(zhǔn)差,設(shè)定與平均值的偏差超過三倍標(biāo)準(zhǔn)差的值為異常值,對(duì)于檢測出來的異常值,項(xiàng)目采用了填補(bǔ)法,即處理掉異常值并在相應(yīng)位置隨機(jī)填補(bǔ)平均值、中位數(shù)或眾數(shù)。
最后項(xiàng)目根據(jù)各個(gè)學(xué)校的綜合情況,將所有學(xué)校分成三組,如表1為數(shù)據(jù)清洗部分結(jié)果。
2 數(shù)據(jù)關(guān)聯(lián)分析及可視化
2.1 關(guān)聯(lián)分析法
因?yàn)楸卷?xiàng)目中有多個(gè)因素,關(guān)聯(lián)分析能更好的分析各個(gè)因素之間的關(guān)系,作出對(duì)數(shù)據(jù)中變量之間關(guān)系的最佳解釋,本項(xiàng)目計(jì)算了支持度,置信度,提升度,確信度。計(jì)算支持度的意義在于,預(yù)判這條規(guī)則是否值得繼續(xù)挖掘,支持度越高,這些項(xiàng)出現(xiàn)的越頻繁,這暗示了他們可能蘊(yùn)藏著的值得挖掘并利用的關(guān)聯(lián)規(guī)則;置信度反映了這條規(guī)則的可靠程度,但是置信度存在一個(gè)盲點(diǎn),就是沒有考慮到規(guī)則后繼單獨(dú)發(fā)生的概率,所以,本項(xiàng)目又選擇了提升度,提升度越高,這條關(guān)聯(lián)規(guī)則越有潛在意義,一般情況下使用支持度,置信度,提升度作為參考,當(dāng)然也會(huì)參照確信度。
2.2 Apriori算法
由于Apriori算法原理簡單,容易被人理解,易于并行化,對(duì)大數(shù)據(jù)有優(yōu)勢,而且算法結(jié)果可以在實(shí)踐中直接使用,因此項(xiàng)目采取了Apriori算法進(jìn)行關(guān)聯(lián)分析。
(1)構(gòu)建模型。
1)發(fā)現(xiàn)頻繁項(xiàng)集。
①找出頻繁“1項(xiàng)集”的集合,該集合記作L1,L1用于找頻繁“2項(xiàng)集”的集合L2,而L2用于找L3,如此下去,直到不能找到“K項(xiàng)集”,找每個(gè)Lk都需要一次數(shù)據(jù)庫掃描。
②連接步和剪枝步,連接步是自連接,原則是保證前k-2項(xiàng)相同,并按照字典順序連接。剪枝步是使任一頻繁項(xiàng)集的所有非空子集也必須是頻繁的。反之,如果某個(gè)候選的非空子集不是頻繁的,那么該候選肯定不是頻繁的,從而可以將其刪除。
③重復(fù)以上步驟直到不能發(fā)現(xiàn)更大的頻集。
2)產(chǎn)生關(guān)聯(lián)規(guī)則,根據(jù)前面提到的置信度的定義,關(guān)聯(lián)規(guī)則的產(chǎn)生如下:
①對(duì)于每個(gè)頻繁項(xiàng)集L,產(chǎn)生L的所有非空子集;
②同時(shí)滿足最小支持度閾值和最小置信度閾值的規(guī)則為強(qiáng)規(guī)則。
(2)我們以社團(tuán)活動(dòng)對(duì)自己的影響和一學(xué)期去圖書館借閱圖書次數(shù)關(guān)系為例,大致流程如下:
1)首先掃描數(shù)據(jù)庫,計(jì)算社團(tuán)活動(dòng)對(duì)自己的影響和一學(xué)期去圖書館借閱圖書次數(shù)的每個(gè)選項(xiàng)的支持度得到候選項(xiàng)集C1,如表2,然后比較產(chǎn)生L1,進(jìn)行連接,得到候選項(xiàng)集C2,如表3;
2)設(shè)定一個(gè)支持度閾值k為 0.100,支持度大于等于0.100的為高頻項(xiàng)集,反之為低頻項(xiàng)集,對(duì)C2進(jìn)行掃描比較產(chǎn)生L2,得出高頻項(xiàng)集為{提高個(gè)人素養(yǎng),4-7}=0.176,{豐富課余生活,4-7}=0.118,{提高個(gè)人素養(yǎng),8-11}=0.103,{效果不明顯,8-11}=0.105;
3)設(shè)定一個(gè)置信度閾值為0.400,置信度越高,A出現(xiàn)與B出現(xiàn)的關(guān)系較大,計(jì)算置信度后得到表4,得出關(guān)系較大的為{提高個(gè)人素養(yǎng),0-3}=0.918,{豐富課余生活,0-3}=0.985,{效果不明顯,0-3}=0.496,{提高個(gè)人素養(yǎng),4-7}=0.468,{豐富課余生活,12及以上}=0.420;
4)同時(shí)滿足最小支持度閾值和最小置信度閾值的規(guī)則為強(qiáng)規(guī)則,參照表5的提升度和表6的確信度得出:(效果不明顯,8-11)、(提高個(gè)人素養(yǎng),4-7)關(guān)系較大。
(3)根據(jù)以上事例采用的算法可得出:
1)第一部分和第二部分學(xué)校的學(xué)生以“提高個(gè)人素養(yǎng)為目的參加社團(tuán)活動(dòng)”和“去圖書館借閱圖書4-7次”關(guān)系較大,第三組各因素之間均無較大關(guān)聯(lián)。
2)第一部分學(xué)校的學(xué)生“以提高個(gè)人素養(yǎng)為目的參加社團(tuán)活動(dòng)”與“學(xué)校的硬件措施完全滿足教學(xué)要求”有較大關(guān)聯(lián);第二部分和第三部分學(xué)校認(rèn)為“社團(tuán)活動(dòng)對(duì)自己的影響不明顯”和“學(xué)校硬件措施勉強(qiáng)滿足教學(xué)要求”有較大關(guān)聯(lián)。
3)第一部分學(xué)校學(xué)生認(rèn)為“學(xué)校的硬件設(shè)計(jì)基本滿足教學(xué)要求”與“一學(xué)期去圖書館借閱圖書4-7次”關(guān)聯(lián)較大;第二部分和第三部分學(xué)校學(xué)生認(rèn)為“學(xué)校的硬件設(shè)計(jì)勉強(qiáng)滿足教學(xué)要求”與“一學(xué)期去圖書館借閱圖書0-3次”關(guān)聯(lián)較大。
4)第一部分學(xué)校學(xué)生“每周每天上自習(xí)”與“課堂出勤都不錯(cuò)”關(guān)聯(lián)較大,“時(shí)常上自習(xí)”與“課堂出勤考試課高考查課低”關(guān)聯(lián)較大;第二部分“時(shí)常上自習(xí)”與“偏理科目高,偏文科目低”關(guān)聯(lián)較大,“偶爾上自習(xí)”與“各課程出勤都不錯(cuò)”關(guān)聯(lián)較大;第三部分“時(shí)常上自習(xí)”與“考試科目高考查科目低”關(guān)聯(lián)較大。
5)第一部分學(xué)校學(xué)生“每周每天上自習(xí)”與“績點(diǎn)3-5”關(guān)聯(lián)較大,“視心情身體狀況而定”與“績點(diǎn)1-2”關(guān)聯(lián)較大;第二部分學(xué)校學(xué)生“偶爾上自習(xí)”與“績點(diǎn)3-4”關(guān)聯(lián)較大,“視心情身體狀況而定”與“績點(diǎn)1-2”關(guān)聯(lián)較大;但第三部分各因素之間關(guān)聯(lián)均不大。
6)第一部分“各課程出勤都不錯(cuò)”與“績點(diǎn)3-5”關(guān)聯(lián)情況較大,“偏理科目出勤高,偏文科目出勤低”與“績點(diǎn)2-3”關(guān)聯(lián)較大;第二部分“各課程出勤都不錯(cuò)”、“各課堂出勤勉勉強(qiáng)強(qiáng),亟待提高”與“績點(diǎn)3-5”關(guān)聯(lián)情況較大,“偏文科目出勤高,偏理科目出勤低”與“績點(diǎn)2-3”關(guān)聯(lián)較大;第三部分“各課堂出勤勉勉強(qiáng)強(qiáng),亟待提高”與“績點(diǎn)4-5”關(guān)聯(lián)情況較大,“偏文科目出勤高,偏理科目出勤低”與“績點(diǎn)1-2”關(guān)聯(lián)較大。
2.3 可視化
以高校學(xué)生績點(diǎn)情況為例,利用Python進(jìn)行可視化展示如圖1、圖2、表7、表8。
本部分主要是利用前面得到的分析結(jié)果,利用可視化工具,協(xié)助數(shù)據(jù)分析得出結(jié)果,有助于與各種數(shù)據(jù)的橫縱向比較,得出分析結(jié)論,提出更有效的改進(jìn)學(xué)風(fēng)的各種意見。
2.4 結(jié)果分析
經(jīng)過以上數(shù)據(jù)分析和可視化,我們得出以下結(jié)論:
在學(xué)風(fēng)建設(shè)中,影響高校學(xué)風(fēng)建設(shè)的因素可以分為內(nèi)部因素和外部因素,內(nèi)部因素是指學(xué)生的自身情況,如出勤率,學(xué)習(xí)情況,自習(xí)情況等,外部因素是指學(xué)校的條件,如學(xué)校硬件措施,學(xué)校管理等,經(jīng)過綜合分析,我們得出,學(xué)風(fēng)建設(shè)由老師,學(xué)生,與學(xué)校的硬件措施以及學(xué)校舉辦相應(yīng)的活動(dòng)共同決定,經(jīng)過數(shù)據(jù)分析,得出內(nèi)部因素占比33.2%,即學(xué)生自身問題(33.2%),外部因素占比66.8%,其中校園文化氛圍(24.5%),學(xué)校管理(18.6%),教師的影響(14.7%),其他(9%)。
在社團(tuán)建設(shè)方面:部分學(xué)校不重視社團(tuán),參與社團(tuán)建設(shè)較少導(dǎo)致社團(tuán)建設(shè)管理工作“松散化”,領(lǐng)導(dǎo)層面的不重視直接導(dǎo)致學(xué)校老師的不重視,社團(tuán)的工作開展困難,使得學(xué)生在社團(tuán)沒有參與感,這不利于學(xué)風(fēng)的建設(shè)。
在圖書館建設(shè)方面:部分學(xué)校硬件比較全面,對(duì)圖書館的建設(shè)比較重視,學(xué)生則可以得到很多資源;部分學(xué)校設(shè)施不太全面,管理不到位,使得圖書館沒有更好的為學(xué)生服務(wù)。
在出勤率,自習(xí)情況與績點(diǎn)方面:部分學(xué)校高??粗乜蒲谐晒p視基本教學(xué),導(dǎo)致許多教師把重點(diǎn)放在科研上,對(duì)教學(xué)不夠重視,使得許多學(xué)生對(duì)學(xué)習(xí)不夠重視,許多學(xué)校為了更好地利用教師和教室資源,通常采取上大課的形式,這樣就難以保證課堂出勤率。而有的學(xué)校較重視課堂出勤率,采取了一些提高出勤率的方法,如教師隨機(jī)點(diǎn)名,學(xué)生聽課情況較好,績點(diǎn)較高;但考慮到各學(xué)校文理側(cè)重點(diǎn)方面,因此各部分學(xué)校文理科出勤情況不同;對(duì)于自習(xí),部分學(xué)校較重視學(xué)生自習(xí)情況,學(xué)生自習(xí)次數(shù)多,掌握的知識(shí)多,績點(diǎn)較高,但是部分學(xué)生自制力較差,不能經(jīng)常自習(xí),績點(diǎn)較低;部分學(xué)校學(xué)生自制力較差,自習(xí)時(shí)間過于分散,但是在績點(diǎn)方面還要考慮到學(xué)校與學(xué)校出的題難度不同,在一些學(xué)校題的難度較低,學(xué)生很容易取得較高的績點(diǎn)。
3 對(duì)策意見
綜合上述結(jié)論,可以得出,學(xué)生自習(xí)情況較好,課堂出勤率較高,積極去圖書館,勤于做練習(xí),并且社團(tuán)建設(shè)較好,硬件措施較齊全的學(xué)校學(xué)風(fēng)建設(shè)情況比較好。
為此提出以下意見,學(xué)校要加強(qiáng)制度建設(shè),注重對(duì)學(xué)生的鼓勵(lì)引導(dǎo),促進(jìn)學(xué)生主動(dòng)學(xué)習(xí),學(xué)校也可以加大發(fā)放獎(jiǎng)學(xué)金、助學(xué)金的力度,對(duì)于那些學(xué)習(xí)成績好,自覺性高,勇于創(chuàng)新的學(xué)生給予鼓勵(lì)與支持,同時(shí),學(xué)校也要有懲罰措施,對(duì)于那些不思進(jìn)取的學(xué)生要教育懲罰,學(xué)校應(yīng)結(jié)合獎(jiǎng)勵(lì)與懲罰措施,為學(xué)風(fēng)建設(shè)保駕護(hù)航。
社團(tuán)活動(dòng)對(duì)學(xué)風(fēng)建設(shè)也很重要,學(xué)校應(yīng)加強(qiáng)對(duì)社團(tuán)的重視程度,建立完善的社團(tuán)管理體系,加強(qiáng)對(duì)學(xué)生社團(tuán)的技術(shù)、經(jīng)濟(jì)等的幫扶,可實(shí)施獎(jiǎng)罰制度,對(duì)于辦得好的社團(tuán)加以獎(jiǎng)勵(lì)和規(guī)劃進(jìn)一步發(fā)展方向,而對(duì)于辦得差的社團(tuán),應(yīng)及時(shí)查明原因,做到有錯(cuò)必查、查錯(cuò)必改,使社團(tuán)向好的方向發(fā)展,以深化社團(tuán)的存在意義,讓社團(tuán)在學(xué)風(fēng)建設(shè)方面發(fā)揮應(yīng)有的作用。學(xué)校要鼓勵(lì)社團(tuán)多舉辦提高學(xué)生的文化修養(yǎng)和有關(guān)優(yōu)良學(xué)風(fēng)創(chuàng)建的活動(dòng),在開展此類活動(dòng)時(shí),要求每一位學(xué)生按照學(xué)風(fēng)要求進(jìn)行自我檢查,確立學(xué)習(xí)目標(biāo),尋求改進(jìn)學(xué)風(fēng)的辦法。
在圖書館問題方面,對(duì)于部分學(xué)校圖書館館舍實(shí)際的使用面積不夠,無法達(dá)到高校在校學(xué)生的人均實(shí)際使用面積,建議加大圖書館的館舍使用面積,此外應(yīng)該合理配置圖書館專業(yè)圖書,使各專業(yè)發(fā)展均衡,要破除圖書館陳舊觀念,使圖書館圖書利用率達(dá)到最佳效果。
學(xué)校應(yīng)該認(rèn)識(shí)到自身對(duì)于硬件設(shè)施建設(shè)的不足,充分了解學(xué)生要求的情況下,進(jìn)一步完善硬件設(shè)施,為學(xué)生的學(xué)習(xí)提供更好的資源。
參考文獻(xiàn)
[1] 趙治.試論當(dāng)前高校學(xué)風(fēng)建設(shè)的現(xiàn)狀、原因及對(duì)策[J].中國電力教育,2010(18):178-180.
[2] 鄭鎮(zhèn)鋒.新時(shí)期高校學(xué)風(fēng)建設(shè)的問題與對(duì)策[J].社科縱橫,2010(02):237-238.
[3] 葛慶龍,陳加輝.加強(qiáng)大一學(xué)生學(xué)風(fēng)建設(shè)的思路及對(duì)策[J].蘭州教育學(xué)院學(xué)報(bào),2010(2):110-112.
[4] 朱其峰.高校學(xué)風(fēng)建設(shè)問題及對(duì)策研究[J].科技創(chuàng)新報(bào),2013(24):199-200.