錢玲 王海青 谷亞林
摘要:電子信息類各專業(yè)核心課程甄別的目的,是為了激發(fā)教師的質(zhì)量意識與競爭意識,實現(xiàn)并明確促進(jìn)學(xué)生學(xué)習(xí)的教學(xué)目標(biāo)與教學(xué)方向。文章利用教務(wù)管理信息系統(tǒng)大數(shù)據(jù),應(yīng)用統(tǒng)計學(xué)關(guān)聯(lián)算法,分析以往畢業(yè)學(xué)生各課程成績與GPA的數(shù)據(jù),甄別出電子信息類專業(yè)的“核心”課程,為學(xué)校的教學(xué)活動發(fā)揮了導(dǎo)向、診斷和監(jiān)督等功能。文中所研究的方法同樣可以推廣到其他高校和其他專業(yè)、從而為促進(jìn)人才培養(yǎng)提供理論依據(jù)和數(shù)據(jù)支撐。
關(guān)鍵詞:大數(shù)據(jù);核心課程;GPA;關(guān)聯(lián)度
中圖分類號:G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-9324(2019)15-0079-03
高校各專業(yè)核心課程是高校專業(yè)課程體系建設(shè)的核心,承擔(dān)著專業(yè)人才培養(yǎng)的基礎(chǔ)性任務(wù),反映專業(yè)特點、體現(xiàn)專業(yè)特色、支撐專業(yè)發(fā)展,其輻射而出的其他專業(yè)課程與之共同構(gòu)成了完整的專業(yè)課程體系,進(jìn)而形成了專業(yè)人才培養(yǎng)體系。學(xué)分績點—GPA(grade point average)是大學(xué)生專業(yè)素質(zhì)的一個重要體現(xiàn),分析教學(xué)大數(shù)據(jù)中課程成績與GPA的關(guān)聯(lián)度可以發(fā)現(xiàn)隱藏在數(shù)據(jù)之間的相互關(guān)系,甄別出對GPA影響較大的核心課程,有助于進(jìn)一步做好專業(yè)課程建設(shè)工作,促進(jìn)高校的內(nèi)涵提升和質(zhì)量提高。
國內(nèi)外高校通過教學(xué)大數(shù)據(jù)對課程體系、教學(xué)模式、數(shù)據(jù)分析都做了許多研究。加利福尼亞大學(xué)洛杉磯分校的Kharkar教授[1]等通過分析數(shù)學(xué)系核心課程關(guān)聯(lián)度,為教授這些課程的教師提供教學(xué)指導(dǎo);清華大學(xué)[2]利用教務(wù)管理系統(tǒng)的構(gòu)建了統(tǒng)計分析工具系統(tǒng),該系統(tǒng)驗證了數(shù)據(jù)分析工具對于教務(wù)管理者的決策支持價值,體現(xiàn)了嵌入教學(xué)系統(tǒng)的數(shù)據(jù)分析工具的優(yōu)勢;浙江大學(xué)[3]通過對資產(chǎn)的歸納、整理,最終形成權(quán)威、全面的資產(chǎn)數(shù)據(jù),并提供數(shù)據(jù)查詢和分析服務(wù);復(fù)旦大學(xué)[4]“教育管理信息化平臺”和“教育資源公共服務(wù)平臺”建設(shè)的過程中,也積累了豐富的信息化實踐經(jīng)驗;電子科技大學(xué)[5]構(gòu)建了教育大數(shù)據(jù)一體化平臺,此平臺提供了精準(zhǔn)預(yù)測學(xué)生成績,助力學(xué)生精準(zhǔn)資助等個性化、精準(zhǔn)化的管理服務(wù)。
本文通過對南京某重點高校的電子信息工程專業(yè),已經(jīng)畢業(yè)的4屆學(xué)生所有課程成績,以及所有學(xué)生最終的GPA數(shù)據(jù)進(jìn)行關(guān)聯(lián)度分析,計算出各課程對GPA成績影響的不同程度,從而甄別出該專業(yè)的核心課程,以期為促進(jìn)高校學(xué)生的成長和發(fā)展提供數(shù)據(jù)依據(jù)和參考。
一、數(shù)據(jù)與整理
在大數(shù)據(jù)時代,通過數(shù)據(jù)挖掘技術(shù)可以獲取事件之間的關(guān)聯(lián)性,為正確的決策提供技術(shù)保障。一般核心課程在高等教育來講通常指基礎(chǔ)課程中的必修課,我們這里的“核心”課程是指和學(xué)生整個大學(xué)期間的GPA關(guān)聯(lián)度最高的幾門課程。
1.數(shù)據(jù)的來源。南京某重點高校的電子信息工程專業(yè)是江蘇省品牌專業(yè),該校的教務(wù)系統(tǒng)已經(jīng)保存了以往學(xué)生的完整的成績數(shù)據(jù),每個專業(yè)所有學(xué)生的課程成績數(shù)據(jù)都保存為Excel文件,我們收集剛剛畢業(yè)的前4屆學(xué)生(即2015屆—2018屆)的學(xué)習(xí)成績數(shù)據(jù)文件,這些原始數(shù)據(jù)包括:該專業(yè)每位學(xué)生的每門課程的每次考試成績,有些學(xué)生的一門課成績不止一個,例如,正??荚嚦煽儭⒀a考成績、重修成績等,平均每位學(xué)生的成績數(shù)據(jù)有100條左右(每位學(xué)生大概修了70多門課程,部分課程還不止一個成績),并且每條數(shù)據(jù)又有23個屬性(每門課程屬性數(shù)據(jù)如表1所示),粗略估算4屆學(xué)生的課程成績數(shù)據(jù)接近一百萬條。
2.數(shù)據(jù)的整理。從學(xué)校教務(wù)處獲取的學(xué)生各門課程成績,均采用百分制記分,該專業(yè)4屆畢業(yè)學(xué)生共有674名,在校4年內(nèi)必須修滿172學(xué)分,除了必修課程以外,學(xué)生之間選修課程存在差異,按照一門課平均2.5學(xué)分計算,每個學(xué)生平均選修70門課程。另外部分學(xué)生原始成績數(shù)據(jù)還存在正??荚嚒⒀a考以及重修等不同類別的成績,為了使結(jié)果更具有真實性,我們設(shè)定幾個成績中,只取第一次有效成績(正常考試的用正??荚嚦煽?,沒有正??荚嚦煽兊挠玫谝淮尉徔蓟蜓a考成績)作為我們的計算數(shù)據(jù)。每門課程成績的原來屬性有23個,例如:{學(xué)號,姓名,開課學(xué)期,課程編號,課程名稱,學(xué)分,成績,考試性質(zhì),…},而有些屬性需要,有些屬性不需要,通過整理將課程屬性精簡為:{課程編號,開課學(xué)期,課程名稱,課程屬性,學(xué)時,學(xué)分,開課單位}共7個屬性,經(jīng)過整理的數(shù)據(jù)用來計算課程關(guān)聯(lián)度。
二、關(guān)聯(lián)分析
關(guān)聯(lián)系數(shù)是用以反映變量之間關(guān)系密切程度的統(tǒng)計指標(biāo)。關(guān)聯(lián)系數(shù)是按積差方法計算,以兩變量與各自平均值的離差為基礎(chǔ),通過兩個離差相乘來反映兩變量之間相關(guān)程度。spearman秩相關(guān)系數(shù)是統(tǒng)計學(xué)的三大相關(guān)系數(shù)之一,是一個非參數(shù)性質(zhì)(與分布無關(guān))的秩統(tǒng)計參數(shù),由Spearman在1904年提出,用來度量兩個變量之間聯(lián)系的強弱,比較適合對GPA影響較大的核心課程的甄別。
2.算法流程。根據(jù)Spearman秩相關(guān)系數(shù)的計算公式,以及經(jīng)過整理的4屆學(xué)生課程考試成績的數(shù)據(jù),用Python語言作為編程語言,所設(shè)計的算法模塊如圖1所示。(1)首先讀取原始數(shù)據(jù)的4個Excel文件,將其合并成一個csv格式的文件;(2)刪去課程不需要的屬性,保留特定屬性,并對同一個學(xué)生同一門課的多個成績進(jìn)行去重,僅保留第一次有效成績,由于存在選修課程的差異,保留有效成績超過學(xué)生總數(shù)50%的課程數(shù)據(jù),刪除選修課程較少的課程數(shù)據(jù),完成數(shù)據(jù)的整理;(3)計算每個學(xué)生每門課程百分制成績對應(yīng)的業(yè)績點和每個學(xué)生的GPA;(4)將所有學(xué)生的GPA進(jìn)行排序,將每個學(xué)生的有效課程的業(yè)績點進(jìn)行排序;(5)根據(jù)Spearman秩相關(guān)系數(shù)的計算公式計算各門課程的Spearman值,從而甄別出核心課程。
通過數(shù)據(jù)挖掘和統(tǒng)計學(xué)關(guān)聯(lián)度計算,為我們獲得電子信息類專業(yè)的核心課程甄別,提供了數(shù)據(jù)支撐。
3.關(guān)聯(lián)系數(shù)。通過4屆畢業(yè)學(xué)生共有674名的課程成績的原始數(shù)據(jù),利用上述分析與計算,共計算出54門課程(包括實踐課程)的Spearman系數(shù),下面列出Spearman系數(shù)最高的10門課程。
從表2可見,10門核心課程共有39學(xué)分,占總學(xué)分的22.4%,都是必修課程。其中,工程數(shù)學(xué)、概率與過程、大學(xué)物理(Ⅰ)和大學(xué)物理(Ⅱ)是學(xué)科教育課,余下6門課程都是專業(yè)基礎(chǔ)課程;這9門課程都是在學(xué)生大一和大二必修的課程(只有數(shù)字信號處理課程除外,其授課時間在大三上),所以,加強大一和大二學(xué)生的學(xué)習(xí)方法教育就非常必要。
三、意義分析
依據(jù)往屆學(xué)生教學(xué)大數(shù)據(jù)中核心課程與GPA的相關(guān)數(shù)據(jù),就可以分析現(xiàn)在在校學(xué)生的核心課程成績,尤其是大一和大二的在讀學(xué)生,可以對學(xué)生的未來學(xué)習(xí)趨勢進(jìn)行科學(xué)預(yù)測,為學(xué)生的自我學(xué)習(xí)監(jiān)控與指導(dǎo)、為教師的教學(xué)決策提供更精細(xì)化的服務(wù)。這樣克服以往經(jīng)驗式的,缺少足夠的數(shù)據(jù)分析判斷、佐證教學(xué)行為效果的缺點,實現(xiàn)以數(shù)據(jù)驅(qū)動的“因材施教”。上述課程關(guān)聯(lián)度分析對當(dāng)前教學(xué)方面的意義體現(xiàn)在以下三個方面。
1.管理系統(tǒng)。高校教學(xué)管理部門,通過分析大一和大二學(xué)生核心課程的成績,可以及時調(diào)整學(xué)生的培養(yǎng)方案?;谶@些信息,學(xué)校不僅可以預(yù)測出每個學(xué)生在其他課程的得分,也可以預(yù)測出每個學(xué)生在其他課程的掛科可能性;分析核心課程的掌握程度,將學(xué)生分為不同類型,例如:“學(xué)術(shù)型”“能力型”和“潛力型”,根據(jù)“分類指導(dǎo)、分層施教和個別培養(yǎng)相結(jié)合”的原則,對不同類型學(xué)生分別實行“深度拓展型、能力強化型、揚長教育型”教育策略,引導(dǎo)學(xué)生個性化發(fā)展,使每一位學(xué)生都成為更好的自己。
2.教學(xué)系統(tǒng)。傳統(tǒng)的教學(xué)系統(tǒng)往往存在片面、主觀、模糊化的傾向。現(xiàn)在每個教師在上課前,可以通過計算學(xué)生的前面核心課程成績,明確自己授課的學(xué)生學(xué)習(xí)狀況,事前知道優(yōu)秀學(xué)生和問題學(xué)生的群體,可以進(jìn)行準(zhǔn)對性教學(xué)。對符合學(xué)困生發(fā)展趨勢的問題學(xué)生進(jìn)行預(yù)警和指導(dǎo),加強管理和檢查;對有異于常人的優(yōu)秀學(xué)生進(jìn)行個性化培養(yǎng)方案,有針對性地制訂培養(yǎng)計劃和教學(xué)方案,推送個性化的學(xué)習(xí)資料,推薦個性化的實踐鍛煉平臺,指導(dǎo)個性化的職業(yè)規(guī)劃;對普通學(xué)生進(jìn)行鼓勵教育,使學(xué)生從被動學(xué)習(xí)變?yōu)樽晕医逃?、自主學(xué)習(xí),激發(fā)其學(xué)習(xí)的活力。
3.學(xué)習(xí)系統(tǒng)。直觀地說,學(xué)生成績和他們的重要知識掌握情況有密切關(guān)系。分析學(xué)生對核心課程的掌握程度,每個學(xué)生就可以自己預(yù)測未來學(xué)業(yè)趨勢。大一和大二學(xué)生在每學(xué)期都可以評估自己核心課程的成績、自己的能力和興趣,調(diào)整學(xué)習(xí)方法和努力方向,預(yù)測自己后續(xù)課程學(xué)習(xí)的難度,從而提前規(guī)劃自己的時間和精力。
四、總結(jié)
隨著全球信息化的高速發(fā)展,電子信息類專業(yè)成為近幾十年來發(fā)展最快的學(xué)科之一。學(xué)生要學(xué)的理論課程越來越多,間接導(dǎo)致學(xué)生發(fā)展不均衡,如何在諸多課程中,抓住主要矛盾成為我們研究的重點,通過核心課程的甄別,可以為高校教與學(xué)提供數(shù)據(jù)支撐,實現(xiàn)了從定性分析到定量分析的轉(zhuǎn)變,促進(jìn)教學(xué)管理科學(xué)化、精細(xì)化。通過在校學(xué)生核心課程的成績就可以預(yù)測畢業(yè)時的GPA情況,可以及時認(rèn)識教學(xué)問題,盡快解決存在問題。上述通過教學(xué)大數(shù)據(jù)甄別學(xué)科專業(yè)核心課程的方法,同樣可以應(yīng)用到其他專業(yè)和其他高校,具有一定的推廣應(yīng)用價值。
參考文獻(xiàn):
[1]R Kharkar, J Tran and C Z Marshak.Core Course Analysis for Undergraduate Students in Mathematics[J].arXiv:1605.00328v1[math.HO] 2 May,2016.
[2]鄧文俊,等.基于教務(wù)管理系統(tǒng)的數(shù)據(jù)分析工具的研究與設(shè)計[J].中國電化教育,2014,(5):138-143.
[3]方偉杰,等.浙江大學(xué):數(shù)據(jù)共享提高公共資產(chǎn)利用率[J].中國教育網(wǎng)絡(luò),2012,(6):60-61.
[4]陳翼,等.復(fù)旦大學(xué):信息化支撐教學(xué)與人才培養(yǎng)模式創(chuàng)新[J].中國教育網(wǎng)絡(luò),2014,(10):45-48.
[5]呂紅胤,等.電子科技大學(xué)一體化大數(shù)據(jù)提供師生精準(zhǔn)畫像[J].中國教育網(wǎng)絡(luò),2017,(2):78-81.