甄 穎,許寧寧,李 庚,陳雅頌**
(1.天津工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院,天津 300387;2.天津工業(yè)大學(xué)數(shù)學(xué)科學(xué)學(xué)院,天津 300387)
受全球新型冠狀病毒疫情的影響,國內(nèi)傳統(tǒng)線下教學(xué)受到較大影響.為了正常推進(jìn)教學(xué)任務(wù),2020—2021年春季學(xué)期,大部分學(xué)校采取“停課不停學(xué)”的線上模式開展教學(xué),以人工智能和大數(shù)據(jù)為代表的新媒體技術(shù)促使線上教學(xué)模式蓬勃發(fā)展[1].
近年來,國內(nèi)外有很多關(guān)于線上教學(xué)模式的探索性研究 .如:Anthony 和 Rohani[2]對(duì)同步直播課堂進(jìn)行了實(shí)證研究,認(rèn)為線上教學(xué)在學(xué)生參與感上與傳統(tǒng)線下教學(xué)的差異不大;Park[3]從學(xué)生線上評(píng)教入手,采用問卷調(diào)查法對(duì)線上教學(xué)現(xiàn)狀進(jìn)行調(diào)查分析,結(jié)合學(xué)生線上評(píng)教數(shù)據(jù)、調(diào)查問卷、訪談教師和學(xué)生,通過單因素方差分析的方法,探究不同類別學(xué)生評(píng)價(jià)的差異性;樊順厚和章素梅[4]指出課堂教學(xué)的有效性就是師生協(xié)同參與,并且在課堂中相互作用,以有效途徑達(dá)成教學(xué)目標(biāo)的過程;Madelynn等[5]采用難度系數(shù)計(jì)算方法,基于大規(guī)模開放在線課程(massive open online courses,MOOCs)學(xué)習(xí)者形成性測(cè)試成績(jī),對(duì)中國MOOCs形成性測(cè)試難易程度進(jìn)行判斷,結(jié)合失分率和信度指標(biāo),得到MOOCs形成性測(cè)試難度系數(shù)自動(dòng)學(xué)習(xí)收斂模型,并應(yīng)用于一門中國MOOCs進(jìn)行可行性和科學(xué)性驗(yàn)證.綜上,當(dāng)前通過大數(shù)據(jù)分析,對(duì)于教學(xué)模式導(dǎo)致成績(jī)差異性的研究仍處于起步階段[6],因此,對(duì)于教學(xué)模式導(dǎo)致成績(jī)差異性的研究具有重要意義.在對(duì)成績(jī)?cè)u(píng)價(jià)中,本文采用了新的指標(biāo)體系,構(gòu)建區(qū)分度、難度和偏度等特殊指標(biāo),探究單一的線上教學(xué)模式與傳統(tǒng)線下教學(xué)效果的差異性.本文以天津工業(yè)大學(xué)2018—2019學(xué)年(2018級(jí))和2019—2020學(xué)年(2019級(jí))秋季學(xué)期的線下教學(xué)與2019—2020學(xué)年春季學(xué)期的線上教學(xué)期間全校高等數(shù)學(xué)考試成績(jī)?yōu)闃颖?,高等?shù)學(xué)僅面向大一學(xué)生授課,對(duì)所研究的指標(biāo)進(jìn)行降維,選取主要影響指標(biāo),用建立的主成分分析(principal compoment analysis,PCA)模型,對(duì)2個(gè)學(xué)年不同專業(yè)、不同班級(jí)線上線下學(xué)習(xí)效果進(jìn)行差異性比較,推斷學(xué)生線上學(xué)習(xí)狀態(tài).依據(jù)上述分析結(jié)果,對(duì)未來的教學(xué)方式進(jìn)行合理化改進(jìn).
對(duì)教學(xué)效果評(píng)價(jià)需要考慮多個(gè)考察指標(biāo).在多指標(biāo)的成績(jī)樣本中,可以通過降維手段提取出評(píng)估教學(xué)效果的虛擬指標(biāo)[7],常用有效手段為PCA.
PCA是多個(gè)線性相關(guān)的變量降維成幾個(gè)核心變量的一種多元統(tǒng)計(jì)方法.假設(shè)x為m維隨機(jī)變量,其均值是μ,協(xié)方差矩陣是R.考慮由m維隨機(jī)變量x到m維隨機(jī)變量y的線性變換.
③設(shè)變量y1是x的所有線性變換中方差最大的;y2是與y1不相關(guān)的x的所有線性變換中方差最大的;一般地,yi是與 y1,y2,…,yi-1(i=1,2,…,m)都不相關(guān)的x的所有線性變換中方差最大的;此時(shí)分別稱y1,y2,…,ym為x的第1,2,…,m主成分.
利用主成分對(duì)多維數(shù)據(jù)降維的過程如下:
(1)對(duì)樣本矩陣X的列進(jìn)行標(biāo)準(zhǔn)化變換.設(shè)訓(xùn)練樣本數(shù)為n,給定樣本矩陣:
式中:Xi=(xi1,xi2,…,xin)是 x的第i個(gè)指標(biāo)的 n個(gè)獨(dú)立觀測(cè)樣本,i=1,2,…,m.標(biāo)準(zhǔn)化矩陣后各元素值為
式中:si為第 i個(gè)指標(biāo)對(duì)應(yīng)的標(biāo)準(zhǔn)差,為 n 個(gè)獨(dú)立觀測(cè)樣本的均值.仍用X表示標(biāo)準(zhǔn)化后的矩陣.
(2)計(jì)算指標(biāo)變量的協(xié)方差矩陣D.針對(duì)X ∈ Rn×m,協(xié)方差矩陣D為
(3)計(jì)算載荷矩陣.求樣本協(xié)方差矩陣對(duì)應(yīng)的m個(gè) 特 征 值 λi(i =1,2,…,m).不 妨 設(shè) λ1≥ λ2≥ … ≥λm≥0,對(duì)應(yīng)的單位特征向量為vi,稱特征向量vi為主成分載荷.構(gòu)造正交矩陣V,該正交矩陣稱為主成分載荷矩陣[8].這個(gè)過程即為D的特征分解,D=VΛVT,Λ為由特征值構(gòu)成的對(duì)角陣.
(5)構(gòu)建主成分模型.對(duì)降維后的i0個(gè)主成分,構(gòu)建主成分模型表達(dá)式為
D矩陣每一個(gè)列向量可以視為n個(gè)樣本的i0個(gè)主成分上形成的投影向量,投影所得向量可以稱為主成分得分向量.
主成分法對(duì)高維數(shù)據(jù)樣本向量的作用相當(dāng)于對(duì)超平面的點(diǎn)(樣本),在低維的某個(gè)子空間下的投影,如圖1所示.
圖1 高維向量在低維平面的投影
考慮不同專業(yè)的高等數(shù)學(xué)成績(jī)的差異,將每個(gè)專業(yè)成績(jī)匯總的統(tǒng)計(jì)量作為指標(biāo),擬通過PCA提取出最能體現(xiàn)出教學(xué)效果的虛擬指標(biāo).本文由各專業(yè)成績(jī)導(dǎo)出了10個(gè)可能反映教學(xué)效果的統(tǒng)計(jì)量[10],并對(duì)各統(tǒng)計(jì)量的實(shí)際含義作出了解釋.
(1)樣本均值.在某個(gè)學(xué)期,對(duì)研究群體的學(xué)生編號(hào)記為 i=1,2,…,k,ai表示第 i個(gè)學(xué)生的成績(jī) .成績(jī)的平均值直接反映該群體(注:群體是指研究對(duì)象的范圍,可以是班級(jí)、專業(yè)、年級(jí)、學(xué)院和全體參加高數(shù)考試的學(xué)生等)學(xué)生成績(jī)的整體水平,公式為
式中:μ表示學(xué)生成績(jī)的平均值,k表示該群體參與考試的學(xué)生總數(shù).
(2)樣本標(biāo)準(zhǔn)差.標(biāo)準(zhǔn)差可以體現(xiàn)該群體每個(gè)學(xué)生成績(jī)差異的波動(dòng)程度,用S表示為
(3)偏度.偏度通過樣本的三階原點(diǎn)矩和二階原點(diǎn)矩計(jì)算所得,反映了學(xué)生成績(jī)分布與均值的偏離程度.計(jì)算公式為
式中:偏度>0,表示高于平均分的學(xué)生更多,該群體整體學(xué)風(fēng)較好;偏度<0,說明大部分學(xué)生成績(jī)低于平均水平,只有個(gè)別學(xué)生成績(jī)比較優(yōu)異,該群體學(xué)風(fēng)較差.k3=E[a3],k2=E[a2]分別表示樣本的三階原點(diǎn)矩和二階原點(diǎn)矩.σ表示總體標(biāo)準(zhǔn)差,其平方為二階中心矩,即
(4)區(qū)分度[11].區(qū)分度是考試試題對(duì)考生實(shí)際解題能力和要考查的各知識(shí)點(diǎn)掌握水平的區(qū)分程度,是將考生區(qū)分開的統(tǒng)計(jì)量.區(qū)分度指標(biāo)高的試題可以將不同水平和能力的學(xué)生區(qū)別開來,有助于對(duì)學(xué)生的能力進(jìn)行鑒別,同時(shí)也體現(xiàn)了教學(xué)效果的高低.不同班級(jí)學(xué)習(xí)狀況不同,同一套試卷對(duì)不同專業(yè)的區(qū)分度不盡相同.本文采用相關(guān)度法計(jì)算區(qū)分度.相關(guān)度法用該試題的成績(jī)與效標(biāo)成績(jī)的相關(guān)系數(shù)作為該題的區(qū)分度指標(biāo),通常,效標(biāo)成績(jī)較難取得,因此用檢驗(yàn)總成績(jī)來代替,求該題成績(jī)與其測(cè)驗(yàn)總成績(jī)的相關(guān)系數(shù),若相關(guān)系數(shù)較高,意味著該試題的區(qū)分度較高[12].該相關(guān)度計(jì)算方法為
(5)中位數(shù).中位數(shù)是該群體學(xué)生成績(jī)的中間水平[13],相對(duì)于樣本均值,不易受個(gè)別學(xué)生極端分?jǐn)?shù)的影響(分?jǐn)?shù)很高和分?jǐn)?shù)很低的少數(shù)學(xué)生可能會(huì)給學(xué)生的成績(jī)均值帶來較大影響).對(duì)排序的成績(jī)
(6)眾數(shù).眾數(shù)是群體中獲得相同成績(jī)最多人數(shù)的分?jǐn)?shù),體現(xiàn)了成績(jī)分布最密集的趨向,能在一定程度上解釋教學(xué)水平的高低[14].
(7)難度.試題難度與學(xué)生成績(jī)有很強(qiáng)相關(guān)性,能間接影響對(duì)教學(xué)效果的判斷[15].對(duì)于每道題難度的計(jì)算方法是
式中:pj表示第j題的難度,Rj表示第j題的通過率.計(jì)算通過率[16]方法為
式中:Aj表示第j題的學(xué)生平均得分,Yj表示第j題的總分?jǐn)?shù),aij表示第i個(gè)學(xué)生第j題的成績(jī).試卷整體難度為各題目難度的加權(quán)平均數(shù),計(jì)算方法為
式中:p表示該試卷的整體難度,Y表示試卷總分,pj表示第j題的難度,Yj表示第j題的總分?jǐn)?shù).
(8)最高分.各專業(yè)最高分體現(xiàn)了每個(gè)專業(yè)的尖子生的學(xué)習(xí)水平[17].
(9)極差.每個(gè)專業(yè)的分?jǐn)?shù)極差是最高分與最低分之差,是成績(jī)分布情況的一種寫照[18],但容易受極端值的影響.
對(duì)于每個(gè)群體的某個(gè)學(xué)年,可以獲得一個(gè)9維向量的樣本.進(jìn)而通過PCA法降維,建立教學(xué)效果的評(píng)價(jià)體系.每個(gè)學(xué)年的教學(xué)效果的主成分虛擬系數(shù)進(jìn)行橫向比較,可判斷不同學(xué)年教學(xué)效果的差異是否具有顯著性.
本文將天津工業(yè)大學(xué)2018—2019和2019—2020學(xué)年秋季學(xué)期的線下教學(xué)與2019—2020學(xué)年春季學(xué)期的線上教學(xué)期間,全校高等數(shù)學(xué)考試成績(jī)作為研究對(duì)象,其中,由于不同專業(yè)對(duì)高等數(shù)學(xué)的學(xué)習(xí)要求不同,2018—2019學(xué)年春季學(xué)期的教學(xué)分為90和45學(xué)時(shí),按學(xué)時(shí)研究討論.9個(gè)指標(biāo)數(shù)據(jù)如表1所示,線上教學(xué)2個(gè)學(xué)期的平均值分別為50.3、56.3分,中位數(shù)分別為49.0、58.5分,均顯著低于線下各學(xué)期的平均值與中位數(shù),表明線上教學(xué)總體成績(jī)不如線下教學(xué)成績(jī)優(yōu)異.線上教學(xué)2個(gè)學(xué)期成績(jī)的標(biāo)準(zhǔn)差分別為23.4、21.2分,均大于線下教學(xué)成績(jī)的標(biāo)準(zhǔn)差,表明線上教學(xué)2個(gè)學(xué)期成績(jī)較線下教學(xué)成績(jī)更為分散,偏離平均值的程度更大.線上教學(xué)與線下教學(xué)極差較為相近,表明最高分與最低分之差在2種教學(xué)方式下無顯著差異.由難度和區(qū)分度具體數(shù)值對(duì)比可知,線上教學(xué)的2個(gè)學(xué)期試卷難度與區(qū)分度明顯較線下教學(xué)降低.從表1中各個(gè)指標(biāo)數(shù)值對(duì)比分析,線上教學(xué)確實(shí)較線下教學(xué)部分指標(biāo)有所下降,后面文字將會(huì)用數(shù)學(xué)模型,量化2種教學(xué)效果差異.補(bǔ)充表中主要反映的數(shù)據(jù)結(jié)果.
表1 樣本指標(biāo)數(shù)據(jù)統(tǒng)計(jì) 單位:分
對(duì)所有專業(yè)的高等數(shù)學(xué)成績(jī)進(jìn)行正態(tài)性檢驗(yàn),全校學(xué)生各學(xué)期的高等數(shù)學(xué)成績(jī)的P值均<0.05(0.024 6~0.037 6),說明拒絕原假設(shè),顯著性較強(qiáng),統(tǒng)計(jì)數(shù)據(jù)符合正態(tài)性檢驗(yàn).
進(jìn)而對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,將所有數(shù)據(jù)指標(biāo)映射到[0,1][19].依據(jù)主成分分析模型和選取的 9個(gè)影響指標(biāo),運(yùn)用MATLAB 2015b編程,得到指標(biāo)的特征值和貢獻(xiàn)率如表2所示.第一個(gè)主成分的貢獻(xiàn)率76.92%,達(dá)到了75.00%的要求,表示其承載了高等數(shù)學(xué)教學(xué)效果的主要綜合信息,在很大程度上能夠反映學(xué)生的學(xué)習(xí)情況,從而建立評(píng)價(jià)體系.
表2 特征值及貢獻(xiàn)率
將以上9個(gè)指標(biāo)轉(zhuǎn)化為一個(gè)主成分指標(biāo),起到明顯的降維效果,從而得到主成分載荷矩陣(表3)如下.由主成分載荷矩陣表可得前3個(gè)主成分的線性組合表達(dá)式為:
表3 主成分載荷矩陣
式中:x1、x2、x3、x4、x6和x9分別為均值、標(biāo)準(zhǔn)差、區(qū)分度、偏度、眾數(shù)、極差,其特征向量值的絕對(duì)值相對(duì)更大,指標(biāo)對(duì)主成分的貢獻(xiàn)也就越高;x1、x3、x6和x9具有較大的正載荷;x2和x4具有較大的負(fù)載荷.考慮到指標(biāo)之間的共性,都可以體現(xiàn)學(xué)生的學(xué)習(xí)情況,反映教學(xué)效果,基本可以將Z1視為x1、x2、x3、x4、x6和x9的綜合變量,因此定義第一主成分為教學(xué)效果指數(shù).
將 2018—2019、2019—2020學(xué)年秋季學(xué)期與2019—2020學(xué)年春季學(xué)期的全校高等數(shù)學(xué)考試成績(jī)代入PCA模型,可進(jìn)行教學(xué)效果的差異性比較.根據(jù)上述模型,將相關(guān)指標(biāo)值帶入,得到教學(xué)效果的累積貢獻(xiàn)率.線上教學(xué)的數(shù)值明顯減小,其中2019—2020學(xué)年春季學(xué)期90學(xué)時(shí)的教學(xué)效果值為-0.716 1,說明教學(xué)效果較差,學(xué)生對(duì)高等數(shù)學(xué)下冊(cè)知識(shí)的吸收不到位,導(dǎo)致成績(jī)明顯低于同時(shí)期往年線下學(xué)習(xí)的期末成績(jī);2019—2020學(xué)年春季學(xué)期45學(xué)時(shí)的教學(xué)效果值為0.026 2,說明對(duì)該類學(xué)生的教學(xué)效果不顯著.與2018級(jí)學(xué)生秋季學(xué)期線下學(xué)習(xí)效果相比,2019級(jí)學(xué)生教學(xué)效果代表值為1.651,教學(xué)效果差異較小,說明學(xué)生線下學(xué)習(xí)時(shí),對(duì)所學(xué)知識(shí)的吸收情況基本無差異.
為了更清楚地展示線上與線下教學(xué)的差異性,本文將2個(gè)學(xué)年同時(shí)期的教學(xué)效果值作差,其中負(fù)號(hào)表示后一年相對(duì)于前一年的教學(xué)效果降低.繪制條形圖如圖2所示.對(duì)于同為線下教學(xué)的第一學(xué)期,2019級(jí)學(xué)生整體對(duì)高等數(shù)學(xué)的掌握情況僅比2018級(jí)低0.061 9,說明教學(xué)效果基本無異,2個(gè)年級(jí)的學(xué)生整體素質(zhì)無差別.由于新型冠狀病毒疫情的原因,2019級(jí)的高等數(shù)學(xué)春季學(xué)期在家進(jìn)行線上教學(xué),90學(xué)時(shí)的課程難度和知識(shí)量>45學(xué)時(shí),故教學(xué)效果差異值也最大;同比2018級(jí)90學(xué)時(shí),下降值達(dá)到1.242 6,45學(xué)時(shí)的下降值為0.459 3,說明學(xué)生在家線上學(xué)習(xí)高等數(shù)學(xué)的學(xué)習(xí)效果不佳,導(dǎo)致期末考試成績(jī)較低.
圖2 不同學(xué)年教學(xué)效果的差異性比較
在新型冠狀病毒肺炎疫情的背景下,本文以天津工業(yè)大學(xué)全校2018和2019級(jí)學(xué)生的高等數(shù)學(xué)期末卷面成績(jī)?yōu)闃颖?,運(yùn)用PCA和控制變量的方法,利用MATLAB 2015b軟件,定義第一主成分為教學(xué)效果指數(shù),從而研究了線上與線下教學(xué)效果的差異性.得到如下結(jié)論:通過第一主成分模型可知2018—2019學(xué)年秋季學(xué)期和2019—2020學(xué)年秋季學(xué)期的線下教學(xué)效果代表值基本持平,說明2018和2019級(jí)的學(xué)生整體素質(zhì)無明顯差距;對(duì)于2019—2020學(xué)年春季學(xué)期的線上教學(xué),與2018級(jí)學(xué)生的成績(jī)相比,2019級(jí)90學(xué)時(shí)學(xué)生的高等數(shù)學(xué)期末成績(jī)不理想,教學(xué)效果差異值最大;2019級(jí)45學(xué)時(shí)的學(xué)生對(duì)知識(shí)掌握也欠佳,教學(xué)效果差異較明顯.
通過教學(xué)效果差異性數(shù)值和相關(guān)調(diào)研,可得到結(jié)論:多數(shù)學(xué)生在家的自主學(xué)習(xí)性不高,雖然高等數(shù)學(xué)課程均為線上直播課,且會(huì)有簽到、作業(yè)等日常任務(wù),但學(xué)生們受到的監(jiān)督遠(yuǎn)不及在校的線下教學(xué).受網(wǎng)絡(luò)、家庭等外界多種因素影響,對(duì)于答疑、作業(yè)指導(dǎo)等工作也不能及時(shí)完成,學(xué)生在家各自為營,欠缺相互討論的學(xué)習(xí)氛圍,在期末復(fù)習(xí)時(shí)沒有緊張感,這些因素都導(dǎo)致了2019級(jí)學(xué)生期末成績(jī)普遍偏低.
綜上所述,由于新型冠狀病毒肺炎疫情在世界范圍內(nèi)還沒有完全平息,多數(shù)高校會(huì)采取提前放寒暑假的措施,為了學(xué)生錯(cuò)開旅途高峰順利返家,高等數(shù)學(xué)課程可以采取線上線下結(jié)合的教學(xué)方式,避免純線上的監(jiān)督不力等問題,同時(shí)打破傳統(tǒng)單一線下教學(xué)的格局,找到最佳的教學(xué)方式.
首都師范大學(xué)學(xué)報(bào)(自然科學(xué)版)2022年5期