董小剛, 佟知真, 王純杰, 李純凈, 張倩倩
(長(zhǎng)春工業(yè)大學(xué) 基礎(chǔ)科學(xué)學(xué)院, 吉林 長(zhǎng)春 130012)
?
高校學(xué)生成績(jī)及教師教學(xué)效果SAS統(tǒng)計(jì)分析
董小剛, 佟知真, 王純杰*, 李純凈, 張倩倩
(長(zhǎng)春工業(yè)大學(xué) 基礎(chǔ)科學(xué)學(xué)院, 吉林 長(zhǎng)春 130012)
以某高校同一學(xué)期不同專(zhuān)業(yè)學(xué)生期末考試成績(jī)作為參考數(shù)據(jù),利用多元統(tǒng)計(jì)方法進(jìn)行分析,使用SAS宏程序?qū)W(xué)生成績(jī)進(jìn)行批量處理并對(duì)教師教學(xué)效果進(jìn)行評(píng)價(jià)。
主成分分析; 因子分析; 聚類(lèi)分析; 典型相關(guān)分析; SAS
高等教育規(guī)模迅速擴(kuò)大,使我們?cè)谳^短時(shí)間內(nèi)迅速提升了我國(guó)人力資源的開(kāi)發(fā)水平,推動(dòng)經(jīng)濟(jì)社會(huì)的持續(xù)快速發(fā)展,也帶動(dòng)了綜合國(guó)力與國(guó)際競(jìng)爭(zhēng)力的持續(xù)提高,使我國(guó)在未來(lái)國(guó)際的科技、教育與人才競(jìng)爭(zhēng)中搶占了有利位置。滿足了廣大人民群眾想要接受到好的教育的迫切愿望,有力地促進(jìn)了教育的公平公正。
就目前的高校管理來(lái)看,特別是對(duì)于學(xué)生的考試試卷的管理工作中,普遍都存在著不能對(duì)試卷成績(jī)數(shù)據(jù)合理分析與利用的問(wèn)題[1]。簡(jiǎn)而言之,考試本身是一種檢驗(yàn)教學(xué)效果與質(zhì)量的重要方法,而成績(jī)所能反應(yīng)出來(lái)的信息不僅僅是顯示在簡(jiǎn)單的層面上,需要對(duì)它進(jìn)行更深入的理性分析,找到各方面的成效與得失以及影響學(xué)生成績(jī)的相關(guān)因素。幫助教師及時(shí)地發(fā)現(xiàn)教學(xué)中存在的一些問(wèn)題及薄弱環(huán)節(jié),使教師可以及時(shí)地調(diào)整教學(xué)方案與內(nèi)容,更好地指導(dǎo)教師在教學(xué)中的工作。
1.1 主成分分析法[2]
主成分分析是數(shù)學(xué)上對(duì)數(shù)據(jù)降維的一種方法。其基本思想是設(shè)法將原來(lái)眾多的具有一定相關(guān)性的指標(biāo)x1,x2,…,xp(p個(gè)指標(biāo))重新組合成一組較少個(gè)數(shù)的互不相關(guān)的綜合指標(biāo)Fm來(lái)代替原來(lái)的指標(biāo)。
主成分分析的具體步驟如下:
1)計(jì)算相關(guān)系數(shù)矩陣;
2)求出相關(guān)系數(shù)矩陣的特征值以及相應(yīng)的正交化單位特征向量;
3)選擇主成分;
4)計(jì)算主成分得分。
1.2 因子分析法
因子分析法就是從研究變量?jī)?nèi)部相關(guān)的依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合因子的一種多變量統(tǒng)計(jì)分析方法。這樣可以對(duì)原始的數(shù)據(jù)進(jìn)行分類(lèi)歸并,將相關(guān)比較密切的變量分別歸類(lèi),歸納出多個(gè)綜合性指標(biāo),這些綜合指標(biāo)互不相關(guān),即它們所綜合的信息互相不重疊。這些綜合指標(biāo)就成為因子或公共因子。
因子分析法的基本思想是將觀測(cè)變量進(jìn)行分類(lèi),將相關(guān)性較高,即聯(lián)系比較緊密的分在同一類(lèi)中,而不同類(lèi)變量之間的相關(guān)性則較低,那么每一類(lèi)變量實(shí)際上就代表了一個(gè)基本結(jié)構(gòu),即公共因子。對(duì)于所研究的問(wèn)題就是試圖用最少個(gè)數(shù)不可測(cè)的所謂公共因子的線性函數(shù)與特殊因子之和來(lái)描述原來(lái)觀測(cè)的每一分量。這樣能相對(duì)容易地以較少的幾個(gè)因子反映原資料的大部分信息,從而達(dá)到濃縮數(shù)據(jù),以小見(jiàn)大,抓住問(wèn)題本質(zhì)和核心的目的。
因子分析法的核心是對(duì)若干個(gè)綜合指標(biāo)進(jìn)行因子分析并提取公共因子,再以每個(gè)因子的方差貢獻(xiàn)率作為權(quán)數(shù)與該因子的得分乘數(shù)之和構(gòu)造得分函數(shù)。因子分析法的數(shù)學(xué)表示為:X=AF+B,即:
模型中,X=(x1,x2,x3,…,xp)是可觀測(cè)隨機(jī)向量,即原始觀測(cè)變量。
F=(f1,f2,…,fk)是X=(x1,x2,…,xp)的公共因子,即各個(gè)原觀測(cè)變量的表達(dá)式中共同出現(xiàn)的因子,是相互獨(dú)立的、不可觀測(cè)的理論變量。B=(β1,β2,…,βp)是X=(x1,x2,…,xp)的特殊因子,是不能被前k個(gè)公共因子包含的部分,這種因子也是不可觀測(cè)的。各特殊因子之間以及特殊因子與所有公共因子之間都是相互獨(dú)立的。
1.3 聚類(lèi)分析[3]
聚類(lèi)分析方法是按樣品(或變量)的數(shù)據(jù)特征把相似的樣品或(變量)傾向于分在同一類(lèi)中,把不相似的樣品(或變量)傾向于分在不同類(lèi)中。聚類(lèi)分析根據(jù)分類(lèi)對(duì)象不同分為Q型和R型聚類(lèi)分析。距離和相似系數(shù)這兩個(gè)概念反映了樣品(或變量)之間的相似程度。相似程度越高,一般兩個(gè)樣品之間的距離就越小。系統(tǒng)聚類(lèi)法是最常用的一種聚類(lèi)方法,常用的系統(tǒng)聚類(lèi)法有最短距離法、最長(zhǎng)距離法、中間距離法、類(lèi)平均法、重心法、離差平方和法、可變法、可變類(lèi)平均法等。在許多應(yīng)用中,類(lèi)平均法和離差平方和法的聚類(lèi)效果相對(duì)較好。
1.4 典型相關(guān)分析
典型相關(guān)分析(Canonical Calcorrelation Analysis)就是利用綜合變量對(duì)之間的相關(guān)關(guān)系來(lái)反映兩組指標(biāo)之間的整體相關(guān)性的多元統(tǒng)計(jì)分析方法。它的基本原理是:為了從總體上把握兩組指標(biāo)之間的相關(guān)關(guān)系,分別在兩組變量中提取有代表性的兩個(gè)綜合變量U1和V1(分別為兩個(gè)變量組中各變量的線性組合),利用這兩個(gè)綜合變量之間的相關(guān)關(guān)系來(lái)反映兩組指標(biāo)之間的整體相關(guān)性。
2.1 數(shù)據(jù)及變量情況
文中數(shù)據(jù)來(lái)源為某高校2014級(jí)學(xué)生2014-2015學(xué)年第一學(xué)期期末考試成績(jī)。數(shù)據(jù)真實(shí)可靠,其中有54 077個(gè)觀測(cè)數(shù)據(jù)和18個(gè)變量。
2.2 教師教學(xué)效果分析
文中以數(shù)學(xué)老師為例進(jìn)行分析。對(duì)原始數(shù)據(jù)進(jìn)行處理,其中x1~x12分別代表平均值、中位數(shù)、最高分、最低分、90分以上人數(shù)、80~90分人數(shù)、70~80分人數(shù)、60~70分人數(shù)、40~60分人數(shù)、40分以下人數(shù)、平均課時(shí)數(shù)及所教學(xué)生人數(shù)。
2.2.1 主成分分析
對(duì)經(jīng)過(guò)插補(bǔ)處理后的數(shù)據(jù)標(biāo)準(zhǔn)化[4-5],之后對(duì)數(shù)據(jù)進(jìn)行主成分分析。SAS程序如下:
proc princomp data=work.b
out=out1 outstat=stat1 prefix=z; /*對(duì)數(shù)據(jù)進(jìn)行主成分分析*/
var x1-x12;
run;
proc print data=out1;
title 'outpur:out1';
run;
表1 特征值、貢獻(xiàn)率、累計(jì)貢獻(xiàn)率
由累計(jì)貢獻(xiàn)率可知,只需要取前3個(gè)主成分即可。通過(guò)觀察可知第一主成分中各個(gè)變量的系數(shù)都為正值,且大小相差不多,我們認(rèn)為第一主成分值代表了對(duì)全部變量的一個(gè)綜合信息的呈現(xiàn)。其中,x6得分最多,說(shuō)明該教師所教學(xué)生綜合成績(jī)最好。主成分分析方法和計(jì)算方法如下:
第一主成分:
z1= 0.25x1+0.27x2+0.33x3+0.11x4+
0.39x5+0.4x6+0.3x7+0.15x8+
0.23x9+0.18x10+0.24x11+0.38x12
第二主成分:
z2= -0.458x1-0.425 3x2-0.214x3-
0.151 4x4-0.066x5-0.053 2x6+
0.200 7x7+0.481 1x8+0.146x9+
0.411 4x10+0.163x11+0.210 6x12
第二主成分的大小則主要取決于x1、x2、x8和x10,它們分別為平均值、中位數(shù)、60~70分成績(jī)的人數(shù)和成績(jī)?cè)?0分以下的人數(shù)。并且前兩個(gè)變量的系數(shù)為負(fù)值,當(dāng)平均值及中位數(shù)越高時(shí),第二主成分的值相對(duì)越低,而60~70分與40分以下的人數(shù)越多,第二主成分值越高,我們可以就此理解為這是一個(gè)負(fù)向相關(guān)的主成分,即平均成績(jī)?cè)降?、低分人?shù)越多時(shí),該名教師的第二主成分值越高。
第三主成分:
z3= -0.021 4x1-0.131 7x2-0.314x3+
0.564 5x4+0.139 4x5+0.154x6+
0.002 8x7+0.247 2x8+0.239 2x9-
0.312 2x10-0.533 3x11+0.145 7x12
第三主成分的大小通過(guò)觀察可知主要取決于x3、x4、x10和x11,它們分別為最高分、最低分、40分以下人數(shù)和平均課時(shí)數(shù)。當(dāng)最高分越低而最低分越高時(shí),第三主成分越高,這可以理解為該名教師所教學(xué)生的分?jǐn)?shù)差距較少。40分以下人數(shù)越少,第三主成分分?jǐn)?shù)越多這一點(diǎn)也可體現(xiàn)出當(dāng)學(xué)生成績(jī)主要分布于中等、學(xué)生高分和低分差距越不明顯,第三主成分得分越高,則可以將第三主成分看作是表明學(xué)生成績(jī)均勻程度的一個(gè)主成分。
在第一主成分中,得分越高說(shuō)明該教師所教學(xué)生綜合成績(jī)?cè)胶?,第二主成分得分越高說(shuō)明該教師所教學(xué)生平均成績(jī)低,低分學(xué)生多;第三主成分得分越高說(shuō)明該教師的學(xué)生成績(jī)水平越接近,班級(jí)總體成績(jī)?cè)骄鶆颉?/p>
2.2.2 因子分析
對(duì)標(biāo)準(zhǔn)化后的數(shù)學(xué)教師信息再進(jìn)行因子分析。文中使用的因子旋轉(zhuǎn)方法[6]是最大方差正交旋轉(zhuǎn)法。SAS程序如下:
proc factor data=b1 rotate=varimax reorder SCORE OUTSTAT=OUTF; /*進(jìn)行因子分析*/
var x1-x12;
run;
proc score data=b1 score = outf out= outs;
run;
proc sort data=outs;
by descending Factor1 ;run;
proc print data=outs;run;
表2 因子載荷表
旋轉(zhuǎn)后的因子載荷在通過(guò)最大方差正交旋轉(zhuǎn)后,得到了12個(gè)指標(biāo)在3個(gè)因子上的新的因子載荷。通過(guò)觀察可以看出,因子F1支配的指標(biāo)有x5、x6、x7、x8、x9和x12,它們代表的是各分?jǐn)?shù)段人數(shù)和總?cè)藬?shù),我們將它理解成成績(jī)分布因子,因子F2支配的指標(biāo)是x1、x2和x3,它代表的是平均成績(jī)因子;因子F3支配的指標(biāo)是x4、x10和x11。
表3 整理后因子得分排序
由整理出的因子得分排序表可以看出,4號(hào)教師的F1得分最高,意味著他的學(xué)生成績(jī)分布最均勻,其他老師按得分依次排列;7號(hào)教師的F2得分最高,這就意味著他所教學(xué)生的平均值中位數(shù)等指標(biāo)值最高,意味著他的學(xué)生總體平均成績(jī)最好;而對(duì)于F3,我們可以看出10號(hào)教師的得分值最高,也就意味著他的學(xué)生中低分成績(jī)的人數(shù)較多。
2.2.3 聚類(lèi)分析
對(duì)標(biāo)準(zhǔn)化后的教師信息數(shù)據(jù)進(jìn)行聚類(lèi)分析[7]。文中選取重心法和最小值法兩種方法同時(shí)進(jìn)行分析,并比較分析結(jié)果。聚類(lèi)分析SAS程序如下:
proc cluster data=b1 method=sin pseudo; /*進(jìn)行聚類(lèi)分析*/
id tno;
proc tree horizontal;
id tno;
proc cluster data=b1 method=cen pseudo;
id tno;
proc tree horizontal;
id tno;
run;
教師分類(lèi)兩種樹(shù)狀圖如圖1所示。
圖1 教師分類(lèi)兩種樹(shù)狀圖
由圖1可大致將數(shù)學(xué)老師分成3個(gè)類(lèi)別:第一類(lèi)是第1、3、5、9、11和12號(hào)教師,第二類(lèi)是第6、7和13號(hào)教師,最后一類(lèi)是第2、4、8和10號(hào)教師。
2.3 學(xué)生成績(jī)分析
2.3.1 對(duì)班級(jí)和科目進(jìn)行多因素的方差分析[8]
選取一個(gè)學(xué)院里考試科目相同的所有學(xué)生成績(jī),按照班級(jí)進(jìn)行分類(lèi)。由數(shù)據(jù)可知,我們選取了4個(gè)班級(jí)共計(jì)132人11科的考試成績(jī)。科目分別為:大學(xué)生計(jì)算機(jī)基礎(chǔ)、大學(xué)外語(yǔ)、高等數(shù)學(xué)、軍事技能訓(xùn)練、軍事理論、思想道德修養(yǎng)與法律基礎(chǔ)、體育、無(wú)機(jī)化學(xué)、無(wú)機(jī)實(shí)驗(yàn)、心理健康教育和學(xué)科概論。我們用x1~x11分別代表這11個(gè)學(xué)科。對(duì)數(shù)據(jù)進(jìn)行多因素的方差分析時(shí),選擇使用SAS軟件中的GLM過(guò)程步,在使用GLM過(guò)程進(jìn)行方差分析時(shí),各語(yǔ)句和ANOVA過(guò)程基本一致。
datayhuasheng; /*建立數(shù)據(jù)集*/
inputabgrade@@;
cards;
1 1 66
1 1 80
1 1 87
1 1 75
1 1 89
1 1 76
1 1 75
. . .
. . .
4 11 80
4 11 80
4 11 70
4 11 80
;
%macrocalc(xueyuan,am,bm); /*對(duì)數(shù)據(jù)進(jìn)行多因素方差分析*/
procglmdata=&xueyuan;
class&am&bm;
modelgrade=&am&bm;
run;
%mendcalc;
%letxueyuan=yhuasheng;
%letam=a;
%letbm=b;
%calc(yhuasheng,a,b)
表4 總體方差分析
表5 方差分析
因?yàn)榉讲罘治鯢=30.51,P<0.000 1,可見(jiàn)拒絕原假設(shè)H0,說(shuō)明模型具有統(tǒng)計(jì)意義。對(duì)于a,F(xiàn)=4.83,P=0.002 4,可見(jiàn)拒絕原假設(shè)H0,說(shuō)明不同班級(jí)對(duì)學(xué)生成績(jī)具有顯著性差異。對(duì)于b,F=38.21,P≤0.000 1,可見(jiàn)拒絕原假設(shè)H0,說(shuō)明不同科目對(duì)學(xué)生也具有顯著性的統(tǒng)計(jì)意義。可以看出,以班級(jí)學(xué)生的平均成績(jī)進(jìn)行方差分析時(shí),班級(jí)間的差異性并不明顯,只有對(duì)班級(jí)內(nèi)每個(gè)學(xué)生的成績(jī)進(jìn)行分析時(shí),才能看出班級(jí)間的顯著性差異,這說(shuō)明了學(xué)生個(gè)體間的差異性較大,平均成績(jī)不能完全代表這個(gè)班級(jí)的綜合信息。
2.3.2 對(duì)同一專(zhuān)業(yè)學(xué)生成績(jī)進(jìn)行因子分析
對(duì)班級(jí)內(nèi)學(xué)生成績(jī)進(jìn)行因子分析時(shí),選用的數(shù)據(jù)是某班級(jí)34名同學(xué)全部11科(科目同2.3.1)的成績(jī),共有374個(gè)數(shù)據(jù)。仍然用x1~x11分別代表這11個(gè)學(xué)科。程序[9]SAS如下:
%macrocalc(yxueyuan,hxueyuan,fm2,fm1407,fs1407,xm1,xm11); /*對(duì)數(shù)據(jù)進(jìn)行因子分析*/
procstandarddata=sasuser.&yxueyuan;
out=&hxueyuanmean=0std=1;
var&xm1-&xm11;
run;
procfactordata=&hxueyuanrotate=varimaxreorderSCOREOUTSTAT=out&fm2;
var&xm1-&xm11;
run;
procscoredata=&hxueyuanscore=out&fm1407out=out&sm1407;
run;
%mendcalc;
%letyxueyuan=yhuasheng;
%lethxueyuan=hhuasheng;
%letfm2=f2;
%letfm1407=f1407;
%letsm1407=s1407;
%letxm1=x1;
%letxm11=x11;
%calc(yhuasheng,hhuasheng,f2,f1407,s1407,x1,x11)
表6 特征值、貢獻(xiàn)率、累計(jì)貢獻(xiàn)率
因此,我們選取前4個(gè)因子進(jìn)行分析。輸出的因子載荷見(jiàn)表7, 通過(guò)觀察分析可以看出,因子F1支配的指標(biāo)有x1、x2、x3、x5、x8和x11,分別是大學(xué)生計(jì)算機(jī)基礎(chǔ)、大學(xué)外語(yǔ)、高等數(shù)學(xué)、軍事理論、無(wú)機(jī)化學(xué)和學(xué)科概論,它們是理論型課程,所以我們把F1稱(chēng)作是理論型因子;因子F2支配的指標(biāo)是x4和x9,分別是軍事技能訓(xùn)練和無(wú)機(jī)實(shí)驗(yàn),是需要?jiǎng)邮謱?shí)踐的兩門(mén)課程,因此,把F2稱(chēng)作是動(dòng)手能力因子;因子F3支配的指標(biāo)是x7和x10,分別是體育和心理健康教育,他們都是個(gè)人綜合素質(zhì)層面上的指標(biāo),所以我們認(rèn)為F3是個(gè)人綜合因子;因子F4支配的是x11,代表的是思想道德修養(yǎng)和法律基礎(chǔ),它代表的是政治思想因子。
表7 因子載荷表
由整理出的因子得分排序表可以看出,F(xiàn)1得分高低意味著理論型課程成績(jī)的好壞;F2得分的高低意味著動(dòng)手實(shí)踐能力的強(qiáng)弱;F3得分的高低代表著個(gè)人綜合的身心素質(zhì)的高低;F4得分的高低代表著政治思想的高低。
2.3.3 對(duì)學(xué)科間相關(guān)性進(jìn)行典型相關(guān)分析[10]
從實(shí)際角度出發(fā),我們知道不同專(zhuān)業(yè)的學(xué)生所學(xué)基礎(chǔ)課程是大體相同的,但所學(xué)專(zhuān)業(yè)知識(shí)不盡相同。有些同學(xué)喜歡專(zhuān)業(yè)知識(shí),有的同學(xué)卻對(duì)基礎(chǔ)性理論知識(shí)感興趣。于是,針對(duì)同一專(zhuān)業(yè)的學(xué)生進(jìn)行專(zhuān)業(yè)學(xué)科與基礎(chǔ)學(xué)科成績(jī)的典型相關(guān)分析,來(lái)判斷兩種性質(zhì)的學(xué)科間是否存在某些相關(guān)性。
選取某年級(jí)4個(gè)班的132名學(xué)生成績(jī)進(jìn)行分析,其中專(zhuān)業(yè)課為:無(wú)機(jī)化學(xué)x8、無(wú)機(jī)實(shí)驗(yàn)x9和學(xué)科概論x11;公共課為:大學(xué)生計(jì)算機(jī)基礎(chǔ)x1、大學(xué)外語(yǔ)x2、高等數(shù)學(xué)x3、軍事技能訓(xùn)練x4、軍事理論x5、思想道德修養(yǎng)與法律基礎(chǔ)x6、體育x7和心理健康教育x10。
我們對(duì)4個(gè)班的總成績(jī)進(jìn)行典型相關(guān)分析。其中變量x8、x9和x11一組,其余變量為一組。SAS程序[11]如下:
%macro calc(dxueyuan,dgonggong,dzhuanye); /*對(duì)數(shù)據(jù)進(jìn)行典型相關(guān)分析*/
proc cancorr all data=sasuser.&dxueyuan
vprefix=&dgonggong vname='公共課'
wprefix=&dzhuanye vname='專(zhuān)業(yè)課';
var x1-x7 x10;
with x8 x9 x11;
run;
%mend calc;
%let dxueyuan=dhuasheng;
%let dgonggong=gonggong;
%let dzhuanye=zhuanye;
%calc(dhuasheng,gonggong,zhuanye)
表8 均值和標(biāo)準(zhǔn)偏差
表9 兩組變量間的相關(guān)系數(shù)表
表10 典型變量檢驗(yàn)表
由表8和表9給出了兩組課程變量的基本信息之間的相關(guān)系數(shù),可以粗略看出,這些課程之間有著不同程度的相關(guān)性。表10給出了兩組課程變量的典型相關(guān)系數(shù)。 第一對(duì)典型相關(guān)系數(shù)達(dá)到0.738 9,可見(jiàn)公共課和專(zhuān)業(yè)基礎(chǔ)課之間的相關(guān)系數(shù)很大。表11輸出結(jié)果顯示3對(duì)特征值所占方差信息量的比例分別是0.839 3、0.109 0和0.051 7,通過(guò)假設(shè)檢驗(yàn)的p值,我們也可以看出前兩對(duì)典型變量均是顯著的。選取前兩對(duì)典型變量。
表11 典型相關(guān)分析貢獻(xiàn)率表
4種檢驗(yàn)方法對(duì)各典型相關(guān)系數(shù)為零的假設(shè)檢驗(yàn),可以看出4種檢驗(yàn)方法均通過(guò)。見(jiàn)表12。
表12 4種檢驗(yàn)方法
表13 公共課組典型系數(shù)
表14 專(zhuān)業(yè)課組典型系數(shù)表
通過(guò)表13和表14可以看出,不論是公共課的8個(gè)變量還是專(zhuān)業(yè)課的3個(gè)變量與第一典型變量的相關(guān)系數(shù)皆為正。
公共課典型相關(guān)表與專(zhuān)業(yè)課典型相關(guān)表分別見(jiàn)表15和表16。
表15 公共課典型相關(guān)表
表16 專(zhuān)業(yè)課典型相關(guān)表
由表15和表16可知,在公共課組變量的組內(nèi)變異表示第一典型變量能解釋變量組0.245 1的組內(nèi)變異;而表示來(lái)自第二個(gè)組的第一典型變量可以解釋第一個(gè)組0.133 8的組內(nèi)變異。對(duì)于專(zhuān)業(yè)課組,它們的組內(nèi)變異表示第一典型變量能解釋變量組0.373 5的組內(nèi)變異;還表示來(lái)自第一個(gè)組的第一典型變量可以解釋第二個(gè)組的0.204的組內(nèi)變異。
可以從相關(guān)系數(shù)的角度解釋典型變量,見(jiàn)表17。
表17 原始變量與典型變量的樣本相關(guān)系數(shù)表
根據(jù)表17典型相關(guān)系數(shù),公共1主要代表了學(xué)生的大學(xué)外語(yǔ)和高等數(shù)學(xué)兩個(gè)變量,其他的變量顯得并不是那么重要,而專(zhuān)業(yè)1主要是代表了學(xué)生的無(wú)機(jī)化學(xué)這個(gè)變量。無(wú)機(jī)化學(xué)變量與第一典型變量公共1有著很大的聯(lián)系。故公共1可以解釋為專(zhuān)業(yè)基礎(chǔ)變量。這與基于典型系數(shù)的解釋基本相一致。而專(zhuān)業(yè)1主要代表了無(wú)機(jī)化學(xué)變量,專(zhuān)業(yè)1主要解釋了基礎(chǔ)公共課外語(yǔ)和數(shù)學(xué)對(duì)無(wú)機(jī)化學(xué)的影響。這與基于典型系數(shù)的解釋基本一致??梢?jiàn)專(zhuān)業(yè)課和公共基礎(chǔ)課之間有一定程序的相關(guān)性。
通過(guò)實(shí)證分析,利用SAS軟件對(duì)數(shù)據(jù)進(jìn)行分析,對(duì)教師教學(xué)效果評(píng)價(jià)提供了有利的思路和工具;也減少對(duì)學(xué)生綜合評(píng)價(jià)的主觀因素,以客觀的方式來(lái)了解學(xué)生的綜合成績(jī),為教師有針對(duì)性地指導(dǎo)學(xué)生,真正實(shí)施因材施教提供理論指導(dǎo)。
[1] 朱琳,閆霏霏.基于SAS的高校學(xué)生成績(jī)抽樣及統(tǒng)計(jì)推斷:以東華理工大學(xué)期末試卷抽樣為例[J].東華理工大學(xué)學(xué)報(bào):社會(huì)科學(xué)版2015,34(3):280-283.
[2] 王學(xué)民.應(yīng)用多元分析[M].3版.上海:上海財(cái)經(jīng)大學(xué)出版社,2009.
[3] 王純杰,李群,董小剛,等.基于K-均值聚類(lèi)的多值有序Logistic回歸模型在信用卡信用評(píng)級(jí)中的應(yīng)用研究[J].吉林師范大學(xué)學(xué)報(bào):自然科學(xué)版,2016,37(3):72-81.
[4] 馬燕.主成分分析法在學(xué)生成績(jī)?cè)u(píng)價(jià)中的應(yīng)用[J].樂(lè)山師范學(xué)院學(xué)報(bào),2007,24(1):131-133.
[5] 汪海波,羅莉.SAS統(tǒng)計(jì)分析與應(yīng)用從入門(mén)到精通[M].北京:人民郵電出版社,2013.
[6] 黃培麗.多元統(tǒng)計(jì)在高校學(xué)生成績(jī)統(tǒng)計(jì)分析中的應(yīng)用研究[D].西安:西安建筑科技大學(xué),2013.
[7] 譚慶.基于K-means聚類(lèi)算法的試卷成績(jī)分析研究[J].河南大學(xué)學(xué)報(bào):自然科學(xué)版,2009,39(4):412-415.
[8] 張瓊.利用SAS軟件包對(duì)學(xué)生的考試成績(jī)做統(tǒng)計(jì)分析[J].成功(教育),2011(12):204.
[9] 姚鑫鋒,王薇.SAS統(tǒng)計(jì)分析實(shí)用寶典[M].北京:清華大學(xué)出版社,2013.
[10]KuiyuanLi,JosaphatUvah,RaidAmin.PredictingStudents’PerformanceinElementsofStatistics[C]//US-ChinaEducationReviewA10,2012:875-884.
[11] 劉洪亮,汪明杰.SAS軟件在學(xué)生成績(jī)相關(guān)性分析中的應(yīng)用[J].林區(qū)教學(xué),2012(4):16-18.
SAS statistical analysis for college student achievements and teaching effect
DONG Xiaogang, TONG Zhizhen, WANG Chunjie*, LI Chunjing, ZHANG Qianqian
(School of Basic Sciences, Changchun University of Technology, Changchun 130012, China)
Taking the student’s final examination results from a college in different major at same semester as references, the multivariate statistical method is used, with SAS macro program, to batch process the examination results and evaluate the teaching effect.
principal component analysis; factor analysis; cluster analysis; canonical correlation analysis; SAS.
2017-02-15
高等學(xué)校大學(xué)數(shù)學(xué)教學(xué)研究與發(fā)展中心項(xiàng)目(2014); 吉林省高等教育教學(xué)改革研究課題(2015); 吉林省教育廳十三五科學(xué)技術(shù)研究項(xiàng)目(吉教科合字[2016]第316號(hào))
董小剛(1961-),男,漢族,吉林長(zhǎng)春人,長(zhǎng)春工業(yè)大學(xué)教授,博士,主要從事數(shù)理統(tǒng)計(jì)方向研究,E-mail:dongxiaogang@ccut.edu.cn. *通訊作者:王純杰(1978-),女,漢族,遼寧遼陽(yáng)人,長(zhǎng)春工業(yè)大學(xué)副教授,博士,主要從事統(tǒng)計(jì)學(xué)和教學(xué)方法研究,E-mail:wangchunjie@ccut.edu.cn.
10.15923/j.cnki.cn22-1382/t.2017.3.01
O 213.9
A
1674-1374(2017)03-0209-09