繆盾
【摘 要】考試是一種重要的、常用的教育測(cè)量手段,在高校中被廣泛使用。如何合理的看待學(xué)生考試成績(jī)與能力的關(guān)系,是幫助學(xué)生了解自己不足,明確努力方向的關(guān)鍵,也是學(xué)生就業(yè)方向選擇和創(chuàng)業(yè)的判別依據(jù)。通過主成分分析的方法對(duì)大量考試數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,找出評(píng)價(jià)的綜合指標(biāo),保留原始變量的主要信息,使我們?cè)谠u(píng)價(jià)學(xué)生的能力時(shí)能夠抓住主要方面。
【關(guān)鍵詞】考試成績(jī);主成分分析;相關(guān)性
中圖分類號(hào): R95 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào):2095-2457(2018)04-0011-003
Research on Correlation between Test Score and Ability Based on Principal Component Analysis
MIAO Dun
(Zhejiang University, Tongji University, Jiaxing, Zhejiang 314051, China)
【Abstract】Examination is an important and commonly used measure of education and is widely used in colleges and universities. How to reasonably treat the relationship between students test scores and abilities is the key to help students understand their own shortcomings and make clear the direction of their efforts. It is also the basis for the selection of students employment orientation and entrepreneurial basis. Through the method of principal component analysis, data mining is performed on a large number of test data to find comprehensive indicators for evaluation, and the main information of the original variables is preserved, so that we can grasp the main aspects when evaluating students abilities.
【Key words】Test scores; Principal component analysis; Correlation
0 引言
考試作為一種常規(guī)性的評(píng)價(jià)手段,是用來評(píng)估教與學(xué)質(zhì)量和水平的重要方法,且貫穿于學(xué)生求學(xué)的各個(gè)階段節(jié)點(diǎn)上。尤其在高校,一門課程的考試就意味著這門課程的終結(jié),考試成績(jī)與學(xué)生能力的關(guān)系被簡(jiǎn)單的賦予正相關(guān)的關(guān)系,即考試成績(jī)高,則認(rèn)為學(xué)生能力高,導(dǎo)致學(xué)生、家長(zhǎng)甚至是教師都一味的追求高分,卻忽略了高分背后是否真正體現(xiàn)了高能??荚嚹芰Σ淮韺W(xué)生真正的專業(yè)能力和學(xué)業(yè)能力,因此如何合理看待學(xué)生考試成績(jī)與能力的關(guān)系,是學(xué)生明晰自身能力偏向,擇業(yè)方向的關(guān)鍵,也是教師綜合評(píng)價(jià)學(xué)生能力,潛力和個(gè)性化教學(xué)的判別依據(jù)。
1 主成分分析法
高校學(xué)生的考試成績(jī)數(shù)據(jù)量龐大,每個(gè)個(gè)體又由很多元數(shù)據(jù)組成,個(gè)體數(shù)據(jù)和群體數(shù)據(jù)又存在復(fù)雜的聯(lián)系,給分析帶來了很大的不便。采用目前主流的統(tǒng)計(jì)分析方法—主成分分析法,借助計(jì)算機(jī)快速處理信息數(shù)據(jù),能較為客觀地透過數(shù)據(jù)表象看到數(shù)據(jù)背后的內(nèi)容。
1.1 方法概述
主成分分析法(Principal component analysis,簡(jiǎn)稱PCA)首先是Hotelling在1933年提出的。主成分分析法是一種利用數(shù)學(xué)思想達(dá)到降低維數(shù)的統(tǒng)計(jì)方法[1],即把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo)(即主成分),使每個(gè)主成分能夠反映原始變量的大部分信息,這種方法在引進(jìn)多方面變量的同時(shí)將復(fù)雜因素歸結(jié)為幾個(gè)主成分,使問題簡(jiǎn)單化,同時(shí)得到的結(jié)果更加科學(xué)有效反映全部數(shù)據(jù)的信息[2]。
1.2 主成分分析步驟
設(shè)研究某一事物涉及到p個(gè)分量,每個(gè)變量都有n個(gè)數(shù)據(jù),可以得到一個(gè)n×p階的矩陣,將其記為公式(1)[3]:X=[x(1)
其中i=1,2,…,n;j=1,2,…,p。
(1)對(duì)矩陣進(jìn)行標(biāo)準(zhǔn)化處理,見公式(2)[3]:
其中xj=,則原始矩陣計(jì)算后得到的標(biāo)準(zhǔn)化矩陣為:
(2)求得標(biāo)準(zhǔn)化后矩陣的相關(guān)系數(shù)矩陣,見公式(4):rij=,j,k=1,2,…,p(4)
(3)求得相關(guān)系數(shù)矩陣R的特征值[λi]和相應(yīng)的特征向量。
2 考試成績(jī)主成分分析
選取某大學(xué)2013級(jí)土木工程專業(yè)122名學(xué)生的15門專業(yè)課考試成績(jī)?yōu)榉治鰳颖?,將其各科成?jī)作為變量,生成122*15的矩陣,部分?jǐn)?shù)據(jù)如圖1所示:
將課程變量用代碼表示,如表1所示:
每位學(xué)生的學(xué)業(yè)成績(jī)?yōu)閙i=[X1i,X2i,…,X15i],其中i∈[1,122]。得到考試成績(jī)?cè)季仃嘪=,通過對(duì)樣本相關(guān)陣的內(nèi)部結(jié)構(gòu)關(guān)系的研究,找出影響學(xué)生成績(jī)的綜合指標(biāo),使綜合指標(biāo)為原變量的線形組合。綜合指標(biāo)不僅保留了原始變量的主要信息,彼此之間又不相關(guān),比原始變量具有一些更優(yōu)越的性質(zhì),使我們?cè)谠u(píng)價(jià)學(xué)生的能力時(shí)能夠抓住主要方面。標(biāo)準(zhǔn)化矩陣并計(jì)算樣本相關(guān)系數(shù),求得矩陣的特征值和貢獻(xiàn)率,如表2所示:
通過表2可以發(fā)現(xiàn)前四個(gè)主成分的貢獻(xiàn)值對(duì)最終結(jié)果的影響較大,因此本文選取累計(jì)貢獻(xiàn)率達(dá)到70%為閾值,選擇前四個(gè)主成分變量代替原始的15個(gè)變量。求得前四個(gè)主成分對(duì)應(yīng)的特征向量如下表3所示:
將每個(gè)學(xué)生的相應(yīng)科目成績(jī)代入上式,可以計(jì)算得到四個(gè)主成分值,第一主成分各個(gè)變量的系數(shù)均為正值,且相差不大,可以認(rèn)為第一主成分值代表了學(xué)生的綜合實(shí)力。
第二主成分中,在X7,X9-X13,X15幾個(gè)變量的系數(shù)出現(xiàn)負(fù)數(shù),即變量所代表的課程建筑施工,混凝土結(jié)構(gòu)設(shè)計(jì)原理,基礎(chǔ)工程設(shè)計(jì)等課程的成績(jī)低,則F2值高,這些課程均為專業(yè)課,因此可以認(rèn)為F2值高代表了學(xué)生的專業(yè)基礎(chǔ)扎實(shí),但是專業(yè)能力還比較弱。
第三主成分F3中,工程制圖,結(jié)構(gòu)力學(xué),氣體結(jié)構(gòu),建筑施工,建筑設(shè)備五門課程變量的系數(shù)為負(fù)值,成績(jī)?cè)降?,此分量的值越高,而混凝土結(jié)構(gòu)設(shè)計(jì),基礎(chǔ)工程設(shè)計(jì)和鋼結(jié)構(gòu)設(shè)計(jì)三個(gè)變量與F3是正相關(guān)的,說明得分高的學(xué)生能力偏重設(shè)計(jì),而施工能力偏弱。
第四主成分F4中,結(jié)構(gòu)力學(xué),砌體結(jié)構(gòu),混凝土結(jié)構(gòu)設(shè)計(jì)基本原理,建筑設(shè)備,地下工程,基礎(chǔ)工程設(shè)計(jì),建筑鋼結(jié)構(gòu)設(shè)計(jì)七門課程變量的系數(shù)為負(fù)值,當(dāng)學(xué)生這七門課程成績(jī)偏低,F(xiàn)4值則高,第四主成分中系數(shù)為正的系數(shù)較高的變量有工程制圖,建筑施工和建筑工程法規(guī),說明F4主成分的值主要體現(xiàn)了學(xué)生的識(shí)圖施工實(shí)操能力,但所體現(xiàn)的設(shè)計(jì)計(jì)算能力偏弱,所以通過F4主成分排序后可建議得分高的學(xué)生往施工方向就業(yè)。
3 結(jié)論
在高校,學(xué)生和教師都要理性的看待考試成績(jī),通過先進(jìn)的統(tǒng)計(jì)方法,挖掘考試成績(jī)[5]中隱含的意思。本文采用了主成分分析的方法,評(píng)價(jià)了畢業(yè)班學(xué)生的綜合能力,從第二、第三、第四主成分計(jì)算值中可以了解到學(xué)生在專業(yè)能力上的偏向,對(duì)學(xué)生擇業(yè)或創(chuàng)業(yè),繼續(xù)深造中的方向選擇,發(fā)揮優(yōu)勢(shì),彌補(bǔ)劣勢(shì)提供了判別的依據(jù),為教師開展針對(duì)性的教學(xué)改革,課程改革和分層教育提供了依據(jù)。
【參考文獻(xiàn)】
[1]劉佳佳,劉志杰.基于MATLAB的考試數(shù)據(jù)主成分分析[J].電腦知識(shí)與技術(shù),2015,11(1):10-14.
[2]劉天華.技術(shù)視角下的高??荚嚫母锾轿鯷J].教育探索,2016,23(12):69-71.
[3]張超,彭道黎.基于PCA-RBF神經(jīng)網(wǎng)絡(luò)的森林碳儲(chǔ)量遙感反演模型研究[J].中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2012.57(4):148-153.
[4]李瑞琴.主成分分析在學(xué)生成績(jī)綜合評(píng)定中的應(yīng)用[J].開放教育研究,2003,44(4):49-51.
[5]李真,廖興.基于大學(xué)生考試成績(jī)相關(guān)性分析-以四川大學(xué)錦城學(xué)院工業(yè)工程專業(yè)為例[J].技術(shù)與市場(chǎng),2017,24(4):260-261+262.