湯鳳香, 方秀男, 康兆敏, 楊文泉, 李 東
(佳木斯大學理學院,黑龍江 佳木斯 154007)
學生成績的評價問題一直是人們關注的焦點問題,即使是在大力提倡素質教育、人文教育的當下,學生成績的高低仍然是衡量一個學生優(yōu)劣的最直接的評價依據(jù),因此如何根據(jù)學生的實際成績盡可能客觀、公平的評價學生,就顯得尤為重要。從目前的實際情況看,學生的總成績或是平均成績,仍然在學生的成績評價中占有重要的地位。此外,也有一些文獻提出了學生成績評價的方法,如層次分析法,主成分分析法,灰色預測法和模糊綜合評價法等[1-5]。文獻[6-7]是研究學生成績綜合評價問題的比較新的研究成果,其中[6]將權重分析與秩和比評價法相結合,在綜合考慮分數(shù)與排名的基礎上對學生成績進行了綜合評價;文獻 [7]對各個影響因素進行主成分分析從而確定指標權重,基于成績排名得到主成分得分,進而對學生成績進行了綜合評價。本文旨在文獻[6-7]的研究基礎上,嘗試利用系統(tǒng)聚類分析的方法,對學生成績評價做進一步的分析,并對不同方法得到的結果進行比較研究。 從已有的研究成果看,采用系統(tǒng)聚類法研究綜合成績評價的文獻較少[8]。
數(shù)據(jù)來自于某中學學生9門課程的成績,學生總人數(shù)1383人,其中一部分數(shù)據(jù)見下表:
表1 學生成績部分數(shù)據(jù)
利用MATLAB軟件,并以前20個樣本為例,打算分成六類,分別采用最短距離法、最遠距離法、類平均法、重心法以及ward法等五種系統(tǒng)聚類方法得到如下分類結果:
從表中分類結果看,各個方法的分類結果有較大差異,從而對于分類決策造成一定困難。為此,對五種分類結果的相關性做進一步的研究,采用SPSS分析五種結果的相關性得到:
從結果可以看出,類平均法和其他幾種方法相關性較好,其中類平均法和最短距離法有最好的相關性0.681,且顯著性較強。除類平均法以外,其他幾種方法之間的相關性很差。因而,最短距離法與類平均法的結果在某種意義上可以互相借鑒,并可以確定使用類平均法進行聚類分析。
利用分類的方法對樣本進行評價研究時,分得類過少或者過多都有各自的弊端,這里不再贅述。那么將樣本分成多少類合適?本文采用統(tǒng)計學當中的F檢驗方法,構建如下的統(tǒng)計量[9]:
其中u1,u2,…,un為n個樣本,ui=(xi1,xi2,…,xim)含有m個指標,另外記
可以看到,類別從2類到10,分6類較合適,因F值從大到小然后到11.584第一次出現(xiàn)上升,然后又遞減。而前面的2類和3類F值雖高,但類太少,因此確定最佳分類的方式即為F值遞減后第一次出現(xiàn)上升趨勢的值所對應的類數(shù)。
從2.1中的結果可以看出,不同的聚類分析方法得到的結果是有差異的,而通常將不同的結果作為更多可能性的一種參考,但從實際最終決策的角度來說,更傾向于“少數(shù)服從多數(shù)”的原則。從五種方法的相關性分析結果來看,最短距離聚類和類平均聚類的結果是可以作為決策參考的。根據(jù)表2對比兩個結果,第2、5、16、17個樣本作為少數(shù)樣本單獨分類,單獨比較這幾個樣本與其他樣本的差距是不理想的,這里從幾個類的聚類中心出發(fā)進行比較。以類平均法聚類為例,各類的聚類中心如下:
表2 五種聚類分類結果
表3 五種聚類結果的相關性
表4 類平均法各分類F值
表5 類平均法各類的聚類中心
首先,選擇的前20個樣本的總成績相差不大,因此如果單從總成績來對他們進行分類是不恰當?shù)?,因為他們都很?yōu)秀,這一點從科總平均分差距不大得以驗證。其次,第1個類別的學生人數(shù)較多達到了9名,因此第1類的類平均分與總體平均分非常接近,反映了這個總體的平均水平。最后,如何通過分類結果對成績分布的特點進行發(fā)掘與說明?這一點可以從某一科目的平均成績在不同的類當中是否變化明顯得出一定的結論,例如以生物科目為例,其在第4類的分數(shù)為74分,明顯低于其他類的分數(shù),因此,可以初步認定第4類學生生物科目的成績相對較弱。與之對應的,第3類學生地理科目的成績明顯高于其他類,因此初步判斷第3類學生的地理成績不俗。
對于學生的評價,單從分數(shù)上論顯然是不全面的,例如考慮某種極端情形
學生科1科2科3科4科513010010010010029090909090
顯然單從成績上來看,學生2的總分要高,但是學生1的四門課程均為滿分。如果從某入學門檻來看,學生1單門課程不及格,極有可能導致這樣的人被拒之門外,這是符合規(guī)則但是又不符合人才培養(yǎng)的常理的。研究希望為類似的選拔機制提供一個借鑒,根本目的是希望人才的選拔更加全面一些,減少因錯過未來的人才而造成的損失。