【摘要】本文以重慶市某理工高校的某專(zhuān)業(yè)的學(xué)生畢業(yè)情況為例,根據(jù)成績(jī)將學(xué)生進(jìn)行相應(yīng)的分類(lèi),尋找每一類(lèi)學(xué)生的學(xué)習(xí)成績(jī)的特征.學(xué)??梢愿鶕?jù)學(xué)生的狀況和社會(huì)的需求調(diào)整課程的設(shè)置,構(gòu)建分層培養(yǎng)的一個(gè)動(dòng)態(tài)系統(tǒng),實(shí)現(xiàn)菜單式的培養(yǎng)模式,增加高等教育培養(yǎng)模式中的柔性。文中提出了一種基于多元統(tǒng)計(jì)分析的高校學(xué)生分層培養(yǎng)模型。根據(jù)學(xué)生的畢業(yè)情況,以在校期間成績(jī)?yōu)橹笜?biāo),采用層次聚類(lèi)方法把學(xué)生分為三類(lèi),得出三個(gè)大類(lèi)學(xué)生的成績(jī)特征。
【關(guān)鍵詞】高校學(xué)生成績(jī);層次培養(yǎng);多元統(tǒng)計(jì)方法;聚類(lèi)
1 問(wèn)題提出
隨著教育工作,尤其是高等教育倍受廣大民眾、政府機(jī)構(gòu)以及各級(jí)媒體的重視,現(xiàn)在很多的高校越來(lái)越重視學(xué)生成績(jī)管理工作。這就要求學(xué)校更好的,更全面的了解學(xué)生當(dāng)前的學(xué)習(xí)情況,還要了解學(xué)生將來(lái)成績(jī)的某些趨勢(shì),以便學(xué)校更有效,更合理的對(duì)在校學(xué)生進(jìn)行分層培養(yǎng)。本文提出用多元統(tǒng)計(jì)的分析方法對(duì)已畢業(yè)的某屆學(xué)生歷年成績(jī)和畢業(yè)情況的相關(guān)數(shù)據(jù)進(jìn)行較為全面的分析研究,進(jìn)行聚類(lèi)分析將學(xué)生分類(lèi)研究學(xué)生成績(jī)呈現(xiàn)的特征,深入研究高校學(xué)生真實(shí)的學(xué)習(xí)情況,并且通過(guò)分析,了解到學(xué)生的當(dāng)前的學(xué)習(xí)定位和將來(lái)的發(fā)展傾向。
2 數(shù)據(jù)收集與處理
2.1數(shù)據(jù)來(lái)源
本文采用的數(shù)據(jù)來(lái)源于重慶某理工類(lèi)高校數(shù)學(xué)專(zhuān)業(yè)學(xué)生本科期間四年的各科成績(jī)和畢業(yè)設(shè)計(jì)完成情況,畢業(yè)實(shí)習(xí)表現(xiàn)情況以及就業(yè)單位情況。
2.2數(shù)據(jù)處理
原始數(shù)據(jù)包括40多個(gè)變量(即40多個(gè)課程),其中多個(gè)變量存在明顯的相關(guān)性,還有各變量的權(quán)重是不同的。由于這些情況,在根據(jù)這些變量進(jìn)行聚類(lèi)時(shí)可能會(huì)使得運(yùn)算結(jié)果失真。所以首先要對(duì)數(shù)據(jù)整理和一些必要的處理。處理如下:
(1)根據(jù)課程培養(yǎng)計(jì)劃,課程劃分為五大類(lèi),分別記為:A專(zhuān)業(yè)基礎(chǔ)課,B專(zhuān)業(yè)平臺(tái)課,C金融方向課,D計(jì)算方向課,E公共基礎(chǔ)課。這樣既能夠有效地壓縮指標(biāo)數(shù)量還可以減弱各項(xiàng)變量的共線性。
(2)根據(jù)各個(gè)變量的不同的權(quán)重(即學(xué)分),將各科的成績(jī)進(jìn)行權(quán)重處理,得到新的成績(jī)數(shù)據(jù)。
3聚類(lèi)分析過(guò)程
3.1聚類(lèi)軟件、指標(biāo)、類(lèi)型的選擇
聚類(lèi)分析利用的軟件是SPSS統(tǒng)計(jì)軟件;分析對(duì)象是對(duì)學(xué)生(即樣本)進(jìn)行聚類(lèi);分析數(shù)據(jù)是五個(gè)指標(biāo),分別是專(zhuān)業(yè)基礎(chǔ)課,專(zhuān)業(yè)平臺(tái)課,金融方向課,計(jì)算方向課,公共基礎(chǔ)課。利用SPSS層次聚類(lèi)方法中的Q型聚類(lèi)對(duì)學(xué)生進(jìn)行分類(lèi)分析,其中將平方歐式距離作為聚類(lèi)分析的個(gè)體距離,平均組間連鎖距離作為類(lèi)間距離。
3.2聚類(lèi)結(jié)果
通過(guò)SPSS軟件,聚類(lèi)運(yùn)算得到層次聚類(lèi)分析中的凝聚狀態(tài)表(見(jiàn)表2)。
情況說(shuō)明:
第一列說(shuō)明聚類(lèi)分析過(guò)程中第幾步;第二、三列反映在該步分析中其中有哪兩個(gè)樣本(這里指學(xué)生)或是小類(lèi)合成一大類(lèi);系數(shù)則表示距離,可能是樣本間距離,也可能是小類(lèi)之間的距離;第五、六列則說(shuō)明參與該步聚類(lèi)的兩個(gè)元素是樣本(即單個(gè)學(xué)生)還是小類(lèi)(即已經(jīng)合為一類(lèi)的學(xué)生組),這里的0和自然數(shù)x分別表示樣本和第x步新和成的小類(lèi);最后一列反映該次聚類(lèi)的結(jié)果會(huì)出現(xiàn)在下面的哪一步。
凝聚狀態(tài)表反映的是聚類(lèi)分析的動(dòng)態(tài)過(guò)程,能夠通過(guò)表內(nèi)容了解41個(gè)樣本變量(即學(xué)生)是如何逐步的成和小類(lèi),再有若干小類(lèi)合成最終的幾個(gè)大類(lèi);而層次聚類(lèi)分析中的類(lèi)成員,則是反映聚類(lèi)分析最終的結(jié)果,根據(jù)軟件操作步驟,可以控制最后聚類(lèi)的個(gè)數(shù)范圍,本次聚類(lèi)是將聚類(lèi)個(gè)數(shù)控制在3至5個(gè)。
Q型聚類(lèi)分析操作中,在”繪圖”選項(xiàng)欄選定”樹(shù)狀圖”,從而還可以得到更加直觀、形象的聚類(lèi)結(jié)果效果圖——樹(shù)狀圖(見(jiàn)圖1)。
表1凝聚狀態(tài)表
Table1condensed state table
* * * * * * H I E R A R C H I C A LC L U S T E R A N A L Y S I S * * * * * *
Dendrogram using Average Linkage(Between Groups)
Rescaled Distance Cluster Combine
圖1 41個(gè)學(xué)生層次聚類(lèi)分析結(jié)果
Table 141 students hierarchical cluster analysis results
3.3對(duì)聚類(lèi)結(jié)果的分析和解釋
經(jīng)過(guò)聚類(lèi)分析將該專(zhuān)業(yè)學(xué)生分了為3至5類(lèi),結(jié)合他們實(shí)際的畢業(yè)情況分析聚類(lèi)的結(jié)果:
分析一:以5群列列情況下的聚類(lèi)結(jié)果,此次聚類(lèi)方法將41個(gè)學(xué)生分為了五大類(lèi)如下表(見(jiàn)表2):
表 2 5群列情況下的聚類(lèi)結(jié)果
Table 4 clustering results of 5 series case
類(lèi)別第一大類(lèi)第二大類(lèi)第三大類(lèi)第四大類(lèi)第五大類(lèi)
學(xué)生代碼學(xué)生1學(xué)生2學(xué)生3學(xué)生26學(xué)生11學(xué)生18
學(xué)生8學(xué)生4學(xué)生5學(xué)生27
學(xué)生12學(xué)生6學(xué)生7學(xué)生28
學(xué)生13學(xué)生10學(xué)生9學(xué)生29
學(xué)生24學(xué)生16學(xué)生14學(xué)生30
學(xué)生32學(xué)生17學(xué)生15學(xué)生31
學(xué)生36學(xué)生22學(xué)生19學(xué)生34
學(xué)生40學(xué)生38學(xué)生20學(xué)生35
學(xué)生39學(xué)生21學(xué)生33
學(xué)生23學(xué)生37
學(xué)生25學(xué)生41
計(jì)數(shù)892211
實(shí)際的情況也根據(jù)他們的畢業(yè)情況劃分了五類(lèi),結(jié)合原始數(shù)據(jù)分析,此次聚類(lèi)結(jié)果,盡管也是將畢業(yè)生分出了五大類(lèi)型,不過(guò)每一類(lèi)的組合人數(shù)與實(shí)際情況有偏差。
分析二:上面對(duì)聚類(lèi)5群列分類(lèi)情況進(jìn)行了分析,并將聚類(lèi)結(jié)果數(shù)據(jù)與實(shí)際情況對(duì)比,盡管部分體現(xiàn)和反映了實(shí)際的畢業(yè)情況,但還明顯看到聚類(lèi)結(jié)果具有生偏差性和不準(zhǔn)確性。現(xiàn)在再對(duì)聚類(lèi)3群列分類(lèi)情況進(jìn)行分析,此次聚類(lèi)方法將41個(gè)學(xué)生劃分為了三大類(lèi)如下表(見(jiàn)表3):
表 3 3群列情況下的聚類(lèi)結(jié)果
Table5 clustering results of 3 series case
類(lèi)別第一大類(lèi)第二大類(lèi)第三大類(lèi)
學(xué)生代碼學(xué)生1學(xué)生2學(xué)生3學(xué)生26
學(xué)生8學(xué)生4學(xué)生5學(xué)生27
學(xué)生11學(xué)生6學(xué)生7學(xué)生28
學(xué)生12學(xué)生10學(xué)生9學(xué)生29
學(xué)生13學(xué)生16學(xué)生14學(xué)生30
學(xué)生18學(xué)生17學(xué)生15學(xué)生31
學(xué)生24學(xué)生22學(xué)生19學(xué)生34
學(xué)生32學(xué)生38學(xué)生20學(xué)生35
學(xué)生36學(xué)生39學(xué)生21學(xué)生33
學(xué)生40學(xué)生23學(xué)生37
學(xué)生25學(xué)生41
計(jì)數(shù)10922
從表中看出,第一大類(lèi)的分類(lèi)情況與上面5群列聚類(lèi)結(jié)果沒(méi)有變動(dòng),人數(shù)一致,類(lèi)成員有差異。將該類(lèi)成員代碼結(jié)合原始數(shù)據(jù),可以看出該類(lèi)基本上都是讀研的學(xué)生,可以定義第二大類(lèi)為讀研學(xué)生群組。第二大類(lèi)成員中大部分是個(gè)體或是待業(yè)肄業(yè)情況,通過(guò)原始數(shù)據(jù)觀察,該類(lèi)學(xué)生的成績(jī)相對(duì)不好;從整體上分析此次聚類(lèi)結(jié)果,基本上把讀研學(xué)生,企業(yè)工作學(xué)生和個(gè)體創(chuàng)業(yè)肄業(yè)的學(xué)生劃分為了三大類(lèi)。
聚類(lèi)并不是最后的目的,聚類(lèi)是為了更好的了解每一類(lèi)學(xué)生的成績(jī)情況,所以下面要對(duì)每一類(lèi)的數(shù)據(jù)進(jìn)行描述分析。
分析一:對(duì)第一大類(lèi)學(xué)生(即讀研學(xué)生)的成績(jī)描述分析,可以在表中(見(jiàn)表4)看出,專(zhuān)業(yè)基礎(chǔ)課和公共基礎(chǔ)課明顯優(yōu)異于其他學(xué)生;其中專(zhuān)業(yè)基礎(chǔ)課是在所有課程中成績(jī)最好的;而平臺(tái)課和兩門(mén)方向課相對(duì)于其他大類(lèi)沒(méi)有明顯的優(yōu)勢(shì),甚至低于第三大類(lèi)的學(xué)生。
表4第一大類(lèi)成績(jī)描述表
Table 4performance description table of the first class
描述統(tǒng)計(jì)量
N極小值極大值均值標(biāo)準(zhǔn)差
專(zhuān)業(yè)基礎(chǔ)課790.0096.0093.14292.11570
專(zhuān)業(yè)平臺(tái)課779.0082.0080.4286.97590
金融方向課773.0076.0074.5714.97590
計(jì)算方向課772.0074.0073.2857.75593
公共基礎(chǔ)課789.0092.0090.4286.97590
有效的 N(列表狀態(tài))7
分析二:對(duì)第二大類(lèi)(即待業(yè)或肄業(yè)的學(xué)生)進(jìn)行成績(jī)描述分析,如下表(見(jiàn)表5),可以觀察到,就情況相對(duì)較差的學(xué)生各科的成績(jī)都不是很好,各科的成績(jī)均值都在70分以下;其中平臺(tái)課和計(jì)算方向課的平均分?jǐn)?shù)甚至低于60分的及格標(biāo)準(zhǔn)。
表5 第二大類(lèi)成績(jī)描述表
Table7performance description table of the second class
描述統(tǒng)計(jì)量
N極小值極大值均值標(biāo)準(zhǔn)差
專(zhuān)業(yè)基礎(chǔ)課964.0070.0067.66671.93649
專(zhuān)業(yè)平臺(tái)課955.0061.0058.33332.34521
金融方向課960.0067.0063.88892.66667
計(jì)算方向課958.0061.0059.77781.20185
公共基礎(chǔ)課960.0064.0061.88891.45297
有效的 N(列表狀態(tài))9
分析三:對(duì)第三大類(lèi)的成績(jī)進(jìn)行描述分析,明顯看出該類(lèi)學(xué)生的各科成績(jī)都處在中等水平(見(jiàn)表6)。除此之外,實(shí)際中進(jìn)入央企或大型國(guó)企的學(xué)生的成績(jī)并沒(méi)有表現(xiàn)出成績(jī)優(yōu)勢(shì),說(shuō)明影響因素還存在很多,比如個(gè)人的交際能力實(shí)踐能力等成績(jī)之外的影響因素。
表6 第三大類(lèi)成績(jī)描述表
Table 8performance description table of the third class
描述統(tǒng)計(jì)量
N極小值極大值均值標(biāo)準(zhǔn)差
專(zhuān)業(yè)基礎(chǔ)課2378.0085.0081.30432.22455
專(zhuān)業(yè)平臺(tái)課2374.0080.0077.60871.72519
金融方向課2369.0077.0072.34782.63902
計(jì)算方向課2370.0076.0073.39131.97114
公共基礎(chǔ)課2378.0083.0080.52171.44189
有效的 N(列表狀態(tài))23
4小結(jié)
將學(xué)生的成績(jī)數(shù)據(jù)作為聚類(lèi)指標(biāo)變量,利用相應(yīng)的統(tǒng)計(jì)軟件對(duì)學(xué)生聚類(lèi)分析,然后將聚類(lèi)結(jié)果與實(shí)際畢業(yè)情況對(duì)比,本次聚類(lèi)結(jié)果基本與實(shí)際相符。利用聚類(lèi)的辦法,高校可以根據(jù)學(xué)生在校期間各科目成績(jī)呈現(xiàn)的特點(diǎn),參照對(duì)聚類(lèi)結(jié)果產(chǎn)生各類(lèi)的成績(jī)的描述分析,對(duì)每一個(gè)學(xué)生進(jìn)行判別歸類(lèi)。這樣可以為學(xué)校定向培養(yǎng)方案的制定提供較科學(xué)的依據(jù);同時(shí)也可以為學(xué)生學(xué)習(xí)計(jì)劃的制定提供參考;此外,還可以根據(jù)第二大類(lèi)呈現(xiàn)的數(shù)據(jù)特征劃出“就業(yè)困難預(yù)警線”,這樣可以給予成績(jī)處在第二大類(lèi)或可能要滑進(jìn)第二大類(lèi)學(xué)生及時(shí)的警示,從而達(dá)到趨利避害的效果。
參考文獻(xiàn):
[1]鄧秀勤.聚類(lèi)分析在股票市場(chǎng)板塊分析中的應(yīng)用[J].數(shù)理統(tǒng)計(jì)與管理,1999.
[2]何曉群.多元統(tǒng)計(jì)分析[M].北京:中國(guó)人民大學(xué)出版社,2004.
[3]周興華.基于主成分分析的中原城市群城市發(fā)展水平研究[J].重慶科技學(xué)院學(xué)報(bào):社會(huì)科學(xué)版,2012(5).
[4]柯冰,錢(qián)省三.聚類(lèi)分析和因子分析在股票研究中的應(yīng)用[J].上海理工大學(xué)學(xué)報(bào),2004.
[5]向東進(jìn).實(shí)用多元統(tǒng)計(jì)分析[M].北京:中國(guó)地質(zhì)大學(xué)出版.2005.
[6]章文波,陳紅艷.實(shí)用數(shù)據(jù)統(tǒng)計(jì)分析及SPSS 12.0應(yīng)用[M].北京:人民郵電出版社,2006.
[7]余建英,何旭宏.數(shù)據(jù)統(tǒng)計(jì)分析與SPSS應(yīng)用[M].北京:人民郵電出版社,2003,4.