李曉朋
(閩江學(xué)院數(shù)學(xué)與數(shù)據(jù)科學(xué)學(xué)院,福建 福州 350108)
“第二課堂成績單”制度既是深化高等教育體制改革、全面推進(jìn)素質(zhì)教育的積極探索,又是適應(yīng)學(xué)生成長成才需要、契合社會(huì)對(duì)人才需求具有戰(zhàn)略意義的制度創(chuàng)新。[1]從試點(diǎn)起,高?!暗诙n堂成績單”實(shí)施已歷4年多時(shí)間,為全面了解高?!暗诙n堂成績單”實(shí)施總體概況,我們以閩江學(xué)院“第二課堂成績單”大數(shù)據(jù)平臺(tái)中的相關(guān)數(shù)據(jù)為數(shù)據(jù)源,借助R語言中的有關(guān)數(shù)據(jù)分析方法,以期從數(shù)據(jù)科學(xué)的角度客觀地分析高?!暗诙n堂成績單”制度施行概況,為構(gòu)建科學(xué)合理的高校學(xué)生綜合測評(píng)體系打下堅(jiān)實(shí)基礎(chǔ)。
多元分析(multivariate analysis)是多變量統(tǒng)計(jì)方法,是數(shù)理統(tǒng)計(jì)中應(yīng)用廣泛的一個(gè)重要分支,包含豐富的理論成果與眾多的應(yīng)用方法。聚類分析(cluster analysis)屬于多元分析,是一類將數(shù)據(jù)所對(duì)應(yīng)的研究對(duì)象進(jìn)行分類的統(tǒng)計(jì)方法。它們的共同特點(diǎn)是:事先不知道類別的個(gè)數(shù)與結(jié)構(gòu);據(jù)以進(jìn)行分析的數(shù)據(jù)是對(duì)象之間的相似性(similarity)或相異性(isimilarity)的數(shù)據(jù),將這些相似(相異)性數(shù)據(jù)看成是對(duì)象之間的“距離”遠(yuǎn)近的一種度量,將距離近的對(duì)象歸入一類,不同類之間的對(duì)象距離較遠(yuǎn),這就是聚類分析方法的共同思路。[2]
Mac Queen(1967)提出了一種動(dòng)態(tài)快速聚類方法——K均值聚類法(k-means cluster),其基本思想是:根據(jù)給定的參數(shù)k,先把n個(gè)對(duì)象粗略地分為k類,然后按照某種最優(yōu)原則(通常表示為一個(gè)準(zhǔn)則函數(shù))修改不合理的分類,直到準(zhǔn)則函數(shù)收斂為止,這樣就得到了最終的分類結(jié)果。[3]K均值聚類的基本思想,K均值聚類是最簡單的無指導(dǎo)學(xué)習(xí)方法,計(jì)算速度很快,也稱為快速聚類和分層聚類不同,K均值聚類事先要根據(jù)先驗(yàn)經(jīng)驗(yàn)確定需要的聚類數(shù)目。顯然,k個(gè)中心(或臨時(shí)中心)都是k×p矩陣。在R軟件中,確定k之后,初始的臨時(shí)中心可以自己輸入,也可以由計(jì)算機(jī)生成。[4]
本文的研究模型是實(shí)際存在的,即閩江學(xué)院學(xué)生發(fā)展大數(shù)據(jù)平臺(tái)。本文將以閩江學(xué)院2017級(jí)某專業(yè)學(xué)生的第二課堂成績和第一課堂成績的數(shù)據(jù)為基本數(shù)據(jù)源,主要使用聚類分析這種多元統(tǒng)計(jì)的方法,對(duì)“第二課堂成績單”制度和第一課堂成績的數(shù)據(jù)進(jìn)行分析,對(duì)學(xué)生進(jìn)行聚類。
本論文以閩江學(xué)院第二課堂大數(shù)據(jù)平臺(tái)數(shù)據(jù)作為數(shù)據(jù)源即樣本整體,采用抽樣調(diào)查的原理,選取了2017級(jí)某專業(yè)所有學(xué)生(2017年9月至2020年1月)第二課堂成績以及該專業(yè)所有學(xué)生第一課堂成績(大一、大二學(xué)年),樣本容量為77,選取了對(duì)本文研究有效數(shù)據(jù),接著對(duì)數(shù)據(jù)進(jìn)行一定的預(yù)處理。
從樣本數(shù)據(jù)分析來看,學(xué)生第二課堂成績總體較為穩(wěn)定,方差數(shù)值不大,成績分布較為均勻,學(xué)生整體發(fā)展較為協(xié)調(diào)。但也存在個(gè)別突出的現(xiàn)象,如“社會(huì)實(shí)踐能力”得分為0,學(xué)生參與社會(huì)實(shí)踐不夠積極,對(duì)社會(huì)實(shí)踐的認(rèn)識(shí)不夠到位。因此,學(xué)校應(yīng)該提前針對(duì)這類學(xué)生采取相應(yīng)的應(yīng)對(duì)措施,建立健全第二課堂成績預(yù)警機(jī)制,督促學(xué)生積極參加各類社會(huì)實(shí)踐。在“校園文化活動(dòng)”方面,學(xué)生成績的方差為7.338110,由此可見,在這方面存在著較為嚴(yán)重的兩極分化現(xiàn)象。這表明有些學(xué)生積極參與各級(jí)各類校園文化活動(dòng),但是有些學(xué)生積極性卻沒有得到充分的調(diào)動(dòng),校園文化活動(dòng)“二八現(xiàn)象”依然明顯。第一課堂成績方面,各項(xiàng)的最值和方差都較大,兩極分化嚴(yán)重。
與“第二課堂成績單”的實(shí)時(shí)動(dòng)態(tài)測評(píng)不同,高校學(xué)生綜合素質(zhì)測評(píng)是階段性的一年一評(píng),期間存在著各類問題,它們會(huì)隱藏在成績之中。作為教育工作者,僅憑大學(xué)生綜合素質(zhì)測評(píng)成績難以掌握學(xué)生的實(shí)時(shí)發(fā)展?fàn)顩r,具有嚴(yán)重的滯后性;而“第二課堂成績單”大數(shù)據(jù)平臺(tái)實(shí)時(shí)進(jìn)行更新反饋,及時(shí)呈現(xiàn)學(xué)生第二課堂的綜合狀況,教育工作者可以隨時(shí)了解學(xué)生的情況,對(duì)于教育實(shí)施作出一定調(diào)整,努力做到有效施教、因材施教。與第二課堂成績所反映的情況類似,兩個(gè)方面的數(shù)據(jù)都可以看出,學(xué)生在文體實(shí)踐方面的表現(xiàn)也存在著兩極分化的現(xiàn)象。由此可知,當(dāng)前的大學(xué)生綜合素質(zhì)測評(píng)確實(shí)存在著某些弊端,需要及時(shí)地加以調(diào)整,這也是本文為構(gòu)建高校學(xué)生綜合測評(píng)體系打下堅(jiān)實(shí)基礎(chǔ)的寫作目的。
在R軟件中,動(dòng)態(tài)聚類法的K均值聚類,在R語言中的kmeans函數(shù)可以幫助完成這個(gè)聚類,其聚類后分類結(jié)果如下:
上表中數(shù)據(jù)是對(duì)學(xué)生第二課堂成績(date1)進(jìn)行分析的結(jié)果,為了更加清晰地將學(xué)生分類,即做等級(jí)化處理,我們還要對(duì)每組學(xué)生的數(shù)據(jù)做數(shù)據(jù)描述性分析,從聚類和描述性分析的結(jié)果來看,第一類的學(xué)生共有13名占總體16.67%,僅從第二課堂成績的積分方面評(píng)估,結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),其應(yīng)屬于優(yōu)等學(xué)生,在思想政治素養(yǎng)模塊的表現(xiàn)尤為突出。
表1 聚類分析結(jié)果(date1)
從聚類結(jié)果來看,第二類的學(xué)生共有7名,占總體8.97%,僅從第二課堂成績的積分方面評(píng)估,結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),其應(yīng)屬于表現(xiàn)較差的一類學(xué)生。經(jīng)過觀察發(fā)現(xiàn)他們?cè)诟鱾€(gè)方面的表現(xiàn)都不及其他學(xué)生,尤其在社會(huì)實(shí)踐能力方面表現(xiàn)較差,甚至有得分為0分的現(xiàn)象,應(yīng)該及時(shí)對(duì)此類學(xué)生提前發(fā)出預(yù)警,督促學(xué)生嚴(yán)格按照學(xué)校相關(guān)要求做好社會(huì)實(shí)踐活動(dòng)。第三類的學(xué)生僅有1名占總體1.28%,僅從第二課堂成績的積分方面評(píng)估,其應(yīng)屬于表現(xiàn)最優(yōu)等的一類學(xué)生,在各個(gè)方面都表現(xiàn)較為突出。第四類的學(xué)生共有32名,占總體44.87%,僅從第二課堂成績的積分方面評(píng)估,結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù)其應(yīng)屬于中上等的一類學(xué)生。從正態(tài)分布的知識(shí)上看,這也是正好符合正態(tài)分布的。該類學(xué)生在各個(gè)方面的表現(xiàn)都較好,屬于成績穩(wěn)定的中間階層,這些學(xué)生是使得整體成績穩(wěn)定的基礎(chǔ),是從“第二課堂成績單”制度受益的大多數(shù)。第五類的學(xué)生共有23名,占總體29.49%,結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該組學(xué)生是屬于中等的一類學(xué)生,也符合正態(tài)分布的特征,與第四類學(xué)生同屬于成績中間階級(jí)。這類學(xué)生和第四類學(xué)生有著相同的特點(diǎn)。
上表中數(shù)據(jù)是對(duì)學(xué)生第一學(xué)年第一課堂成績(date2)進(jìn)行分析的結(jié)果,為了更加清晰地將學(xué)生分類,即做等級(jí)化處理,我們也要對(duì)這組學(xué)生的數(shù)據(jù)做數(shù)據(jù)描述性分析。從聚類結(jié)果來看,第一類學(xué)生共有18名,占總數(shù)的23.07%。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該類學(xué)生整體水平持中,但從數(shù)據(jù)中可以看出,他們均有不及格科目,這表明他們?cè)趯?duì)各類科目之間時(shí)間和精力分配的處理上不夠合理科學(xué),導(dǎo)致有些科目沒有及格,這類學(xué)生需要加強(qiáng)對(duì)課堂知識(shí)的學(xué)習(xí)。
表2 聚類分析結(jié)果(date2)
從聚類的結(jié)果來看,第二類學(xué)生僅有1名,占總數(shù)的1.2 8%。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該學(xué)生成績偏下等,甚至綜合測評(píng)總成績沒有超過及格線,特別是專業(yè)學(xué)習(xí)表現(xiàn)分比較低,而且數(shù)據(jù)顯示該學(xué)生曾經(jīng)有過違反校規(guī)校紀(jì)的行為。所以該類學(xué)生自成一類,是學(xué)生中的極少數(shù),也是預(yù)警對(duì)象之一。第三類學(xué)生共有14名,占總數(shù)的17.95%。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該類學(xué)生成績屬于中上等成績,沒有不及格科目,但是由于整體成績不夠好,所以沒有獲得獎(jiǎng)學(xué)金。這反映出,此類學(xué)生需要加強(qiáng)對(duì)第一課堂知識(shí)的學(xué)習(xí),在獲得專業(yè)優(yōu)勢的前提下提升其他能力,提升綜合能力,做到德智體美勞全面發(fā)展。第四類學(xué)生共有25名,占總數(shù)的32.05%。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該類學(xué)生成績屬于中等成績,均出現(xiàn)了不及格的科目,有明顯的偏科現(xiàn)象,導(dǎo)致整體成績不夠好,直接的結(jié)果是沒有獲得獎(jiǎng)學(xué)金。但是這類學(xué)生的數(shù)據(jù)顯示他們?cè)谖捏w實(shí)踐方面表現(xiàn)甚佳。所以這類學(xué)生更加需要加強(qiáng)對(duì)第一課堂知識(shí)的學(xué)習(xí),掌握專業(yè)優(yōu)勢,同時(shí)提升其他能力,提升綜合能力。第五類學(xué)生共有19名,占總數(shù)的24.36%。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該類學(xué)生成績屬于優(yōu)等成績,沒有不及格科目,整體成績較好,均獲得獎(jiǎng)學(xué)金。各方面成績顯示,該類學(xué)生在各方面表現(xiàn)甚佳。
上表中數(shù)據(jù)是對(duì)學(xué)生第二學(xué)年第一課堂成績(date3)進(jìn)行分析的結(jié)果,為了更加清晰地將學(xué)生分類,即做等級(jí)化處理,我們也要對(duì)這組學(xué)生的數(shù)據(jù)做數(shù)據(jù)描述性分析。聚類分析的結(jié)果顯示,第一類學(xué)生共有14名,占總數(shù)的17.95%。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該類學(xué)生在整體學(xué)生中屬于中下等水平,特點(diǎn)是均有不及格的科目,均未獲得獎(jiǎng)學(xué)金。數(shù)據(jù)反映,該類學(xué)生在專業(yè)學(xué)習(xí)表現(xiàn)方面仍有較大的進(jìn)步空間,要把專業(yè)課學(xué)習(xí)作為今后的第一要?jiǎng)?wù);另外品德行為表現(xiàn)上有待增強(qiáng),要注意增強(qiáng)在文體實(shí)踐方面的積極性,以期提升綜合素質(zhì)。
表3 聚類分析結(jié)果(date3)
聚類分析的結(jié)果顯示,第二類學(xué)生共有28名,占總數(shù)的35.90%,是數(shù)量最多的一類。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該類學(xué)生在整體學(xué)生中屬于中等水平,該類學(xué)生的特點(diǎn)是均沒有不及格的科目,但是因?yàn)榭傮w的成績不夠好,因此均未獲學(xué)業(yè)得獎(jiǎng)學(xué)金。該類學(xué)生的另外一個(gè)特點(diǎn)就是各項(xiàng)成績兩極分化嚴(yán)重,形成木桶效應(yīng),導(dǎo)致即使個(gè)別方面做得很好也未能得到獎(jiǎng)學(xué)金等榮譽(yù)。這類學(xué)生應(yīng)該注意取長補(bǔ)短,做到優(yōu)勢互補(bǔ),積極補(bǔ)短板、強(qiáng)弱項(xiàng)。第三類學(xué)生共有13名,占總數(shù)的16.67%。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該類學(xué)生在整體學(xué)生中屬于中上等水平,均沒有不及格科目,但是因?yàn)榭傮w的成績不夠好,因此均未獲得獎(jiǎng)學(xué)金。該類學(xué)生與第二類學(xué)生有相同的特點(diǎn),就是各項(xiàng)成績兩極分化嚴(yán)重,產(chǎn)生木桶效應(yīng)。這類學(xué)生應(yīng)該做好自己擅長的方面后,積極彌補(bǔ)自己的劣勢,加強(qiáng)弱項(xiàng),才能使得德智體美勞各方面得到全面的發(fā)展。第四類學(xué)生共有2名,占總數(shù)的2.56%。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該類學(xué)生的共同點(diǎn)是曾經(jīng)受到過紀(jì)律處分,成績上的差別十分的明顯。第五類學(xué)生共有20名,占總數(shù)的25.64%。結(jié)合該組學(xué)生的成績的描述統(tǒng)計(jì)數(shù)據(jù),該類學(xué)生在整體學(xué)生中屬于優(yōu)等水平,均沒有不及格科目,總體的成績較好,均獲得獎(jiǎng)學(xué)金,各方面表現(xiàn)優(yōu)異,是高等教育的優(yōu)秀成果,也是高等教育體制機(jī)制的受益者。
通過對(duì)聚類情況的觀察,以“第二課堂成績單”與通過傳統(tǒng)的大學(xué)生綜合測評(píng)而來的第一課堂成績?yōu)樽宰兞窟M(jìn)行聚類呈現(xiàn)出不同的結(jié)果。
從date1和date2的數(shù)據(jù)比較來看,學(xué)號(hào)重合數(shù)為9,相應(yīng)重合率為11.538%,其中第三類第四類均無學(xué)號(hào)重合出現(xiàn),而在第五類中出現(xiàn)的學(xué)號(hào)重合數(shù)最高。從date1和date3的數(shù)據(jù)比較中,學(xué)號(hào)的重合數(shù)為22,則相應(yīng)的重合率為28.20 5%,其中在第一類和第三類均無學(xué)號(hào)重合出現(xiàn),而在第四類中出現(xiàn)的學(xué)號(hào)重合數(shù)最高。Date2和date3的數(shù)據(jù)比較中,學(xué)號(hào)重合數(shù)為27,則相應(yīng)的重合率為34.615%,其中第二類無學(xué)號(hào)重合出現(xiàn),而在第五類中出現(xiàn)的學(xué)號(hào)重合率最高。
date2和date3分別是學(xué)生在大學(xué)第一學(xué)年度和第二學(xué)年度的第一課堂成績,是同一批學(xué)生在連續(xù)兩年取得的兩組第一課堂成績,也是通過科學(xué)嚴(yán)謹(jǐn)?shù)膶W(xué)生綜合測評(píng)成績計(jì)算方法計(jì)算而來,兩者在時(shí)間上具有連續(xù)性,對(duì)象具有繼承性。這些條件保證了兩者的對(duì)象經(jīng)過聚類分析后,應(yīng)該具有高度的重合率,但是經(jīng)過計(jì)算兩者在聚類對(duì)象重合數(shù)上為27,相應(yīng)的重合率為34.615%。雖然兩者經(jīng)過聚類分析后所得的重合率量值表現(xiàn)較低,但是這個(gè)數(shù)字應(yīng)該被認(rèn)為是這種情況下的最理想的重合效果。由此,推理date1和date2的重合數(shù)9,相應(yīng)的重合率11.538%,是比較低的。從date1和date3的數(shù)據(jù)比較來看,這兩組數(shù)據(jù)的重合數(shù)為22,相應(yīng)的重合率為28.205%。根據(jù)分析,表現(xiàn)出重合率有所攀升的現(xiàn)象,可以被認(rèn)為是合理的重合率(因?yàn)閐ate2和date3的重合率也僅有34.615%)。主要原因是:一是閩江學(xué)院“第二課堂成績單”制度經(jīng)過一年的摸索和探究,業(yè)已趨于成熟;二是學(xué)生已經(jīng)適應(yīng)了這種具有創(chuàng)新性的育人方式;三是時(shí)間上的累計(jì)使“第二課堂成績單”制度和大學(xué)生綜合素質(zhì)測評(píng),在育人工作功能上有較高的擬合度。