熊寬江,豐建霞,胡志華
(1.黃岡師范學(xué)院 數(shù)理學(xué)院,湖北 黃州 438000;2.黃岡師范學(xué)院 文學(xué)院,湖北 黃州 438000)
?
基于學(xué)生成績(jī)的學(xué)生分類指導(dǎo)模型研究
熊寬江1,豐建霞2,胡志華1
(1.黃岡師范學(xué)院 數(shù)理學(xué)院,湖北 黃州 438000;2.黃岡師范學(xué)院 文學(xué)院,湖北 黃州 438000)
摘要智能計(jì)算機(jī)輔助教學(xué)系統(tǒng)中的教師模塊,在學(xué)生分類的指導(dǎo)下為學(xué)生提供個(gè)性化教學(xué)服務(wù),已有的學(xué)生分類模型大多只從單方面直接分類,沒(méi)有考慮從多角度進(jìn)行綜合評(píng)價(jià)。利用多元統(tǒng)計(jì)學(xué)的因子、聚類分析方法并結(jié)合職位能力要求構(gòu)建學(xué)生分類指導(dǎo)綜合評(píng)價(jià)模型,用該模型分析了黃岡師范學(xué)院漢語(yǔ)言文學(xué)專業(yè)的學(xué)生,并給出了他們畢業(yè)時(shí)的就業(yè)方向指導(dǎo)建議。相比于已有的學(xué)生分類模型,結(jié)果多元且更加準(zhǔn)確合理。
關(guān)鍵詞學(xué)生分類算法;因子分析;聚類分析
學(xué)生分類既是實(shí)現(xiàn)個(gè)性化教學(xué)的重要基礎(chǔ),也是智能計(jì)算機(jī)輔助教學(xué)技術(shù)中教師模塊要解決的關(guān)鍵問(wèn)題,教師模塊在分類的前提下,針對(duì)不同類型的學(xué)生提供各異的教學(xué)策略。分類的準(zhǔn)確性和合理性是衡量智能計(jì)算機(jī)輔助教學(xué)系統(tǒng)好壞的重要指標(biāo),研究學(xué)生分類模型也應(yīng)注重其準(zhǔn)確性和合理性。目前,學(xué)生分類模型大多采用單一模型進(jìn)行直接分類,鮮有從多個(gè)角度進(jìn)行的綜合評(píng)價(jià)和分類,采用多種方法進(jìn)行綜合評(píng)價(jià),結(jié)果更有說(shuō)服力,而且也有助于提升分類結(jié)果的準(zhǔn)確性和合理性。
把各門(mén)課程的原始成績(jī)相加得總分,用以評(píng)選學(xué)生榮譽(yù)或獎(jiǎng)學(xué)金是許多高校通行的做法,這種做法太過(guò)簡(jiǎn)單,沒(méi)有考慮課程的難易程度和重要性。一種改進(jìn)的方法是給每門(mén)課程賦予權(quán)值,計(jì)算加權(quán)總分,然后再根據(jù)加權(quán)總分的大小進(jìn)行分類評(píng)選。當(dāng)我們需要對(duì)學(xué)生進(jìn)行分類指導(dǎo)時(shí),就不適宜采用這種依據(jù)排名的分類方法,應(yīng)該利用多元統(tǒng)計(jì)學(xué)的方法從學(xué)生成績(jī)中挖掘信息進(jìn)行分類。并且,在實(shí)際分析問(wèn)題中,大多都是多指標(biāo)問(wèn)題,分析此類問(wèn)題還應(yīng)當(dāng)解決指標(biāo)降維問(wèn)題[1-4]。
本文從多元統(tǒng)計(jì)學(xué)中找方法,構(gòu)建了基于學(xué)生成績(jī)的學(xué)生分類指導(dǎo)模型[5-8],并選取黃岡師范學(xué)院漢語(yǔ)言文學(xué)專業(yè)2009級(jí)某班級(jí)學(xué)生的成績(jī)記錄,對(duì)學(xué)生進(jìn)行分類,探索學(xué)生的潛在能力,并依據(jù)專業(yè)培養(yǎng)目標(biāo)和職位能力要求,給出了他們畢業(yè)時(shí)的就業(yè)指導(dǎo)建議。依據(jù)該模型的分類指導(dǎo),由于有潛在能力分析的數(shù)據(jù)支持,指導(dǎo)建議要比直接依據(jù)課程成績(jī)的更加合理準(zhǔn)確。
1學(xué)生分類指導(dǎo)模型
大學(xué)四年的學(xué)習(xí)成績(jī)既是學(xué)生學(xué)習(xí)生活的記錄,也是學(xué)生學(xué)習(xí)能力的反映,利用成績(jī)對(duì)學(xué)生分類,分類結(jié)果可應(yīng)用于高校學(xué)生管理,如評(píng)獎(jiǎng)學(xué)金、推薦研究生、向用人單位推薦分配學(xué)生等。
利用學(xué)生成績(jī)可以構(gòu)建基于學(xué)生成績(jī)的學(xué)生分類指導(dǎo)模型(圖1),它是建立在學(xué)生分類上的綜合評(píng)價(jià)模型,該模型由三個(gè)部分組成:學(xué)生分類、潛在能力分析和職位能力要求。
學(xué)生分類所面臨的多指標(biāo)分類問(wèn)題[9-11],分類指標(biāo)越多,有用信息的提取越復(fù)雜越困難,而且多指標(biāo)之間的相互影響和牽連也提醒我們,在處理分類問(wèn)題時(shí),指標(biāo)越少越好。用較少的幾個(gè)新的綜合指標(biāo)代替較多的原有指標(biāo)的方法,在多元統(tǒng)計(jì)學(xué)里稱之為主成份分析。主成份分析所產(chǎn)生的新指標(biāo)盡可能地保留了原有指標(biāo)所含的信息,也保證了各指標(biāo)之間不相關(guān),使各指標(biāo)含有的信息不重疊。主成份分析只是信息提取的第一步,要實(shí)現(xiàn)學(xué)生分類,接下來(lái)還應(yīng)該在主成份分析結(jié)果上進(jìn)行聚類?,F(xiàn)代統(tǒng)計(jì)學(xué)中的聚類分析具有準(zhǔn)確、快速、可實(shí)現(xiàn)性強(qiáng)等優(yōu)點(diǎn),已成功應(yīng)用于大量國(guó)民經(jīng)濟(jì)分析當(dāng)中。學(xué)生成績(jī)聚類分析的基本思想是根據(jù)多名學(xué)生多門(mén)功課的考試成績(jī),具體找出一些能夠度量不同學(xué)生之間相似程度的統(tǒng)計(jì)量(稱為距離)[12-15],以這些統(tǒng)計(jì)量為劃分類型的依據(jù),把一些相似程度較大(即距離較近)的學(xué)生劃分為一類,把另外一些彼此之間相似程度較大的學(xué)生又聚合為另一類,關(guān)系密切的聚合到一個(gè)小的分類單位,關(guān)系疏遠(yuǎn)的聚合到一個(gè)大的分類單位,直到把所有學(xué)生都聚合完畢。如果把不同的類型一一劃出,就可以形成一個(gè)由小到大的分類系統(tǒng)。根據(jù)聚類的過(guò)程,可以把整個(gè)分類系統(tǒng)畫(huà)成一張譜系圖,用它把所有學(xué)生間的親疏關(guān)系表示出來(lái),聚類譜系圖也是聚類分析中最直觀的一種表示方式。
圖1 學(xué)生分類指導(dǎo)綜合評(píng)價(jià)模型
學(xué)生分類主要由主成份分析和聚類分析兩大處理過(guò)程組成:
1.1.1主成份分析
Step1:獲取學(xué)生成績(jī)?cè)紨?shù)據(jù)矩陣:X=(xij)n×p。
Step2:對(duì)xij標(biāo)準(zhǔn)化,計(jì)算原始數(shù)據(jù)矩陣的相關(guān)陣R。
Step3:計(jì)算相關(guān)陣R的特征值和特征向量,設(shè)λ1,λ2,…,λp為R的p個(gè)特征值。為方便分析和敘述,不妨設(shè)λ1≥λ2≥…≥λp>0,且ξi=(μ1i,μ2i,…,μpi)T,i=1,2,…,p,為λi所對(duì)應(yīng)的正則化特征向量。
Step4:計(jì)算累積方差貢獻(xiàn)率,建立主成份,貢獻(xiàn)率一般取80%或85%即可。
(1)
其中Y1,Y2,…,Yp為標(biāo)準(zhǔn)化指標(biāo)變量。
Step5:計(jì)算前k個(gè)主成份的樣本值:
(2)
用新指標(biāo)(主成份)樣本值(zij)n×k替代原樣本值(xij)n×p繼續(xù)進(jìn)行統(tǒng)計(jì)分析。
1.1.2聚類分析
Step1:把每個(gè)學(xué)生的各看為一類,以此作為初始類,利用已定義好的距離公式進(jìn)行計(jì)算。n個(gè)學(xué)生,初始分類表為G1,G2,…,Gn,計(jì)算好的距離矩陣D0如下:
(3)
Step2:在距離矩陣D0中找到最小的數(shù)d(Gi,Gj),將Gi與Gj合并為一新類Gn+1,將新類Gn+1加入分類表,并將Gi與Gj從分類表中刪除。
Step3:計(jì)算新類Gn+1與剩余各類的距離,類間距離采用重心法計(jì)算,得到新的距離矩陣D1。
Step4:反復(fù)迭代Step2和Step3,直至所有樣本合為一類,即最終的分類表只含有一個(gè)類。
Step5:根據(jù)Step1至Step4的計(jì)算過(guò)程繪制系統(tǒng)聚類譜系圖。
Step6:依照系統(tǒng)聚類譜系圖結(jié)果對(duì)學(xué)生進(jìn)行分類,并對(duì)聚類結(jié)果賦予實(shí)際意義。
潛在能力分析是學(xué)生分類指導(dǎo)模型的重要部分,學(xué)生成績(jī)反映學(xué)生學(xué)習(xí)能力傾向,這種能力傾向可以描述為一種潛在能力。對(duì)于多指標(biāo)問(wèn)題的成因分析,一般采用因子分析,它是多元統(tǒng)計(jì)分析方法中較為成熟的一個(gè)分支,已廣泛應(yīng)用于社會(huì)調(diào)查、教育測(cè)量、心理分析、成因分析等各個(gè)領(lǐng)域[16-19]。因子分析是用較少個(gè)數(shù)的公共因子的線性函數(shù)與特定因子之和來(lái)表達(dá)原觀察變量X的每一個(gè)分量,以便達(dá)到合理解釋原變量X的相關(guān)性并降低其維數(shù)。因子分析是主成份分析的推廣,主成份分析是將原指標(biāo)加以綜合、歸納,而因子分析則是將原指標(biāo)給予分解、演繹。
Step1:由學(xué)生成績(jī)?cè)紨?shù)據(jù)矩陣計(jì)算樣本相關(guān)矩陣R。
Step2:求R的特征值和標(biāo)準(zhǔn)化特征向量,記λ1≥λ2≥…≥λp>0為R的特征值,相應(yīng)的單位正交特征向量為e1,e2,…,ep。
Step3:求因子模型的因子載荷矩陣A。
先確定公共因子的個(gè)數(shù)m,取m為滿足(或0.70或0.90)的最小正整數(shù)
(4)
注意λ1+λ2+…+λp=p
Step4:計(jì)算因子載荷矩陣A的方差V。
(5)
(6)
確定φst后,作旋轉(zhuǎn)變換
(7)
全部列配對(duì)旋轉(zhuǎn)完成后,得到新的因子載荷矩陣B(1)和方差V(1):
(8)
Step6:對(duì)新的因子載荷矩陣B(1)繼續(xù)方差最大旋轉(zhuǎn),直至方差V(s)不再增大為止,得到最終因子載荷陣B(s)。
方差不再增大為止,即
|V(s)-V(s-1)|<ε(給定精度)
(9)
時(shí)停止,而后取
(10)
作為最終的因子載荷矩陣。
Step7:由因子載荷矩陣,取每個(gè)因子相對(duì)較大的變量,得到因子分類結(jié)果,因子載荷則反映了因子結(jié)構(gòu)。
因子分析的直觀結(jié)果是對(duì)學(xué)生分類的課程指標(biāo)進(jìn)行了分組,分入同一組的課程在該組內(nèi)具有相同的“課程能力”,它們?cè)诜从硨W(xué)生潛在能力上是一致的?!罢n程能力”即各門(mén)課程所應(yīng)分擔(dān)的能夠體現(xiàn)本課程的特點(diǎn)與職能的那一部分專業(yè)能力,是專業(yè)能力的分解與具體化?!罢n程能力”與專業(yè)培養(yǎng)目標(biāo)有關(guān),有了專業(yè)培養(yǎng)任務(wù)和目標(biāo),成組的課程群所反映的潛在能力就可以從培養(yǎng)目標(biāo)中找到。
以漢語(yǔ)言文學(xué)專業(yè)為例,主要專業(yè)課程包括基礎(chǔ)理論類、文學(xué)史類、語(yǔ)言類與基礎(chǔ)技能類,基礎(chǔ)理論類如文學(xué)概論、語(yǔ)言學(xué)概論、中國(guó)古代文論、西方文論等。它所承擔(dān)的專業(yè)能力培養(yǎng)任務(wù)不僅讓學(xué)生具備一定的認(rèn)知能力,而且還培養(yǎng)學(xué)生的理性思辨能力,即運(yùn)用理論去分析具體的文學(xué)現(xiàn)象、語(yǔ)言現(xiàn)象、美學(xué)現(xiàn)象、文論現(xiàn)象的能力;文學(xué)史類課程如中國(guó)古代文學(xué)史、中國(guó)現(xiàn)當(dāng)代文學(xué)史、外國(guó)文學(xué)史等,重點(diǎn)培養(yǎng)的是學(xué)生從史性知識(shí)中去尋找與發(fā)現(xiàn)文學(xué)發(fā)展的規(guī)律,進(jìn)行文學(xué)個(gè)案與文學(xué)史的互釋,在史性思維中將文學(xué)的過(guò)去、現(xiàn)在與未來(lái)進(jìn)行貫通思考等能力;語(yǔ)言類課程如古代漢語(yǔ)、現(xiàn)代漢語(yǔ)等,則側(cè)重于培養(yǎng)學(xué)生分析研究語(yǔ)言問(wèn)題以及正確運(yùn)用語(yǔ)言的能力;基礎(chǔ)技能類課程是學(xué)生獲得單項(xiàng)基本能力的重要途徑,如語(yǔ)文教師技能、文秘技能等。
職位能力要求是用人單位對(duì)招錄人員的基本專業(yè)能力規(guī)定,考慮職位能力要求是站在用人單位的角度參與學(xué)生分類指導(dǎo)。同樣以漢語(yǔ)言文學(xué)專業(yè)為例,人們一般認(rèn)為,漢語(yǔ)言文學(xué)專業(yè)所應(yīng)培養(yǎng)的人才類型不外乎文秘型、記者型、教師型、編輯出版型、組織宣傳型、文學(xué)創(chuàng)作型等,事實(shí)上,除了這些類型之外,還有管理型、服務(wù)型、綜合型、自主創(chuàng)業(yè)型等多種“業(yè)外類型”,這是由該專業(yè)的基礎(chǔ)性學(xué)科特征決定的。其中,教師型和文秘型都是以語(yǔ)言交際作為最基本的方式而履職的。從語(yǔ)文教師職位的要求看,需要具有基本的組織教學(xué)的能力,特別是進(jìn)行課堂教學(xué)、課文講讀的能力,指導(dǎo)學(xué)生作文的能力等。同時(shí),也需要具有進(jìn)行創(chuàng)造性教學(xué)、開(kāi)展學(xué)科教學(xué)研究的發(fā)展能力。文秘人員則更強(qiáng)調(diào)基于語(yǔ)言的綜合協(xié)調(diào)能力,信息收集與處理能力和常用公文、一般應(yīng)用文體的寫(xiě)作能力等。
2模型計(jì)算結(jié)果
選取黃岡師范學(xué)院漢語(yǔ)言文學(xué)專業(yè)2009級(jí)某班級(jí)的20名學(xué)生的考試成績(jī)?yōu)槌跏紨?shù)據(jù),初始數(shù)據(jù)見(jiàn)附表,附表中列出了包括中國(guó)文化概論、二十世紀(jì)西方文論、教育技術(shù)學(xué)、中國(guó)當(dāng)代文學(xué)史、古代漢語(yǔ)、語(yǔ)言學(xué)概論、語(yǔ)文教學(xué)論、文學(xué)概論、現(xiàn)代漢語(yǔ)、語(yǔ)言文字信息處理、中國(guó)現(xiàn)代文學(xué)史共11門(mén)課程,學(xué)生姓名均用序號(hào)1,2,3,…,20來(lái)表示。
對(duì)學(xué)生成績(jī)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,經(jīng)過(guò)學(xué)生分類的兩大處理過(guò)程,可得到系統(tǒng)聚類譜系圖(圖2)。根據(jù)系統(tǒng)聚類譜系圖,可將這20名同學(xué)分為 5大類:G1={6,20,10},三名同學(xué);G2={1,9,4,7,8,14,3,17,19,2 },十名同學(xué);G3={15,16},兩名同學(xué);G4={5,18,13},三名同學(xué);G5={11,12},兩名同學(xué)。
圖2 聚類譜系圖
對(duì)學(xué)生成績(jī)進(jìn)行因子分析,并利用“最大方差旋轉(zhuǎn)法”計(jì)算因子載荷矩陣,結(jié)果如表1所示。
表1 經(jīng)“最大方差旋轉(zhuǎn)”的因子載荷表
由因子載荷表,取每個(gè)主因子大于0.5的變量,可得因子結(jié)構(gòu),如表2所示。從表2中可以看出,五個(gè)主因子反映了不同的潛在能力。影響主因子1的是基礎(chǔ)理論類的課程,它反映學(xué)生一定的認(rèn)知能力,理性思辨能力以及利用理論分析具體現(xiàn)象的能力;主因子2是語(yǔ)言類課程,反映學(xué)生研究語(yǔ)言問(wèn)題以及正確運(yùn)用語(yǔ)言的能力;主因子3主要包含文字處理類課程,顯然反映學(xué)生的文字處理能力;主因子4是語(yǔ)文教師基礎(chǔ)技能類課程,反映學(xué)生語(yǔ)文教學(xué)能力;主因子5是文學(xué)史類課程,反映學(xué)生從史性知識(shí)中尋找與發(fā)現(xiàn)規(guī)律,在史性思維中貫通思考的能力。
表2 因子結(jié)構(gòu)
3結(jié)果討論
學(xué)生成績(jī)聚類分析模型將20名學(xué)生分成了5大類,結(jié)合學(xué)生潛在能力因子分析模型的潛在能力結(jié)果,就可以賦予分類一個(gè)比較合理的畢業(yè)工作方向指導(dǎo)建議:
G1={6,20,10},這三名同學(xué),語(yǔ)言能力、語(yǔ)文教學(xué)能力欠佳,認(rèn)知能力、理性思辨能力、文字處理能力突出。建議畢業(yè)后從事新聞編輯類的工作。
G2={1,9,4,7,8,14,3,17,19,2 },這十名同學(xué),各能力相對(duì)均衡,其中語(yǔ)言能力和認(rèn)知能力、理性思辨能力較為突出。建議畢業(yè)后從事教師行業(yè)。
G3={15,16},這兩名同學(xué),語(yǔ)文教學(xué)能力較差,文字處理較強(qiáng),其余各能力較均衡。建議畢業(yè)后從事文秘類的工作。
G4={5,18,13},這三名同學(xué),理性思辨能力較差,語(yǔ)言能力欠佳。文字處理能力較強(qiáng),剩余均衡?;A(chǔ)能力有待提高,建議畢業(yè)后參加其他培訓(xùn)以提高就業(yè)能力。
G5={11,12},兩名同學(xué),5種潛在能力都較為突出,畢業(yè)后適合考研。
附表:
黃岡師范學(xué)院漢語(yǔ)言文學(xué)專業(yè)2009級(jí)某班級(jí)20名學(xué)生的考試成績(jī)初始數(shù)據(jù)
參考文獻(xiàn):
[1]彭德林.ICAI智能計(jì)算機(jī)輔助教育發(fā)展趨勢(shì)的研究[J].中國(guó)科技信息,2011,(04):214-215.
[2]關(guān)琳.教師模型中學(xué)生分類的挖掘算法[D].貴州師范大學(xué),2005.
[3]關(guān)琳,張仁津.教師模型中學(xué)生分類算法[J].貴州師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,(01):82-85.
[4]嚴(yán)的兵.基于數(shù)據(jù)挖掘的學(xué)生成績(jī)分析[D].安徽大學(xué),2011.
[5]劉琳.淺談新時(shí)期我國(guó)高校學(xué)生分類管理模式的構(gòu)建[J].魅力中國(guó),2011,(12):276-277.
[6]丁曉原.論應(yīng)用型本科院校漢語(yǔ)言文學(xué)專業(yè)學(xué)生核心能力的培養(yǎng)[J].常熟理工學(xué)院學(xué)報(bào),2007,(06).
[7]饒頌,劉慶.適應(yīng)市場(chǎng)需要因材施教 淺談民辦高校分層施教[J].職業(yè),2007,(11):52-53.
[8]陳治.使用SPSS軟件進(jìn)行因子分析和聚類分析的方法[J].市場(chǎng)研究,2006,(06):45-48.
[9]李曦.多元統(tǒng)計(jì)在學(xué)生成績(jī)分析的運(yùn)用[J].南昌航空工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版),2006,(03):58-62.
[10]劉琳,丁琨,張健,李任波.利用多元統(tǒng)計(jì)分析進(jìn)行學(xué)生成績(jī)綜合評(píng)價(jià)[J].農(nóng)業(yè)與技術(shù),2012,(04):184-185.
[11]劉海生.多元統(tǒng)計(jì)分析法在學(xué)生成績(jī)綜合評(píng)價(jià)中的應(yīng)用[J].華北經(jīng)濟(jì)學(xué)院學(xué)報(bào),2002,(5):77-79.
[12]劉麗敏,樊曉平,廖志芳.選擇性聚類融合新方法研究[J].計(jì)算機(jī)應(yīng)用研究,2012,(11):4031-4034.
[13]楊燕,靳蕃,KAMEL Mohamed.聚類有效性評(píng)價(jià)綜述[J].計(jì)算機(jī)應(yīng)用研究,2008,(06):1630-1632.
[14]曲麗娜.基于數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘的高校學(xué)生成績(jī)分析[D].吉林大學(xué),2008.
[15]丁春忠,汪四水.基于EM算法學(xué)生成績(jī)的因子分析[J].蘇州大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,(04):25-28.
[16]孫榮平.成績(jī)統(tǒng)計(jì)分析中的數(shù)據(jù)預(yù)處理研究[J].黑龍江教育(高教研究與評(píng)估),2006,(09):67-68.
[17]劉聰穎,孫鵬.地方高校漢語(yǔ)言文學(xué)專業(yè)就業(yè)現(xiàn)狀及對(duì)策分析[J].邯鄲學(xué)院學(xué)報(bào),2009,(04):122-125.
[18]蔡梅娟.漢語(yǔ)言文學(xué)專業(yè)學(xué)生能力培養(yǎng)體系研究[J].山東理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2012,(04):101-104.
[19]伍建華.漢語(yǔ)言文學(xué)專業(yè)應(yīng)用型人才培養(yǎng)的基本思路[J].湖南科技學(xué)院學(xué)報(bào),2008,(11):204-206.
編輯喻曉敏
基金項(xiàng)目黃岡師范學(xué)院大學(xué)生創(chuàng)新項(xiàng)目(20110813)。
通訊作者豐建霞,女,湖北黃岡人,副教授,主要研究方向?yàn)榻逃夹g(shù)學(xué)。
作者簡(jiǎn)介熊寬江,男,湖北蘄春人,在讀碩士研究生,主要研究方向?yàn)閿?shù)據(jù)挖掘。
收稿日期2015-05-11
doi10.3969/j.issn.1003-8078.2015.06.30
中圖分類號(hào)G434
文獻(xiàn)標(biāo)志碼A
文章編號(hào)1003-8078(2015)06-0112-06