張敏強(qiáng) 凡細(xì)珍 郭凱茵 鐘陽(yáng)
?
大數(shù)據(jù)理念下教育質(zhì)量監(jiān)測(cè)評(píng)價(jià)的變革與發(fā)展*
張敏強(qiáng) 凡細(xì)珍 郭凱茵 鐘陽(yáng)1
通過(guò)分析教育大數(shù)據(jù)的特點(diǎn),揭示其在教育測(cè)評(píng)中應(yīng)用的不足,并進(jìn)一步提出大數(shù)據(jù)時(shí)代教育測(cè)評(píng)的系統(tǒng)化、縱向化、微觀(guān)化、創(chuàng)新性以及“以人為本”的發(fā)展趨勢(shì)。在此基礎(chǔ)上,文章對(duì)比分析了大數(shù)據(jù)理念下經(jīng)典測(cè)量理論、項(xiàng)目反應(yīng)理論和認(rèn)知診斷理論的優(yōu)勢(shì)與不足,對(duì)三種測(cè)量理論在教育實(shí)踐中的應(yīng)用提出了相應(yīng)的建議。
教育質(zhì)量監(jiān)測(cè);大數(shù)據(jù);經(jīng)典測(cè)量理論;項(xiàng)目反應(yīng)理論;認(rèn)知診斷
(一)教育大數(shù)據(jù)的特點(diǎn)及其在教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)中的應(yīng)用現(xiàn)狀
“大數(shù)據(jù)”不是一個(gè)單純描述數(shù)據(jù)數(shù)量之巨大的概念,其意味著數(shù)據(jù)來(lái)源的多樣化、數(shù)據(jù)類(lèi)型的多元化以及在數(shù)據(jù)處理與分析層面的大容量與高速度。更為重要的是,“大數(shù)據(jù)”立足于對(duì)大量數(shù)據(jù)的深度挖掘與科學(xué)分析,尋求數(shù)據(jù)背后的隱含關(guān)系與價(jià)值,使得人們可以從基于小樣本數(shù)據(jù)的推測(cè)或基于感性的偏好性選擇轉(zhuǎn)向基于數(shù)據(jù)分析與理性證據(jù)的決策??梢?jiàn),“大數(shù)據(jù)”在本質(zhì)上已經(jīng)轉(zhuǎn)化為一種新的思維方式、一種新的問(wèn)題解決方法。[2]
由于教育具有成長(zhǎng)性、學(xué)習(xí)性以及受到天生遺傳及后天成長(zhǎng)環(huán)境等諸多因素的影響,所以,教育大數(shù)據(jù)除了具有數(shù)據(jù)容量大、多元多樣的一般特點(diǎn),還具有其自身的特點(diǎn)。教育作為以“人”為對(duì)象的社會(huì)活動(dòng),其核心是學(xué)生。教育大數(shù)據(jù)實(shí)現(xiàn)了對(duì)學(xué)生數(shù)據(jù)的全方位、全過(guò)程采集,橫向數(shù)據(jù)覆蓋了學(xué)生學(xué)業(yè)、知識(shí)技能、身心健康等各個(gè)方面,縱向數(shù)據(jù)貫穿了學(xué)生從幼兒園到高中的發(fā)展全過(guò)程。這些都為對(duì)教育展開(kāi)系統(tǒng)、全面、可持續(xù)性、以人為本的教育監(jiān)測(cè)與評(píng)價(jià)奠定了基礎(chǔ)。但是由于數(shù)據(jù)本身特點(diǎn)的條件限制以及相關(guān)教育工作者缺乏專(zhuān)業(yè)的統(tǒng)計(jì)測(cè)量知識(shí),目前對(duì)教育大數(shù)據(jù)的挖掘與利用遠(yuǎn)遠(yuǎn)不夠。為了解教育大數(shù)據(jù)的特點(diǎn),便于教育大數(shù)據(jù)服務(wù)于教育改革與教育的評(píng)價(jià)應(yīng)用,將教育大數(shù)據(jù)的特點(diǎn)總結(jié)如下:
1.數(shù)據(jù)來(lái)源多樣,不利于不同區(qū)域數(shù)據(jù)間的比較
從數(shù)據(jù)來(lái)源來(lái)看,教育大數(shù)據(jù)匯聚了來(lái)自不同區(qū)域、不同學(xué)校的數(shù)據(jù)。這些數(shù)據(jù)又包含了學(xué)生不同學(xué)科的學(xué)業(yè)測(cè)評(píng)成績(jī)以及學(xué)生身心發(fā)展等不同方面及類(lèi)型的數(shù)據(jù)。不同來(lái)源的數(shù)據(jù)往往缺乏統(tǒng)一的標(biāo)準(zhǔn),從而給數(shù)據(jù)間的比較帶來(lái)了困難。
2.數(shù)據(jù)類(lèi)型多元但不具有一致性,不利于數(shù)據(jù)的整合
教育數(shù)據(jù)可劃分四種基本類(lèi)型,類(lèi)別數(shù)據(jù)、等級(jí)數(shù)據(jù)、等距數(shù)據(jù)和等比數(shù)據(jù)。類(lèi)別數(shù)據(jù)如學(xué)生的性別,等級(jí)數(shù)據(jù)如學(xué)生的排名,等距數(shù)據(jù)如氣溫,等比數(shù)據(jù)如學(xué)生的跑步速度。這些不同類(lèi)型數(shù)據(jù)給考試分?jǐn)?shù)和問(wèn)卷數(shù)據(jù)的解釋與評(píng)價(jià)帶來(lái)了不便,不同學(xué)科、不同年級(jí)、不同時(shí)段的數(shù)據(jù)需進(jìn)行轉(zhuǎn)換、歸類(lèi)、整合,然后才可以比較。目前,教育行業(yè)對(duì)不同類(lèi)型數(shù)據(jù)的整合不足,對(duì)學(xué)生分?jǐn)?shù)及各種指標(biāo)數(shù)據(jù)的解釋與評(píng)價(jià)有待完善。
3.數(shù)據(jù)收集缺乏時(shí)間延續(xù)性,對(duì)縱向數(shù)據(jù)搜集及分析不足
目前,教育監(jiān)測(cè)與評(píng)價(jià)注重對(duì)橫斷面數(shù)據(jù)的應(yīng)用分析,對(duì)數(shù)據(jù)進(jìn)行橫向比較,較少進(jìn)行縱向的追蹤與比較。這一方面是因?yàn)榭v向數(shù)據(jù)不易收集,并且在收集的過(guò)程中容易出現(xiàn)流失。另一方面,縱向數(shù)據(jù)的比較與分析從方法上來(lái)說(shuō)也比橫向數(shù)據(jù)的分析復(fù)雜得多。這些都是導(dǎo)致目前縱向數(shù)據(jù)收集與分析不足的重要原因。
4.數(shù)據(jù)容量大但深層挖掘不夠,對(duì)數(shù)據(jù)的利用不夠充分
教育大數(shù)據(jù)雖然龐大,但是目前對(duì)其挖掘與利用尚且不足,尤其是數(shù)據(jù)背后深層次的隱性信息的挖掘。在當(dāng)前的教育監(jiān)測(cè)與評(píng)價(jià)實(shí)踐中,對(duì)學(xué)生往往只憑借一個(gè)“分”,對(duì)學(xué)校只憑借一個(gè)“率”。同樣的一個(gè)“分”和“率”,所代表的能力和層次可能大有不同,背后還有很多的信息可挖掘。由于目前數(shù)據(jù)的收集缺乏規(guī)劃,因此不夠細(xì)致和到位,相關(guān)的教育工作者缺乏測(cè)量方面的專(zhuān)業(yè)知識(shí),不懂得對(duì)數(shù)據(jù)進(jìn)行深度挖掘與分析。
由此可見(jiàn),盡管教育大數(shù)據(jù)對(duì)學(xué)生的數(shù)據(jù)進(jìn)行了橫向和縱向的全方位采集,但在實(shí)際的教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)實(shí)踐中,對(duì)這些大數(shù)據(jù)的挖掘和利用還需要下大功夫。教育大數(shù)據(jù)給教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)既帶來(lái)了機(jī)遇,也帶來(lái)了挑戰(zhàn)。
(二)教育大數(shù)據(jù)給教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)帶來(lái)的機(jī)遇與挑戰(zhàn)
1.教育大數(shù)據(jù)豐富了教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)的內(nèi)涵,測(cè)評(píng)從碎片化走向系統(tǒng)化
(1)測(cè)評(píng)主體趨向多元化
在教育實(shí)踐活動(dòng)中,不同省市、區(qū)縣、學(xué)校以及學(xué)生個(gè)體都希望能夠獲得自身表現(xiàn)與發(fā)展的反饋信息。教育大數(shù)據(jù)為滿(mǎn)足這些不同層面的測(cè)評(píng)主體需求提供了數(shù)據(jù)基礎(chǔ)。目前,只給區(qū)域提供一個(gè)“分”和一個(gè)“率”,給學(xué)校提供一個(gè)“分”,給學(xué)生個(gè)體提供一個(gè)“分”,這些遠(yuǎn)不能滿(mǎn)足不同測(cè)評(píng)主體的需求。單純的一個(gè)“分”或“率”不能實(shí)現(xiàn)對(duì)不同區(qū)域與不同學(xué)校的科學(xué)、公正評(píng)估,需要根據(jù)不同層面主體的需求,提供不同的服務(wù)與質(zhì)量監(jiān)測(cè)評(píng)價(jià)報(bào)告。
(2)測(cè)評(píng)結(jié)果趨向細(xì)致化
隨著教育的發(fā)展,不同測(cè)評(píng)主體對(duì)教育反饋信息的需求已經(jīng)不滿(mǎn)足于一個(gè)簡(jiǎn)單、籠統(tǒng)的分?jǐn)?shù)。他們不但要求獲得學(xué)生知識(shí)掌握、能力發(fā)展的反饋信息,也希望進(jìn)一步了解學(xué)生知識(shí)與能力的相互作用以及學(xué)習(xí)方法、習(xí)慣、興趣、人格等因素對(duì)知識(shí)掌握和能力提升的影響。教育監(jiān)測(cè)評(píng)價(jià)結(jié)果需要根據(jù)新的教育形勢(shì)與客觀(guān)需求,運(yùn)用新型測(cè)量理論和現(xiàn)代科學(xué)技術(shù)實(shí)現(xiàn)對(duì)整體層面的診斷與評(píng)估,同時(shí)要能夠細(xì)化到課程的具體章節(jié)、單元及具體的單項(xiàng)能力。
(3)測(cè)評(píng)形式趨向多樣化
隨著計(jì)算機(jī)與信息技術(shù)的發(fā)展,測(cè)驗(yàn)從過(guò)去單一的紙筆形式發(fā)展到以計(jì)算機(jī)為載體的在線(xiàn)測(cè)試等多種測(cè)試形式,同時(shí)出現(xiàn)了基于經(jīng)典測(cè)量理論(Classical Test Theory,CTT)的傳統(tǒng)測(cè)驗(yàn)形式和基于項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)的自適應(yīng)測(cè)驗(yàn)。而計(jì)算機(jī)技術(shù)與現(xiàn)代測(cè)試?yán)碚撓嗷ソY(jié)合,又出現(xiàn)了計(jì)算機(jī)化的自適應(yīng)測(cè)驗(yàn)(CAT)形式。
2.教育大數(shù)據(jù)擴(kuò)展了教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)的維度,測(cè)評(píng)從橫向研究走向縱向研究
傳統(tǒng)的教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)局限于同一時(shí)間段的橫向比較與分析,無(wú)法提供學(xué)生個(gè)體縱向發(fā)展的信息反饋,而教育大數(shù)據(jù)為教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)的縱向追蹤研究提供了數(shù)據(jù)基礎(chǔ),從而能夠?qū)W(xué)生的發(fā)展進(jìn)行追蹤,為學(xué)生的發(fā)展提供更為全面的信息。同時(shí),其能為學(xué)生自我對(duì)比提供機(jī)會(huì),使教育評(píng)價(jià)更為科學(xué)、合理。
3.教育大數(shù)據(jù)擴(kuò)大了教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)的深度,測(cè)評(píng)從宏觀(guān)走向微觀(guān)
傳統(tǒng)的教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)只提供一個(gè)籠統(tǒng)的考試分?jǐn)?shù)或能力分?jǐn)?shù),而對(duì)于是什么因素導(dǎo)致學(xué)生試題做錯(cuò)及知識(shí)掌握情況等信息則無(wú)法獲取。隨著教育的深入發(fā)展,各測(cè)評(píng)主體都已不滿(mǎn)足于給學(xué)生一個(gè)簡(jiǎn)單的考試分?jǐn)?shù)或能力分?jǐn)?shù),他們更希望考試能夠提供診斷信息,能夠報(bào)告學(xué)生掌握了哪些知識(shí)點(diǎn),哪些知識(shí)點(diǎn)未掌握而需要補(bǔ)救。在大數(shù)據(jù)與信息時(shí)代下,教育質(zhì)量監(jiān)測(cè)與評(píng)既有必要也完全能夠從宏觀(guān)走向微觀(guān)。
4.教育大數(shù)據(jù)加大了教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)的難度,測(cè)評(píng)理論和技術(shù)從傳統(tǒng)走向創(chuàng)新
教育的發(fā)展對(duì)教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)提出了更高的要求。學(xué)生個(gè)體不僅僅需要一個(gè)整體的“分”,還需要“分”層面的分析,并能夠?qū)崿F(xiàn)因人而測(cè),因材施教。這不僅對(duì)測(cè)驗(yàn)命題提出了更高要求,也迫切需要測(cè)評(píng)與信息技術(shù)、計(jì)算機(jī)技術(shù)結(jié)合起來(lái),發(fā)展出新的測(cè)驗(yàn)理論與測(cè)驗(yàn)方法,對(duì)教育大數(shù)據(jù)進(jìn)行更為充分、更加深入的挖掘與分析,提供更加細(xì)致、科學(xué)的評(píng)價(jià)結(jié)果報(bào)告。
5.教育大數(shù)據(jù)改變了教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)的價(jià)值取向,測(cè)評(píng)從工具主義走向人本主義
教育大數(shù)據(jù)是關(guān)乎“人”的數(shù)據(jù),其宗旨始終是為學(xué)生的發(fā)展服務(wù)?;诨ヂ?lián)網(wǎng)技術(shù)的教育大數(shù)據(jù)采集模式也應(yīng)遵循“以人為本”的基本原則,堅(jiān)持以人為中心,以互聯(lián)網(wǎng)為輔助手段,樹(shù)立“互聯(lián)網(wǎng)+”的理念。在教育領(lǐng)域貫徹落實(shí)以人為本的科學(xué)發(fā)展觀(guān),就是要確立人在教育中的主體性,以每一個(gè)學(xué)生的健康成長(zhǎng)和終身幸福為本。[3]在教育大數(shù)據(jù)的形勢(shì)下,教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)的功能應(yīng)更多地從“選拔工具”轉(zhuǎn)向“診斷工具”,給出個(gè)性化評(píng)價(jià)結(jié)果。這種面向每一個(gè)學(xué)生的個(gè)性化的教育測(cè)評(píng),既是新形勢(shì)下人本主義教育價(jià)值觀(guān)的要求,也是“以學(xué)生為中心”的教育思想的體現(xiàn)。
隨著計(jì)算機(jī)技術(shù)的發(fā)展和教育大數(shù)據(jù)時(shí)代的來(lái)臨,教育測(cè)評(píng)理論和方法有了新的發(fā)展,從傳統(tǒng)的經(jīng)典測(cè)量理論(CTT)到現(xiàn)代的項(xiàng)目反應(yīng)理論(IRT),再到新一代的認(rèn)知診斷理論(CDT)。
(一)經(jīng)典測(cè)評(píng)理論與方法的回顧與評(píng)述
經(jīng)典測(cè)評(píng)理論又稱(chēng)真分?jǐn)?shù)理論,是心理和教育測(cè)量學(xué)發(fā)展歷史中最早實(shí)現(xiàn)數(shù)學(xué)形式化的測(cè)量理論。[4]CTT經(jīng)過(guò)幾十年的發(fā)展,形成了一套以真分?jǐn)?shù)理論作為基礎(chǔ)的較為完善的測(cè)驗(yàn)理論體系,其核心是經(jīng)典的信度理論。CTT認(rèn)為測(cè)驗(yàn)作為間接測(cè)量,要使測(cè)量與評(píng)價(jià)可靠,編制有恰當(dāng)難度、區(qū)分度的題目和控制測(cè)量誤差是提高測(cè)量信度、效度的有效手段。
CTT以弱假設(shè)為基礎(chǔ),這些弱假設(shè)條件容易被絕大多數(shù)測(cè)驗(yàn)數(shù)據(jù)資料所滿(mǎn)足。因此CTT在實(shí)際中有著很廣泛的應(yīng)用。同時(shí)其對(duì)題目和測(cè)驗(yàn)作統(tǒng)計(jì)分析的方法在計(jì)算上較為簡(jiǎn)單,意義上也明了直觀(guān),易于教育工作者理解和掌握,這也使得CTT的應(yīng)用較具普遍性。[5]
但是CTT的缺陷與不足也是非常明顯的:用CTT 方法所求得的題目參數(shù)會(huì)受到不同考生樣本組能力水平的影響,對(duì)考生能力的估計(jì)也會(huì)因測(cè)驗(yàn)的不同而不同。由CTT關(guān)于信度公式的分析推導(dǎo)中可知,CTT的信度值只是低限估計(jì),故只能假定測(cè)驗(yàn)誤差對(duì)所有考生都一樣。因而在某種意義上說(shuō),CTT難以提供考生得到分?jǐn)?shù)的精確信息,也就是說(shuō),難以實(shí)施與考生實(shí)際能力水平相當(dāng)?shù)目荚?,故而以“選拔”及突顯“專(zhuān)長(zhǎng)”為導(dǎo)向的測(cè)試難以實(shí)施。
(二)現(xiàn)代項(xiàng)目反應(yīng)理論及其優(yōu)勢(shì)
1963年發(fā)展的項(xiàng)目反應(yīng)理論是針對(duì)CTT的不足加以改進(jìn)的方法。IRT的最大特點(diǎn)就是它找到了一條題目特征曲線(xiàn)(Item Characteristic Curve,ICC),并且以多種數(shù)學(xué)表達(dá)式(或稱(chēng)數(shù)學(xué)模型)來(lái)描述它和逼近它。[6]題目特征曲線(xiàn)的數(shù)學(xué)模型一般包含兩個(gè)方面的參數(shù):題目參數(shù)和考生能力參數(shù)。從理論上說(shuō),IRT有效地解決了CTT中無(wú)法建立考生得分與測(cè)驗(yàn)題目參數(shù)之間函數(shù)關(guān)系的問(wèn)題,題目參數(shù)不受考生樣本影響,考生能力不因測(cè)驗(yàn)改變而改變。
在題目分析和估計(jì)考生能力的同時(shí),IRT可以得到題目信息函數(shù)和測(cè)驗(yàn)信息函數(shù)這兩個(gè)統(tǒng)計(jì)量。這兩個(gè)測(cè)驗(yàn)信息量為精確估計(jì)每個(gè)考生的能力水平提供了標(biāo)準(zhǔn),也為自適應(yīng)測(cè)驗(yàn)的實(shí)施提供了必要的條件。
IRT雖然具有這些優(yōu)勢(shì),但仍只有一個(gè)分?jǐn)?shù)(只不過(guò)這個(gè)分?jǐn)?shù)變成了能力水平)來(lái)評(píng)價(jià)考試結(jié)果,無(wú)法回答在考試中學(xué)生哪方面能力或知識(shí)的缺失造成了失分,學(xué)生存在哪些不足及應(yīng)如何補(bǔ)救。
(三)新一代認(rèn)知診斷理論及其優(yōu)勢(shì)
通常把對(duì)個(gè)體知識(shí)結(jié)構(gòu)、加工技能或認(rèn)知過(guò)程(均簡(jiǎn)稱(chēng)為“attribute”)的診斷評(píng)估稱(chēng)為認(rèn)知診斷 評(píng) 估 或 認(rèn) 知 診 斷( Cognitive Diagnosis Assessment/Cognitive Diagnosis)。[7]可以說(shuō),認(rèn)知診斷理論彌補(bǔ)了CTT和IRT只能提供一個(gè)測(cè)驗(yàn)分?jǐn)?shù)(或能力參數(shù))的不足,實(shí)現(xiàn)了對(duì)學(xué)生更為精細(xì)的診斷與區(qū)分。
認(rèn)知診斷理論把認(rèn)知過(guò)程與測(cè)量手段結(jié)合起來(lái),不僅能對(duì)考生的整體水平做出評(píng)估,同時(shí)將考生的認(rèn)知結(jié)構(gòu)模式化,利用合適的測(cè)量模型對(duì)不同的認(rèn)知結(jié)構(gòu)模式進(jìn)行診斷,從而定量地考查考生的認(rèn)知結(jié)構(gòu)和個(gè)體差異,實(shí)現(xiàn)因人而測(cè),并對(duì)不同的考生給出不同的評(píng)價(jià)結(jié)果。因此認(rèn)知診斷的結(jié)果更微觀(guān)、詳細(xì)、精確,除了估計(jì)每位考生的能力值,還可以診斷考生的學(xué)習(xí)優(yōu)勢(shì)或劣勢(shì),為提升或補(bǔ)救教學(xué)提供確切的依據(jù)。新一代認(rèn)知診斷理論具有廣闊的應(yīng)用前景。
經(jīng)典測(cè)量理論(CTT)、項(xiàng)目反應(yīng)理論(IRT)和認(rèn)知診斷理論(CDT)各有優(yōu)勢(shì)與不足。通過(guò)上面的分析,我們可以對(duì)這三種理論的優(yōu)勢(shì)與不足總結(jié)如下:
經(jīng)典測(cè)量理論(CTT)的優(yōu)勢(shì)在于它便于理解和操作,團(tuán)體可共用一份試卷,因此測(cè)驗(yàn)成本較低,在實(shí)際中的應(yīng)用也比較廣泛和成熟。其不足在于被試的能力水平與測(cè)驗(yàn)相關(guān)、題目參數(shù)與測(cè)驗(yàn)樣本相關(guān),被試能力與題目參數(shù)不在同一量尺上,同時(shí)CTT只提供一個(gè)信度值,測(cè)量誤差估計(jì)籠統(tǒng)、不精確,測(cè)驗(yàn)結(jié)果的準(zhǔn)確性與推廣性相矛盾。
項(xiàng)目反應(yīng)理論(IRT)克服了經(jīng)典測(cè)量理論(CTT)“測(cè)驗(yàn)相關(guān)”“樣本相關(guān)”等不足,對(duì)被試能力的估計(jì)比經(jīng)典測(cè)量理論更為精確,同時(shí)它也克服了經(jīng)典測(cè)量中所有被試完成同一份測(cè)驗(yàn)的弊端,實(shí)現(xiàn)了“因材施測(cè)”“因人而測(cè)”的目標(biāo)。其不足在于測(cè)驗(yàn)理論較為復(fù)雜,需要由具備統(tǒng)計(jì)測(cè)量學(xué)知識(shí)的專(zhuān)家進(jìn)行操作,對(duì)計(jì)算機(jī)的要求較高,測(cè)驗(yàn)樣本容量相對(duì)也較大,因此測(cè)驗(yàn)成本較高。此外,它對(duì)被試能力的定義還只是通過(guò)單一的能力值,未能進(jìn)一步考查被試的認(rèn)知結(jié)構(gòu)。
認(rèn)知診斷理論(CDT)繼承了IRT的優(yōu)良特性,不但可以因人而測(cè),還可以對(duì)不同的人給出不同的評(píng)價(jià)結(jié)果,做到可以不用“統(tǒng)考”也可以分析收集數(shù)據(jù),給出教學(xué)質(zhì)量的評(píng)價(jià)。它能夠精確地測(cè)量、診斷被試的認(rèn)知屬性結(jié)構(gòu),能夠?yàn)樘嵘蜓a(bǔ)救教學(xué)提供確切的依據(jù),為教學(xué)質(zhì)量的改進(jìn)與提高指明方向。其不足在于測(cè)驗(yàn)理論較為復(fù)雜,尤其是命題要求很高,需要由統(tǒng)計(jì)測(cè)量專(zhuān)家與認(rèn)知心理學(xué)專(zhuān)家、學(xué)科專(zhuān)家通力合作進(jìn)行。同時(shí)其對(duì)認(rèn)知屬性的劃分較為困難,需要根據(jù)所測(cè)認(rèn)知領(lǐng)域的特點(diǎn)結(jié)合專(zhuān)門(mén)技術(shù)進(jìn)行,因此初始測(cè)驗(yàn)的成本也較高。
隨著計(jì)算機(jī)技術(shù)的普及和教育大數(shù)據(jù)的獲得,三大測(cè)量理論在教育實(shí)踐中都有條件得以實(shí)現(xiàn)。除了CTT得到廣泛應(yīng)用之外,IRT和CDT也在國(guó)內(nèi)外大型測(cè)驗(yàn)中得到了應(yīng)用。因此,本文對(duì)三大測(cè)量理論在教育大數(shù)據(jù)下的應(yīng)用給出如下建議。CTT可以普遍使用,同時(shí)要將其相關(guān)的理論與知識(shí)進(jìn)行普及,使其成為每個(gè)教師除教育學(xué)、心理學(xué)、教學(xué)法以外應(yīng)該掌握的基本技能。IRT可以在學(xué)校、市、省級(jí)區(qū)域應(yīng)用,適用于會(huì)考、能力水平考試,以降低大規(guī)??荚嚨母鞣N壓力。CDT可以在學(xué)校、行政區(qū)層面應(yīng)用,也可以在高考改革及教育質(zhì)量監(jiān)測(cè)中應(yīng)用,為實(shí)現(xiàn)“因材施教”的個(gè)性化教學(xué)奠定了基礎(chǔ),應(yīng)用前景廣闊。
在教育大數(shù)據(jù)的理念下,基于新一代測(cè)量理論與方法的教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)將在教育活動(dòng)中發(fā)揮更大作用。
[1]Big Data: The Next Frontier for Innovation,Competition,and Productivity[EB/OL].[2011-5-30].http://www.mckinsey.com/ business-functions/business-technology/our-insights/big-data -the-next-frontier-for-innovation .
[2]金陵.大數(shù)據(jù)與信息化教學(xué)變革[J].中國(guó)電化教育,2013(10):8-13.
[3]楊東平.試論以人為本的教育價(jià)值觀(guān)[J].清華大學(xué)教育研究,2010(4):16-20.
[4]漆樹(shù)青,戴海琦,丁樹(shù)良.現(xiàn)代教育與心理測(cè)量學(xué)原理[M].北京:高等教育出版社,2002:26-27.
[5]張敏強(qiáng).教育測(cè)量理論與方法的應(yīng)用研究[J].華南師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),1992(3):73-83.
[6]張敏強(qiáng).教育測(cè)量學(xué)[M].北京:人民教育出版社,1998: 137.
[7]涂冬波,漆書(shū)青,戴海琦,蔡艷,丁樹(shù)良.教育考試中的認(rèn)知診斷評(píng)估[J].考試研究,2008(10):4-15.
(責(zé)任編輯吳全華)
The Evolution and Development of Education Quality Assessment under the Concept of Big Data
ZHANG Minqiang & FAN Xizhen & GUO Kaiyin & ZHONG Yang
By analyzing the characteristics of big data in education,this paper revealed the insufficient application of big data in education quality assessment and presented the five trends of education quality assessment under the big data era: systematical,longitudinal,microcosmic,innovative,people-oriented.Based on these above,the paper discussed the advantages and limitations of Classical Testing Theory(CTT),Item Response Theory(IRT),Cognitive Diagnosis Theory(CDT).Suggestions on applications of CTT,IRT,CDT were proposed.
education quality assessment;big data;classical testing theory;item response theory;cognitive diagnosis
G40-034
A
2095-6762(2016)03-0002-05 2011年5月,世界著名的麥肯錫全球研究院(McKinsey Global Institute)發(fā)布了一篇題為《大數(shù)據(jù):創(chuàng)新,競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿》(Big Data: The Next Frontier for Innovation,Competition,and Productivity)的報(bào)告,宣告了“大數(shù)據(jù)時(shí)代的到來(lái)”[1]。大數(shù)據(jù)時(shí)代的到來(lái)對(duì)整個(gè)社會(huì)都產(chǎn)生了重要的影響,教育也不例外。大數(shù)據(jù)在教育領(lǐng)域中的應(yīng)用不僅可以實(shí)現(xiàn)對(duì)學(xué)生的量體裁衣式的教育,而且可以讓家長(zhǎng)了解到更為詳細(xì)的教育信息,更加能夠?yàn)榻處煹慕虒W(xué)提供客觀(guān)全面的教學(xué)反饋信息,而教育管理也能從中獲取信息和依據(jù),更好地組織教育資源、制定教育改革發(fā)展的措施,從而實(shí)現(xiàn)“以學(xué)生為中心”的人本主義教育。其達(dá)到上述理想效用有賴(lài)于教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)對(duì)大數(shù)據(jù)的利用與挖掘。教育大數(shù)據(jù)給教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)帶來(lái)機(jī)遇的同時(shí),也給其帶來(lái)了挑戰(zhàn)。在大數(shù)據(jù)理念和科學(xué)技術(shù)迅速發(fā)展的當(dāng)下,教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)也正經(jīng)歷著一系列的發(fā)展與變革。
2016-05-19
張敏強(qiáng),廣東省心理健康與認(rèn)知科學(xué)重點(diǎn)實(shí)驗(yàn)室、華南師范大學(xué)心理應(yīng)用研究中心、華南師范大學(xué)心理學(xué)院教授,博士生導(dǎo)師(廣東廣州,510631);凡細(xì)珍,華南師范大學(xué)心理學(xué)院博士研究生(廣東廣州,510631);郭凱茵,廣東省心理學(xué)會(huì)教育測(cè)量與考試評(píng)價(jià)技術(shù)研究院副院長(zhǎng)(廣東廣州;510631);鐘陽(yáng),廣州市教育研究院教育質(zhì)量評(píng)價(jià)與監(jiān)測(cè)部主任(廣東廣州,510030)
* 本文系廣州市教育科學(xué)“十二五”規(guī)劃 2014年度重大課題“基于現(xiàn)代教育測(cè)量學(xué)的中小學(xué)學(xué)業(yè)質(zhì)量評(píng)價(jià)應(yīng)用研究”(課題編號(hào):1201411413)、國(guó)家社會(huì)科學(xué)基金“十二五”規(guī)劃教育學(xué)一般課題“促進(jìn)區(qū)域教育發(fā)展的學(xué)業(yè)質(zhì)量測(cè)評(píng)體系研究”(項(xiàng)目編號(hào):BHA130053)及2016年廣州市中小學(xué)教育質(zhì)量陽(yáng)光評(píng)價(jià)項(xiàng)目第二期(項(xiàng)目編號(hào):GZJY2051S/YD16G0510)的研究成果。