□趙茜 錢阿劍
推動(dòng)基礎(chǔ)教育高質(zhì)量均衡發(fā)展,已然成為各國(guó)普遍的教育訴求。在此背景下,積極開展基礎(chǔ)教育質(zhì)量監(jiān)測(cè)評(píng)價(jià),成為掌握教育質(zhì)量狀況的有效舉措。美國(guó)、法國(guó)以及我國(guó)都形成了較為完備的基礎(chǔ)教育質(zhì)量監(jiān)測(cè)評(píng)價(jià)體系,還有一些國(guó)際組織也積極開展國(guó)際大型教育質(zhì)量監(jiān)測(cè)項(xiàng)目,如TALIS、PIRLS、PISA、TIMSS 等,為各國(guó)教育質(zhì)量的比較研究提供了實(shí)證數(shù)據(jù)。教育質(zhì)量的內(nèi)涵是多層次、全要素和全過(guò)程的,由于不同監(jiān)測(cè)評(píng)價(jià)項(xiàng)目在對(duì)教育質(zhì)量的內(nèi)涵維度的界定上存在差異,因此表現(xiàn)出不同的監(jiān)測(cè)評(píng)價(jià)模式,分別是“單一要素”模式、“雙因素”模式以及“三因素”模式。
基于一般的基礎(chǔ)教育質(zhì)量監(jiān)測(cè)評(píng)價(jià)框架,監(jiān)測(cè)評(píng)價(jià)主要從教育產(chǎn)出和影響教育產(chǎn)出的背景、輸入和過(guò)程因素兩方面對(duì)教育質(zhì)量進(jìn)行考察。[1]教育產(chǎn)出的定義大多從學(xué)生發(fā)展的角度著手,有兩種基本取向,即核心素養(yǎng)和課程標(biāo)準(zhǔn)。但是,“單一要素”模式的教育質(zhì)量監(jiān)測(cè)項(xiàng)目,只注重學(xué)生單方面素養(yǎng)或?qū)W科能力的測(cè)量,并不能考察學(xué)生的全面發(fā)展情況。如國(guó)際閱讀素養(yǎng)進(jìn)展項(xiàng)目PIRLS(Progress in International Reading Literacy Study)以及數(shù)學(xué)和科學(xué)學(xué)科的國(guó)際測(cè)評(píng)項(xiàng)目TIMSS(Trends in International Mathematics and Science Study),前者僅對(duì)學(xué)生的閱讀素養(yǎng)進(jìn)行測(cè)量,而后者則是從課程標(biāo)準(zhǔn)出發(fā),測(cè)量四、八年級(jí)學(xué)生數(shù)學(xué)和科學(xué)學(xué)科的達(dá)標(biāo)情況。
“單一要素”模式的另一種類型并不是直接以教育產(chǎn)出作為自己的監(jiān)測(cè)指標(biāo),而是著重以影響教育產(chǎn)出的背景、輸入和過(guò)程中的某一要素作為監(jiān)測(cè)的主要指標(biāo),以求通過(guò)該要素的改進(jìn),培養(yǎng)學(xué)生的核心素養(yǎng)或達(dá)到某學(xué)科的課程標(biāo)準(zhǔn)。例如,教師教學(xué)國(guó)際調(diào)查項(xiàng)目TALIS(Teaching and Learning International Survey)就是“單一要素”模式的典型代表。它的調(diào)查對(duì)象并不是學(xué)生,而是教師和校長(zhǎng),它詳細(xì)測(cè)量了教師專業(yè)發(fā)展、教師評(píng)價(jià)與反饋、教學(xué)實(shí)踐、信念與態(tài)度以及校長(zhǎng)領(lǐng)導(dǎo)力等指標(biāo),而這些指標(biāo)大部分屬于影響教育產(chǎn)出的過(guò)程因素。
不同于“單一要素”模式,“雙因素”模式的監(jiān)測(cè)評(píng)價(jià)項(xiàng)目充分體現(xiàn)了教育質(zhì)量三維度中的兩個(gè)基本特征。“雙因素”模式可以進(jìn)一步區(qū)分為兩種子類型:一是“多層次+全要素”模式,我國(guó)義務(wù)教育質(zhì)量監(jiān)測(cè)屬于該模式;二是“全要素+全過(guò)程”模式,國(guó)際學(xué)生評(píng)估項(xiàng)目PISA(the Program for International Student Assessment)是其典型代表。
我國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)在“中央統(tǒng)一領(lǐng)導(dǎo)、省級(jí)政府統(tǒng)籌、地方分級(jí)負(fù)責(zé)”的教育管理體制下,形成了清晰的國(guó)家、?。ㄗ灾螀^(qū)、直轄市)、市(地)、縣(區(qū))四個(gè)層次的縱向監(jiān)測(cè)網(wǎng)絡(luò)。[2]不同行政區(qū)位的監(jiān)測(cè)模式,在功能定位上存在明顯的差異性。整體而言,國(guó)家在于提供監(jiān)測(cè)標(biāo)準(zhǔn)和技術(shù),省、市負(fù)責(zé)本地規(guī)劃,縣(區(qū))負(fù)責(zé)監(jiān)測(cè)實(shí)施。[3]部分學(xué)者也從“國(guó)家—區(qū)域”兩個(gè)層次對(duì)我國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)模式進(jìn)行了功能劃分,認(rèn)為國(guó)家層面的監(jiān)測(cè)在于把握全國(guó)基礎(chǔ)教育質(zhì)量的總體狀況,重在“診斷”;而區(qū)域監(jiān)測(cè)則關(guān)注于解決區(qū)域的實(shí)際問題,重在“診斷”后的“治療”。[4]不同層次的評(píng)估模式,由于所關(guān)注的教育質(zhì)量在外延上具有差異性,因此既能夠提供宏觀層次的信息,也能夠獲得中觀和微觀層次的信息,通過(guò)不同層次信息之間的互補(bǔ),從而獲得對(duì)基礎(chǔ)教育質(zhì)量的完整構(gòu)圖。
教育質(zhì)量的全要素特征不僅需要在教育產(chǎn)出上注重學(xué)生的全面發(fā)展,同時(shí)也需要考慮影響學(xué)生發(fā)展的全維度因素,包括背景要素、投入要素以及過(guò)程要素,按照生態(tài)系統(tǒng)理論的觀點(diǎn),也可以將所有影響學(xué)生發(fā)展的環(huán)境要素劃分為微觀系統(tǒng)、中觀系統(tǒng)、外層系統(tǒng)以及宏觀系統(tǒng)。我國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)充分體現(xiàn)了全要素特征。2021 年教育部印發(fā)的 《國(guó)家義務(wù)教育質(zhì)量監(jiān)測(cè)方案(2021年修訂版)》 中,就確定以德育、語(yǔ)文、數(shù)學(xué)、英語(yǔ)、科學(xué)、體育與健康、藝術(shù)、勞動(dòng)、心理健康等九個(gè)學(xué)科領(lǐng)域以及影響學(xué)業(yè)水平的相關(guān)因素作為主要監(jiān)測(cè)內(nèi)容。
國(guó)際學(xué)生評(píng)估項(xiàng)目PISA(the Program for International Student Assessment)的分析單位是國(guó)家,旨在為不同國(guó)家提供教育質(zhì)量的實(shí)證數(shù)據(jù),因此并不具有多層次的特征,但是對(duì)全要素維度是十分重視的。PISA 基于背景—投入—過(guò)程—產(chǎn)出(CIPO,Context-Input-Process-Output)框架,從核心素養(yǎng)出發(fā),利用標(biāo)準(zhǔn)化測(cè)試方式,測(cè)量了學(xué)生的閱讀、數(shù)學(xué)和科學(xué)等學(xué)科素養(yǎng),還考察了學(xué)生解決問題的能力、創(chuàng)造性思維、全球勝任力等關(guān)鍵能力,了解他們是否具備應(yīng)對(duì)未來(lái)生活所需的知識(shí)、技能和終身學(xué)習(xí)的能力。除了認(rèn)知領(lǐng)域的測(cè)評(píng)外,PISA 還通過(guò)問卷的形式,收集學(xué)生非認(rèn)知領(lǐng)域的大量信息,涉及學(xué)生學(xué)習(xí)的情感、態(tài)度、價(jià)值觀,更為全面地反映學(xué)生的發(fā)展水平。除了對(duì)學(xué)生的核心素養(yǎng)進(jìn)行測(cè)試外,PISA 還通過(guò)多主體問卷(學(xué)生、家長(zhǎng)、教師、學(xué)校)獲得影響學(xué)生成長(zhǎng)的背景、投入與過(guò)程性因素,涉及學(xué)生的社會(huì)人口信息、社會(huì)經(jīng)濟(jì)地位,教師教學(xué)、專業(yè)發(fā)展,學(xué)校性質(zhì)、學(xué)校管理以及學(xué)校政策等指標(biāo)。
教育質(zhì)量監(jiān)測(cè)的全過(guò)程特征主要體現(xiàn)在監(jiān)測(cè)數(shù)據(jù)的收集與分析環(huán)節(jié)中。隨著教育信息化的不斷推進(jìn),大數(shù)據(jù)、云計(jì)算、人工智能、視頻分析等技術(shù)和教育質(zhì)量監(jiān)測(cè)與評(píng)價(jià)實(shí)現(xiàn)了深度融合,使得教育質(zhì)量數(shù)據(jù)的收集,從傳統(tǒng)的紙筆測(cè)試逐步過(guò)渡到基于互聯(lián)網(wǎng)的測(cè)試,如人機(jī)交互測(cè)試、計(jì)算機(jī)自適應(yīng)測(cè)試等,不但實(shí)現(xiàn)了監(jiān)測(cè)內(nèi)容的拓展,收集了大量過(guò)程性數(shù)據(jù)和對(duì)高階思維能力的測(cè)試,而且也為監(jiān)測(cè)反饋的即時(shí)性創(chuàng)造了條件。PISA 充分利用互聯(lián)網(wǎng)測(cè)試的優(yōu)勢(shì),一方面,收集了學(xué)生在計(jì)算機(jī)測(cè)試中的過(guò)程性數(shù)據(jù),如學(xué)生在每道題上的作答反應(yīng)時(shí)間,從而為后續(xù)項(xiàng)目進(jìn)行指標(biāo)合成提供額外的信息;另一方面,人機(jī)交互測(cè)試使高階核心素養(yǎng)的真實(shí)測(cè)量成為可能,如考察學(xué)生的問題解決能力或創(chuàng)新能力等。
此外,在智慧學(xué)習(xí)環(huán)境的推動(dòng)下,基于課堂視頻分析的相關(guān)技術(shù)和資料得到了發(fā)展和積累,將課堂視頻中與教育質(zhì)量指標(biāo)相關(guān)的痕跡信息提取出來(lái),并對(duì)所提取的信息進(jìn)行評(píng)價(jià)分析,可以實(shí)現(xiàn)對(duì)學(xué)生相關(guān)指標(biāo)的連續(xù)追蹤和動(dòng)態(tài)監(jiān)測(cè),為教育質(zhì)量的改進(jìn)和提升提供全面、及時(shí)、準(zhǔn)確的信息反饋。[5]經(jīng)濟(jì)合作與發(fā)展組織(OECD)的TALIS 視頻分析,就是課堂視頻分析的典型范例。2020 年11 月,OECD 發(fā)布的全球教學(xué)洞察(Global Teaching Insights,GTI)視頻研究數(shù)據(jù)報(bào)告,分別從課堂管理、社會(huì)情感支持、學(xué)生認(rèn)知參與、課堂話語(yǔ)、學(xué)科內(nèi)容質(zhì)量和基于學(xué)生理解的評(píng)價(jià)及回應(yīng)6 個(gè)觀測(cè)維度,對(duì)“教學(xué)”進(jìn)行結(jié)構(gòu)性評(píng)價(jià)[6],為我們精確刻畫了課堂教學(xué)的動(dòng)態(tài)模式,提供了較為完整的構(gòu)圖。
“三因素”模式是最為系統(tǒng)、完備的基礎(chǔ)教育質(zhì)量監(jiān)測(cè)評(píng)價(jià)模式,具有多層次、全要素和全過(guò)程的基本特征。被稱為美國(guó)“國(guó)家成績(jī)報(bào)告卡”的國(guó)家教育進(jìn)展評(píng)估NAEP(National Assessment of Educational Progress),便是該模式最為典型的代表;法國(guó)的基礎(chǔ)教育質(zhì)量評(píng)價(jià)體系,也屬于該種模式。
“三因素”模式的多層次特征不僅表現(xiàn)在縱向的行政區(qū)位結(jié)構(gòu)上,同時(shí)也體現(xiàn)在橫向的專題類型之中。NAEP 在主評(píng)估項(xiàng)目中,依據(jù)行政區(qū)位劃分為全國(guó)性評(píng)估、州評(píng)估以及學(xué)區(qū)評(píng)估,以了解不同層面的基礎(chǔ)教育質(zhì)量現(xiàn)狀。同時(shí),NAEP 除了主評(píng)估項(xiàng)目之外,還包括長(zhǎng)期趨勢(shì)評(píng)估和專項(xiàng)研究評(píng)估這兩種主要的評(píng)估模式。其中,長(zhǎng)期趨勢(shì)評(píng)估在于了解全國(guó)特定年齡青少年的知識(shí)與技能水平,從而掌握基礎(chǔ)教育質(zhì)量發(fā)展的基本趨勢(shì);而專項(xiàng)研究又可以進(jìn)一步劃分為關(guān)注特定學(xué)生群體的研究、專題領(lǐng)域的研究以及將NAEP 結(jié)果與其他項(xiàng)目結(jié)果進(jìn)行對(duì)接的研究等。[7]法國(guó)基礎(chǔ)教育質(zhì)量評(píng)價(jià)體系在國(guó)家測(cè)評(píng)之外,也包括兩種主要的評(píng)估模式,即學(xué)生學(xué)業(yè)診斷和學(xué)校發(fā)展評(píng)估。前者評(píng)估的對(duì)象是學(xué)生,通過(guò)學(xué)業(yè)診斷信息報(bào)告,幫助學(xué)生獲知自身當(dāng)前的學(xué)習(xí)水平以及存在的問題,而學(xué)校發(fā)展評(píng)估的對(duì)象是學(xué)校,是對(duì)學(xué)校整體辦學(xué)力量和水平的綜合評(píng)估。[8]
高質(zhì)量公平是教育的基本追求,全要素特征下的教育質(zhì)量監(jiān)測(cè)不僅表現(xiàn)在對(duì)CIPO 四要素的評(píng)價(jià),同時(shí)也指向教育公平的監(jiān)測(cè)評(píng)價(jià)。如果說(shuō)注重學(xué)生發(fā)展的質(zhì)量監(jiān)測(cè)是以提高整體水平為目標(biāo)的話,那么教育公平關(guān)注的是縮小差距,即縮小群體間、學(xué)校間、城鄉(xiāng)間以及區(qū)域間的教育質(zhì)量差距。NAEP 從建立之初就提出了要“關(guān)注弱勢(shì)群體,體現(xiàn)評(píng)價(jià)公正”的主張,對(duì)不同性別、種族、家庭社會(huì)背景的學(xué)生學(xué)業(yè)表現(xiàn)進(jìn)行了持續(xù)跟蹤,以此評(píng)估相關(guān)教育公平政策的實(shí)施效果。[9]但是部分學(xué)者認(rèn)為,教育結(jié)果公平并不是指每個(gè)不同背景的學(xué)生在教育結(jié)果上完全平等,而是將學(xué)生的性別、年齡、社會(huì)經(jīng)濟(jì)地位等因素進(jìn)行跟蹤監(jiān)測(cè),教育系統(tǒng)自身的變量對(duì)學(xué)生學(xué)習(xí)結(jié)果所造成的影響是平等的。[10]雖然這一想法并沒有具體落實(shí)到教育質(zhì)量監(jiān)測(cè)評(píng)價(jià)項(xiàng)目中,但是為我們提供了一種較為科學(xué)合理地呈現(xiàn)教育結(jié)果公平的思路。
NAEP 不但是多層次、全要素的監(jiān)測(cè),在監(jiān)測(cè)數(shù)據(jù)的收集與分析環(huán)節(jié)中,也充分體現(xiàn)了質(zhì)量監(jiān)測(cè)的全過(guò)程特征。而大部分國(guó)家或國(guó)際大型教育質(zhì)量監(jiān)測(cè)項(xiàng)目,采集的學(xué)生發(fā)展信息及其關(guān)鍵影響因素,多為“靜態(tài)”或“截面”的數(shù)據(jù),反映的只是基于某一調(diào)查時(shí)間點(diǎn)上學(xué)生所處的結(jié)果狀態(tài),無(wú)法獲悉學(xué)生的學(xué)習(xí)和發(fā)展過(guò)程。為了了解基礎(chǔ)教育質(zhì)量的發(fā)展趨勢(shì),NAEP 除了主評(píng)估之外,還實(shí)施了長(zhǎng)期趨勢(shì)評(píng)估,對(duì)9、13、17歲學(xué)生的數(shù)學(xué)和閱讀能力進(jìn)行測(cè)試,每4 年進(jìn)行1 次,利用增值評(píng)價(jià)模型對(duì)學(xué)生的“進(jìn)步”“發(fā)展”情況進(jìn)行評(píng)價(jià)[11],這與“為了改進(jìn)”而實(shí)施的監(jiān)測(cè)評(píng)價(jià)是相得益彰的。
借助現(xiàn)代教育測(cè)量理論與技術(shù)的新進(jìn)展,如矩陣抽樣技術(shù)、測(cè)驗(yàn)等值技術(shù)、項(xiàng)目反應(yīng)理論、認(rèn)知診斷理論、自動(dòng)化評(píng)分等,不但實(shí)現(xiàn)了趨勢(shì)研究中不同年份數(shù)據(jù)的可比性,同時(shí)使得教育質(zhì)量監(jiān)測(cè)的反饋直接指向?qū)W生個(gè)體及其教師,為開展有針對(duì)性的補(bǔ)救教學(xué)提供了依據(jù)。在法國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)體系中,就包括對(duì)學(xué)生學(xué)業(yè)的診斷。教師通過(guò)授權(quán)獲得使用網(wǎng)上測(cè)試工具庫(kù)的權(quán)限,然后對(duì)學(xué)生個(gè)體的學(xué)業(yè)成就進(jìn)行診斷評(píng)估。同時(shí),該工具庫(kù)還會(huì)對(duì)測(cè)試結(jié)果進(jìn)行解釋、分析,并為教師提供教學(xué)改進(jìn)的建議。另外,基于互聯(lián)網(wǎng)技術(shù)的在線評(píng)估成了法國(guó)教育質(zhì)量監(jiān)測(cè)評(píng)價(jià)的重要手段,它提供了自動(dòng)化評(píng)分,并以文字和圖表等多種形式,報(bào)告各學(xué)校及其學(xué)生的進(jìn)步和表現(xiàn)。[12]
我國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)評(píng)價(jià)正逐步從“雙因素”模式向“三因素”模式轉(zhuǎn)變,即在多層次和全要素層次的不斷深化中,逐漸納入全過(guò)程性因素。首先,在多層次上,雖然我國(guó)形成了較為完備的縱向監(jiān)測(cè)網(wǎng)絡(luò)結(jié)構(gòu),但是橫向上的專題評(píng)估模式發(fā)展仍然是較為滯后的,尚未將不同專題類型的監(jiān)測(cè)模式整合進(jìn)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)評(píng)價(jià)體系之中。建構(gòu)完善的橫向?qū)n}評(píng)估結(jié)構(gòu),是我國(guó)基礎(chǔ)教育質(zhì)量評(píng)價(jià)的未來(lái)發(fā)展趨勢(shì)之一。其次,在全要素上,需要逐步從基于課程標(biāo)準(zhǔn)的測(cè)評(píng)向基于學(xué)生核心素養(yǎng)的測(cè)評(píng)轉(zhuǎn)變[5],從質(zhì)量維度的測(cè)評(píng)向質(zhì)量和公平有機(jī)結(jié)合的測(cè)評(píng)轉(zhuǎn)變,不管是在監(jiān)測(cè)內(nèi)容、監(jiān)測(cè)工具設(shè)計(jì)環(huán)節(jié)、還是數(shù)據(jù)收集與分析環(huán)節(jié),都需要融入公平的視角。最后,我國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)亟需建構(gòu)起面向全過(guò)程的數(shù)據(jù)收集與分析模式。一方面,在開展截面數(shù)據(jù)項(xiàng)目的同時(shí),進(jìn)行趨勢(shì)追蹤數(shù)據(jù)的試點(diǎn),為增值評(píng)價(jià)的開展提供可行的數(shù)據(jù)支持;另一方面,充分發(fā)揮計(jì)算機(jī)測(cè)試的優(yōu)越性,開發(fā)在線測(cè)評(píng)工具庫(kù),為高階思維能力的測(cè)試創(chuàng)造條件。