楊中超,杜 屏
(1.國家教育行政學(xué)院,北京 102617;2.北京師范大學(xué),北京 100875)
隨著國外學(xué)校效能與學(xué)校改進(jìn)研究的推進(jìn),學(xué)校評價在研究界引起學(xué)者們的廣泛關(guān)注,相關(guān)研究成果不斷涌現(xiàn)并推動著學(xué)校教育實(shí)踐的深化與發(fā)展,學(xué)校評價對學(xué)校發(fā)展的引導(dǎo)作用越來越受到實(shí)踐者的重視。世界經(jīng)濟(jì)合作組織(OECD)和歐盟委員會于2013年、2015年發(fā)布專題報告對其成員國中小學(xué)學(xué)校評價的現(xiàn)狀和趨勢做了系統(tǒng)分析?;诖耍狙芯吭噲D梳理國外學(xué)校評價的主要特征及未來政策走向,以期在教育領(lǐng)域權(quán)力下放、學(xué)校自主權(quán)擴(kuò)大的背景下,對改進(jìn)和完善我國學(xué)校評價實(shí)踐,推進(jìn)基礎(chǔ)教育質(zhì)量綜合評價改革提供借鑒。
一般而言,學(xué)校評價從形式上可分為外部學(xué)校評價和內(nèi)部學(xué)校評價兩類。具體到每一種具體形式的評價,不同國家在評價標(biāo)準(zhǔn)、范圍、程序和結(jié)果使用上雖然存在差異,但也呈現(xiàn)出較強(qiáng)的一致性。
外部學(xué)校評價是外部評價者對一所學(xué)校內(nèi)部運(yùn)行結(jié)構(gòu)和過程的質(zhì)量以及學(xué)生學(xué)習(xí)成果質(zhì)量的評估。歐盟成員國廣泛開展外部學(xué)校評價,基本上都是中央或最高機(jī)構(gòu)負(fù)責(zé),只是在愛沙尼亞、匈牙利、奧地利、波蘭和土耳其五個國家,執(zhí)行外部學(xué)校評價的責(zé)任不同程度被下放到地方一級。[1]
外部學(xué)校評價標(biāo)準(zhǔn)通常高度標(biāo)準(zhǔn)化,并且在許多國家都設(shè)置在中央層面,不僅描繪了外部評價應(yīng)該關(guān)注什么,而且定義了一所好學(xué)校要達(dá)到什么樣標(biāo)準(zhǔn)。評價內(nèi)容包括教育管理目標(biāo)、學(xué)生結(jié)果、教學(xué)質(zhì)量和遵守法規(guī)等,具體評價范圍因國而異,比如土耳其主要集中在遵守法規(guī)方面。評價形式分定期評價、抽查或項(xiàng)目評價,以及兩者結(jié)合三類,時間間隔從2至10年不等,一般為5年。
雖然外部學(xué)校評價在評價范圍上有些差異,但在程序上卻呈現(xiàn)出相當(dāng)同質(zhì)的畫面,主要包括數(shù)據(jù)收集與前期分析、現(xiàn)場考察和撰寫評價報告三個階段。第一階段是收集和分析學(xué)校信息。雖然在不同國家中小學(xué)學(xué)校間存在差異,但大體涵蓋以下四個方面:一是績效和其他指標(biāo)的統(tǒng)計數(shù)據(jù),包括學(xué)生成績、學(xué)生數(shù)、學(xué)生保留率、生師比、教師流動率和出勤率等;二是報告和其他定性文件,比如內(nèi)部評價報告、學(xué)校發(fā)展規(guī)劃和一般學(xué)校政策文件等;三是行政文件,比如校歷、董事會會議記錄和學(xué)校內(nèi)部規(guī)章制度等;四是來自各種學(xué)校利益相關(guān)者,如學(xué)校領(lǐng)導(dǎo)、教師、家長、學(xué)生和當(dāng)?shù)厣鐓^(qū)代表的信息。第二階段是實(shí)地考察學(xué)校。此階段是外部學(xué)校評價工作的普遍行為。在實(shí)地考察中,評價者可以翻閱學(xué)校檔案、觀察教學(xué)活動,與學(xué)校內(nèi)部人員,甚至學(xué)校外部利益相關(guān)者座談,借此評價者可獲取關(guān)于學(xué)校表現(xiàn)和運(yùn)作的一手材料。考察時間跨度取決于檢查的復(fù)雜性或?qū)W校規(guī)模,最少一天(奧地利和瑞典),最多七天,平均為兩到三天。為減少對學(xué)校的打擾,當(dāng)前雖然依舊保持對所有學(xué)校開展定期外部評價,但已壓縮了對好學(xué)校的評估時間和次數(shù),而是更多地關(guān)注薄弱學(xué)校。學(xué)校利益相關(guān)者的參與是歐盟議會和理事會向成員國制定的關(guān)于學(xué)校教育質(zhì)量評價合作的建議之一,并被視作“促進(jìn)改善學(xué)校的共同責(zé)任”的有力工具,比如在愛沙尼亞、波蘭、葡萄牙和瑞典等國,學(xué)生、家長和當(dāng)?shù)厣鐓^(qū)代表的意見在評價階段都會被考慮;在捷克、德國和西班牙等國僅限于學(xué)生和家長。第三階段是撰寫評價報告。在大多數(shù)國家,撰寫評價報告是評價人員和學(xué)校管理層之間的對話過程,某些情況下教師也參與其中。評價報告處理方式一般包括公開、有限制的公開(比如依據(jù)請求)和不公開三種。除丹麥和西班牙等少數(shù)國家外,大多數(shù)國家都會公布最終的外部學(xué)校評價報告。學(xué)校評價報告為學(xué)校利益相關(guān)者提供了重要的信息來源,尤其是在父母和學(xué)生有學(xué)校選擇權(quán)的荷蘭或英國某些地區(qū),這有助于他們?yōu)樽优雽W(xué)作出明智選擇。盡管如此,這也可能觸發(fā)類似市場機(jī)制,增加學(xué)校之間的生源競爭。事實(shí)上,在大多數(shù)國家,允許擇校和公布外部評價結(jié)果不會共存。
面對評價結(jié)果,學(xué)校、評價者和教育當(dāng)局一般會采取三類行為:補(bǔ)救行動(remedial actions)、懲罰行動(disciplinary actions)和提升行動(profile-raising actions),其中以補(bǔ)救行動最為常見。補(bǔ)救行動旨在解決評價人員發(fā)現(xiàn)的缺陷或糾正法規(guī)中的不合理之處,改善學(xué)校教育質(zhì)量。有的政府會向?qū)W校提供支持性措施,比如讓評價人員參與后續(xù)改進(jìn)行動、提供額外的培訓(xùn)或資源等。當(dāng)補(bǔ)救行動未達(dá)目的時,教育當(dāng)局會對學(xué)校整體(極少數(shù)是個人)進(jìn)行懲罰,包括終止資助或扣留預(yù)算(英國和荷蘭)、取消頒發(fā)國家認(rèn)可證書的權(quán)利(拉脫維亞),甚至關(guān)閉學(xué)校(捷克)。提升行動是指認(rèn)可、激勵和傳播外部評價過程中發(fā)現(xiàn)的學(xué)校優(yōu)勢和良好做法,在法國甚至?xí)o表現(xiàn)良好或有創(chuàng)新性的學(xué)校額外資源獎勵。
外部學(xué)校評價的一個關(guān)鍵問題是要確保評價者具有足夠的資質(zhì)。外部評價人員的任命都有一定的資格限制,并且通常要在任命前或試用期間接受專門培訓(xùn)。在大多數(shù)國家,申請者必須具有教學(xué)資格,有一定的教師或?qū)W校管理職位的專業(yè)經(jīng)驗(yàn)。在意大利、葡萄牙和冰島,評價團(tuán)隊(duì)還吸納了具有研究或?qū)W術(shù)資歷的評價人員。除了正式的資格和專業(yè)經(jīng)驗(yàn),一些國家還根據(jù)技能、知識和能力選擇候選人,比如愛爾蘭和斯洛伐克看重交流和報告技能;在西班牙和愛爾蘭,使用多種語言的能力也很重要。盡管如此,也有質(zhì)疑者認(rèn)為吸引越來越多經(jīng)驗(yàn)豐富的教育工作者退出學(xué)校加入評價隊(duì)伍中,可能會降低學(xué)校系統(tǒng)的教育質(zhì)量。
內(nèi)部學(xué)校評價也稱學(xué)校自我評價,是學(xué)校自己評價自己質(zhì)量的過程。評價內(nèi)容涉及學(xué)校的方方面面,從教學(xué)方法到管理效率。歐盟議會和理事會2001年關(guān)于學(xué)校教育質(zhì)量評價合作的建議呼吁會員國把“鼓勵學(xué)校自我評價作為創(chuàng)造學(xué)習(xí)和改進(jìn)學(xué)校的一種方法”。起初內(nèi)部學(xué)校評價多是建議進(jìn)行,如今在除保加利亞和法國(僅限于小學(xué))外的歐盟內(nèi)三分之二的教育系統(tǒng)中,都已變成強(qiáng)制開展。
內(nèi)部學(xué)校評價通常每年進(jìn)行一次,主要由學(xué)校工作人員執(zhí)行,在某些情況下,會與其他學(xué)校利益相關(guān)者,如學(xué)生、家長或當(dāng)?shù)厣鐓^(qū)成員合作。學(xué)生、家長和其他學(xué)校利益相關(guān)者的參與被視為成功內(nèi)部學(xué)校評價的一個重要特點(diǎn),因?yàn)樗龠M(jìn)了學(xué)校改進(jìn)的共同責(zé)任。實(shí)際上,即使在沒有法規(guī)明文規(guī)定的國家,比如愛爾蘭、芬蘭、挪威以及英國的蘇格蘭,中央當(dāng)局往往鼓勵利益相關(guān)者參與內(nèi)部學(xué)校評價。
自我評價能力方面不同學(xué)校存在顯著差異,國家或地方政府對學(xué)校自我評價的有力支持被認(rèn)為是確保學(xué)校自我評價過程有效的重要因素。除保加利亞外,幾乎所有歐盟國家都至少采取一項(xiàng)或多項(xiàng)措施,支持和幫助中小學(xué)學(xué)校進(jìn)行內(nèi)部評價。這些措施包括:開展專門培訓(xùn)、提供評價框架和指標(biāo)、提供指南和手冊、建立在線論壇、提供專家咨詢,以及在某些情況下的財政支持。2004年,只有四分之一的國家允許學(xué)校使用考試成績等指標(biāo)與其他同類學(xué)?;蛉珖骄阶鞅容^,而目前已擴(kuò)展至三分之二的教育系統(tǒng)。在一半以上的教育系統(tǒng)中,學(xué)校都會尋求外部專家的咨詢和支持,內(nèi)容包括如何開展內(nèi)部評價和改進(jìn)流程、評價工具選擇、根據(jù)結(jié)果起草行動計劃等。總體來看,在這些措施中,提供指南和手冊以及學(xué)生成績是最常見的方法,令人意外的是,財政支持反而最少用,只出現(xiàn)在西班牙和克羅地亞。
內(nèi)部評價結(jié)果除了被用來指導(dǎo)學(xué)校改進(jìn)外,也會被中央或地方當(dāng)局用于對學(xué)校進(jìn)行外部學(xué)校評價或監(jiān)測教育系統(tǒng)。在芬蘭,作為教育提供者的地方當(dāng)局有法律義務(wù)評價其提供的教育,地方和學(xué)校自我評價的結(jié)果被用于支持教育發(fā)展和改善學(xué)習(xí)條件;在英國的威爾士,地方當(dāng)局會根據(jù)調(diào)查結(jié)果確定發(fā)展需要,制定適當(dāng)?shù)陌l(fā)展目標(biāo),與學(xué)校進(jìn)行組織對話,以及決定資源分配。當(dāng)然相比用于監(jiān)測目的,內(nèi)部評價結(jié)果更多服務(wù)于外部學(xué)校評價。
外部和內(nèi)部學(xué)校評價兩者之間存在并行(parallel)、序貫(sequential)和合作(co-operative)三種關(guān)系模式。[2]并行是指兩個系統(tǒng)各自運(yùn)行,每個都有自己的標(biāo)準(zhǔn)和規(guī)則;序貫是指外部機(jī)構(gòu)遵循學(xué)校自我評價,并將其作為學(xué)校質(zhì)量保證體系的關(guān)鍵;合作是指外部機(jī)構(gòu)與學(xué)校合作制定一種共同的評價方法。隨著學(xué)校系統(tǒng)的不斷成熟,雖然發(fā)展趨勢是從并行到序貫再到合作模式,但實(shí)踐中并行和序貫?zāi)J皆谠S多國家教育系統(tǒng)中都是混合出現(xiàn),幾乎沒有教育系統(tǒng)單純使用某一個模式。[3]
外部學(xué)校評價會促進(jìn)和刺激學(xué)校自我評價過程的改進(jìn)。Ehren(2013)等人通過分析六個歐盟成員國的教育系統(tǒng)后發(fā)現(xiàn),外部學(xué)校評價中設(shè)定的期望和利益相關(guān)者對外部學(xué)校評價結(jié)果的敏感性與學(xué)校自我評價過程的改進(jìn)密切相關(guān);外部學(xué)校評價對學(xué)校的期望設(shè)定會對他們的改進(jìn)能力產(chǎn)生直接影響。[4]
很多國家把內(nèi)部學(xué)校評價看作外部學(xué)校評價的一個組成部分。一方面,許多外部評價機(jī)構(gòu)提供了具體的質(zhì)量指標(biāo)來指導(dǎo)學(xué)校開展自我評價;另一方面,許多國家使用內(nèi)部學(xué)校評價結(jié)果來引導(dǎo)外部評價過程。當(dāng)然,也有一些國家,如愛沙尼亞、德國和土耳其,雖然對兩種評價都有要求,但沒有把內(nèi)部學(xué)校評價作為外部學(xué)校評價的一部分。當(dāng)外部評價者不使用內(nèi)部評價報告作為信息來源時,往往是由于這兩個過程沒有共同的目的或范圍,或內(nèi)部評價過程不是強(qiáng)制性的或尚未完全實(shí)施。
外部和內(nèi)部學(xué)校評價的關(guān)系本質(zhì)上是要協(xié)調(diào)好評價的問責(zé)與發(fā)展功能。外部學(xué)校評價一個固有不平衡是它通常被鼓勵要向?qū)W校提供建議,而這使外部評價者的判斷缺乏獨(dú)立性;內(nèi)部學(xué)校評價的內(nèi)在不平衡是問責(zé)制的要求往往妨礙其發(fā)展功能。在各國學(xué)校評價系統(tǒng)中,內(nèi)部學(xué)校評價在外部學(xué)校評價中地位越弱的國家越重視發(fā)展功能(如比利時和丹麥),越強(qiáng)越重視問責(zé)功能(如荷蘭和英格蘭)。
世界經(jīng)濟(jì)合作組織(OECD)提供了一個概念框架來描繪學(xué)校評價所涉及的內(nèi)容及其相互間的聯(lián)系,包括學(xué)校評價的治理、程序、能力建設(shè)和結(jié)果使用四個方面。[5]按照這一框架,國外中小學(xué)學(xué)校評價未來政策走向大概呈現(xiàn)以下四個特點(diǎn)。
明確學(xué)校評價目的對于決定誰應(yīng)負(fù)責(zé)開展評價、使用哪些程序以及如何使用評價結(jié)果都至關(guān)重要。學(xué)校評價作為教育系統(tǒng)評價總體框架的一部分,其目標(biāo)應(yīng)與教育系統(tǒng)的總目標(biāo)保持一致。在學(xué)校評價框架內(nèi),要平衡學(xué)校評價的問責(zé)和發(fā)展功能,考慮哪些要素最好用于問責(zé)目的,哪些最適合發(fā)展目的。確保學(xué)校評價的重點(diǎn)是改善教師教學(xué)、學(xué)生學(xué)習(xí)和學(xué)生成果。學(xué)校評價不僅僅關(guān)注政策、規(guī)劃和結(jié)果之間的關(guān)系,更要旗幟鮮明地突出它對教學(xué)和學(xué)習(xí)的重視,把教學(xué)質(zhì)量評價作為學(xué)校評價的中心任務(wù),以此向?qū)W生、教師和家長證明學(xué)校評價不是一個官僚活動。國外學(xué)校評價一方面重點(diǎn)已經(jīng)發(fā)生轉(zhuǎn)變,“合規(guī)”不再是唯一的目標(biāo),而且越來越重視教學(xué)和學(xué)習(xí)的質(zhì)量;另一方面呈現(xiàn)出內(nèi)部和外部學(xué)校評價相結(jié)合,避免過度依賴一個的明顯趨勢,比如強(qiáng)調(diào)保持兩者所使用評價標(biāo)準(zhǔn)的相似性,以及與學(xué)校合作,提供評價指導(dǎo)等。
學(xué)校質(zhì)量標(biāo)準(zhǔn)將為有效學(xué)校提供明確依據(jù),而學(xué)校和學(xué)校組織者使用據(jù)此建立的評價指標(biāo)框架將增加外部和內(nèi)部學(xué)校評價之間的一致性。“我們的學(xué)校有多好?”不僅是學(xué)生和家長的問題,也是學(xué)校領(lǐng)導(dǎo)和教職工的問題,更是教育當(dāng)局的問題。學(xué)校質(zhì)量標(biāo)準(zhǔn)要考慮情境、投入和過程因素,重點(diǎn)在學(xué)生成果上,同時應(yīng)動態(tài)調(diào)整,以確保適應(yīng)變化。為確保學(xué)校評價數(shù)據(jù)和資料收集的可靠性,應(yīng)提供一些一致、可比和可靠的自我評價工具,以及在學(xué)校政策制定中有效使用這些工具的例子。研究表明:“保持外部學(xué)校評價采用的方法和評價標(biāo)準(zhǔn)透明,可以提高外部評價在被評價者心目中的合法性。”[6]因此,越來越多國家一方面把外部學(xué)校評價的方法、程序和手段在互聯(lián)網(wǎng)上定期公開征詢公眾意見,評價報告也以紙質(zhì)形式或數(shù)字形式出版;另一方面評價機(jī)構(gòu)鼓勵學(xué)校提前審查業(yè)已公開的評價標(biāo)準(zhǔn)和工具,并允許學(xué)校就外部評價過程發(fā)表評論,糾正事實(shí)錯誤并在評價報告中質(zhì)疑調(diào)查結(jié)果。
外部評價者的選擇和招聘對于評價機(jī)構(gòu)內(nèi)的能力建設(shè)至關(guān)重要,因此選拔標(biāo)準(zhǔn)應(yīng)確保進(jìn)入者具有評價所需的可靠技能和特征。外部學(xué)校評價隊(duì)伍中吸納高聲譽(yù)的校長和資優(yōu)教師有助于提高評價團(tuán)隊(duì)的可信度。為了確保外部評價結(jié)果的客觀性和一致性,需要在評價設(shè)計等方面采取措施,比如在同一類學(xué)校中使用相同的評價小組、定期組織外部評價員會議、定期審查評價程序的一致性和質(zhì)量。當(dāng)然,更重要的是為外部評價者提供具體培訓(xùn),實(shí)際上學(xué)校評價方法的不斷變化以及內(nèi)外部評價趨向合作的趨勢,都要求評價者具有足夠的適應(yīng)能力,并接受必要的再培訓(xùn)。內(nèi)部學(xué)校評價成功與否在很大程度上取決于學(xué)校校長動員參與、調(diào)動資源和提供適當(dāng)培訓(xùn)與支持的能力。通過培訓(xùn)校長在學(xué)校效能及其評價等方面的能力和技巧,可以提升學(xué)校自我評價水平。同時,內(nèi)部學(xué)校評價不只是校領(lǐng)導(dǎo)的一項(xiàng)活動,所有教職工和學(xué)生都應(yīng)參與其中。可以說,確保校長和承擔(dān)評價責(zé)任的其他人員在課堂觀察、訪談、數(shù)據(jù)收集、結(jié)果分析和解釋方面具備必要的技能,有助于保證評價過程的有效性和可靠性以及評價結(jié)果的可理解性。
管理和收集國家、區(qū)域?qū)用鎸W(xué)生評價項(xiàng)目的結(jié)果,有效使用這些數(shù)據(jù)對學(xué)校進(jìn)行反饋對于推動學(xué)校評價和學(xué)校發(fā)展而言至關(guān)重要。因此,要開發(fā)和建立數(shù)據(jù)系統(tǒng),更好地向?qū)W校報告和反饋結(jié)果,同時,要注意反饋結(jié)果的保密性、層次性和及時性。所謂層次性是指校長們更關(guān)心的是對學(xué)校成績的描述,以及與其他學(xué)校、地區(qū)或全國平均水平的績效比較信息,而教師更在意班級和學(xué)生個體層面的信息。為了更廣泛地使用外部學(xué)校評價的結(jié)果,一是評價報告的技術(shù)性不應(yīng)太強(qiáng),以便非專業(yè)人士閱讀;二是要借助相應(yīng)傳播策略來擴(kuò)散學(xué)校評價結(jié)果,學(xué)校也可以主動向工作人員和家長推廣評價結(jié)果;三是可以在評價報告中增加一些基于背景信息的學(xué)??冃гu價標(biāo)準(zhǔn),以及提供學(xué)??冃г鲋翟u價結(jié)果等。
國外學(xué)校評價實(shí)踐表明學(xué)校評價活動不存在單一的模式或全球最佳做法,需要做的是使教育系統(tǒng)評價框架的各組成部分(學(xué)生評價、教師評價、學(xué)校評價和教育體系評價)發(fā)揮協(xié)同增效作用,避免程序重復(fù),以及防止各部分目標(biāo)不一致。這對于當(dāng)前我國開展學(xué)校評價實(shí)踐具有積極的啟示。
一是強(qiáng)調(diào)課堂實(shí)踐,把評價重心放在教師教學(xué)和學(xué)生學(xué)習(xí)上。我國教育督導(dǎo)工作今后應(yīng)從更多重視“合規(guī)”轉(zhuǎn)向關(guān)注質(zhì)量,更加突出學(xué)校評價的發(fā)展功能而非問責(zé)功能,一個關(guān)鍵的原則是將學(xué)生置于評價框架的中心,注重檢測學(xué)生發(fā)展成果,把評價工作更多集中在教師教學(xué)和學(xué)生學(xué)習(xí)上。其次,積極鼓勵和推動學(xué)校開展自我評價,發(fā)揮與外部學(xué)校評價的協(xié)同作用,英國外部督導(dǎo)定位越來越傾向于對學(xué)校自評的監(jiān)督和再評,使學(xué)校成為評價、發(fā)展與改進(jìn)的原動力。[7]為發(fā)揮內(nèi)部學(xué)校評價對我國建設(shè)現(xiàn)代學(xué)校制度,提升學(xué)校辦學(xué)水平的重要作用,學(xué)校要以學(xué)校發(fā)展規(guī)劃為目標(biāo)開展學(xué)校自我評價,最大限度調(diào)動利益相關(guān)者參與學(xué)校發(fā)展的積極性。國家層面要結(jié)合學(xué)生發(fā)展核心素養(yǎng),盡快建立國家學(xué)校質(zhì)量標(biāo)準(zhǔn),開發(fā)學(xué)校評價指標(biāo)框架。
二是加強(qiáng)評價主體的能力建設(shè)是影響有效學(xué)校評價的關(guān)鍵。應(yīng)在國家一級建立專門的評價知識庫、工具和準(zhǔn)則以協(xié)助評價活動的開展;要嚴(yán)控評價隊(duì)伍的任職資格門檻,定期為關(guān)鍵人員提供專門培訓(xùn),比如提升學(xué)校領(lǐng)導(dǎo)評價教師的能力、教師評價學(xué)生的能力、教師的形成性評價技能、學(xué)校處理自評數(shù)據(jù)的能力等。另外,當(dāng)前歐美國家學(xué)校評價以學(xué)校改進(jìn)為目的,普遍采用差異化的評價方法,即把評價重點(diǎn)放在相對薄弱的學(xué)校上,以及重視評價之后的后期干預(yù)的做法,同樣值得我們借鑒。