• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    探索增值評(píng)價(jià)的中國(guó)路向:基于美國(guó)實(shí)踐經(jīng)驗(yàn)的批判性分析 *

    2023-03-11 08:23:30韓玉梅嚴(yán)文蕃
    關(guān)鍵詞:評(píng)價(jià)教育教師

    韓玉梅 [美]嚴(yán)文蕃 蔣 丹

    (1.西南大學(xué)西南民族教育與心理研究中心,重慶 400715;2.西南大學(xué)教育政策研究所,重慶 400715;3.美國(guó)馬薩諸塞大學(xué)波士頓分校,波士頓 02125-3393)

    一、引言

    作為教育評(píng)價(jià)體系中的一種重要理念和方法,增值評(píng)價(jià)一直頗具爭(zhēng)議性。2020 年10 月,中共中央國(guó)務(wù)院印發(fā)了《深化新時(shí)代教育評(píng)價(jià)改革總體方案》(以下簡(jiǎn)稱“《方案》”),提出要“探索增值評(píng)價(jià)”,引領(lǐng)教育研究者圍繞增值評(píng)價(jià)開(kāi)展理論、技術(shù)、實(shí)踐等多層面的探索,通過(guò)國(guó)際比較及本土化的研究與實(shí)踐,摸索出一條適宜新時(shí)代中國(guó)特色教育評(píng)價(jià)體系的增值評(píng)價(jià)路徑。

    20 世紀(jì)80 年代以來(lái),增值評(píng)價(jià)在美國(guó)被廣泛應(yīng)用于學(xué)校評(píng)價(jià)、教師評(píng)價(jià)等教育評(píng)價(jià)體系中。其中,增值評(píng)價(jià)在教師評(píng)價(jià)體系中的應(yīng)用引發(fā)了學(xué)術(shù)界曠日持久的爭(zhēng)鳴與批判,也在實(shí)踐層面掀起了一線教育者的長(zhǎng)期對(duì)抗與質(zhì)疑,經(jīng)歷了由占主導(dǎo)地位、大規(guī)模推廣到與其他評(píng)價(jià)方式融合式發(fā)展和限定性、綜合性應(yīng)用的態(tài)勢(shì)變革。在我國(guó),增值評(píng)價(jià)一直處于理論探索和以研究為目的的小范圍試驗(yàn)階段,尚未在政策和實(shí)踐層面開(kāi)展實(shí)質(zhì)性的大規(guī)模探索。20 世紀(jì)末,少數(shù)學(xué)者開(kāi)始嘗試將增值評(píng)價(jià) 的理念和方法技術(shù)引入到我國(guó)素質(zhì)教育評(píng)價(jià)體系中(張興,1998)。21 世紀(jì)以來(lái),一些學(xué)者嘗試運(yùn)用增值評(píng)價(jià)模型在我國(guó)樣本地區(qū)開(kāi)展學(xué)校效能、教師效能評(píng)價(jià)的實(shí)證研究(馬曉強(qiáng)等,2006;邊玉芳等,2007;邵越洋等,2020)?!斗桨浮钒l(fā)布以來(lái),在“新時(shí)代教育評(píng)價(jià)改革”戰(zhàn)略視域下探討增值評(píng)價(jià)的研究數(shù)量激增,研究熱度攀升到前所未有的高度(郭元祥等,2021)。眾多學(xué)者積極肯定了增值評(píng)價(jià)的價(jià)值,認(rèn)為相比過(guò)程評(píng)價(jià),增值評(píng)價(jià)既關(guān)注過(guò)程,又重視起點(diǎn),具有較為合理的評(píng)價(jià)理念及科學(xué)的統(tǒng)計(jì)方法,保證了更加公平、公正、客觀、科學(xué)的判斷和比較,應(yīng)該成為新時(shí)期我國(guó)教育評(píng)價(jià)的重要方式(楊小微,2020;邵越洋等,2020;邊玉芳等,2015)。不可否認(rèn),增值評(píng)價(jià)具有強(qiáng)有力的量化表征能力及追求教育評(píng)價(jià)科學(xué)化、客觀化的價(jià)值邏輯起點(diǎn),可以為促進(jìn)我國(guó)教育高質(zhì)量發(fā)展帶來(lái)新思路。然而從總體上來(lái)看,國(guó)內(nèi)已有關(guān)于增值評(píng)價(jià)的研究重引薦與褒獎(jiǎng),輕批判和反思,對(duì)增值評(píng)價(jià)的弊端與局限、未解的難題與挑戰(zhàn)、國(guó)際發(fā)展動(dòng)態(tài)及實(shí)踐證據(jù)剖析相對(duì)不足。

    當(dāng)前,在深化新時(shí)代教育評(píng)價(jià)改革戰(zhàn)略帶來(lái)的重要機(jī)遇和利好形勢(shì)下,中國(guó)增值評(píng)價(jià)的本土路徑何在?如何理性研判增值評(píng)價(jià)的本質(zhì)特性與利弊優(yōu)缺,客觀把握增值評(píng)價(jià)在我國(guó)教育評(píng)價(jià)體系中的價(jià)值定位、技術(shù)邊界和發(fā)展路向?如何在實(shí)踐中最大化發(fā)揮增值評(píng)價(jià)的優(yōu)勢(shì),為建設(shè)富有時(shí)代特征、彰顯中國(guó)特色、體現(xiàn)世界水平的教育評(píng)價(jià)體系做出應(yīng)有的貢獻(xiàn)?圍繞這些基本問(wèn)題,遵循“堅(jiān)持中國(guó)特色,扎根中國(guó),融通中外”的原則,本文采用國(guó)際比較和批判性分析的視角,以教師增值評(píng)價(jià)為抓手,借鑒美國(guó)增值評(píng)價(jià)的理論與實(shí)踐探索經(jīng)驗(yàn),批判性審思教師增值評(píng)價(jià)的本質(zhì)特性、技術(shù)邊界、應(yīng)用限度、融合趨勢(shì)、實(shí)施條件等問(wèn)題,多方位地深入探尋增值評(píng)價(jià)在中國(guó)教育評(píng)價(jià)體系中的價(jià)值路向、技術(shù)路向、應(yīng)用路向、發(fā)展路向和實(shí)踐路向。

    二、價(jià)值路向:理性研判本質(zhì)特性,探索增值評(píng)價(jià)的價(jià)值定位

    任何一種教育評(píng)價(jià)方法都是優(yōu)勢(shì)與風(fēng)險(xiǎn)并存的,在考量和選擇增值評(píng)價(jià)方法的適切性和價(jià)值路向時(shí),首先需要思考和權(quán)衡增值評(píng)價(jià)相較于其他方法所獨(dú)具有的本質(zhì)特性,從而明晰其在特定文化背景下和教育評(píng)價(jià)體系中的價(jià)值定位(NRC, 2010, p.56)。

    (一)研判教師增值評(píng)價(jià)的內(nèi)涵與本質(zhì)特征

    “增值”(value-added)的概念來(lái)源于經(jīng)濟(jì)學(xué)領(lǐng)域,本意是指商品總價(jià)值扣除生產(chǎn)成本、中間投入后額外增加的價(jià)值部分,反映的是產(chǎn)品核心要素所貢獻(xiàn)的價(jià)值(Deardorff, 2016)。引申到其他領(lǐng)域,“增值”泛指特定物品(或服務(wù)、人員)超出標(biāo)準(zhǔn)預(yù)期額外創(chuàng)造的更多“價(jià)值”。1971 年,教育經(jīng)濟(jì)學(xué)家埃里克·哈努謝克(Eric Hanushek)發(fā)表文章探討教師特征變量與學(xué)生成績(jī)之間的關(guān)系,從教育投入產(chǎn)出的視角首次將經(jīng)濟(jì)學(xué)中的“增值”概念引入教育研究領(lǐng)域,將教師特征等影響因素變量視為投入成本,將學(xué)生成績(jī)視為教育過(guò)程產(chǎn)出的“商品”,將一定時(shí)期后學(xué)習(xí)成績(jī)的增長(zhǎng)變化視為“增值”,并構(gòu)建教育生產(chǎn)函數(shù)模型來(lái)定量刻畫教師特征等參數(shù)與學(xué)生成績(jī)?cè)鲩L(zhǎng)的關(guān)系(Hanushek, 1971)。這一研究確立了教育學(xué)領(lǐng)域中“增值”概念的原初涵義,即學(xué)生在學(xué)習(xí)過(guò)程中受到教師等變量影響后,其成績(jī)?cè)谔囟〞r(shí)間段的增長(zhǎng)幅度,反映了教師等關(guān)鍵要素對(duì)學(xué)生成績(jī)產(chǎn)出所貢獻(xiàn)的價(jià)值增量。

    基于拉夫爾·W.泰勒(Ralph W.Tyler)的經(jīng)典“目標(biāo)—結(jié)果”導(dǎo)向評(píng)估理論,即主張?jiān)u價(jià)是將實(shí)際教育結(jié)果與預(yù)期目標(biāo)之間進(jìn)行比較的過(guò)程,“增值評(píng)價(jià)”(value-added assessment)是基于學(xué)生成績(jī)?cè)鲩L(zhǎng)實(shí)際結(jié)果和預(yù)期結(jié)果之差值,來(lái)對(duì)教師、學(xué)校等影響因素的效能和貢獻(xiàn)度進(jìn)行評(píng)價(jià)的一種理念,旨在滿足教育當(dāng)局對(duì)教育目標(biāo)和結(jié)果及其實(shí)現(xiàn)進(jìn)程的監(jiān)測(cè)需求,以及對(duì)學(xué)校和教育者促進(jìn)學(xué)生學(xué)習(xí)的效能的研判需求(Sanders & Horn, 1994)。根據(jù)不同的測(cè)評(píng)目的,增值評(píng)價(jià)可以運(yùn)用到教師評(píng)價(jià)、學(xué)校評(píng)價(jià)等教育評(píng)價(jià)子體系中。在教師評(píng)價(jià)子體系,增值評(píng)價(jià)即指以特定周期中學(xué)生學(xué)業(yè)成就增長(zhǎng)幅度為評(píng)價(jià)依據(jù),對(duì)教師促進(jìn)學(xué)生學(xué)業(yè)增長(zhǎng)的效能或貢獻(xiàn)度進(jìn)行評(píng)判的理念和手段(Darling-Hammond et al., 2012)。換言之,教師增值評(píng)價(jià)是檢測(cè)學(xué)生特定時(shí)間段內(nèi)學(xué)業(yè)成績(jī)的實(shí)際增長(zhǎng)在多大程度上歸因于教師效能的測(cè)評(píng)手段,被視為衡量教師質(zhì)量水平的重要標(biāo)尺。

    圖1 簡(jiǎn)要呈現(xiàn)了教師增值評(píng)價(jià)中“增值”的二步測(cè)算方法。首先,采用增值模型(value-added model),代入教師所教學(xué)生的標(biāo)準(zhǔn)化測(cè)試起點(diǎn)成績(jī)數(shù)據(jù)(如3 年級(jí)數(shù)學(xué)成績(jī))、學(xué)生個(gè)體特征變量數(shù)據(jù)、學(xué)校層面控制變量數(shù)據(jù)、教師變量數(shù)據(jù)等進(jìn)行測(cè)算,預(yù)測(cè)出學(xué)生在特定時(shí)段后(如一學(xué)年)的成績(jī)?cè)龇担? 年級(jí)數(shù)學(xué)成績(jī)預(yù)測(cè)增幅均值);其次,將學(xué)生同等時(shí)期實(shí)際成績(jī)?cè)龇担? 年級(jí)數(shù)學(xué)成績(jī)實(shí)際增幅均值)與預(yù)測(cè)成績(jī)?cè)龇颠M(jìn)行比較,所得的差值即為教師的“增值”分值,即教師效能估算值,該分值越高,表示教師效能越高,反之則越低(SDP, 2012)。

    圖1 教師增值評(píng)價(jià)的概念圖示

    依據(jù)上述內(nèi)涵闡釋,可以基本把握教師增值評(píng)價(jià)的幾個(gè)本質(zhì)特性:

    其一,以學(xué)生成績(jī)?cè)龇Y(jié)果為依據(jù)診斷教師貢獻(xiàn)度。教師是促進(jìn)學(xué)生學(xué)習(xí)的關(guān)鍵,學(xué)生學(xué)業(yè)成就在一定程度上是教師等關(guān)鍵因素綜合作用的產(chǎn)出結(jié)果。教師增值評(píng)價(jià)通過(guò)學(xué)生標(biāo)準(zhǔn)化測(cè)試手段和特定周期成績(jī)?cè)龇鶖?shù)據(jù)實(shí)現(xiàn)對(duì)學(xué)生學(xué)習(xí)進(jìn)步程度的量化測(cè)度,以此作為重要參數(shù)來(lái)衡量教師對(duì)學(xué)生成績(jī)?cè)鲩L(zhǎng)的貢獻(xiàn)度,這為教師評(píng)價(jià)提供了一種便利的操作方法和數(shù)量化的精準(zhǔn)描述。相較于主觀的課堂觀察法、學(xué)生調(diào)查法和傳統(tǒng)的終結(jié)性成績(jī)?cè)u(píng)估法等,增值評(píng)價(jià)采用一種縱向的視野將學(xué)生學(xué)業(yè)成就的起點(diǎn)納入考量范疇,控制背景變量和影響因素,檢測(cè)特定周期學(xué)生成績(jī)的縱向發(fā)展變化與“凈增長(zhǎng)”程度,實(shí)現(xiàn)了測(cè)評(píng)客體在時(shí)空維度由定點(diǎn)向過(guò)程、由絕對(duì)向相對(duì)、由靜態(tài)向動(dòng)態(tài)的跨越。這一評(píng)價(jià)方式為教師效能評(píng)判提供了更加立體、公正的客觀依據(jù),為教師促進(jìn)學(xué)生學(xué)習(xí)的貢獻(xiàn)度評(píng)估提供了形成性、診斷性工具,為教育產(chǎn)出結(jié)果、教師質(zhì)量水平和教育投入產(chǎn)出效益的定量刻畫提供了可行方案,具有主觀測(cè)評(píng)方法無(wú)法比擬的特性(Amrein-Beardsley et al., 2016)。然而,教師增值評(píng)價(jià)理念并未從根本上擺脫結(jié)果取向的桎梏。一方面,學(xué)生成績(jī)?cè)龇且圆煌瑫r(shí)段同一標(biāo)準(zhǔn)化考試成績(jī)?yōu)榛A(chǔ)數(shù)據(jù)的測(cè)算結(jié)果,盡管避免了靜態(tài)考試成績(jī)絕對(duì)值的偏誤,但依然難以克服甚至強(qiáng)化了師生對(duì)考試結(jié)果的追求,這為美國(guó)基礎(chǔ)教育領(lǐng)域不期望看到的“為考試而教”的現(xiàn)象埋下了伏筆。另一方面,基于學(xué)生成績(jī)“增值”結(jié)果評(píng)價(jià)教師效能的價(jià)值取向隱含了將學(xué)生成績(jī)?cè)龇曂瑸榻處熃虒W(xué)結(jié)果的邏輯,對(duì)增值評(píng)價(jià)結(jié)果的倚重容易重蹈教師質(zhì)量與學(xué)生成績(jī)簡(jiǎn)單捆綁的“唯分?jǐn)?shù)”覆轍。

    其二,以學(xué)生成績(jī)?cè)鲩L(zhǎng)的因果效應(yīng)表征狹義的“教師效能”。教師效能(teacher effectiveness)是教師評(píng)價(jià)的客體。對(duì)教師效能的界定影響著教師評(píng)價(jià)所采用的標(biāo)準(zhǔn)和方法,不同教師評(píng)價(jià)方法也反映了對(duì)教師效能不同內(nèi)涵維度的側(cè)重。美國(guó)國(guó)家教師質(zhì)量綜合中心(National Comprehensive Center for Teacher Quality)發(fā)布的一份關(guān)于教師效能的報(bào)告較為綜合地指出了教師效能內(nèi)涵的五個(gè)維度,包括:教師對(duì)學(xué)生有高期望并幫助學(xué)生提高學(xué)習(xí)成績(jī)的能力;培養(yǎng)學(xué)生積極情感態(tài)度價(jià)值觀、個(gè)人效能感及合作精神的能力;使用不同教學(xué)資源按照學(xué)生需求設(shè)計(jì)和提供學(xué)習(xí)機(jī)會(huì)、實(shí)時(shí)監(jiān)測(cè)評(píng)價(jià)學(xué)生發(fā)展的能力;促進(jìn)課堂和學(xué)校多元化發(fā)展及培養(yǎng)學(xué)生公民意識(shí)的能力;與其他利益相關(guān)者合作促進(jìn)學(xué)生成長(zhǎng)發(fā)展的能力(Goe et al., 2008)。教師增值評(píng)價(jià)采用了上述教師效能第一維度的狹義界定,僅指向了以學(xué)生成績(jī)提高為標(biāo)識(shí)的教師教學(xué)成果的評(píng)價(jià)范疇(陳玉琨,2007,第130 頁(yè)),是統(tǒng)計(jì)學(xué)意義上教師對(duì)學(xué)生成績(jī)?cè)龇a(chǎn)生的因果效應(yīng)。換言之,在增值評(píng)價(jià)體系中,教師效能被狹義地表征為學(xué)生在特定時(shí)間段內(nèi)接受某教師的教育后其學(xué)習(xí)成績(jī)的變化差異(McCaffrey et al., 2003, pp.9-15)。這一立場(chǎng)在“力爭(zhēng)上游”(Race to the Top)項(xiàng)目行動(dòng)綱要對(duì)“有效教師”(effective teacher)的操作性界定中得到了印證。該文件將“有效教師”界定為“所教學(xué)生成績(jī)至少在一個(gè)年級(jí)水平、一個(gè)學(xué)年測(cè)評(píng)中達(dá)到了預(yù)期增長(zhǎng)指標(biāo)的教師”(USDOE, 2009, p.12)。在這樣的評(píng)價(jià)標(biāo)尺下,學(xué)生成績(jī)?cè)鲩L(zhǎng)幅度均值高的教師被歸類為“高效能教師”,反之為“低效能教師”,甚至“不合格教師”(Kupermintz, 2003, pp.292-293)。

    由此產(chǎn)生的問(wèn)題是,教師效能可以依據(jù)學(xué)生成績(jī)來(lái)被認(rèn)知和判定嗎?長(zhǎng)期以來(lái),眾多學(xué)者研究教師和學(xué)生成績(jī)之間的關(guān)系,認(rèn)為教師效能是最重大的影響學(xué)生學(xué)習(xí)和學(xué)業(yè)成就增長(zhǎng)的關(guān)鍵因素(Sanders & Horn, 1998;Johnson, 2015),其水平差異化是導(dǎo)致學(xué)生學(xué)習(xí)差異化的重要原因(Darling-Hammond, 2000),因此以學(xué)生成績(jī)?yōu)闃?biāo)準(zhǔn)來(lái)評(píng)價(jià)教師具有高度的合理性和可操作性(Millman, 1997; Tucker &Stronge, 2005, p.15)。然而,也有大量采用大規(guī)模學(xué)生標(biāo)準(zhǔn)化測(cè)試數(shù)據(jù)分析學(xué)生成績(jī)影響因素的研究發(fā)現(xiàn),教師對(duì)學(xué)生學(xué)習(xí)成就的解釋力僅占所有影響因素的1%—14%,而更具有解釋力的影響因素來(lái)自于學(xué)校和教育體制機(jī)制等層面(ASA, 2014)。眾多學(xué)者主張,教師對(duì)學(xué)生學(xué)習(xí)的影響并不是唯一或者最強(qiáng)的影響因素,即便統(tǒng)計(jì)模型能夠在一定程度上篩除其他變量的統(tǒng)計(jì)噪音,但依舊不可避免地會(huì)遺留一些影響(Haertel, 2013, p.5)。爭(zhēng)議之下,將學(xué)生成績(jī)作為教師效能高低的主要評(píng)判依據(jù),尤其將基于學(xué)生成績(jī)的增值評(píng)價(jià)結(jié)果與高利害的教師問(wèn)責(zé)掛鉤,其合理性和公平性不僅值得懷疑,甚至?xí)?dǎo)致負(fù)向的抑制作用(Everson, 2017)。上述爭(zhēng)議可以反映出,增值評(píng)價(jià)對(duì)教師效能的量化表征在本質(zhì)上具有雙重限度:一是增值評(píng)價(jià)所測(cè)度的教師效能僅聚焦教師促進(jìn)學(xué)生成績(jī)?cè)鲩L(zhǎng)的“凈效應(yīng)”,而不能等同于廣義、多元的“效能”;二是增值評(píng)價(jià)對(duì)教師效應(yīng)的測(cè)度是以對(duì)其他影響因素變量的人為控制為假設(shè)條件的,而其能夠在多大程度上滿足前提假設(shè)、精準(zhǔn)辨別教師及其他影響因素對(duì)學(xué)生學(xué)習(xí)成績(jī)的影響效應(yīng)差異是長(zhǎng)期以來(lái)有關(guān)增值評(píng)價(jià)方法論的爭(zhēng)議和未解難題所在。

    其三,以增值模型為核心技術(shù)實(shí)現(xiàn)“增值”的測(cè)度。增值評(píng)價(jià)理念得以實(shí)現(xiàn)的核心技術(shù)在于增值模型的科學(xué)構(gòu)建。增值模型(value-added modeling, VAM)是借助計(jì)算機(jī)軟件和學(xué)生學(xué)業(yè)成就數(shù)據(jù)庫(kù)中相關(guān)數(shù)據(jù)來(lái)統(tǒng)計(jì)分析學(xué)生成績(jī)?cè)鲩L(zhǎng)情況以及教師等教育要素效能高低的數(shù)學(xué)統(tǒng)計(jì)模型(Amrein-Beardsley,2008)。構(gòu)建教師增值模型的目的是在排除或控制外部影響變量的情況下,測(cè)算學(xué)生特定時(shí)期的成績(jī)預(yù)期增長(zhǎng)凈值與同期實(shí)際增長(zhǎng)值的差值,并用這個(gè)差值無(wú)偏倚地反映教師對(duì)學(xué)生學(xué)業(yè)成績(jī)?cè)鲩L(zhǎng)的因果效應(yīng),或稱貢獻(xiàn)度(Koedel et al., 2015)。從理論上講,在統(tǒng)計(jì)模型建構(gòu)合理、前提假設(shè)條件滿足、各項(xiàng)學(xué)生成績(jī)測(cè)評(píng)工具信效度高的情況下,這一目標(biāo)是能夠?qū)崿F(xiàn)的。但現(xiàn)實(shí)中,這些條件往往難以實(shí)現(xiàn)。

    隨著統(tǒng)計(jì)技術(shù)和教育大數(shù)據(jù)的發(fā)展,增值模型處于持續(xù)的動(dòng)態(tài)變化與修訂完善進(jìn)程中。首先,增值模型并非唯一的基于學(xué)生成績(jī)的教師評(píng)價(jià)模型。在增值模型誕生之前,甚至到今天,教育統(tǒng)計(jì)學(xué)專家們一直在持續(xù)探索和構(gòu)建多樣化的模型來(lái)測(cè)評(píng)學(xué)生成績(jī)與教師效能之間的影響關(guān)系。美國(guó)各州教育決策者也根據(jù)各州實(shí)際需求采納了不同類型的基于學(xué)生成績(jī)的統(tǒng)計(jì)模型,如狀態(tài)模型、交股模型、成長(zhǎng)模型等(NRC, 2010, pp.3-4)。其次,在各類增值模型及其變式中,從簡(jiǎn)單的線性模型,到成就累計(jì)函數(shù)模型、固定效應(yīng)回歸模型、雙步驟平均殘差增值模型等,更多更復(fù)雜的遺漏變量不斷被納入模型,以便更加科學(xué)地衡量教師效能對(duì)學(xué)生成績(jī)的貢獻(xiàn)度。然而,如何精準(zhǔn)地遴選協(xié)同變量、如何有力地解釋測(cè)量誤差等依然是當(dāng)前增值評(píng)價(jià)技術(shù)領(lǐng)域面臨的重大難題(Koedel et al., 2015)。實(shí)際上,不同類型的增值模型抑或其他基于學(xué)生成績(jī)的測(cè)評(píng)模型都有其特色與局限,沒(méi)有任何一個(gè)模型是萬(wàn)能的或絕對(duì)精準(zhǔn)的。但值得肯定的是,多元化模型的探索為全美各州自主建構(gòu)和完善本土化的教師評(píng)價(jià)體系提供了豐富的工具選項(xiàng)和組合空間。隨著人們對(duì)學(xué)生學(xué)習(xí)、教師效能及二者關(guān)系的認(rèn)知能力提升、統(tǒng)計(jì)分析技術(shù)的日益完善、教育大數(shù)據(jù)挖掘技術(shù)的發(fā)展,以及各級(jí)各類學(xué)生成長(zhǎng)發(fā)展與學(xué)業(yè)成就監(jiān)測(cè)追蹤數(shù)據(jù)庫(kù)的建立與健全,增值模型必將不斷完善。

    其四,以特定年級(jí)學(xué)科教師為增值評(píng)價(jià)的主要適評(píng)對(duì)象。學(xué)生的連續(xù)性標(biāo)準(zhǔn)化測(cè)試成績(jī)是增值評(píng)價(jià)測(cè)算所倚賴的基礎(chǔ)數(shù)據(jù),因此增值評(píng)價(jià)的適切性在很大程度上受限于學(xué)生特定周期內(nèi)標(biāo)準(zhǔn)化測(cè)試成績(jī)數(shù)據(jù)的可獲取性和質(zhì)量,并不普適于所有科目、所有年級(jí)、所有教師。在美國(guó),以國(guó)家教育進(jìn)步考試(National Assessment of Educational Progress, NAEP)、適當(dāng)年度進(jìn)步測(cè)試(Adequate Yearly Progress,AYP)、各級(jí)各類州級(jí)學(xué)業(yè)成就測(cè)試(State Achievement Tests)等為代表的標(biāo)準(zhǔn)化學(xué)業(yè)水平測(cè)試較多適用于公立學(xué)校的數(shù)學(xué)、閱讀等主要科目,部分測(cè)試覆蓋科學(xué)、歷史、經(jīng)濟(jì)、地理等學(xué)科。從時(shí)間維度來(lái)看,有的測(cè)試是年度測(cè)評(píng),有的以三年級(jí)、五年級(jí)、八年級(jí)為主要測(cè)試對(duì)象。為避免大量缺失數(shù)據(jù)造成的統(tǒng)計(jì)偏誤,適合參與增值評(píng)價(jià)的教師須滿足特定的基本條件,即:確保其學(xué)生既參加了特定年級(jí)特定學(xué)科的基線測(cè)評(píng)(如三年級(jí)數(shù)學(xué)測(cè)試)、在測(cè)評(píng)階段持續(xù)在該教師班級(jí)接受教育,且參加了后續(xù)學(xué)年的同類測(cè)評(píng)(如四年級(jí)數(shù)學(xué)測(cè)試)(Opper, 2019)。為滿足上述條件,增值評(píng)價(jià)無(wú)形中為其適宜對(duì)象設(shè)置了門檻,不能廣泛應(yīng)用于所有教師和學(xué)生。這一適用性限度導(dǎo)致增值評(píng)價(jià)的可推廣性和公平公正性受到削弱。一方面,它難以推廣到學(xué)生成績(jī)數(shù)據(jù)獲取性低的區(qū)域、學(xué)科和教師對(duì)象群體,難以在采用不同測(cè)評(píng)標(biāo)準(zhǔn)和測(cè)評(píng)工具的地域范圍、年度區(qū)間進(jìn)行被評(píng)教師效能的跨群體、跨時(shí)空比較。另一方面,被評(píng)教師對(duì)象的公平公正性被削弱。盡管學(xué)生學(xué)習(xí)往往是多學(xué)科教師共同作用的結(jié)果,數(shù)學(xué)、閱讀等主要科目的教師卻要背負(fù)起學(xué)生學(xué)習(xí)成就增長(zhǎng)結(jié)果的主要責(zé)任,接受基于增值評(píng)價(jià)結(jié)果的問(wèn)責(zé)。

    (二)錨定增值評(píng)價(jià)在中國(guó)特色教育評(píng)價(jià)體系中的價(jià)值定位

    從以上對(duì)增值評(píng)價(jià)內(nèi)涵和本質(zhì)特性的剖析中可見(jiàn)其具有顯著的優(yōu)勢(shì)和特色,但其暴露的局限更提醒我們要理性認(rèn)識(shí)和謹(jǐn)慎明確增值評(píng)價(jià)在我國(guó)建設(shè)新時(shí)代中國(guó)特色教育評(píng)價(jià)體系中可能發(fā)揮的價(jià)值,避免過(guò)分夸大和泛化應(yīng)用。

    其一,應(yīng)充分肯定和最大化發(fā)揮增值評(píng)價(jià)的循證導(dǎo)向和技術(shù)優(yōu)勢(shì),滿足《方案》中“扭轉(zhuǎn)不科學(xué)的教育評(píng)價(jià)導(dǎo)向”,“提高教育評(píng)價(jià)的科學(xué)性、專業(yè)性、客觀性”的戰(zhàn)略需求。一方面,增值評(píng)價(jià)秉持技術(shù)理性的立場(chǎng),用統(tǒng)計(jì)測(cè)算模型和客觀數(shù)據(jù)達(dá)成對(duì)學(xué)生學(xué)業(yè)進(jìn)步和教師效應(yīng)的數(shù)字化循證與解釋預(yù)測(cè),為教師教學(xué)實(shí)績(jī)的產(chǎn)出提供科學(xué)檢測(cè)手段和客觀證據(jù),彌補(bǔ)主觀評(píng)價(jià)和終結(jié)性評(píng)價(jià)中可能存在的模糊評(píng)判和刻板偏見(jiàn),實(shí)現(xiàn)突破超越和更新迭代。另一方面,增值評(píng)價(jià)既考核學(xué)生的學(xué)業(yè)結(jié)果,也考核努力程度、進(jìn)步發(fā)展,并在技術(shù)手段下排除其他變量干擾,基于事實(shí)判斷推導(dǎo)出對(duì)教師的價(jià)值評(píng)判,進(jìn)一步提升學(xué)生學(xué)習(xí)和教師貢獻(xiàn)度測(cè)評(píng)的客觀性、精準(zhǔn)性和公正性。在我國(guó)新時(shí)代教育評(píng)價(jià)改革過(guò)程中,應(yīng)肯定增值評(píng)價(jià)的循證導(dǎo)向和技術(shù)優(yōu)勢(shì),最大化挖掘和發(fā)揮其在教育評(píng)價(jià)體系多領(lǐng)域的價(jià)值,提升教育評(píng)價(jià)體系的整體科學(xué)性。

    其二,應(yīng)明確增值評(píng)價(jià)“有所為、有所不為”,確保其價(jià)值與評(píng)價(jià)需求的匹配。《方案》在改革教師評(píng)價(jià)專題中提到要“突出教育教學(xué)實(shí)績(jī)”,而增值評(píng)價(jià)的屬性、功能和生成背景恰恰指向了對(duì)教師教學(xué)實(shí)績(jī)的評(píng)估,可以為未來(lái)開(kāi)展聚焦教學(xué)實(shí)績(jī)的中國(guó)特色教師增值評(píng)價(jià)體系提供重要思路,是當(dāng)前探索增值評(píng)價(jià)應(yīng)用領(lǐng)域的重點(diǎn)所在。在“探索增值評(píng)價(jià)”的政策熱潮下,研究者們熱烈探討增值評(píng)價(jià)在學(xué)前教育、高等教育、職業(yè)教育、特殊教育等不同教育階段和領(lǐng)域的應(yīng)用,這種泛化的傾向值得反思。增值評(píng)價(jià)當(dāng)前具有的局限性啟示我們,教師增值評(píng)價(jià)尚不能應(yīng)用于教師教學(xué)實(shí)績(jī)以外的效能維度評(píng)估,不能用于不具備技術(shù)成熟度和數(shù)據(jù)基礎(chǔ)的客體測(cè)評(píng),不適用于刻意開(kāi)展非量化教育指標(biāo)的評(píng)估等。在探索增值評(píng)價(jià)的過(guò)程中,需著重衡量增值評(píng)價(jià)方法的特有屬性和功能與評(píng)價(jià)主體需求間的效用關(guān)系和匹配程度,杜絕對(duì)增值評(píng)價(jià)效用的夸大和應(yīng)用的泛化。

    三、技術(shù)路向:正視增值模型爭(zhēng)議,探索增值評(píng)價(jià)的技術(shù)邊界

    作為一種以統(tǒng)計(jì)模型構(gòu)建、大規(guī)模數(shù)據(jù)采集與分析為核心技術(shù)的測(cè)評(píng)方法,增值評(píng)價(jià)的方法論根基和科學(xué)化水平是其立足之本。在統(tǒng)計(jì)學(xué)意義上,增值評(píng)價(jià)要實(shí)現(xiàn)其測(cè)評(píng)目的,必須至少滿足幾個(gè)理想條件:一是學(xué)生學(xué)業(yè)成就能夠被科學(xué)測(cè)評(píng),且測(cè)評(píng)工具能夠真實(shí)反映個(gè)體學(xué)生在同樣間隔單位時(shí)期內(nèi)縱向的學(xué)習(xí)成績(jī)?cè)鲩L(zhǎng)情況;二是教師是學(xué)生接受測(cè)評(píng)的縱向時(shí)期中唯一的貢獻(xiàn)者,或經(jīng)過(guò)對(duì)非教師變量的統(tǒng)計(jì)學(xué)控制,能夠精準(zhǔn)測(cè)度出教師變量對(duì)學(xué)生成績(jī)?cè)鲩L(zhǎng)的貢獻(xiàn)度;三是學(xué)生被隨機(jī)分配到不同學(xué)校和班級(jí)中,每個(gè)教師所教班級(jí)中的學(xué)生學(xué)習(xí)環(huán)境、學(xué)生生源群體特征無(wú)顯著差異(Darling-Hammond, 2015)。其中,前兩個(gè)條件關(guān)涉信效度問(wèn)題,第三個(gè)條件關(guān)涉統(tǒng)計(jì)偏誤問(wèn)題。然而現(xiàn)實(shí)中,上述假設(shè)條件均難以絕對(duì)滿足,甚至不可能滿足,因此增值評(píng)價(jià)在方法技術(shù)層面飽受批判。梳理增值評(píng)價(jià)方法與技術(shù)層面的爭(zhēng)議有助于摸清增值評(píng)價(jià)的技術(shù)邊界,繼而在探索中尋求突破。

    (一)正視增值模型的爭(zhēng)議

    1.信效度之爭(zhēng)

    高水平的信效度是良好測(cè)驗(yàn)的基本特征,前者是指測(cè)驗(yàn)的可靠性、一致性、穩(wěn)定性,后者指測(cè)驗(yàn)?zāi)軠y(cè)量出目標(biāo)特性的程度,即實(shí)現(xiàn)測(cè)驗(yàn)?zāi)康牡挠行院途珳?zhǔn)度(朱德全,宋乃慶,2013,第88 頁(yè))。對(duì)于增值評(píng)價(jià)而言,對(duì)學(xué)生成績(jī)?cè)龇?、教師效能測(cè)評(píng)結(jié)果的一致性和穩(wěn)定性、有效性和精準(zhǔn)度,是檢驗(yàn)增值模型信效度的根本問(wèn)題,也是國(guó)際學(xué)術(shù)界持續(xù)關(guān)注的爭(zhēng)議焦點(diǎn)。

    其一,對(duì)有關(guān)增值評(píng)價(jià)模型一致性和穩(wěn)定性的批判。增值模型的統(tǒng)計(jì)假設(shè)是不論在何種情境下,增值評(píng)價(jià)都能夠持續(xù)、穩(wěn)定、一致地測(cè)評(píng)出教師對(duì)學(xué)生成績(jī)的影響效應(yīng)與貢獻(xiàn)度。然而,多項(xiàng)研究表明,從不同時(shí)間、測(cè)評(píng)數(shù)據(jù)、模型類型、工具、地域等維度對(duì)比中,增值評(píng)價(jià)結(jié)果都表現(xiàn)出不穩(wěn)定性和不一致性,有的差異甚至是懸殊的、顛覆性的(Goldhaber, 2015)。一是同一教師群體在不同年度的測(cè)評(píng)結(jié)果波動(dòng)幅度較大。多項(xiàng)研究發(fā)現(xiàn),教師增值評(píng)價(jià)結(jié)果排名的連年數(shù)據(jù)中,僅有四分之一到三分之一教師前后兩年的排名狀況相對(duì)穩(wěn)定,大約有10%—15%比重的教師從第一年排名墊底的狀況翻轉(zhuǎn)為第二年的名列前茅,也有大約相似比重的教師前一年排名靠前而到第二年排名墊底,這種“過(guò)山車式”的排名波動(dòng)使得學(xué)校、同行、教師自身對(duì)教學(xué)能力的認(rèn)同充滿不確定性,尤其將排名和教師獎(jiǎng)金、補(bǔ)貼等掛鉤后,人事決策存在嚴(yán)重的風(fēng)險(xiǎn)和不可信度(Sass, 2008; SDP, 2012)。二是基于不同類型學(xué)生測(cè)評(píng)數(shù)據(jù)的增值評(píng)價(jià)結(jié)果差異較大。一項(xiàng)研究顯示,將同年度、同學(xué)科的州級(jí)標(biāo)準(zhǔn)化測(cè)試數(shù)據(jù)和另一項(xiàng)更高難度測(cè)試數(shù)據(jù)代入同一增值模型進(jìn)行測(cè)算,兩類增值評(píng)價(jià)結(jié)果排名對(duì)比發(fā)現(xiàn),約20%—30%在前者排名靠前的教師,在后者排名墊底(Bill & Melinda Gates Foundation, 2010)。三是不同增值模型可能測(cè)算出不一致的增值結(jié)果。有研究采用不同的增值模型對(duì)同一批次語(yǔ)文和數(shù)學(xué)學(xué)科教師效能進(jìn)行測(cè)算,發(fā)現(xiàn)語(yǔ)文學(xué)科中占比約46.4%的教師在兩種統(tǒng)計(jì)模型下的測(cè)評(píng)結(jié)果是基本一致的, 但約8.1%的教師在一個(gè)模型中被測(cè)定為有效教師,在另一模型中等級(jí)更高;約12.6%的教師在一個(gè)模型中測(cè)得最低分值,但在另一模型中卻被評(píng)定為有效教師。數(shù)學(xué)學(xué)科中占比約60.8%的教師在兩種統(tǒng)計(jì)模型下的測(cè)評(píng)結(jié)果基本一致,但約1.4%在模型一中被評(píng)定為無(wú)效的教師在模型二中被評(píng)定為有效,2.7%在模型一中所得測(cè)評(píng)結(jié)果為有效的教師在模型二中被評(píng)定為無(wú)效(Briggs & Domingue, 2011)。盡管比重不高,但對(duì)測(cè)評(píng)結(jié)果不一致的少數(shù)教師而言影響是重大的。四是增值評(píng)價(jià)結(jié)果與課堂觀察等質(zhì)性評(píng)估結(jié)果存在不一致性。2016 年,美國(guó)《教育周刊》報(bào)道的案例顯示,一位有著18 年教齡的通過(guò)課堂觀察等測(cè)評(píng)方法被評(píng)定為優(yōu)秀的老教師在增值評(píng)價(jià)中被定級(jí)為低效能教師,引發(fā)了該教師對(duì)教育行政部門的起訴,引起全美關(guān)注,而當(dāng)年類似的訴訟案在全美發(fā)生了14 起(Harris, 2016)。五是增值評(píng)價(jià)結(jié)果在區(qū)域內(nèi)和區(qū)域間不具有一致性和可比性。一項(xiàng)基于四個(gè)學(xué)區(qū)增值評(píng)價(jià)數(shù)據(jù)的跨區(qū)域比較研究發(fā)現(xiàn),在區(qū)域間、區(qū)域內(nèi)不同的參照系下,對(duì)“高效能”和“低效能”教師的劃分和評(píng)定標(biāo)準(zhǔn)存在顯著差異,不具備一致性和可比性(Blazar et al., 2016)。

    其二,對(duì)有關(guān)增值評(píng)價(jià)有效性和精準(zhǔn)度的批判。首先是標(biāo)準(zhǔn)化測(cè)試對(duì)學(xué)生學(xué)業(yè)成就的檢測(cè)效度存疑。增值模型運(yùn)算的基礎(chǔ)數(shù)據(jù)來(lái)源于學(xué)生的標(biāo)準(zhǔn)化測(cè)試成績(jī),因此增值評(píng)價(jià)能否有效反映學(xué)生成績(jī)的增長(zhǎng)幅度在很大程度上取決于標(biāo)準(zhǔn)化測(cè)試工具的效度。然而,自從《不讓一個(gè)孩子掉隊(duì)法》(No Child Left Behind, NCLB)推動(dòng)大規(guī)模標(biāo)準(zhǔn)化考試以來(lái),美國(guó)學(xué)界有關(guān)標(biāo)準(zhǔn)化考試的批判和質(zhì)疑就從未間斷過(guò):一是大規(guī)模標(biāo)準(zhǔn)化測(cè)試旨在依據(jù)特定年級(jí)的平均學(xué)業(yè)標(biāo)準(zhǔn)檢測(cè)全體學(xué)生的達(dá)標(biāo)水平和正態(tài)分布情況,難以精準(zhǔn)測(cè)評(píng)出低于或高于年級(jí)平均水平學(xué)生的真實(shí)學(xué)業(yè)成就及其增長(zhǎng)幅度邊界(Darling-Hammond, 2015)。在這樣的局限下,采用標(biāo)準(zhǔn)化測(cè)試數(shù)據(jù)來(lái)對(duì)那些教授薄弱班級(jí)或精英班級(jí)的教師進(jìn)行增值評(píng)價(jià),其測(cè)評(píng)結(jié)果必然存在統(tǒng)計(jì)學(xué)意義上的偏差(Haertel, 2013, p.8)。二是以標(biāo)準(zhǔn)化測(cè)試成績(jī)?cè)龇鶠閷?dǎo)向的增值評(píng)價(jià)誘致教師教學(xué)行為發(fā)生偏移,部分教師將大量時(shí)間用于備考應(yīng)試,甚至部分教師為獲取更高增值分值,刻意在學(xué)生標(biāo)準(zhǔn)化測(cè)試中協(xié)助學(xué)生作弊、篡改學(xué)生成績(jī),嚴(yán)重影響了學(xué)生標(biāo)準(zhǔn)化測(cè)試結(jié)果的真實(shí)性(Amrein-Beardsley et al., 2016),間接削弱了標(biāo)準(zhǔn)化測(cè)試對(duì)學(xué)生學(xué)業(yè)成就和進(jìn)步程度的檢測(cè)效度。其次是增值評(píng)價(jià)對(duì)教師效能檢測(cè)的精準(zhǔn)度受質(zhì)疑。增值評(píng)價(jià)的效度還體現(xiàn)在能否在控制其他變量的前提下精準(zhǔn)分辨教師對(duì)學(xué)生成績(jī)?cè)龇挠绊懶?yīng),從而精準(zhǔn)反映教師效能的高低。大量研究表明,學(xué)生學(xué)業(yè)成就的影響因素除了教師以外,還有學(xué)校環(huán)境、辦學(xué)條件、教學(xué)資源、同伴關(guān)系等教育系統(tǒng)內(nèi)部要素,學(xué)生自身種族、性別、智力水平、前期學(xué)業(yè)基礎(chǔ)、學(xué)習(xí)品質(zhì)、課外學(xué)習(xí)活動(dòng)等個(gè)體因素,以及學(xué)生所處的社會(huì)文化背景、家庭社會(huì)經(jīng)濟(jì)地位、父母教育背景、重要他者、社區(qū)環(huán)境等外部因素,教師只是所有錯(cuò)綜復(fù)雜的影響因素中占比不高的一個(gè)因素(Good, 2014;Haertel, 2013, p.5)。增值評(píng)價(jià)的前提假設(shè)是一旦將其他變量進(jìn)行控制,便可合理地將特定時(shí)段內(nèi)學(xué)生成績(jī)的增長(zhǎng)歸因于教師效能,然而,沒(méi)有任何一個(gè)統(tǒng)計(jì)模型能夠毫無(wú)保留地篩除教師以外其他變量的影響。此外,美國(guó)各州建立的數(shù)據(jù)庫(kù)中,學(xué)生個(gè)體變量和其他外部變量的長(zhǎng)期縱向追蹤數(shù)據(jù)普遍存在缺失現(xiàn)象,客觀制約了統(tǒng)計(jì)模型對(duì)其他影響變量的人為控制。即便具備最完整的變量數(shù)據(jù),這些非教師變量和其他難以解釋的遺漏變量對(duì)學(xué)生學(xué)業(yè)成就主因子造成的混雜效應(yīng)也難以被識(shí)別和分辨,從而影響對(duì)教師效能的精準(zhǔn)測(cè)度(Amrein-Beardsley & Holloway, 2019)。大量研究證據(jù)引發(fā)了學(xué)界對(duì)增值評(píng)價(jià)效度的質(zhì)疑,認(rèn)為增值評(píng)價(jià)的估算“極為不準(zhǔn)確”,并建議使用者謹(jǐn)慎應(yīng)用(Ballou & Springer, 2015)。

    2.統(tǒng)計(jì)偏誤之爭(zhēng)

    增值評(píng)價(jià)的另一重要理想假設(shè)是教師和學(xué)生的分配具有一定隨機(jī)性,基于隨機(jī)抽取的學(xué)生樣本成績(jī)數(shù)據(jù),能夠分析推斷出學(xué)生整體的成績(jī)與教師效能之間的因果關(guān)系,從而客觀研判教師效能對(duì)成績(jī)?cè)鲩L(zhǎng)的貢獻(xiàn)度。然而現(xiàn)實(shí)中,受自然地理?xiàng)l件、歷史文化、經(jīng)濟(jì)社會(huì)發(fā)展水平、教育政策等因素影響,大多數(shù)學(xué)區(qū)、學(xué)校都不是按隨機(jī)性原則來(lái)組織安排教師資源配置和教育教學(xué)活動(dòng)的,絕大多數(shù)學(xué)生家長(zhǎng)也不是按照隨機(jī)性原則來(lái)?yè)裥5?。在?jīng)濟(jì)水平兩極分化、種族和社會(huì)階層分級(jí)現(xiàn)象嚴(yán)重的美國(guó)社會(huì),優(yōu)質(zhì)教師資源往往被相對(duì)固化地吸引或自主流動(dòng)到優(yōu)質(zhì)學(xué)區(qū)、優(yōu)質(zhì)學(xué)校、優(yōu)等生班級(jí),而相對(duì)薄弱教師則流入處境不利學(xué)校和班級(jí),教育兩極分化現(xiàn)象普遍,班級(jí)內(nèi)學(xué)生群體的同質(zhì)性程度較高(Amrein-Beardsley et al., 2016)。大批在低收入社區(qū)學(xué)校工作的教師們,需要同時(shí)面臨教育資源相對(duì)匱乏而教學(xué)、心理、健康、社會(huì)支持需求更加迫切的挑戰(zhàn),學(xué)生學(xué)業(yè)成績(jī)?cè)诟蟪潭壬鲜艿椒N族、文化資本、經(jīng)濟(jì)社會(huì)地位等外部因素的影響,教師對(duì)這些處境不利學(xué)生學(xué)業(yè)成就增長(zhǎng)的艱辛付出與效能貢獻(xiàn),更加難以用簡(jiǎn)單的標(biāo)準(zhǔn)化測(cè)試成績(jī)?cè)龇鶃?lái)體現(xiàn)(Darling-Hammond, 2015)。在上述現(xiàn)實(shí)情境下,違背隨機(jī)性原則的班級(jí)和學(xué)生抽樣策略必然會(huì)導(dǎo)致增值模型產(chǎn)生統(tǒng)計(jì)偏誤,影響對(duì)處境不利教師評(píng)判的公平性和公正性(Amrein-Beardsley et al., 2016)。而截至目前,尚沒(méi)有任何統(tǒng)計(jì)模型和統(tǒng)計(jì)分析技術(shù)能夠補(bǔ)救因隨機(jī)性缺失而導(dǎo)致的結(jié)論偏倚問(wèn)題(Braun, 2005)。

    (二)突破增值評(píng)價(jià)在中國(guó)特色教育評(píng)價(jià)體系中的技術(shù)邊界

    增值評(píng)價(jià)以技術(shù)見(jiàn)長(zhǎng),探索增值評(píng)價(jià)需要著力加強(qiáng)增值評(píng)價(jià)模型的技術(shù)研發(fā),摸清增值評(píng)價(jià)的技術(shù)邊界,全面認(rèn)識(shí)增值評(píng)價(jià)技術(shù)中現(xiàn)存的爭(zhēng)議和短板,既不要走向?qū)夹g(shù)的神化,也不要為技術(shù)障礙所懼,保持破立并舉的決心,在技術(shù)層面的探索中實(shí)現(xiàn)突破與創(chuàng)新。

    一是應(yīng)加強(qiáng)方法和技術(shù)研究,有針對(duì)性地探索增值模型信效度缺陷和統(tǒng)計(jì)偏誤等的破解思路和優(yōu)化路徑。吸取美國(guó)增值評(píng)價(jià)技術(shù)爭(zhēng)議的深刻教訓(xùn),著力研究多種增值模型、測(cè)算方法及標(biāo)準(zhǔn)化測(cè)評(píng)工具的優(yōu)缺點(diǎn)。將增值評(píng)價(jià)方法技術(shù)層面的探索與我國(guó)國(guó)家和地方基礎(chǔ)教育階段學(xué)生標(biāo)準(zhǔn)化考試測(cè)評(píng)系統(tǒng)、國(guó)家基礎(chǔ)教育質(zhì)量監(jiān)測(cè)系統(tǒng)、教師評(píng)價(jià)系統(tǒng)等的研究與建設(shè)相關(guān)聯(lián)。探索學(xué)生成就增幅和進(jìn)步程度的本土化測(cè)評(píng)標(biāo)準(zhǔn)、測(cè)評(píng)技術(shù)、測(cè)評(píng)工具,提升各級(jí)各類追蹤性測(cè)評(píng)工具對(duì)學(xué)生學(xué)習(xí)表現(xiàn)的測(cè)評(píng)效度和數(shù)據(jù)儲(chǔ)備,不斷探索增值評(píng)價(jià)方法和技術(shù)的優(yōu)化路徑,避免技術(shù)偏誤對(duì)學(xué)生、教師、學(xué)校等評(píng)價(jià)客體造成誤判和利益損害。

    二是應(yīng)充分利用信息技術(shù),著眼國(guó)際前沿,梳理增值評(píng)價(jià)技術(shù)發(fā)展的現(xiàn)實(shí)樣態(tài)、重大挑戰(zhàn)和發(fā)展趨勢(shì),不斷尋求技術(shù)突破,以增值評(píng)價(jià)技術(shù)攻關(guān)為抓手向國(guó)際社會(huì)貢獻(xiàn)中國(guó)智慧和中國(guó)力量?!斗桨浮窂?qiáng)調(diào)要“堅(jiān)持中國(guó)特色,扎根中國(guó)、融通中外”,增值評(píng)價(jià)的本土化探索要建基于中國(guó)已有教育評(píng)價(jià)體系和新時(shí)代教育評(píng)價(jià)改革的現(xiàn)實(shí)土壤和政策土壤,既要學(xué)習(xí)借鑒國(guó)際經(jīng)驗(yàn),又要有所突破和超越,符合中國(guó)特色教育事業(yè)發(fā)展特征和需求。積極開(kāi)展教育評(píng)價(jià)國(guó)際合作,在大力度學(xué)習(xí)借鑒國(guó)際前沿技術(shù)、研發(fā)中國(guó)特色的本土化增值模型的同時(shí),積極邁入國(guó)際研究團(tuán)隊(duì)的探索行列,為增值評(píng)價(jià)現(xiàn)存難題的技術(shù)攻關(guān)需求貢獻(xiàn)中國(guó)理念和中國(guó)方案。此外,沒(méi)有任何一種測(cè)評(píng)模型、統(tǒng)計(jì)算法是萬(wàn)能的,因此要避免過(guò)度依賴單一的增值模型和測(cè)算方法,要發(fā)展和建構(gòu)多元模型和算法,通過(guò)多樣化算法的疊加、互補(bǔ)和相互比較、印證,來(lái)豐富增值評(píng)價(jià)旨在解釋和預(yù)測(cè)的教育問(wèn)題的推理邏輯和破解思路(楊欣,2022)。要繼續(xù)加強(qiáng)教育信息技術(shù)、教育統(tǒng)計(jì)技術(shù)、教育心理測(cè)量領(lǐng)域的理論創(chuàng)新發(fā)展和實(shí)踐應(yīng)用發(fā)展,著力助推增值評(píng)價(jià)以其獨(dú)特的優(yōu)勢(shì)在教育評(píng)價(jià)領(lǐng)域發(fā)揮日益重要的作用(辛濤等,2009)。

    四、應(yīng)用路向:強(qiáng)化診斷功能,探索增值評(píng)價(jià)結(jié)果的應(yīng)用限度

    教師增值評(píng)價(jià)的根本目的在于提升教師質(zhì)量,最終促進(jìn)學(xué)生學(xué)習(xí)和教育發(fā)展。為了實(shí)現(xiàn)這一目的,增值評(píng)價(jià)結(jié)果在實(shí)踐應(yīng)用中發(fā)揮著兩大核心功能:一是診斷功能,或稱發(fā)展性、形成性評(píng)價(jià)的功能,即依據(jù)測(cè)評(píng)結(jié)果及時(shí)判別和發(fā)現(xiàn)教師教學(xué)過(guò)程中的優(yōu)勢(shì)與問(wèn)題,繼而為其提供有針對(duì)性的專業(yè)發(fā)展指導(dǎo)方案,促進(jìn)教育教學(xué)效能的提升;二是行政管理功能,或稱人事評(píng)價(jià)的功能,即依據(jù)測(cè)評(píng)結(jié)果判定和核算教學(xué)實(shí)績(jī),并做出關(guān)涉教師獎(jiǎng)懲、晉升、薪資待遇和績(jī)效分配等切身利益的人事決策。作為教師效能的客觀檢測(cè)手段,增值評(píng)價(jià)的診斷功能可以服務(wù)低利害決策,為教師提供優(yōu)化教學(xué)策略和提升專業(yè)能力的重要信息和參考依據(jù);而作為行政管理者監(jiān)督和問(wèn)責(zé)的手段,增值評(píng)價(jià)的行政管理功能指向高利害決策,直接影響教師切身利益,甚至可能引起被評(píng)人員的焦慮和負(fù)向反饋,盡管“適度的焦慮可以起到提高工作質(zhì)量的動(dòng)機(jī)作用”(陳玉琨,2007,第21—23 頁(yè))。兩大功能的發(fā)揮伴隨增值評(píng)價(jià)結(jié)果的應(yīng)用,而如何應(yīng)用結(jié)果、如何確定兩大功能占據(jù)的權(quán)重取決于應(yīng)用者和決策者的選擇。與此同時(shí),利害的高低程度與決策依據(jù)的科學(xué)性程度成正比,做出高利害決策所提供的測(cè)評(píng)證據(jù)必須更加確鑿和精準(zhǔn),否則有可能會(huì)與促進(jìn)教師成長(zhǎng)的初衷背道而馳(NRC, 2010, p.60)。

    (一)以診斷功能的強(qiáng)化遏制高利害決策風(fēng)險(xiǎn)

    縱觀美國(guó)教師評(píng)價(jià)和問(wèn)責(zé)體系的演進(jìn)歷程,增值評(píng)價(jià)經(jīng)歷了由發(fā)揮行政管理功能為主導(dǎo)向發(fā)揮診斷性功能為主導(dǎo)、由以監(jiān)督激勵(lì)教師為目的向促進(jìn)教師專業(yè)發(fā)展為目的、由服務(wù)高利害決策向服務(wù)低利害決策的歷史轉(zhuǎn)向和發(fā)展趨向,其曲折的發(fā)展道路與經(jīng)驗(yàn)教訓(xùn)值得借鑒。同時(shí),增值評(píng)價(jià)結(jié)果能否以及可以在何種程度上作為教師問(wèn)責(zé)和人事決策的依據(jù)是學(xué)術(shù)研究領(lǐng)域的又一個(gè)爭(zhēng)議焦點(diǎn)。對(duì)美國(guó)增值評(píng)價(jià)政策演進(jìn)及實(shí)證研究發(fā)現(xiàn)的梳理有助于中國(guó)在探索增值評(píng)價(jià)的過(guò)程中少走彎路。

    其一,以政策演進(jìn)為據(jù),低利害融合性發(fā)展是歷史所趨。20 世紀(jì)中后期,全美教育質(zhì)量下滑危機(jī)推動(dòng)大規(guī)模教育改革以提升學(xué)生學(xué)業(yè)成就,這一戰(zhàn)略需求為增值評(píng)價(jià)的產(chǎn)生和發(fā)展提供了宏觀驅(qū)動(dòng)力。1983 年,《國(guó)家處在危機(jī)之中:教育改革勢(shì)在必行》(A Nation at Risk: The Imperative for Educational Reform)將當(dāng)時(shí)美國(guó)教育中存在的學(xué)生學(xué)業(yè)成就低、國(guó)際競(jìng)爭(zhēng)力低、功能性文盲比例高、難以滿足高質(zhì)量人力資本需求等問(wèn)題拉入全美民眾的視野,呼吁各州發(fā)動(dòng)深刻的教育改革以全面提高教育質(zhì)量,并提出五大改革任務(wù)和系列舉措,其中即包括推動(dòng)大規(guī)模標(biāo)準(zhǔn)化考試、提高考試標(biāo)準(zhǔn)和期望,并持續(xù)監(jiān)測(cè)評(píng)估學(xué)生成績(jī)進(jìn)步情況;推行績(jī)效工資(performance-based salary),將教師評(píng)價(jià)系統(tǒng)與教師待遇、晉升、終身教職、留任等高利害問(wèn)責(zé)決策掛鉤(USNCEE,1983)。與此同時(shí),傳統(tǒng)的以課堂觀察為主導(dǎo)的主觀性教師評(píng)價(jià)體系在實(shí)踐中暴露了諸多問(wèn)題,教育政策制定者急需一種科學(xué)的測(cè)評(píng)方法來(lái)客觀診斷和識(shí)別教師等關(guān)鍵影響因素對(duì)學(xué)生學(xué)習(xí)的促進(jìn)效能和貢獻(xiàn)度,為高利害的教育問(wèn)責(zé)體系提供客觀依據(jù)(Sanders & Horn, 1998),這進(jìn)一步促進(jìn)了增值評(píng)價(jià)的發(fā)展。自此,全美各州開(kāi)始探索教師評(píng)價(jià)改革及其與學(xué)生成績(jī)的關(guān)聯(lián)。其中,田納西州采納了統(tǒng)計(jì)學(xué)專家威廉·桑德斯(William Sanders)建立的“增值評(píng)價(jià)模型”(后稱為“桑德斯模型”, Sanders Model),即基于特定學(xué)生變量的控制測(cè)算學(xué)生特定時(shí)期數(shù)學(xué)和閱讀成績(jī)的增長(zhǎng),并以此增長(zhǎng)數(shù)據(jù)來(lái)評(píng)價(jià)學(xué)校效能和教師效能的數(shù)學(xué)統(tǒng)計(jì)模型(Sanders & Horn,1994)。田納西州于1992 年將這一模型納入該州《教育改進(jìn)法》(Education Improvement Act),構(gòu)建了美國(guó)教育評(píng)價(jià)歷史上頗具影響力的“田納西增值評(píng)價(jià)系統(tǒng)”( Tennessee Value-added Assessment System,TVAAS)。這一系統(tǒng)首次在政策和立法層面確立了教育增值評(píng)價(jià)的合法地位,及以此評(píng)價(jià)結(jié)果作為教師問(wèn)責(zé)依據(jù)的合法話語(yǔ)(Sanders & Horn, 1998),掀起了全美范圍內(nèi)增值評(píng)價(jià)的研究熱潮和行動(dòng)熱潮。

    21 世紀(jì)以來(lái),《不讓一個(gè)孩子掉隊(duì)法》的頒布和“力爭(zhēng)上游”基金項(xiàng)目(Race to the Top Fund Program)的推動(dòng)為增值評(píng)價(jià)的大規(guī)模制度化發(fā)展起到了里程碑式的助推作用。前者主導(dǎo)了全美標(biāo)準(zhǔn)化教育改革,激勵(lì)各州推動(dòng)年度學(xué)生學(xué)業(yè)成就標(biāo)準(zhǔn)化考試、年度學(xué)業(yè)進(jìn)步測(cè)評(píng)與報(bào)告、基于標(biāo)準(zhǔn)的教師質(zhì)量評(píng)價(jià)、基于學(xué)業(yè)成就的學(xué)校效能和教師效能評(píng)價(jià)、教育問(wèn)責(zé)體系構(gòu)建等改革,為增值評(píng)價(jià)的制度化發(fā)展提供了政策空間,奠定了全美標(biāo)準(zhǔn)化測(cè)評(píng)及學(xué)業(yè)進(jìn)步測(cè)評(píng)的數(shù)據(jù)基礎(chǔ),為大規(guī)模推行增值評(píng)價(jià)提供了保障條件(USDOE, 2002)。后者發(fā)起了K-12 階段共同核心標(biāo)準(zhǔn)(Common set of K-12 standards)的建構(gòu),大力度強(qiáng)化了學(xué)生標(biāo)準(zhǔn)化考試及州級(jí)追蹤數(shù)據(jù)庫(kù)建設(shè),進(jìn)一步推動(dòng)基于學(xué)生標(biāo)準(zhǔn)化成績(jī)?cè)鲩L(zhǎng)的教師評(píng)價(jià)體系改革,鼓勵(lì)以評(píng)價(jià)結(jié)果為依據(jù)制定高利害教師問(wèn)責(zé)和用人決策,提升教師效能(USDOE,2009)。近十年間,在聯(lián)邦政府教育基金的驅(qū)動(dòng)下,美國(guó)各州掀起了一股將學(xué)生成績(jī)?cè)鲩L(zhǎng)納入教師評(píng)價(jià)體系并作為教師問(wèn)責(zé)依據(jù)的立法潮(National Conference of State Legislatures, 2010)。據(jù)統(tǒng)計(jì),截至2016 年1 月,全美44 個(gè)州及華盛頓哥倫比亞特區(qū)(約占全美行政區(qū)劃88%)采納了增值評(píng)價(jià)來(lái)推動(dòng)當(dāng)?shù)貙W(xué)校教師效能評(píng)估,并將評(píng)估結(jié)果用于當(dāng)?shù)貙W(xué)校教師的高利害人事決策中;超過(guò)30 個(gè)州及華盛頓哥倫比亞特區(qū)(約占61%)頒布了相關(guān)法律法規(guī)強(qiáng)制學(xué)校將增值評(píng)價(jià)納入教師評(píng)價(jià)體系中(Collins & Amrein-Beardsley, 2014)。增值評(píng)價(jià)作為一種主導(dǎo)性政策工具在全美教育評(píng)價(jià)系統(tǒng)中迅速推廣開(kāi)來(lái)。

    然而,隨著大規(guī)模推廣,增值評(píng)價(jià)在實(shí)踐應(yīng)用中暴露的問(wèn)題和在學(xué)術(shù)研究證據(jù)下暴露的弊端受到越來(lái)越多批判。美國(guó)聯(lián)邦政府調(diào)整評(píng)價(jià)方向,逐漸弱化增值評(píng)價(jià)的主導(dǎo)性地位和高利害問(wèn)責(zé)關(guān)聯(lián),逐漸進(jìn)入了限定性、融合性發(fā)展階段。2015 年12 月,奧巴馬政府簽署頒布了《每個(gè)學(xué)生都成功法》(Every Student Succeeds Act, ESSA),修正了有關(guān)標(biāo)準(zhǔn)化考試的條款,并將問(wèn)責(zé)權(quán)轉(zhuǎn)移到各個(gè)州教育部,賦予各州自主研制州級(jí)學(xué)生學(xué)業(yè)標(biāo)準(zhǔn)、采取多樣化學(xué)生學(xué)業(yè)成就和教師效能測(cè)評(píng)方式、根據(jù)各州特色提升教育質(zhì)量的權(quán)利和責(zé)任。此外,該法還專門強(qiáng)調(diào),教師評(píng)價(jià)不能以學(xué)生學(xué)業(yè)成就表現(xiàn)為唯一依據(jù),鼓勵(lì)采用多樣化方法對(duì)教師教學(xué)表現(xiàn)和效能進(jìn)行綜合評(píng)價(jià)(USDOE, 2016)。該法案的頒布迎來(lái)了美國(guó)教師增值評(píng)價(jià)應(yīng)用性發(fā)展的分水嶺。各州教育部對(duì)增值評(píng)價(jià)在教師評(píng)價(jià)體系中的定位做了調(diào)整與修正,一些州(如紐約州、俄亥俄州、田納西州等)繼續(xù)沿用教師增值評(píng)價(jià)方法,但也有越來(lái)越多的州(如阿拉巴馬州、亞利桑那州、喬治亞州等)廢止或改革了基于增值評(píng)價(jià)結(jié)果的教師問(wèn)責(zé)體系;大多數(shù)州不再將增值評(píng)價(jià)結(jié)果與高利害教師用人決策掛鉤,而僅作為輔助性的問(wèn)題診斷依據(jù)為教師專業(yè)發(fā)展提供指導(dǎo);即便依然使用原有的或修正后的增值評(píng)價(jià)法,但大多數(shù)州也不再將增值評(píng)價(jià)結(jié)果作為教師評(píng)價(jià)體系的唯一甚至核心方法,而是將其與課堂觀察、學(xué)生調(diào)查、教學(xué)檔案評(píng)估等方法進(jìn)行融合,降低增值評(píng)價(jià)分值在綜合評(píng)價(jià)分值中所占的權(quán)重。過(guò)去以增值評(píng)價(jià)為主導(dǎo)、強(qiáng)化增值評(píng)價(jià)行政管理功能的教師評(píng)價(jià)體系,最終轉(zhuǎn)向強(qiáng)化診斷功能、以增值評(píng)價(jià)結(jié)果作為輔佐性診斷依據(jù)、融合多種測(cè)評(píng)方法及多樣化高質(zhì)量證據(jù)的綜合評(píng)價(jià)體系(Amrein-Beardsley & Holloway, 2019)。

    其二,以實(shí)證研究為據(jù),避免高利害決策是證據(jù)所指。在美國(guó)學(xué)者有關(guān)增值評(píng)價(jià)服務(wù)決策功能的爭(zhēng)議中,站在擁護(hù)方立場(chǎng)的學(xué)者們一方面積極采集實(shí)證證據(jù),肯定增值評(píng)價(jià)主導(dǎo)的人事決策在優(yōu)化師資隊(duì)伍結(jié)構(gòu)、提升人事管理效率、完善教師退出機(jī)制、激發(fā)教師內(nèi)生動(dòng)力等方面的作用和價(jià)值;另一方面,他們持續(xù)開(kāi)展長(zhǎng)期追蹤研究,驗(yàn)證增值評(píng)價(jià)導(dǎo)向下教師對(duì)學(xué)生發(fā)展起到了長(zhǎng)遠(yuǎn)的積極影響。有研究發(fā)現(xiàn),增值評(píng)價(jià)的實(shí)施推動(dòng)了“低效能”教師的自主離任,激發(fā)了留任教師尤其是得到高績(jī)效獎(jiǎng)勵(lì)的“高效能”教師的內(nèi)生動(dòng)力,進(jìn)一步有效提升了其所任教班級(jí)學(xué)生的成績(jī)?cè)鲩L(zhǎng)幅度(Dee & Wyckoff,2015)。一項(xiàng)對(duì)3—8 年級(jí)學(xué)生縱向追蹤20 年的研究發(fā)現(xiàn),那些在3—8 年級(jí)階段就讀于增值評(píng)價(jià)分值高的“高效能教師”班級(jí)的學(xué)生,在成人階段高等教育入學(xué)率更高、收入更高、社會(huì)經(jīng)濟(jì)地位更高,間接印證了增值評(píng)價(jià)結(jié)果和基于增值評(píng)價(jià)的教師問(wèn)責(zé)政策的有效性和深遠(yuǎn)影響(Chetty et al., 2014)。

    更多站在批判立場(chǎng)的研究者鑒于證據(jù)的缺乏對(duì)增值評(píng)價(jià)方法的科學(xué)性與精準(zhǔn)度表示懷疑,進(jìn)而鮮明反對(duì)將增值評(píng)價(jià)應(yīng)用于實(shí)踐,尤其是應(yīng)用于高利害的人事決策中。美國(guó)教育部聯(lián)合多個(gè)研究機(jī)構(gòu)發(fā)布的一份有關(guān)“力爭(zhēng)上游”項(xiàng)目效果評(píng)估的報(bào)告中稱,自實(shí)施以來(lái),尚未有證據(jù)能夠證明該項(xiàng)目對(duì)學(xué)生學(xué)業(yè)成就的提升起到了實(shí)質(zhì)性作用(Dragoset et al., 2015)。這意味著,“力爭(zhēng)上游”項(xiàng)目的重要舉措之一,與高利害決策掛鉤的教師增值評(píng)價(jià),對(duì)學(xué)生學(xué)業(yè)成就的促進(jìn)作用也未得到積極的循證支持。相反地,基于增值評(píng)價(jià)結(jié)果的教師效能排名、等級(jí)分類等高利害問(wèn)責(zé)已然引發(fā)多種不良的反向作用(Goldhaber, 2015),包括教師與學(xué)校和行政部門之間的法律沖突(Education Week, 2015; Harris, 2016),教師職業(yè)認(rèn)同感、價(jià)值感和工作積極性的削弱(Harris & Herrington, 2015),應(yīng)試導(dǎo)向的教學(xué)模式轉(zhuǎn)變和考試違規(guī)等失范行為的增多(Ballou & Springer, 2015),對(duì)低于或高于平均水平學(xué)生個(gè)性化教學(xué)需求的忽視,以及同事間的惡性競(jìng)爭(zhēng)生態(tài)(Darling-Hammond, 2015)等。諸多證據(jù)顯示,問(wèn)責(zé)驅(qū)動(dòng)的教師增值評(píng)價(jià)對(duì)教師內(nèi)部動(dòng)機(jī)有抑制作用(NRC, 2011, p.4)。

    隨著實(shí)踐中的問(wèn)題逐漸暴露,諸多權(quán)威機(jī)構(gòu)站到反方隊(duì)列,遏制增值評(píng)價(jià)在高利害決策中的應(yīng)用。蘭德公司(RAND Corporation)早在2003 年即發(fā)表報(bào)告稱:“有關(guān)增值評(píng)價(jià)的研究基礎(chǔ)尚不充足,增值評(píng)價(jià)模型產(chǎn)生的統(tǒng)計(jì)偏誤尚未可知,沒(méi)有可行的方法來(lái)科學(xué)檢測(cè)潛在偏誤的程度及其可能造成的影響與后果,增值評(píng)價(jià)測(cè)算結(jié)果缺乏穩(wěn)定性,不建議將增值評(píng)價(jià)用于高利害教師評(píng)價(jià)決策中,尤其要避免基于增值評(píng)價(jià)分值對(duì)教師進(jìn)行排名”(McCaffrey et al., 2003, pp.119-120)。美國(guó)統(tǒng)計(jì)協(xié)會(huì)(American Statistical Association, ASA)發(fā)布聲明稱,在使用增值評(píng)價(jià)時(shí),對(duì)量化信息的過(guò)度倚重會(huì)引發(fā)反作用,甚至?xí)c提高教師質(zhì)量的目標(biāo)背道而馳(ASA, 2014)。美國(guó)教育研究協(xié)會(huì)(American Educational Research Association, AERA)發(fā)布聲明,建議“所有已經(jīng)應(yīng)用或準(zhǔn)備應(yīng)用增值模型的教師教育項(xiàng)目和學(xué)校機(jī)構(gòu)應(yīng)理性認(rèn)識(shí)這種測(cè)評(píng)方法的科學(xué)限度和技術(shù)限度,謹(jǐn)慎使用增值評(píng)價(jià)作為高利害教師人事決策的方法和依據(jù)”(AERA, 2015)。2014 年,美國(guó)教育研究協(xié)會(huì)、美國(guó)心理協(xié)會(huì)(American Psychological Association,APA)、國(guó)家教育測(cè)評(píng)協(xié)會(huì)(National Council on Measurement in Education, NCME)聯(lián)合發(fā)布的最新版《教育與心理測(cè)評(píng)標(biāo)準(zhǔn)》(Standards for Educational and Psychological Testing)明確表明,學(xué)生測(cè)評(píng)成績(jī)可應(yīng)用于教育項(xiàng)目評(píng)估、政策研究、問(wèn)責(zé)體系中,但條件是必須提供成績(jī)測(cè)評(píng)工具的信效度檢測(cè)報(bào)告和可信的、能夠證實(shí)該成績(jī)檢測(cè)結(jié)果與教師效能之間因果關(guān)系的證據(jù)(Braun, 2015)。

    (二)探尋增值評(píng)價(jià)結(jié)果在中國(guó)特色教育評(píng)價(jià)體系中的應(yīng)用路向

    首先,應(yīng)謹(jǐn)慎規(guī)劃增值評(píng)價(jià)應(yīng)用于政策和實(shí)踐的方向和進(jìn)程,全面把握增值評(píng)價(jià)向?qū)嵺`轉(zhuǎn)化的適宜時(shí)機(jī)。從美國(guó)經(jīng)驗(yàn)來(lái)看,增值評(píng)價(jià)由理論向政策實(shí)踐的應(yīng)用轉(zhuǎn)化是特定社會(huì)歷史條件、教育系統(tǒng)內(nèi)外部要素發(fā)展需求、測(cè)評(píng)技術(shù)發(fā)展與多元利益相關(guān)主體價(jià)值驅(qū)動(dòng)的耦合結(jié)果。而增值評(píng)價(jià)在美國(guó)教師評(píng)價(jià)體系二十余年的應(yīng)用中由服務(wù)高利害決策向限定性、融合式服務(wù)低利害決策的轉(zhuǎn)向,客觀反映了新型教育評(píng)價(jià)理念歷經(jīng)實(shí)踐檢驗(yàn)、批判、再認(rèn)知、再修訂的歷史變遷規(guī)律,也反映了任何評(píng)價(jià)手段都要以促進(jìn)人的發(fā)展為終極關(guān)懷的普世價(jià)值。新時(shí)代教育增值評(píng)價(jià)的本土化理論和技術(shù)探索尚不成熟,亟需集結(jié)教育測(cè)量與評(píng)價(jià)領(lǐng)域?qū)<覍W(xué)者和教育考試、教育評(píng)價(jià)專業(yè)機(jī)構(gòu)聯(lián)合開(kāi)展深入的研究,充分儲(chǔ)備好高質(zhì)量的數(shù)據(jù)基礎(chǔ),在特定試點(diǎn)地區(qū)和教師群體開(kāi)展多個(gè)周期的試測(cè)、檢驗(yàn)、修正,并在取得積極循證結(jié)果的前提下,方可運(yùn)用到政策話語(yǔ)中指導(dǎo)實(shí)踐的開(kāi)展與推廣。

    其次,應(yīng)突出增值評(píng)價(jià)結(jié)果的診斷功能,使多維功能間相互制衡與融合?!斗桨浮分赋觯巴晟圃u(píng)價(jià)結(jié)果運(yùn)用,綜合發(fā)揮導(dǎo)向、鑒定、診斷、調(diào)控和改進(jìn)作用”。增值評(píng)價(jià)能夠在我國(guó)教育評(píng)價(jià)體系中發(fā)揮多大效益,一方面取決于增值評(píng)價(jià)自身的算法優(yōu)劣,另一方面則取決于決策者和實(shí)踐者對(duì)增值算法結(jié)果的認(rèn)知方法、認(rèn)知目的、認(rèn)知對(duì)象和認(rèn)知模式(楊欣,2022),即關(guān)涉增值算法結(jié)果的推理邏輯、應(yīng)用目的、關(guān)注對(duì)象和理解闡釋。美國(guó)教育增值評(píng)價(jià)的實(shí)踐印證了以學(xué)生成績(jī)?cè)鲋低评斫處熜堋?yīng)用于教師高利害問(wèn)責(zé)、重點(diǎn)關(guān)注決策者的行政管理和人事監(jiān)控需求等經(jīng)驗(yàn)的失敗。這啟示我們?cè)趯?shí)踐中要以教師發(fā)展為中心,兼顧教育行政管理者、政策制定者的利益訴求,權(quán)衡教師主體與利益相關(guān)者的利益博弈均衡,既要突出增值評(píng)價(jià)結(jié)果之于教師專業(yè)能力的導(dǎo)向、鑒定、診斷功能,又要發(fā)揮其基于證據(jù)進(jìn)行師資調(diào)控、改進(jìn)方案研制的功能,服務(wù)于《方案》提出的“重實(shí)績(jī)、重貢獻(xiàn)的激勵(lì)機(jī)制”建設(shè),避免公開(kāi)、惡意使用增值結(jié)果進(jìn)行排名、等級(jí)劃分、利益綁定,也要防止增值評(píng)價(jià)結(jié)果的形式主義和失效,實(shí)現(xiàn)增值評(píng)價(jià)多維功能的相互制衡、相互融合、相互補(bǔ)充,為激發(fā)教師內(nèi)生動(dòng)力和提高教師質(zhì)量肅清評(píng)價(jià)生態(tài)、掃清機(jī)制障礙和壓力源,引導(dǎo)教師注重教育教學(xué)實(shí)績(jī),潛心教書育人。

    五、發(fā)展路向:構(gòu)建多元化測(cè)評(píng)體系,探索增值評(píng)價(jià)的融合發(fā)展之路

    教育評(píng)價(jià)是對(duì)教育目標(biāo)達(dá)成程度的基本判斷,而教育目標(biāo)具有多重性。當(dāng)前沒(méi)有一個(gè)教育系統(tǒng)對(duì)所有教育目標(biāo)的評(píng)價(jià)是完整的,許多教育評(píng)價(jià)只是關(guān)注了教育目標(biāo)中的知識(shí)技能這一很小的部分,而基于此得出的評(píng)判必然導(dǎo)向教育評(píng)價(jià)的狹隘化(趙勇,2021)。增值評(píng)價(jià)也天然攜帶狹隘性,因此,將增值評(píng)價(jià)與其他多元化測(cè)評(píng)方法相融合,嵌入綜合性的評(píng)價(jià)體系,成為國(guó)內(nèi)外學(xué)者有關(guān)增值評(píng)價(jià)未來(lái)發(fā)展路向達(dá)成的一致共識(shí)(Darling-Hammond, 2015;王斌華,2005;鄭智勇,宋乃慶,2021)。這既是美國(guó)眾多州政府現(xiàn)行教師評(píng)價(jià)體系所采納的策略,也是我國(guó)新時(shí)代教育評(píng)價(jià)體系和增值評(píng)價(jià)本土化發(fā)展的內(nèi)在要求與必然選擇。

    (一)增值評(píng)價(jià)與多元評(píng)價(jià)方法的融合經(jīng)驗(yàn)

    為證實(shí)多元測(cè)評(píng)方法綜合評(píng)價(jià)結(jié)果相較單一測(cè)評(píng)結(jié)果的科學(xué)性和優(yōu)越性, 比爾及梅琳達(dá)·蓋茨基金會(huì)資助了一項(xiàng)頗具影響力的有效教學(xué)測(cè)評(píng)項(xiàng)目(Measures of Effective Teaching, MET Project),并通過(guò)實(shí)驗(yàn)研究證實(shí),融合了課堂觀察、增值評(píng)價(jià)、學(xué)生反饋等多種測(cè)評(píng)方法的教師評(píng)價(jià)結(jié)果,相較于以上任何單一方法的評(píng)價(jià)結(jié)果而言,都具有更高的統(tǒng)計(jì)效力和信度,更有助于促進(jìn)教師有效教學(xué)(Bill &Melinda Gates Foundation, 2010; 2012)。眾多類似實(shí)證研究的證據(jù)為美國(guó)教育政策決策部門建立健全綜合性教師評(píng)價(jià)體系提供了循證依據(jù),增值評(píng)價(jià)與其他評(píng)價(jià)方法的融合也越來(lái)越多地體現(xiàn)在美國(guó)各州宏觀教師評(píng)價(jià)體系的總體設(shè)計(jì)、中觀方法的組合使用、微觀證據(jù)的綜合采集等方方面面。

    一是評(píng)價(jià)體系的綜合性與融合性。美國(guó)多個(gè)州教育部在搭建的教師評(píng)價(jià)體系宏觀框架中將增值評(píng)價(jià)與其他評(píng)價(jià)理念相融合,增值評(píng)價(jià)在特定權(quán)重范圍內(nèi)發(fā)揮限定性作用。例如,田納西州教育部建構(gòu)的“田納西教育者提升模型”(Tennessee Educator Acceleration Model, TEAM)以提升教育者專業(yè)水平為目的開(kāi)展綜合評(píng)價(jià),融合了田納西增值評(píng)價(jià)系統(tǒng)(TVAAS),過(guò)程評(píng)價(jià)取向的課堂教學(xué)觀察、教師主觀反饋、學(xué)生檔案袋評(píng)價(jià),以及結(jié)果評(píng)價(jià)取向的學(xué)生學(xué)業(yè)成就表現(xiàn)測(cè)評(píng),三者綜合集成來(lái)反映教師的總體效能水平分值,其中增值評(píng)價(jià)分值在綜合分值測(cè)算中占35%的權(quán)重(Tennessee Department of Education, 2022)。佛羅里達(dá)州教師評(píng)價(jià)系統(tǒng)鼓勵(lì)將增值評(píng)價(jià)結(jié)果與其他過(guò)程性、結(jié)果性教師評(píng)價(jià)結(jié)果相融合,要求基于學(xué)生學(xué)業(yè)表現(xiàn)的增值評(píng)價(jià)比重須至少占三分之一,基于課堂觀察等主觀評(píng)價(jià)方法的教師教學(xué)實(shí)踐評(píng)價(jià)比重須占至少三分之一,其他評(píng)價(jià)指標(biāo)最多占三分之一(Florida Department of Education, 2022)。二是評(píng)價(jià)方法的多元組合。美國(guó)各州教師評(píng)價(jià)體系鼓勵(lì)探索增值評(píng)價(jià)以外的檢測(cè)學(xué)生學(xué)習(xí)成就增長(zhǎng)的方法,鼓勵(lì)采用多元化的評(píng)價(jià)方法、工具和手段來(lái)獲取多元化的信息與數(shù)據(jù),從而對(duì)教師效能做出趨近真實(shí)的全面刻畫。據(jù)美國(guó)教師質(zhì)量協(xié)會(huì)(National Council on Teacher Quality)統(tǒng)計(jì),截至2019 年,全美有44 個(gè)州要求在教師評(píng)價(jià)體系中納入教師課堂觀察法,33 個(gè)州要求使用增值評(píng)價(jià),7 個(gè)州要求將學(xué)生調(diào)查納入教師評(píng)價(jià)和反饋系統(tǒng)中,24 個(gè)州允許使用學(xué)生調(diào)查法來(lái)評(píng)價(jià)教師效能(Schweig, 2019)。制度化支持進(jìn)一步鞏固了美國(guó)教師評(píng)價(jià)方法在政策層面呈多樣化發(fā)展的樣態(tài)。三是評(píng)價(jià)證據(jù)的多樣性。自2016 年增值評(píng)價(jià)式微以來(lái),美國(guó)各州教師評(píng)價(jià)體系更加強(qiáng)調(diào)教師評(píng)價(jià)所建基的證據(jù)的多樣性和質(zhì)量水平,鼓勵(lì)探索學(xué)生成就增值證據(jù)的多樣化獲取手段;提升多樣化學(xué)生標(biāo)準(zhǔn)化測(cè)試工具效度以采集高質(zhì)量增值證據(jù);采取更適宜的測(cè)評(píng)方法對(duì)正態(tài)分布之外的少數(shù)優(yōu)等生和差生采集增值證據(jù);鼓勵(lì)教師在評(píng)估周期自行采集和積累合理的、適切的證據(jù),組成有效的證據(jù)鏈,來(lái)證明其所教學(xué)生發(fā)展的“增值”表現(xiàn)及其自身教學(xué)實(shí)績(jī);當(dāng)多重證據(jù)指向矛盾性結(jié)論時(shí),需要補(bǔ)充證據(jù)和調(diào)查,鼓勵(lì)教師發(fā)出自己的聲音對(duì)多樣性證據(jù)進(jìn)行呈現(xiàn)、補(bǔ)充和闡釋,或?qū)σ研纬傻脑u(píng)估結(jié)果進(jìn)行申辯協(xié)商,力求將教師評(píng)價(jià)的最終結(jié)果建立在多重證據(jù)指向性一致以及利益相關(guān)主體協(xié)商一致的基礎(chǔ)上。

    (二)系統(tǒng)構(gòu)建增值評(píng)價(jià)的中國(guó)特色融合發(fā)展策略

    在增值評(píng)價(jià)的本土化探索進(jìn)程中,“要不要與其他評(píng)價(jià)方法融合”已不再是研討焦點(diǎn),而“融合什么”“如何融合”成為亟待破解的關(guān)鍵問(wèn)題。

    其一,應(yīng)以價(jià)值多元化為導(dǎo)向,構(gòu)建增值評(píng)價(jià)與多元化測(cè)評(píng)方法的系統(tǒng)性融合機(jī)制。增值評(píng)價(jià)站在價(jià)值中立的立場(chǎng),試圖通過(guò)學(xué)生成績(jī)?cè)鲋档摹笆聦?shí)”來(lái)客觀反映教師效能的“真相”。而實(shí)際上,評(píng)價(jià)作為一項(xiàng)價(jià)值判斷的行為,其本身并非價(jià)值無(wú)涉。從決策者對(duì)評(píng)價(jià)體系框架的構(gòu)建,到評(píng)價(jià)客體的聚焦,再到評(píng)價(jià)標(biāo)準(zhǔn)的構(gòu)建、評(píng)估工具的篩選、評(píng)估結(jié)果的應(yīng)用與闡釋,都刻上了評(píng)價(jià)主體以及評(píng)價(jià)體系設(shè)計(jì)者的主觀價(jià)值烙印。不同的評(píng)價(jià)方法和標(biāo)準(zhǔn)也反映了其背后所建基的多元價(jià)值體系。因此,要實(shí)現(xiàn)增值評(píng)價(jià)與多元評(píng)價(jià)方法的融合,首先應(yīng)認(rèn)同和抱持價(jià)值多元主義的評(píng)價(jià)導(dǎo)向,并在綜合考量多元利益相關(guān)者的多元化價(jià)值立場(chǎng)的前提下設(shè)計(jì)綜合性的評(píng)價(jià)體系,以確保評(píng)價(jià)結(jié)果更加多面向地考量和呈現(xiàn)評(píng)價(jià)客體滿足主體需求的屬性和程度。其次,增值評(píng)價(jià)的探索不是孤立的,應(yīng)嵌入到教育評(píng)價(jià)體系總體戰(zhàn)略框架中,放置于多樣化評(píng)價(jià)理念的參照體系中。以系統(tǒng)觀和決策理論的視野,從政治經(jīng)濟(jì)文化環(huán)境、各利益相關(guān)主體的價(jià)值訴求、數(shù)據(jù)的可獲取性、經(jīng)費(fèi)投入成本及測(cè)評(píng)目的目標(biāo)等維度,綜合衡量和比較“結(jié)果評(píng)價(jià)”“過(guò)程評(píng)價(jià)”“綜合評(píng)價(jià)”“增值評(píng)價(jià)”各自的特色與優(yōu)勢(shì),預(yù)估每一種測(cè)評(píng)理念所得出的評(píng)估結(jié)果對(duì)促進(jìn)教師質(zhì)量、改進(jìn)教育質(zhì)量的潛在貢獻(xiàn)與價(jià)值,考量每一種評(píng)價(jià)理念可能存在的風(fēng)險(xiǎn)與隱患(McCaffrey et al., 2003, p.118),避免增值評(píng)價(jià)成為主導(dǎo)性的評(píng)價(jià)準(zhǔn)則。在具體的測(cè)評(píng)項(xiàng)目中,研判增值評(píng)價(jià)與三個(gè)評(píng)價(jià)理念的互通性、互補(bǔ)性和融合性,找準(zhǔn)增值評(píng)價(jià)在綜合評(píng)價(jià)體系中所適宜扮演的角色和占據(jù)的權(quán)重,研制出適宜具體測(cè)評(píng)目的和對(duì)象的嵌套式融合評(píng)估機(jī)制,力求采用更加多元的評(píng)價(jià)理念實(shí)現(xiàn)對(duì)評(píng)價(jià)對(duì)象樣態(tài)和關(guān)鍵要素的全面完整刻畫,力求實(shí)現(xiàn)不同評(píng)價(jià)理念獨(dú)特優(yōu)勢(shì)的最大化發(fā)揮和不同評(píng)價(jià)理念間的最優(yōu)匹配。此外,應(yīng)站在新時(shí)代教育評(píng)價(jià)和教育高質(zhì)量發(fā)展的戰(zhàn)略高度,以促進(jìn)教師發(fā)展和教育質(zhì)量為終極訴求,構(gòu)建一套動(dòng)態(tài)循環(huán)、螺旋向上的“評(píng)價(jià)+提升”一體化綜合評(píng)價(jià)體系框架。將教師發(fā)展目標(biāo)和年度教學(xué)計(jì)劃的參與式制定作為評(píng)價(jià)體系的起點(diǎn)環(huán)節(jié),將計(jì)劃的執(zhí)行、形成性評(píng)價(jià)、增值評(píng)價(jià)和年度終結(jié)性評(píng)價(jià)納入到一個(gè)完整的、綜合的、循環(huán)往復(fù)的教師評(píng)價(jià)程序中,將教師的自我反思與自我評(píng)價(jià)作為一輪評(píng)價(jià)周期的終點(diǎn)和啟動(dòng)新一輪評(píng)價(jià)周期的起點(diǎn),最終將教師評(píng)價(jià)引入不斷促進(jìn)教師專業(yè)發(fā)展進(jìn)而促進(jìn)學(xué)生學(xué)習(xí)和教育質(zhì)量的向上驅(qū)動(dòng)的良性循環(huán)軌道中。在實(shí)施計(jì)劃的過(guò)程中,教師自身與評(píng)價(jià)者采用增值評(píng)價(jià)和多元方法共同收集關(guān)于教師表現(xiàn)與學(xué)生學(xué)習(xí)增值的多樣化數(shù)據(jù)資料證據(jù),并持續(xù)進(jìn)行追蹤、反饋、反思、改進(jìn),循環(huán)往復(fù),共同構(gòu)建“評(píng)價(jià)+提升”一體化的綜合體系,共同促進(jìn)教師評(píng)價(jià)的公平公正性、全面性和科學(xué)性。

    其二,應(yīng)以利益相關(guān)主體的多元協(xié)商為原則,結(jié)合具體情境構(gòu)建增值評(píng)價(jià)與多樣化證據(jù)的融合機(jī)制。首先應(yīng)重視利益相關(guān)者的多元協(xié)商與共同建構(gòu)。增值評(píng)價(jià)的落地實(shí)施需立足具體而真實(shí)的應(yīng)用情境,這不僅關(guān)涉政治、經(jīng)濟(jì)、社會(huì)、文化、心理等復(fù)雜的現(xiàn)實(shí)要素,也關(guān)涉評(píng)估者和被評(píng)估者等多元利益相關(guān)者的合法權(quán)益及相互間的互動(dòng)關(guān)聯(lián)。評(píng)價(jià)聚焦哪些維度、采用何種評(píng)價(jià)方法與手段、采集和披露哪些數(shù)據(jù)信息、對(duì)結(jié)果做出何種解釋等都反映了特定情境下評(píng)價(jià)主體的關(guān)切和需求,并與多元利益相關(guān)者的切身利益密切相關(guān)。當(dāng)不同方法采用不同價(jià)值標(biāo)準(zhǔn)和評(píng)價(jià)尺度,或當(dāng)不同評(píng)價(jià)手段得到不一致的數(shù)據(jù)信息而引發(fā)沖突性的裁決時(shí),必須建構(gòu)一套以平等協(xié)商為原則的融合機(jī)制,為不同評(píng)價(jià)方法和結(jié)論提供闡釋的機(jī)會(huì)和空間,為不同方法賦予合理的權(quán)重,為不同利益相關(guān)者賦予能力和權(quán)力,應(yīng)許其充分地參與、響應(yīng)和平等地對(duì)話、協(xié)商,最終達(dá)成對(duì)評(píng)估結(jié)果具有共識(shí)性的建構(gòu)。其次,應(yīng)在協(xié)商原則下促成多樣化方法的有機(jī)融合。在設(shè)計(jì)和搭建評(píng)估體系時(shí),需識(shí)別所關(guān)涉的關(guān)鍵利益相關(guān)者及其代表的多重教育目標(biāo),并站在他們的立場(chǎng)和視角,篩選和搭建多樣化的能夠反映多元利益相關(guān)群體關(guān)切焦點(diǎn)的評(píng)價(jià)方法組合,繼而采用盡可能全面的手段從盡可能多的視角和渠道獲取多面向的數(shù)據(jù)和信息,為多元協(xié)商和達(dá)成共識(shí)提供互補(bǔ)或互相印證的物料與素材,通過(guò)資源整合,做出無(wú)限趨近于教師效能“真相”的努力(Schweig, 2019)。早在增值評(píng)價(jià)誕生以前,基于教師教學(xué)實(shí)踐觀察的評(píng)估方法(ratings based on observations of teacher practice, OTP)在評(píng)價(jià)標(biāo)準(zhǔn)和工具的可信度、穩(wěn)定性、主觀偏見(jiàn)等方面飽受詬病,而后隨著不斷完善,現(xiàn)已發(fā)展成為普適性最高的測(cè)評(píng)方法(Braun, 2015)。學(xué)生作為教師評(píng)價(jià)的間接受益者,通過(guò)學(xué)生調(diào)查法、學(xué)生檔案袋等手段可以為教師效能提供重要證據(jù)。教師教學(xué)檔案袋、自評(píng)報(bào)告、所教學(xué)生學(xué)業(yè)述評(píng)、教學(xué)述評(píng)等評(píng)價(jià)手段和方法可以幫助教師主體站在自身立場(chǎng)發(fā)出聲音。此外,家長(zhǎng)評(píng)價(jià)也可以為理解教師效能補(bǔ)充重要且獨(dú)特的視角。

    六、實(shí)踐路向:做足條件準(zhǔn)備,探索增值評(píng)價(jià)的實(shí)施策略

    要推動(dòng)增值評(píng)價(jià)從理論探索向具體實(shí)施的轉(zhuǎn)換,必須在評(píng)價(jià)體系頂層設(shè)計(jì)、測(cè)評(píng)工具研發(fā)、基礎(chǔ)數(shù)據(jù)儲(chǔ)備、統(tǒng)計(jì)模型建構(gòu)、團(tuán)隊(duì)建設(shè)、機(jī)制建設(shè)等方面做好充足準(zhǔn)備,以避免產(chǎn)生不必要的政策成本消耗,進(jìn)而逐步實(shí)現(xiàn)社會(huì)效益的最大化。

    (一)增值評(píng)價(jià)從理論邁向?qū)嵺`的成熟條件

    美國(guó)國(guó)家研究協(xié)會(huì)(National Research Council, NRC)結(jié)合聯(lián)邦政府和各州教育部門實(shí)踐探索的經(jīng)驗(yàn),較為全面地總結(jié)了實(shí)施增值評(píng)價(jià)所需滿足的六個(gè)條件和步驟(NRC, 2010, pp.58-59):一是具有內(nèi)部一致性的學(xué)業(yè)成就監(jiān)測(cè)標(biāo)準(zhǔn)、課程標(biāo)準(zhǔn)和教學(xué)標(biāo)準(zhǔn),及依據(jù)系列標(biāo)準(zhǔn)研制的科學(xué)的、年度的、全國(guó)或區(qū)域范圍內(nèi)統(tǒng)一的學(xué)業(yè)成就測(cè)評(píng)工具和學(xué)業(yè)成就進(jìn)步測(cè)評(píng)工具;二是具備高質(zhì)量、多元化、充足完備、大規(guī)模、縱向的學(xué)生學(xué)業(yè)成就數(shù)據(jù)的可獲取性,建立健全國(guó)家和地方基礎(chǔ)教育階段學(xué)生學(xué)業(yè)成就動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)庫(kù)、充足連貫的學(xué)生人口學(xué)變量調(diào)查數(shù)據(jù)庫(kù),建立完善規(guī)范的數(shù)據(jù)采集與分析機(jī)制;三是組建專家團(tuán)隊(duì)或聘請(qǐng)第三方專業(yè)團(tuán)隊(duì)來(lái)構(gòu)建和調(diào)試適宜本地需求的增值模型,運(yùn)行、操作和監(jiān)測(cè)增值模型的數(shù)據(jù)分析;四是建立一套有效的增值評(píng)價(jià)結(jié)果報(bào)告反饋系統(tǒng),便于為教育一線實(shí)踐者有效呈現(xiàn)和解讀測(cè)評(píng)結(jié)果及其推論,提高增值評(píng)價(jià)過(guò)程與結(jié)果的透明度;五是為教育管理者、一線教師提供必要的培訓(xùn),確保他們能夠深刻理解和有效使用評(píng)估結(jié)果;六是建立有效的事后監(jiān)測(cè)與反饋機(jī)制,在增值評(píng)價(jià)結(jié)果發(fā)布后開(kāi)展短期和中長(zhǎng)期的調(diào)查,了解增值評(píng)價(jià)對(duì)教師后續(xù)發(fā)展和學(xué)生成就提升產(chǎn)生的促進(jìn)作用和長(zhǎng)遠(yuǎn)影響,為進(jìn)一步改進(jìn)增值評(píng)價(jià)方法、提升增值評(píng)價(jià)法的使用效益積累證據(jù)。這一指南可以為我國(guó)推動(dòng)增值評(píng)價(jià)的本土化落地和實(shí)施提供重要啟示和參考。

    (二)分步健全增值評(píng)價(jià)在新時(shí)代教育評(píng)價(jià)改革戰(zhàn)略下的本土化落地策略

    其一,應(yīng)健全國(guó)家和地方基礎(chǔ)教育階段學(xué)生學(xué)業(yè)成就及其進(jìn)步程度的標(biāo)準(zhǔn)化測(cè)評(píng)體系。增值評(píng)價(jià)建基于學(xué)生標(biāo)準(zhǔn)化測(cè)試成績(jī)及其進(jìn)步程度測(cè)評(píng)體系。要推動(dòng)增值評(píng)價(jià)的實(shí)踐落地,首先要將我國(guó)國(guó)家和地方層面基礎(chǔ)教育階段學(xué)生學(xué)業(yè)成就標(biāo)準(zhǔn)化測(cè)評(píng)體系與增值評(píng)價(jià)體系并軌。重點(diǎn)規(guī)范健全國(guó)家級(jí)、省域等不同層級(jí)和地域具有內(nèi)部一致性的基礎(chǔ)教育階段學(xué)生學(xué)業(yè)成就監(jiān)測(cè)標(biāo)準(zhǔn)、不同學(xué)科學(xué)段課程標(biāo)準(zhǔn)、教師專業(yè)標(biāo)準(zhǔn)體系,繼而依據(jù)系列標(biāo)準(zhǔn)研制或完善適用性廣泛的、多樣化的、高信效度的學(xué)業(yè)成就測(cè)評(píng)工具體系,開(kāi)發(fā)研制學(xué)生學(xué)業(yè)成就進(jìn)步測(cè)評(píng)工具體系和測(cè)算方法,用以采集高質(zhì)量的能夠客觀反映學(xué)生特定時(shí)期學(xué)業(yè)靜態(tài)表現(xiàn)和特定周期縱向動(dòng)態(tài)變化的數(shù)據(jù)信息。積極探索適宜不同學(xué)科、年級(jí)、等級(jí)的多樣化分類分階測(cè)評(píng)工具體系。進(jìn)一步統(tǒng)籌整合國(guó)家基礎(chǔ)教育質(zhì)量監(jiān)測(cè)協(xié)同創(chuàng)新中心、地方教育評(píng)估院、教育考試院等部門開(kāi)展教育質(zhì)量監(jiān)測(cè)工作的優(yōu)勢(shì)資源和先進(jìn)經(jīng)驗(yàn),將增值評(píng)價(jià)的實(shí)踐探索納入基礎(chǔ)教育質(zhì)量監(jiān)測(cè)頂層設(shè)計(jì)框架中,為增值評(píng)價(jià)的落地實(shí)施奠定制度基礎(chǔ)、平臺(tái)基礎(chǔ)和工具基礎(chǔ)。鑒于增值評(píng)價(jià)的適用范圍限度和技術(shù)限度,我國(guó)增值評(píng)價(jià)的實(shí)踐探索應(yīng)建立清晰的工作臺(tái)賬、任務(wù)清單和實(shí)施方案細(xì)則,以特定年級(jí)、特定學(xué)科、特定區(qū)域開(kāi)展的特色試點(diǎn)項(xiàng)目為切入口先行先試,并在積極循證的基礎(chǔ)上逐步向更多學(xué)科、年級(jí)和地域范圍分層分步推進(jìn)。

    其二,應(yīng)建立健全國(guó)家和地方基礎(chǔ)教育階段學(xué)生學(xué)業(yè)發(fā)展和教師教學(xué)實(shí)績(jī)動(dòng)態(tài)監(jiān)測(cè)追蹤數(shù)據(jù)庫(kù)。高質(zhì)量數(shù)據(jù)是開(kāi)展增值評(píng)價(jià)的前提條件。數(shù)據(jù)質(zhì)量的高低表現(xiàn)在學(xué)業(yè)測(cè)試工具的信效度水平、學(xué)生個(gè)體/家庭/學(xué)校/教師變量的豐富程度以及數(shù)據(jù)的客觀真實(shí)性、精準(zhǔn)性、完備程度、縱向連貫性和時(shí)長(zhǎng)跨度等。高質(zhì)量數(shù)據(jù)的持續(xù)追蹤和獲取取決于國(guó)家和地方基礎(chǔ)教育動(dòng)態(tài)監(jiān)測(cè)數(shù)據(jù)庫(kù)的建設(shè)情況。應(yīng)建立完善規(guī)范的數(shù)據(jù)采集機(jī)制,組建專業(yè)團(tuán)隊(duì)搭建數(shù)據(jù)庫(kù)平臺(tái),結(jié)合系列學(xué)生學(xué)業(yè)成就及進(jìn)步程度監(jiān)測(cè)標(biāo)準(zhǔn)體系和測(cè)評(píng)工具體系,定期在特定區(qū)域施測(cè),精準(zhǔn)采集測(cè)評(píng)數(shù)據(jù)和背景調(diào)查數(shù)據(jù),確保學(xué)生個(gè)體成績(jī)軌跡的持續(xù)動(dòng)態(tài)追蹤,及其與個(gè)體特征變量、家庭背景變量、任課教師特征變量、所在學(xué)校變量等相關(guān)影響要素變量數(shù)據(jù)的有效鏈接與匹配,確保缺失數(shù)據(jù)掌控在合理范圍內(nèi)。應(yīng)建立國(guó)家級(jí)、地方級(jí)、校級(jí)數(shù)據(jù)庫(kù)間的聯(lián)網(wǎng)和跨庫(kù)檢索、跨庫(kù)應(yīng)用機(jī)制,開(kāi)設(shè)針對(duì)性的培訓(xùn)課程,圍繞數(shù)據(jù)庫(kù)的功能價(jià)值、開(kāi)發(fā)利用、操作使用等對(duì)教育管理者和教師進(jìn)行培訓(xùn)。為便于開(kāi)展研究和實(shí)施增值評(píng)價(jià),數(shù)據(jù)庫(kù)應(yīng)向研究者、政策制定者、學(xué)校、第三方評(píng)估人員公開(kāi)數(shù)據(jù)的獲取權(quán)限。此外,還應(yīng)注重?cái)?shù)據(jù)信息的隱私保護(hù)機(jī)制建設(shè),避免數(shù)據(jù)泄露;提升基層教育部門管理者及一線學(xué)校校長(zhǎng)基于高水平信息數(shù)據(jù)和循證邏輯的教育治理能力,為增值評(píng)價(jià)的實(shí)踐落地建立好數(shù)據(jù)儲(chǔ)備、運(yùn)行機(jī)制和制度保障。

    其三,應(yīng)組建專業(yè)團(tuán)隊(duì),構(gòu)建“研究者—決策者—實(shí)踐者”三方良性協(xié)作機(jī)制。增值評(píng)價(jià)的高度復(fù)雜性和專業(yè)性要求組建高水平的專業(yè)團(tuán)隊(duì),在理論研究、實(shí)地調(diào)查、頂層設(shè)計(jì)、增值模型構(gòu)建、工具研發(fā)與檢測(cè)、評(píng)估施測(cè)、數(shù)據(jù)采集與分析、證據(jù)挖掘、結(jié)果報(bào)告與解讀、專項(xiàng)培訓(xùn)、事后反饋等環(huán)節(jié)提供全程、全方位的服務(wù)、指導(dǎo)與支持。增值評(píng)價(jià)專家團(tuán)隊(duì)?wèi)?yīng)具備四個(gè)特征:一是跨學(xué)科,由教育學(xué)、統(tǒng)計(jì)學(xué)、測(cè)量學(xué)、心理學(xué)等跨學(xué)科的專家組成;二是跨部門,由專家學(xué)者、專業(yè)教育評(píng)價(jià)機(jī)構(gòu)和評(píng)估人員、教育行政部門管理者、一線教師和校長(zhǎng)等構(gòu)成;三是復(fù)合型,熟練掌握增值評(píng)價(jià)技術(shù)、通用教育測(cè)評(píng)技術(shù)、學(xué)生學(xué)業(yè)成就測(cè)評(píng)技術(shù),熟悉一線教師教育教學(xué)實(shí)踐及教師主體需求,深度掌握教育教學(xué)規(guī)律和學(xué)生學(xué)習(xí)規(guī)律,熟悉相關(guān)教育政策與標(biāo)準(zhǔn);四是具備國(guó)際比較視野,全面了解和熟悉國(guó)際社會(huì)增值評(píng)價(jià)前沿發(fā)展趨勢(shì)和宏觀教育評(píng)價(jià)理論、技術(shù)、政策與實(shí)踐經(jīng)驗(yàn),深諳我國(guó)本土化實(shí)情。在增值評(píng)價(jià)的實(shí)踐探索過(guò)程中,研究者、政策制定者、一線教育實(shí)踐者三方須通力協(xié)作,各自發(fā)揮重要的職責(zé),以確保增值評(píng)價(jià)各環(huán)節(jié)之間的有效銜接。研究者應(yīng)立足增值評(píng)價(jià)的理論問(wèn)題和方法論爭(zhēng)議,結(jié)合中國(guó)教育評(píng)價(jià)體系改革的現(xiàn)實(shí)需求和現(xiàn)實(shí)基礎(chǔ)開(kāi)展深入研究,為增值評(píng)價(jià)從理念向政策和實(shí)踐的轉(zhuǎn)化提供前瞻性、突破性、可操作的理論指導(dǎo)和參考建議;積極以第三方評(píng)估者的身份參與到增值評(píng)價(jià)的模型構(gòu)建、設(shè)計(jì)實(shí)施、結(jié)果測(cè)算、匯報(bào)與解讀等環(huán)節(jié)。政策制定者應(yīng)辯證梳理增值評(píng)價(jià)有關(guān)的爭(zhēng)議與挑戰(zhàn),系統(tǒng)剖析已有教育評(píng)價(jià)工作體系的成效、經(jīng)驗(yàn)、問(wèn)題和突破口,在戰(zhàn)略決策層面健全和完善教育評(píng)價(jià)體系的頂層設(shè)計(jì),考量和明確增值評(píng)價(jià)、過(guò)程評(píng)價(jià)、結(jié)果評(píng)價(jià)等不同類型教育評(píng)價(jià)的差異化價(jià)值定位與權(quán)重,制定探索增值評(píng)價(jià)的工作臺(tái)賬、時(shí)間表和實(shí)施方案,領(lǐng)銜組建專項(xiàng)工作組,做好與研究者、實(shí)踐者的溝通與協(xié)商,在條件成熟時(shí)啟動(dòng)增值評(píng)價(jià)的特色試點(diǎn)工程項(xiàng)目。要高度重視一線教師在增值評(píng)價(jià)中的主體性和參與度,鼓勵(lì)教師全程參與增值評(píng)價(jià)體系的探索與實(shí)踐,向政策制定者和研究者反饋增值評(píng)價(jià)的實(shí)際需求、認(rèn)知感受、實(shí)踐智慧和遷移效果。政策制定者和實(shí)踐者有義務(wù)向研究者開(kāi)放客觀、真實(shí)、全面的數(shù)據(jù)以支持其開(kāi)展理論研究、技術(shù)研發(fā)與改進(jìn),以及實(shí)證檢驗(yàn)(McCaffrey et al., 2003,p.121)。三方之間的對(duì)話與協(xié)作將大大有助于增值評(píng)價(jià)方法的有效應(yīng)用,減少政策成本的浪費(fèi)。

    其四,應(yīng)建立全過(guò)程的增值評(píng)價(jià)結(jié)果和影響評(píng)估反饋機(jī)制。作為增值評(píng)價(jià)體系的重要組成部分,應(yīng)探索建立事前、事中、事后的增值評(píng)價(jià)結(jié)果和影響評(píng)估反饋機(jī)制。一是在增值評(píng)價(jià)實(shí)施前,為教育管理者、一線教師提供必要的培訓(xùn),確保他們能夠認(rèn)同并深刻理解增值評(píng)價(jià)的目的、工作原理、實(shí)施程序和測(cè)評(píng)結(jié)果的生成機(jī)制,引導(dǎo)其在績(jī)效分配、問(wèn)責(zé)和用人評(píng)價(jià)決策以及后續(xù)教師專業(yè)發(fā)展方案制定中,合理應(yīng)用增值評(píng)價(jià)結(jié)果。二是在實(shí)施增值評(píng)價(jià)過(guò)程中,指導(dǎo)和協(xié)助學(xué)校與教師規(guī)范做好標(biāo)準(zhǔn)化測(cè)評(píng)、高質(zhì)量數(shù)據(jù)采集和證據(jù)挖掘工作,了解實(shí)施過(guò)程中存在的困難、障礙和現(xiàn)實(shí)問(wèn)題,用以改進(jìn)和優(yōu)化增值評(píng)價(jià)體系。三是在增值評(píng)價(jià)結(jié)果公布后,為學(xué)校和教師第一時(shí)間呈現(xiàn)和解讀增值評(píng)價(jià)結(jié)果及其推論,及時(shí)答疑解惑,提高增值評(píng)價(jià)過(guò)程與結(jié)果的透明度,確保被評(píng)教師對(duì)結(jié)果的理解力和接納度,配合對(duì)結(jié)果持有異議的教師開(kāi)展申辯和補(bǔ)充證據(jù)的工作,協(xié)助學(xué)?;谠u(píng)價(jià)結(jié)果為“低效能”教師研制改進(jìn)指導(dǎo)方案,提升教師的獲得感和公平感。四是在增值評(píng)價(jià)結(jié)果發(fā)布后的一段時(shí)期,開(kāi)展短期和中長(zhǎng)期的追蹤調(diào)查,持續(xù)追蹤和實(shí)證評(píng)估增值評(píng)價(jià)對(duì)教師教學(xué)改進(jìn)和學(xué)生成就提升產(chǎn)生的深遠(yuǎn)影響,為進(jìn)一步優(yōu)化增值評(píng)價(jià)模型和方法策略、提升增值評(píng)價(jià)法的使用效益、健全教育評(píng)價(jià)體系等積累證據(jù)。

    七、結(jié)語(yǔ)

    沒(méi)有一種評(píng)價(jià)方法是萬(wàn)全之計(jì),增值評(píng)價(jià)亦是如此。盡管長(zhǎng)期伴隨著強(qiáng)烈的爭(zhēng)議和批判,但不可否認(rèn)的是,增值評(píng)價(jià)法以其彰顯專業(yè)性和客觀性的特色優(yōu)勢(shì)為健全教師評(píng)價(jià)體系提供了一種重要的可能路徑、為全面診斷教師教學(xué)實(shí)績(jī)提供了重要的量化手段、為教育問(wèn)責(zé)體系和人事決策提供了新視角和新依據(jù)、為傳統(tǒng)主觀評(píng)價(jià)法和終結(jié)性評(píng)價(jià)法提供了重要補(bǔ)充,因此具有在價(jià)值多元取向的新時(shí)代教育評(píng)價(jià)方法體系中存在的合理性和必要性(Glazerman et al., 2010)。更為重要的是,要在充分、全面、辯證地認(rèn)識(shí)增值評(píng)價(jià)的本質(zhì)特性、技術(shù)邊界、功能限度的前提下,有的放矢地持續(xù)探索增值評(píng)價(jià)發(fā)展道路中尚未破解的技術(shù)難題和尚待優(yōu)化的缺陷,結(jié)合中國(guó)特色教育情境和教育評(píng)價(jià)發(fā)展實(shí)情,摸索增值評(píng)價(jià)的本土化路向,探索增值評(píng)價(jià)法與其他評(píng)價(jià)理念和方法的融合機(jī)制,合理研判增值評(píng)價(jià)在我國(guó)新時(shí)代教育評(píng)價(jià)系統(tǒng)中所扮演的角色,充分發(fā)揮增值評(píng)價(jià)的優(yōu)勢(shì)潛能,為新時(shí)代教育高質(zhì)量發(fā)展中關(guān)鍵要素水平的衡量診斷、進(jìn)步進(jìn)程的監(jiān)測(cè)督導(dǎo)、產(chǎn)出效益的測(cè)算評(píng)估等極盡所能。

    需要重申的是,對(duì)增值評(píng)價(jià)的探索不能囿于方法技術(shù)的圈層,而要不斷回望增值評(píng)價(jià)的原點(diǎn),即思考“為什么評(píng)”的本原問(wèn)題。增值評(píng)價(jià)的終極目的是透過(guò)學(xué)生成績(jī)?cè)鲩L(zhǎng)顯現(xiàn)出教師教學(xué)實(shí)績(jī),激發(fā)教師教書育人的潛能,最終將其運(yùn)用在提升學(xué)生學(xué)習(xí)和教育質(zhì)量上。若無(wú)法服務(wù)促進(jìn)教師發(fā)展的目的,增值評(píng)價(jià)的方法再高階、再前沿也將徒勞。評(píng)價(jià)的最高境界是評(píng)量和刻畫客體的“真實(shí)”狀態(tài),然而沒(méi)有一種評(píng)價(jià)方法可以提供一種絕對(duì)“真實(shí)”的認(rèn)識(shí)。評(píng)估結(jié)果往往并非終極意義上的“事實(shí)”,而是由包括評(píng)估者以及由于評(píng)估而處于風(fēng)險(xiǎn)之中的利益相關(guān)者通過(guò)互動(dòng)而共同創(chuàng)造和構(gòu)建的一種結(jié)果(古巴,林肯,2008,第2—3 頁(yè))。據(jù)此,增值評(píng)價(jià)方法實(shí)質(zhì)上是具有科學(xué)范式傾向的群體為“理解”教師效能而做出的一種建構(gòu)主義的努力。在探索中國(guó)特色增值評(píng)價(jià)的道路上,我們需要審慎、全面地了解增值評(píng)價(jià)對(duì)教育公平的促進(jìn)功能,及其在教育復(fù)雜性、教育主體性、育人本位性等方面的認(rèn)識(shí)限度與不足,最大程度地借鑒他山之石,充分立足我國(guó)教育特色與實(shí)情,運(yùn)用中國(guó)智慧與中國(guó)方案,實(shí)現(xiàn)增值評(píng)價(jià)可能為教師評(píng)價(jià)體系乃至整個(gè)教育評(píng)價(jià)體系的所“增”之“值”。

    (韓玉梅工作郵箱:hanyumei2016@swu.edu.cn;本文通信作者為嚴(yán)文蕃:wenfan.yan@umb.edu )

    猜你喜歡
    評(píng)價(jià)教育教師
    國(guó)外教育奇趣
    題解教育『三問(wèn)』
    最美教師
    SBR改性瀝青的穩(wěn)定性評(píng)價(jià)
    石油瀝青(2021年4期)2021-10-14 08:50:44
    教師如何說(shuō)課
    甘肅教育(2020年22期)2020-04-13 08:11:16
    未來(lái)教師的當(dāng)下使命
    教育有道——關(guān)于閩派教育的一點(diǎn)思考
    辦好人民滿意的首都教育
    基于Moodle的學(xué)習(xí)評(píng)價(jià)
    圓我教師夢(mèng)
    吐魯番(2014年2期)2014-02-28 16:54:42
    大话2 男鬼变身卡| 国产成人91sexporn| 国产精品人妻久久久影院| 久久午夜综合久久蜜桃| 卡戴珊不雅视频在线播放| 午夜91福利影院| 亚洲欧美激情在线| 精品人妻一区二区三区麻豆| 亚洲av电影在线进入| 亚洲精品,欧美精品| 成人国语在线视频| 国产av国产精品国产| 国产精品一二三区在线看| 亚洲图色成人| 欧美激情 高清一区二区三区| 最近最新中文字幕大全免费视频 | 一区二区av电影网| 免费观看性生交大片5| 婷婷色综合www| 国产日韩欧美视频二区| 18禁国产床啪视频网站| 1024视频免费在线观看| 伦理电影免费视频| 国产日韩欧美视频二区| 熟女av电影| 免费观看av网站的网址| 各种免费的搞黄视频| 精品少妇久久久久久888优播| 狂野欧美激情性bbbbbb| 午夜免费男女啪啪视频观看| 亚洲一码二码三码区别大吗| 少妇人妻久久综合中文| 女人爽到高潮嗷嗷叫在线视频| 女人被躁到高潮嗷嗷叫费观| 国产成人精品福利久久| 波多野结衣一区麻豆| 一边亲一边摸免费视频| 欧美精品亚洲一区二区| 久久婷婷青草| 国产极品天堂在线| 国产精品女同一区二区软件| 欧美亚洲日本最大视频资源| 伦理电影大哥的女人| 午夜av观看不卡| 激情五月婷婷亚洲| 亚洲熟女毛片儿| 少妇被粗大的猛进出69影院| 汤姆久久久久久久影院中文字幕| 亚洲情色 制服丝袜| 秋霞在线观看毛片| 精品人妻在线不人妻| 国产成人精品无人区| 免费不卡黄色视频| 一本久久精品| 国产精品麻豆人妻色哟哟久久| 亚洲av电影在线进入| 又大又黄又爽视频免费| 亚洲 欧美一区二区三区| 性色av一级| 久热这里只有精品99| 欧美在线一区亚洲| 亚洲精品国产色婷婷电影| 9热在线视频观看99| 亚洲欧美色中文字幕在线| 色网站视频免费| 国产麻豆69| 中文字幕高清在线视频| 黑人巨大精品欧美一区二区蜜桃| 国产av码专区亚洲av| 国产精品亚洲av一区麻豆 | 国产成人精品无人区| 爱豆传媒免费全集在线观看| 五月天丁香电影| 天天影视国产精品| 亚洲欧美一区二区三区黑人| √禁漫天堂资源中文www| www日本在线高清视频| 天天影视国产精品| 亚洲国产欧美一区二区综合| 丰满迷人的少妇在线观看| 日韩一区二区三区影片| 国产亚洲精品第一综合不卡| 亚洲第一青青草原| 亚洲av欧美aⅴ国产| 香蕉国产在线看| 精品一区二区三区av网在线观看 | 看十八女毛片水多多多| 色网站视频免费| 色精品久久人妻99蜜桃| 亚洲天堂av无毛| 亚洲一卡2卡3卡4卡5卡精品中文| 精品久久久久久电影网| 黑人猛操日本美女一级片| 多毛熟女@视频| 99九九在线精品视频| 热99国产精品久久久久久7| 国产亚洲一区二区精品| 男女午夜视频在线观看| 久久亚洲国产成人精品v| 99精国产麻豆久久婷婷| 18在线观看网站| 欧美老熟妇乱子伦牲交| 天堂俺去俺来也www色官网| 国产精品熟女久久久久浪| 97精品久久久久久久久久精品| 韩国av在线不卡| 国产日韩欧美亚洲二区| 国产成人午夜福利电影在线观看| 成人亚洲精品一区在线观看| 纵有疾风起免费观看全集完整版| 成人黄色视频免费在线看| av片东京热男人的天堂| 久久影院123| 亚洲欧美清纯卡通| 国产成人系列免费观看| 18在线观看网站| 日本av手机在线免费观看| 悠悠久久av| 久久久久久久久久久免费av| 国产一区亚洲一区在线观看| 一边摸一边做爽爽视频免费| 女性生殖器流出的白浆| 中文精品一卡2卡3卡4更新| a 毛片基地| 久久久欧美国产精品| 国产黄频视频在线观看| 亚洲 欧美一区二区三区| 亚洲av在线观看美女高潮| 丝袜美腿诱惑在线| 欧美少妇被猛烈插入视频| 国产精品国产三级国产专区5o| 男女床上黄色一级片免费看| 18禁裸乳无遮挡动漫免费视频| 五月天丁香电影| 亚洲视频免费观看视频| 久久久精品国产亚洲av高清涩受| 欧美精品亚洲一区二区| 日韩熟女老妇一区二区性免费视频| 日韩大片免费观看网站| 一区二区三区激情视频| 国产高清不卡午夜福利| 亚洲欧洲日产国产| 国产精品一区二区精品视频观看| 久久鲁丝午夜福利片| 日本wwww免费看| 中文字幕精品免费在线观看视频| 18禁国产床啪视频网站| 亚洲伊人久久精品综合| 亚洲欧美精品综合一区二区三区| 大香蕉久久网| 男女边吃奶边做爰视频| 九九爱精品视频在线观看| 国产av码专区亚洲av| svipshipincom国产片| 性色av一级| 人人妻人人澡人人爽人人夜夜| 成人国语在线视频| 一区二区三区激情视频| 精品免费久久久久久久清纯 | 老司机深夜福利视频在线观看 | videos熟女内射| 成人毛片60女人毛片免费| 国产视频首页在线观看| 人人妻,人人澡人人爽秒播 | 国产精品成人在线| 一区二区三区乱码不卡18| 精品一区二区三卡| 美女主播在线视频| 午夜激情av网站| 日本黄色日本黄色录像| 成人三级做爰电影| 女的被弄到高潮叫床怎么办| 成人毛片60女人毛片免费| 欧美久久黑人一区二区| 一个人免费看片子| 免费观看a级毛片全部| 亚洲国产最新在线播放| 国产精品二区激情视频| 久久久久视频综合| 国产精品久久久久久久久免| 母亲3免费完整高清在线观看| 欧美久久黑人一区二区| 亚洲欧美色中文字幕在线| 只有这里有精品99| 在现免费观看毛片| 黄片小视频在线播放| 成人国产麻豆网| 亚洲一区中文字幕在线| 亚洲中文av在线| 成人三级做爰电影| 天天躁夜夜躁狠狠躁躁| 国产成人精品无人区| 日本av手机在线免费观看| 免费黄频网站在线观看国产| 这个男人来自地球电影免费观看 | 国产精品久久久久久人妻精品电影 | 色婷婷久久久亚洲欧美| 黄色一级大片看看| 777米奇影视久久| 国产精品一二三区在线看| 天天添夜夜摸| 欧美日韩视频高清一区二区三区二| 人人妻,人人澡人人爽秒播 | e午夜精品久久久久久久| 亚洲欧美精品综合一区二区三区| 欧美激情高清一区二区三区 | 看十八女毛片水多多多| 成人漫画全彩无遮挡| 乱人伦中国视频| 电影成人av| 午夜福利视频精品| 久久亚洲国产成人精品v| 亚洲av男天堂| 国产欧美日韩一区二区三区在线| 亚洲精品自拍成人| 又黄又粗又硬又大视频| 黄色视频不卡| www.熟女人妻精品国产| 巨乳人妻的诱惑在线观看| 青草久久国产| 热99国产精品久久久久久7| 久久精品国产亚洲av涩爱| 亚洲国产欧美在线一区| 九九爱精品视频在线观看| 一级,二级,三级黄色视频| 国产免费一区二区三区四区乱码| 深夜精品福利| 国产精品三级大全| 亚洲国产毛片av蜜桃av| 国产极品粉嫩免费观看在线| 韩国av在线不卡| 香蕉丝袜av| 黑人欧美特级aaaaaa片| 如何舔出高潮| 欧美黑人欧美精品刺激| 久久久国产精品麻豆| 最近最新中文字幕大全免费视频 | 亚洲欧美色中文字幕在线| 岛国毛片在线播放| 日本一区二区免费在线视频| 亚洲精品久久午夜乱码| 悠悠久久av| 人人妻人人爽人人添夜夜欢视频| 午夜日本视频在线| 黑人猛操日本美女一级片| 国产 精品1| 国产精品久久久人人做人人爽| 亚洲av国产av综合av卡| 久久久久精品国产欧美久久久 | 多毛熟女@视频| 老熟女久久久| 欧美日韩福利视频一区二区| 青春草国产在线视频| 欧美激情高清一区二区三区 | 亚洲第一区二区三区不卡| 综合色丁香网| 国产午夜精品一二区理论片| 国产亚洲欧美精品永久| 国产野战对白在线观看| 国产极品粉嫩免费观看在线| 婷婷色av中文字幕| 亚洲精品视频女| 亚洲国产最新在线播放| videosex国产| xxxhd国产人妻xxx| 亚洲欧美成人精品一区二区| 亚洲精品国产一区二区精华液| 成年av动漫网址| 这个男人来自地球电影免费观看 | 久久免费观看电影| 天天躁日日躁夜夜躁夜夜| 午夜福利,免费看| 日韩av免费高清视频| 自线自在国产av| 91国产中文字幕| 下体分泌物呈黄色| 国产伦人伦偷精品视频| 亚洲色图综合在线观看| 久久亚洲国产成人精品v| 国产精品人妻久久久影院| 天天躁夜夜躁狠狠躁躁| 69精品国产乱码久久久| 国产日韩欧美视频二区| 亚洲av中文av极速乱| 亚洲综合精品二区| 90打野战视频偷拍视频| 午夜福利视频精品| 国产一区二区激情短视频 | 各种免费的搞黄视频| 纯流量卡能插随身wifi吗| 亚洲人成电影观看| 最近2019中文字幕mv第一页| 亚洲av日韩在线播放| av国产久精品久网站免费入址| 日韩,欧美,国产一区二区三区| 夫妻午夜视频| 精品国产一区二区三区四区第35| 精品午夜福利在线看| 久久精品国产a三级三级三级| 老鸭窝网址在线观看| 亚洲国产最新在线播放| 色网站视频免费| 高清不卡的av网站| 黄色视频不卡| 丁香六月欧美| 捣出白浆h1v1| 久久热在线av| 亚洲视频免费观看视频| 国产视频首页在线观看| 国产成人午夜福利电影在线观看| www.熟女人妻精品国产| 男人添女人高潮全过程视频| 可以免费在线观看a视频的电影网站 | 国产福利在线免费观看视频| 我要看黄色一级片免费的| 日韩熟女老妇一区二区性免费视频| 我的亚洲天堂| 人人妻人人爽人人添夜夜欢视频| 亚洲情色 制服丝袜| 亚洲人成网站在线观看播放| 久久久久精品国产欧美久久久 | 国产精品久久久久久精品电影小说| 美女脱内裤让男人舔精品视频| 卡戴珊不雅视频在线播放| 国产探花极品一区二区| 精品一区二区三区av网在线观看 | 各种免费的搞黄视频| 乱人伦中国视频| 免费在线观看黄色视频的| 国产亚洲一区二区精品| 黄片无遮挡物在线观看| 蜜桃国产av成人99| 婷婷色综合大香蕉| 老司机靠b影院| 黄片无遮挡物在线观看| 亚洲精品国产区一区二| 国产精品无大码| 麻豆精品久久久久久蜜桃| 日韩人妻精品一区2区三区| 国产精品久久久久成人av| 免费高清在线观看日韩| 亚洲国产欧美网| 久久久国产精品麻豆| 啦啦啦在线免费观看视频4| 亚洲,欧美精品.| 久久久精品94久久精品| 午夜福利一区二区在线看| 中文精品一卡2卡3卡4更新| 少妇精品久久久久久久| 少妇的丰满在线观看| 丁香六月天网| 18禁裸乳无遮挡动漫免费视频| 涩涩av久久男人的天堂| 十分钟在线观看高清视频www| 高清在线视频一区二区三区| 成人国产av品久久久| 国产精品成人在线| 亚洲成人一二三区av| 免费高清在线观看视频在线观看| 精品国产超薄肉色丝袜足j| 十八禁人妻一区二区| 欧美成人午夜精品| 亚洲精品,欧美精品| 麻豆精品久久久久久蜜桃| 国产精品国产三级专区第一集| 欧美精品亚洲一区二区| 丝袜人妻中文字幕| 啦啦啦啦在线视频资源| 亚洲色图 男人天堂 中文字幕| 久久久久久免费高清国产稀缺| 久久性视频一级片| 婷婷色av中文字幕| 欧美日韩福利视频一区二区| 久久精品国产a三级三级三级| 精品国产一区二区久久| 日日啪夜夜爽| 日韩大片免费观看网站| 青春草视频在线免费观看| 国产男人的电影天堂91| 精品视频人人做人人爽| 国产亚洲最大av| 80岁老熟妇乱子伦牲交| 欧美精品av麻豆av| 亚洲国产精品999| 中文字幕最新亚洲高清| 中文字幕人妻丝袜一区二区 | 一级毛片黄色毛片免费观看视频| 久久精品亚洲熟妇少妇任你| 电影成人av| 97精品久久久久久久久久精品| 午夜日本视频在线| 亚洲精品中文字幕在线视频| 日韩精品有码人妻一区| 亚洲伊人色综图| 色婷婷av一区二区三区视频| 无遮挡黄片免费观看| 女人精品久久久久毛片| 午夜影院在线不卡| 免费久久久久久久精品成人欧美视频| 极品少妇高潮喷水抽搐| 久久精品亚洲av国产电影网| 高清欧美精品videossex| h视频一区二区三区| 国产精品国产三级专区第一集| 咕卡用的链子| 18禁国产床啪视频网站| 一级毛片 在线播放| 国产男女内射视频| 亚洲专区中文字幕在线 | 女性被躁到高潮视频| 亚洲中文av在线| 精品一区在线观看国产| 男女午夜视频在线观看| 大香蕉久久成人网| www日本在线高清视频| 黑丝袜美女国产一区| 黄片播放在线免费| 久久精品aⅴ一区二区三区四区| 亚洲免费av在线视频| 丁香六月天网| 亚洲国产中文字幕在线视频| 国产成人一区二区在线| 午夜福利视频精品| 精品免费久久久久久久清纯 | avwww免费| 国产精品 欧美亚洲| 欧美变态另类bdsm刘玥| 精品少妇久久久久久888优播| 国产精品.久久久| 精品久久久精品久久久| 男的添女的下面高潮视频| 亚洲欧美精品综合一区二区三区| 日本av免费视频播放| 18禁观看日本| 一级毛片 在线播放| 欧美97在线视频| 久久久久精品国产欧美久久久 | 激情视频va一区二区三区| 99香蕉大伊视频| 九九爱精品视频在线观看| 国产97色在线日韩免费| 日韩欧美一区视频在线观看| 精品第一国产精品| av有码第一页| 亚洲四区av| 麻豆av在线久日| 性色av一级| 成人国产麻豆网| tube8黄色片| 亚洲精品国产一区二区精华液| 亚洲视频免费观看视频| 中文字幕av电影在线播放| 亚洲av电影在线进入| 色婷婷久久久亚洲欧美| 只有这里有精品99| 亚洲av成人不卡在线观看播放网 | 久久精品久久久久久噜噜老黄| 国产日韩欧美亚洲二区| 夫妻午夜视频| 日韩,欧美,国产一区二区三区| netflix在线观看网站| 最近最新中文字幕大全免费视频 | 18禁国产床啪视频网站| 卡戴珊不雅视频在线播放| 肉色欧美久久久久久久蜜桃| 午夜福利视频在线观看免费| 777米奇影视久久| 日韩一区二区视频免费看| 国产高清国产精品国产三级| 成人免费观看视频高清| 久久久久网色| 18在线观看网站| 999久久久国产精品视频| 一本—道久久a久久精品蜜桃钙片| 精品一区二区三卡| 天堂8中文在线网| 亚洲人成77777在线视频| 亚洲一区中文字幕在线| 国产 一区精品| 精品人妻一区二区三区麻豆| 日韩av免费高清视频| 人人妻人人爽人人添夜夜欢视频| av国产久精品久网站免费入址| 国产女主播在线喷水免费视频网站| 建设人人有责人人尽责人人享有的| 国产国语露脸激情在线看| 久久久国产欧美日韩av| 欧美另类一区| 女人久久www免费人成看片| 亚洲精品国产av成人精品| av网站免费在线观看视频| 婷婷成人精品国产| 中文字幕色久视频| 人妻一区二区av| 午夜91福利影院| 国产精品 国内视频| 如何舔出高潮| 国产男人的电影天堂91| 亚洲成av片中文字幕在线观看| 国产1区2区3区精品| 国产伦人伦偷精品视频| 精品国产超薄肉色丝袜足j| 亚洲伊人久久精品综合| 秋霞伦理黄片| 久久久久久久精品精品| 欧美激情高清一区二区三区 | 99热国产这里只有精品6| 巨乳人妻的诱惑在线观看| 国产精品女同一区二区软件| 欧美日韩亚洲综合一区二区三区_| 狂野欧美激情性bbbbbb| 久久精品久久久久久噜噜老黄| 免费少妇av软件| 国产成人av激情在线播放| 丝袜美腿诱惑在线| 黄网站色视频无遮挡免费观看| 国产一区二区在线观看av| 国产淫语在线视频| 一区二区三区四区激情视频| 成人毛片60女人毛片免费| 建设人人有责人人尽责人人享有的| 日本一区二区免费在线视频| 午夜福利乱码中文字幕| 精品少妇久久久久久888优播| 狠狠婷婷综合久久久久久88av| 日韩 亚洲 欧美在线| 国产极品粉嫩免费观看在线| 午夜影院在线不卡| 校园人妻丝袜中文字幕| 男女免费视频国产| 晚上一个人看的免费电影| 亚洲av福利一区| 久久久久精品人妻al黑| 咕卡用的链子| 麻豆av在线久日| 亚洲专区中文字幕在线 | 人妻一区二区av| 国产在视频线精品| 欧美精品一区二区免费开放| 午夜影院在线不卡| 91老司机精品| 中文字幕另类日韩欧美亚洲嫩草| 啦啦啦啦在线视频资源| 大码成人一级视频| 啦啦啦 在线观看视频| a级毛片黄视频| 精品国产乱码久久久久久小说| 男人添女人高潮全过程视频| 高清不卡的av网站| 日韩人妻精品一区2区三区| 嫩草影视91久久| 伦理电影免费视频| 叶爱在线成人免费视频播放| 性色av一级| 久久久久国产一级毛片高清牌| 91精品三级在线观看| www日本在线高清视频| 亚洲美女黄色视频免费看| 黄色 视频免费看| 精品国产一区二区久久| 日韩一区二区视频免费看| 午夜福利视频精品| 男女免费视频国产| 秋霞在线观看毛片| 最黄视频免费看| avwww免费| 一二三四中文在线观看免费高清| 一级,二级,三级黄色视频| 在线亚洲精品国产二区图片欧美| 高清av免费在线| 色94色欧美一区二区| 国产亚洲av高清不卡| 99久久精品国产亚洲精品| 国产成人一区二区在线| 国产老妇伦熟女老妇高清| 观看av在线不卡| 日韩一区二区视频免费看| 99久久99久久久精品蜜桃| 超色免费av| 精品人妻一区二区三区麻豆| 我的亚洲天堂| 伊人亚洲综合成人网| 十八禁高潮呻吟视频| 在线观看国产h片| 你懂的网址亚洲精品在线观看| 美女视频免费永久观看网站| 又粗又硬又长又爽又黄的视频| 不卡视频在线观看欧美| 水蜜桃什么品种好| 七月丁香在线播放| 欧美人与善性xxx| 国产精品久久久久久精品电影小说| 一区二区av电影网| 亚洲国产精品999| 成年人午夜在线观看视频| 午夜老司机福利片| 亚洲视频免费观看视频| av不卡在线播放| 人人妻人人澡人人看| 熟女av电影| 不卡av一区二区三区| bbb黄色大片| 尾随美女入室| 久久久久精品性色| 免费不卡黄色视频| 老汉色av国产亚洲站长工具| 国产黄色视频一区二区在线观看| 国产97色在线日韩免费| 看免费成人av毛片| 高清欧美精品videossex| 亚洲av中文av极速乱| 中文字幕亚洲精品专区| 精品久久久久久电影网| 国产xxxxx性猛交| 久久久精品94久久精品|