采訪_姚曦 編輯_楊軍
楊念魯:評價(jià)本質(zhì)是改進(jìn)教育
采訪_姚曦 編輯_楊軍
在2013年開始推行的教育質(zhì)量綜合評價(jià)改革中,中國教育學(xué)會一直是為各實(shí)驗(yàn)區(qū)提供專業(yè)指導(dǎo)的機(jī)構(gòu)之一。“教育智庫深度參與,行政和專業(yè)雙向互動(dòng)”的工作機(jī)制也是成都市推行評價(jià)改革的重要保障。為此,本刊專程采訪了中國教育學(xué)會秘書長楊念魯博士,通過他來解讀目前評價(jià)改革的意義和問題。楊念魯博士曾在教育部長期擔(dān)任基礎(chǔ)教育領(lǐng)域的工作,早在上世紀(jì)90年代就曾負(fù)責(zé)國家教育規(guī)劃重點(diǎn)課題《義務(wù)教育階段教育質(zhì)量研究》,并出版專著《義務(wù)教育質(zhì)量研究》。
本刊記者專訪中國教育學(xué)會秘書長楊念魯博士
兩份典型的教育質(zhì)量監(jiān)測結(jié)果。監(jiān)測一般只起標(biāo)定作用,而不作具體分析
本刊記者:您好,楊先生。中國整體推動(dòng)教育質(zhì)量評價(jià)改革至今已有3年,從30個(gè)實(shí)驗(yàn)區(qū)確立到10月份在成都召開第一次全國性的現(xiàn)場會,可以說取得了階段性成果。我們該如何理解當(dāng)前評價(jià)改革的迫切性、復(fù)雜性、長期性?
楊念魯:先說復(fù)雜性,復(fù)雜性主
要體現(xiàn)在兩方面。一是長期以來社會各方面,包括教育行政部門、校長、老師、家長等對評價(jià)都存在很大誤區(qū)。教育質(zhì)量評價(jià)是非常復(fù)雜、嚴(yán)謹(jǐn)、科學(xué)的診斷和甄別過程,但迫于各種現(xiàn)實(shí),過去我們往往簡單理解為考試分?jǐn)?shù)。有多少孩子考上清華、北大,考了多少分。這是社會上一般的對評價(jià)的理解?,F(xiàn)在來談新的評價(jià)理念,首先在觀念上阻力非常大。
分?jǐn)?shù)只是評價(jià)中最基礎(chǔ)的鏈條??荚嚦煽兙秃帽壬×诵枰葴y體溫,只是評價(jià)依據(jù)的一方面。醫(yī)生也不可能僅憑體溫就診病。還需要進(jìn)一步體檢,比如驗(yàn)血、做透視等,最后診斷出病人的整體健康狀況。
教育質(zhì)量評價(jià)也一樣,其本質(zhì)是改進(jìn)教育,而不是給學(xué)習(xí)者一個(gè)標(biāo)定。
您剛問到監(jiān)測和評價(jià)的區(qū)別。監(jiān)測從某種意義上就是起標(biāo)定作用,了解學(xué)習(xí)者在整個(gè)群體中的某一方面達(dá)到什么狀態(tài)。并不是評價(jià)。當(dāng)然可以根據(jù)標(biāo)定深入研究和解析,從而進(jìn)行診斷,但其主要目的是標(biāo)定:測驗(yàn)學(xué)生是否達(dá)到國家標(biāo)準(zhǔn),至于達(dá)到多少一般不做具體分析。
如此,我們說,教育質(zhì)量評價(jià)更主要是通過測量學(xué)生學(xué)習(xí)狀況并深入分析:達(dá)到標(biāo)準(zhǔn)是因?yàn)槭裁矗浚ㄌ貏e是)沒有達(dá)到標(biāo)準(zhǔn)的問題出在哪里?這才是評價(jià)最根本的目的。是為了提高質(zhì)量、改進(jìn)教學(xué)、優(yōu)化決策。
本刊記者:據(jù)了解,一些地區(qū)把監(jiān)測和評價(jià)等同或混淆起來,這樣是否存在一些問題?
楊念魯:這肯定是不夠準(zhǔn)確的。監(jiān)測和評價(jià)二者本身并行不悖,各有其用。但特別要說明一點(diǎn),評價(jià)結(jié)果是不能跟教師獎(jiǎng)懲、績效工資掛鉤的。監(jiān)測應(yīng)該與區(qū)域政績掛鉤,比如監(jiān)測某區(qū)域的義務(wù)教育質(zhì)量,是否達(dá)到國家課程大綱標(biāo)準(zhǔn)。沒達(dá)到要對官員問責(zé)。
但我們堅(jiān)決反對把評價(jià)結(jié)果跟教師績效工資掛鉤。因?yàn)樵u價(jià)目的不是為了懲罰誰,不是標(biāo)定作用,而是找原因、找病根。找原因的過程中憑什么去追究教師責(zé)任?假如一個(gè)孩子數(shù)學(xué)總考40多分,一般來說很多老師、家長都會覺得這孩子“不是學(xué)數(shù)學(xué)的料”。但評價(jià)可以幫他分析,數(shù)學(xué)教育涉及記憶、計(jì)算、推理、空間思維等各種能力。這孩子雖然總體看是不及格,但分析結(jié)果可能是他計(jì)算能力不差,數(shù)學(xué)思維沒建立。也可能是空間思維能力、推理能力很強(qiáng),計(jì)算能力不行。同樣是不及格,在精細(xì)診斷后,就會發(fā)現(xiàn)不同的問題,對癥下藥。
現(xiàn)在很多校外輔導(dǎo)機(jī)構(gòu)就在應(yīng)用這種方法。有孩子來咨詢就做測評,分析短板,有針對性的輔導(dǎo),效率很高。他們稱為“靶向治療”。當(dāng)然他們使用的評價(jià)方法還是很簡單的,但做法很有效。
我們說評價(jià)方法很重要。復(fù)雜性的第二方面就表現(xiàn)在:它不是對一個(gè)工業(yè)產(chǎn)品進(jìn)行標(biāo)定、分析。產(chǎn)品的標(biāo)定、分析可以精確到厘米、毫米甚至更小的單位。但教育質(zhì)量評價(jià)的對象是人,是活生生的個(gè)體。從科學(xué)角度說,對兩個(gè)不同的人同一項(xiàng)學(xué)習(xí)內(nèi)容的表現(xiàn)不太可能進(jìn)行嚴(yán)格比較。但評價(jià)必須做比較,通過比較才有鑒別和分析,才能發(fā)現(xiàn)問題。
如何在技術(shù)和方法上把科學(xué)性和人的個(gè)性表現(xiàn)有機(jī)結(jié)合,這也是評價(jià)改革的困難所在。
本刊記者:我可不可以這么理解,既需要借助先進(jìn)的技術(shù),又不能迷信技術(shù)。
楊念魯:對。做小范圍分析時(shí),現(xiàn)有技術(shù)大致是可以達(dá)到要求的。但大范圍分析就有難度了,不可能花這么長時(shí)間、精力、人力對整個(gè)區(qū)域的學(xué)業(yè)情況做細(xì)致的分析和鑒別。復(fù)雜性的第三方面就是我們對那些相對比較好測量的,比如成績,甚至某種學(xué)習(xí)能力。但有一些,比如人的情感、價(jià)值觀等等──我們統(tǒng)稱為綜合素質(zhì)。這次教育部發(fā)的《意見》就非常強(qiáng)調(diào)兩點(diǎn):學(xué)業(yè)成績和綜合素質(zhì);所以叫教育質(zhì)量綜合評價(jià)改革。綜合素質(zhì)要用什么方法才能準(zhǔn)確判斷,據(jù)我所知,目前國內(nèi)還沒有特別完善的方法。
本刊記者:有位一線老師問我,孩子誠信的程度要怎么來評價(jià)呢?
楊念魯:不僅是誠信。道德上的問題學(xué)生可以回答得非常漂亮,道德認(rèn)知測試題可以得滿分,但他的道德情感是否“真的”認(rèn)可這些答案?不一定。
本刊記者:知行不合一。
楊念魯:對,就是知行不合一,言行不合一。這種問題是比較難用簡單方法進(jìn)行測量和分析的。尤其大范圍測量時(shí)更難。國外較通行的方法是檔案袋,記錄學(xué)生參加的活動(dòng)的表現(xiàn)和反饋。一兩次行為可以偽裝,但時(shí)間長了次數(shù)多了就不行,因此積累的數(shù)據(jù)可以進(jìn)行分析。這樣就能對學(xué)生的道德、情感、態(tài)度、價(jià)值觀等做出判斷。但這種方法不可能畢其功于一役,是一個(gè)長期、復(fù)雜的過程。檔案袋在跟蹤期間是否靈敏、真確,都是需要考慮的問題……
以上三方面就構(gòu)成了基礎(chǔ)教育質(zhì)量綜合評價(jià)的復(fù)雜性。評價(jià)和醫(yī)生看病不一樣,醫(yī)生通過CT可以看到腫瘤位置、大小,但教育的評價(jià)達(dá)不到這種(物理性的)精細(xì)程度。
楊念魯:再說改革的迫切性。為什么教育部特別抓學(xué)生的評價(jià),就是因?yàn)槲覀冞^去總體上對基礎(chǔ)教育的質(zhì)量評價(jià)出了問題。
一是以分?jǐn)?shù)作為評價(jià)唯一手段;二是用一次性結(jié)果進(jìn)行評價(jià)。這都是不全面的。其實(shí)一個(gè)人是在不斷成長變化的,他有多種潛能、智能。從不知到知,從不行到行,從不會到會的過程。不能因?yàn)樗淮纬煽兙涂垡豁敳钌騼?yōu)生的帽子,太簡單粗暴了。我總講一個(gè)例子:在同一場考試中,一個(gè)孩子從95分提高到98分,另一個(gè)孩子從40分提高到59分。都是進(jìn)步,都要鼓勵(lì)。但方式方法不一樣。問題在于,對后者老師往往還認(rèn)為他是差生,因?yàn)樗麤]及格。老師會更關(guān)注98分的孩子。這是我們過去教育質(zhì)量評價(jià)的問題。
第三是一把尺子量所有孩子。國家有課程標(biāo)準(zhǔn)、基本的教學(xué)要求,學(xué)生接受完相關(guān)教育需要達(dá)到標(biāo)準(zhǔn)。但不能因此拿一把尺子量所有孩子,每個(gè)人都有個(gè)性。
第四,我們過去只注重語文、數(shù)學(xué)、英語等所謂主學(xué)科成績,對其它學(xué)科,或有的不能用學(xué)科知識反映的能力往往忽略。如音體美。社會實(shí)踐能力、動(dòng)手能力、團(tuán)隊(duì)精神等等。這種評價(jià)是瘸腿的、不完整的。
這都和我們現(xiàn)在的人才選拔機(jī)制有關(guān)系。高考是一種特定的選拔機(jī)制,嚴(yán)格說它不是面向全體學(xué)生的。它只是把那些適合進(jìn)入高校深造的孩子選拔出來,還有很多不適合進(jìn)入高校的孩子怎么辦?過去我們只用高考一把尺子來衡量,考上大學(xué)是好樣的,沒考上就被淘汰,這是我們整個(gè)社會的價(jià)值判斷……
如果這個(gè)問題不解決,整個(gè)教育就走偏了。它還催生了題海戰(zhàn)術(shù)、填鴨式教育。這一來教育的意義何在?培養(yǎng)的只是考試機(jī)器。我說得比較絕對,在教育過程中肯定也是要培養(yǎng)能力、教授方法。但導(dǎo)向不對,把整個(gè)教育導(dǎo)偏了,所以改革很迫切。
正是因?yàn)檫@種復(fù)雜性和迫切性決定了改革不可能畢其功于一役。國家有關(guān)部門充分理解基層的苦衷,意識到抓評價(jià)就是抓牛鼻子,如果能用正確的理念、方法去看待評價(jià)并正確運(yùn)用評價(jià)結(jié)果,那教育質(zhì)量就會有大的提升。但還有很多客觀條件限制,包括我剛剛說的:領(lǐng)導(dǎo)是否支持?老師是否擁護(hù)?方法是否科學(xué)?工具是否便捷可行?這些問題不可能在短期內(nèi)解決。改革一定是長期的、螺旋式的提升,最終達(dá)到理想狀態(tài)的過程。
本刊記者:您剛才提到,評價(jià)出問題很大程度是我們的選拔機(jī)制有問題?,F(xiàn)在各地也在進(jìn)行高考改革。您如何看待高考改革和教育質(zhì)量評價(jià)改革的關(guān)系?
楊念魯:高考也是一種評價(jià),是一種比較簡單的、一次性、終結(jié)性的評價(jià),跟我剛剛籠統(tǒng)講的教育質(zhì)量評價(jià)有些不同。如果說基礎(chǔ)教育階段,特別是高中階段的評價(jià)相對科學(xué)了,對高考改革就會更加有利,更符合教育初衷。可以說是相互促進(jìn)關(guān)系。
本刊記者:第二個(gè)問題,教育質(zhì)量評價(jià)改革與“管、辦、評”分離改革也該是配套的,如何看待評價(jià)改革在其中扮演的角色?這實(shí)際也牽涉到專業(yè)機(jī)構(gòu)和行政部門合作的問題。
楊念魯:我以為,在“管、辦、評”這三者中,牛鼻子是“評”。如果“評”做不到科學(xué)、準(zhǔn)確,“辦”
就不知道朝哪個(gè)方向辦,缺乏有效工具來提供改進(jìn)意見?!肮堋币惨粯樱以谡ぷ鬟^二十多年。有很大的體會,政府很好心,想把事情辦好、管好,但是往往管不到點(diǎn)子上,結(jié)果反而是缺位了。很大部分原因是信息缺乏,缺少對管理對象分析的信息。這就是抓“評”的作用。如果“評”能把“辦”的情況客觀、準(zhǔn)確、及時(shí)地反饋給“管”,“管”就會到位,三方形成合力。
目前的高考改革也正在改變過去“一考定終身”的評價(jià)方式
本刊記者:正如您剛才談到信息問題。隨著網(wǎng)絡(luò)時(shí)代發(fā)展,現(xiàn)代教育質(zhì)量評價(jià)技術(shù)也開始利用大數(shù)據(jù)分析了。能否談?wù)勏嚓P(guān)的研究?
楊念魯:近幾年國外非常注重大數(shù)據(jù)分析,這是我國目前比較短缺的。我們支持公眾教育研究院每年搞一個(gè)大賽(本來不想用“賽”字,但沒辦法,不比賽就沒人來)。其實(shí)比賽的目的不是為了看成績,主要想搜集數(shù)據(jù)。參與者達(dá)到一定數(shù)量就可做大數(shù)據(jù)分析,分析目的是為了建模。當(dāng)所有評價(jià)在某一環(huán)節(jié)、某一點(diǎn)都能有比較科學(xué)的、可參考的常模,評價(jià)結(jié)果就準(zhǔn)確了。未來在同一領(lǐng)域、同一學(xué)科將有若干個(gè)常模,需要我們組織出面把這些有參考意義、有科學(xué)性的模加以整合,提煉出一個(gè)新的模。
本刊記者:我可以把最后提煉出來的模理解成未來的行業(yè)標(biāo)準(zhǔn)嗎?
楊念魯:可以?,F(xiàn)在因?yàn)榇蠹业臏y量方法不同,提供工具的機(jī)構(gòu)水平也良莠不齊。教育主管部門和學(xué)校也不知道誰的準(zhǔn),誰的不準(zhǔn),該不該用。今年我們的研討會初步篩選了7家專門提供評價(jià)機(jī)構(gòu),讓他們“打擂臺”,展示各自的理念、結(jié)構(gòu)、優(yōu)勢。說完以后專家點(diǎn)評,用戶判斷。
教育學(xué)會作為國家級學(xué)術(shù)機(jī)構(gòu)不會專門和一個(gè)機(jī)構(gòu)合作,將來我們會吸納各個(gè)機(jī)構(gòu)的成果加以整合。最重要是形成行業(yè)的標(biāo)準(zhǔn)、給教育改革做參考,讓更多的孩子受益。
本刊記者:我見證了中國教育學(xué)會和成都市教育局簽訂《合作框架協(xié)議》那次會議,你們跟成都市教育局合作是如何展開的?
楊念魯:2013年,當(dāng)時(shí)教育部課程教材中心、基礎(chǔ)教育質(zhì)量監(jiān)測中心和教育學(xué)會受教育部委托給30個(gè)實(shí)驗(yàn)區(qū)提供專業(yè)支持。在跟實(shí)驗(yàn)區(qū)聯(lián)系過程中,我到成都出差,跟兩個(gè)青羊區(qū)教研員有接觸,他們告訴我青羊區(qū)以區(qū)域?yàn)閱挝辉谧鼋逃|(zhì)量評價(jià)的嘗試。一開始大家不理解,不太積極,但后來驚奇地發(fā)現(xiàn),通過改革,把他們包括老師們的教研的熱情都充分調(diào)動(dòng)起來了。我覺得這是一個(gè)非常積極的現(xiàn)象,是我們求之不得的。于是繼續(xù)了解,才得知公眾教育研究院在幫他們做評價(jià)工具。這個(gè)評價(jià)就和我前面說的理念非常吻合,后來學(xué)會就跟公眾教育研究院反復(fù)接觸、討論,決定用他們的工具為30個(gè)實(shí)驗(yàn)區(qū)里愿意和我們合作的區(qū)域進(jìn)行服務(wù)。成都市教育局正在招標(biāo),可以說一拍即合。
本刊記者:這個(gè)過程很有趣,從基層教研員了解到線索,然后找到他們背后的技術(shù)支撐,恰好公眾教育研究院的理念和你們高度契合,然后中國教育學(xué)會和公眾教育研究院就成了合作伙伴。
楊念魯:就像你說的,我們的理念非常契合。他們做的評價(jià)不是簡單給學(xué)生標(biāo)定,也不是一次性報(bào)告,而是做學(xué)科分析。分析教學(xué)過程,從結(jié)果反推教學(xué)過程的優(yōu)勢和短板,進(jìn)而給出改進(jìn)建議。公眾教育研究院和其他類似研究機(jī)構(gòu)不同的一點(diǎn),他們很注重讓老師們參與。這也是青羊區(qū)當(dāng)時(shí)做評價(jià)改革的要求。其實(shí)純粹從技術(shù)而言,很多機(jī)構(gòu)做得也不錯(cuò)。但關(guān)鍵是老師有沒有參與進(jìn)來。評測機(jī)構(gòu)給出報(bào)告就走了,老師們拿到報(bào)告是似是而非的,不知下一步該怎么辦。評價(jià)結(jié)果怎么分析,怎么反思教學(xué)過程,這實(shí)際是老師專業(yè)成長最好的途徑。