王殿軍
一、我國教育評價的現(xiàn)狀
十八大以來,我國圍繞教育評價出臺了很多政策、舉措。早在《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》里,就涉及了如分類考試、綜合評價、多元錄取等關(guān)于評價的說法。2013年,《教育部關(guān)于推進中小學教育質(zhì)量綜合評價改革的意見》中就提到了學業(yè)水平綜合評價;2014年,“評價”一詞出現(xiàn)在高考改革方案里;2015年,職業(yè)教育領(lǐng)域也專門提到了評價。所以初中、高中、職業(yè)教育,都在呼喚評價。2017年的《關(guān)于深化教育體制機制改革的意見》也提出,要標準健全、目標分層、多級評價、多元參與等。
但從長期的實踐來看,中國教育存在的主要問題是,教育評價的結(jié)果未得到有效運用,過程評價的診斷功能未能得到充分發(fā)揮,增值評價缺乏對評價對象主體地位的關(guān)注,綜合評價的機制和標準還不夠健全,良好的教育評價生態(tài)還未建立,第三方教育評價的作用未得到充分發(fā)揮,教育評價的理論、技術(shù)和專業(yè)人才仍較貧瘠。
五大改革,目標就是要破“五唯”?!拔逦ā辈黄?,我們的人才培養(yǎng)和教育發(fā)展都會受到嚴重制約。要打破“五唯”,就得有新的東西來替代它。不能一說這個房子不好就拆,必須把新房子建好了,搬進新房子,才能拆那個舊房子。所以我們的任務是要盡快建設新的評價體系,進行區(qū)域試驗,重點檢驗,不斷迭代。直到有一天這個新方案足以替代原有方案,原有方案才能終止。現(xiàn)在有些人有點極端,恨不得明天就取消高考,取消高考后要怎么辦?這么大的國家,老百姓這么關(guān)注升學,在沒有找到比高考更好的方式前必須繼續(xù)堅持。沒有一個人因為對自己的房子不滿意,當天晚上就弄個帳篷住操場的,沒有人這么干,這個道理大家容易理解。
現(xiàn)在的職業(yè)教育,要高質(zhì)量發(fā)展,要講“雙一流”,怎么評?如果評不好,我們就會由一個極端走上另一個極端,就會由這個問題變成那個問題,但是問題還是問題。
我們的過程評價也沒有得到充分地重視,因為對有些事情來講,過程更重要。比如德育水平,就不太好考查。如果一個人的道德品質(zhì)靠紙筆考試來判斷,得滿分的并不能保證就是道德完美的人,說不定將來還要出事。所以這樣的考試是靠不住的??渴裁??靠過程表現(xiàn),這才是比較靠得住的,所以過程評價要充分利用。
增值評價也要充分重視。人和人是有差異的,現(xiàn)在這種絕對評價,對有些學生很不公平。比如體育,身體健全的人可能對體育評價不會有什么意見,但是對于一個有殘疾的人會怎么樣呢?在殘奧會上,殘疾運動員為國家爭金奪銀,但在普通的學校體育考試中卻可能不及格,因為不具備常人完成某項體育活動的條件。所以,這個評價應該是根據(jù)每個人的特殊情況,評價其在原有水平上增長的能力,即強調(diào)增值評價。一個人堅持體育鍛煉,體質(zhì)不斷增強,成績不斷提高,良好習慣不斷養(yǎng)成,這些東西是更重要的,而不是看誰跑得更快。
我們必須系統(tǒng)化地建立良好的教育評價生態(tài)。這里要強調(diào)一下第三方評估,就是將一些評價交給第三方,因為它比較權(quán)威、學術(shù),大眾也比較認可。如果是辦教育來評自己,這個結(jié)果基本上沒評大家就知道了。
二、清華附中的教育評價實踐
我在清華附中當校長之后,第一個關(guān)心的問題就是教育評價問題。所以在2009年后,就天天在想怎樣把考試評價給變成不是唯一的,打破唯分數(shù)論。那個時候我就研究學生綜合素質(zhì)評價系統(tǒng)。到現(xiàn)在研究了12年,系統(tǒng)也用了好幾代了。我們以自下而上的方式,對學生各個方面進行觀察、記錄、分析,建立了包含9個模塊46個維度的行為記錄內(nèi)容,構(gòu)建了學生綜合素質(zhì)生成性評價模型,并利用大數(shù)據(jù)分析技術(shù),開發(fā)學生綜合素質(zhì)生成性評價系統(tǒng)。目前,該評價系統(tǒng)已經(jīng)輻射12個省7000多所學校的數(shù)百萬學生。此外,我們還建立了教師專業(yè)發(fā)展與綜評系統(tǒng),主要有個人成長記錄、專業(yè)引領(lǐng)發(fā)展、特色成長助力、評價與規(guī)劃四大模塊。
我們的綜合素質(zhì)評價研究,其最初的想法其實很簡單,就是覺得有些教育內(nèi)容,尤其素質(zhì)是不可能考出來的,但又需要評,怎么辦?這就需要過程評,從過程里面的參與度、表現(xiàn),收集大數(shù)據(jù)來評。因為有了過程,結(jié)果就會水到渠成。天天鍛煉身體好,認真學習成績好,習慣好了結(jié)果自然就好,就這么一個簡單的邏輯。過去沒有信息技術(shù),過程無法記錄,數(shù)據(jù)無法收集,收集了以后無法評價。現(xiàn)在不一樣,很簡單就能把學生的整個發(fā)展過程,大數(shù)據(jù)全部收集起來,進行建模,進行大數(shù)據(jù)處理,進行評價生成,既可靠又好用,效率又高。
當然,我們要因地制宜,因校制宜,不同學校記錄的東西不同,不同年齡段記錄的東西也不同。我們的團隊一直在琢磨:如何評價?評價什么?我認為,我們的攻關(guān)全部解決了這個問題,在北京已用了好多年,且效果非常好。
例如,誠信問題實際上在中國是第一大問題,我們用互相監(jiān)督、公示等辦法很好地解決了這個問題。就像發(fā)朋友圈一樣,當你做的事情在所有人的目光下,你就不敢胡作非為,以假亂真,而且一旦作假被發(fā)現(xiàn),將會終身受到影響,在誠信體系里會被記上一筆。所以到目前為止,還沒人敢以身試法,因為那樣會因小失大,失去誠信。
三、我國教育評價展望
未來我們首先要解決學生評價問題。學生評價也分為學業(yè)評價、綜合素質(zhì)評價和高階思維能力評價。
美國從2017年推出新的學生評價體系MTC(能力素養(yǎng)成績單聯(lián)盟,Mastery Transcript Consortium,簡稱MTC),其中許多都和思維有關(guān)。由此可看出,他們已經(jīng)開始對學生創(chuàng)新能力和思維水平進行培養(yǎng)了,而我們還在知識的層面上打轉(zhuǎn)轉(zhuǎn),這是非常危險的。如果我們能在教育評價上趕超歐美,就會在人才培養(yǎng)方面有趕超的機會。我們開端了一項事業(yè),只要我們堅持,我想這個目標終究會實現(xiàn)。
在我們進行的幾種評價里,要選出更適合評價內(nèi)容的方式,要把評價方式與評價內(nèi)容匹配起來。有些評價可能要關(guān)注結(jié)果,有些可能既要關(guān)注結(jié)果又要關(guān)注過程,有些適合增值,還有些可能要綜合,等等。我們還要想辦法營造良好的評價生態(tài)環(huán)境,讓大家重視評價、關(guān)注評價,同時能夠包容這種評價實驗。在人才培養(yǎng)過程中,還要重視評價的理論工具和創(chuàng)新。
另外,還要重視第三方評估??晒膭畛闪⒁粋€第三方教育評價的研究院,能夠接受委托,在全球范圍得出評價結(jié)果,能夠解釋為什么這么評,能總結(jié)特定的公式,有專家團隊。有時候推薦制比申請制更重要,諾貝爾獎什么時候申請過?這一獎項的評選,其實是在全球找好幾百個同行,每個人背對背提名。你是數(shù)學家,你是有名望的數(shù)學家,你認為全球最強的50個數(shù)學家是誰,將每個人最強的成果寫出來,這就是一種評的方式。
(責任編輯 ? 郭向和 姚力寧)B9E61A73-98EF-49C7-A577-E7B571212128