徐曉虹,董 一
(1.寧波教育學(xué)院,浙江 寧波 315016;2.寧波市海曙區(qū)教科室,浙江 寧波 315000)
中國基礎(chǔ)教育改革與發(fā)展的歷程表明,教育評價中評價理念、評價制度、評價技術(shù)等方面的創(chuàng)新,業(yè)已成為教育改革的瓶頸與關(guān)鍵問題,而改革學(xué)生評價就是一個突破口。寧波市海曙區(qū)2015年開始嘗試區(qū)域?qū)W生評價體系的變革工作,除了區(qū)域?qū)用娴闹贫仍O(shè)計與改革外[1],重新認(rèn)識并重視教師的學(xué)生評價素養(yǎng)培養(yǎng),成為必須迅速解決的現(xiàn)實問題。教師的學(xué)生評價素養(yǎng),區(qū)別于教師評價與教師評價素養(yǎng),本課題專指教師對義務(wù)教育段學(xué)生評價過程中所呈現(xiàn)的評價認(rèn)知、能力、態(tài)度三個方面專業(yè)素養(yǎng)。[2]
(一)問卷設(shè)計
問卷第一部分單項選擇題11題,為教師背景信息與培訓(xùn)經(jīng)歷,以便做差異性比較檢驗。第二部分15題、第三部分14題,按照認(rèn)知、能力、態(tài)度三個維度調(diào)查教師的學(xué)生評價素養(yǎng)。在問卷設(shè)計過程中,用李克特五點法(Likert's five scaling method)設(shè)計量表,征求學(xué)校一線教師的調(diào)研意見,采用德爾菲法(Delphi method)綜合相關(guān)教育專家的建議,并由自評改為他評的方式,旨在通過心理投射反映出教師的真實現(xiàn)狀。
(二)信度和效度檢驗
匿名調(diào)查是對海曙區(qū)義務(wù)段在職在編教師開展的全樣本問卷,以此分析整個區(qū)域教師的學(xué)生評價素養(yǎng)情況。匿名調(diào)查時間從2015年5月底到6月底,在教師會議上統(tǒng)一發(fā)放、回收答題卡。答題采用答題卡涂卡形式,回收1545份,掃描檢錄出有效卡1403份,有效率90.8%。采用SPSS16.0軟件統(tǒng)計分析數(shù)據(jù)。運用Alpha信度系數(shù)法,檢測問卷內(nèi)在信度系數(shù)為0.896,證明題項之間具有較高的內(nèi)在一致性,問卷具有高穩(wěn)定性和可靠性。
(一)調(diào)查結(jié)果1:無論職前職后,教師嚴(yán)重缺少教育評價方面的專題培訓(xùn)
問卷第一部分中有3道題設(shè)置了有關(guān)“教師培訓(xùn)與自學(xué)評價課程”的問題,得出僅46.7%的教師在職前有過評價方面的培訓(xùn),半數(shù)以上的教師沒有參加過;53.0%的教師在就職教師之后有參加過評價方面的培訓(xùn);55.5%的教師平時有自學(xué)評價知識的經(jīng)歷。職前、職后都參加過評價方面培訓(xùn)的僅占31.2%。
有2道題分別考察教師對標(biāo)準(zhǔn)化測驗中信度概念和教育評價方法分類的掌握情況,屬于需要基本掌握的評價原理知識,回答正確率為10.2%、58.0%,反映出教師培訓(xùn)的經(jīng)歷與評價原理知識的掌握沒有直接的相關(guān)性,即參加過培訓(xùn)的教師未必掌握了相關(guān)的教育評價知識。舉一例分析,數(shù)據(jù)發(fā)現(xiàn):3年以下任職教師正確率最高達(dá)到74%;隨教齡年限遞升,準(zhǔn)確率略微遞減(參見表1)。
表1 教師的學(xué)生評價素養(yǎng)認(rèn)知水平年齡比較
可見,中小學(xué)教師對評價原理知識的掌握情況不盡如人意,個別題目正確率只有一成,不同職稱和教齡的教師存在差異。
(二)調(diào)查結(jié)果2:一半教師在教育教學(xué)中缺乏理論聯(lián)系實際的實踐操作
問卷中有關(guān)于學(xué)生評價能力內(nèi)容的題目,以此來考察教師掌握評價方案設(shè)計的實踐技能。教師未能答對,推理得知這部分教師在平時的教育教學(xué)工作中缺乏評價方案設(shè)計的實踐操作,如第40題44.4%的教師選擇錯誤,說明教師在教育教學(xué)評價中缺少正確的引導(dǎo),評價的針對性和有效性有待商榷之處。
根據(jù)教齡對比,結(jié)果上沒有明顯差異。但通過職稱和學(xué)科部分的檢驗,發(fā)現(xiàn)存在差異。根據(jù)職稱比較,初級和中級教師準(zhǔn)確率達(dá)到58.0%,高于錯誤率;反而,高級教師的回答準(zhǔn)確率低于錯誤率。這說明,高級教師固化了評價的方法與手段。
根據(jù)學(xué)科劃分來比較,語文教師的準(zhǔn)確率明顯高于其他學(xué)科達(dá)到62.0%,說明語文教師對評價方案設(shè)計原理知識與實踐知識的掌握情況,明顯好于其他學(xué)科教師,數(shù)學(xué)教師次之,英語教師排第三;信息技術(shù)與綜合實踐教師,情況表現(xiàn)最差;其他學(xué)科教師回答正誤各占一半。所以,信息技術(shù)與綜合實踐學(xué)科作為學(xué)生綜合素質(zhì)評價的重要組成部分,更有必要加強對這兩門學(xué)科教師的評價知識理論與實踐的培訓(xùn)。(準(zhǔn)確率排序參見表2)
調(diào)查還發(fā)現(xiàn):初中教師的正確率44.0%低于小學(xué)教師62.0%近二成。在對不同類型學(xué)校的數(shù)據(jù)比較中發(fā)現(xiàn):高級教師中,初中和九年一貫制學(xué)校的正確率偏低,低于完小和中心小學(xué)20.0%;中級教師中,重點、中心小學(xué)最高,正確率達(dá)到66.0%,可推理重點小學(xué)的中級教師評價實踐表現(xiàn)較好。初級教師中,初中正確率最低,低于其他類型學(xué)校20.0%。(準(zhǔn)確率比較參見表3)
表2 教師的學(xué)生評價認(rèn)知水平學(xué)科比較
從語、數(shù)、英三科來比較各教齡教師第40題的答題情況:
語文:準(zhǔn)確率總體比較均衡;3年教齡以下教師準(zhǔn)確率最低,為53.0%;6—10年教齡教師最高,為75.0%;可見,3年教齡以下語文教師亟須培訓(xùn)與引領(lǐng)。
數(shù)學(xué):11—15年教齡的教師準(zhǔn)確率最低為49.0%;3年以下及3—5年教齡教師準(zhǔn)確率最高,70.0%以上,可見,年輕的數(shù)學(xué)教師評價實踐行為較好。
英語:11—20年教齡的教師準(zhǔn)確率最高,近70.0%;21年及以上教師準(zhǔn)確率最低為39.0%。
(三)調(diào)查結(jié)果3:教師對自身與同事的評價知識運用能力和評價具體行為表現(xiàn)的認(rèn)同度較高
有3道題通過被測教師對周圍教師“是否能根據(jù)教學(xué)內(nèi)容清楚表述課堂評價目標(biāo)與內(nèi)容”“能根據(jù)學(xué)生學(xué)情及教學(xué)情況選擇恰當(dāng)評價方法”“根據(jù)教學(xué)目標(biāo)設(shè)計評價方案并予以實施”的情況做出是否認(rèn)同判斷,從心理學(xué)專業(yè)角度分析,其本人的回答也可以投射出自身的情況。3道題回答的總體情況比較接近,這也反映出調(diào)查的信效度較高。從教師們的主觀判斷來看,可以認(rèn)為八成的教師對評價的原理知識是基本掌握的,其中三成的教師掌握情況比較好。
表3 教師的學(xué)生評價認(rèn)知水平學(xué)校類型、職稱比較
6道題通過被測教師對周圍教師在“課堂評價”“引導(dǎo)學(xué)生參與評價”“評價交流”“評價改進(jìn)教學(xué)”“方法的運用”“學(xué)業(yè)測驗的實施”等情況做出是否認(rèn)同的判斷,也反映出自身的認(rèn)知與能力。在大數(shù)據(jù)分析中,對“非常不同意”“不同意”“一般”“同意”“非常同意”分別從小到大賦值1、2、3、4、5,得到期望值與標(biāo)準(zhǔn)差(如表4)。
15—19題的期望值都在4以上(即偏向于正向值“同意”),標(biāo)準(zhǔn)差在0.8左右,數(shù)據(jù)結(jié)果穩(wěn)定。只有第26題期望值3.02,處于中立,標(biāo)準(zhǔn)差0.956。
數(shù)據(jù)反映出:
有八成教師關(guān)注課堂評價,在課堂上根據(jù)學(xué)生對教學(xué)的各種反應(yīng)做出相應(yīng)的評價;
近八成教師在教育評價中注重評價主體的多元化,能積極引導(dǎo)學(xué)生參與評價;
九成教師注重評價交流,在測驗或練習(xí)后及時給學(xué)生進(jìn)行試卷分析并解釋分析結(jié)果;
近九成教師關(guān)注通過評價來改進(jìn)自己的教學(xué)。
第26題持認(rèn)同觀點的占29.7%,中立的占43.1%,反對的占27.2%。說明教師在平時實施學(xué)業(yè)測驗的過程中,自行編制試卷開展標(biāo)準(zhǔn)化測驗的做法不多。
表4 教師的學(xué)生評價能力分析
(四)調(diào)查結(jié)果4:教師在評價方面的反思研究能力表現(xiàn)不一,近一半的教師有想法卻鮮有反思,更多是沒有付諸實際行動
第32題(在學(xué)生評價方面的論文寫作與發(fā)表獲獎情況)的意圖是了解教師的評價反思與研究能力。1/4的教師根本沒有評價反思的想法,對評價反思處于麻木狀態(tài)。近一半的教師有想法卻沒有反思的實際行動。近1/5的教師在評價方面已有研究成果,具有一定的評價反思與研究能力?!坝袇⑴c或自己開展涉及評價方面的課題”的教師占11.7%,比例甚少。
從學(xué)科比較來看,語文教師對評價反思的自覺性優(yōu)于其他學(xué)科,數(shù)學(xué)、信息技術(shù)與綜合實踐三個學(xué)科教師涉及評價的文章獲獎或發(fā)表的表現(xiàn)較低,數(shù)學(xué)、英語、社政教師“沒有評價反思”的比例較高,值得引起重視。
從教齡比較而言,選擇“有反思沒記錄”的教師隨教齡的增長總體趨勢遞減,6—10年的教師稍低,11—15年的教師稍高;“有評價方面的文章獲獎或發(fā)表”的教師隨教齡的增長總體趨勢遞增,6—10年教齡的教師比例最高;然而,6—10年教齡教師的內(nèi)部存在明顯的兩極分化,因為6—10年教齡的教師“沒有評價反思”的比例也最高。另外,3年以下教齡的教師“參與評價方面的課題”比例相比其他教齡的教師要高一點,說明了剛?cè)肼毜哪贻p教師在評價方面的積極性較高。
(五)調(diào)查結(jié)果5:教師評價實踐中常采用的學(xué)生評價集中于四種方式,課堂口頭評價占首位
一道多選題請被測教師選出最常采用的學(xué)生評價方式,按選擇頻數(shù)從高到低排序。顯然,教師常采用的學(xué)生評價方式集中于前四種:課堂口頭評價、家庭作業(yè)、紙筆測驗、日常觀察,因為比例都在50.0%以上。成長記錄、口試、制作、表演、日記、辯論比例分別為29.0%、24.0%、21.0%、20.0%、19.0%、14.0%。
(六)調(diào)查結(jié)果6:教師對同事評價態(tài)度的認(rèn)同觀點集中程度相對較弱,反映出教師們的評價態(tài)度存在差異與問題,值得引起重視
83.8%的教師贊同“應(yīng)用于實際教育評價的課程標(biāo)準(zhǔn)是必要的”,對于“運用課程標(biāo)準(zhǔn)應(yīng)用于教育評價”的認(rèn)識有正確態(tài)度。對于“現(xiàn)在的教學(xué)就是為了學(xué)生在考試中取得好成績”的看法,教師們的意見各持一半。可見,當(dāng)前在中小學(xué)教師的觀念中,應(yīng)試教育與素質(zhì)教育勢力均衡,對于外部的學(xué)業(yè)評價,至少一半教師還是認(rèn)為分?jǐn)?shù)起到主要的評價作用。
認(rèn)同“聽評課活動中,教師們更關(guān)注教學(xué)設(shè)計和教師的授課行為”的教師占79.2%,說明教師在聽評課過程中,更多地還是關(guān)注教師的教學(xué)行為,重視“教”的評價,輕視“學(xué)”的評價。18.5%的教師持中立觀點,12.3%的教師不認(rèn)同。
56.8%的教師認(rèn)為“如果條件允許,期中、期末考試教師們還是想自己命題”,其中近二成的教師對于自己命題開展學(xué)業(yè)評價的實踐需求愿望比較強烈(18.0%選擇了非常同意)。教師們對統(tǒng)一標(biāo)準(zhǔn)化測驗的態(tài)度,真正認(rèn)同有關(guān)部門組織統(tǒng)一考試的教師不到四成。30.3%持中立觀點,30.0%持反對立場。53.3%的教師愿意給每個學(xué)生寫所任教課程的評語,對素質(zhì)評價或質(zhì)性評價抱以積極的態(tài)度。
(七)調(diào)查結(jié)果7:教師的學(xué)生評價價值觀認(rèn)同接近75.0%;近六成教師對參與區(qū)域?qū)W生評價變革表現(xiàn)出積極的態(tài)度
對于學(xué)生評價目的的價值觀分析:74.2%教師認(rèn)為“學(xué)生評價的目的是促進(jìn)學(xué)生將來的發(fā)展”,3.9%選擇“為了學(xué)生的學(xué)習(xí)”具有正確的學(xué)生評價價值觀;4.3%教師認(rèn)為“學(xué)生評價的目的旨在提高教師教學(xué)質(zhì)量”,著眼自身的教學(xué),有點膚淺;17.5%選擇“著眼于學(xué)生當(dāng)前發(fā)展的評價”,側(cè)重于教育評價的診斷性或只局限于學(xué)生的學(xué)習(xí)而非整體的發(fā)展。
對于區(qū)域開展學(xué)生評價變革的價值觀認(rèn)同分析:2/3的教師認(rèn)同并會盡力實踐學(xué)生評價,17.7%的教師認(rèn)同但缺乏行動力,這些教師不同程度上表現(xiàn)出了在教育教學(xué)工作中有實踐評價的需求。11.5%的教師表示不確定,4.2%的教師對實踐學(xué)生評價持一種消極的態(tài)度。
從第37題的回答情況看,有57.4%的教師對我區(qū)中小學(xué)開展學(xué)生評價變革抱以積極的態(tài)度,贊同并能積極參與其中;12.5%的教師贊同但不愿參與;23.1%的教師持觀望態(tài)度;7.1%的教師比較悲觀,持懷疑態(tài)度。
(八)調(diào)查結(jié)果8:教師對學(xué)生評價素養(yǎng)的培訓(xùn)需求中典型案例學(xué)習(xí)占首位
第38題以多選題的形式,讓教師表達(dá)出自己的主觀意愿,可以了解在教師的思想中提升評價素養(yǎng)的策略有哪些側(cè)重。同時,大數(shù)據(jù)也能反映教師們對提升自身評價素養(yǎng)的培訓(xùn)需求。排序前8位的內(nèi)容、比例數(shù)據(jù)分別是:典型案例學(xué)習(xí)(61.0%)、教師評價實踐的鍛煉(58.0%)、教師權(quán)利的回歸(55.0%)、教師間的評價交流(46.0%)、教育管理者的先進(jìn)評價理念傳輸(43.0%)、教育政策的支持(42.0%)、教師自身的評價理念提升(36.0%)、教師教育培訓(xùn)(35.0%)。
從回答結(jié)果來看,教師們的選擇看起來比較分散,但是教師的選擇占五成以上比例的選項有“典型案例學(xué)習(xí)”“教師評價實踐的鍛煉”“教師權(quán)利的回歸”三項。其中,“典型案例學(xué)習(xí)”的需求最高,另外兩項也反映出教師們對提升自身素養(yǎng)、開展評價的真實思考。選擇“教師間的評價交流”排位第四,比較靠前,表達(dá)了教師希望通過同行間的評價交流,相互提升評價素養(yǎng)的愿望?!敖逃芾碚呦冗M(jìn)的理念”和“教師自身的評價理念”排位比較靠后。相比而言,教師更需要實實在在的實踐經(jīng)驗,在實踐學(xué)生評價的道路上更需要踐行者、行動上的領(lǐng)路人。
在可選項中,“教師教育培訓(xùn)”居然排在最后一位,這需要反思當(dāng)前的教師培訓(xùn)工作,特別對于教師評價素養(yǎng)提升培訓(xùn)的方案制定,希望本實證報告能起到一定的警示作用。
盡管近一半的教師有過職前培訓(xùn)或職后培訓(xùn)等經(jīng)歷,但教師所擁有的評價知識與技能卻十分有限,教師的評價知能處于較低水平。初級教師對“評價的個人經(jīng)驗知識”的培訓(xùn)需求明顯高于中高級教師;高級教師對“評價的基本原理知識”的培訓(xùn)需求明顯高于初級和中級教師?!熬唧w的評價行為能力(觀察、傾聽、對話等)”的培訓(xùn)需求比例按職稱的升高呈遞減趨勢;相反地,中高級教師關(guān)注“設(shè)計與實施能力”與“評價與反思的研究能力”培訓(xùn)需求的比例略高于初級教師。
如何充實教師的評價知能,需要考慮改進(jìn)的策略與路徑,確保教師所接受的評價教育的內(nèi)容與他們實際所需要的相匹配,例如結(jié)合學(xué)科特點的評價培訓(xùn)、結(jié)合教齡職稱開展分層的評價能力培訓(xùn)等。
數(shù)據(jù)顯示,教師的評價態(tài)度受到教齡與職稱的影響較為顯著,年輕教師、初級教師對開展學(xué)生評價有較高的積極性和正確的評價價值觀,相比而言,有相當(dāng)一部分比例的教齡長、職稱高的教師對于評價的現(xiàn)實態(tài)度需要數(shù)據(jù)去引導(dǎo)和鼓勵。從學(xué)科本身的性質(zhì)出發(fā),音體美、信息技術(shù)和綜合實踐學(xué)科教師參與區(qū)域開展學(xué)生評價變革的積極性略高于其他學(xué)科,他們更想突出自身在學(xué)生綜合素質(zhì)評價的比重。
因為評價態(tài)度始終影響著評價知能水平和評價實踐行為,只有端正了教師的評價價值觀,激發(fā)了教師的評價積極性,才能有效推進(jìn)學(xué)生評價變革工作。
教師之前所經(jīng)歷的評價培訓(xùn)并沒有質(zhì)量的要求,很大程度上學(xué)習(xí)一些與自己評價實踐沒有多大關(guān)系的評價內(nèi)容。從職稱比較來看,初級教師對評價的實踐需求最高,隨著職稱等級的遞增,參與學(xué)生評價變革的主觀積極性反而呈遞減趨勢。當(dāng)一種專業(yè)能力所需的知識與技能完全憑教師的興趣來發(fā)展,沒有任何外在的質(zhì)量的規(guī)范時,就容易造成教師的評價知能表現(xiàn)參差不齊,影響評價行為的有效性。教師們對統(tǒng)一標(biāo)準(zhǔn)化測驗的態(tài)度,也反映出很大一部分教師(占六成)希望能有自主命題開展評價的實踐機會,不希望教育行政部門用分?jǐn)?shù)來衡量教育質(zhì)量。教師需要實實在在的評價理論,更需要有寬松的實踐平臺。
這就需要相關(guān)部門和學(xué)校在為教師提供評價技能培訓(xùn)的同時,更要為教師提供政策的支持和營造良好的評價實踐環(huán)境。
為配合區(qū)域開展學(xué)生評價變革的行動研究,關(guān)注與提升教師的學(xué)生評價素養(yǎng)是重要變量。通過本次實證調(diào)查結(jié)果,總結(jié)出四個關(guān)鍵詞即“課堂”“案例”“放權(quán)”與“交流”來提供決策建議。
因為涉及義務(wù)教育段師生關(guān)系,關(guān)注學(xué)生在課堂上的表現(xiàn)評價,是推進(jìn)有效教學(xué)的關(guān)鍵因素。相對于標(biāo)準(zhǔn)化考試來說,教師更為熟悉課堂評價,具有很大自主權(quán)。如何正確引導(dǎo)教師對課堂評價的關(guān)注高于標(biāo)準(zhǔn)化考試,調(diào)動教師的評價積極性,學(xué)習(xí)課堂評價知識,有效運用評價技能,在課堂上落實有效評價需要加強培訓(xùn)。
基于教學(xué)一線的學(xué)生評價變革,需要滿懷教育理想的教師作為開路先鋒。要鼓勵先行者積累成功評價案例,建議組織一年一度的評價專題論文評選,以評選活動激勵教師的積極性,將案例整理成冊,形成培訓(xùn)素材。通過分領(lǐng)域、分學(xué)科的評價案例研究,分享經(jīng)驗做法,才能提升全體教師的評價知能和實踐行為。有了先行者的實踐探索和案例的呈現(xiàn),再分層分批地補缺培訓(xùn),形成評價變革師資梯隊。
由于外部評價的強勢,導(dǎo)致學(xué)校內(nèi)部評價功能的不斷削弱,教師評價權(quán)的缺失剝奪了教師評價素養(yǎng)得以積累、發(fā)展的有效平臺。如教師已不再自己命題;或在編制試卷時,考慮試卷編制和評分的便利;抑或是選擇題目拼湊成試卷。長此以往,必定導(dǎo)致一線教師學(xué)業(yè)評價技能的退化。因此,本調(diào)查倡議教師權(quán)利的回歸,考慮適當(dāng)放權(quán),在力求公平、規(guī)范操作的前提下,合理分配學(xué)生業(yè)績的評價權(quán)力,把評價的一部分權(quán)利還給教師,建立權(quán)力分享的學(xué)生評價體系。逐步摸索符合班情、校情的評價方式,而不是一味以分?jǐn)?shù)評價教師的教學(xué)質(zhì)量。
適當(dāng)放權(quán),探索評價新模式的過程中,建議教育主管部門要為學(xué)校提供政策的支持,學(xué)校要為教師營造良好的評價實踐環(huán)境。特別是教研室開展學(xué)科學(xué)業(yè)評價變革中,探索標(biāo)準(zhǔn)化測驗中的量化評價與質(zhì)性評價相結(jié)合,給教師開展評價變革實踐以專業(yè)支持和政策保障。
學(xué)生評價的變革實踐不是閉門造車就可以出成效的,需要探尋教育主管部門、學(xué)校與教師三類主體協(xié)同促進(jìn)教師學(xué)生評價素養(yǎng)的提升路徑,分析教師需求及其在評價領(lǐng)域的表現(xiàn),尋求專業(yè)力量開發(fā)高質(zhì)量的評價培訓(xùn)項目,逐層逐批實施全員評價培訓(xùn)來提高教師的評價操作技能。在制定培訓(xùn)方案的過程中,需要考慮為教師搭建專業(yè)的評價實踐平臺,促進(jìn)教師反思和研究。加強教師之間、學(xué)科之間、班主任之間、校際之間、區(qū)域之間的交流,促進(jìn)教師評價實踐經(jīng)驗的分享與提升。[3]
[1]徐曉虹.區(qū)域?qū)W生評價變革的行動研究[J].中小學(xué)管理,2016(3):42-44.
[2]王中華.論核心素養(yǎng)視角下的學(xué)生評價[J].中小學(xué)教師培訓(xùn),2017(3):1-3.
[3]蔡敏.美國基礎(chǔ)教育學(xué)生評價改革述評[J].中國教育學(xué)刊,2003(8):22-25.