盧卓元 劉婉妮 趙向梅
西安歐亞學院,陜西 西安 710065
教學評價是教學管理中的重要一環(huán),是學校了解學生學習效果、教師教學效果和教學過程的重要管理手段。為求全面和公允,多數(shù)學校都會采用學生評教、同行評教和督導評教相結(jié)合的方法。但是教學評價是否能夠真正衡量教師的教學質(zhì)量卻一直存在很大爭議。
經(jīng)常會發(fā)現(xiàn)這樣一種現(xiàn)象:即使是同樣一個老師帶同樣一門課,不同班級不同專業(yè)不同學期學生的評分也會相差巨大,而且學生和同行的評分也有很大區(qū)別。那么哪一種評價能夠更真實地反映教師的教學水平和教學效果,更能夠激勵教師改進教學和提高教學質(zhì)量,二者之間存在巨大差別的原因在哪里呢?
教學評價是指按照一定的教學目標,運用科學可行的評教方法,對教學過程和教學成果予以價值上的判斷,為改進教學、提高教學質(zhì)量提供可靠的信息和科學依據(jù)[1]。教學評價本身是一種管理手段,目的是對教育教學過程中的各要素和環(huán)節(jié)進行具體分析,針對性地指出改進方向,提高教育質(zhì)量。但是由于評價主體不一,評價標準多樣,就會相應產(chǎn)生不同的評價視角和評價層級,導致一定的評價結(jié)果偏差。
通過研究相關(guān)文獻發(fā)現(xiàn),學者們集中在三個方向進行探究:1.評什么(評價內(nèi)容和評價指標);2.誰來評(評價主體);3.怎么評(評價過程管理)。
教學質(zhì)量是教學評價的主要內(nèi)容。丁艷、萬千一詳細分析了我國1997—2018年關(guān)于教學質(zhì)量評價的研究文獻,主要集中在評價理念、評價主體、評價指標和過程管理四個方面的問題。
認為目前我國的教學評價在理念上缺乏以人為本的思想;現(xiàn)階段高校評價主體主要有學生、專家督導、領(lǐng)導和同行評價,但普遍傾向于采用以學生評價為主體的多元化評價模式;評價指標則存在著不科學、不全面、靜態(tài)性等問題;關(guān)于評價管理的研究較少,少數(shù)幾篇文章共同提到管理缺乏指導與監(jiān)控、各部分之間缺乏相互配合等問題[2]。
然而,在教學評價實踐中值得深思的另一個問題,是教學評價的結(jié)果呈現(xiàn)形式和利用。陳國欽認為,多數(shù)高校評價結(jié)果的處理和反饋缺乏科學性。反饋比較滯后,且公布的結(jié)果多以分數(shù)呈現(xiàn),缺少具體的問題評價;這就導致教師的參與意識較弱,積極性低下,教學質(zhì)量評價無法發(fā)揮激勵、監(jiān)督作用[3]。
從教學評價的目的上看,教學評價更類似于面向過去的總結(jié)性目的,主要以外在的獎優(yōu)罰劣為手段,而非面向未來的過程性目的的發(fā)展性評價。如多數(shù)學校會向教師反饋評教分數(shù)排名,教師雖然可以通過評教系統(tǒng)查看各類評價主體對自己的主觀評價;但是從量化考核的角度來說,評教分數(shù)無疑是最確切的量化數(shù)字;在教師績效考評、評優(yōu)晉升等方面起著不可替代的作用;甚至被明確寫入職稱晉升的條件中去。
相對的,發(fā)展性評價更注重根據(jù)教師的自身素質(zhì)和在現(xiàn)實工作中的表現(xiàn),著眼于教師個人的專業(yè)發(fā)展,注重用內(nèi)在的教育,引導和支持教師進行自我評價與反思,自我調(diào)整與完善,不斷提升教育教學水平;從而能夠真正實現(xiàn)促進教師的差異性發(fā)展和學校的整體性發(fā)展[4]。因此表現(xiàn)為數(shù)字的教學評價就不得不面臨更多的考量、質(zhì)疑,而探究更科學、合理的評價方式也成為大家共同關(guān)注和研究的問題。
本研究以某高校某學院(以下簡稱“某學院”)148名教師連續(xù)3個學期的學生和同行專家評教分數(shù)為基礎(chǔ),進行縱向和橫向研究。參與問卷調(diào)查的學生來自全校各個分院,從19~20(1)到20~21(1)3個學期實際參評學生分別為43576、41385、51029人次,一般是在每學期期中進行問卷發(fā)放和填寫,涉及課程有《大學體育》《大學英語》《思想道德修養(yǎng)與法律基礎(chǔ)》等50余門課程(含必修、選修、網(wǎng)絡(luò)課程等)。
同行評價則為分院148名任課教師。除問卷調(diào)查外,作者還分別通過隨堂和私下溝通的方式對90名學生和30名教師進行質(zhì)性訪談,獲取真實想法和建議。
學生評教方面,每學期由該校質(zhì)量評估中心借助教務系統(tǒng)tronclass對全校所有課程和學生統(tǒng)一發(fā)放和收集問卷。值得注意的是,問卷收集的數(shù)量并非實際在校學生數(shù),而是實際參評人數(shù)。換句話說,如果一個學生一學期參與了10門課的評教,那么他就會被重復計算10次。加上本研究中所涉及的課程為全校學生必選通識課,課程門數(shù)及修習學生數(shù)均遠遠超過其他專業(yè)課程,因此參評數(shù)量格外龐大。
同行評教方面,則是由某學院教學科針對本院所有教師自行在tronclass上發(fā)放問卷,但與學生評教不同的是,同行評教基本是一對一的關(guān)系,即一位教師只負責另一位同行教師的評價。督導評價則不僅針對課堂授課,還包括課程設(shè)計、課程總體執(zhí)行和效果等方面的評價,有單獨的評價量表。二者評分結(jié)合起來形成教師評價。
1.學生評價著重體現(xiàn)學習體驗
大學生是高等教育的主體,是高等教育的受教育者和受益者,也是高等教育過程的參與者和體驗者,大學生對其所接受的高等教育寄予期望。通過體驗得到感知,形成對滿意度的體驗和評判,基于學習體驗而形成的對大學生學習滿意度的調(diào)查與研究,應該成為大學生學習與發(fā)展研究的重要組成部分[5]。
某學院委托第三方進行教學質(zhì)量評價,評價指標包含教學資源、教學設(shè)計、教學內(nèi)容、教學效果和教學組織五個方面,每個方面又有1~3個二級指標。這些指標包含學生是否能夠了解和找到大綱及其他優(yōu)質(zhì)教學資源,教師準備的講義制作水平;課程目標是否清晰,是否采用多樣化教學;教學內(nèi)容信息量及挑戰(zhàn)度;平時作業(yè)難度、師生互動情況;以及教學環(huán)節(jié)的時間安排是否能夠滿足學生的需求等。
該問卷問題描述多以“我認為……”“我覺得……”“我了解……”開頭,帶有很強的主觀性。
比如:“我認為該門課程的教學目標清晰、明確”“我掌握了該門課程已經(jīng)教授的內(nèi)容”“教師準備的課程講義(或課件)內(nèi)容清晰、新穎、指導性強,能夠幫助我掌握課程內(nèi)容”……從個案分析來看,學生作答也同樣帶有很強的主觀性。比如,某門課程明明有教材,但還是會有少部分學生選擇沒有教材,經(jīng)過課堂訪談得知,學生選“無”僅僅是為了避免選擇“有”選項之后系統(tǒng)彈出來地對教材進行評價的一道題;又比如通過部門檢查,明明所有老師都在教務系統(tǒng)顯眼位置上傳了本學期大綱、教學計劃和考核方案,但還是有20%的學生選了“否”,原因也很簡單,對于自己沒有瀏覽過的東西自動默認為“無”或“否”,這些不負責任的打分都會直接影響教師的最終評價。
2.與學生年齡接近的老師更有優(yōu)勢
一般來說,一個有30年教齡的老師,在教學經(jīng)驗及學術(shù)水平上往往會超過一個剛上講臺的年輕教師,但反映在學生評教分數(shù)上,卻并不是這樣,見表1。
表1 年齡段對教師評價得分影響
上表中3個學期的前20名中,90后教師都是占比最多的,其次是80后、70后和50~60后;而在后20名中90后相比70后、80后明顯少得多。這反映出學生在評分時,更傾向于給予自己年齡相近的年輕教師打高分。仔細分析原因不難發(fā)現(xiàn),排除外貌、著裝等外在原因,與學生年齡越接近,越容易有共同話題,思維方式也更接近,更易引起學生的好感,這種好感會在適當程度上代替真實教學水平。
可見,要想讓如今的學生接受教師,首先要了解和走近他們在思維、話題、情感和表達上的期待。
3.教師權(quán)威對學生評價影響不大
作者專門挑出四類具有不同身份的人進行比較,試圖發(fā)現(xiàn)身份對教學評價的影響。這四類人分別是某分院主管教學的院長、課程組的組長、學校的督導和一名1996年出生的年輕教師(表2)。可以看出在學生眼中,評教分數(shù)的高低跟職務并沒有多大關(guān)聯(lián)。但有趣的是,拋開職務高低,會看到同樣一個老師帶同樣一門課程,不同年級和專業(yè)的學生會給出相差極大的分數(shù)和排名。上表中某課程組長的排名從81名到第3名,之后又到第71名,院長的排名也類似,相反,1996年出生入職不到2年的年輕教師卻一直保持在相對穩(wěn)定而且是靠前的位置。值得提醒的是,前三類人員都是親自參與制定、監(jiān)督和執(zhí)行教學質(zhì)量標準與規(guī)范的人,他們比普通老師接受了更多有關(guān)教學技能的培訓,在教學過程中也比其他教師更熟悉得分點,但結(jié)果依然不太理想。
表2 不同職務教師得分對比
4.班級規(guī)模和課程性質(zhì)會對學生評教產(chǎn)生巨大影響
無論是教學體驗還是學習體驗,小班課的效果都公認比大班課強很多,那么在教學評價上會有明顯體現(xiàn)嗎?從表3中便可看出端倪。
表3 某分院20~21(1)教學質(zhì)量得分排名全校前5%的課程教師(前10名)
該學期該分院有14人排名位于全校前5%。 但從評教規(guī)模上看,這些教師的評教人數(shù)普遍偏低(2~3個班),個別評教率甚至達到了個位數(shù),說明班級規(guī)模普遍較小。
班級規(guī)模小有利于幫助老師建設(shè)和學生之間的和諧關(guān)系。老師們除能夠更有效關(guān)注每個學生的知識獲得和技能提高之外,也有更多時間關(guān)注學生的精神和思想狀態(tài)。課內(nèi)是師生關(guān)系,課外是伙伴或朋友關(guān)系,學生在打分的時候自然給分較高。
另外,在以上所列的科目中,雅思英語是對出國有需求的學生開設(shè)的,該校大學體育也實行的是俱樂部制,學生本身是基于興趣和需求選擇這些課程,在學習的過程中往往具有十足的主動性和積極性,因此這些課程自然比學校整體學業(yè)規(guī)劃課程更受歡迎。此種條件下的打分,雖一定程度上反映了老師的教學質(zhì)量,不排除更多地帶有學生的主觀情感因素。
1.課堂教學評價更關(guān)注教學過程的管理
與學生評價更關(guān)注學習體驗相比,管理層則更關(guān)注整個教學過程的管理,從表4就可以看見分明:
表4 某分院同行督導評價細則
上表包含教師的教和學生的學兩方面。教師的教包含教學目標、教師教法、教學管理、教學過程、教學考核等;學生的學則包含課前準備、課中參與和課后學習效果三方面。
這樣的評價或許更客觀,因為很多標準可執(zhí)行可衡量,比如教師采用了什么教學方法、是否攜帶教學材料、是否布置課后作業(yè),課堂氣氛是否活躍等。但是這些顯性的條件由于非常容易滿足,故教師們得分普遍較高,并不一定能夠反映教師真正的教學水平和教學質(zhì)量。
2.管理視角下的教學評價維度更多元化
事實上,單純依靠一節(jié)課的得分,來評價教師的教學質(zhì)量和教學能力并不合適,因為教學本身是個動態(tài)的過程,管理者也深知這一點,但是教學質(zhì)量管理又是教學生命線中最重要的一環(huán),因此,就催生了多維度的質(zhì)量評價體系。
除了對課堂教學進行常規(guī)評價外,也有學校會針對課程設(shè)計和執(zhí)行,以及整體課程建設(shè)情況進行評價。而評價主體除學生外,還包括同行、校級和院級督導、課程組長、校外專家等。
依然以上文某分院為例,該分院由于長期堅持“以學生為中心”的教學理念,在課程評價上建立有一套獨立評價體系,主要考核整個課程設(shè)計是否按照指南(該分院基層學術(shù)組織自行研究制定)進行,以及教學的PDCA流程執(zhí)行情況。
但值得考量的是,多方評價會造成被評教師的茫然,在眾多的評價方、評教標準和評教分數(shù)中到底以哪一個為標準?而且相差非常大的分數(shù)發(fā)生在同一個人身上時到底表明自己做得好還是不好呢?
3.管理視角下的評教是否完全公允有待驗證
作者在進行同行督導評價梳理時發(fā)現(xiàn)兩個值得注意的現(xiàn)象,第一,評價分數(shù)的區(qū)間跨度相當大;第二,評價得分受人情因素影響較大。在連續(xù)三個學期的評價中,最高分都達到了100分,而最低分只有74分,這與學生評教的分布曲線相比有較大區(qū)別。另外,一般職務較高,或者名譽較高的人得分普遍高于普通老師,打分人與被打分人的私交也成為一個影響因子。
同時,同行評教往往是一對一的關(guān)系,就造成了眾多老師由于評價標準不一而造成的分數(shù)懸殊。但是學生評教往往是經(jīng)過一個或半個學期的學習之后,由同樣一群學生根據(jù)學習體會與收獲,對所有代課老師的課堂教學進行的一種教學評價方式,這就保證了評價者是固定的,標準也是一致的。1977年,費爾德曼研究表明,學生評教的數(shù)量足夠多時(15人以上),學生評教的可靠性就能勝過最好的客觀測驗[6]。
所以,在某種程度上,同行打分的可靠性還需要驗證。其中某位老師在19~20(1)學生評教中位列全分院第一名,但是在同行評價中卻是全分院倒數(shù)第11名,就是一個很典型的例子。
清華大學在19~20(1)的學生評教中,《寫作與溝通》課8位教師位列全校前5%。筆者曾線上采訪該課程某教師得知,課程組在學期初和學期末有集體備課,但在教學過程中從不輕易干涉教師教學。教師在沒有外在監(jiān)督的情況下都投入了巨大精力和熱情,學生也付出了比其他課相對多的努力,最終該課程被學生評為高能課和高投入課,教師得到了應有的尊重,學生也收獲良多。
反觀其他,則普遍制定了極為精細的評價標準和細則,且評價方和評價次數(shù)繁多;長此以往,很可能造成教師為了獲得高分而教學,慢慢教學熱情被消磨殆盡。沒有成就感和收獲感的師生關(guān)系也很難融洽,學生與老師不能形成“共情”“共鳴”“共識”“共享”,無疑最終影響教育和管理的結(jié)果[7]??梢姡啾仍O(shè)計精細的評價標準,給老師更多的自主權(quán),用內(nèi)因驅(qū)動戰(zhàn)勝條框束縛更重要。
曾有研究者指出,高?,F(xiàn)行評價標準存在許多共性問題:一是評價指標在制定過程中基本沒有學生參與;二是大多數(shù)評價指標都以學生的主觀感受為主,缺乏客觀的定量分析;三是較少兼顧評價指標的多樣性和差異性設(shè)計;四是多為結(jié)果性評價,缺少過程性或形成性評價;五是大多重視對課堂學習效果的評價,忽略了對課外育人工作及教學成果核定等其他方面的評價[8]。這個總結(jié)可謂切中肯綮。
因此,建議各學校內(nèi)部統(tǒng)一評價標準,注重質(zhì)性評價,適當減少評價頻率,保護教師教學熱情和學生學習熱情,真正提高教學效果。
教育的特殊性就在于它是發(fā)生在教師和學生之間連續(xù)的、動態(tài)的、微妙的過程,并不是一個數(shù)字就可以代表的短暫行為。高校中的師生關(guān)系是人際關(guān)系,但又是一種特殊的人際關(guān)系;包括師生間為完成教育任務而發(fā)生的工作關(guān)系;為滿足交往而形成的人際關(guān)系;以情感、認識等交往為表現(xiàn)形式的心理關(guān)系[9]。
因此,一個數(shù)字也許的確可以促進教師內(nèi)在動機的激發(fā),從而改進教學方法,提升教學質(zhì)量;但管理者應明白,這并非教育的全部。教育是培養(yǎng)人的活動,也許教育者更應該關(guān)注我們在什么地方,用什么方法觸動和影響了學生,從而給他們提供什么樣的榜樣和激勵。
總之,學生評價、同行評價、專家評價等種種方式都是高校為了解教學情況、保證教學質(zhì)量、提高教學效果所采取的手段;但由此引發(fā)的對教師的定性評價則不太科學。究其原因,各種評價方式雖然都在一定程度上能夠反映教師的教學態(tài)度、教學組織、教學能力和教學效果,但又都難免受情感、好惡、課程性質(zhì)、評價時機等多方面因素的影響。如若單純以評價分數(shù)的高低來判定一個教師的授課質(zhì)量難免有失公允,還需要師生以更廣泛的視域來看待和改善教學評價。