祁 蕓,趙永發(fā)
(西北民族大學教育科學與技術學院,甘肅蘭州 730030)
“教學評一體化”最早在義務教育階段提出,意圖呈現一個完整的教學系統(tǒng),《義務教育課程方案》(2022 年版)強調了“教學評”一致性。評價是教的活動與學的活動相互聯系的紐帶,《深化新時代教育評價改革總體方案》指出,“充分發(fā)揮評價的導向、鑒定、診斷、調控和改進作用”,為我國當下的教育評價指明了方向,即以評促學,以評促教[1]。讓“學”與“評”充分糅合,通過學習者積極參與、全身心投入評價過程來讓評價起到診斷與調控作用,進而促進學習的提高[2]。
同伴互評也被稱作同儕互評、同伴評價。同伴互評最廣為接受的定義是由Topping提出的,他認為同伴互評是一種學生對彼此的學習績效、意義或質量進行點評,形成自我判斷的過程[3]。當前,同伴互評是以學生為中心,貫徹學評融合理念重要實現方式之一。然而,有的研究者認為同伴互評存在交互行為弱、評語質量低、可靠性不足等問題,而對其效果持質疑態(tài)度,同伴互評的有效開展,需要教師的完善設計與實施。如何有效設計同伴互評,很考驗教師的能力,這也從一定程度上實現了教學評一體化需求。
目前有關同伴互評的研究綜述,大多從國家分布、期刊分布、合作者分布等表層上展示其研究熱點,對如何指導一線教師開展同伴互評活動,操作借鑒性不強。因此,為了擴展同伴互評在當下教育教學中的實踐應用,實現教學評一體化,研究對國內同伴互評的實證研究核心文獻進行了梳理和篩選,并根據實證研究的核心要素進行內容分析,在操作層面上進行歸納總結。
研究借助內容分析梳理國內同伴互評實證研究的研究要素,研究問題主要包括三部分:“同伴互評實證研究的研究重點都是什么?”“研究情境和研究方法是什么?”“研究結果主要包括哪些方面?”
研究采用系統(tǒng)性文獻綜述的方法,選取中國知網學術期刊數據庫(CNKI)核心期刊作為數據來源,以“同伴互評”“同儕互評”“同伴反饋”為主題詞進行檢索,時間截至2023 年6 月,共獲取216篇文獻,初步篩選后剩余179 篇文獻。進一步篩選文獻,要求相關研究必須是實證研究,且相關要素齊全,以此排除文獻80篇,最終得到99篇文獻。
為實現開展相關教學實踐的借鑒意義,需要通過一定的內容分析框架系統(tǒng)展示同伴互評實證研究所包含的要素。丁斯莫爾指出,實證研究應包含學科背景、數據收集方法、研究結果等幾個核心要點[4];也有研究者指出,一項實證研究是由“真實問題—方法運用—數據分析—結論詮釋”構成的統(tǒng)一體[5]。綜上,本研究搭建包含研究主題、研究情境、研究方法、研究結果四個維度的內容分析編碼體系(見表1)。
表1 內容編碼體系
本研究進行內容分析時以篇為單位,相關文獻的內容從上述4 個一級維度以及9 個二級維度進行統(tǒng)計分析。進行編碼的兩名研究生先任取20%的文章進行初步編碼,對出現的問題協(xié)商解決方案,最終使兩名編碼人員的信度(Cohen’s Kappa)達到92.8%,然后再完成剩余文獻的編碼。
國內有關同伴互評實證研究的主題比較豐富,包括同伴互評的作用,同伴互評有效性、可靠性的提升,同伴互評模型的構建,同伴互評相關工具的開發(fā)應用等,這表明我國對同伴互評的研究逐漸深入,不斷從各個方面設法提高同伴互評效果,但對同伴互評促進學習機制和路徑的研究相對而言還比較匱乏,僅有少量說明文獻,這可能對大規(guī)模開展同伴互評實踐造成一定的影響。
1.同伴互評對學習的促進作用
同伴互評作為一種容易使學習者接受,能大大提高學習者參與度和投入度的過程性評價手段,可以提高學生的反思能力,增強學生的自信心、學習動機和自我效能感,最終實現對學習的促進作用。例如汪瓊等人對MOOC課程中同伴互評數據進行挖掘后發(fā)現:同伴互評活動可以幫助學生有效反思,學習效果也相對更好[6]。
同伴互評應用的最多的場景是英語、日語等外語寫作與翻譯,對其有非常顯著的提升作用。例如程英等人探討非英語專業(yè)碩士研究生的同伴互評在角色扮演活動中的作用。引入互評后,76.6%的學生個人成績發(fā)生了改變,分差變化幅度約為原來的2.4 倍,效果比較顯著[7]。在中文的寫作中,也可以提高學習者的寫作水平。張義兵等人在對小學六年級進行同伴互評后發(fā)現,互評教學不僅能夠提升小學生的作文水平,而且可以促進深度學習的發(fā)展[8]。
伴隨著研究逐漸深入,學者們逐漸發(fā)現同伴互評活動在促進學習者高階思維發(fā)展方面同樣效果顯著。例如張濤等人研究了在線同伴互評不同階段學習者批判性思維的發(fā)展,并指出在線同伴互評活動可以促進批判性思維的提升[9]。其在后續(xù)的研究中探討了同伴互評活動中的參與者群體認知也在向中高維度演變;且不同階段、不同組別的群體認知網絡存在顯著差異[10]。
2.同伴互評可靠性的提升
同伴互評已經被廣大研究者和教育工作者所接受,但研究發(fā)現實際應用互評的實踐并不是很多,這是因為在實踐層面的同伴互評通常需要面臨社會性互惠、評價失真等問題,很多教師甚至學生自己對其效果存疑;因此,如何提高同伴互評的準確度,也是當前研究的熱點話題。
同伴互評讓很多學習者接受的最大原因是,其相比于其他評價方式可以帶來“自由”,而它存在的問題也很大程度上來源于這種自由,因此施加一定程度的干預來實現有限度的“自由”是十分必要的。因此,有很多研究者致力于實現這種干預,例如李紅霞等人基于FBM 模型提出兩階段干預策略,提高學習者參與同伴互評投入度的同時,還能避免活動“失控”,具備一定程度可操作性[11]。
也有研究者從同伴互評的情緒體驗入手。柏宏權等人研究了同伴互評中所包含的不同評語類型,并進一步探究其對學習者情緒體驗的影響。他們指出不同評語類型會對學習者的情緒產生不同影響;例如加強型評語和糾正型評語,加強型評語學習者期望獲得但又不想收到簡單加強型評語[12]。這對從情緒體驗的角度提升同伴互評的可靠性具有實踐參考意義。在提升同伴互評準確度方面,大多研究集中借助技術的參與來實現,例如有研究者借助二分圖匹配理論構建作業(yè)評閱人推薦模型來解決作業(yè)評閱人的任務分配問題[13]。
技術對同伴互評可靠性提升的最大促進作用是其可以面向大數量級的學習者,比如MOOC 學習者,能有效節(jié)省人力,也能保障同伴互評的準確度,是未來同伴互評的研究重點之一??傊芯空邚牟煌矫?,力爭在一定程度上解決同伴互評中存在的問題,取得了相當的成效,有效解決了同伴互評的信度問題。
3.同伴互評的工具研究
同伴互評的優(yōu)勢不言而喻,但不可否認的是,在實踐教學中加入同伴互評會極大增加教師的工作量,造成一定的負擔;因此,如何利用一些行之有效的工具輔助教師進行同伴互評活動就顯得尤為重要。
在眾多互評工具的研究中,提供量規(guī)是采用最多的方式,有研究者進行了基于量規(guī)的在線同伴互評一系列實驗,發(fā)現基于量規(guī)的在線同伴互評不僅可以提高學習者的認知投入度,還可以提高學習成效;最重要的是學生對基于量規(guī)的在線同伴互評比較認同,認為其可以幫助自己更好的進行同伴互評[14]。也有研究者關注了什么樣的量規(guī)具備更好的促進效果,例如范逸洲等人發(fā)現逐級劃分量規(guī)等級以及采用是非選擇型的評分量規(guī)能在一定程度上提高學習者之間互評的信效度,且評價者的信效度越高,其所提交的作業(yè)質量越高。
評價支架也屬于量規(guī)中的一種,有研究者將評價支架應用到MOOC中;結果表明,分析型評價支架能更好的提升學習者同伴互評的投入度,并且能提高評價一致性和評語質量[15]。
智能化的同伴互評系統(tǒng)能在極大程度上減輕教師負擔,提高互評信度,是未來同伴互評的發(fā)展方向之一。有研究創(chuàng)建了適用于媒體設計類課程、能進行同伴互評的移動作業(yè)展示系統(tǒng),并且進行了實踐應用,發(fā)現其也可以很好體現同伴互評的效果,學習者的認可度和投入度比較高[16]。
實證研究的情境至關重要,不同的參與人群,測量環(huán)境都有可能對研究結果產生影響,因此研究通過學科情境、參與人員、研究時長三個能對研究結果產生一定影響的指標來進行匯總分析。
1.學科背景
同伴互評應該擴展到不同學科中驗證其有效性,并在不同學科的實踐中不斷完善自己,方能在當下的教育情境中,為培養(yǎng)更多具備高階思維能力人才發(fā)揮重要作用。同伴互評相關實證研究中,在外語寫作和翻譯教學中應用比較廣泛,因此英語和非英語學科占比相對較高一些,除此之外,教育技術領域有關同伴互評的實證研究比較多,研究案例比較豐富(見圖1)。
圖1 學科領域分布
2.參與人員
同伴互評作為一種形成性評價方式,應該在不同的年級、學段開展,但目前同伴互評實證研究中,89.81%以大學生、研究生作為對象,僅有7.41%和2.78%以中小學生、教師為研究對象。大學生是同伴互評實證研究關注最多的群體,其他學段的學習者參與不足,尤其是成人研究者;今后應加強不同學段中的應用研究以及對比研究。
從參與同伴互評活動的人員數量來看,30 人以下的研究有16個,31到60人的研究有39個,61到100 人的研究有16 個,100 到200 人的研究15個,多于200 人的研究9 個(見圖2)。參與人數最多的研究是MOOC中有關同伴互評對自我效能感的研究[17]。參與人數最少的是羅曉杰的一項研究,他選擇一名新手型高中英語教師(X教師)作為研究對象,探究同伴反饋對其反思能力的影響[18]。
圖2 參與人員數量分布
3.人員持續(xù)時間
針對明確指明研究時長的70個研究(其他研究只指明幾輪,并未指明具體時間)進行分析(如圖3 所示),很大部分研究集中在一學期內完成,盡管一學期已經能夠在一定程度上展示出同伴互評的有效性,但對同伴互評的遠期效果進行檢驗、采取好的干預措施等,都需要大量的時間去驗證,因此,未來開展多輪次的研究十分必要。
圖3 研究持續(xù)時間
為了更好展示同伴互評實證研究的開展歷程,研究將研究方法劃分為實驗方法、數據搜集方法和數據分析方法三個部分。
1.實驗方法
在同伴互評實證研究方法中,準實驗研究方法最多,且最多的是以教師評價與學生評價做對比,來驗證同伴互評的有效性,其他研究相對較少(見表2)。未來應該采用不同的研究方法探討同伴互評影響學習者的作用和機制,以提升其對學習者的促進效果。
表2 實驗方法
2.數據搜集方法
一個研究可能存在多種數據搜集方法,不同的數據搜集方法可能會影響實驗結果。通過對同伴互評實證研究數據搜集方法分析可知,比較常規(guī)的、能夠快速測量學習者的學習績效、學習態(tài)度的方法主要是問卷法(90.91%),且除了用于檢驗學習效果外,它一般還用于對同伴互評認知的調查;除此之外,應用比較多的是測驗法(61.18%),即通過前后測的方法,測量學習者在參與同伴互評活動前后各個方面的變化情況,用于支撐研究;能夠在一定程度上體現學習者變化的訪談法(31.76%)應用也比較多,除了作為輔助證據以外,它能夠深入了解學習者所思所想,為進一步改善同伴互評活動提供建議。值得注意的是,絕大部分研究應用多種數據收集方法,以保障研究結果的準確性。
3.數據分析方法
實證研究的數據分析方法很重要,當前同伴互評實證研究采用的分析方法主要有量化分析、質性分析和混合分析三種,其中大多數研究主要采用混合分析方法,它能從多角度、多方面對數據進行解釋,更加具備科學性。從具體的方法來看,認知網絡分析、腦電技術分析等新鮮的數據分析方法逐漸應用到同伴互評實證研究當中,其可以實現對學習者高階思維能力變化的監(jiān)測,在一定程度上促進同伴互評效果的檢驗。
實證研究的結果一般來說是比較可靠的,因為其是建立在實踐得出數據的基礎上,進行合理分析得出的,是對提出的問題和假設的解答,可參考意義比較大。研究結果種類分布在學業(yè)成就(例如外語的翻譯和寫作能力)、思維與能力發(fā)展(例如批判性思維和情感體驗)上。除此之外,有關提升同伴互評可靠性的研究也比較多,表明對同伴互評的研究已經逐漸深入。
研究以國內同伴互評領域的99 篇核心文獻為例,依據構建的實證研究內容分析框架,從研究主題、研究情境、研究方法以及研究結果四個方面進行系統(tǒng)化分析,來展現同伴互評實證研究的內容與過程,結論主要如下。(1)從主題上說,同伴互評對學習的促進作用、可靠性提升、工具研究三個主題研究比較集中,同伴互評的作用機制、同伴互評與自評、師評結合等方面的研究較為薄弱。未來研究應該進一步深入,例如可以通過評價主客體的轉換、評價過程全方位掌握的基礎上探尋同伴互評促進學習者高階思維發(fā)展的內在機理。(2)從研究情境看,同伴互評在外語、教育技術學等領域研究最多,但是從參與人員來看,大多集中在大學生上,對中小學生和成人學習者關注較少。未來研究應該進一步拓寬研究領域,探討同伴互評對不同學科、不同年齡的學習者作用的差異性。(3)從研究方法看,準實驗法應用的最多,問卷、訪談等傳統(tǒng)數據搜集方法占比較大,混合分析是同伴互評最主要的分析方法。隨著人工智能、大數據的發(fā)展,技術支持下的研究應該更加精確、可視化,對于提供策略有更準確的建議。(4)從結果上看,同伴互評對學習的促進作用得到了很多的驗證,突出表現高階思維能力的發(fā)展、積極的情緒體驗和良好的學業(yè)成效上,未來研究應該更加關注同伴互評對于學習者的綜合提升,促進學習進一步提高。
1.“教學評一體化”下的同伴互評在進行設計時需考慮多元主體結合評價
同伴互評是學評融合的重要實踐之一,學習者在進行互評的同時,也展開了對自我的評價與拓展,而教學評一體化還需要“教”的參與。因此,在同伴互評中施加教師作用,促進多元主體評價方式為教學評一體化助力,而同伴互評本身也需要教師的有效設計才能促進學習者高階思維的發(fā)展,因此,同伴互評本身就蘊含著教學評一體化的思想。
在同伴互評實證研究中,已經有不少研究開始將教師評價融入同伴互評之中。例如陳功等人在學習者寫作過程中借助“N+2+1”多元反饋模式來促進深度學習,并幫助學生達到三個領域、六個方面的高階知識和能力[19]。盡管當前同伴互評仍是以學習者為中心的評價實踐,但師評和自主評價同樣是同伴互評不可或缺的一部分。教師的作用來源于對同伴互評活動的設計、監(jiān)控和適當調節(jié),并對不利于同伴互評活動順利進行的突發(fā)情況進行控制;自主評價可以更好的幫助學習者進行反思,提高同伴互評的效果。因此,將師評和自主評價融入同伴互評當中,發(fā)展多元主體結合的評價方式,是未來同伴互評研究的重要趨勢。當然,教師的介入也需要控制“度”,一味由教師做決定,同伴互評也就失去了它原本的意義。因此,未來研究應該著力于尋找教師評價與自主、同伴互評之間的平衡點,使教師能夠很好的影響互評活動,而又不對結果產生不良影響,產生不必要的限制和干擾,從而形成一體化發(fā)展,促進教學評深度融合。
2.“教學評一體化”下的同伴互評要利用技術進行全過程支持
當下,為了提高同伴互評的準確度與可靠性,已經有研究者將大數據等技術融入其中,實現對互評全過程的監(jiān)控與調節(jié),技術的參與對同伴互評可靠性的提升有很大幫助,研究者可以將學習者以往的數據,例如評價者的可靠度等作為基準來進行人員與題目分配,從而在一定程度上保障同伴互評順利進行。有研究通過構建同伴互評概率模型來保障同伴互評中的題目,特別是主觀題目評分的客觀性與均一性[20]。除此之外,技術對同伴互評的另一個促進作用是其可以將結果可視化呈現給學習者,使學習者可以清楚了解自己的實際情況,進而進行自我調控。技術對教學評一體化的助推還體現教師的“教”上,教師可以借助技術的應用更好設計、監(jiān)控、調節(jié),例如在技術支持的同伴互評中,教師通過提前設計如何分配作品、如何進行評分評語,其余工作可由互評系統(tǒng)自動完成,教師和學習者只需要觀看系統(tǒng)給自己推送的結果即可。一方面幫助學習者更好的發(fā)現自己的問題,解決自己的問題;另一方面可以讓教師根據結果及時調整策略,全面改善同伴互評結果。
3.同伴互評在設計時要注意其促進學習的作用路徑與機制,進而提升作用效果
同伴互評相比于其他形成性評價方式的優(yōu)勢,在于參與者可以全身心投入,受外界干擾影響較小,這為學習者提升自己的專業(yè)知識理解、評價能力和高階思維能力提供了可能。因此,最大程度保持學習者在評價過程中的深度參與應是未來研究的方向之一。在同伴互評相關研究中發(fā)現,真正探索同伴互評如何影響學習者的機制研究并不多,研究大多集中在驗證同伴互評的作用上,而關于如何促進深度參與,則需要了解其如何影響學習者,進而采取針對性措施進行保障,提高同伴互評效果。除此之外,同伴互評的深度參與過程也與當下深度學習所提倡的理念相關,研究其影響機制也為深度學習的實現提供一種可能。