[中圖分類號]G424.74[文獻(xiàn)標(biāo)識碼]A[文章編號] 1673—1654(2025)04—039—011
2020年10月,中共中央、國務(wù)院印發(fā)《深化新時代教育評價(jià)改革總體方案》,方案提出“四個評價(jià)”,要求針對不同主體和不同學(xué)段、不同類型教育特點(diǎn),改進(jìn)結(jié)果評價(jià),強(qiáng)化過程評價(jià),探索增值評價(jià),健全綜合評價(jià)。文件首次明確提出“探索增值評價(jià)”,成為教育行政部門和一線學(xué)校開展教育評價(jià)工作新的突破點(diǎn)。
利用學(xué)生的進(jìn)步程度開展增值評價(jià),是一種更加公平和精確的學(xué)校評價(jià)方法1,是近些年來教育評價(jià)的熱點(diǎn)話題。已有研究中大多將增值評價(jià)用于評價(jià)區(qū)域內(nèi)學(xué)校、教師的教學(xué)效能,既為教育行政問責(zé)提供量化證據(jù)支持,也為學(xué)校、教師教育教學(xué)改進(jìn)提供新證據(jù)、新視角2。盡管使用的增值模型存在差異,但已有研究大多基于一次前測和后測進(jìn)行增值分析。實(shí)際上,學(xué)生學(xué)業(yè)水平在一段時間內(nèi)是持續(xù)動態(tài)發(fā)展的,多次采集學(xué)生成績并持續(xù)開展增值分析,有助于更精準(zhǔn)地刻畫學(xué)生學(xué)業(yè)成就的發(fā)展軌跡,錨定學(xué)校增值發(fā)展的多樣類型。同時,已有研究普遍聚焦學(xué)校、教師層面的增值情況,對于學(xué)生個體的增值表現(xiàn)及其影響因素關(guān)注較少。在實(shí)踐中,精準(zhǔn)呈現(xiàn)學(xué)生的進(jìn)步情況,挖掘高增值學(xué)生所具有的共同特征,有助于探究增值表現(xiàn)背后的深層次原因,為教育教學(xué)改進(jìn)提供方向,激發(fā)各層次學(xué)生的學(xué)習(xí)潛能。因此,有必要基于科學(xué)的增值分析方法,對學(xué)生、學(xué)校多階段增值情況及其相關(guān)影響因素進(jìn)行分析與研究。
一、研究背景
(一)增值評價(jià)
增值評價(jià)把起點(diǎn)、過程和結(jié)果統(tǒng)一起來,既看學(xué)生的學(xué)業(yè)結(jié)果,也客觀衡量學(xué)生的進(jìn)步程度和學(xué)校的努力狀況,旨在探索某些學(xué)校的學(xué)生在某一段時間內(nèi)的學(xué)習(xí),與另外一些學(xué)校的學(xué)生相比,是否有相對較多的進(jìn)步,將原有的對靜止、單次測驗(yàn)成績進(jìn)行終結(jié)性評價(jià)轉(zhuǎn)變?yōu)閷B續(xù)、發(fā)展趨勢進(jìn)行綜合性評價(jià)。
在實(shí)踐中,學(xué)校和教育管理部門大多依托學(xué)生的原始分?jǐn)?shù)、常模排名或轉(zhuǎn)換為百分位等級的相對排名,對學(xué)生增值情況進(jìn)行分析。如果分?jǐn)?shù)或排名提升,則認(rèn)為學(xué)生產(chǎn)生了增值。然而原始分?jǐn)?shù)與排名由于測量水平問題,一方面無法公平地比較不同起點(diǎn)分?jǐn)?shù)或排名的學(xué)生的進(jìn)步程度,另一方面也受制于“天花板效應(yīng)\"和\"地板效應(yīng)\"影響。
王曉平等總結(jié)美國學(xué)校進(jìn)行增值評價(jià)常用的數(shù)理模型多達(dá)7種,對于測驗(yàn)是否需要垂直等值、進(jìn)行縱向鏈接,不同模型的要求存在差異。其中基于學(xué)生考試分?jǐn)?shù)進(jìn)行比較的“增分模型”“漸進(jìn)達(dá)標(biāo)模型”“分類模型”等對分?jǐn)?shù)等值有著較高的要求,需要依據(jù)跨年級的縱向量表才能得出科學(xué)、合理的增值結(jié)果,在當(dāng)前教育研究與一線實(shí)踐中都具有較大困難。學(xué)生成長百分等級(student growthpercentile,SGP)模型因其更為突出的適用性在美國得到廣泛使用,值得我國教育界關(guān)注和借鑒。
(二)成長百分等級模型
在每次學(xué)業(yè)測試中,都有若干個學(xué)業(yè)水平相近的學(xué)生群體,Betebenner將這樣的學(xué)生群體定義為“學(xué)業(yè)伙伴\"(academicpeer)[5]。通過整合學(xué)生多次測驗(yàn)數(shù)據(jù),可以計(jì)算出每個學(xué)生在學(xué)業(yè)伙伴中相對位置的變化,并以此來衡量學(xué)生的進(jìn)步程度。例如,學(xué)生A在中考階段,與其他9名同學(xué)的英語學(xué)科成績均為90分,則認(rèn)為他們起始學(xué)業(yè)水平相同。經(jīng)過三年教學(xué)后,收集這10名學(xué)生的高考成績并排序,此時學(xué)生A在群體中排名第3,超過了 70% 的學(xué)生,則認(rèn)為他在英語學(xué)科上的成長百分等級(SGP)為70。對于學(xué)生A來說,通過高中3年的學(xué)習(xí),與曾經(jīng)學(xué)業(yè)水平相當(dāng)?shù)膶W(xué)業(yè)伙伴相比,他獲得了更為明顯的學(xué)業(yè)增值。
上述案例簡單闡釋了該模型的基本原理,在實(shí)踐中需要依托分位數(shù)回歸方法對學(xué)生多次測驗(yàn)成績進(jìn)行分析。與線性回歸僅能求出一條回歸曲線不同的是,分位數(shù)回歸模型能夠根據(jù)研究者所關(guān)注的不同分位數(shù),擬合每條分位數(shù)回歸曲線。使用該方法開展增值分析時,分別計(jì)算1\~99分位數(shù)方程,并根據(jù)殘差確定每名學(xué)生的SGP等級,其數(shù)值范圍為1\~99的整數(shù)。在學(xué)生個體層面,如果SGP等級高于50,則表明這名學(xué)生在學(xué)業(yè)成績上獲得了進(jìn)步;反之,則表明這名學(xué)生在一段時間以來的學(xué)習(xí)中存在一定問題,進(jìn)步程度較低。在教師、學(xué)校等層面,將班、校范圍內(nèi)所有學(xué)生SGP等級的中位數(shù)(medianstudentgrowthpercentile,mSGP)作為指標(biāo),衡量教師、學(xué)校的教學(xué)效能。
成長百分等級模型具有三大優(yōu)勢:首先,該模型受極端值、異常值影響較小。對于處于尖端或底端的學(xué)生均可估計(jì)出其進(jìn)步程度,突破了依據(jù)位次變化計(jì)算增值時存在天花板效應(yīng)或地板效應(yīng)的困境。其次,每個學(xué)生的增值程度均被統(tǒng)一到1\~99的SGP量尺下,能夠比較起點(diǎn)不同學(xué)生的進(jìn)步情況,保證了評價(jià)的相對公平。最后,該模型操作性強(qiáng),在實(shí)際操作中并不需要使用垂直等值設(shè)計(jì)的測驗(yàn)工具,突破了教育一線難以將增值評價(jià)落實(shí)落地的困境。有研究者使用標(biāo)準(zhǔn)分法、效應(yīng)量法、分層回歸法及學(xué)生成長百分位法進(jìn)行增值分析并比較結(jié)果,指出學(xué)生成長百分位法更適用于開展增值評價(jià),是一種簡單高效的方法。本研究擬依據(jù)成長百分等級模型對學(xué)生開展增值分析。
(三)學(xué)習(xí)策略
在影響學(xué)業(yè)成績的諸多因素中,學(xué)習(xí)策略一直是教育研究者和一線教師關(guān)注的關(guān)鍵因素。PISA、TIMSS等大型國際測試均在調(diào)研問卷及報(bào)告中關(guān)注學(xué)習(xí)策略對于學(xué)業(yè)成績的影響。以英語學(xué)科為例,《普通高中英語課程標(biāo)準(zhǔn)(2017年版2020年修訂)》指出,發(fā)展學(xué)生運(yùn)用學(xué)習(xí)策略的能力是提高學(xué)生學(xué)習(xí)能力的主要途徑,是教學(xué)的重要內(nèi)容,也是英語學(xué)科核心素養(yǎng)的重要組成部分8。具體來說,英語學(xué)習(xí)策略主要指學(xué)生為促進(jìn)語言學(xué)習(xí)和語言運(yùn)用而采取的各種行動和步驟,包括元認(rèn)知策略、認(rèn)知策略、交際策略和情感策略等。其中,元認(rèn)知策略指學(xué)生為了提高英語學(xué)習(xí)效率,計(jì)劃、監(jiān)控、評價(jià)、反思和調(diào)整學(xué)習(xí)過程或?qū)W習(xí)結(jié)果的策略;認(rèn)知策略指學(xué)生為了完成具體語言學(xué)習(xí)活動而采取的步驟和方法;交際策略指學(xué)生為了爭取更多的交際機(jī)會、維持交際以及提高交際效果而采取的策略;情感策略指學(xué)生為了調(diào)控學(xué)習(xí)情緒、保持積極的學(xué)習(xí)態(tài)度而采取的策略。通常這些策略可以組合運(yùn)用以解決學(xué)習(xí)中較復(fù)雜的問題。
已有研究發(fā)現(xiàn),學(xué)習(xí)策略尤其是元認(rèn)知策略對于學(xué)業(yè)成績具有顯著的正向影響[9-10],在不同學(xué)段中可能存在差異]。作為能夠促進(jìn)學(xué)生終身學(xué)習(xí)能力發(fā)展的學(xué)習(xí)策略,除了對終結(jié)性評價(jià)能夠產(chǎn)生正向影響外,對學(xué)生增值情況也可能產(chǎn)生積極的預(yù)測作用。由于增值分析結(jié)果與學(xué)生的前測成績無相關(guān),對于能夠較好使用學(xué)習(xí)策略的學(xué)生,無論其起始成績優(yōu)劣,是否能獲得較高的增值,需要結(jié)合數(shù)據(jù)開展實(shí)證研究。
二、研究設(shè)計(jì)
(一)研究問題
以北京市某區(qū)高中英語學(xué)科為例,聚焦學(xué)業(yè)成績增值表現(xiàn)情況與學(xué)習(xí)策略的關(guān)系,檢驗(yàn)學(xué)習(xí)策略與學(xué)生起始學(xué)業(yè)成績是否存在交互效應(yīng),探究學(xué)生對不同學(xué)習(xí)策略使用的水平對于起始學(xué)業(yè)水平不同的學(xué)生是否產(chǎn)生影響。
(二)研究樣本
數(shù)據(jù)采集于北京市某區(qū)。選取該區(qū)域內(nèi)2020級高中生2020年6月初中學(xué)業(yè)水平考試(以下簡稱“中考\")數(shù)據(jù)、2022年6月高二年級學(xué)業(yè)水平調(diào)研數(shù)據(jù)及2023年4月高三下學(xué)期期中測試數(shù)據(jù)。由于增值分析為一項(xiàng)縱向分析技術(shù),需要樣本連續(xù)參與多次測試,因此對某一次測試缺考的學(xué)生進(jìn)行剔除。學(xué)習(xí)策略問卷在高二年級學(xué)業(yè)水平調(diào)研項(xiàng)目中配合測試卷發(fā)放,與學(xué)業(yè)成績庫鏈接后,共保留學(xué)生數(shù)據(jù)樣本6016人,來自于50所中學(xué),每所學(xué)校人數(shù)在12\~491人之間。其中男生2863人,占比 47.6% ,女生3153人,占比 53.4% 。
(三)變量選取
1.學(xué)業(yè)成績
選取每名學(xué)生參與每次測試或調(diào)研的英語學(xué)科學(xué)業(yè)成績,其中中考測試、高二年級調(diào)研試卷滿分為100分,高三下學(xué)期期中試卷滿分為150分。除中考外,高二調(diào)研卷及高三期中卷均由本區(qū)教研員和骨干教師多輪次研討,結(jié)合課程質(zhì)量標(biāo)準(zhǔn)及教育質(zhì)量綜合評價(jià)指標(biāo)體系對試題進(jìn)行統(tǒng)一命制,力求考查出學(xué)生必備知識、關(guān)鍵能力、核心素養(yǎng)等真實(shí)水平。測試后由一線教師聯(lián)合完成全區(qū)統(tǒng)一閱卷工作。
進(jìn)行增值分析前,首先將所有學(xué)生三次測驗(yàn)成績進(jìn)行標(biāo)準(zhǔn)化處理。使用成長百分等級模型,基于中考和高二調(diào)研成績計(jì)算學(xué)生第一階段增值,基于高二調(diào)研成績與高三期中成績計(jì)算學(xué)生第二階段增值。
2.學(xué)習(xí)策略
學(xué)習(xí)策略調(diào)研問卷參考《普通高中英語課程標(biāo)準(zhǔn)(2017年版2020年修訂)》對于學(xué)習(xí)策略的定義及分類標(biāo)準(zhǔn),將學(xué)習(xí)策略分為認(rèn)知策略、元認(rèn)知策略、交際策略和情感策略。問卷編制主要依據(jù)課標(biāo)要求,借鑒PISA、NEAP、TIMSS等大規(guī)模測評問卷題目,采用4點(diǎn)李克特量表方式自編相關(guān)調(diào)研題目。其中,認(rèn)知策略維度主要調(diào)查學(xué)生在聽、讀等技能方面較為典型的學(xué)習(xí)策略;元認(rèn)知策略主要調(diào)查學(xué)生在英語學(xué)科的計(jì)劃(設(shè)置目標(biāo)、預(yù)習(xí))和監(jiān)控(檢查和反思)策略;情感策略主要調(diào)查學(xué)生對于學(xué)習(xí)英語學(xué)科的態(tài)度及保持信心采取的策略;交際策略主要調(diào)查學(xué)生為了爭取更多的交際機(jī)會、維持交際以及提高交際效果而采取的策略。
問卷整體信效度見表2。各分量表克倫巴赫 ∝ 值均超過0.7,具有較高的內(nèi)部一致性信度。驗(yàn)證性因子分析結(jié)果表明,CFI(comparative fitindex,相對擬合指數(shù))和TLI(Tucker-Lewisindex,塔克-劉易斯適配度指數(shù))指標(biāo)均高于0.9,RMSEA(rootmeansquareerrorofapproximation,近似均方根誤差)小于0.08,模型適配情況良好。認(rèn)知策略分量表題目載荷在0.54\~0.63之間,元認(rèn)知策略分量表題目載荷在0.59\~0.68之間,情感策略分量表題目載荷在 0.46~ 0.73之間,交際策略分量表題目載荷在0.57\~0.70之間,均超過0.4,表明題目質(zhì)量較高,能夠較好地表征測量構(gòu)念。
3.分析方法
使用R軟件中自編函數(shù)進(jìn)行成長百分等級模型的分析,以及學(xué)生、學(xué)校層面增值等級計(jì)算,對學(xué)生、學(xué)校學(xué)業(yè)增值表現(xiàn)及學(xué)生學(xué)習(xí)策略水平進(jìn)行描述性統(tǒng)計(jì),并進(jìn)行T檢驗(yàn)、相關(guān)分析、多因素方差分析。
三、研究結(jié)果
(一)增值分析
學(xué)生層面的學(xué)業(yè)成績及增值情況如表3所示。學(xué)生在中考到高二、高二到高三兩階段的SGP等級均值為 49.71~49.95 ,標(biāo)準(zhǔn)差為 28.84~28.85 ,兩階段增值之間不存在顯著性差異 (1=-0.47,pgt;0.05) 。不同性別學(xué)生在歷次測試的學(xué)業(yè)成績上均存在極其顯著的差異 (t1=5.34,plt;0.001;t2=3.88,plt;0.001;t3=3.72, (204號plt;0.001 ),女生表現(xiàn)均顯著高于男生,但兩階段增值分析中均不存在顯著性差異 (t1=-0.30,pgt;0.05; t2= 0.66,pgt;0.05, 。各學(xué)生兩階段增值等級之間存在極其顯著的負(fù)相關(guān),相關(guān)系數(shù)為 -0.21(plt;0.001) ,表明在第一階段取得較高增值等級的學(xué)生,在第二階段增值分析中較難獲得相似的表現(xiàn)。
依據(jù)每所學(xué)校所有學(xué)生SGP等級的中位數(shù)(mSGP)評判學(xué)校增值情況,如表3所示。與學(xué)生個體情況表現(xiàn)不同,各學(xué)校兩段增值之間存在顯著的正相關(guān),相關(guān)系數(shù)為 0.29(plt;0.05) ,表明在學(xué)校層面,在第一階段教學(xué)效能較高的學(xué)校,與第二階段增值分析表現(xiàn)有一定的一致性。
本著激勵學(xué)校、鼓勵發(fā)展的宗旨,將學(xué)校的增值表現(xiàn)劃分為高增值、較高增值、平均增值、較低增值、低增值五種類型,具體標(biāo)準(zhǔn)如表4所示。聚焦學(xué)校個案,各校第一段與第二段增值類型如表4所示。其中第一段中各類型學(xué)校分布相對均勻,第二段中超過一半學(xué)校處于平均增值類型。
各學(xué)校兩階段增值等級如圖1所示。共有26所學(xué)校在兩階段中均保持平均增值及以上的表現(xiàn),占比 52.0% 。絕大部分學(xué)校在某一階段能夠?qū)崿F(xiàn)平均及以上水平的學(xué)業(yè)增值。共有6所學(xué)校在兩階段中均保持較低增值或低增值(圖中左下區(qū)域),占比12.0% ,表明相關(guān)學(xué)校在高中階段英語學(xué)科教學(xué)中存在較為明顯的短板,學(xué)生學(xué)業(yè)成績表現(xiàn)在全區(qū)范圍內(nèi)持續(xù)走低。
表5以第二階段增值分析為例,呈現(xiàn)起始生源水平不同學(xué)校的結(jié)果評價(jià)與增值評價(jià)表現(xiàn)情況。其中學(xué)校1、2、3為較高增值和高增值類型。這些學(xué)校中既有結(jié)果評價(jià)中始終處于全區(qū)高位的頭部學(xué)校(學(xué)校1),也有中前端或中后端的學(xué)校(學(xué)校2和學(xué)校3)。尤其是學(xué)校3,受生源因素影響,結(jié)果評價(jià)的排名相對落后,但增值分析排名顯著高于前測和后測的結(jié)果評價(jià)排名。這充分反映出增值評價(jià)的激勵作用,即能夠更為合理地評價(jià)這類學(xué)校為學(xué)生帶來的教學(xué)賦能。學(xué)校4、5、6為較低增值或低增值類型。這些學(xué)校同樣包含了區(qū)域頭部學(xué)校和中后端學(xué)校。以學(xué)校4為例,由于在教學(xué)過程中未能給學(xué)生帶來足夠的學(xué)業(yè)進(jìn)步,即使在后測測試中的絕對成績名列前茅,但和前測水平相當(dāng)?shù)膶W(xué)生、學(xué)校相比,學(xué)校4的教學(xué)效能表現(xiàn)并不令人滿意。
(左下區(qū)域?yàn)閮呻A段均低增值學(xué)校,右上區(qū)域?yàn)閮呻A段均高增值學(xué)校)
(二)學(xué)習(xí)策略分析
對四種學(xué)習(xí)策略進(jìn)行描述統(tǒng)計(jì)和差異性檢驗(yàn),如表6所示。結(jié)果表明,學(xué)生對于認(rèn)知策略的使用
更為頻繁,情感策略、元認(rèn)知策略相對較低。差異性檢驗(yàn)結(jié)果表明,在每種策略的使用頻率上,女生均顯著高于男生,與學(xué)業(yè)成績表現(xiàn)相一致。
(三)學(xué)生增值與學(xué)習(xí)策略的關(guān)聯(lián)分析
基于驗(yàn)證性因子分析模型,估計(jì)每名學(xué)生四種學(xué)習(xí)策略使用頻率的因子得分。分別將四種學(xué)習(xí)策略因子得分與學(xué)生第一階段、第二階段增值等級進(jìn)行相關(guān)性分析。結(jié)果如表7所示,在高二年級,即第一階段后測調(diào)研的各項(xiàng)學(xué)習(xí)策略得分,與學(xué)生的第一階段增值等級普遍存在極其顯著的正相關(guān),相關(guān)系數(shù)在0.17\~0.19之間。相反,各項(xiàng)學(xué)習(xí)策略得分與學(xué)生第二階段增值等級之間的相關(guān)系數(shù)較低,在0.03\~0.04之間,幾乎不存在相關(guān)性。
為進(jìn)一步探究學(xué)生第一階段英語增值情況與學(xué)習(xí)策略的關(guān)系,將四種學(xué)習(xí)策略依據(jù)學(xué)生個體的因子得分,以-1和1為分界線,將其劃分為低水平、中等水平和高水平三個組別。同時,將學(xué)生第一階段前測成績以標(biāo)準(zhǔn)分-1和1為分界線,將其劃分為起始水平低、起始水平中等和起始水平高三個組別。采用多因素方差分析方法,聚焦起點(diǎn)不同的學(xué)生群體中,學(xué)習(xí)策略水平不同的學(xué)生在學(xué)業(yè)增值表現(xiàn)上是否存在顯著性差異。
分析結(jié)果如表8所示,學(xué)生的起始學(xué)業(yè)水平、認(rèn)知策略水平、元認(rèn)知策略水平和情感策略水平、交際策略水平具有極其顯著的主效應(yīng) "F情感策略水平 =9.40 plt;0.001 ;F交際策略水平 =5.44 plt; 0.01)。四種學(xué)習(xí)策略水平表現(xiàn)不同的學(xué)生,在學(xué)科增值等級上均存在顯著差異,表現(xiàn)為學(xué)習(xí)策略水平越高,學(xué)生在一段時間內(nèi)的學(xué)科學(xué)業(yè)成績增值表現(xiàn)越好。
此外,研究發(fā)現(xiàn)學(xué)生認(rèn)知策略水平與起始學(xué)業(yè)水平之間的交互效應(yīng)顯著 F=3.10,plt;0.05, ?;诤唵涡?yīng)分析發(fā)現(xiàn),當(dāng)學(xué)生調(diào)用認(rèn)知策略頻率的水平達(dá)到中等及以上時( gt;-1 個標(biāo)準(zhǔn)差),不同起始水平學(xué)生獲得的學(xué)業(yè)增值無顯著性差異。當(dāng)學(xué)生調(diào)用認(rèn)知策略頻率的水平較低時( lt;-1 個標(biāo)準(zhǔn)差),起始水平越高的學(xué)生,所獲得的增值等級越低。
元認(rèn)知策略水平、起始學(xué)業(yè)水平與性別之間的交互效應(yīng)顯著( F=1.80,plt;0.05 )?;诤唵涡?yīng)分析發(fā)現(xiàn),對于男生來說,當(dāng)調(diào)用元認(rèn)知策略頻率的水平達(dá)到高水平時( gt;1 個標(biāo)準(zhǔn)差),起始水平越高的學(xué)生,所獲得增值等級越高;當(dāng)調(diào)用元認(rèn)知策略頻率的水平較低時( lt;-1 個標(biāo)準(zhǔn)差),起始水平越高的學(xué)生,所獲得增值等級越低。對于女生來說,當(dāng)調(diào)用元認(rèn)知策略頻率達(dá)到中等及以上水平時( (gt;-1 個標(biāo)準(zhǔn)差),不同起始水平學(xué)生獲得的學(xué)業(yè)增值無顯著性差異;當(dāng)學(xué)生調(diào)用元認(rèn)知策略頻率的水平較低時(lt;-1個標(biāo)準(zhǔn)差),起始水平較高的學(xué)生,所獲得的增值等級較高。
四、結(jié)論與討論
以高中英語學(xué)科學(xué)業(yè)測評為例,基于成長百分等級模型,開展高中學(xué)段兩階段區(qū)校增值分析,并探討學(xué)生增值等級的影響因素。結(jié)果表明,全區(qū)各學(xué)校學(xué)業(yè)增值普遍達(dá)到平均及以上的增值水平,通過增值評價(jià)能夠有效挖掘生源水平較低學(xué)校的教學(xué)效能;在相鄰兩階段的增值等級上,學(xué)生層面表現(xiàn)為負(fù)相關(guān),學(xué)校層面表現(xiàn)為正相關(guān);學(xué)生某一時間點(diǎn)的學(xué)習(xí)策略水平,與前一階段增值表現(xiàn)存在正相關(guān),與后一階段增值表現(xiàn)幾乎不相關(guān);學(xué)生對認(rèn)知策略、元認(rèn)知策略、情感策略、交際策略四種學(xué)習(xí)策略使用頻率的水平,均對學(xué)業(yè)增值存在積極影響;對于學(xué)業(yè)增值,認(rèn)知策略與起始學(xué)業(yè)水平之間,元認(rèn)知策略與起始學(xué)業(yè)水平、性別之間均存在交互效應(yīng),起始學(xué)業(yè)水平越高的學(xué)生若想實(shí)現(xiàn)增值,越需要關(guān)注學(xué)習(xí)策略的掌握與使用。
(一)充分認(rèn)識增值評價(jià)的引導(dǎo)和激勵作用
不論是學(xué)生層面還是學(xué)校層面,增值評價(jià)都為教育一線工作者打開了一種新的評價(jià)視角。以往教育行政部門基于三率一分進(jìn)行的終結(jié)性評價(jià),無法通過評價(jià)解決“強(qiáng)者恒強(qiáng)、弱者恒弱”的局面。增值評價(jià)作為眾多評價(jià)方式中的一種,能夠有效挖掘生源水平不同學(xué)校的教學(xué)效能,在激勵薄弱學(xué)校發(fā)展、比較同類學(xué)校進(jìn)步幅度等方面具有重要價(jià)值,保障了評價(jià)的公平性。
基于成長百分等級模型開展的增值分析,能夠?qū)W(xué)生和學(xué)校的增值等級進(jìn)行較為精準(zhǔn)的判斷。該模型分析的結(jié)果有著較為明確的教育意義,即超過了多大比例的曾經(jīng)學(xué)業(yè)水平相當(dāng)?shù)膶W(xué)業(yè)伙伴,相對來說更便于一線教育工作者和教育行政部門理解和使用。
本研究分別計(jì)算了學(xué)生中考到高二和高二到高三兩個階段的學(xué)業(yè)增值,發(fā)現(xiàn)學(xué)生層面兩階段增值之間的相關(guān)性與學(xué)校層面相反。對于學(xué)生個體來說,在第一階段實(shí)現(xiàn)較高增值、尤其是極高增值的情況下,在第二階段很難再獲得相似的進(jìn)步,僅有 9% 的學(xué)生能夠在兩階段增值分析中始終保持高增值狀態(tài) SGPgt;65 )。這也符合常規(guī)的教學(xué)規(guī)律。但對于學(xué)校來說,兩段增值具有一定的跨時間一致性,教育行政部門關(guān)注增值評價(jià)結(jié)果的同時,也要放眼去看增值趨勢[12]。相當(dāng)一部分學(xué)校在高中學(xué)段三年的教學(xué)中,始終能給學(xué)生帶來接近甚至遠(yuǎn)超全區(qū)平均水平的學(xué)業(yè)增值,值得教育行政教研部門對增值表現(xiàn)優(yōu)異的學(xué)校進(jìn)行分析與挖掘,凝練優(yōu)秀經(jīng)驗(yàn)。對于持續(xù)處于低增值狀態(tài)的學(xué)校要有針對性的幫扶方案和改進(jìn)措施。因此,基于評價(jià)結(jié)果的有效反饋與運(yùn)用,能夠給予學(xué)校新的改進(jìn)方向,幫助學(xué)校對學(xué)科教研組一段時間內(nèi)的教學(xué)成果進(jìn)行更加立體的評判。
(二)關(guān)注非學(xué)業(yè)因素與學(xué)業(yè)成績之間的動態(tài)互促
以往研究大多針對學(xué)生、學(xué)校學(xué)業(yè)增值情況進(jìn)行分析,較少關(guān)注對學(xué)業(yè)增值影響因素的研究。本研究聚焦學(xué)生對學(xué)習(xí)策略使用頻率這一因素,在高二年級采集一次學(xué)習(xí)策略的靜態(tài)數(shù)據(jù),并與前后兩階段增值等級的動態(tài)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析。此時獲得的學(xué)生非學(xué)業(yè)因素?cái)?shù)據(jù),既代表了前一階段結(jié)束時的學(xué)習(xí)狀態(tài),也同時作為下一階段的基線狀態(tài)。
研究發(fā)現(xiàn),某一時刻學(xué)生的非學(xué)業(yè)因素表現(xiàn)與前一階段學(xué)生學(xué)業(yè)增值情況具有一定的正相關(guān)性,而與后一階段的學(xué)業(yè)增值幾乎不具有相關(guān)性。其原因可能在于,由于當(dāng)前學(xué)業(yè)增值分析基于多次測試刻畫學(xué)生動態(tài)變化的態(tài)勢,而對于非學(xué)業(yè)因素的調(diào)研僅在某一個時間節(jié)點(diǎn)采集,僅代表當(dāng)下學(xué)生對自我學(xué)習(xí)狀態(tài)的評定,一定程度上解釋了其在前一階段所獲增值水平高低的原因。而進(jìn)入下一階段,學(xué)生對學(xué)習(xí)策略調(diào)用頻率等非學(xué)業(yè)因素水平始終在動態(tài)變化、與學(xué)業(yè)成就相互影響的過程中,并不會穩(wěn)定、持續(xù)保持相同水平。
未來研究可以采集多次非學(xué)業(yè)因素?cái)?shù)據(jù),開展對于非學(xué)業(yè)因素的增值研究,描繪學(xué)生非學(xué)業(yè)因素的發(fā)展軌跡,并與多階段學(xué)業(yè)增值數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,更好地挖掘兩者之間動態(tài)變化、相互促進(jìn)的作用,結(jié)合對學(xué)生的個案分析,進(jìn)一步探究和挖掘影響學(xué)生、學(xué)校正向發(fā)展、實(shí)現(xiàn)教育賦能的深層要素。
(三)綜合運(yùn)用多種評價(jià)方式,依據(jù)學(xué)情精準(zhǔn)施策
本研究以英語學(xué)科為例,發(fā)現(xiàn)學(xué)生對于認(rèn)知策略、元認(rèn)知策略、情感策略、交際策略等四項(xiàng)學(xué)習(xí)策略使用頻率的水平,對學(xué)生學(xué)業(yè)增值均存在顯著的主效應(yīng)。結(jié)合已有研究結(jié)論,學(xué)習(xí)策略不僅對于學(xué)生在結(jié)果評價(jià)中所獲得的學(xué)業(yè)成績存在積極影響,也與學(xué)生進(jìn)步與否、程度高低有著高度的相關(guān)。學(xué)生在學(xué)習(xí)中主動調(diào)用相關(guān)策略,說明其有意愿投入到學(xué)科學(xué)習(xí)當(dāng)中,開展自主學(xué)習(xí)。教師有必要依據(jù)課程標(biāo)準(zhǔn)中明確列出的學(xué)習(xí)策略,組織課內(nèi)外教育教學(xué)活動,激發(fā)學(xué)生的自主意識,提高學(xué)生對于自主學(xué)習(xí)的正確認(rèn)識,通過課堂教學(xué)方式的變革為學(xué)生提供適當(dāng)?shù)淖灾鲗W(xué)習(xí)空間[13]。保持主動和積極的學(xué)科學(xué)習(xí)態(tài)度與自信心的學(xué)生,更容易實(shí)現(xiàn)明顯的學(xué)業(yè)增值。未來研究也可拓展學(xué)科,研究不同學(xué)習(xí)策略對于學(xué)生學(xué)業(yè)增值的影響是否具有跨學(xué)科一致性。
本研究還依據(jù)學(xué)生不同的起始學(xué)業(yè)水平進(jìn)一步將學(xué)生細(xì)分,發(fā)現(xiàn)對于不同起點(diǎn)的學(xué)生來說,不同學(xué)習(xí)策略對于學(xué)業(yè)增值的影響存在差異。認(rèn)知策略使用頻率達(dá)到中等及以上水平時,不論學(xué)生起點(diǎn)水平如何,大多能夠?qū)崿F(xiàn)較為明顯的學(xué)業(yè)增值。反之,當(dāng)認(rèn)知策略使用頻率較低時,起點(diǎn)越高的學(xué)生越難獲得進(jìn)步。認(rèn)知策略作為較為基礎(chǔ)的學(xué)習(xí)策略,調(diào)用的頻率相較其他學(xué)習(xí)策略更為頻繁。在日常教學(xué)中,教師對于各類學(xué)生群體都應(yīng)重視落實(shí)基礎(chǔ)知識,為學(xué)生創(chuàng)設(shè)調(diào)用認(rèn)知策略的真實(shí)情境和挑戰(zhàn)性學(xué)習(xí)任務(wù),夯實(shí)全面發(fā)展的基礎(chǔ)。
同時,研究還發(fā)現(xiàn)元認(rèn)知策略對于學(xué)業(yè)增值的影響,在不同性別、不同起點(diǎn)的學(xué)生群體中存在差異。尤其在男生群體中,元認(rèn)知策略的作用更為關(guān)鍵。學(xué)生在認(rèn)知過程中,需要不斷對在這一過程進(jìn)行積極而自覺的監(jiān)視、控制和調(diào)節(jié),提高學(xué)習(xí)效率。對于本研究所關(guān)注的高中生群體來說,男生相比女生在英語學(xué)科學(xué)業(yè)表現(xiàn)和各項(xiàng)學(xué)習(xí)策略上都較為落后。但立足增值評價(jià)視角,兩者無顯著性差異。當(dāng)元認(rèn)知策略使用頻率達(dá)到中等及以上水平時,無論起點(diǎn)水平如何,男生群體都能夠?qū)崿F(xiàn)與女生群體相同程度的學(xué)業(yè)增值。與認(rèn)知策略使用頻率相似,對于起點(diǎn)越高的學(xué)生,教師越應(yīng)該關(guān)注其在學(xué)習(xí)中的主動性,在課堂教學(xué)中加強(qiáng)與學(xué)生的互動,對其學(xué)習(xí)中的問題進(jìn)行歸因分析,及時給予指導(dǎo),引導(dǎo)學(xué)生進(jìn)行自主計(jì)劃與反思總結(jié),有效提升學(xué)習(xí)效率,實(shí)現(xiàn)學(xué)業(yè)增值。
綜上,區(qū)域和學(xué)校需要有效運(yùn)用增值評價(jià)的分析數(shù)據(jù),挖掘其教育意義與價(jià)值,轉(zhuǎn)換評價(jià)視角,將結(jié)果評價(jià)、綜合評價(jià)等方式與探索增值評價(jià)工作關(guān)聯(lián)起來,組織學(xué)科教研組充分解析學(xué)情,關(guān)注不同起點(diǎn)的學(xué)生群體,探究真正促使學(xué)生產(chǎn)生增值的關(guān)鍵因素,在教學(xué)中做到針對性施策。
參考文獻(xiàn):
[1]彭湃,胡詠梅,克里默.學(xué)校增值的一致性與穩(wěn)定性:基于多水平追蹤數(shù)據(jù)的實(shí)證研究[J].教育研究,2015,36(7):73-80.
[2]邊玉芳,王燁暉.增值評價(jià):學(xué)校辦學(xué)質(zhì)量評估的一種有效途徑[J].教育學(xué)報(bào),2013,9(1):43-48.
[3]陳如平.以增值評價(jià)探索為突破口推進(jìn)學(xué)校改革[J].中小學(xué)管理,2020,(08):1.
[4]王曉平,齊森,謝小慶.美國學(xué)校“成長測量\"的7種主要方法[J].中國考試,2018,(6):21-27.
[5]Betebenner D W.Norm-and Criterion-Referenced StudentGrowth [J].Educational Measurement: Issues and Practice,2O09,28(4):42-51.
[6]符華均,王朝陽,程乾,等.基于學(xué)生成長百分等級模型的學(xué)業(yè)進(jìn)步評價(jià)[J].中國考試,2019,(2):14-18.
[7]陳安琪,關(guān)丹丹.幾種增值評價(jià)方法的對比分析及實(shí)證研究[J].中國考試,2022,(09):54-62.
[8]中華人民共和國教育部.普通高中英語課程標(biāo)準(zhǔn)(2017年版2020年修訂)[S].北京:人民教育出版社,2020:54.
[9]Chiu M,Chow B,Mcbride-ChangC.Universalsand SpecificsinLearning Strategies:Explaining Adolescent Mathematics,Science,and Reading Achievement across 34 Countries [J].LearningandIndividualDifferences,2007,17:344-365.
[10]張文靜,辛濤.閱讀投入對閱讀素養(yǎng)影響的跨文化比較研究——以PISA2009為例[J].心理發(fā)展與教育,2012,28(02):175-183.DOI:10.16187/j.cnki.issn1001-4918.2012.02.006.
[11]辛濤,李茵,王雨晴.年級、學(xué)業(yè)成績與學(xué)習(xí)策略關(guān)系的研究[J].心理發(fā)展與教育,1998,(04):42-45.
[12]劉夢琦,肖選婷.區(qū)域初中學(xué)校增值評價(jià)的實(shí)證研究[J].考試研究,2024,20(06):51-60.
[13]張佳妮.自主學(xué)習(xí)策略如何影響學(xué)業(yè)成績?——基于四川省2153名高中畢業(yè)生的調(diào)查研究[J].教育科學(xué)研究,2024,(07):44-51.
Study on the Value-added Assessment of High School Students and its Relationship with Learning Strategies
Yao Shoumei Wang Shuaiming Wang Meng BeijingHaidian TeacherTraining College,Beijing,l00097
Abstract:Value-added assessment is a crucial avenue for advancing educational evaluation reform in China. This study employs the student growth percentile model to conduct a two-period value-added assessment of English subjectperformance inhigh school academic assessments within a district of Beijing.It investigates the influence offour learning strategiesonstudents’value-added performanceacross diferent initial academic levels throughmultivariate analysis of variance.The findings indicate that astudent'suseof learning strategies at a specific point in time is positivelyassociated with their previous period's value-added performance,but exhibits minimal correlation with subsequent period performance.Moreover,the frequency of employing these four learning strategies hasa positive impact on academic value-added.Interaction efectsare observed between cognitive strategies and initialacademic level,meta-cognitive strategiesand initialacademic level,aswellas gender.Itis recommended that regions and schools need to comprehensively and consistently colect multidimensional dataon students' academic and non-academic performance to fully leverage the educational potential of value-added assessment data.Furthermore,this can guide teachersin conducting correlation analysesbetween outcome evaluation,value-added assessment,and comprehensive evaluation while implementing targeted interventions for diverse student groups.
Key Words:Value-Added Assessment,Student Growth Percentile Model,Learning Strategies
(責(zé)任編輯:陳暢、李梅)