[中圖分類號] G424.74 [文獻標(biāo)識碼] A[文章編號] 1673—1654(2025)04—001—010
2014年9月國務(wù)院發(fā)布《關(guān)于深化考試招生制度改革的實施意見》,提出“完善高中學(xué)業(yè)水平考試。學(xué)業(yè)水平考試主要檢驗學(xué)生學(xué)習(xí)程度,是學(xué)生畢業(yè)和升學(xué)的重要依據(jù)”“學(xué)業(yè)水平考試由省級教育行政部門按國家課程標(biāo)準(zhǔn)和考試要求組織實施,確??荚嚢踩行?、成績真實可信”。根據(jù)文件要求,H省于2019年建立了普通高中學(xué)業(yè)水平合格性考試(以下簡稱“合格考”)項目。作為高中綜合改革及學(xué)業(yè)水平考試的重要組成部分,合格考由全省統(tǒng)一命題、統(tǒng)一考試、統(tǒng)一閱卷、統(tǒng)一公布成績。
合格考實施6年來,成績呈現(xiàn)方式(僅以“合格/不合格”兩個等級呈現(xiàn)考試成績)考試成績使用、難度設(shè)置(大部分省份規(guī)定通過率不低于 95% )限制了考試功能的發(fā)揮和教育價值的實現(xiàn),甚至其功能和地位還不及曾經(jīng)的會考,還有人認(rèn)為合格考徒增教育壓力和負(fù)擔(dān),造成教育和考試資源的浪費。因此,將合格考的英語科目與語言標(biāo)準(zhǔn)進行對接,既能拓展其功能和效用,從階段性診斷評價轉(zhuǎn)化為增值評價,又能為教師提供學(xué)情診斷反撥教學(xué),還能為學(xué)生提供精準(zhǔn)的定位和能力分析,幫助學(xué)生自我規(guī)劃聽說讀寫譯等微技能發(fā)展。
國務(wù)院《關(guān)于深化考試招生制度改革的實施意見》中提出“加強國家外語能力測評體系建設(shè)”。為貫徹落實這一目標(biāo),國家教育部、國家語言文字工作委員會于2018年正式發(fā)布《中國英語能力等級量表》(以下簡稱《量表》)。作為首個面向中國學(xué)習(xí)者的英語能力標(biāo)準(zhǔn)體系,《量表》以語言運用為導(dǎo)向,為語言學(xué)習(xí)者提供多級別的英語能力描述,是一套英語學(xué)習(xí)、教學(xué)與測評相統(tǒng)一的中國英語能力參照標(biāo)準(zhǔn)體系。自《量表》發(fā)布以來,相關(guān)研究日益增多,各類考試與《量表》的對接是其中一個重要的研究主題。例如,揭薇將大學(xué)英語四級口語考試與《量表》口語部分進行對接3,姜子蕓開展了江蘇省高考英語閱讀與《量表》的對接研究,王華將校本考試報告等級與《量表》進行對接,以上這些研究為實現(xiàn)考試項目與語言標(biāo)準(zhǔn)之間的對接提供了實踐參考。
一、研究設(shè)計
在高中一線教師嘗試《量表》對接合格考的研究過程中,暴露出若干問題:如對接方法短缺、經(jīng)驗不足,導(dǎo)致教師無法組建有效的考試對接團隊;大部分教師熟悉《新課標(biāo)》而不熟悉《量表》,導(dǎo)致教師不能用過程性評價的眼光看待高中英語各項語言技能的教學(xué)與評價;教師間評價素養(yǎng)的差異性降低了對接結(jié)果的信度。為此,本研究由考試機構(gòu)工作人員總體協(xié)調(diào),組織了13位年齡、任教學(xué)校、教齡、職稱和學(xué)歷各異的高中一線教師參與對接研究。選取H省X年合格考英語科目試卷閱讀部分為研究工具,參照《連接語言測試與歐洲語言共同參考框架的手冊》中的步驟,進行合格考閱讀與《量表》中《閱讀理解能力量表》的對接。旨在關(guān)注高中一線教師測評的視角與結(jié)論,探討適用于高中一線教師的考試對接方法、影響教師認(rèn)知測評的因素及改進措施,測算出達(dá)到《量表》相應(yīng)等級的最低能力考生對應(yīng)合格考閱讀部分的劃界分,從而為擴展合格考功能與價值、推進高中英語閱讀教學(xué)提供實證佐證。
(一)研究專家與工具
參與對接的研究者共有14人,由1名對接項目負(fù)責(zé)人和13位高中教師組成。項目負(fù)責(zé)人熟悉考試命題、高中英語新課標(biāo)和《量表》的內(nèi)容,從宏觀上確保了研究過程的權(quán)威性。參與對接的教師都長期從事一線教學(xué),熟悉教情、學(xué)情和課標(biāo),并有不同級別考試命題的經(jīng)驗,通過充分培訓(xùn)之后熟悉《量表》的內(nèi)容和要求,從微觀上確保了研究數(shù)據(jù)的可信度。研究使用了H省X年合格考的試卷英語閱讀試題作為對接工具,該試卷閱讀部分共45小題,總分75分。
(二)研究方法
采用改良Angoff法中的多次判斷法。根據(jù)經(jīng)驗豐富的一線教師對考生的能力及其廣泛的社會或教育環(huán)境中專業(yè)的認(rèn)知,討論最低勝任能力考生所具備的知識技能。
(三)研究問題
根據(jù)《新課標(biāo)》要求,合格考以學(xué)業(yè)質(zhì)量水平一為命題依據(jù)。13名中學(xué)教師需要對《量表》《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一及H省X年合格考的試卷英語閱讀試題進行逐一測評,回答以下問題:
1.使用Nvivo11文本分析軟件對文本語料進行
質(zhì)性分析,確定《新課標(biāo)》中學(xué)業(yè)質(zhì)量水平一與《量表》中《閱讀理解能力總表》的級別對應(yīng)關(guān)系。2.分析《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一的要求與《量表》中《閱讀理解能力總表》的級別對應(yīng)關(guān)系及原因。3.教師組測評結(jié)果的差異與其背景信息的哪些因素相關(guān)?4.組織教師使用改良Angoff法進行量化分析,測算達(dá)到《閱讀理解能力總表》三、四、五級要求的最低能力考生在合格考閱讀部分的得分分別是多少?
二、研究過程
(一)文本分析
使用Nvivo11軟件對《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一中關(guān)于閱讀理解能力要求的部分(表1)進行統(tǒng)計分析,其結(jié)果如表2所示。
從表2可以看出,《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一的要求聚焦于以下三點。
1.獲取信息方式:讀和看為主要方式,其次是借助多模態(tài)語篇。
2.行為目標(biāo):理解、區(qū)分、推斷、比較、分析、概括、識別、辨識。其中高頻詞為“識別”與“分析”,說明這兩者是行為目標(biāo)中的重點。
3.閱讀理解涉及的內(nèi)容:分為事實性信息、語篇寫作特征、傳遞價值觀等。具體包含詞匯:觀點、大意、價值觀、結(jié)構(gòu)、類型、情感態(tài)度、社會文化現(xiàn)象、文化背景、文體特征、銜接手段、信息、意義、語法結(jié)構(gòu)、主要詞匯、主要事實,其中“觀點”為高頻詞。
通過對《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一進行文本分析,再與《量表》中的《閱讀理解能力總表》一至九級的要求進行比對,可以得出以下結(jié)論:第一,《閱讀理解能力總表》一級、二級獲取信息的方式主要是借助圖片,低于水平一中的獲取信息方式要求;第二,《閱讀理解能力總表》六級至七級涉及“專業(yè)材料”,行為目標(biāo)要求更高,包括“評析\"“鑒賞”“評價\"等級別,根據(jù)布魯姆認(rèn)知目標(biāo)分類,屬于高階思維能力要求;第三,對應(yīng)《閱讀理解能力總表》三級至五級更合適,涉及對“日常生活語篇”的閱讀,需要學(xué)生能理解、區(qū)分、推斷、比較、分析、概括、識別、辨識即可。
(二)專家測評
1.對接框架
《連接語言測試與歐洲語言共同參考框架的手冊》修訂版規(guī)范了對接研究的步驟,包括四個階段:框架熟悉、試題檢視、標(biāo)準(zhǔn)設(shè)定和效度驗證(CouncilofEurope2009)[8]。本研究開展了前三個階段。
第一階段是框架熟悉。13位中學(xué)教師整體掌握并高度熟悉《量表》中《閱讀理解能力總表》和《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一閱讀部分的質(zhì)量描述和能力要求,了解《量表》閱讀能力各等級的區(qū)別及顯著特征,開展描述語的分類、排序、討論等活動。在這一階段,教師組按照“教師組測評—對接項目負(fù)責(zé)人組織全組進行充分討論——教師組再次測評\"的步驟進行兩次測評,確定《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一和《量表》中《閱讀理解能力總表》級別的基本對應(yīng)關(guān)系。
第二階段是試題檢視。教師組需要完成對X年H省合格考的45道閱讀試題進行宏觀和微觀理解、分析。首先,對接項目負(fù)責(zé)人為教師組介紹合格考的考試內(nèi)容和目標(biāo)。然后,教師組完成X年H省合格考的試卷閱讀題目,模擬并體會學(xué)生答題的認(rèn)知過程。隨后,教師組著手分析試卷閱讀語篇的內(nèi)容、題目設(shè)置和考查范圍,與《新課標(biāo)》學(xué)業(yè)質(zhì)量水平及《量表》各等級描述語的匹配程度。
第三階段是標(biāo)準(zhǔn)設(shè)定。教師組研判達(dá)到《閱讀理解能力總表》三、四、五級要求的最低能力考生在合格考閱讀部分的得分。采用改良Angoff法,分別評估達(dá)到《閱讀理解能力總表》三、四、五級的最低能力考生分別答對閱讀部分每道試題的概率,統(tǒng)計教師組多輪測評數(shù)據(jù),分析達(dá)到《量表》三、四、五級的考生在合格考中的劃界分。
2.專家測評結(jié)果及分析
(1)《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一和《量表》分析結(jié)果
經(jīng)過多輪測評,教師組形成統(tǒng)一結(jié)論:在考查學(xué)生閱讀能力方面,《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一主要對應(yīng)《閱讀理解能力總表》四級,兼容三級,涉及五級的少部分要求,這與文本分析階段的分析結(jié)果一致。
(2)相關(guān)性分析
使用SPSS軟件分析教師組的年齡、任教學(xué)校批次(一批次:省級示范高中,二批次:市級示范高,三批次:一般普通高中)教齡、職稱和學(xué)歷與教師認(rèn)知的顯著性關(guān)系,定位影響教師認(rèn)知差異的因素。
通過匯總卡方檢驗數(shù)據(jù),繪制認(rèn)知測評中教師的年齡、任教學(xué)校批次、教齡、職稱和學(xué)歷差異性柱狀圖(圖1),橫軸為測評各因素,縱軸為費希爾精確檢驗漸進顯著性(雙側(cè))值P。實驗數(shù)據(jù)表明,只有第一輪的教師任教學(xué)校批次的P小于0.05,差異顯著,其他因素差異不顯著。為進一步了解教師任教學(xué)校批次與教師認(rèn)知顯著性的關(guān)系,分析兩輪測評中的影響因素為任教批次的交叉表和卡方檢驗數(shù)據(jù)。
分析13位教師的任教學(xué)校批次與兩輪測評觀點交叉表(表3),可以看出教師的任教學(xué)校批次分布均勻合理,且經(jīng)過一輪研討和交流后,觀點呈現(xiàn)趨同性。在前兩輪測評中,9位教師未改變觀點;分別任教于二批和三批次高中學(xué)校的兩位教師在第二輪測評中,改變觀點,認(rèn)為水平一與《量標(biāo)》四級更為匹配;分別任教于一批和三批次高中學(xué)校教師改變第一輪觀點,認(rèn)為水平一的要求介于《量標(biāo)》的四級到五級之間。
卡方檢驗結(jié)果(表4)顯示:在第一輪測評中,教師任教的學(xué)校批次與認(rèn)知測評的費希爾精確檢驗漸進顯著性(雙側(cè))值P小于0.05,差異顯著,兩者有關(guān);
經(jīng)過專家集體討論后,在第二輪測評中,教師任教的批次與認(rèn)知測評的P大于0.05,差異不顯著。
實驗數(shù)據(jù)表明,在所有因素中,教師任教學(xué)校批次顯著影響教師對接《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一和《閱讀理解能力總表》等級的認(rèn)知測評,但是教師間的交流和碰撞有助于縮小學(xué)校批次對教師認(rèn)知測評的影響。
(3)教師測評關(guān)鍵詞分析結(jié)果
在高中英語閱讀研究中,教學(xué)與考試密不可分。本研究中的教師是有不同一線教學(xué)經(jīng)驗的高中教師,在對接《量表》《新課標(biāo)》和合格考時,所關(guān)注的重點有異同。在SPSS分析的基礎(chǔ)上,使用微詞云軟件,導(dǎo)人兩輪測評專家觀點的關(guān)鍵詞,得到詞云(圖2)和詞頻(圖3)。
如圖2所示,在兩輪測評中,教師對閱讀教學(xué)與考試在《量表》和《新課標(biāo)》中的關(guān)鍵詞關(guān)注點集中在三個方面:一是語篇所傳達(dá)的文化、觀點、事實和情感等文化內(nèi)涵;二是語篇結(jié)構(gòu)、類型、信息、手段、背景等內(nèi)容和結(jié)構(gòu);三是語篇語言、態(tài)度、要義、主旨、句子、關(guān)系等寫作手法。這三個方面與《量表》閱讀部分的閱讀理解能力和閱讀理解策略高度契合。
對應(yīng)領(lǐng)會文章戈材料 結(jié)構(gòu)手段掌握 簡單接景
如圖3所示,在兩輪測評中,頻率最高的10個關(guān)鍵詞為文化、結(jié)構(gòu)、觀點、類型、事實、信息、情感、內(nèi)涵、區(qū)分和手段。這10個關(guān)鍵詞可分為兩類,即關(guān)注重點和討論熱點。教師關(guān)注重點為觀點、事實、信息、區(qū)分和手段這5個關(guān)鍵詞,他們認(rèn)為這5個關(guān)鍵詞是《量表》三、四、五級之間的區(qū)分要點。教師討論熱點是文化、內(nèi)涵、類型、結(jié)構(gòu)和情感這5個關(guān)鍵詞。
對于在語篇文化功能上,與《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一相對應(yīng)的是《閱讀理解能力總表》四級的\"文化背景”還是五級的“文化內(nèi)涵\"這個問題,6號教師認(rèn)為涉及文化背景,并由一輪觀點的三至四級更改為四級;11號教師認(rèn)定為文化內(nèi)涵,并由第一輪觀點的四級更改為四級至五級。在語篇類型上,9號教師認(rèn)定為日常語篇,并由第一輪觀點的五級更改為四至五級。在語篇結(jié)構(gòu)和情感上,13號教師兩輪都以此為主要觀點,堅持認(rèn)為水平一閱讀對應(yīng)《量表》四級。
實驗數(shù)據(jù)表明,教師們均有極強的專業(yè)素養(yǎng),能獨立作出科學(xué)研判,給出的依據(jù)有理有據(jù),且在兩輪測評和討論中,能批判性地吸收觀點,并通過討論形成一致意見,為下一步改良Angoff法研究奠定了堅實可靠的基礎(chǔ)。
(4)改良Angoff法研究結(jié)果與效度
首先,對接負(fù)責(zé)人組織教師組對3篇培訓(xùn)卷進行了評判和討論,形成一致意見,建立基準(zhǔn)線;第二,進入第一輪評測,由13位教師逐一對X年H省合格考的7個篇章及45道閱讀題進行獨立判斷,給出每道試題達(dá)到《量表》三、四、五級最低能力的考生分別答對該題概率的百分比;第三,第一輪測評結(jié)束后,對接項目負(fù)責(zé)人組織每位教師按照題序逐一進行充分的討論;第四,教師組參考考試數(shù)據(jù)和小組討論內(nèi)容,再進行第二輪獨立測評。
根據(jù)圖4可以得出以下結(jié)論。第一,考試數(shù)據(jù)在教師所給的三、四、五級考生的得分率區(qū)間內(nèi)波動,以四級為主,涉及三級和五級;這與前一階段文本分析和框架熟悉的結(jié)論吻合,即在考查學(xué)生閱讀能力方面,《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一總體對應(yīng)《量表》四級,兼容三級,涉及五級。第二,兩輪測評與實際考試數(shù)據(jù)的波動基本一致,三、四、五級考生得分率波峰為第1題和第2題,波谷為28題和30題,專家認(rèn)為1、2題最簡單,28和30題最難;實際考試中1、2題的得分率最高,為1.98和1.96,28題和30題得分率最低,為0.61和 0.66 。以上進一步驗證了專家對題目的難度把握精準(zhǔn),研究數(shù)據(jù)可信。
匯總計算13位教師二輪測評的數(shù)據(jù),得出三、四、五級考生各小題得分率判定值的平均值。因各小題所考查的閱讀能力維度和試題難度的不同,三、四、五級考生得分率差距各異,其中1、2題差距最小,28、
30題差距最大。將該得分率平均值與各小題分值相乘,得到達(dá)到《量表》中《閱讀理解能力總表》三至五級的最低能力考生對應(yīng)合格考閱讀部分每道題的得分,分類相加后,得出三、四、五級考生的劃界分(表5)。
三、研究結(jié)論
以《新課標(biāo)》作為高中一線教師開展考試與《量表》對接的媒介,增加教師跨批次的校際交流和碰撞,有助于提升教師考試對接的信度和效度。在英語學(xué)習(xí)者閱讀能力考查中,《新課標(biāo)》學(xué)業(yè)質(zhì)量水平一總體對應(yīng)《量表》《閱讀理解能力總表》四級,兼容三級,涉及五級。教師專家組運用改良Angoff法進行測評,達(dá)到《量表》三至五級的最低能力考生對應(yīng)X年H省合格考閱讀部分的劃界分為:三級65.62,四級69.94,五級73.02。
本研究對于高中英語閱讀教學(xué)與考試具有重要意義。一是從共時的角度,高中教師的評價素養(yǎng)得到有效提升,能夠以評價的視角看待日常教學(xué)和診斷性測評,判斷學(xué)生當(dāng)前的閱讀能力和素養(yǎng)水平;二是從歷時的角度,教師能以發(fā)展的眼光看待閱讀教學(xué),使用本研究中的劃界分,判斷每個學(xué)生當(dāng)前在《量表》視域下所處的閱讀能力水平等級,并根據(jù)《量表》的發(fā)展級別,和學(xué)生一起,“一生一策”,共同繪制每位學(xué)生的閱讀能力雷達(dá)圖和提升路徑。
本課題組后續(xù)還將繼續(xù)開展合格考對接的效度研究,進一步驗證本實證研究結(jié)果的有效性,為推動增值評價視域下合格考的高質(zhì)量發(fā)展打下基礎(chǔ)。
參考文獻:
[1]丁秀濤.關(guān)于高中學(xué)業(yè)水平考試“合格考\"定位與功能的思考[J].中國考試,2020,(6):74-78.
[2]劉建達(dá).我國英語能力等級量表研制的基本思路[J].中國考試,2015,(1):7-11+15.
[3]揭薇.英語口語考試與中國英語能力等級量表對接研究:以CET-SET4為例[J].外語界,2019,(1):71-80.
[4]姜子蕓.高考英語閱讀與中國英語能力等級量表對接的實證研究:以江蘇省高考英語閱讀為例[J].遼寧科技學(xué)院學(xué)報,2019,21(1):73-75.
[5]王華.校本英語水平考試與《中國英語能力等級量表》的對接研究:以“上海交通大學(xué)英語水平考試\"為例[J].外語界,2020,(5):72-79.
[6]何懼,何佳,安滔,等.Angoff法及其衍生方法在資格考試合格線設(shè)定中的比較研究[J].中國考試(研究版),2007,(6):23-26.
[7]中華人民共和國教育部.普通高中英語課程標(biāo)準(zhǔn)(2017年版2020年修訂)[M].北京:人民教育出版社,2020.
[8]何蓮珍,羅藍(lán).語言考試與語言能力量表對接研究:路徑與方法[J].外語教學(xué),2020,(1):29-33.
Research on Aligning English Reading Ability in High School Academic Achievement English Test(HSAAET)to China's Standards of English Language Ability(CSE)from High School Teachers’Perspective:Taking H Province as an Example
Sun Meng' Chen Si2 Zhou Jia3 1Hubei Educational Examinations Authority,Wuhan,Hubei,430077 2Hubei ProvinceWuhanHigh School,Wuhan,Hubei,430060 3WuhanEducational ScienceResearchInstitute,Wuhan,Hubei,430012
Abstract:This study focuses on the empirical research process of aligning evaluation from the perspective of highschool teachers,specifically thealignmentof thereading partof the High Schol Academic Achievement English Test(HSAAET)with the corresponding levels of China’s Standardsof English Language Ability(CSE). NVIVO11 software isused to analyze thediscourse texts andevaluation datacolected from 13 high school teachersduring the aligning process.SPSS software is employed to analyze the significant relationships between thebackground informationof thisgroupof highschol teachersand theiraligning evaluationdata,inorder to identifythe parameters thatafect the cognitive differenes among teachers.Modified Angoff method isused to calculate the boundary scoresof the reading part of the academic proficiency test corresponding to the minimum ability candidates rated as levels three to five of CSE.
KeyWords:High School Teachers’Perspective,English Reading Ability in High School Academic Achievement English Test(HSAAET),China's Standards of English Language Ability(CSE),Aligning
(責(zé)任編輯:吳茫)