劉蓮英 于運花 鄧建平 郭隆?!≮w靜
摘? 要? 高校課程建設(shè)質(zhì)量決定人才培養(yǎng)質(zhì)量,課程測試為評價教學(xué)效果、改進教學(xué)方法、提高課程建設(shè)質(zhì)量提供依據(jù)和方向。材料導(dǎo)論雙語課程通過對期末試卷質(zhì)量和成績的分析,建立試卷評價體系,促進深度教學(xué)反思,形成教學(xué)—考試分析的閉環(huán)教學(xué)流程,為持續(xù)提高課程建設(shè)質(zhì)量提供建議、措施和保障。
關(guān)鍵詞? 材料導(dǎo)論;雙語教學(xué);試卷評價;閉環(huán)教學(xué)
中圖分類號:G642? ? 文獻標(biāo)識碼:B
文章編號:1671-489X(2024)08-0052-06
0? 引言
2019年,教育部發(fā)布了《教育部關(guān)于深化本科教育教學(xué)改革全面提高人才培養(yǎng)質(zhì)量的意見》和《教育部關(guān)于一流本科課程建設(shè)的實施意見》,提出要全面提高課程建設(shè)質(zhì)量,強調(diào)要實施科學(xué)的課程評價,嚴(yán)格評估課程質(zhì)量。近年來,高校廣泛開展了教學(xué)改革,加強教學(xué)各環(huán)節(jié)的質(zhì)量建設(shè)。其中,科學(xué)合理的教學(xué)評價體系可以有效促進教學(xué)質(zhì)量的提高。教學(xué)過程中的各種測試可評價教學(xué)效果,為改進教學(xué)方法、提高教育教學(xué)質(zhì)量提供依據(jù)和方向[1-4]。根據(jù)測試評估教學(xué)效果,需要保證測試試卷的質(zhì)量并對測試成績進行科學(xué)、規(guī)范和全面的評價[5-6]。由此,才可全面、客觀地了解學(xué)生的知識、能力和素質(zhì)狀況,找出教學(xué)過程中存在的不足,提出持續(xù)改進的方法和措施,不斷提升課程教學(xué)質(zhì)量。
材料導(dǎo)論雙語課程是北京化工大學(xué)材料科學(xué)與工程學(xué)院面向材料專業(yè)大三學(xué)生開設(shè)的必修基礎(chǔ)課,課程目標(biāo)是通過中英雙語講授,使學(xué)生掌握有關(guān)金屬、陶瓷、聚合物、復(fù)合材料及生物功能材料的專業(yè)和英語基礎(chǔ)知識,能應(yīng)用所學(xué)知識分析材料的制備、結(jié)構(gòu)、性能、應(yīng)用關(guān)系并了解材料前沿發(fā)展動態(tài),養(yǎng)成高度社會責(zé)任感、寬廣視野和科學(xué)素養(yǎng)。為此,課程依據(jù)“價值引領(lǐng)、素質(zhì)養(yǎng)成、能力培養(yǎng)與知識傳授”四位一體的教育教學(xué)理念,持續(xù)進行教學(xué)內(nèi)容和方法的改革,開展基于中國大學(xué)MOOC和北化在線平臺的線上、線下混合式教學(xué),拓展結(jié)合材料學(xué)科前沿的文獻查閱、英語演講比賽等實踐教學(xué)活動,采取“平時50%+期末考試50%”的課程評價方式,初步建立過程評價與結(jié)果評價有機結(jié)合的課程評價體系。針對期末考試試卷,課程團隊前期已建立了基于Excel表格的統(tǒng)一規(guī)范的試卷正確率統(tǒng)計模板,由教師和助教統(tǒng)計本教學(xué)班試卷中所有題目得分,根據(jù)得分情況進行試卷分析,獲得學(xué)生答題情況分布、試卷質(zhì)量與難度的基本認(rèn)知。然而,鑒于Excel統(tǒng)計計算的復(fù)雜性[7],試卷分析沒能全面評價試卷質(zhì)量(沒有獲得試卷的區(qū)分度、信度和效度等指標(biāo)),也未建立規(guī)范、全面的試卷評價體系和相關(guān)教學(xué)流程。
為此,本文在已有課程建設(shè)的基礎(chǔ)上,采用Excel表格和專用IBM SPSS軟件統(tǒng)計課程期末考試試卷,分析試卷質(zhì)量和學(xué)生成績,建立學(xué)生期末考試成績與平時學(xué)習(xí)過程表現(xiàn)之間的聯(lián)系,以期綜合分析、深度挖掘測試信息,客觀反映試卷質(zhì)量和學(xué)生水平,建立規(guī)范、統(tǒng)一、普適性強的試卷評價體系,形成教學(xué)過程全要素和考試分析全覆蓋的閉環(huán)教學(xué)流程。通過全覆蓋考試分析、深度教學(xué)反思,指導(dǎo)教學(xué)設(shè)計,推動教學(xué)持續(xù)改進,有效提高教學(xué)改革效果和教育教學(xué)質(zhì)量,分享教育教學(xué)成果應(yīng)用的有益經(jīng)驗。
1? 內(nèi)容和方法
1.1? 素材與數(shù)據(jù)
樣本數(shù)據(jù)包括參加2022—2023年度課程期末考試的2020級功能材料(功材)專業(yè)2個班、材料科學(xué)與工程(材料)專業(yè)4個班、高分子材料與工程(高材)專業(yè)10個班的學(xué)生試卷,共372份。本課程期末考試為全英文,閉卷考試。規(guī)范化閱卷按照評卷標(biāo)準(zhǔn)和標(biāo)準(zhǔn)答案進行流水集體閱卷、雙人復(fù)核的形式進行。
試題包括I材料分類(I分類,5分)、II縮寫—全拼—翻譯(II縮寫,10分)、III概念匹配(III概念,10分)、IV選擇(IV單選和判斷,20分)、V填空(15分)、VI簡答(40分)。
每份學(xué)生試卷答案按班級錄入規(guī)范的試卷正確率統(tǒng)計Excel表格,統(tǒng)計每小題、大題、試卷總體的得分及各題滿分值,形成Excel學(xué)生成績表。
1.2? 試卷分析
試卷分析內(nèi)容包括試卷質(zhì)量分析和學(xué)生成績分析,試卷質(zhì)量分析可評價所出考試題目的合理性和全面性,以便客觀反映教學(xué)質(zhì)量、促進試題命題和教學(xué)方法的改進。
1.2.1? 試卷質(zhì)量分析
分析內(nèi)容主要是對試卷“四度”的分析[1-2]。
1)難度:試卷或試題的難易程度,即學(xué)生的試卷得分率、試題與學(xué)生所學(xué)知識及所具備能力水平的適合程度。對于學(xué)生而言,高得分率題目是較為容易的題目,難度值P較大,反之亦然。
2)區(qū)分度:反映試題對不同學(xué)生知識和能力水平的鑒定、區(qū)分程度。對所學(xué)知識理解掌握程度好,能綜合、靈活運用知識的學(xué)生能較好完成難度值P較小的題目。
3)信度:說明試卷能否真實反映學(xué)生水平的一致性、穩(wěn)定性及可靠性的指標(biāo)。
4)效度:反映試卷題目達到測試目的的程度,即考試結(jié)果與目標(biāo)的符合程度。試卷效度包括內(nèi)容效度、結(jié)構(gòu)效度和效標(biāo)關(guān)聯(lián)效度。內(nèi)容效度反映試卷題目內(nèi)容與教學(xué)大綱要求之間的一致性程度;結(jié)構(gòu)效度反映測試結(jié)果的有效性與正確性,一般采用定性方法分析試卷的內(nèi)容效度和結(jié)構(gòu)效度;效標(biāo)關(guān)聯(lián)效度為測試結(jié)果與效標(biāo)的相關(guān)系數(shù)。
分析方法如下。
1)難度:采用Excel學(xué)生成績表中的得分率表示難度P:p=x-/w,X為試卷或試題平均得分,W為試卷或試題滿分;根據(jù)P值評定難度等級,P≥0.7為容易,P在0.4(不含)~0.7(不含)為難度適中,P≤0.4為較難。
2)區(qū)分度:采用IBM SPSS 29.0.0.0(241)統(tǒng)計軟件,導(dǎo)入Excel學(xué)生成績表中學(xué)生各題得分及總分,計算各題得分與總分間的積差相關(guān)系
數(shù)[8],以此作為試題的區(qū)分度。對于客觀題(I分類,IV選擇,V填空),計算各題與總分間的斯皮爾曼相關(guān)系數(shù)Rho;對于主觀題(II縮寫,III概念,VI簡答),計算各題與總分間的皮爾遜相關(guān)系數(shù)Rho,得到每題區(qū)分度;當(dāng)相關(guān)系數(shù)>0.4時,認(rèn)為試題具有較好區(qū)分度,難度適中試題具有較高區(qū)分度。
3)信度:利用IBM SPSS軟件,計算試題與總分的克隆巴赫Alpha系數(shù)[9],以此表示信度;Alpha≥0.9,說明信度非常好,學(xué)生分?jǐn)?shù)與真實水平間的差異較?。?.6≤Alpha<0.9,具有相當(dāng)信度;Alpha<0.6,信度不足。
4)效度:采用定性方法分析試卷的內(nèi)容效度;以學(xué)生的平時成績作為效標(biāo),以試卷成績和平時成績之間的相關(guān)系數(shù)表示效標(biāo)關(guān)聯(lián)效度[9-10],平時成績由課堂表現(xiàn)(10%)+MOOC學(xué)習(xí)(10%)+演講展示(15%)+平時3~8次測驗(15%)構(gòu)成。利用IBM SPSS軟件,計算試卷成績和平時成績之間的皮爾遜相關(guān)系數(shù),即效度系數(shù)E,E在0.7~1.0,效度很高;E在0.4~0.7(不含),效度較高;E<0.4,效度不足。
1.2.2? 學(xué)生成績分析
學(xué)生成績分析內(nèi)容包括:學(xué)生成績的描述性分析和各專業(yè)學(xué)生成績的差異性分析。
分析方法如下。
1)描述性分析:導(dǎo)入Excel學(xué)生成績表,利用IBM SPSS軟件的描述和頻次分析,統(tǒng)計學(xué)生成績的最高分、最低分、平均值、方差以及頻數(shù)分布等信息。
2)差異性分析:利用IBM SPSS軟件的比較平均值、單因素ANOVA分析分別對功材、材料、高材三個專業(yè)的學(xué)生試卷總分進行方差分析:檢驗方差齊性[10],在方差齊性的前提下對總分進行單因素方差分析和3個專業(yè)成績的差異性檢驗,即多重比較,分析三專業(yè)學(xué)生成績之間是否存在顯著性差異。
2? 結(jié)果與分析
2.1? 試卷質(zhì)量分析
2.1.1? 試卷難度分析
表1總結(jié)了試卷各大題的難度以及各大題中3種不同難度試題,即很容易(P≥0.7)、難度適中(0.4<P<0.7)、難度較大(P≤0.4)的小題數(shù)量和得分情況。從表1可以看出:大題I~
VI的難度P值從0.94逐漸提高到0.52,考試過程中由簡單題逐漸過渡到有一定難度的題,學(xué)生容易適應(yīng)考試而正常發(fā)揮;試卷中容易題占39分,難度適中題占49.5分,較難題占11.5分(主要分布于VI簡答),試卷總體難度P=0.65,說明試卷難易程度適中。
2.1.2? 試卷區(qū)分度分析
表1給出試卷各大題的區(qū)分度—各題與總分間的相關(guān)系數(shù)Rho,II~VI題的Rho在0.690~0.944區(qū)間,大于0.4,顯示具有良好以上的區(qū)分度,尤其是V填空、VI簡答,綜合性較強,能很好地區(qū)分不同層次的學(xué)生,考查學(xué)生學(xué)習(xí)水平和教學(xué)效果的差異。I分類由于難度較小,區(qū)分度不大,今后可以在專業(yè)英語名稱及材料組成方面調(diào)整難度和改進區(qū)分度。
2.1.3? 試卷信度分析
通過計算各大題與試卷總分的克隆巴赫Alpha信度系數(shù)(表2),得到信度為0.764,在0.6~0.9的范圍內(nèi),說明試卷具有較好的信度,可以依據(jù)試卷成績較穩(wěn)定、可靠地檢驗學(xué)生的學(xué)習(xí)效果。刪除I-分類題項后,Alpha信度系數(shù)提高(>0.764),而刪除II~VI題后,Alpha信度系數(shù)降低(<0.764),說明刪除I題可提高試卷的信度,而刪除II~VI題則會降低試卷信度。分析原因主要是:I題的難度低,區(qū)分度不高,無法分出優(yōu)劣;而II~VI題的難度在較容易和適中之間,區(qū)分度較好,可信度高,刪除后都會降低可信度。
2.1.4? 試卷效度分析
1)內(nèi)容與結(jié)構(gòu)效度。課程章節(jié)內(nèi)容在試卷各試題中的分布、占比和考查目的見表3。試卷內(nèi)容包含各章節(jié)內(nèi)容,I分類、II縮寫、III概念、V填空題主要考查有關(guān)金屬、陶瓷、聚合物、復(fù)合材料及生物功能材料的分類、化學(xué)鍵及結(jié)晶等結(jié)構(gòu)、性能、加工及應(yīng)用的基本概念和基礎(chǔ)知識,同時考查相關(guān)材料的專業(yè)英語知識及中英文術(shù)語的理解;IV選擇和VI簡答題中包含一些基礎(chǔ)知識的描述和判斷,更多是對材料制備—結(jié)構(gòu)—性能—應(yīng)用方面的綜合思考、分析、比較和辨析,考查對基礎(chǔ)知識的靈活應(yīng)用、融會貫通能力。如:簡答題中,結(jié)合疫情防控期間常用的口罩、課程M1章材料選擇的依據(jù)和理念以及M8章生物材料的性能和應(yīng)用要求,出了一道開放思考題——選擇設(shè)計新型口罩用材料需要考慮的因素,考查學(xué)生綜合應(yīng)用知識、分析和解決問題的能力,同時考查學(xué)生是否具備一定的環(huán)保、健康、審美和科學(xué)思維等素養(yǎng)。
試題內(nèi)容經(jīng)教學(xué)團隊3位命題教師反復(fù)研討、綜合考量,確定試卷命題涵蓋了本課程教學(xué)大綱中課程目標(biāo)和畢業(yè)要求指標(biāo)點要求掌握的重點內(nèi)容;教學(xué)團隊負(fù)責(zé)人試做、審核試卷;試卷的嚴(yán)格命題和審核確保了測試結(jié)果的有效性和正確性,也確保了知識、能力和素養(yǎng)的課程培養(yǎng)目標(biāo)的達成。
2)效標(biāo)關(guān)聯(lián)效度。計算所得期末試卷成績和平時成績之間的皮爾遜相關(guān)系數(shù)匯總于表2,得到0.01顯著性水平下的效度系數(shù)E=0.545,在0.4~0.7范圍內(nèi),說明本次期末試卷具有較高效度,能夠考查出學(xué)生對所要求知識的掌握程度,同時也說明平時成績和期末成績的相關(guān)性顯著,體現(xiàn)了課程堅持過程性評價的重要性和必要性。主講教師可通過學(xué)生平時成績的監(jiān)測,及時督促學(xué)生的日常學(xué)習(xí),及時答疑解惑幫助學(xué)生學(xué)懂弄通知識難點,保證較好的期末成績、保證較好的教學(xué)效果。
2.2? 學(xué)生成績分析
2.2.1? 試卷成績的描述性分析
如圖1所示,372位學(xué)生的試卷平均成績?yōu)?4.92,總分的頻數(shù)分布直方圖大體呈正態(tài)分布,說明試卷難度適中、區(qū)分度較好、總體質(zhì)量較高。但總分最大值和最小值間的差值(89.5)較大,總分標(biāo)準(zhǔn)差(17.796)>10,說明學(xué)生成績差異較大;偏度(-0.240)為一較小負(fù)值,低分段—不及格占比(38.7%)偏高,說明考試具有一定難度,低分段、成績小于平均分值的人數(shù)較多。
2.2.2? 學(xué)生成績的差異性分析
統(tǒng)計不同專業(yè)、班級的總成績平均分(圖2),對功材、材料、高材專業(yè)的總分進行方差分析(表4),方差齊性檢驗的顯著性>0.05,說明各專業(yè)總分方差無統(tǒng)計學(xué)差異,方差齊性;單因素ANOVA分析的組間顯著性<0.05,說明各專業(yè)間的成績存在顯著差異性,多重比較分析表明,功材1和高材3間的顯著性>0.05,這兩專業(yè)間的總分沒有顯著性差異,而這兩專業(yè)與材料2專業(yè)間的顯著性<0.05,總分差異明顯。
3? 教學(xué)反思和改進建議
試卷分析反映出的主要問題及原因分析、課程持續(xù)改進建議和措施見表5。試卷分析表明,大多數(shù)學(xué)生對材料基本概念、專業(yè)基礎(chǔ)知識、專業(yè)英語詞匯和表達等掌握較好,但綜合分析、思考、理解材料制備—結(jié)構(gòu)—性能—應(yīng)用內(nèi)在關(guān)系的能力不足,其背后深層次的原因是教學(xué)過程中學(xué)生參與學(xué)習(xí)的程度不夠,學(xué)習(xí)環(huán)節(jié)中深入思考、體味、歸納和提升的過程不充分。面對有限學(xué)時和既定教學(xué)內(nèi)容,要提高學(xué)生的能力培養(yǎng)力度,需要在教學(xué)設(shè)計上優(yōu)化教學(xué)內(nèi)容和改進教學(xué)方法。
在課程教學(xué)持續(xù)改進方面,建議針對章節(jié)內(nèi)容考查情況,通過教學(xué)團隊集體研討,進一步修訂教學(xué)大綱、優(yōu)化教學(xué)計劃和凝練精講內(nèi)容,突出章節(jié)重難知識點及相關(guān)邏輯關(guān)系,明確教師講授知識點的深度、學(xué)生須掌握知識點的程度和目標(biāo);教學(xué)方法上,建議在教學(xué)過程中,對重要知識點、能力型、得分率低的考題內(nèi)容,設(shè)計有效的教學(xué)手段,如合理有效利用MOOC和在線平臺等線上教學(xué)資源,安排課前對知識型內(nèi)容進行線上自主學(xué)習(xí),課堂教學(xué)針對重點、能力型內(nèi)容采用討論、思考和練習(xí)等參與式學(xué)習(xí)方式展開,幫助學(xué)生實現(xiàn)知識的內(nèi)化理解,提高其邏輯思維、獨立思考和靈活應(yīng)用知識的能力。
在應(yīng)對雙語教學(xué)難點方面,為提高學(xué)生的專業(yè)英語水平,降低雙語教學(xué)的固有難度,需要創(chuàng)建和諧、互助的教學(xué)氛圍,幫助學(xué)生克服雙語學(xué)習(xí)的畏難心理,提高學(xué)習(xí)興趣;此外,從加強學(xué)生能力培養(yǎng)的角度考慮,鼓勵學(xué)生課前線上自主學(xué)習(xí)專業(yè)英語和相關(guān)知識,課堂教師根據(jù)教學(xué)內(nèi)容的難易程度,隨時調(diào)整英語授課語言占比,加強專業(yè)英語詞匯構(gòu)詞特點、專業(yè)術(shù)語、專業(yè)英語表達的分析和總結(jié),循序漸進,讓學(xué)生適應(yīng)雙語教學(xué)、學(xué)懂相關(guān)內(nèi)容,提高學(xué)習(xí)興趣;課中、課后引導(dǎo)學(xué)生閱讀、討論有關(guān)先進材料的文獻,提高專業(yè)英語閱讀能力。
在個性化教與學(xué)方面,可利用MOOC課前學(xué)習(xí)、文獻閱讀等方式,發(fā)揮學(xué)生個性,促進自主學(xué)習(xí);利用雨課堂前測和隨堂測等方式,及時了解學(xué)情,加強平時教學(xué)情況的分析和調(diào)整,督促不同層次學(xué)生的平時學(xué)習(xí),尤其關(guān)注高分、低分學(xué)生的個性化學(xué)習(xí)訴求;增加教師間的切磋交流、研討,互相取長補短,提高教學(xué)技能和水平。
深度試卷分析使課程主講教師切實體會到學(xué)期考試后教學(xué)反思的重要性,為此,教學(xué)團隊通過集體研討、結(jié)合班級教學(xué)和考試分析,建立了規(guī)范的閉環(huán)教學(xué)流程(圖3),包括教學(xué)研討、教學(xué)設(shè)計、教學(xué)過程和監(jiān)測、考試和分析,以及改進措施和方案等,通過長年規(guī)范的試卷分析和反思,持續(xù)改進課程教學(xué),相信能夠逐年提高課程教學(xué)質(zhì)量,為培養(yǎng)具有家國情懷、社會責(zé)任感、科學(xué)素養(yǎng)和跨文化交流能力的高質(zhì)量創(chuàng)新型人才作出貢獻。
4? 結(jié)束語
教學(xué)是一種教師與學(xué)生共同參與、相互奔赴的雙邊活動。實現(xiàn)學(xué)生的良好學(xué)習(xí)效果是教學(xué)追求的終極目的。建立科學(xué)、規(guī)范、全面的試卷評價體系和閉環(huán)教學(xué)流程,可幫助教師全面了解學(xué)生的學(xué)習(xí)效果,有的放矢地調(diào)整教改方向,有效促進教師改進教學(xué)方法,激發(fā)和調(diào)控學(xué)生的學(xué)習(xí)行為,持續(xù)提升課程教學(xué)質(zhì)量。
5? 參考文獻
[1] 司鳳山,王晶.研究型教學(xué)中試卷質(zhì)量評價研究[J].黑河學(xué)院學(xué)報,2023,14(1):84-85,107.
[2] 田宏.基于大學(xué)數(shù)學(xué)教學(xué)改革的試卷分析評價體系的建立與實踐[J].中國教育技術(shù)裝備,2019(15):24-26,33.
[3] 熊健,劉向君,諶麗,等.基于試卷分析結(jié)果的《巖石物理學(xué)基礎(chǔ)》課程教學(xué)思考[J].教育現(xiàn)代化,2020(24):
148-150.
[4] 李亞娟.材料物理專業(yè)雙語教學(xué)初探:“材料工程基礎(chǔ)”雙語課程現(xiàn)狀分析及改革思路[J].教育教學(xué)論壇,
2020(29):200-203.
[5] 羅先欽,王剛,喻錄容,等.“化工原理”考試試卷分析與評價[J].教育教學(xué)論壇,2020(49):134-136.
[6] 吳則琪,邵琳,宋懷濤,等.基于試卷分析的本科微課教學(xué)效果研究[J].中國教育技術(shù)裝備,2020(23):67-68,74.
[7] 張蕓,武斌,楊陽.基于Excel的試卷質(zhì)量深度分析平臺的實現(xiàn)[J].成都中醫(yī)藥大學(xué)學(xué)報(教育科學(xué)版),
2019(2):23-25.
[8] 石佳燦.基于SPSS的初中科學(xué)試卷質(zhì)量與成績定量分析[J].教育觀察,2019(33):9-12.
[9] 施俊,楊勇.基于統(tǒng)計軟件SPSS的試卷質(zhì)量分析[J].電腦知識與技術(shù),2017(17):121-123,127.
[10] 王本洋,唐松,徐正春.基于SPSS軟件的雙語試卷質(zhì)量與學(xué)生成績定量分析[J].中國林業(yè)教育,2014(1):
22-26.
*項目來源:北京化工大學(xué)2020年本科教育教學(xué)改革研究項目“《材料導(dǎo)論》(雙語)混合式教學(xué)融合課程思政一體化課程設(shè)計研究與實踐”(項目編號:2021BHDJGYB02)。
作者簡介:劉蓮英,副教授;于運花、鄧建平、郭隆海,教授;趙靜,北京化工大學(xué)材料科學(xué)與工程學(xué)院黨委書記,研究員。