摘 """""要:基于新課改背景編制中小學(xué)體育教師評價素養(yǎng)量表,實現(xiàn)中小學(xué)體育教師評價素養(yǎng)的量化評價。運用文獻資料法厘定中小學(xué)體育教師評價素養(yǎng)的基本內(nèi)涵和提出其核心要素,并據(jù)此采用專家咨詢法、數(shù)理統(tǒng)計法編制中小學(xué)體育教師評價素養(yǎng)初始量表;選取784名中小學(xué)體育教師(樣本1)的問卷進行項目分析、探索性因子分析;選取833名中小學(xué)體育教師(樣本2)的問卷進行驗證性因子分析、信效度以及恒等性檢驗;間隔4周后,對來自樣本2的120名中小學(xué)體育教師(樣本3)的問卷進行中小學(xué)體育教師評價素養(yǎng)量表信度重測。結(jié)果表明:中小學(xué)體育教師教學(xué)評價素養(yǎng)量表由評價知識、評價技能、評價態(tài)度、評價習(xí)慣、評價品格5個分量表構(gòu)成,共22個題項。二階五因子結(jié)構(gòu)模型各項擬合指標達到統(tǒng)計學(xué)意義;量表的內(nèi)部一致性系數(shù)、重測信度系數(shù)、內(nèi)容效度系數(shù)、收斂效度系數(shù)均介于標準值區(qū)間;量表具有跨性別、跨學(xué)段、跨地區(qū)的測量等值性。研究認為,中小學(xué)體育教師評價素養(yǎng)量表具有一定的科學(xué)性和可靠性,可以作為測量我國中小學(xué)體育教師評價素養(yǎng)的有效工具。
關(guān) "鍵 "詞:學(xué)校體育;中小學(xué)體育教師;評價素養(yǎng);體育與健康課程標準;量化評價
中圖分類號:G807.2;G807.3""""文獻標志碼:A """文章編號:1006-7116(2025)02-0114-09
Establishment of evaluation literacy scale for physical education teachers in primary and secondary schools and its reliability and validity test
GUO Hongliang1,"2,XU Weixin3,GUO Yongbo4,YU Yonghui5,YAO Lei2
(1.Postdoctoral Mobile Station,Beijing Sport University,Beijing 100084,China;2. School of Education,Beijing Sport University,Beijing 100084,China;3.College of Sports Science,F(xiàn)ujian Normal University,F(xiàn)uzhou 350007,China;4.School of Physical Education,Guangzhou College of Commerce,Guangzhou 510320,China;5.Department of Physical Education,Renmin University of China,Beijing 100872,China)
Abstract:"Based on the background of the new curriculum reform, the evaluation literacy scale of primary and secondary physical education teachers was developed to realize the quantitative evaluation of the evaluation literacy of primary and secondary physical education teachers. The basic connotation and core elements of the evaluation literacy of primary and secondary physical education teachers were determined by the method of literature data, and the initial scale of evaluation literacy of primary and secondary physical education teachers was prepared by Delphi expert consultation and mathematical statistics. A total of 784 physical education teachers (sample 1) were selected for project analysis and exploratory factor analysis. The confirmatory factor analysis, reliability and validity, and identity test were conducted on the questionnaires of 833 primary and secondary school physical education teachers (sample 2). After an interval of 4 weeks, 120 primary and secondary physical education teachers from sample 2 (sample 3) were re-tested for the reliability of the evaluation literacy scale of primary and secondary physical education teachers. The results showed that the evaluation literacy scale of physical education teachers in primary and secondary schools was composed of 5 sub-scales, including evaluation knowledge, evaluation skill, evaluation attitude, evaluation habit and evaluation character. The fit indexes of the second-order five-factor structure model were statistically significant, and the internal consistency coefficient, retest reliability coefficient, content validity coefficient and convergence validity coefficient of the scale were all in the range of standard values. The present scale has the measurement equivalence of cross-gender, cross-school and cross-region. The conclusion suggests that the evaluation literacy scale of primary and secondary school physical education teachers is scientific and reliable, and can be also used as an effective tool to measure the evaluation literacy of primary and secondary school physical education teachers in China.
Keywords:"school physical education;primary and secondary school physical education teachers;evaluation literacy;physical education and health curriculum standards;quantitative evaluation
當前,培養(yǎng)中小學(xué)生的體育與健康核心素養(yǎng)已經(jīng)成為我國基礎(chǔ)教育階段體育與健康課程與教學(xué)改革的重要方向。評價作為體育與健康課程教學(xué)的重要組成部分,是落實學(xué)生體育與健康學(xué)科核心素養(yǎng)的重要抓手。對此,教育部頒布的《普通高中體育與健康課程標準(2017年版)》(以下簡稱《課程標準2017年版》)、《普通高中體育與健康課程標準(2017年版2020年修訂)》(以下簡稱《課程標準2020年修訂版》)、《義務(wù)教育課程方案(2022年版)》(以下簡稱《課程方案2020年版》)、《義務(wù)教育體育與健康課程標準(2022年版)》(以下簡稱《課程標準2022年版》)、《基礎(chǔ)教育課程教學(xué)改革深化行動方案》(以下簡稱《行動方案》),均對中小學(xué)體育教師的教學(xué)評價賦予新的內(nèi)涵要義和提出更高要求,使評價與教學(xué)、學(xué)習(xí)之間的共生關(guān)系得到前所未有的體現(xiàn)。然而,受傳統(tǒng)體育教學(xué)觀念的影響,部分中小學(xué)體育教師時常將評價置于教學(xué)活動之外[1];部分中小學(xué)體育教師在開展體育教學(xué)評價活動時,一方面,對學(xué)生體育學(xué)習(xí)的評價內(nèi)容仍舊局限于運動技能和身體素質(zhì)的發(fā)展與提高,并按照統(tǒng)一的評分標準對學(xué)生進行結(jié)果評價,最終以運動成績“論英雄”[2]。另一方面,為了提高體育教學(xué)評價的效率,不喜歡耗時費力卻具有人文關(guān)懷的評價方法[3],如增值性評價、表現(xiàn)性評價、檔案袋評價等。此外,在評價主體方面,教師擁有控制權(quán)和主導(dǎo)權(quán),但學(xué)生的評價主體地位被弱化、評價權(quán)益被忽視[4]。顯然,以上問題的存在不僅無法滿足發(fā)展學(xué)生體育與健康核心素養(yǎng)的需要,同時也反映中小學(xué)體育教師評價素養(yǎng)的不健全。
中小學(xué)體育教師評價素養(yǎng)作為教師專業(yè)素養(yǎng)的重要組成部分,其高低直接決定課程改革能否切實有效地開展,決定課程改革目標在何種程度上可以實現(xiàn)[5-6]。因此,提高中小學(xué)體育教師評價素養(yǎng)尤為必要和迫切。中小學(xué)體育教師評價素養(yǎng)測評工具是揭示中小學(xué)體育教師評價素養(yǎng)發(fā)展現(xiàn)狀和現(xiàn)存問題、提出改進對策的有力抓手和有形標尺。因此,在發(fā)展體育與健康學(xué)科核心素養(yǎng)、體育教師評價素養(yǎng)亟待提升的多重背景下,研制嚴謹、適用、科學(xué)的中小學(xué)體育教師評價素養(yǎng)測評工具無疑具有重要的理論與現(xiàn)實意義。
1 "中小學(xué)體育教師評價素養(yǎng)的基本內(nèi)涵與核心要素
1.1 "中小學(xué)體育教師評價素養(yǎng)的基本內(nèi)涵
1991年美國教育評價專家斯蒂金斯[7]首次提出“評價素養(yǎng)”,并將教師評價素養(yǎng)界定為教師所應(yīng)具備的基礎(chǔ)性教育評價知識和將這些知識運用到各種學(xué)生成就測驗中的技能。此定義將知識和技能作為教師評價素養(yǎng)的同時,主要體現(xiàn)“對學(xué)習(xí)進行評價”的評價取向。隨后越來越多的研究者將評價素養(yǎng)確認為教師專業(yè)素養(yǎng)的組成部分[8],并在斯蒂金斯定義的基礎(chǔ)上對教師評價素養(yǎng)進行多維界定。通過梳理大致可分為以下兩種觀點:其一,此類觀點在界定取向上,關(guān)注“評價促進學(xué)生的學(xué)習(xí)”。如Webb[9]指出:評價素養(yǎng)是關(guān)于評價學(xué)生所知、所能的方法類知識,怎樣解釋評價結(jié)果的知識,以及如何用評價結(jié)果提高教學(xué)效率以改善學(xué)生學(xué)習(xí)的知識。斯蒂金斯于2017年在原始定義基礎(chǔ)上提出,教師評價素養(yǎng)是指精確測量和報告學(xué)生學(xué)業(yè)成就的知識與技巧,使用評價過程和結(jié)果去改善學(xué)生學(xué)習(xí)[10]。其二,此類觀點關(guān)注評價促進學(xué)生學(xué)習(xí)的同時,一方面強調(diào)教師評價的發(fā)生場域,即教師主要針對學(xué)生的學(xué)習(xí)過程和結(jié)果進行評價;另一方面體現(xiàn)評價素養(yǎng)的多維性。如李順雨[11]指出,教師為了促進學(xué)生的學(xué)習(xí),通過使用多種評價方法針對學(xué)生的學(xué)習(xí)過程和結(jié)果進行評價時所體現(xiàn)出的知識、技能、態(tài)度和價值取向的集合。鄭東輝[12]指出,教師評價素養(yǎng)是教師依據(jù)促進學(xué)習(xí)的評價理念開展學(xué)生評價所表現(xiàn)出來的關(guān)鍵能力和倫理品格。
由此可見,國內(nèi)外學(xué)者對教師評價素養(yǎng)內(nèi)涵的認識莫衷一是,爭論的焦點在于對評價素養(yǎng)屬概念、對教師評價發(fā)生場域和目的取向的認識。首先,就評價素養(yǎng)屬概念而言,從構(gòu)詞法的角度來講評價素養(yǎng)屬于偏正短語,因此將中心語素養(yǎng)作為評價素養(yǎng)的屬概念是適切的。素養(yǎng)介入到教育領(lǐng)域中不再是簡單的文化認知,而是一個抽象的、多維的復(fù)雜概念,是知識、技能、態(tài)度、倫理等多方面結(jié)合在一起的整體表現(xiàn)[5]。其次,就評價發(fā)生場域而言:一方面,評價必須是貫穿于體育教學(xué)活動始終的,因為評價的即時性特點就決定“過程性”評價實為其本質(zhì);另一方面,核心素養(yǎng)導(dǎo)向的評價觀著重強調(diào)學(xué)生評價實踐活動的過程性與綜合性[12]。最后,從評價對于學(xué)習(xí)的目的來看有以下3種典型的取向,一是“對學(xué)習(xí)進行評價”,二是“為了學(xué)習(xí)的評價”,三是“作為學(xué)習(xí)的評價”[13]。其中,“對學(xué)習(xí)進行評價”是為了分等和報告,是學(xué)習(xí)之后對學(xué)習(xí)結(jié)果做出鑒定與區(qū)分,無助于學(xué)生的后續(xù)學(xué)習(xí)與改進,而“為了學(xué)習(xí)的評價”和“作為學(xué)習(xí)的評價”則是明確將評價作為教學(xué)的一部分來支持學(xué)習(xí)[13]。顯然,核心素養(yǎng)導(dǎo)向的評價實踐活動,要求教師所要堅持的是為了學(xué)習(xí)和作為學(xué)習(xí)的評價取向[12]。
綜上所述,本研究基于對評價素養(yǎng)屬概念、教師評價發(fā)生場域和目的取向的分析和理解,將中小學(xué)體育教師評價素養(yǎng)內(nèi)涵界定為:中小學(xué)體育教師通過不斷學(xué)習(xí)和實踐而形成的,能夠?qū)W(xué)生體育學(xué)習(xí)過程和結(jié)果進行評價且能夠通過評價促進學(xué)生體育學(xué)習(xí)所需具備的知識、技能、態(tài)度及品行的綜合表現(xiàn)。
1.2 "中小學(xué)體育教師評價素養(yǎng)核心要素
首先,中小學(xué)體育教師評價素養(yǎng)是教師專業(yè)素養(yǎng)的重要組成部分[5-6]。按照當前學(xué)界對教師專業(yè)素養(yǎng)結(jié)構(gòu)的一般認識,其結(jié)構(gòu)通常由知識、能力(技能)、態(tài)度(情意)、品格4個部分構(gòu)成[14],這可以作為建構(gòu)中小學(xué)體育教師評價素養(yǎng)核心要素的重要參考。
其次,追溯教師評價素養(yǎng)的研究歷程。國內(nèi)外學(xué)者基于不同研究視角或采用不同研究思路對教師評價素養(yǎng)要素形成不同觀點,其演變軌跡主要從一維走向多維,即從斯蒂金斯最初提出的知識型[7]到后來的知識與技能型[8-9,13],再到現(xiàn)如今的知識、技能、態(tài)度(理念)[6,11-12]+倫理(品格)[12,15]、實踐力[16]、解釋力[16]、意識[12,16]等。但是細究發(fā)現(xiàn),評價知識、評價技能、評價態(tài)度已經(jīng)成為教師評價素養(yǎng)結(jié)構(gòu)中的共有要素[15]。
最后,中小學(xué)體育教師評價素養(yǎng)的要素應(yīng)當具有一定的靈活性和適應(yīng)性,即必須要與新課改的要求保持一致。鑒于此,本研究結(jié)合《課程標準2017年版》《課程標準2020年修訂版》《課程標準2022年版》中的“課程理念”“評價建議”,《課程方案2020年修訂版》中的“課程實施”以及《行動方案》中的“重點任務(wù)”等諸多內(nèi)容,凝練出符合中小學(xué)體育教師評價素養(yǎng)內(nèi)涵的4個要素,即評價知識、評價技能、評價態(tài)度、評價品格。如就評價知識而言,《課程標準2017年版》在“評價建議”中明確要求教師知曉“評價的內(nèi)容”即“圍繞運動能力、健康行為、體育品德”而評。于評價技能而言,《課程標準2022年版》在“評價建議”中提出“采用定量評價與定性評價結(jié)合、過程性評價與終結(jié)性評價結(jié)合......積極探索增值評價,健全綜合評價”的要求,《行動方案》將“提升教師教學(xué)評價能力”作為重要任務(wù)。于評價態(tài)度而言,《課程方案2022年版》在“課程實施”之“改進教育評價”一欄中,要求教師“重視并積極開展學(xué)習(xí)評價,倡導(dǎo)評價促進學(xué)習(xí)的理念”。于評價品格而言,《課程方案2022年版》在“課程實施”之“改進教育評價”中要求教師“嚴格遵守評價的倫理規(guī)范,尊重學(xué)生人格,保護學(xué)生自尊心”。此外,習(xí)慣理論認為,所有穩(wěn)定的素養(yǎng)必然會通過習(xí)慣以思維或行動的方式外顯,習(xí)慣是素養(yǎng)的體現(xiàn),也是形成素養(yǎng)的主要方式[17]。因此,評價習(xí)慣理應(yīng)成為中小學(xué)體育教師教學(xué)評價素養(yǎng)的核心要素。而且,中小學(xué)體育教師具備良好的評價習(xí)慣即“每課一評”是對接體育課時預(yù)設(shè)目標是否達成、達成度如何及存在哪些問題的必要通道[18]。
綜上所述,基于對教師專業(yè)素養(yǎng)要素的借鑒、國內(nèi)外教師評價素養(yǎng)文獻分析和比較,并結(jié)合新課改對中小學(xué)體育教師教學(xué)評價提出的新要求,本研究將評價知識、評價技能、評價態(tài)度、評價習(xí)慣和評價品格作為中小學(xué)體育教師評價素養(yǎng)的核心要素,并構(gòu)成中小學(xué)體育教師評價素養(yǎng)量表的5個維度。
2 "研究對象與方法
2.1 "調(diào)查對象
樣本1:主要用于中小學(xué)體育教師評價素養(yǎng)量表的項目分析、探索因子分析。采用方便抽樣的方式,于2024年5—6月通過問卷星平臺(www.wjx.com)分別向北京、山東、廣東3個省市的中小學(xué)體育教師發(fā)放問卷,901份剔除無效問卷117份(測謊題答錯),有效問卷為784份,有效率為87.0%。其中,男性379人(48.4%),女性405人(51.6%),小學(xué)教師214人(27.2%),初中教師305人(38.9%),高中教師265人(33.8%),平均教齡7.2年。教育測量學(xué)指出量表開發(fā)所需的樣本量與觀測條目之比應(yīng)為10∶1[19],中小學(xué)體育教師評價素養(yǎng)初始量表題項共為26個,因此樣本量符合要求。
樣本2:主要用于中小學(xué)體育教師評價素養(yǎng)量表的驗證性因子分析、信效度檢驗。采用方便抽樣的方式,于2024年7月通過問卷星平臺(www.wjx.com)分別向上海、福建、江蘇3個省市的中小學(xué)體育教師發(fā)放問卷978份,剔除無效問卷145份(測謊題答錯),有效問卷為833份,有效率為85.2%。其中,男性479人(57.5%),女性354人(42.5%),小學(xué)教師276人(33.1%),初中教師299人(35.9%),高中教師258人(31.0%),平均教齡6.1年。樣本量符合教育測量學(xué)要求。
樣本3:主要用于重測信度分析。采用方便抽樣的方式,時隔4周通過問卷星平臺(www.wjx.com)從樣本2中隨機選取120名中小學(xué)體育教師進行第二次正式測試。剔除無效問卷17份(測謊題答錯),有效問卷為103份,有效率為85.8%。其中男性59人(57.3%),女性44人(42.7%),小學(xué)教師39人(37.8%),初中教師38(36.9%)人,高中教師26人(25.2%),平均教齡7.6年。
2.2 "研究方法
專家咨詢法:本研究通過兩輪專家咨詢法最大范圍內(nèi)征求、匯集學(xué)校體育學(xué)研究領(lǐng)域和體育教師發(fā)展研究領(lǐng)域的15位資深專家對初步編制的中小學(xué)體育教師評價素養(yǎng)量表評價指標及題項進行評估,其中教授11名,副教授4名,博士生導(dǎo)師11名,碩士生導(dǎo)師4名。兩輪咨詢函回收率為100%,專家積極度高;專家判斷依據(jù)系數(shù)Ca介于0.8~1.0之間,表明理論依據(jù)和實踐經(jīng)驗在很大程度上決定著專家意見。熟悉程度系數(shù)Cs介于0.8~1.0之間,說明專家對該領(lǐng)域的熟悉程度高。權(quán)威度系數(shù)Cr介于0.8~1.0之間,平均值為0.899,也反映出專家權(quán)威度高。""""數(shù)理統(tǒng)計法:本研究的中小學(xué)體育教師評價素養(yǎng)量表為李克特5級量表,所有題項的計分范圍為“1~5分”:按5(非常符合)、4(符合)、3(一般)、2(不符合)、1(非常不符合)進行賦值。量表總得分的計算方式為“總分/項目數(shù)”,取值范圍為“1~5分”[20],得分越高說明中小學(xué)體育教師評價素養(yǎng)越高。采用SPSS 27.0統(tǒng)計軟件對樣本1調(diào)查數(shù)據(jù)進行項目分析、探索性因子分析,對樣本2和樣本3調(diào)查數(shù)據(jù)進行信效度檢驗。采用AMOS 23.0統(tǒng)計軟件對樣本2數(shù)據(jù)進行驗證性因子分析與恒等性檢驗。
3 "結(jié)果與分析
3.1 "中小學(xué)體育教師教學(xué)評價素養(yǎng)量表的設(shè)計
首先,將構(gòu)成中小學(xué)體育教師評價素養(yǎng)的5個核心維度確定為一級評價指標;其次,根據(jù)各一級評價指標的內(nèi)涵,選取相應(yīng)的可觀測變量即測量題項??捎^測變量主要通過以下兩種路徑獲取:一是借鑒其他學(xué)科領(lǐng)域中教師評價核心素養(yǎng)評價工具題項,并更改使用情境和核心詞匯。二是參考《課程標準2017年版》《課程標準2020年修訂版》《課程標準(2022版)》《課程方案2022年版》中的相關(guān)內(nèi)容。初步形成由5個一級評價指標和28個題項組成的初始量表。
3.2 "中小學(xué)體育教師評價素養(yǎng)量表評價指標的完善與確定
1)評價指標完善:德爾菲專家咨詢第1輪。
本研究將初始量表編制成專家咨詢問卷后,采用問卷星的方式邀請15位專家對各評價指標進行定性評估,評估原則主要包括評價指標是否及義、表達是否清楚、閱讀是否流暢、是否晦澀難懂、有無歧義、是否適用于調(diào)研人群以及各個維度之間是否相對獨立等[21]。本輪共計發(fā)放問卷15份,回收問卷15份,有效問卷15份,回收有效率100%。
回收問卷后發(fā)現(xiàn),5個一級評價指標均獲得15位專家的肯定。同時部分專家就測量題項提出以下意見:部分專家建議在評價知識維度下增加“評價方法的使用方法”題項,部分專家建議在健身技能維度下增加“反思技能”題項以及“評價目標設(shè)計”題項,另有部分專家認為評價習(xí)慣“會自動進行評價”與“評價是我不用刻意去記就會去做的事情”表述重復(fù),違背獨立性原則。針對以上意見,經(jīng)過查閱相關(guān)資料以及與部分不同專家反復(fù)溝通,本研究決定采納,并對存在問題的評價指標進行刪除,形成包含5個一級評價指標、28個測量題項的中小學(xué)體育教師評價素養(yǎng)量表。
2)評價指標確定:德爾菲專家咨詢第2輪。
將經(jīng)過第一輪修改和調(diào)整后的中小學(xué)體育教師評價素養(yǎng)評價指標編制成李克特5級量表,請各位專家對每一評價指標按5(非常重要)、4(比較重要)、3(一般重要)、2(一般不重要)、1(非常不重要)進行賦值。本輪共計發(fā)放問卷15份,回收問卷15份,有效問卷15份,回收有效率100%。待回收問卷后,根據(jù)變異系數(shù)對各評價指標進行取舍。如果測量題項的變異系數(shù)大于或等于0.25,則說明該題項的專家意見協(xié)調(diào)程度不夠[22]。變異系數(shù)計算公式如下所示,其中Si表示i指標的標準差(專家認同度),Mi表示i指標的平均值(專家意見集中度),Vi表示i指標的變異系數(shù)(專家意見協(xié)調(diào)度)。通過計算,結(jié)果顯示中小學(xué)體育教師評價素養(yǎng)5個一級評價指標、28個測量題項平均值均在4.3分以上,變異系數(shù)均小于0.25,協(xié)調(diào)系數(shù)較好(Plt;0.001),表明專家對各評價指標具有較高認可度且意見比較一致。
(1)
3.3 "項目分析
首先,對量表的28個題項進行臨界比值(CR)分析,具體為:對28個題項求和并進行高低排序,取前27%被試者計為高分組,后27%被試者計為低分組。隨后對高低分組的同一題項的得分進行獨立樣本T檢驗。結(jié)果顯示,28個題項均達到高度顯著水平(Plt;0.001),CR值均大于3.0,表明28個測量題項具有良好的鑒別度且全部符合要求[23]34。接下來采用同質(zhì)性檢驗法,對28個測量題項與總分的相關(guān)性進行分析。若相關(guān)系數(shù)小于0.4,表示個別題項與量表構(gòu)念只是一種低度關(guān)系,題項與整體量表的同質(zhì)性不高,此題項應(yīng)該刪除[23]34。檢驗結(jié)果發(fā)現(xiàn),28個測量題項相關(guān)系數(shù)均大于0.4。綜上所述,經(jīng)過項目分析后中小學(xué)體育教師評價素養(yǎng)量表28個題項均保留。
3.4 "探索性因子分析
通過項目分析后,對量表進行KMO和Bartlett球形度檢驗,結(jié)果發(fā)現(xiàn)KMO值為0.980,Bartlett球形度檢驗結(jié)果為x2=21 911.088,df=378,P =0.000(Plt;0.001)。根據(jù)Kaiser的觀點,KMO值為0.9以上,Bartlett球形度檢驗達到0.05顯著性水平適合進行因子分析[23]76。接下來,采用主成分分析法和最大方差法,提取出特征根值大于1的因子,并遵循吳明隆等提出的6條題項判斷標準[23]159對題項進行篩選。經(jīng)過3輪探索后,結(jié)果顯示KMO值以及Bartlett球形度檢驗的相關(guān)數(shù)值均符合測量學(xué)要求,能夠從眾多公因子中提取特征根值大于1的因子為5個,5個因子旋轉(zhuǎn)特征值分別為10.096、4.510、3.763、1.521、1.016,5個因子累積方差解釋率77.728%,達到60%的標準[23]36(見表1),表明因子分析結(jié)果理想。同時刪除4道雙重載荷較高的題項(A4與B7、B8與B9),刪除了2道因素負荷量低于0.45的題目(C3、E4)。
根據(jù)因子分析結(jié)果分別對5個因子進行命名,其中因子1包含A1、A2、A3、A5、A6五個題項,命名為“評價知識”;因子2包含B1、B2、B3、B4、B5、B6、B10七個題項,命名為“評價技能”;因子3包含C1、C2、C4、C5四個題項,命名為“評價態(tài)度”;因子4包含D1、D2、D3三個題項,命名為“評價習(xí)慣”;因子5包含E1、E2、E3三個題項,命名為“評價品格”。最終,5個因子和22個題項共同形成中小學(xué)體育教師評價素養(yǎng)量表。
3.5 "驗證性因子分析
根據(jù)探索性因子分析結(jié)果,本研究構(gòu)建一階五因子結(jié)構(gòu)模型與二階五因子結(jié)構(gòu)模型,隨后導(dǎo)入樣本2數(shù)據(jù),采用AMOS 23.0統(tǒng)計軟件中的極大似然模型估計法對以上兩個競爭模型進行檢驗和比較。同時依據(jù)修正指數(shù)表中的參數(shù)對模型進行修正。修正結(jié)果表明,如果在e1和e2、e6和e10、e11和e12、e14和e16之間建立共變關(guān)系,卡方自由度比、均方根漸進誤差等擬合指標會符合或接近標準值,但是二階五因子結(jié)構(gòu)模型各項適配度指標均優(yōu)于一階五因子結(jié)構(gòu)模型。同時,根據(jù)Doll建議的目標系數(shù)t值算法來檢驗二階模型的解釋力,計算公式為一階因子有關(guān)模型的卡方值除以二階因子模型卡方值,t值越接近1則表示二階模型越能取代一階模型[24-25]。通過計算,t值為0.809,即中小學(xué)體育教師評價素養(yǎng)二階五因子結(jié)構(gòu)模型解釋了一階的80.9%。因此,可認為與一階五因子模型相比,二階五因子結(jié)構(gòu)模型為最佳模型(見圖1)。此外,該結(jié)果既表明中小學(xué)生體育教師評價素養(yǎng)量表具有良好的結(jié)構(gòu)效度,也佐證中小學(xué)生體育教師評價素養(yǎng)結(jié)構(gòu)框架的合理性。
3.6 "中小學(xué)體育教師評價素養(yǎng)量表的恒等性驗證
由于本研究調(diào)查對象包含性別、學(xué)段及地區(qū),對此,在秉持寬松策略的原則下(模型不做任何限制),采用結(jié)構(gòu)模型恒等性(MGSEM)分析檢驗中小學(xué)體育教師評價素養(yǎng)量表在不同性別、學(xué)段、地區(qū)之間的測量等值性。通過檢驗發(fā)現(xiàn),模型因素負荷、截距、共變異數(shù)與測量誤差比較中P值均大于0.05未達到顯著性水平,且ΔNFI、ΔIFI、ΔRFI均小于0.05,ΔCFI小于0.01。以上結(jié)果不僅表明中小學(xué)體育教師評價素養(yǎng)量表具有跨性別、跨學(xué)段、跨地區(qū)的恒等性,而且也為中小學(xué)體育教師評價素養(yǎng)模型可作為較為普遍的相關(guān)研究基底模型[25]提供重要依據(jù)。
3.7 "信效度檢驗
在本研究中信度檢驗指標主要為:內(nèi)部一致性系數(shù)(Cronbach’s α系數(shù))和重測信度。如表2所示,通過對樣本2數(shù)據(jù)檢驗,中小學(xué)體育教師評價素養(yǎng)總量表Cronbach’s α系數(shù)為0.883,5個分量表的內(nèi)部一致性系數(shù)介于0.806~0.893之間。通過對樣本3數(shù)據(jù)檢驗,中小學(xué)體育教師評價素養(yǎng)總量表重測信度相關(guān)系數(shù)為0.841(Plt;0.001),5個分量表重測信度相關(guān)系數(shù)介于0.818~0.871之間(Plt;0.001)。內(nèi)部一致性系數(shù)介于0.8與0.9之間表示量表具有穩(wěn)定的內(nèi)部一致性,ICC>0.80表示重測信度極好[23]221。因此,上述結(jié)果表明中小學(xué)生體育教師評價素養(yǎng)量表具有良好的信度。
在本研究中效度檢驗指標主要為:內(nèi)容效度、收斂效度。(1)在內(nèi)容效度方面,主要包含條目水平的內(nèi)容效度指數(shù)(I-CVI)與量表水平的內(nèi)容效度指數(shù)(S-CVI),本研究邀請15位的資深專家對題項與其對應(yīng)的各評價指標之間的相關(guān)性進行評定。通過計算,I-CVI為0.853,S-CVI為0.868。I-CVI不低于0.78、S-CVI不低于0.8表示量表內(nèi)容效度較好[26]。因此,以上結(jié)果表明中小學(xué)生體育教師評價素養(yǎng)量表具有較好的內(nèi)容效度。(2)在收斂效度方面(如表3所示)經(jīng)過檢驗,中小學(xué)生體育教師評價素養(yǎng)量表所有題項標準因子載荷均大于0.500;5個分量表平均方差萃取AVE介于0.513~0.546之間,組合信度CR介于0.734~0.798。Hair等指出只有同時滿足以下3種標準才說明量表具有良好的收斂效度:(1)標準因子載荷(Estimate)均大于0.500;(2)平均方差萃?。ˋVE)大于0.500;(3)組合信度(CR)大于0.700[23]224。因此,以上結(jié)果表明中小學(xué)生體育教師評價素養(yǎng)量表具有較好的收斂效度。
4 "討論
4.1 "中小學(xué)體育教師評價素養(yǎng)量表結(jié)構(gòu)分析
中小學(xué)體育教師評價素養(yǎng)量表主要由評價知識、評價技能、評價態(tài)度、評價習(xí)慣、評價品格5個分量表構(gòu)成。評價知識反映的是體育教師對評價目的、功能、內(nèi)容以及方法等方面的認識和理解。換言之,體育教師在開展核心素養(yǎng)導(dǎo)向的評價活動前,應(yīng)該熟知“為什么評”“評什么”以及“怎么評”等方面的知識?!盀槭裁丛u”旨在強調(diào)評價目的,即對學(xué)生的體育學(xué)習(xí)行為進行觀察、診斷、反饋、引導(dǎo)和激勵,以判斷基于核心素養(yǎng)的課程目標的達成度,給教師和學(xué)生提供即時、多元、有效的反饋,促使學(xué)生更積極地學(xué)與教師更有效地教[27]125?!霸u什么”主要圍繞運動能力、健康行為、體育品德3個核心素養(yǎng)展開。其中,運動能力評價內(nèi)容主要包括基本運動技能、體能、專項運動技能等的掌握程度,以及在日常生活中運用所學(xué)運動知識與技能解決實際問題的能力,在展示或比賽中的表現(xiàn)等[27]125;健康行為評價內(nèi)容主要包括體育鍛煉習(xí)慣、營養(yǎng)膳食、合理作息、安全防范、情緒調(diào)控、適應(yīng)能力等[28];體育品德評價內(nèi)容主要包括學(xué)生在學(xué)練、展示或比賽中表現(xiàn)出的體育精神、體育道德和體育品格等[27]126?!霸趺丛u”主要指向的是滿足學(xué)生體育與健康學(xué)科核心素養(yǎng)發(fā)展所需要的評價方法。評價知識既是體育教師科學(xué)有效開展核心素養(yǎng)導(dǎo)向評價活動的重要前提,也是實現(xiàn)教-學(xué)-評一體化和避免盲目評價的先決條件。
評價技能是指體育教師將評價知識運用于評價實踐活動中的能力。根據(jù)《課程標準2020年修訂版》《課程標準2022年版》的要求,核心素養(yǎng)導(dǎo)向的體育教學(xué)評價活動必須具備以下5個技能:一是會撰寫指導(dǎo)評價活動且契合體育與健康學(xué)科核心素養(yǎng)的學(xué)習(xí)目標;二是運用科學(xué)的評價方法準確收集與體育與健康學(xué)科核心素養(yǎng)相關(guān)的學(xué)習(xí)信息;三是依據(jù)學(xué)習(xí)信息對教學(xué)進行反思并針對性地改進;四是將產(chǎn)生的評價結(jié)果與初始學(xué)習(xí)目標比較,解釋反饋給學(xué)生,既要讓學(xué)生從評價中知道“我的實際水平”,也要讓學(xué)生知道“我在哪些方面運動表現(xiàn)較好”“我在哪些方面運動表現(xiàn)存在不足”“接下來我該如何提高”;五是引導(dǎo)學(xué)生參與體育學(xué)習(xí)評價,學(xué)生由被評價者成為課堂評價的主體既是整體培育學(xué)生核心素養(yǎng)的時代之需,也是課堂評價范式轉(zhuǎn)型的重要訴求。一方面,對于促進學(xué)生的自我調(diào)節(jié)學(xué)習(xí)和終身學(xué)習(xí)均具有重要意義,另一方面也有利于將反饋信息傳遞給體育教師,促進體育教師的教學(xué)質(zhì)量提高和專業(yè)改進[29],最終實現(xiàn)以評促教??偠灾鳛轶w育教師評價活動的核心環(huán)節(jié),評價技能不僅是體育教師將評價知識轉(zhuǎn)換為評價行為的關(guān)鍵和評價能力的集體表現(xiàn),而且也是體育教師有效開展核心素養(yǎng)導(dǎo)向評價活動不可或缺的基本手段,解決體育教師“想評而不會評”的根本基礎(chǔ)[30]。評價態(tài)度是指體育教師對教學(xué)評價持有的看法以及由此做出行動選擇的一種心理傾向[16]44,其內(nèi)蘊著體育教師的價值判斷和情感因素,表征著體育教師的評價立場,即體育教師如何看待評價以及在開展核心素養(yǎng)導(dǎo)向的評價活動時認同什么、堅持什么。此外,對于中小學(xué)體育教師而言,真正能夠促使其摒棄傳統(tǒng)評價理念、實施核心素養(yǎng)導(dǎo)向的評價活動,并非在于其個人的好奇心和利益的驅(qū)使,而在于其是否真正認同評價改革的價值以及由此產(chǎn)生的主觀意愿。由此言之,體育教師評價態(tài)度是開展核心素養(yǎng)導(dǎo)向評價活動的重要驅(qū)動,決定著體育教師的評價行為選擇[16]44。
評價習(xí)慣是體育教師形成的自覺穩(wěn)定的評價行為方式,主要體現(xiàn)在評價行為穩(wěn)定性和評價行為自動化兩個方面。評價行為穩(wěn)定性意味著體育教師要“每課一評”。評價行為自動化意味著體育教師評價行為是不需要外在環(huán)境的制約、高度自覺的行為方式[31]。體育與健康學(xué)科核心素養(yǎng)的形成是一個時間長久、由量變到質(zhì)變的過程。顯然,這一過程離不開評價的反饋、導(dǎo)向和激勵作用。如果體育教師評價行為缺失恒常性、穩(wěn)定性,那么既無法實現(xiàn)課時目標的有效連接,也無法協(xié)調(diào)教學(xué)程序、改進教學(xué)方法、作出正確的決策。評價品格是指體育教師在教學(xué)評價活動中所應(yīng)該具備的道德品質(zhì)。評價品格隱喻著體育教師從評價的設(shè)計、信息的收集到測評結(jié)果的解釋、運用及交流溝通,都必須建立在客觀公正、合理合法、合乎倫理的基礎(chǔ)上[15]。評價是把雙刃劍,評價向善,如給予學(xué)生評價知情權(quán)和參與權(quán),尊重學(xué)生的多樣性,保護學(xué)生的評價隱私,有助于消除學(xué)生對評價的恐懼心理,吸引學(xué)生參與到評價中來并利用評價來改善自己的學(xué)習(xí)[12]。如果評價在不經(jīng)意間傷害了學(xué)生,如傷人的評價語言、人與人之間的橫向比較,不僅會對學(xué)生的學(xué)習(xí)產(chǎn)生消極影響[15],而且也與《課程標準2020年修訂版》《課程標準2022年版》倡導(dǎo)“關(guān)愛學(xué)生”的教育評價理念是背道而馳的。因此,真正實施核心素養(yǎng)導(dǎo)向的評價活動離不開“尊重個體差異”“因材施評”在教學(xué)實踐上的運用,即評價品格是體育教師必備的評價素養(yǎng)。
4.2 "中小學(xué)體育教師評價素養(yǎng)量表具有一定的科學(xué)性和可靠性
評價指標的科學(xué)性直接決定著測評工具的科學(xué)性。本研究首先采用保障評價指標體系準確性、科學(xué)性的德爾菲專家咨詢法對中小學(xué)體育教師評價素養(yǎng)量表進行定性評估。心理測量學(xué)指出,項目分析的主要目的在于檢測編制的量表或測試個別條目的適切或者可靠程度[22]4,基于此,本研究采用臨界值比法、題總相關(guān)法等對量表題項的適切性進行定量評估。探索性因子分析主要目的是找出影響觀測變量的因子個數(shù),以及各個因子和各個觀測變量之間的相關(guān)程度,建立量表的或問卷的結(jié)構(gòu)效度[32]。對此,本研究通過主成分分析法減少題項的數(shù)目,找出量表的潛在結(jié)構(gòu),將中小學(xué)體育教師評價素養(yǎng)量表中具有錯綜復(fù)雜關(guān)系的變量綜合為5個核心因子。驗證性因子分析主要目的是檢驗量表建構(gòu)效度的適切性與真實性[32]。本研究通過驗證,發(fā)現(xiàn)構(gòu)建的二階五因子結(jié)構(gòu)模型各項適配度指標均符合標準值,而且在模型修正過程中沒有刪去過多的路徑和題項。綜上,多種方法相結(jié)合的選擇途徑不僅從不同角度和目的對題項進行篩選,而且也保證被選題項的質(zhì)量和量表的科學(xué)性[33]。
測量恒等性是指測驗工具或評量方法適用于不同對象,或于不同時間地點上使用時,測驗分數(shù)或評量結(jié)果應(yīng)具有一定的恒等性[34]。為此,本研究借助多群組驗證性因素分析考察中小學(xué)體育教師評價素養(yǎng)量表跨性別、跨學(xué)段、跨地區(qū)的測量恒等性。結(jié)果發(fā)現(xiàn),因素負荷、截距、共變異數(shù)與測量誤差4個指標取值均符合理想范圍,這一結(jié)果表明跨性別、跨學(xué)段、跨地區(qū)不會對中小學(xué)體育教師評價素養(yǎng)量表的測量結(jié)果和穩(wěn)定性產(chǎn)生影響。相關(guān)研究指出,測量工具時間太長可能會造成測試對象的消極情緒,進而“抵觸”測評過程,降低測評的有效性[35]。通過對多名被測試者進行訪談,得出中小學(xué)體育教師評價素養(yǎng)量表測量題項數(shù)量適中,而且題項長短適宜,自評完成時間介于4~6分鐘之間,易被接受。綜上所述,以上研究方法以及操作過程具有較強的科學(xué)性,進而也為中小學(xué)體育教師評價素養(yǎng)量表的科學(xué)性提供重要保障。
在本研究中,內(nèi)部一致性系數(shù)、重測信度、內(nèi)容效度、收斂效度均在理想值區(qū)間。結(jié)果表明中小學(xué)體育教師評價素養(yǎng)量表具有良好的可靠性和適用性,可以為我國中小學(xué)體育教師評價素養(yǎng)的測量提供工具支持。
4.3 "局限與展望
一方面,由于人力、物力、時間等方面的限制,本研究僅選擇部分地區(qū)部分中小學(xué)體育教師作為調(diào)查對象,造成樣本量有限、選取的調(diào)查對象不夠?qū)掗?,因此后續(xù)研究可以進一步擴大樣本量和樣本選擇范圍,對中小學(xué)體育教師評價素養(yǎng)量表進行修正和驗證。另一方面,本研究主要采用自上而下型的研究思路,即基于文獻調(diào)研的方式獲取中小學(xué)體育教師評價素養(yǎng)量表測評題項,盡管題項具有一定科學(xué)性和適用性,但是這種思路往往會造成收集到的資料不夠全面。因此,后續(xù)研究可通過開門問策、深入實踐完善題項內(nèi)容(如采用半結(jié)構(gòu)式訪談法對中小學(xué)體育教師進行訪談),以使中小學(xué)體育教師評價素養(yǎng)量表更好地為體育教師實施核心素養(yǎng)導(dǎo)向的評價活動服務(wù)。
參考文獻:
[1] 張細謙,姚蕾. 體育課程與教學(xué)論[M]. 北京:高等教育出版社,2021:252.
[2] 張健. 新課程標準下體育教學(xué)評價的問題與對策研究[J]. 課程·教材·教法,2015,35(6):98-102.
[3] 鄭東輝,毛瑋潔. 論教師評價倫理素養(yǎng)的培育[J]. 教師教育研究,2024,36(5):16-21.
[4] 范云祥,馬衛(wèi)平. 體育教學(xué)評價中幾對范疇的思考[J]. 上海體育學(xué)院學(xué)報,2011,35(4):70-73.
[5] 檀慧玲,王玥,沈漪佳. 教師評價素養(yǎng)發(fā)展的挑戰(zhàn)與對策:基于深化教育評價改革和實施新課標的省思[J]. 教育科學(xué)研究,2023(8):34-41.
[6] 盛雅琦,張輝蓉. 新時代教師評價素養(yǎng)的內(nèi)涵解構(gòu)、價值意蘊及測評框架[J]. 課程·教材·教法,2022,42(5):146-152.
[7] STIGGINS R J. Assessment literacy[J]. Phi Delta Kappan,1991,72(7):534-539.
[8] YUE T X,GAVIN T L B. Teacher assessment literacy in practice:A reconceptualization[J]. Teaching and Teacher Education,2016(58):149-162.
[9]"WEBB N. Assessment literacy in a standards-based urban education setting[C]//In Annual Meeting of the American Educational Research Association,NewOrleans,Louisiana,2002:1-5.
[10]"CHAPPUIS J,STIGGINS R J."Stuernt-involved assessment for learning[M]. 7th ed. New York:Person Education Inc,2017:11.
[11] 李順雨. 初中課堂教師評價素養(yǎng)研究[D]. 大連:遼寧師范大學(xué),2016:22.
[12] 鄭東輝. 新時期教師到底需要怎樣的評價素養(yǎng)[J].教育發(fā)展研究,2022,42(4):46-51.
[13] EARL L M. Assessment as learning[M]. Thousand Oaks,CA:Corwin,2013:26,27.
[14] BROOKHAR S M. Educational assessment knowledge and skills for teachers[J]."Educational Measurement:Issues and Practice.2011,30(1):3-12.
[15] 朱傳世. 教師評價素養(yǎng)框架設(shè)計初探[J]. 中國教師,2024(5):35-38.
[16] 趙雪晶. 我國中學(xué)教師教學(xué)評價素養(yǎng)研究[D]. 上海:華東師范大學(xué),2012.
[17] 朱永新. 習(xí)慣養(yǎng)成是核心素養(yǎng)形成的行動路徑——新教育實驗推進“每月一事”的理論與實踐[J]. 課程·教材·教法,2017,37(1):4-15.
[18] 邵偉德,何魯偉,鄒旭鋁,等. 核心素養(yǎng)融入體育課堂教學(xué)的邏輯與策略——以2022年版課程標準為視角[J]. 首都體育學(xué)院學(xué)報,2023,35(1):10-20.
[19] 羅伯特,德威利斯. 量表的編制:理論與應(yīng)用[M].席仲恩,杜鈺,譯. 重慶:重慶大學(xué)出版社,2018:68.
[20] 孟高慧,劉暢. 大學(xué)生學(xué)術(shù)信息組織水平量表的開發(fā)與應(yīng)用[J]. 圖書情報工作,2021,65(12):73-82.
[21] 孟萬金,苗小燕,官群,等. 中國中小學(xué)生家庭幸福感量表編制[J]. 教育研究與實驗,2020(3):91-96.
[22] 陳華友,周禮剛,劉金培,等. 統(tǒng)計預(yù)測與決策[M]. 北京:科學(xué)出版社,2018:13.
[23] 吳明隆. 問卷統(tǒng)計分析實務(wù)—SPSS操作與應(yīng)用[M]. 重慶:重慶大學(xué)出版社,2010.
[24] DOLL W J,XIA W,TORKZADEH G A confiematory factor analysis of the end-user coomputing satisfaction instructment[J]. MIS Quarterly,1994,18(4):453-461.
[25] 晏駿,譚廣鑫,李信厚,等.《粵港澳青少年民族傳統(tǒng)體育文化認同量表》的編制與檢驗[J]. 體育科學(xué)研究,2023,27(6):25-31.
[26] 史靜琤,莫顯昆,孫振球. 量表編制中內(nèi)容效度指數(shù)的應(yīng)用[J]. 中南大學(xué)學(xué)報(醫(yī)學(xué)版),2012,37(2):49-52.
[27] 教育部. 義務(wù)教育體育與健康課程標準(2022年版)[M]. 北京:北京師范大學(xué)出版社,2022.
[28] 季瀏. 我國《義務(wù)教育體育與健康課程標準(2022年版)》解讀[J]. 體育科學(xué),2022,42(5):3-17.
[29] 郭洪瑞. 學(xué)生評價素養(yǎng)的國外研究及其啟示[J]. 中國考試,2022(12):70-79.
[30] 楊國海. 教師評價素養(yǎng)的內(nèi)涵及框架[J]. 當代教育科學(xué),2011(4):11-19.
[31] 喬玉成. 青少年鍛煉習(xí)慣的養(yǎng)成機制及影響因素[J]. 體育學(xué)刊,2011,18(3):88-94.
[32] 吳明隆. 結(jié)構(gòu)方程模型—AMOS的操作與應(yīng)用[M]."重慶:重慶大學(xué)出版社,2009:212.
[33] 孫瑩,鮑鑫中. 一種基于方差最大化的組合賦權(quán)評價方法及其應(yīng)用[J]. 中國管理科學(xué),2011,19(6):142-148.
[34]"REISE S P,WIDAMAN K F,PUGH R H. Confirmatory factor analysis and item response theory:Two approaches for exploring measurement invariance[J]. Psychological Bulletin,1993(114):552-566.
[35] 陳思同,劉陽,唐炎. 體育素養(yǎng)測量與評價的現(xiàn)狀、挑戰(zhàn)及未來[J]. 體育學(xué)刊,2019,26(5):111-117.
收稿日期:2024-09-26
基金項目:全國教育科學(xué)規(guī)劃2020年度教育部青年項目課題(ELA200418)。
作者簡介:郭洪亮(1991-),男,博士,在站博士后,研究方向:學(xué)校體育學(xué)。E-mail:GHL11210707@163.com""通信作者:姚蕾