(貴州理工學(xué)院體育學(xué)院 貴州 貴陽 550003)
現(xiàn)有不同的工具來評估幼兒期的運(yùn)動表現(xiàn),這些評估工具大多針對特定的幼兒群體,因此具有特定的評估測試內(nèi)容。運(yùn)動評估作為常模參照測試或標(biāo)準(zhǔn)參考。一種是標(biāo)準(zhǔn)參照測試將孩子的表現(xiàn)與預(yù)定的標(biāo)準(zhǔn)進(jìn)行比較,標(biāo)準(zhǔn)參照測試考慮了執(zhí)行動作技能項(xiàng)目所需動作的定性方面。另一種形式運(yùn)動技能評估主要是教師通過對學(xué)生使用監(jiān)測儀器進(jìn)行的。前期研究文獻(xiàn)中多集中在測試內(nèi)容和標(biāo)準(zhǔn)上,幾乎很少涉獵測試中組織與管理,本文主要是對七測試評估工具 MOT4-6、M-ABC、PDMS、KTK、TGMD、MMT、BOTMP 測試中組織與管理進(jìn)行梳理。
標(biāo)準(zhǔn)化工具標(biāo)準(zhǔn)包括:測試手冊轉(zhuǎn)換表清晰、測試儀器、測試項(xiàng)目和評分操作指南,計(jì)分表和大量自由選擇空間以獲得補(bǔ)充的定性信息。此外,評估儀器設(shè)備應(yīng)易于安裝,測試項(xiàng)目應(yīng)易于指導(dǎo)、演示和管理。
按照測試使用者標(biāo)準(zhǔn)進(jìn)行評估(物理療法測評估工作小組,簡稱TESMPT,1991年),例如,報(bào)告測試選擇(例如描述實(shí)際使用、實(shí)物背景、測試選擇的總體和理由,包括不選擇工具的原因),測試選擇必須基于什么內(nèi)容是最好,并應(yīng)遵循道德準(zhǔn)則(如經(jīng)評估的學(xué)齡前兒童和其父母的知情同意、安全措施等)。經(jīng)過審查工具的行政管理,可用于指導(dǎo)為特定的教育研究目標(biāo)或臨床選擇適合的測評工具(見表 1)。
表1 標(biāo)準(zhǔn)數(shù)據(jù)
在開始評估之前,應(yīng)采取預(yù)防措施,防止出現(xiàn)危險(xiǎn)情況。大多數(shù)測試都是“當(dāng)場”進(jìn)行的環(huán)境。測試手冊明確環(huán)境需求,如測試室是6m×4m,包括障礙物的墻和堅(jiān)硬的地面。測試室應(yīng)明亮、安靜、通風(fēng)良好。避免測試孩子間干擾和測試時(shí)間最短。
考官或測試人員的選擇和培訓(xùn)是非常重要的組成部分。測試者的專業(yè)背景應(yīng)符合物理治療中的測試和測量標(biāo)準(zhǔn)(TFSMPT,1991)。合格的測試員應(yīng)閱讀和研究測試內(nèi)容和預(yù)編手冊。然后,他們應(yīng)該遵守具體的規(guī)則和程序。當(dāng)報(bào)告結(jié)果時(shí),它們應(yīng)該描述在測試過程中可能發(fā)生的任何事情。
規(guī)范性數(shù)據(jù)往往是基于小樣本、較舊或針對運(yùn)動能力不足而不是運(yùn)動能力。表1顯示了規(guī)范性數(shù)據(jù),作者和工具的來源、年齡、抽樣中的兒童人數(shù)和抽樣方法。本綜述多數(shù)數(shù)據(jù)來源僅代表美國人口,因族裔、種族、性別等不同而有所區(qū)別。只有Movement-ABC測試歐洲兒童有相對較新的規(guī)范數(shù)據(jù)。KTK和MOT4-6以及MMT代表歐洲兒童數(shù)據(jù)。這些數(shù)據(jù)中有一些是作為負(fù)值點(diǎn),有些過時(shí)了。它們在本國使用,受到限制(見表1)。
對動作評估工具批判性是沒有像心理測量中認(rèn)知發(fā)展一樣。造成這一特殊缺陷的主要原因有五個(gè)方面:(1)認(rèn)為最重要的發(fā)展目標(biāo)是認(rèn)知發(fā)展,由于有限的證據(jù)關(guān)于運(yùn)動技能發(fā)展的信息有助于理解認(rèn)知發(fā)展,因此對運(yùn)動技能發(fā)展的興趣是有限;(2)體育往往沒有其他學(xué)科那么重要;(3)沒有證據(jù)證明存在不分割的運(yùn)動能力,使用簡單的任務(wù)來解決一種測量大項(xiàng)目方案,但太耗時(shí);(4)關(guān)于性別差異結(jié)果的可能產(chǎn)生相互矛盾,不能激勵研究性別中立、可靠和有效的評估工具。并非所有作者都同意根據(jù)性別差異出現(xiàn)在11歲或以后。如粗細(xì)運(yùn)動技能性別差異的研究。這重要缺點(diǎn)是沒有提供男女兒童標(biāo)準(zhǔn);(5)同齡兒童之間存在很大差異。
測試總分,測試者應(yīng)該意識到不同運(yùn)動任務(wù)之間的相關(guān)性可能很低。運(yùn)動技能評估的復(fù)雜性反映了運(yùn)動系統(tǒng)的多因素特性、可能存在的性別或文化以及同齡兒童之間的巨大差異。因此建議使用多個(gè)評估工具。用于學(xué)齡前的兒童,不同評估工具的優(yōu)缺點(diǎn)(詳見表 2)。
運(yùn)動評估工具的選擇考慮影響因素。應(yīng)考慮以下標(biāo)準(zhǔn):
測試目的、運(yùn)動障礙、測試的年齡、測試的易操作、考評員的水平、測試項(xiàng)目時(shí)間等。
表2 用于學(xué)齡前兒童教育研究的評估工具的優(yōu)缺點(diǎn)
強(qiáng)調(diào)了評估工具中使用的單一美國樣本,以及跨文化有效性不足?,F(xiàn)有數(shù)據(jù)的日期或以小年齡組樣本為基礎(chǔ),增加歐洲學(xué)齡前兒童的樣本,這為跨文化使用提供了數(shù)據(jù)樣本。美國和歐洲兒童的運(yùn)動技能發(fā)展之間存在著明確的差異,如歐洲缺乏關(guān)于運(yùn)動技能發(fā)展和表現(xiàn)的最新信息。使用PDMS-2分別獲得精細(xì)和粗大動作性能的分?jǐn)?shù),允許1-6歲兒童的粗大和精細(xì)運(yùn)動表現(xiàn)之間存在相對差異。
經(jīng)典測量理論(Classical Test Theory,CTT)認(rèn)為測評體系的構(gòu)建需要經(jīng)過信效度檢驗(yàn)、項(xiàng)目分析、常模、標(biāo)準(zhǔn)化等基本建造程序。標(biāo)準(zhǔn)化測評對實(shí)施程序、對象范圍、施測環(huán)境、測試方式、測驗(yàn)時(shí)限、分?jǐn)?shù)解釋(常模)作了統(tǒng)一的規(guī)定,這樣測評能夠在異時(shí)、異地,不同的主試等條件下進(jìn)行,并能得到同等有效的測評結(jié)果。標(biāo)準(zhǔn)化的思想主要來自于自然科學(xué)中對實(shí)驗(yàn)條件進(jìn)行嚴(yán)格控制以降低測量誤差,其方法主要源自實(shí)驗(yàn)科學(xué)中對無關(guān)變量和干擾變量控制的方法。本研究選取的測評工具在現(xiàn)實(shí)操作中均已經(jīng)具有了完整的操作手冊,并對操作情景、工具規(guī)格以及測試人員品質(zhì)等提出要求,較高的標(biāo)準(zhǔn)化程度保證了測試的信效度,同時(shí)保證了常模解釋的準(zhǔn)確性,這也是它們得以廣泛應(yīng)用的重要原因。
常模參照評價(jià)是一種以經(jīng)典測評理論為基礎(chǔ)的測量,主要目的在于把施測對象同常模比較,從而判斷施測對象在所屬團(tuán)體中的相對位置。FMS的發(fā)展是一個(gè)復(fù)雜的過程,對于運(yùn)動技能模式發(fā)展的認(rèn)識,一般是通過辨別運(yùn)動技能發(fā)展的序列和階段的方法,這也是判斷FMS是否形成的常用方法。因此通常FMS的測評是對不同年齡段的兒童使用相同的測評工具,預(yù)期隨著年齡的增長,F(xiàn)MS表現(xiàn)會隨之發(fā)展,這樣可以將不同年齡段的兒童進(jìn)行直接比較,或?qū)蝹€(gè)的兒童與常模進(jìn)行比較,這凸顯了常模參照評價(jià)的優(yōu)點(diǎn)。但運(yùn)用常模參照評價(jià)評估的最大短板是由于地區(qū)差異導(dǎo)致的測評工具推廣難的問題,這也是各國紛紛建立自己獨(dú)立的FMS測評體系的原因之一。
FMS的測評是實(shí)施運(yùn)動技能干預(yù)和教學(xué)的前提,盡管對于FMS的操作概念還存在爭議,但發(fā)達(dá)國家多數(shù)已經(jīng)建立了基于本國操作情景的FMS測評工具?;厮菸覈w育教育中關(guān)于動作發(fā)展研究的歷史,可以看出上世紀(jì)80年代以前,國內(nèi)并沒有學(xué)者對運(yùn)動技能發(fā)展進(jìn)行研究。從對外國測評工具的綜述可以看出,對于運(yùn)動技能測量的研究在我國還處于初步的探索階段,應(yīng)更好的借鑒發(fā)達(dá)國家在FMS測量研究的先進(jìn)理念和方法,同時(shí)緊密結(jié)合我國體育教育的現(xiàn)狀,取長補(bǔ)短,批判吸收。
(1)當(dāng)前主流的兒童運(yùn)動技能發(fā)展評價(jià)的方法都是由美德等國的學(xué)者基于本國兒童青少年運(yùn)動技能數(shù)據(jù)研發(fā),注重常模參照評價(jià)在評估中的運(yùn)用,但多數(shù)測評工具存在因?yàn)榭缥幕瘻y評,效度減弱的缺點(diǎn),其數(shù)據(jù)常模不能精確地適用于他國兒童;
(2)“體育素養(yǎng)”已經(jīng)被我國學(xué)界所認(rèn)同,建立我國兒童青少年體育素養(yǎng)的測評體系是目前體育素養(yǎng)研究中的熱點(diǎn),而FMS測評是體育素養(yǎng)測評的一個(gè)維度,基于我國大陸兒童數(shù)據(jù)常模的FMS的測評是研發(fā)是當(dāng)前我國兒童青少年體育素養(yǎng)測評的關(guān)鍵環(huán)節(jié);
(3)FMS的推廣已經(jīng)成為體育教育和競技運(yùn)動后備人才培養(yǎng)的重點(diǎn),并已成為發(fā)達(dá)國家體育教育效果實(shí)施的評估標(biāo)準(zhǔn),大量的文獻(xiàn)也證實(shí),教師和研究人員可以通過改變和控制任務(wù)及環(huán)境因素來影響兒童青少年的FMS的發(fā)展,而我國在FMS相關(guān)研究上的力度依舊薄弱。
在研究教育環(huán)境中,建議測試工具取決于研究的目的。當(dāng)評估學(xué)齡前兒童的一般運(yùn)動能力時(shí),建議使用MOT4-6;測評運(yùn)動功能障礙時(shí)使用PDMS-2;而KTK測試將更合適平衡力。使用MMT運(yùn)動測試能力潛力較大。然而,當(dāng)目的是評估學(xué)齡前兒童運(yùn)動障礙的發(fā)生率時(shí),Movement-ABC將適合使用,其敏感性和特異性有待進(jìn)一步研究,如BOT-2和PDMS-2需有復(fù)雜的測試儀器,更適合評估較小的兒童群體,測試也相當(dāng)耗時(shí)。