• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    Rasch模型在物理學業(yè)質量評價中的應用研究

    2021-06-18 06:56:52桑芝芳
    物理通報 2021年6期
    關鍵詞:均方殘差試題

    肖 月 桑芝芳

    (蘇州大學物理科學與技術學院 江蘇 蘇州 215000)

    1 Rasch模型的原理

    Rasch模型是由丹麥數學與教育學家G. Rasch于1960年提出來的一個用來測量潛在特質的概率模型.它成功地解決了經典測量理論中被試樣本依賴、測量工具依賴以及被試能力參數與項目難度參數之間相互干擾等問題.在教育與心理測量學領域中,Rasch模型常常依據學生在測試上的表現(xiàn),間接測量出學生的潛在特質——學科能力.

    1.1 Rasch模型的數學表達式

    在Rasch模型中,被試能力,試題難度,以及被試給出正確答案的可能性之間的關系可以由方程式(1)來表達[1].如下

    (1)

    1.2 Rasch模型的參數估計

    項目難度和被試的能力水平是Rasch模型中的兩大參數.這兩個參數的估計是Rasch分析中非常重要的過程.一般采用的估計方法為極大似然估計法.其原理為在己知被試作答矩陣的情況下,找到一個數值,使參數估計的可能概率達到最大值,通過求取似然概率的最大值來估計出考生的能力水平和項目的難度.

    1.3 Rasch模型與數據的擬合

    Rasch模型是一個理想化的數學模型.它要求所收集的實證數據必須滿足事先規(guī)定的標準和結構,才能實現(xiàn)客觀測量[1].因此,Rasch模型通過提供未加權殘差均方(Outfit MNSQ)和加權殘差均方(Infit MNSQ)兩種形式的卡方擬合指標,來判斷所收集的實證數據是否符合該模型.

    本文采用了Rasch研究中經常使用的取值范圍,即Outfit MNSQ和Infit MNSQ值在0.5~1.5范圍內,說明擬合程度較好.Outfit ZSTD和Infit ZSTD分別是Outfit MNSQ和Infit MNSQ的標準化的形式,Outfit ZSTD和Infit ZSTD值在-2~2范圍內,說明擬合程度較好[2].在分析過程中,如果有試題的擬合程度不理想,我們不應該直接刪除該試題而是認真地審視該試題找出影響擬合度的因素[3].

    2 利用Rasch模型分析物理試題的質量

    2.1 研究對象與研究方法

    本研究對某高中587名高三學生在一份高三物理試卷中客觀題的作答情況進行分析.采用Excel對收集到的原始數據進行處理和轉化,然后將處理后的數據導入WINSTEPS軟件,進行Rasch分析,其中主要包括整體質量檢驗、懷特圖、單維性檢驗、試題擬合度以及試題氣泡圖.

    2.2 試題的整體情況分析

    試題的總體統(tǒng)計情況如表1所示.

    表1 試題的總體統(tǒng)計情況

    由表1可知,試題難度為0.00;Infit MNSQ和Outfit MNSQ分別為1.00和1.32,Infit ZSTD和Outfit ZSTD分別為-0.10和0.10,均在理想值范圍內,說明本次數據與Rasch理想模型擬合程度較好;試題的信度(Reliability)為0.99(>0.7),表示試題具有較高的可信度;試題的區(qū)分度(Separation)為10.19(>2),顯示試題能夠對不同能力水平被試加以區(qū)分.

    從內容來看,試題強化了對物理基本概念與規(guī)律等知識的考查,主要涉及勻變速運動、圓周運動、動能定理與機械能守恒、靜電場等知識.突出考查學生對物理基本概念與規(guī)律的理解,有助于培養(yǎng)學生的物理觀念與科學思維.而且每個試題都具有明確的考查目標和功能,能夠對不同水平的學生進行區(qū)分.

    因此,從定性和定量兩個方面對客觀題進行整體評估,結果顯示整體情況較好,可進行后續(xù)分析.

    2.3 學生能力與試題難度關系圖(懷特圖)

    Rasch模型將所收集的實證數據進行對數轉換,使其變?yōu)榈染鄶祿?logit數據).然后將學生能力和試題難度的等距數據標定在同一個量尺上,根據它們在量尺上的相對位置,直接比較學生之間的能力高低,試題之間的難度大小,以及學生與試題之間的關系.

    圖1顯示了學生能力和試題難度之間的對應關系.其中,左邊部分表示學生能力的分布,每個#號代表7名學生,每個點表示1~6名學生,中間豎線是等距量尺,右邊部分表示試題難度的分布.從上往下,學生能力逐漸降低,試題難度逐漸減小.

    由圖1可知,學生能力分布范圍約為5個logit,試題難度分布范圍約為6個logit.總體來看,學生能力平均值為1.61 logit,考試題難度平均值為0.00 logit,學生能力水平高于試題難度,說明試題難度偏低.試題難度沒有覆蓋到全體學生,特別是較高能力水平的學生.針對此類情況,需要適當增加一些難度較大的試題,并相應減少沒有學生能力水平對應的難度較小的試題.

    2.4 單維性檢驗分析

    Rasch模型的假設之一,測量的潛在特質是單維的,即學生在該測試中取得結果的好壞只與某一種潛在特質有關(如知識、能力、性格特征等),本文通過Rasch模型提供的標準殘差對比圖,來鑒別該試題測量的潛在特質是否是單維的.

    圖1 懷特圖

    圖2 標準殘差對比圖

    圖2展示了試題的標準殘差對比圖,橫坐標是試題難度(Item Measure),左側縱坐標是試題與其他可能的因素之間的相關系數(Contrast Loading),坐標系中的1~8為題號.可以看到,1~7題的相關系數都在理想范圍[-0.4,0.4]內,具有單維性,以第3題為例進行說明,并對超出理想范圍的第8題做進一步分析.

    【第3題】如圖3所示,車廂水平底板上放置質量為M的物塊,物塊上固定豎直輕桿.質量為m的球用細線系在桿上O點.當車廂在水平面上沿直線加速運動時,球和物塊相對車廂靜止,細線偏離豎直方向的角度為θ,此時車廂底板對物塊的摩擦力為Ff、支持力為FN,已知重力加速度為g,則( )

    圖3 第3題題圖

    A.Ff=MgsinθB.Ff=Mgtanθ

    C.FN=(M+m)gD.FN=Mg

    在標準殘差對比圖中,本試題與其他可能的因素之間的相關系數為0.04.它通過連接體模型考查牛頓運動定律的運用,學生先以小球為研究對象,由牛頓第二定律推導出車廂運動的加速度;然后以物塊與小球整體為研究對象,通過力的分解求出水平方向與豎直方向上的力.在此過程中,并未涉及物理知識以外的其他潛在特質,具有單維性.

    【第8題】如圖4所示,在水平放置的光滑接地金屬板中點正上方h高處,有一帶正電的點電荷Q,一表面絕緣、帶正電的小球(可視為質點,且不影響原電場)以速度v0在金屬板上自左端向右端運動,則( )

    圖4 第8題題圖

    A.小球先做減速后做加速運動

    B.運動過程中小球的電勢能先減小后增大

    通過Rasch分析,第8題難度為2.53 logit,只有34%的學生回答正確,是客觀題中最難的題目,擬合度在理想范圍內,能夠區(qū)分不同能力水平的學生,區(qū)分度較好.該試題考查了靜電平衡、力與運動以及功等知識點,綜合性較強.要求學生掌握靜電平衡導體特點,以及能根據題圖電場線的分布,聯(lián)想到等量異種電荷.如若由于思維定勢,學生沒有充分考慮到導體的放入,以及對之前所學知識不能情境遷移,則不能將題目信息與已有知識相匹配進而推斷出正確答案.因此,除了學生的物理知識,本試題還考查了學生的推理分析、比較、情境遷移等綜合能力.

    2.5 試題擬合程度分析

    表2統(tǒng)計了8道試題的擬合指標統(tǒng)計情況,包括試題難度、未加權殘差均方(Outfit MNSQ)、加權殘差均方(Infit MNSQ)、以及PT測量中的相關系數.

    表2 試題的擬合情況統(tǒng)計表

    根據擬合的數據來看,難度最大的題目為第8題,難度最小的題目為第1題.試題的加權殘差均方全都在[0.93,1.11]范圍內,未加權殘差均方大部分都在[0.64,1.17]范圍內,幾乎都在正常的取值范圍[0.5,1.5]內,表明試題的擬合程度較好.此外,相關系數表示試題與試題測量目標的擬合程度,相關系數的最低可接受水平約為 0.03,相關系數越高,說明試題與試題的測量目標越接近[4].從表格中發(fā)現(xiàn)所有試題的相關系數均處于可接受的水平.

    2.6 試題氣泡圖分析

    圖5為試題的氣泡圖,直觀地展示每一道試題的測量誤差和擬合情況.圖中,縱軸表示試題難度,越靠近頂端,表示題目越難;橫軸表示試題與模型的擬合情況,用未加權殘差均方表示;每個氣泡的大小表示標準誤,氣泡越大,標準誤越大,測量的精確性越低.

    圖5 氣泡圖

    由圖5可知,2~8題的未加權殘差均方在[0.5,1.5]范圍內,結合表2的擬合程度統(tǒng)計表,表明大部分學生的反應與預期一致,試題能夠較準確地檢測出學生的能力水平,以第4題為例進行說明,并對超出理想范圍的第1題做進一步分析.

    【第4題】國慶70周年閱兵展出了我國高超音速乘波體導彈——東風-17,東風-17突防能力強,難以攔截,是維護祖國和平發(fā)展的有力武器.如圖6所示,設彈道上處于大氣層外的a點和處于大氣層內的b點的曲率半徑之比為2∶1,導彈在a和b兩點的速度大小分別為3倍音速和12倍音速,方向均平行于其正下方的水平地面,導彈在a點所受重力為G,在b點受到空氣的升力為F.則( )

    圖6 第4題題圖

    A.F=33GB.F>33G

    C.F=32GD.F<32G

    第4題的未加權殘差均方為0.97,在理想范圍內,表明學生的作答情況符合模型的預期,即在本試題中,理解分析能力高的學生回答正確的概率大于能力低的學生.本試題以真實情境為背景,利用向心力知識解決實際問題.假設導彈在a和b點做圓周運動,可以計算出升力F=33G,又從軌跡中得知導彈要做離心運動,可得F>33G.62%的學生答對了此題,其中42%的學生能力水平值高于平均能力水平值,能力高的學生回答正確的概率大于能力低的學生.

    【第1題】某質點從靜止開始做勻加速直線運動,已知第3 s內通過的位移是x,則質點運動的加速度為( )

    通過Rasch分析,第1題難度為-3.49 logit,有98%的學生回答正確,是客觀題中最簡單的題目.本試題只考查了勻變速直線運動公式的運用,學生無論能力高低均能正確回答,學生的作答差異不大,沒有體現(xiàn)出必要的區(qū)分性.

    本試題應該創(chuàng)設真實的問題情境,讓學生應用勻變速直線運動的物理知識解決生活中的實際問題.這樣才能考查學生是否真正理解所學知識,同時也培養(yǎng)了學生分析問題、解決問題的能力,有效發(fā)展學生的物理學科核心素養(yǎng).

    綜上所述,試題整體信度較高、區(qū)分度合理,能客觀地考查出學生分析問題的能力和水平.但是相對來說,缺乏考查高能力水平的試題,存在個別試題指標與 Rasch模型不能很好擬合的情況,需要考慮做出調整.

    3 Rasch模型在試卷質量分析中的注意事項

    Rasch模型具有許多分析功能,由于實際的測量情況不同,測量者應該結合測量目標,選擇合理的Rasch模型對應的分析功能對測試進行分析.本文以一份高三物理試卷中客觀題為例,主要從整體質量檢驗、懷特圖、單維性檢驗、試題擬合度以及試題氣泡圖等方面進行質量分析.如若教師想分析男、女生在作答試題上是否存在差異,可以使用Rasch模型的項目功能差異(Differential Item Functioning,DIF)進行檢驗;對于考查多種潛在特質的試題,教師可以使用多維度的Rasch模型進行分析.多維度的Rasch模型并不是對Rasch模型的顛覆,而是對Rasch模型單維度要求的發(fā)展,它充分利用相關維度特質(或相關分量表)所提供的有用信息,在保證測驗信度、效度的同時,提高目標特質測量的精確度、廣度和效率[1].

    在分析過程中,如果有試題的擬合程度不理想,我們不應該直接刪除該試題而是要認真地審視該試題找出影響擬合度的因素,如考慮命題人員的初始意圖、測評目標與要求等,再決定這類試題的去留.因為Rasch模型作為檢測工具,只能檢測出有問題的試題,對于如何處理這類試題,需要結合實際情況做出判斷.

    4 結論

    本文以一份高三物理試卷中客觀題的質量分析為例,介紹了Rasch模型在物理學業(yè)質量評價中的應用.研究表明試題整體質量較好,信度較高,區(qū)分度合理,絕大多數試題達到了測量目標,能客觀地考查學生的能力水平.可以看出,中學教師編制該試題的能力水平較高,能夠客觀、準確地評價學生的物理學業(yè)質量.

    Rasch模型的分析功能比較多,本文中所提及的功能只是Rasch模型可用于試卷質量分析功能的一部分.因此在具體的應用中,由于實際的測量情況不同,測量者應該結合測量目標,選擇合理的Rasch模型對應的分析功能對測試進行分析[5].

    猜你喜歡
    均方殘差試題
    一類隨機積分微分方程的均方漸近概周期解
    基于雙向GRU與殘差擬合的車輛跟馳建模
    2021年高考數學模擬試題(四)
    基于殘差學習的自適應無人機目標跟蹤算法
    Beidou, le système de navigation par satellite compatible et interopérable
    2019年高考數學模擬試題(五)
    《陳涉世家》初三復習試題
    基于遞歸殘差網絡的圖像超分辨率重建
    自動化學報(2019年6期)2019-07-23 01:18:32
    2019屆高考數學模擬試題(二)
    基于抗差最小均方估計的輸電線路參數辨識
    電力建設(2015年2期)2015-07-12 14:15:59
    郁南县| 延川县| 施秉县| 得荣县| 公主岭市| 绥中县| 卓资县| 双牌县| 丹凤县| 辽源市| 老河口市| 天水市| 东丰县| 密云县| 蛟河市| 汤阴县| 海南省| 勐海县| 莎车县| 卓资县| 金堂县| 麻江县| 双城市| 徐闻县| 万源市| 新龙县| 西林县| 桐柏县| 鲁山县| 普安县| 荣昌县| 祁东县| 荔浦县| 娄底市| 漳浦县| 扎赉特旗| 桃园县| 察隅县| 龙口市| 安平县| 淳化县|