• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      偏態(tài)分布下多維測驗(yàn)合成信度區(qū)間估計(jì)的比較

      2014-06-15 01:52:26葉寶娟
      教育測量與評(píng)價(jià) 2014年11期
      關(guān)鍵詞:樣本容量置信區(qū)間測驗(yàn)

      葉寶娟 楊 強(qiáng)

      偏態(tài)分布下多維測驗(yàn)合成信度區(qū)間估計(jì)的比較

      葉寶娟 楊 強(qiáng)

      用合成信度能比α系數(shù)更準(zhǔn)確地估計(jì)測驗(yàn)的合成信度。本文用模擬研究比較了兩種估計(jì)多維測驗(yàn)合成信度置信區(qū)間的方法,結(jié)果發(fā)現(xiàn)用Delta法通過近似計(jì)算得到的標(biāo)準(zhǔn)誤,與Bootstrap法的結(jié)果差別很小,而且比Bootstrap法簡單得多,因此推薦使用Delta法估計(jì)多維測驗(yàn)合成信度的置信區(qū)間。

      多維測驗(yàn);合成信度;置信區(qū)間;Bootstrap法;Delta法

      用合成信度能比α系數(shù)更準(zhǔn)確地估計(jì)測驗(yàn)的合成信度。[1][2][3][4]信度是一個(gè)總體參數(shù),其值未知,在實(shí)證研究中通常用樣本信度來估計(jì)。低信度的測驗(yàn)分?jǐn)?shù)包含大量誤差,對(duì)于許多研究來說是有問題的。[5]在評(píng)價(jià)測驗(yàn)質(zhì)量時(shí),點(diǎn)估計(jì)得到的信息有限,最好用信度的區(qū)間估計(jì)補(bǔ)充信度點(diǎn)估計(jì)得到的信息,以此得到在所研究的總體上重復(fù)取樣時(shí)信度的精確性。[6][7][8]應(yīng)用研究中經(jīng)常碰到多維測驗(yàn)(multidimensionaltest),即整個(gè)測驗(yàn)測量了不止一個(gè)潛變量。葉寶娟和溫忠麟用Delta推導(dǎo)出計(jì)算多維測驗(yàn)合成信度置信區(qū)間。[9]不僅如此,楊強(qiáng)、葉寶娟和溫忠麟比較了測驗(yàn)題目為正態(tài)分布時(shí),兩種估計(jì)多維測驗(yàn)合成信度置信區(qū)間的方法:Bootstrap法和Delta法,結(jié)果發(fā)現(xiàn)Delta法是一種簡單而準(zhǔn)確的估計(jì)多維測驗(yàn)合成信度置信區(qū)間較好的方法,推薦用這種方法估計(jì)多維測驗(yàn)合成信度的置信區(qū)間。[10]那么,當(dāng)測驗(yàn)題目為偏態(tài)分布時(shí),Delta法的表現(xiàn)如何,是否可以用來估計(jì)多維測驗(yàn)合成信度的置信區(qū)間呢?本文將對(duì)此進(jìn)行探討。

      本文首先簡單介紹了多維測驗(yàn)合成信度及估計(jì)多維測驗(yàn)合成信度置信區(qū)間的兩種方法:Bootstrap法和Delta法,然后用蒙特卡洛(Monte Carlo)模擬研究比較兩種估計(jì)多維測驗(yàn)合成信度置信區(qū)間的方法,進(jìn)而推薦比較好的方法估計(jì)多維測驗(yàn)合成信度的置信區(qū)間。

      一、多維測驗(yàn)的合成信度

      若一個(gè)測驗(yàn)由p個(gè)題目x1,x2,…,xp測量了n個(gè)潛變量F1,F(xiàn)2,…,F(xiàn)n,δ1,δ2,…,δp為x1,x2,…,xp的測量誤差,則有

      其中,λjm表示題目j在第m個(gè)潛變量上的負(fù)荷。

      假設(shè)合成總分是有意義的,則整份測驗(yàn)X= x1+x2+…+xp的合成信度為[11][12]

      二、估計(jì)多維測驗(yàn)合成信度置信區(qū)間的方法

      1.Bootstrap法

      用Bootstrap法需要對(duì)一個(gè)固定的樣本(當(dāng)作總體)進(jìn)行重復(fù)取樣,比較麻煩,但計(jì)算的結(jié)果是一種實(shí)證結(jié)果,通常作為真值的反映,可以用來比較其他方法計(jì)算結(jié)果是否合理。Bootstrap法有多種取樣方案,本文所說的Bootstrap法是從一個(gè)給定的樣本中有放回地重復(fù)取樣以產(chǎn)生出許多樣本,即將原始樣本當(dāng)作總體,從這個(gè)總體中重復(fù)取樣以得到類似于原始樣本的Bootstrap樣本。[13]這種方法比較麻煩,一般的應(yīng)用工作者不易掌握。

      2.Delta法

      用Delta法估計(jì)多維測驗(yàn)合成信度的的標(biāo)準(zhǔn)誤為

      三、研究設(shè)計(jì)

      本研究考慮以下變量:題目分布、因子個(gè)數(shù)、每個(gè)因子題數(shù)、因子相關(guān)、因子負(fù)荷、樣本容量、估計(jì)方法。

      (1)題目分布:設(shè)置的題目分布分別為均勻分布、χ2(3)分布。(被試間因素)

      (2)因子個(gè)數(shù):設(shè)置的因子個(gè)數(shù)為2、4。(被試間因素)

      (3)因子相關(guān):設(shè)置兩個(gè)因子之間的相關(guān)在0~0.60之間,分為3種情況:高相關(guān)(0.40~0.60)、中相關(guān)(0.20~0.40)、低相關(guān)(0~0.20)。(被試間因素)

      (4)每個(gè)因子上題數(shù):設(shè)置的題數(shù)為3、6、10。(被試間因素)

      (5)因子負(fù)荷:設(shè)置的因子負(fù)荷在0.30~0.90之間,分為3種情況:高負(fù)荷(0.70~0.90)、中負(fù)荷(0.50~0.70)、低負(fù)荷(0.30~0.50)。(被試間因素)

      (6)樣本容量:設(shè)置的樣本容量分別為300、500、1000。(被試間因素)

      (7)估計(jì)方法:Bootstrap法和Delta法。(被試內(nèi)因素)

      本模擬實(shí)驗(yàn)是一個(gè)2×2×3×3×3×3×2的設(shè)計(jì),共有324種水平組合。

      在每種處理(即水平組合)中,模擬一批數(shù)據(jù),然后隨機(jī)取一個(gè)擬合好的樣本,即RMSEA和SRMR小于0.08,NNFI和CFI大于0.90,用Delta法和Bootstrap法計(jì)算合成信度的標(biāo)準(zhǔn)誤。比較兩個(gè)標(biāo)準(zhǔn)誤的差異,也就是比較了合成信度的置信區(qū)間的差異。并且還可以了解當(dāng)測驗(yàn)題目、因子負(fù)荷和樣本容量變化時(shí),合成信度的置信區(qū)間及其不同方法的差異是如何變化的。

      四、研究結(jié)果

      計(jì)算用Bootstrap法得到的標(biāo)準(zhǔn)誤時(shí),只使用收斂到恰當(dāng)解且模型擬合較好的樣本的結(jié)果。因?yàn)锽ootstrap法得到的標(biāo)準(zhǔn)誤是一種實(shí)證結(jié)果,可以看作是真值,因而可以將Delta法計(jì)算的標(biāo)準(zhǔn)誤與其比較來計(jì)算偏差。比較的標(biāo)準(zhǔn)與單維測驗(yàn)比較的標(biāo)準(zhǔn)相同,也就是說,如果標(biāo)準(zhǔn)誤相差0.01,信度的下限就會(huì)相差0.02。從應(yīng)用角度看,如果信度下限相差0.01(相應(yīng)的標(biāo)準(zhǔn)誤相差0.005),表明只是微小差別;如果信度下限相差0.02(相應(yīng)的標(biāo)準(zhǔn)誤相差0.01),表明有點(diǎn)差別;如果信度下限相差0.05(相應(yīng)的標(biāo)準(zhǔn)誤相差0.025),則表明有實(shí)質(zhì)差別。

      1.均勻分布模擬研究結(jié)果

      在均態(tài)分布下設(shè)計(jì)的162個(gè)處理?xiàng)l件中,有143個(gè)處理?xiàng)l件對(duì)應(yīng)的Bootstrap樣本,有恰當(dāng)解且結(jié)構(gòu)模型擬合較好的樣本比例為100%。除在4因子3個(gè)題目的因子相關(guān)低時(shí),樣本容量為300的負(fù)荷分別為低、中、高的3個(gè)處理的Bootstrap樣本,有恰當(dāng)解且結(jié)構(gòu)模型擬合較好的樣本比例在80%以上但不足90%外,其余16個(gè)處理?xiàng)l件對(duì)應(yīng)的Bootstrap樣本,有恰當(dāng)解且結(jié)構(gòu)模型擬合較好的樣本比例都在90%以上。因?yàn)锽ootstrap法賴以計(jì)算的樣本不少于800個(gè),所以計(jì)算結(jié)果有效。

      (1)Delta法的標(biāo)準(zhǔn)誤

      比較Delta法和Bootstrap法的結(jié)果(參見圖1)。Delta法的標(biāo)準(zhǔn)誤偏差(絕對(duì)值)有正有負(fù),但都很小,均小于0.005,在因子負(fù)荷為高時(shí),標(biāo)準(zhǔn)誤偏差均小于或等于0.001,尤其是在因子個(gè)數(shù)為4,題數(shù)較多(6,10)、因子負(fù)荷為高時(shí),標(biāo)準(zhǔn)誤偏差為0。因此,可以認(rèn)為Delta法估計(jì)的標(biāo)準(zhǔn)誤是近似無偏的。

      (2)合成信度的標(biāo)準(zhǔn)誤變化情況

      保持其他條件不變,隨著因子個(gè)數(shù)的增加,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤會(huì)變小。保持其他條件不變,隨著因子相關(guān)的增加,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤不一定減小。保持其他條件不變,隨著題目個(gè)數(shù)的增加,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤減小。保持其他條件不變,隨著負(fù)荷的升高,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤減小。保持其他條件不變,隨著樣本容量的增加,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤減小。

      總之,因子越多、題目越多、負(fù)荷越高或者樣本容量越大,合成信度的標(biāo)準(zhǔn)誤越小,從而估計(jì)的合成信度越精確。容易看出,用Delta法得到的標(biāo)準(zhǔn)誤與用Bootstrap法得到的標(biāo)準(zhǔn)誤變化情況一致。

      圖1 用Delta法和Bootstrap法計(jì)算的合成信度標(biāo)準(zhǔn)誤的差值箱型圖

      2.χ2(3)分布模擬研究結(jié)果

      在χ2(3)分布下設(shè)計(jì)的162個(gè)處理?xiàng)l件中,有142個(gè)處理?xiàng)l件對(duì)應(yīng)的Bootstrap樣本,有恰當(dāng)解且結(jié)構(gòu)模型擬合較好的樣本比例為100%。除在4因子3個(gè)題目的因子相關(guān)低時(shí),樣本容量為300的負(fù)荷分別為低、中的處理,及樣本容量為500的負(fù)荷為低的處理的Bootstrap樣本,有恰當(dāng)解且結(jié)構(gòu)模型擬合較好的樣本比例在80%以上但不足90%外,其余17個(gè)處理?xiàng)l件對(duì)應(yīng)的Bootstrap樣本,有恰當(dāng)解且結(jié)構(gòu)模型擬合較好的樣本比例都在90%以上。因?yàn)锽ootstrap法賴以計(jì)算的樣本不少于800個(gè),所以計(jì)算結(jié)果有效。

      (1)Delta法的標(biāo)準(zhǔn)誤

      比較Delta法和Bootstrap法的結(jié)果(參見圖2)。Delta法的標(biāo)準(zhǔn)誤偏差(絕對(duì)值)有正有負(fù),但都很小,均小于0.005,在題目較多(6,10)、因子負(fù)荷為高時(shí),標(biāo)準(zhǔn)誤偏差均小于或等于0.001。因此,可以認(rèn)為Delta法估計(jì)的標(biāo)準(zhǔn)誤是近似無偏的。

      圖2 用Delta法和Bootstrap法計(jì)算的合成信度標(biāo)準(zhǔn)誤的差值箱型圖

      (2)合成信度的標(biāo)準(zhǔn)誤變化情況

      保持其他條件不變,隨著因子個(gè)數(shù)的增加,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤會(huì)變小。但是有兩個(gè)例外,在因子相關(guān)為低、中相關(guān),題數(shù)為3,樣本容量為300,因子負(fù)荷為低時(shí),4個(gè)因子的樣本的標(biāo)準(zhǔn)誤比兩個(gè)因子的樣本的標(biāo)準(zhǔn)誤大。這可能與在這兩種情況下,Bootstrap法有恰當(dāng)解且結(jié)構(gòu)模型擬合較好的樣本百分比不同有關(guān)。

      保持其他條件不變,隨著因子相關(guān)的增加,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤減小。保持其他條件不變,隨著題目個(gè)數(shù)的增加,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤減小。保持其他條件不變,隨著負(fù)荷的升高,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤減小。保持其他條件不變,隨著樣本容量的增加,用Bootstrap法估計(jì)的標(biāo)準(zhǔn)誤減小。

      總之,因子越多、相關(guān)越高、題目越多、負(fù)荷越高或者樣本容量越大,合成信度的標(biāo)準(zhǔn)誤越小,從而估計(jì)的合成信度越精確。容易看出,用Delta法得到的標(biāo)準(zhǔn)誤與Bootstrap法得到的標(biāo)準(zhǔn)誤變化情況一致。

      3.模擬研究小結(jié)

      相比于Bootstrap法,Delta法估計(jì)的標(biāo)準(zhǔn)誤是比較精確的,而LISREL輸出的標(biāo)準(zhǔn)誤有較大的偏差。因此,可以使用Delta法計(jì)算合成信度的置信區(qū)間。

      因子越多、題目越多、負(fù)荷越高或者樣本容量越大,合成信度的標(biāo)準(zhǔn)誤越小,從而估計(jì)的合成信度越精確。用Delta法得到的標(biāo)準(zhǔn)誤與Bootstrap法得到的標(biāo)準(zhǔn)誤變化情況一致。

      五、結(jié)論

      (1)Delta法的標(biāo)準(zhǔn)誤與Bootstrap法的標(biāo)準(zhǔn)誤差異很小。Bootstrap法的結(jié)果是一種實(shí)證結(jié)果,可以作為真值看待,但Bootstrap法計(jì)算過程相當(dāng)麻煩,尤其是在題目很多,模型比較復(fù)雜時(shí),計(jì)算機(jī)進(jìn)行較大樣本的Bootstrap抽樣需要很長時(shí)間。Delta法通過近似計(jì)算得到標(biāo)準(zhǔn)誤,與Bootstrap法的結(jié)果差別很小,而且比Bootstrap法簡單得多。因此,推薦使用Delta法估計(jì)多維測驗(yàn)合成信度的置信區(qū)間。

      (2)隨著因子個(gè)數(shù)的增加、題目個(gè)數(shù)的增加、負(fù)荷的升高或樣本容量的增多,用Bootstrap法(還有Delta法)估計(jì)的多維測驗(yàn)合成信度的標(biāo)準(zhǔn)誤傾向于減小。

      [1]溫忠麟,葉寶娟.測驗(yàn)信度估計(jì):從α系數(shù)到內(nèi)部一致性信度[J].心理學(xué)報(bào),2011,43(7):821~829.

      [2]葉寶娟.偏態(tài)分布下單維測驗(yàn)合成信度三種區(qū)間估計(jì)的比較[J].教育測量與評(píng)價(jià),2012(10):28~32.

      [3][7]葉寶娟,溫忠麟.單維測驗(yàn)合成信度三種區(qū)間估計(jì)的比較[J].心理學(xué)報(bào),2011,43(4):453~461.

      [4][8][9]葉寶娟,溫忠麟.用Delta法估計(jì)多維測驗(yàn)合成信度的置信區(qū)間[J].心理科學(xué),2012,35(6):1213~1217.

      [5]Lucas,R.E.,&Donnellan,M.B.EstimatingtheReliability of Single-Item Life Satisfaction Measures:Results from Four National Panel Studies[J].Social Indicators Research, 2011,105(3):323~331.

      [6]Raykov,T.,&Shrout,P.E.Reliability of scales with general structure:Point and interval estimation using a structuralequationmodelingapproach[J].StructuralEquationModeling,2002,9(2):195~212.

      [10]楊強(qiáng),葉寶娟,溫忠麟.兩種估計(jì)多維測驗(yàn)合成信度置信區(qū)間方法比較[J].心理學(xué)探新,2014,34(1):43~47.

      [11]屠金路,王庭照,金瑜.結(jié)構(gòu)方程模型下多因子非同質(zhì)測量合成分?jǐn)?shù)的信度估計(jì)[J].心理科學(xué),2010,33 (3):666~669.

      [12]Yang,Y.,&Green,S.B.A Note on Structural Equation Modeling Estimates of Reliability[J].Structural Equation Modeling,2010,17(1):66~81.

      [13]Wen,Z.,Marsh,H.W.,&Hau,K.T.Structural E-quationModelofLatentInteractions:AnAppropriateStandardizedSolutionandItsScaleFreeProperties[J].StructuralEquationModel,2010,17(1):1~22.

      責(zé)任編輯/王彩霞

      G40-058.1

      A

      1674-1536(2014)11-0008-04

      本研究獲得教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目(13YJC190029)、全國教育科學(xué)規(guī)劃教育部重點(diǎn)課題“均等化視角下的省級(jí)義務(wù)教育政策績效評(píng)估研究”(DFA130249)、江西省高校人文社會(huì)科學(xué)研究項(xiàng)目(JY1320)資助。

      葉寶娟/江西師范大學(xué)心理學(xué)院教師,江西師范大學(xué)心理學(xué)院博士后。(南昌 330022)

      楊 強(qiáng)/江西師范大學(xué)教育學(xué)院教師。

      猜你喜歡
      樣本容量置信區(qū)間測驗(yàn)
      定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
      p-范分布中參數(shù)的置信區(qū)間
      多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
      采用無核密度儀檢測壓實(shí)度的樣本容量確定方法
      列車定位中置信區(qū)間的確定方法
      《新年大測驗(yàn)》大揭榜
      趣味(語文)(2018年7期)2018-06-26 08:13:48
      兩個(gè)處理t測驗(yàn)與F測驗(yàn)的數(shù)學(xué)關(guān)系
      考試周刊(2016年88期)2016-11-24 13:30:50
      你知道嗎?
      廣義高斯分布參數(shù)估值與樣本容量關(guān)系
      多種檢測目標(biāo)下樣本容量設(shè)計(jì)的比較
      广宗县| 上饶县| 紫云| 嘉定区| 东阿县| 甘肃省| 龙陵县| 长治县| 长葛市| 湖口县| 来宾市| 五峰| 龙泉市| 阳东县| 阳西县| 武邑县| 睢宁县| 靖远县| 克东县| 镇安县| 封丘县| 罗山县| 西峡县| 建德市| 岳池县| 沈丘县| 东乌| 突泉县| 南部县| 璧山县| 曲靖市| 永靖县| 棋牌| 仁寿县| 镇江市| 江陵县| 华阴市| 融水| 高邑县| 怀集县| 和龙市|