王 洋 孫愛峰
(白城衛(wèi)生職工中等專業(yè)學(xué)校,吉林 白城 137000)
效標(biāo)關(guān)聯(lián)效度是衡量測驗(yàn)有效性或準(zhǔn)確度的一個重要指標(biāo),其含義是所考察的測驗(yàn)與效標(biāo)之間的一致程度。效標(biāo)是能夠體現(xiàn)測驗(yàn)?zāi)繕?biāo)的相對準(zhǔn)確的一個參照標(biāo)準(zhǔn),可用流行病學(xué)術(shù)語“金標(biāo)準(zhǔn)”描述,因此,效標(biāo)關(guān)聯(lián)效度又可稱為目標(biāo)(關(guān)聯(lián))效度或標(biāo)準(zhǔn)效度。當(dāng)效標(biāo)在測驗(yàn)之后稱為預(yù)測效度,可以預(yù)測學(xué)生在相同(近)領(lǐng)域?qū)π轮R學(xué)的如何;如果效標(biāo)與測驗(yàn)大體上同時存在稱為同時效度,對研究和改進(jìn)測驗(yàn)方法,檢查新編制的測驗(yàn)是否可行有一定意義[1]。所以,必須用適宜的統(tǒng)計(jì)量來估計(jì)效標(biāo)關(guān)聯(lián)效度,這樣才能評價一個測驗(yàn)的有效性。在統(tǒng)計(jì)學(xué)上,一般采用相關(guān)系數(shù)或一致系數(shù)表示。
當(dāng)測驗(yàn)成績?yōu)殡p變量正態(tài)分布時,應(yīng)計(jì)算積差相關(guān)系數(shù)。計(jì)算公式為:
式中x、y分別表示兩測驗(yàn)的成績。
在兩次測驗(yàn)中,一個是正態(tài)分布的連續(xù)變量,另一個是真正的二分變量(如及格與不及格,達(dá)標(biāo)與未達(dá)標(biāo)),此時宜用點(diǎn)二列相關(guān)系數(shù)表示效標(biāo)關(guān)聯(lián)效度。計(jì)算公式為:
式中p為及格人數(shù)百分?jǐn)?shù),q為不及格人數(shù)百分?jǐn)?shù),st為整個測驗(yàn)的標(biāo)準(zhǔn)差。
當(dāng)測驗(yàn)成績不服從雙變量正態(tài)分布、分布類型未知或原始數(shù)據(jù)用等級表示時,需用等級相關(guān)系數(shù)表示效標(biāo)關(guān)聯(lián)效度。計(jì)算公式為:
式中d為每對觀察值X、Y的秩次之差,n為對子數(shù)。
當(dāng)相同秩次較多時,宜用下式計(jì)算校正rs值rs’。
式中TX(TY)=Σ(t3-t)/12,t為X或Y中相同秩次的個數(shù)。
一般地說,相關(guān)系數(shù)r>0.7時,表示測驗(yàn)的有效性較高;0.4<r<0.7時表示測驗(yàn)的有效性為中等;r<0.4時,表示測驗(yàn)的有效性較低。
檢驗(yàn)總體相關(guān)系數(shù)ρ或ρS是否為零可用查表法或作t檢驗(yàn)(n>50時)。
【例1】某教師自編一套某課程測驗(yàn)題,預(yù)測學(xué)生成績,用百分制評分,一年后再次進(jìn)行測驗(yàn),以及格和不及格評分,及格記1分,不及格記0分。測試結(jié)果見表1[2]。試估計(jì)該測驗(yàn)的效標(biāo)關(guān)聯(lián)效度。
表1 某課程兩次測驗(yàn)成績及效標(biāo)效度計(jì)算表
查r界值表,P>0.05,說明自編測驗(yàn)的效標(biāo)關(guān)聯(lián)效度較低,不能預(yù)測學(xué)生的學(xué)習(xí)成績。
但是,本例連續(xù)變量的偏態(tài)量數(shù)[2]SK=1.91大于0.3,呈正偏態(tài)分布。因此,應(yīng)計(jì)算等級相關(guān)系數(shù)。
經(jīng)計(jì)算,rs’=0.41,查rs界值表,P>0.05,說明自編測驗(yàn)的效標(biāo)關(guān)聯(lián)效度較低。但是,由于rs’=0.41,說明測驗(yàn)具有中等效標(biāo)關(guān)聯(lián)效度,在一定程度上可以預(yù)測學(xué)生的學(xué)習(xí)成績。所以,用相關(guān)系數(shù)估計(jì)效標(biāo)關(guān)聯(lián)效度時一定要注意計(jì)算相關(guān)系數(shù)的應(yīng)用條件。
設(shè)觀察對象的某定性或等級指標(biāo)分成k類或級,n個學(xué)生兩種測驗(yàn)的評判結(jié)果整理如表2。
表2 對定性指標(biāo)的兩種測驗(yàn)?zāi)J?/p>
此時一致系數(shù)的計(jì)算公式為:
式中p0為實(shí)際一致率,pe為期望一致率。
對于2個測驗(yàn),如果其中一個為標(biāo)準(zhǔn)測驗(yàn),那么一致系數(shù)就是標(biāo)準(zhǔn)效度。κ越大,測驗(yàn)的有效性越好。通常的評價標(biāo)準(zhǔn)為κ>0.75為好,0.4<κ<0.75為較好,κ<0.4為差。
假設(shè)檢驗(yàn)需選用單側(cè)檢驗(yàn),因此可用u0.05=1.645、u0.01=2.362作出統(tǒng)計(jì)推斷。
表3 某校50名學(xué)生2次測驗(yàn)成績分布對比表
【例2】某學(xué)校將學(xué)生成績分為優(yōu)秀、良好、中等、及格和不及格5個等級。該校某班級50名學(xué)生2次測驗(yàn)成績于各等級的人數(shù)分布見表3,試問2次測驗(yàn)的一致性如何?
經(jīng)計(jì)算:p0=0.520,pe=0.252 ,κ=0.358,u=4.520。
u>2.326,P<0.01,可認(rèn)為2次測驗(yàn)的一致性較差,第2次測驗(yàn)成績優(yōu)于第1次。
對定量指標(biāo)的兩種測驗(yàn)來說,|κ|≤|r|;對定性指標(biāo)的兩種測驗(yàn)來說,|κ|≤|r|,用樣本推斷總體時,用χ2檢驗(yàn)有無相關(guān)等價u檢驗(yàn)有無一致;從排秩指標(biāo)的兩種測驗(yàn)來說,κ=rs,用樣本推斷總體時無相關(guān)檢驗(yàn)等價有無一致檢驗(yàn)。
對同一指標(biāo)的不同測驗(yàn),用一致系數(shù)測量一致性最適宜,比用相關(guān)系數(shù)測量其相關(guān)性更嚴(yán)格更有實(shí)際意義;相關(guān)系數(shù)一般用于兩個或多個(多個可用類相關(guān)系數(shù))不同指標(biāo)的相關(guān)性。
在實(shí)際工作中,應(yīng)根據(jù)原始資料的類型(必要時,各類變量可以相互轉(zhuǎn)化或進(jìn)行變量變換)和分布類型的不同以及有無標(biāo)準(zhǔn)測量手段等因素,選擇究竟采用相關(guān)系數(shù)還是一致系數(shù)估計(jì)效標(biāo)關(guān)聯(lián)效度,以提高測驗(yàn)的有效性和準(zhǔn)確度。
[1]周東海.醫(yī)學(xué)教育管理學(xué)[M].北京:人民衛(wèi)生出版社,1996:153-154.
[2]韓靜禮,何德蘭,劉海石.中等醫(yī)學(xué)教育研究方法[M].潞西:德宏民族出版社,1994:100-118.
[3]黃正南.一致系數(shù)的公式及其與相關(guān)系數(shù)的關(guān)系[J].中國衛(wèi)生統(tǒng)計(jì).1995,12(5):1-4.