陳利,王楊,李衛(wèi)
在分析定性資料時, χ2檢驗是一種常用的統(tǒng)計方法。χ2檢驗多用于比較兩個及兩個以上樣本的率(構成比)或兩個分類變量的關聯性分析,如比較兩種藥物治療的有效率,比較兩種診斷試劑的靈敏度和特異度等。χ2檢驗用途雖廣,但并非所有定性資料都可選用χ2檢驗,而且不同的研究目的計算χ2值的公式也不完全相同。若不考慮資料類型、使用條件和檢驗目的而盲目套用χ2公式就會有統(tǒng)計學錯誤,甚至得到相反結論。本文通過分析常見χ2檢驗誤用實例,來說明如何正確使用χ2檢驗。
例1:某醫(yī)院有疑似心肌梗死病例112人,現通過甲、乙兩種方法對同一份血清標本的心肌酶進行檢測判斷是否為心肌梗死,結果如表1,比較兩種檢測方法的陽性率有無差別?[1]
表1 甲乙兩種方法測定結果比較
研究者用獨立樣本χ2檢驗進行分析,得P>0.05。結論為兩種檢測方法的陽性率差異無統(tǒng)計學意義。
解析:分析定性資料前,首先應明確資料是獨立樣本還是配對樣本。若為同一樣本一分為二分別接受兩種檢驗,即為配對設計的列聯表資料,應選擇配對設計的χ2檢驗;若為兩組不同的樣本分別接受處理,則為獨立列聯表資料,此時可用獨立樣本χ2檢驗。
本例為配對設計資料,分析配對設計比較兩樣本率有無差異時應選用配對設計兩樣本率比較的McNemanr 檢驗,但應注意當b+c<40時,須計算校正的χ2值[2]。例中b+c=30<40,所以應選用校正公式進行分析。計算得χ2=5.633,P=0.018,結論為兩種方法檢測的陽性率差異有統(tǒng)計學意義。
例2:某研究欲比較兩種治療方法的病死率。將43例急性心肌梗死患者分為復方丹參注射液治療組和非復方丹參注射液治療組。治療后24小時死亡情況見表2。[3]
表2 急性心肌梗死患者治療后24小時死亡情況
研究者選用一般χ2檢驗,得χ2=4.329,P<0.05。認為兩組病死率差異有統(tǒng)計學意義。
解析:對于可用χ2檢驗分析的資料,首先應對資料進行檢驗,然后選擇合適的分析方法:①當總樣本量n≥40且所有格子的理論頻數T≥5時,選擇四格表χ2;②當總樣本量n≥40且所有格子的理論頻數滿足1≤T<5時,選擇校正的四格表χ2;③當總樣本量n<40或T<1時,應選擇Fisher確切檢驗。
經分析,該資料滿足條件(2),故應選擇校正的四格表χ2公式。計算得χ2=2.938,P>0.05。結論為兩組病死率差異無統(tǒng)計學意義。
例3:某醫(yī)院為研究阿托伐他汀與辛伐他汀降血脂的療效。將223例高血脂患者分為阿托伐他汀治療組和辛伐他汀治療組。治療4周后療效見表3。
表3 高血脂患者治療4周后療效(例)
研究者用χ2檢驗計算得χ2=6.69,P>0.1。認為兩種藥物降血脂效果差異無統(tǒng)計學意義。
解析:資料中組別(分組變量)是二分類變量,療效(結局變量)為有序變量,因此屬單向有序列聯表資料(結局變量有序)。因χ2檢驗不考慮結局變量的有序性,得到的結論只能說明兩組病人在5個療效等級上的頻數分布是否有差異,而不能說明兩組的療效是否有差異。
因此資料應選用適合單向有序列聯表資料(結局變量有序)的分析方法,如Wilcoxon秩和檢驗。計算得Uc=2.49,0.01<P<0.02,。結論為兩種藥物降血脂的療效差異有統(tǒng)計學意義。
根據上述案例分析可知, χ2檢驗并非適用于所有定性資料的分析,臨床研究中,應充分考慮資料類型及分析目的,以選擇合理的分析方法。
[1] 李明,賈秀琴,陳嫚茵,等. 醫(yī)學研究中定性資料假設檢驗方法誤用分析 . 深圳中西醫(yī)結合雜志 , 2007, 17: 95-97.
[2] 潘興儀 . 卡方檢驗在醫(yī)學科研中的應用 . 廣西醫(yī)學 , 2001, 23: 1396-1401.
[3] 方積乾主編 . 衛(wèi)生統(tǒng)計學 . 第 6 版 . 北京 : 人民衛(wèi)生出版社 , 2007. 161.