姚寧寧 陳炳為△ 申春悌 錢劉蘭 黃 灝
·應(yīng)用研究·
對數(shù)線性模型在評分者一致性研究方法中的應(yīng)用*
姚寧寧1陳炳為1△申春悌2△錢劉蘭1黃 灝1
目的研究對數(shù)線性模型在等級資料評分者一致性研究方法中的應(yīng)用。方法由高級和中級及以下職稱的醫(yī)生獨立收集慢性支氣管炎的四診信息,以口唇青紫程度為例,其評分為4個等級。采用不同的對數(shù)線性模型對觀測頻數(shù)進(jìn)行擬合,選擇擬合程度好的模型,再進(jìn)行一致性結(jié)構(gòu)分析。結(jié)果對三個對數(shù)線性模型進(jìn)行比較,得到等權(quán)重模型的結(jié)果最好,表明高級和中級及以下職稱的醫(yī)生之間存在正相關(guān)。結(jié)論在一致性研究中應(yīng)用對數(shù)線性模型,可以分析一致性結(jié)構(gòu),對特定的假設(shè)進(jìn)行檢驗,不再是應(yīng)用單個統(tǒng)計量總結(jié)一致性。
一致性評價 對數(shù)線性模型 中醫(yī) 慢性支氣管炎
隨著大規(guī)??蒲泻献餮芯康脑絹碓蕉嗪托路椒ǖ牟粩喑霈F(xiàn),一致性評價的重要意義越來越明顯。一般常用kappa系數(shù)評價兩種檢驗方法和同一方法兩次檢驗結(jié)果的一致性,它考慮了機遇因素對一致性的影響。然而,僅用單個的kappa系數(shù)總結(jié)一致性可能會損失一些重要信息,而且kappa值對邊際分布形式敏感,當(dāng)存在多個表格時,kappa系數(shù)也不能比較[1-2]。Tanner和Young提出構(gòu)建研究者間的一致性結(jié)構(gòu)。后來Alan采用對數(shù)線性模型構(gòu)建研究者間的一致結(jié)構(gòu),不再只是得到一致性評價的單個統(tǒng)計量,它可以檢驗一些特定的假設(shè),這些特定的參數(shù)用來解釋在獨立模型下單元格數(shù)值與期望值之間的差異,其特定假設(shè)的意義與一致性的意義是一致的[3]。
在中醫(yī)學(xué)的傳統(tǒng)辨證中,證候的診斷標(biāo)準(zhǔn)主要基于“望、聞、問、切”得到的四診資料,醫(yī)師根據(jù)四診信息所歸納出的證候是一個無法直接測量的綜合變量[4]。定量證候診斷是中醫(yī)證候規(guī)范的重點與難點[5]。中醫(yī)證候的量化主要在于兩個步驟:第一是四診信息的采集,從資料類型上看,四診信息通常由兩分類和(或)等級分類資料組成;第二是證候量化分類過程,可應(yīng)用現(xiàn)代測量理論和技術(shù)對醫(yī)師通過臨床觀察所收集的四診信息篩選,探索這些臨床表現(xiàn)與其證候之間的關(guān)系,如結(jié)構(gòu)方程模型、潛在類別模型[5]等。如果不同醫(yī)師在四診信息采集上存在偏差,將會對證候量化存在影響,因此四診信息的采集量化尤為重要。對中醫(yī)四診信息進(jìn)行一致性研究,可以提高中醫(yī)辨證的精確性和可重復(fù)性。本文的目的是研究對數(shù)線性模型在等級資料評分者一致性方法中的應(yīng)用。
對i×j的交叉表,對數(shù)線性模型要求i=j(luò)?;灸P?
mij是觀測頻數(shù),λ0是截距參數(shù),和分別為行變量(評估者A)和列變量(評估者B)的主效應(yīng)參數(shù),eij是殘差。基本模型中沒有包含交互,因為模型中滲透著交互或者評估者的等級可能相關(guān),但也可能由于其他原因。為了方便研究,可以用設(shè)計矩陣的方法來表示,因此基本模型也可以表示為:log M=Xλ+e。其中,X=■xb,xδ,xβ,xc」。M是觀測頻數(shù)的列向量;X是設(shè)計矩陣;λ是參數(shù)向量。Xb是基本模型的設(shè)計矩陣;Xδ是反應(yīng)評分者一致的設(shè)計矩陣;Xβ是定義模型有關(guān)特性的設(shè)計矩陣;Xc是協(xié)變量的設(shè)計矩陣。X的編碼通常有啞變量編碼和效應(yīng)編碼,常用啞變量編碼,但為了方便解釋,可以選擇效應(yīng)量編碼。假設(shè)上述參數(shù)都存在,那么可以推廣到廣義對數(shù)線性模型:
在對數(shù)線性模型中,一致性為兩部分:機遇一致和評分者一致[3]。模型擬合后計算廣義 kappa系數(shù)元格的實際觀測頻數(shù)與總頻數(shù)的比,θ2為對角線單元格的期望頻數(shù)與總頻數(shù)的比),意義是:特定假設(shè)下的模型未能解釋的一致和不一致的比例[2]。廣義kappa與Cohen′s kappa的θ2值不同,前者同時考慮到機遇和非機遇因素的影響,后者僅考慮到機遇因素的影響。根據(jù)選擇模型的分析結(jié)果,篩選出擬合程度好的模型,對于最后選擇的模型的特定參數(shù)可以用對角線優(yōu)勢比θ(diagonal odds ratio theta)解釋。當(dāng)模型中僅含有δ時,θ=exp(2δ),即 OR=exp(2δ),而當(dāng)模型中同時含有 β和 δ時,θ=exp(β+2δ),即 OR=exp(β+2δ)[2,7]。如果對角線單元格的等級發(fā)生率大于非對角線的,則OR>1,OR提供了描述評分者間一致性的另一種選擇[2,8]。
以高級職稱醫(yī)生和中級及以下職稱醫(yī)生分別對同一個患有慢性支氣管炎的病人的口唇青紫程度進(jìn)行評價為例,高級職稱醫(yī)生包括主任中醫(yī)師和副主任中醫(yī)師,中級及以下職稱醫(yī)生包括主治中醫(yī)師和住院中醫(yī)師。采用對數(shù)線性模型對其進(jìn)行一致性評價,數(shù)據(jù)整理如下(表1)。其中,B代表高級職稱醫(yī)生,A代表中級及以下職稱醫(yī)生,口唇青紫程度分為4個等級(0=無,1=輕度,2=中度,3=重度)。
表1 慢性支氣管炎口唇青紫程度評價的頻數(shù)表
從表1中可以看到,對角線單元格的頻數(shù)明顯多于非對角線單元格的頻數(shù)。在研究者中,假定各變量等級是同等重要的,不考慮誤診的情況和協(xié)變量的影響,則有三種模型,分別為:
(1)主效應(yīng)模型:
(2)等權(quán)重模型:
(3)帶有線性間交互的等權(quán)重模型:
口唇青紫的程度為等級變量,X采用效應(yīng)量編碼,對于模型 3,μi=i,μj=j(luò)。研究中使用 SAS PROC GENMOD步進(jìn)行分析,分析后結(jié)果見表2。
表2 三種對數(shù)線性模型的匯總
從表2得出:模型1說明高級職稱醫(yī)生和中級職稱及以下醫(yī)生在慢性支氣管炎口唇青紫程度的診斷之間存在相關(guān);模型2和模型3中P>0.05,說明模型擬合較好,兩者相對于模型1都有很大的提高,差異是具有統(tǒng)計學(xué)意義的,但是模型3相對于模型2的提高是沒有統(tǒng)計學(xué)意義的,所以最終選擇模型2,其各參數(shù)估計值見表3。根據(jù)模型2的參數(shù)估計值,得到模型的期望頻數(shù)(見表4)。
表3 模型2參數(shù)估計值
表4 等權(quán)重模型估計的期望頻數(shù)
研究最終選擇的模型2(等權(quán)重模型)得到廣義kappa=0.000,說明在該模型未能解釋的一致和不一致的比例接近于0,模型能很好地擬合觀測頻數(shù)。等權(quán)重模型中特定參數(shù) δ=3.068(ASE=0.3584,P<0.001),說明參數(shù)δ的設(shè)定具有統(tǒng)計學(xué)意義,一致性除了機遇因素造成外,還存在額外的一致。OR=exp(2δ)=462.2>1,表明高級職稱醫(yī)生和中級及以下職稱醫(yī)生在慢性支氣管炎口唇青紫程度的診斷之間存在正相關(guān)。對于i=1,2,3,4,高級職稱醫(yī)生的診斷是i+1的優(yōu)勢比中級及以下職稱醫(yī)生的診斷是i+1的優(yōu)勢要高出462.2倍。
對數(shù)線性模型的一致性是對一致性結(jié)構(gòu)進(jìn)行構(gòu)造。對數(shù)線性模型的主效應(yīng)模型所得的期望頻數(shù)與常用方法所求期望是一致的,其他模型均是考慮到一些特定的假設(shè),如果模型擬合程度好,則所求期望頻數(shù)與觀測頻數(shù)是非常接近的。廣義kappa接近于0,說明模型中參數(shù)的假設(shè)是有意義的,模型擬合較好;廣義kappa越接近于1,說明模型不能很好的擬合其觀測頻數(shù),機遇因素和非機遇因素的影響較小。應(yīng)用一致性的對數(shù)線性模型分析一致性的結(jié)構(gòu),而不再是應(yīng)用單個統(tǒng)計量來總結(jié)信息,它考慮到了變量間本身存在的線性關(guān)系、各變量等級的重要程度,以及協(xié)變量對一致性造成的影響,使得對一致性的結(jié)構(gòu)分析更加合理。
目前中醫(yī)臨床四診信息的采集方法仍然沿用傳統(tǒng)中醫(yī)學(xué)的望聞問切方法,如果缺乏四診信息采集規(guī)范,臨床信息則采集不統(tǒng)一,搜集的癥狀缺乏客觀性,就會導(dǎo)致在填寫臨床調(diào)查表時,不同的研究者對同一研究疾病患病的四診信息采集發(fā)生較大差異。創(chuàng)建規(guī)范的操作程序,讓各臨床單位研究者掌握統(tǒng)一的中醫(yī)臨床四診信息采集操作標(biāo)準(zhǔn),加強不同研究單位和不同研究者對四診信息采集的一致性研究,可以提高中醫(yī)臨床辨證的精確性和可重復(fù)性,可使臨床試驗中療效評價相對科學(xué)、客觀。將中醫(yī)診療結(jié)果量化,選擇合適的模型進(jìn)行分析,尋找出規(guī)律,會為中醫(yī)理論的傳承與發(fā)展提供巨大的幫助。
[1] Feinstein AR,Cicchetti DV.High agreement but low kappa:I.the problems of two paradoxes.Journal of clinical epidemiology,1990,43(6):543-549.
[2]Eye Av,Mun E.Analyzing Rater Agreement:Manifest Variable Methods.Mahwah,New Jersey:Law rence Erlbaum,2005.
[3]Tanner MA,Young MA.Modeling agreementamong raters.Journal of the American Statistical Association,1985,80(389):175-180.
[4]陳炳為,陳啟光,許碧云,等.潛在變量模型及其在中醫(yī)證候中的應(yīng)用概述.中國衛(wèi)生統(tǒng)計,2009,29(5):535-538.
[5]鄭建光,陳炳為,陳啟光,等.證實性因子分析在腦梗死病人中醫(yī)證候的應(yīng)用.中國衛(wèi)生統(tǒng)計,2011,28(5):504-506.
[6] Eye Av,Mun E.Log-linear modeling:Concepts,Interpretation,and Application.US:W iley,2013.
[7] Agresti A.A model for agreement between ratings on an ordinal scale.Biometrics,1988,44:539-548.
[8]Michelle C,Laura M,Debajyoti S.Beyond kappa:A review of inter rater agreement measures.The Canadian Journal of Statistics,1999,27(1):3-23.
“十二五”國家科技支撐計劃(2013BAI13B035);國家自然科學(xué)基因(81273190)
1.東南大學(xué)公共衛(wèi)生學(xué)院(210009)
2.南京中醫(yī)藥大學(xué)附屬常州市中醫(yī)醫(yī)院
△通信作者:陳炳為,E-mail:drchenbw@126.com;申春悌,E-mail:czsct@163.com
(責(zé)任編輯:鄧 妍)