南方醫(yī)科大學(xué)南京臨床醫(yī)院(南京軍區(qū)南京總醫(yī)院醫(yī)務(wù)部)(210002) 劉玉秀 繆華章 陸夢(mèng)潔 陳 林
定量方法對(duì)比研究重復(fù)測(cè)量設(shè)計(jì)Bland-Altman一致限LoA的可信區(qū)間估計(jì)
南方醫(yī)科大學(xué)南京臨床醫(yī)院(南京軍區(qū)南京總醫(yī)院醫(yī)務(wù)部)(210002) 劉玉秀 繆華章 陸夢(mèng)潔 陳 林
目的本文將介紹兩種不同重復(fù)測(cè)量設(shè)計(jì)情形一致性評(píng)價(jià)的Bland-Altman一致限LoA及其可信區(qū)間估計(jì)方法,并探討兩種不同設(shè)計(jì)情形中分別涉及的兩種不同可信區(qū)間估計(jì)方法的統(tǒng)計(jì)學(xué)性能,為方法學(xué)的選擇應(yīng)用提供理論依據(jù)。方法根據(jù)所測(cè)量樣本真值是否變化,將重復(fù)測(cè)量設(shè)計(jì)分為兩種類型,分別給出其Bland-Altman一致限LoA及其可信區(qū)間估計(jì)的兩種方法(一種是Bland-Altman法,簡(jiǎn)稱B-A法;另一種是方差估計(jì)反推法,簡(jiǎn)稱MOVER法),借助Monte-Carlo模擬技術(shù),在正態(tài)分布假定下,設(shè)定不同的樣本量、不同的個(gè)體內(nèi)變異性,分別采用B-A法和MOVER法,模擬獲得95%LoA范圍的95%可信區(qū)間對(duì)總體設(shè)定的覆蓋率,用覆蓋率與95%的接近程度評(píng)價(jià)不同方法的統(tǒng)計(jì)學(xué)性能,理論上該覆蓋率與95%越接近,反映方法的統(tǒng)計(jì)學(xué)性能越好。結(jié)果用B-A法估計(jì)LoA可信區(qū)間的覆蓋率隨樣本量的增大而增大,樣本量為20以下時(shí)覆蓋率不足90%,即使在樣本量達(dá)到250時(shí),其覆蓋率仍在94%以下,而MOVER法覆蓋率始終緊緊圍繞事先設(shè)定的可信度95%微小波動(dòng),甚至在樣本量為10時(shí)覆蓋率也能接近95%。結(jié)論MOVER法用于方法對(duì)比研究重復(fù)測(cè)量設(shè)計(jì)的LoA可信區(qū)間估計(jì)具有很好的統(tǒng)計(jì)學(xué)性能。
方法對(duì)比研究 重復(fù)測(cè)量 Bland-Altman法 一致限 可信區(qū)間 MOVER法
醫(yī)學(xué)研究中常常會(huì)遇到兩種測(cè)量方法對(duì)比研究的一致性評(píng)價(jià)問題。就兩種測(cè)量方法對(duì)同一樣本各測(cè)量一次的設(shè)計(jì)情形,進(jìn)行一致性評(píng)價(jià)的統(tǒng)計(jì)學(xué)方法可考慮使用Bland和Altman提出的一致限(lim its of agreement,LoA)方法[1],通過計(jì)算兩種方法結(jié)果間差異的均數(shù)及其標(biāo)準(zhǔn)差獲得LoA,根據(jù)其是否在可接受的誤差范圍內(nèi)來判定兩測(cè)量方法間的一致性。目前,應(yīng)用Bland-A ltman一致限LoA進(jìn)行方法對(duì)比研究的一致性評(píng)價(jià)得到普遍認(rèn)可[2],但有兩方面的問題并未引起足夠的重視。第一個(gè)問題是,LoA在概念上只能屬于統(tǒng)計(jì)描述的范疇,反映的是所測(cè)量樣本特征,并未涉及對(duì)總體的推斷,會(huì)誤導(dǎo)一致性的評(píng)價(jià),甚至得出錯(cuò)誤的結(jié)論。正是由于這一極其重要并帶有普遍性的問題,引起不少學(xué)者的注意,強(qiáng)烈呼吁要進(jìn)行一致性的正確評(píng)價(jià),必須考慮樣本抽樣誤差的問題[3-5]。甚至有學(xué)者指出,LoA不能作為一致性判定的限值,其可信區(qū)間的限值才是真正的一致性限值[5]。第二個(gè)問題是,在方法對(duì)比研究中,即使采用了重復(fù)測(cè)量設(shè)計(jì),但未能很好地按照重復(fù)測(cè)量機(jī)制應(yīng)用Bland-Altman法進(jìn)行一致性評(píng)價(jià),甚至還存在方法學(xué)上的錯(cuò)誤[6]。
本文將對(duì)方法對(duì)比研究重復(fù)測(cè)量設(shè)計(jì)兩種不同情形一致性評(píng)價(jià)的Bland-Altman一致性限值LoA及其可信區(qū)間估計(jì)方法進(jìn)行介紹,并通過對(duì)兩種不同設(shè)計(jì)情形中分別涉及的兩種不同可信區(qū)間估計(jì)方法的Monte-Carlo模擬實(shí)驗(yàn),評(píng)價(jià)其統(tǒng)計(jì)學(xué)性能,為方法學(xué)的選擇應(yīng)用提供理論依據(jù)。
Bland和Altman曾多次引用Bow ling提供的數(shù)據(jù)作為例子[7-8]。測(cè)量心排量的兩種方法分別是阻抗心動(dòng)描記術(shù)(impedance cardiography,IC)和放射性核素心室顯像術(shù)(radionuclide ventriculgrraphy,RV),RV是一種侵入性的方法,而IC是非侵入性的,為了評(píng)價(jià)測(cè)量心排量?jī)煞N方法的一致性,以考察IC方法是否可以替代RV方法,研究者測(cè)量了12例病人,不同的病人用兩種方法分別進(jìn)行了3~6次測(cè)量。
基于通用性考慮,以x和y分別代表RV和IC測(cè)量方法,n為病人例數(shù),令mxi和myi分別代表測(cè)量次數(shù)(i=1,2,…,n),xij代表RV方法第i例病人的第j次測(cè)量結(jié)果(j=1,2,…,mxi),yij代表IC方法第i例病人的第j次測(cè)量結(jié)果(j=1,2,…,myi)。由于兩方法結(jié)果成對(duì)出現(xiàn),則mxi=myi=mi。LoA估計(jì)基于每對(duì)結(jié)果差值進(jìn)行,記dij為第i例病人用兩種測(cè)量方法的第j次測(cè)量結(jié)果差值,dij=xij-yij,對(duì)dij建立單因素的隨機(jī)效應(yīng)模型(one-way random effectsmodel)為
其中,d是兩種方法的真實(shí)差值,ai和eij為相互獨(dú)立的均數(shù)為0、方差分別為的正態(tài)分布變量。一致限可定義為兩方法真實(shí)差值、個(gè)體間和個(gè)體內(nèi)隨機(jī)變異的和。
其期望值為
則100(1-β)%LoA的限值估計(jì)分別為
為了獲得上述LoA兩個(gè)限值的可信區(qū)間,按照常規(guī)的可信區(qū)間估計(jì)方法獲得各限值的標(biāo)準(zhǔn)誤估計(jì)。經(jīng)數(shù)理統(tǒng)計(jì)研究,該標(biāo)準(zhǔn)誤的平方計(jì)算公式為
則計(jì)算LoA下限的100(1-α)%可信區(qū)間的公式為
zα/2為標(biāo)準(zhǔn)正態(tài)分布的100(1-α/2)%分位數(shù)。同理,計(jì)算LoA上限的100(1-α)%可信區(qū)間的公式為
以上是用Bland-Altman法計(jì)算的可信區(qū)間,可見Bland-Altman法可信區(qū)間估計(jì)值對(duì)參數(shù)的點(diǎn)估計(jì)值具有對(duì)稱性。但是,由于LoA的兩個(gè)限值是正態(tài)分布均數(shù)和方差的組合量函數(shù),根據(jù)均數(shù)和方差的統(tǒng)計(jì)學(xué)性質(zhì),均數(shù)的抽樣分布仍服從正態(tài)分布,但方差的抽樣分布并不服從正態(tài)分布,因此通過均數(shù)和方差合成而獲得的LoA的兩個(gè)限值其分布在理論上并不服從正態(tài)分布。Bland-Altman法強(qiáng)行進(jìn)行對(duì)稱處理所計(jì)算的可信區(qū)間其統(tǒng)計(jì)學(xué)性能值得懷疑。Efron和Tibshanri認(rèn)為,將偏態(tài)分布統(tǒng)計(jì)量強(qiáng)行對(duì)稱化進(jìn)行可信區(qū)間估計(jì)是“最嚴(yán)重的錯(cuò)誤”[9]。
為此,基于Zou和Donner提出的方差估計(jì)反推法(themethod of variance of estimates recovery,簡(jiǎn)稱為MOVER法)[10-11],兩個(gè)參數(shù)之和或之差的可信區(qū)間估計(jì),均可根據(jù)兩個(gè)參數(shù)各自的可信區(qū)間限值而獲得的原理,Zou導(dǎo)出了LoA的可信區(qū)間估計(jì)方法[12],100(1-β)%LoA的下限LoAl的100(1-α)%可信區(qū)間下限和上限的計(jì)算公式分別為L(zhǎng)oAl-LME和LoAl+RME。同理,100(1-β)%LoA的上限的100(1-α)%可信區(qū)間下限和上限的計(jì)算公式分別為L(zhǎng)oAu-RME和LoAu+LME。其中
在方法對(duì)比研究中,當(dāng)樣本中欲測(cè)定的指標(biāo)真值恒定或者在一定時(shí)間內(nèi)相對(duì)不變時(shí),例如頸動(dòng)脈狹窄程度、影像載體上的病變大小、血標(biāo)本中的某指標(biāo)含量等,用兩種方法進(jìn)行多次測(cè)量,并不需要像真值結(jié)果具有隨時(shí)變化特性時(shí)那樣,必須保證兩方法測(cè)定同時(shí)進(jìn)行、結(jié)果成對(duì)出現(xiàn),兩種方法對(duì)同一樣本的測(cè)量次數(shù)可以不同,即不必要求mxi=myi。對(duì)兩方法的測(cè)量結(jié)果xij和yij分別建立單因素的隨機(jī)效應(yīng)模型
式中μx為x的真值,axi和exij為服從均數(shù)為0、方差分別為的正態(tài)分布變量。
式中μy為y的真值,ayi和eyij為服從均數(shù)為0、方差分別為的正態(tài)分布變量。
為了對(duì)LoA及其可信區(qū)間進(jìn)行估計(jì),分別計(jì)算出各個(gè)體x和y的均數(shù)和方差計(jì)算個(gè)體內(nèi)隨機(jī)誤差的合并方差估計(jì)值
計(jì)算每一個(gè)體兩種方法的均數(shù)差值
則兩種方法均差的均數(shù)及其方差分別為
根據(jù)Bland和Altman的方法,100(1-β)%LoA的限值估計(jì)分別為
為了獲得上述LoA兩個(gè)限值的可信區(qū)間,按照Bland-Altman法,獲得各限值的方差估計(jì)
有關(guān)100(1-β)%LoA的兩個(gè)限值的100(1-α)%可信區(qū)間估計(jì)采用MOVER法的計(jì)算公式與前面介紹的完全相同,只是計(jì)算可信區(qū)間公式中涉及到的l和u需按下式求算
在模擬研究之前,首先對(duì)前面用RV和IC兩種方法重復(fù)測(cè)量12例病人心排量結(jié)果的例子進(jìn)行分析。此例本為樣本真值即時(shí)變化的重復(fù)測(cè)量設(shè)計(jì),為節(jié)省篇幅,這里也作為樣本真值相對(duì)不變的重復(fù)測(cè)量設(shè)計(jì)分析的例子,結(jié)果顯示,兩種方法的均差為0.71,表明IC方法測(cè)量結(jié)果較RV方法平均低0.71,按真值結(jié)果是變化的情形考慮,兩方法95%一致限LoA為(-1.30,2.72),按照BA法計(jì)算的95%LoA范圍的95%可信區(qū)間為(-2.61,3.63),按MOVER法計(jì)算的可信區(qū)間為(-2.66,4.08)。如果按真值結(jié)果是不變的情形考慮,兩方法95%一致限LoA為(-1.35,2.77),按照BA法計(jì)算的95%LoA范圍的95%可信區(qū)間為(-2.35,3.67),按MOVER法計(jì)算的可信區(qū)間為(-2.70, 4.12)。鑒于本例只有12例病人,累計(jì)測(cè)量次數(shù)也僅有60次,所求算的LoA可信區(qū)間結(jié)果(MOVER法)下限為-2.66,上限達(dá)到4.08,與臨床能夠允許的誤差限值相比似乎偏大,尚不足以得出兩方法具有一致性的結(jié)論,這與原研究者Bow ling認(rèn)為IC測(cè)量與RV測(cè)量間缺少一致性的結(jié)論一致。
為了考察上述可信區(qū)間估計(jì)的統(tǒng)計(jì)學(xué)性能,針對(duì)兩種不同重復(fù)測(cè)量設(shè)計(jì)類型,基于測(cè)量結(jié)果服從正態(tài)分布,分別設(shè)定不同的樣本量和不同的個(gè)體間變異占總變異的比例(個(gè)體間方差比例),進(jìn)行Monte-Carlo模擬實(shí)驗(yàn)。本文隨機(jī)模擬實(shí)驗(yàn)借助SAS 9.2系統(tǒng)編程實(shí)現(xiàn)。
對(duì)于真值變化的重復(fù)測(cè)量設(shè)計(jì)情形,在不同的樣本量和重復(fù)測(cè)量次數(shù)設(shè)定下,按照兩種方法測(cè)量結(jié)果差值的總體均數(shù)為0,個(gè)體間方差為個(gè)體內(nèi)方差為產(chǎn)生第i例個(gè)體的第j次測(cè)量結(jié)果即dij。具體步驟為,先按個(gè)體例數(shù)產(chǎn)生服從分布的隨機(jī)數(shù),然后針對(duì)不同個(gè)體再產(chǎn)生與個(gè)體內(nèi)重復(fù)測(cè)量次數(shù)對(duì)應(yīng)的服從分布的隨機(jī)數(shù),最后對(duì)兩個(gè)隨機(jī)數(shù)變量求和即可。如果限定則產(chǎn)生的dij是一服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)的隨機(jī)數(shù)變量。隨機(jī)模擬產(chǎn)生足夠多的隨機(jī)變量,分別計(jì)算95%LoA范圍的95%可信區(qū)間,如果可信區(qū)間估計(jì)方法統(tǒng)計(jì)學(xué)性能優(yōu)良,則根據(jù)正態(tài)分布特點(diǎn),計(jì)算出的可信區(qū)間理論上將會(huì)有95%的比例覆蓋-1.96到1.96范圍因此,我們采用覆蓋率來評(píng)價(jià)可信區(qū)間估計(jì)方法的統(tǒng)計(jì)學(xué)性能,模擬實(shí)驗(yàn)的覆蓋率愈接近95%,表明所用的可信區(qū)間估計(jì)方法統(tǒng)計(jì)學(xué)性能愈好。為了盡量模擬實(shí)際中的不同情形,我們將樣本量設(shè)定為10、20、50、100、150、200、250共7種情形,個(gè)體間方差比例從0.5開始,每次增加0.1,直至0.9,共5種情形(該比例小于0.5時(shí)表明個(gè)體內(nèi)變異大于個(gè)體間變異,顯然對(duì)一致性評(píng)價(jià)不具有實(shí)際意義),統(tǒng)一設(shè)定每例的重復(fù)測(cè)量次數(shù)為5次,每一組合的模擬次數(shù)為10000次。模擬結(jié)果見表1。
對(duì)于真值不變的重復(fù)測(cè)量設(shè)計(jì)情形,需要對(duì)兩種測(cè)量方法分別產(chǎn)生隨機(jī)數(shù)變量。隨機(jī)變量xij來自于兩個(gè)均數(shù)為0,個(gè)體間方差和個(gè)體內(nèi)方差分別為的隨機(jī)變量之和,限定同理yij隨機(jī)變量來自于兩個(gè)均數(shù)為0,個(gè)體間方差和個(gè)體內(nèi)方差分別為的隨機(jī)變量之和,限定計(jì)算95%LoA范圍的95%可信區(qū)間,根據(jù)正態(tài)分布特點(diǎn),模擬實(shí)驗(yàn)次數(shù)足夠多時(shí),計(jì)算出的可信區(qū)間理論上將會(huì)有95%的比例覆蓋范圍按照真值變化的重復(fù)測(cè)量設(shè)計(jì)情形給定模擬參數(shù)組合,x和y變量的重復(fù)測(cè)量次數(shù)分別設(shè)為5次和4次。模擬結(jié)果見表1和圖1。
可見,Bland-Altman法LoA可信區(qū)間估計(jì)方法在樣本例數(shù)較小時(shí)覆蓋率偏低,而MOVER法甚至在樣本例數(shù)僅為10時(shí),也較為接近95%,表明采用MOVER法進(jìn)行LoA范圍可信區(qū)間估計(jì)具有很好的可靠性,是一種較為理想的LoA范圍可信區(qū)間估計(jì)方法。
盡管Bland和A ltman給出了針對(duì)重復(fù)測(cè)量設(shè)計(jì)的LoA可信區(qū)間估計(jì)方法[7-8],但研究表明,在小樣本量時(shí)該方法達(dá)不到應(yīng)有的統(tǒng)計(jì)學(xué)性能。而本文介紹的重復(fù)測(cè)量設(shè)計(jì)LoA可信區(qū)間估計(jì)的新方法即MOVER法,經(jīng)Monte-Carlo模擬實(shí)驗(yàn)表明,甚至在小樣本量時(shí)仍然具有優(yōu)良的統(tǒng)計(jì)學(xué)性能。不僅如此,該方法無論是在兩種重復(fù)測(cè)量設(shè)計(jì)的哪一種情形下,都不要求個(gè)體重復(fù)測(cè)量次數(shù)相等,具有相當(dāng)?shù)撵`活性和實(shí)用性[12]。另外,盡管MOVER法的計(jì)算過程貌似復(fù)雜,但從其推導(dǎo)和構(gòu)建過程可見,除一般的統(tǒng)計(jì)運(yùn)算外,也只是涉及到正態(tài)分布和卡方分布的分位數(shù),這在方法學(xué)實(shí)現(xiàn)上并不困難。因此,MOVER法是一種值得推薦用于方法對(duì)比研究重復(fù)測(cè)量設(shè)計(jì)的LoA可信區(qū)間估計(jì)方法。
表1 方法對(duì)比研究重復(fù)測(cè)量設(shè)計(jì)兩種不同情形分別采用兩種不同的方法進(jìn)行95%LoA范圍的95%可信區(qū)間估計(jì)覆蓋率(%)的模擬結(jié)果(模擬次數(shù)為10000次)
當(dāng)然,本文模擬是在假定測(cè)量結(jié)果服從正態(tài)分布的前提下進(jìn)行的,對(duì)于不同的重復(fù)測(cè)量次數(shù)包括個(gè)體重復(fù)測(cè)量次數(shù)不同的情形,我們另外進(jìn)行了模擬,結(jié)果顯示各方法的統(tǒng)計(jì)學(xué)性能具有類似的特點(diǎn)和規(guī)律,鑒于篇幅這里未予列舉。至于重復(fù)測(cè)量設(shè)計(jì)Bland-Altman法一致性評(píng)價(jià)的應(yīng)用條件考察,可參照單樣本兩種測(cè)量方法僅測(cè)量一次的情形,通過圖示方法,例如繪制Bland-Altman圖和差值的直方圖,粗略判定兩種測(cè)量方法結(jié)果及其差值是否服從正態(tài)分布、在測(cè)量范圍內(nèi)差值的變異是否隨測(cè)量結(jié)果變化而變化等。對(duì)于不能滿足Bland-Altman法應(yīng)用條件即數(shù)據(jù)行為不良的重復(fù)測(cè)量設(shè)計(jì)的一致性評(píng)價(jià),還需進(jìn)一步的方法學(xué)探討。
圖1 方法對(duì)比研究重復(fù)測(cè)量設(shè)計(jì)兩種不同情形分別采用兩種不同的方法進(jìn)行95%LoA范圍的95%可信區(qū)間估計(jì)覆蓋率(%)模擬結(jié)果(模擬次數(shù)為10000次)
國(guó)內(nèi)目前對(duì)采用Bland-Altman法評(píng)價(jià)一致性的研究?jī)H局限于簡(jiǎn)單的方法學(xué)介紹,也僅限于兩種測(cè)量方法單次測(cè)量的情形,對(duì)LoA范圍可信區(qū)間估計(jì)更是較少深入涉及,尚未見到有關(guān)重復(fù)測(cè)量設(shè)計(jì)的方法學(xué)介紹[13-17],這需要我國(guó)的方法學(xué)研究者和應(yīng)用者,無論從理論研究和實(shí)際應(yīng)用都應(yīng)給予高度關(guān)注。
1.Bland JM,Altman DG.Statisticalmethods for assessing agreement between two methods of clinicalmeasurement.Lancet,1986,1(8476):307-310.
2.Zaki R,Bulgiba A,Ismail R,etal.Statisticalmethods used to test for agreement of medical instruments measuring continuous variables in method comparison studies:a systematic review.PloS ONE,2012,7(5):e37908.doi:10.1371/journal.pone.0037908.
3.Hamilton C,Stamey J.Using Bland-Altman to assess agreement between twomedical devices-don't forget the confidence intervals!JClin Monit Comput,2007,21(6):331-333.
4.Ham ilton C,Lew is S.The importance of using the correctbounds on the Bland-Altman lim its of agreement when multiplemeasurements are recorded per patient.JClin Monit Comput,2010,24(3):173-175.
5.Stockl D,Cabaleiro DR,Uytfanghe KV,et al.Interpreting method comparison studies by use of the Bland-Altman plot:reflecting the importance of sample size by incorporating confidence lim its and predefined error limits in the graphic.Clin Chem,2004,50(11):2216-2218.
6.Myles PS,Cui J.Using the Bland-Altmanmethod tomeasure agreement w ith repeated measures.Br JAnaesth,2007,99(3):309-311.
7.Bland JM,Altman DG.Measuring agreement in method comparison studies.Stat MethodsMed Res,1999,8(2):135-160.
8.Bland JM,Altman DG.Agreement between methods of measurement with multiple observations per individual.J Biopharm Stat,2007,17(4):571-582.
9.Efron B,Tibshirani RJ.An introduction to the bootstrap.New York:Chapman&Hall/CRC Press,1993.
10.Zou GY,Donner A.Construction of confidence lim its about effect measures:a general approach.StatMed,2008,27(10):1693-1702.
11.Donner A,Zou GY.Closed-form confidence intervals for functions of the normalmean and standard deviation.Stat Methods Med Res,2010,21(4):347-359.
12.Zou GY.Confidence interval estimation for the Bland-Altman lim its of agreementw ith multiple observations per individual.Stat Methods Med Res,2013,22(6):630-642.
13.李鎰沖,李曉松.兩種測(cè)量方法定量測(cè)量結(jié)果的一致性評(píng)價(jià).現(xiàn)代預(yù)防醫(yī)學(xué),2007,34(17):3263-3266.
14.陳卉.Bland-Altman分析在臨床測(cè)量方法一致性評(píng)價(jià)中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2007,24(3):308-309.
15.周宇豪,許金芳,賀佳.診斷試驗(yàn)一致性評(píng)價(jià)中幾種方法的比較與應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(1):40-42.
16.薩建,劉桂芬.定量測(cè)量結(jié)果的一致性評(píng)價(jià)及Bland-Altman法的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(4):409-411.
17.繆華章,陳林,劉玉秀.定量方法對(duì)比研究一致性評(píng)價(jià)Bland-Altman法LoA的可信區(qū)間估計(jì).中國(guó)衛(wèi)生統(tǒng)計(jì),2014,31(1):64-67.
(責(zé)任編輯:郭海強(qiáng))
Confidence Interval Estimation for the Bland-Altman Lim its of Agreement w ith Repeated M easurements in Quantitative M ethod Com parison Studies
Liu Yuxiu,M iao Huazhang,Lu Mengjie,et al(Nanjing General Hospital of Nanjing Military Command,Southern Medical University(210002),Nanjing)
ObjectiveThis paper w ill introduce agreement evaluation by using the Bland-Altman LoA and is confidence interval estimatemethod in two different repeated measurement design scenarios,and explores the statistical performance of two different confidence intervalestimationmethods in each scenario,and provides a theoreticalbasis for the selection and application of themethodology.MethodsAccording to themeasured sample true value whether changed,the repeated measurement design is divided into two types,and gives the Bland-Altman LoA w ith its two confidence interval confidence interval estimatemethods(one is Bland-Altman method,another is the MOVER method),respectively.By using Monte-Carlo simulation technique,set the different sample sizes and individual variability under the assumption of the normal distribution,and obtain the coverage rates of the B-A and MOVERmethodswhich be used to simulate the 95%confidence interval of the 95%LoA for the population.The adjacency degree between the coverage rates and 95%can be used for evaluating the statistical performance,theoretically,the coverage ratesmore close to 95%,reflect the statistical performance of themethod ismuch higher.ResultsThe coverage rate of LoA confidence interval estimation by using the B-A method is increasesw ith the sample size,but less than 90%when the sample sizewas under20,and still below 94%even when the sample size is250,while the MOVERmethod coverage closely around the small fluctuations in the credibility of 95%predefined,it can close to 95%even when sample size is 10.ConclusionThe confidence interval estimation for LoA by using MOVER method in method comparison studies w ith repeated measurements design works well and deserves recommendation.
Method comparison study;Repeatedmeasurements;Bland-Altmanmethod;Lim its of agreement;Confidence intervals;MOVER
中國(guó)衛(wèi)生統(tǒng)計(jì)2014年2期