山西醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(030001) 薩 建 劉桂芬
在臨床醫(yī)學(xué)、診斷醫(yī)學(xué)、計(jì)量放射學(xué)等學(xué)科研究中,經(jīng)常要求對(duì)兩種或者兩種以上診斷方法進(jìn)行比較或者進(jìn)行測量結(jié)果一致性的評(píng)價(jià)。有時(shí),其中一種方法是診斷的“金標(biāo)準(zhǔn)”或公認(rèn)的方法,而另外一種是新的方法或手段,相比較金標(biāo)準(zhǔn)而言可能更加經(jīng)濟(jì)或創(chuàng)傷、痛苦更小;而有時(shí)并沒有金標(biāo)準(zhǔn),研究者只關(guān)注方法之間的互換性如何。通過對(duì)診斷或測量結(jié)果的一致性評(píng)價(jià),可以回答“方法之間能否相互替代”的問題。
當(dāng)測量結(jié)果為定量數(shù)據(jù)時(shí),涉及到一致性評(píng)價(jià)的問題,過去臨床工作中常用的方法是進(jìn)行配對(duì)t檢驗(yàn)、相關(guān)分析、回歸分析等〔1〕,但是這些方法均不準(zhǔn)確,甚至是錯(cuò)誤的。例如,配對(duì)t檢驗(yàn)只是檢驗(yàn)兩組數(shù)據(jù)的集中位置是否相同,相關(guān)分析只是檢驗(yàn)數(shù)據(jù)同步變化的方向與緊密程度,這些都只是一致性評(píng)價(jià)的某一個(gè)方面。準(zhǔn)確的一致性評(píng)價(jià),應(yīng)當(dāng)同時(shí)考慮到數(shù)據(jù)的集中趨勢、離散趨勢以及相關(guān)性,這三個(gè)方面均相同才能認(rèn)為是“一致”,才能說明方法之間的“可互換性”〔2〕。
通過采用Bland-Altman圖來進(jìn)行定量資料的一致性評(píng)價(jià)是近年來興起的新方法,并且針對(duì)數(shù)據(jù)的不同情況,應(yīng)用方面也有所差別,本文將通過兩個(gè)實(shí)例來介紹該方法的應(yīng)用,以及需要注意的若干問題。
對(duì)定量測量資料進(jìn)行一致性評(píng)價(jià)的Bland-Altman方法,最初是由英國學(xué)者Bland JM和Altman DG于1983年首先提出的〔3〕,1986年在 Lancet上發(fā)表文章詳細(xì)闡述〔4〕,并于 1999 年〔5〕將該方法進(jìn)一步擴(kuò)展。該方法的基本思想是,利用原始數(shù)據(jù)的均值與差值,分別以均值為橫軸,以差值為縱軸做散點(diǎn)圖,計(jì)算差值的均數(shù)以及差值的95%分布范圍(即為一致性界限,LoA,ˉd±1.96Sd),認(rèn)為應(yīng)該有95%的差值位于該一致性界限以內(nèi)。分析散點(diǎn)的分布與一致性界限的位置關(guān)系,并且與專業(yè)上可接受的界限值相比較,如果一致性界限在臨床上可以接受,則可以認(rèn)為兩種方法之間一致性較好,可以互換。同時(shí),考慮到抽樣誤差,除了LoA,還要有LoA的可信區(qū)間(LoA CI)。計(jì)算LoA CI所對(duì)應(yīng)的標(biāo)準(zhǔn)誤一般為 1.71SE(ˉd)〔6〕,即可計(jì)算出兩條一致性界限分別對(duì)應(yīng)的可信區(qū)間。
在現(xiàn)有軟件中,可以直接繪制Bland-Altman圖的只有Medcalc軟件,其余的均比較繁瑣或者需要編程。通過Medcalc做出的Bland-Altman圖一般如圖1所示。
圖1 一般的Bland-Altman圖(Medcalc軟件繪制、有添加)
圖1的下方橫軸代表兩個(gè)指標(biāo)的平均值,左側(cè)縱軸代表兩個(gè)指標(biāo)之差。圖形區(qū)域內(nèi)共有六條線,三條較長者從上到下依次是:Mean+1.96SD、Mean和Mean-1.96SD,即上述所述差值均數(shù)及LoA上限與下限。其余三條較短者(一般無標(biāo)記,筆者添加)分別為差值為0和差值均數(shù)的95%CI。而LoA的95%CI軟件不能自動(dòng)繪出,需要手工計(jì)算。一般認(rèn)為,圖形中的點(diǎn)位于LoA范圍內(nèi)的要占到所有點(diǎn)的95%,同時(shí)還要考慮該LoA不超出專業(yè)上可接受的臨界值范圍。滿足這兩點(diǎn)一般即可認(rèn)為兩種方法的一致性較好,可以互換。
采用Bland-Altman圖進(jìn)行一致性評(píng)價(jià),需要根據(jù)數(shù)據(jù)情形進(jìn)行判定。如果Difference-Average散點(diǎn)圖上差值隨均值變化不明顯,則可采用原始數(shù)據(jù)進(jìn)行作圖分析;常見的另外一種情形是差值隨著均值的增大而增大,此時(shí)需要對(duì)原始數(shù)據(jù)進(jìn)行對(duì)數(shù)轉(zhuǎn)換,然后再進(jìn)行作圖分析。具體實(shí)例如下:
1.采用原始數(shù)據(jù)進(jìn)行分析的實(shí)例
(1)原始數(shù)據(jù)
某實(shí)驗(yàn)室采用兩個(gè)不同公司的試劑盒(W與M)對(duì)70份同型半胱氨酸樣品進(jìn)行檢測,研究兩種試劑盒檢測結(jié)果是否一致。數(shù)據(jù)見表1。
表1 兩種試劑盒對(duì)同型半胱氨酸檢測結(jié)果(μmol/L)
(2)Bland-Altman分析
圖2 兩種試劑盒對(duì)同型半胱氨酸檢測結(jié)果的Bland-Altman圖
從圖2中可以看出,70個(gè)點(diǎn)中有3個(gè)位于LoA范圍以外,比例為4.29%,小于5%。經(jīng)過計(jì)算,70對(duì)數(shù)據(jù)的相關(guān)系數(shù)為0.963(P<0.001),差值的均數(shù)ˉd=0.001μmol/L,標(biāo)準(zhǔn)差 SD=0.81μmol/L,標(biāo)準(zhǔn)誤 SE=0.10μmol/L,由此計(jì)算出的95%LoA為(-1.587,1.589)μmol/L。樣本量為 70,對(duì)應(yīng)的 t=1.995,LoA上限1.589的95%CI為(1.589-1.995×1.71×0.1,1.589+1.995×1.71 ×0.1),即(1.248,2.336)μmol/L,LoA 下限-1.587的95%CI為(-1.928,-1.246)μmol/L。綜合起來,LoA的可信區(qū)間為(-1.982,2.336)μmol/L。該范圍明顯大于95%LoA本身,這是考慮到了抽樣誤差的結(jié)果。所以,數(shù)據(jù)點(diǎn)有95%分布在該范圍內(nèi)即可(比LoA寬泛),同時(shí)也要求LoA的CI不能超出專業(yè)意義的臨界值(比LoA更嚴(yán)格),二者其實(shí)也是相統(tǒng)一的。假如專業(yè)上要求兩種檢測方法之間的偏差在±2.5μmol/L之間是可以接受的,那么二者的一致性較好。
2.采用經(jīng)對(duì)數(shù)轉(zhuǎn)換以后進(jìn)行分析的實(shí)例
(1)原始數(shù)據(jù)
研究人員采用實(shí)時(shí)三維半自動(dòng)邊界檢測法(A)和實(shí)時(shí)三維雙平面法(B)檢測水囊模型的容積,觀察兩種方法測量結(jié)果的一致性,數(shù)據(jù)見表2。
表2 兩種方法對(duì)水囊模型容積的檢測結(jié)果(ml)
(2)Bland-Altman分析
圖3 兩種方法對(duì)水囊模型容積的檢測結(jié)果的Bland-Altman圖
從圖3看出,23個(gè)點(diǎn)均位于LoA范圍內(nèi),經(jīng)過計(jì)算,兩組數(shù)據(jù)的相關(guān)系數(shù)為0.963(P<0.001),差值均數(shù) ˉd=0.217ml,標(biāo)準(zhǔn)差 SD=4.17ml,標(biāo)準(zhǔn)誤 SE=0.87ml,LoA 范圍是(-7.96,8.39)ml,樣本量為 23,對(duì)應(yīng)的 t值為2.074,LoA的可信區(qū)間為(-11.05,11.48)ml。同時(shí)可以發(fā)現(xiàn),A與B的差值隨著均值的增加而增大,呈現(xiàn)“喇叭”狀分布??梢韵氲?,這樣計(jì)算出的LoA以及LoA CI一定會(huì)由于差值較大的那些點(diǎn)而變寬,要解決這一問題,可以對(duì)原始數(shù)據(jù)進(jìn)行對(duì)數(shù)轉(zhuǎn)換,利用轉(zhuǎn)換以后的數(shù)據(jù)再進(jìn)行Bland-Altman分析。
從圖4看出,經(jīng)過對(duì)數(shù)據(jù)進(jìn)行對(duì)數(shù)轉(zhuǎn)換以后,散點(diǎn)的分布情況有了明顯改善。兩組對(duì)數(shù)數(shù)據(jù)的相關(guān)系數(shù)為 0.97(P <0.001),對(duì)數(shù)差值均數(shù) ˉd=0.000419,標(biāo)準(zhǔn)差SD=0.01151,標(biāo)準(zhǔn)誤 SE=0.0024,LoA范圍是(-0.024,0.024),經(jīng)過反對(duì)數(shù)變換的 LoA為(-1.057,1.057)ml,樣本量為 23,對(duì)應(yīng)的 t值為 2.074,LoA的可信區(qū)間為(-0.0325,0.0325),經(jīng)過反對(duì)數(shù)變換的 LoA CI為(-1.078,1.078)ml,明顯小于原始數(shù)據(jù)的LoA CI,更容易得到一致性較好的結(jié)論。
圖4 兩種方法對(duì)水囊模型容積的檢測結(jié)果對(duì)數(shù)轉(zhuǎn)換后的Bland-Altman圖
1.做Bland-Altman圖,除了要計(jì)算數(shù)據(jù)的LoA外,還要計(jì)算和考慮LoA的可信區(qū)間。由于分析的數(shù)據(jù)大多為抽樣得到,所以為了考慮到抽樣誤差的大小,LoA CI就顯得更加重要。LoA CI的范圍更大,可以包含更多的散點(diǎn),但同時(shí)也可能超出專業(yè)上可接受的臨界值。在國外臨床文獻(xiàn)中,Bland-Altman法應(yīng)用比較廣泛,但是仍然很少有同時(shí)考慮LoA CI的,所以該方法的應(yīng)用不能過于機(jī)械化。
2.經(jīng)過上述兩個(gè)實(shí)例分析比較可以看出,Bland-Altman法的使用一定要根據(jù)數(shù)據(jù)的情況靈活調(diào)整,當(dāng)遇到數(shù)據(jù)的差值與均值成比例變化時(shí)(可能是“喇叭”狀的散點(diǎn),也可能是其他情況),最好將原始數(shù)據(jù)取對(duì)數(shù)以后再繪制該圖,然后將得到的LoA與LoA CI進(jìn)行反對(duì)數(shù)計(jì)算。
3.數(shù)據(jù)進(jìn)行對(duì)數(shù)變化并不能徹底消除差值與均值成比例的問題,但是從上述的圖4中也可以看出,這樣做可以使得LoA與LoA CI明顯變窄,相比較于采用原始數(shù)據(jù)有更大的優(yōu)勢。
4.采用Bland-Altman圖法進(jìn)行一致性評(píng)價(jià)實(shí)際上也需要有一定的樣本量,雖然沒有固定的樣本含量計(jì)算公式,但是樣本量越大,LoA CI范圍越小,越容易得到一致性較好的結(jié)論。同時(shí),除了樣本量足夠以外,對(duì)數(shù)據(jù)的分布情況也有一些要求,即數(shù)據(jù)的覆蓋范圍盡量寬一些,太窄的話容易得到錯(cuò)誤的結(jié)論,也不容易發(fā)現(xiàn)是否存在差值隨均值成比例變化的情形。
5.Bland-Altman圖法最初主要用于新方法與金標(biāo)準(zhǔn)之間的比較,或者兩個(gè)觀察者間的比較。對(duì)于重復(fù)測量之間的一致性評(píng)價(jià)相對(duì)比較復(fù)雜,還需要進(jìn)一步深入研究。
1.李鎰沖,李曉松.兩種測量方法定量測量結(jié)果的一致性評(píng)價(jià).現(xiàn)代預(yù)防醫(yī)學(xué),2007,34(17):3263-3266.
2.方積乾,陸盈主編.現(xiàn)代醫(yī)學(xué)統(tǒng)計(jì)學(xué).北京:人民衛(wèi)生出版社,2002,81-83.
3.Altman DG,Bland JM.Measurement in medicine:the analysis of methodcomparison studies.The Statistician,1983,32:307-317.
4.Bland JM,Altman DG.Statistical methods for assessing agreement between two methods of clinical measurement.Lancet,1986,i:307-310.
5.Bland JM,Altman DG.Measuring agreement in method comparison studies.StatMethodsMed Res,1999,8:135-160.
6.陳卉.Bland-Altman分析在臨床測量方法一致性評(píng)價(jià)中的應(yīng)用.中國衛(wèi)生統(tǒng)計(jì),2007,24(3):308-309.