東南大學(xué)流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(210009) 陳召青 王詩(shī)遠(yuǎn) 楊舒靜 劉 沛
逆向累積分布圖及其在疫苗免疫原性數(shù)據(jù)分析中的應(yīng)用
東南大學(xué)流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(210009) 陳召青 王詩(shī)遠(yuǎn) 楊舒靜 劉 沛△
在疫苗臨床試驗(yàn)中,接種后血清抗體水平的高低與該疫苗能否產(chǎn)生保護(hù)作用及保護(hù)水平的高低有著直接關(guān)系,因此對(duì)免疫原性的分析是疫苗臨床試驗(yàn)統(tǒng)計(jì)分析的重要部分。就體液免疫反應(yīng)而言,這類數(shù)據(jù)的一個(gè)重要特征是數(shù)據(jù)的取值范圍較大,變化范圍??缭蕉鄠€(gè)數(shù)量級(jí),觀察值間呈現(xiàn)倍數(shù)關(guān)系。雖然其原始觀測(cè)數(shù)值呈右偏態(tài)分布[1],但經(jīng)對(duì)數(shù)轉(zhuǎn)換后,免疫原性值一般滿足正態(tài)或近似正態(tài)分布。對(duì)這類數(shù)據(jù),目前國(guó)內(nèi)通用的方法是首先計(jì)算其描述性統(tǒng)計(jì)指標(biāo)如幾何均數(shù)和對(duì)數(shù)標(biāo)準(zhǔn)差,而后對(duì)經(jīng)對(duì)數(shù)變換后的數(shù)據(jù)采用假設(shè)檢驗(yàn)和區(qū)間估計(jì)等方法進(jìn)行統(tǒng)計(jì)推斷[1-2]。這些方法雖然行之有效,但其結(jié)果表達(dá)方式均為在特定點(diǎn)(如幾何均數(shù))和較抽象的范圍(如95%可信區(qū)間)表達(dá)其臨床試驗(yàn)結(jié)果,這樣一方面使研究工作者難以從體液免疫原性的整體數(shù)據(jù)變化上(如不同滴度的抗體水平上)把握數(shù)據(jù)的變化趨勢(shì)和分布狀況,另一方面也使非統(tǒng)計(jì)工作者難以理解一些組間比較的假設(shè)檢驗(yàn)結(jié)果。為解決這些問題,Reed、Meade和Steinhoff于1995年提出了逆向累積分布圖(reverse cumulative distribution,RCD)的概念和方法,這一方法因具有結(jié)果表達(dá)直觀、傳達(dá)信息量大等優(yōu)點(diǎn),一經(jīng)提出就受到了疫苗臨床試驗(yàn)工作者的青睞并在國(guó)外得到了較廣泛的應(yīng)用[3]。然而國(guó)內(nèi)對(duì)此法卻少有介紹,本文將從概念、方法及應(yīng)用實(shí)例上對(duì)這一數(shù)據(jù)表達(dá)方式進(jìn)行介紹。
逆向累積分布圖(以下簡(jiǎn)稱RCD曲線)是用來顯示免疫原性數(shù)據(jù)分布的圖形工具,特別適合于疫苗組間分布的可視性圖形比較。該圖的橫軸為經(jīng)過對(duì)數(shù)轉(zhuǎn)換后的抗體滴度或濃度,縱軸代表至少有此抗體水平個(gè)體所占百分比。根據(jù)定義,圖中的曲線從100%開始,然后從左到右逐漸下降至0,曲線最低點(diǎn)就是抗體水平最大時(shí)的觀察者比例。逆向累積分布函數(shù)的表達(dá)形式為
式(1)中Rx(x)表示變量X大于等于某一數(shù)值x的概率。而通常的累積分布函數(shù)為
式(2)中Cx(x)表示變量X小于等于其某一數(shù)值x的概率。由此可知,逆向累積分布圖之所以被稱為逆向,是因?yàn)樗抢鄯e分布圖(cumulative distribution plot)的逆轉(zhuǎn)。而正是這一逆轉(zhuǎn),使得它特別適合于對(duì)疫苗免疫原性數(shù)據(jù)的直觀表達(dá)[4-5]。
與逆向累積分布圖相似的是Kaplan-Meier生存曲線(survival curve),只不過生存曲線多以生存時(shí)間為橫軸、生存率為縱軸,隨著生存時(shí)間的遞增,生存率曲線從1到0逐漸下降,與逆向累積分布圖不同的是它不是一條平滑的曲線,而是階梯狀逐漸下降的圖形[2]。
繪制RCD曲線時(shí),首先要根據(jù)每一抗體水平在y軸上找出至少有此抗體水平個(gè)體所占的百分比,然后將這些點(diǎn)用折線連接起來。第一個(gè)繪制的點(diǎn)通常表示在最低抗體水平下個(gè)體所占的百分比,一般為100%。曲線從左至右,x值越來越大,y值越來越小,最后會(huì)無限接近于0。利用RCD曲線可以估計(jì)各種百分位數(shù),如求第50分位數(shù)所對(duì)應(yīng)的抗體滴度對(duì)數(shù)值,就可在y軸上找到50%,畫一條水平線與曲線相交,然后再找出交點(diǎn)所對(duì)應(yīng)x軸上的值,就是所求值,即中位抗體滴度的對(duì)數(shù)值。另外,通過已知x值也可求得y值,這一般用于已知保護(hù)水平或最低檢測(cè)限估計(jì)觀察對(duì)象所占的累積百分比[3]。
圖1給出了四條頗具代表性的RCD曲線。大部分RCD曲線是倒S型,如曲線D,直到在x軸上到達(dá)某一數(shù)值時(shí)迅速下降至最小值。曲線A呈現(xiàn)近似直角形,開始保持高且平坦,直到一個(gè)在橫軸上達(dá)到較大數(shù)值時(shí)迅速下降至最小值,表示抗體水平較高者所占比例較大。如果曲線以一條相對(duì)直的斜線降到x軸如曲線C,說明抗體滴度的變異較大。曲線的陡峭程度反映了觀察值的伸展程度和變異性。中部和尾部一樣陡,說明較少的變異,而此時(shí)曲線C比較淺的中部表示較大的伸展性和變異性。在極端的例子中,RCD曲線以垂直的曲線結(jié)束,說明數(shù)據(jù)集中,幾乎沒有變異,所有余下的數(shù)據(jù)都相等[3]。曲線B比曲線C陡峭,但是又不及曲線D,表示其變異性比曲線D大,但又小于曲線C。曲線B和曲線C相交,兩者有一個(gè)相同的百分位值,如圖1中,該點(diǎn)為當(dāng)抗體滴度對(duì)數(shù)轉(zhuǎn)換值為6時(shí),累積頻率百分比為40%,在小于抗體水平6時(shí),B組更占優(yōu)勢(shì),但是超過6時(shí),C組就更占優(yōu)勢(shì)了。
圖1 逆向累積分布圖
我們以腸道病毒71型滅活疫苗(Vero細(xì)胞)做試驗(yàn)組和安慰劑做對(duì)照組進(jìn)行的III期臨床試驗(yàn)為例說明RCD曲線和目前通用的統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷方法相結(jié)合,以提高統(tǒng)計(jì)結(jié)果形象化和增加數(shù)據(jù)信息量之效果。研究人群按發(fā)病特征分成6~11月齡和12~35月齡兩層。
從表1我們可以看出在腸道病毒71型(EV71)疫苗組免疫前后經(jīng)配對(duì)t檢驗(yàn)t=60.92,P<0.0001,差異有統(tǒng)計(jì)學(xué)意義,所以可認(rèn)為試驗(yàn)組疫苗在免疫前后抗體水平不同,提示EV71疫苗對(duì)健康人群可能有保護(hù)作用;安慰劑組經(jīng)配對(duì)t檢驗(yàn)t=-2.34,P= 0.0194,差異有統(tǒng)計(jì)學(xué)意義,所以安慰劑組在免疫前后抗體水平也不同。從表1我們還可以看出免疫前EV71疫苗組和安慰劑組經(jīng)過兩樣本t檢驗(yàn)t=-0.51,P=0.6103,P>0.05,差異沒有統(tǒng)計(jì)學(xué)意義,所以尚不能認(rèn)為在免疫前后兩組疫苗的受試者抗體水平不同;免疫后EV71疫苗組和安慰劑組同樣經(jīng)過兩樣本t檢驗(yàn)t=30.73,P<0.0001,差異有統(tǒng)計(jì)學(xué)意義,所以可以認(rèn)為在免疫前后兩組疫苗的受試者抗體水平不同。面對(duì)上述統(tǒng)計(jì)分析結(jié)果,有時(shí)難以使人一下子得到試驗(yàn)疫苗是否有效的清晰結(jié)論。此時(shí)借助RCD曲線(圖2)不但可增加統(tǒng)計(jì)結(jié)果的直觀性,方便理解,而且可有效把握數(shù)據(jù)的變化趨勢(shì)和分布狀況。由圖2可知,免疫前試驗(yàn)組和免疫前后安慰劑組的曲線,在抗體水平較小時(shí)就迅速下降,說明試驗(yàn)組免疫前以及安慰劑組免疫前后抗體水平都較低,而免疫后試驗(yàn)組曲線開始保持高而且平坦,直到達(dá)到一個(gè)在橫軸上較大數(shù)值時(shí)才下降,表示試驗(yàn)組免疫后抗體水平較高者所占比例較大,安慰劑組免疫前后抗體水平變化不大,這也說明了雖然安慰劑組統(tǒng)計(jì)分析結(jié)果有意義(P=0.0194),但是實(shí)際意義不大,從而從實(shí)際角度直觀地解釋了表1中一系列(4個(gè))假設(shè)檢驗(yàn)結(jié)果的實(shí)際意義。
表1 兩試驗(yàn)組抗體滴度免疫前后結(jié)果比較
圖2 不同組別抗體滴度逆向累積分布圖
隨著分組數(shù)的增加,假設(shè)檢驗(yàn)的數(shù)量也成倍增長(zhǎng),對(duì)統(tǒng)計(jì)檢驗(yàn)結(jié)果的綜合分析和判斷也更趨抽象,此時(shí)RCD曲線的優(yōu)勢(shì)則更為明顯。如在本次試驗(yàn)中每組疫苗又分成兩個(gè)年齡層,為得出試驗(yàn)結(jié)論,需要在八個(gè)組中進(jìn)行比較。從表2我們可以看出免疫前兩個(gè)年齡組6~11月齡和12~35月齡中試驗(yàn)組和安慰劑組P值分別0.4696和0.7641,差異無統(tǒng)計(jì)學(xué)意義。免疫后兩個(gè)年齡組中試驗(yàn)組和安慰劑組P值都小于0.0001,差異有統(tǒng)計(jì)學(xué)意義。在6~11月齡中EV71疫苗組免疫前后經(jīng)配對(duì)t檢驗(yàn)t=-36.31,P<0.0001,差異有統(tǒng)計(jì)學(xué)意義,所以可認(rèn)為6~11月齡試驗(yàn)組疫苗在免疫前后抗體水平不同,安慰劑組免疫前后配對(duì)t檢驗(yàn)t=0.32,P=0.7458,差異沒有統(tǒng)計(jì)學(xué)意義,所以尚不能認(rèn)為6~11月齡安慰劑組在免疫前后抗體水平不同;在12~35月齡中EV71疫苗組免疫前后經(jīng)配對(duì)t檢驗(yàn)t=-50.31,P<0.0001,差異有統(tǒng)計(jì)學(xué)意義,所以可認(rèn)為12~35月齡試驗(yàn)組疫苗在免疫前后抗體水平不同,安慰劑組免疫前后配對(duì)t檢驗(yàn)t=-2.59,P=0.0099,差異有統(tǒng)計(jì)學(xué)意義,所以12~35月齡安慰劑組在免疫前后抗體水平也不同。
表2 不同年齡層兩試驗(yàn)組抗體滴度結(jié)果比較
圖3 不同組別不同年齡層抗體滴度逆向累積分布圖
圖3描述的是兩組疫苗兩個(gè)年齡層在免疫接種前后抗體滴度的RCD曲線圖,經(jīng)過觀察我們可以明顯看出免疫后試驗(yàn)組12~35月齡和6~11月齡的曲線(曲線P和Q)形狀與位置與其他曲線不同,其他曲線在抗體滴度較小時(shí)就迅速下降,而曲線P和Q開始保持高而平坦,在抗體滴度較大時(shí)才開始下降,說明兩個(gè)年齡組免疫后EV71疫苗組較高抗體水平者比例較大。同時(shí)曲線N、J和M有著多處交叉,三者總體的形狀和位置基本一樣,說明6~11月齡受試者在接種前試驗(yàn)組和對(duì)照組抗體水平無差異,并且接種了安慰劑之后抗體水平未見變化。同樣的情況也發(fā)生在曲線I、X和Y中,表示12~35月齡與6~11月齡組結(jié)果基本相似,雖然接種了安慰劑之后統(tǒng)計(jì)檢驗(yàn)結(jié)果顯示抗體水平有變化(t=2.59,P=0.0099),但從圖3可見,其變化幅度較小,提示其實(shí)際意義有限。所以通過解讀圖3,我們發(fā)現(xiàn)RCD曲線圖不僅可以直觀地解釋表2中一系列(8個(gè))假設(shè)檢驗(yàn)結(jié)果的意義,讓非統(tǒng)計(jì)人員更容易理解,而且還能形象說明統(tǒng)計(jì)檢驗(yàn)結(jié)果的實(shí)際意義。
本文介紹了逆向累積分布圖的概念、制作方法及其在疫苗III期臨床試驗(yàn)中的應(yīng)用。我們可以看出逆向累積分布圖不僅增大了信息量,結(jié)果直觀,而且具有繪制簡(jiǎn)單、易于非統(tǒng)計(jì)人員理解的優(yōu)點(diǎn),特別適合對(duì)疫苗免疫原性數(shù)據(jù)的表達(dá)。在繪制過程中需要注意的是,曲線上的點(diǎn)表示的是至少有此抗體水平個(gè)體所占的百分比,所以計(jì)算方法是先通過每一個(gè)抗體水平個(gè)體所占百分比計(jì)算出正向累積百分比,然后再算出其逆向累積百分比繪制圖形。另外,逆向累積分布圖不能提供準(zhǔn)確數(shù)據(jù)信息,因此需要和相應(yīng)的統(tǒng)計(jì)指標(biāo)和假設(shè)檢驗(yàn)方法同時(shí)使用,而這些信息常通過統(tǒng)計(jì)表的形式表達(dá)。通過圖表結(jié)合,我們不僅可以準(zhǔn)確的表達(dá)數(shù)據(jù)信息,而且可以使一些抽象的統(tǒng)計(jì)結(jié)果直觀化,有利于我們從整體上把握數(shù)據(jù)蘊(yùn)含的信息。建議在免疫原性數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果表達(dá)中將傳統(tǒng)的統(tǒng)計(jì)指標(biāo)描述和統(tǒng)計(jì)假設(shè)檢驗(yàn)與RCD曲線圖示法相結(jié)合,以取得相互補(bǔ)充、相得益彰之效果。
1.方積乾.衛(wèi)生統(tǒng)計(jì)學(xué).第6版.北京:人民衛(wèi)生出版社,2008.
2.孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué).第3版.北京:人民衛(wèi)生出版社,2010.
3.Reed GF,Meade BD,Steinhoff MC.The reverse cumulative distribution plot:A graphicmethod for exploratory analysis of antibody data.Pediatrics,1995:600-603.Jozef Nauta.Statistics in Clinical Vaccine Trials. New York:Springer,2010:19-52.
4.Edward KM,Meade BD,Decker MD,et al.Comparison of 13 acellular pertussis vaccines:overview and serologic response.Pediatrics.1995:548-557.
5.Horne AD.The Statistical Analysis of Immunognicity Data in Vaccine atials.New York:Annals of the New York Academy of Sciences,2006:2211-2215.
(責(zé)任編輯:丁海龍)
△通信作者:劉沛
中國(guó)衛(wèi)生統(tǒng)計(jì)2014年2期