南方醫(yī)科大學(xué)生物統(tǒng)計(jì)學(xué)系(510515)
張娟娟 黃 云 陳平雁△
?
·應(yīng)用研究·
衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)中基于貝葉斯NMB模型的樣本量估計(jì)方法及SAS實(shí)現(xiàn)
南方醫(yī)科大學(xué)生物統(tǒng)計(jì)學(xué)系(510515)
張娟娟黃云陳平雁△
【提要】目的通過(guò)SAS編程實(shí)現(xiàn)Bayesian方法在衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)中的樣本量估計(jì),彌補(bǔ)該領(lǐng)域樣本量計(jì)算在操作上的不足。方法概括性地介紹Bayesian方法的理論背景,以及分析階段和設(shè)計(jì)階段的先驗(yàn)信息對(duì)樣本量估計(jì)的重要性,給出樣本量估算的不等式。編寫(xiě)SAS宏程序,利用迭代算法估算出不同參數(shù)組合下的樣本量。結(jié)果通過(guò)舉例展示了三種情形下的樣本量估計(jì)結(jié)果,包括:分析階段較弱、設(shè)計(jì)階段較強(qiáng)的先驗(yàn)信息,分析階段較弱、設(shè)計(jì)階段適當(dāng)?shù)南闰?yàn)信息,以及分析階段、設(shè)計(jì)階段相同的先驗(yàn)信息。效果與成本的相關(guān)系數(shù)(含方向)、效應(yīng)量、意愿支付界值與所需樣本量呈負(fù)相關(guān)。此外,先驗(yàn)信息越強(qiáng),所需樣本量越小。結(jié)論本文的SAS程序可以實(shí)現(xiàn)不同效應(yīng)量、相關(guān)系數(shù)、意愿支付界值等參數(shù)組合下的Bayesian樣本量估計(jì)結(jié)果,還包括了經(jīng)典的頻率方法。
成本效果樣本量Bayesian方法SAS編程詞首字母大寫(xiě)
傳統(tǒng)的衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)往往只作為臨床試驗(yàn)的次要評(píng)價(jià)指標(biāo),原因是新藥注冊(cè)時(shí)不要求提供衛(wèi)生經(jīng)濟(jì)學(xué)數(shù)據(jù)[1]。隨著臨床試驗(yàn)的衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)迅速發(fā)展,澳大利亞和加拿大提出新藥在批準(zhǔn)報(bào)銷(xiāo)之前必須提供成本效果數(shù)據(jù)[2-3],ISPOR(international society for pharmacoeconomics and outcomes research)也給出了臨床試驗(yàn)的衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)專(zhuān)業(yè)指導(dǎo)意見(jiàn)[4-5],從而使得衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)在新藥審批及醫(yī)療費(fèi)用報(bào)銷(xiāo)中日益受到重視。臨床試驗(yàn)的經(jīng)濟(jì)學(xué)評(píng)價(jià)首先需要考慮樣本量問(wèn)題。近二十年有關(guān)衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)的樣本量估計(jì)方法被陸續(xù)提出,包括模擬方法[6],基于成本數(shù)據(jù)的分布提出的參數(shù)和非參數(shù)方法[7],基于Fieller準(zhǔn)則的置信區(qū)間法[8],機(jī)會(huì)成本法[9]等基于經(jīng)典頻率理論的方法,也有相應(yīng)的Bayesian方法[1,10]。雖然樣本量估計(jì)的方法學(xué)逐步發(fā)展,但目前尚缺乏相應(yīng)的專(zhuān)用統(tǒng)計(jì)軟件或便利程序,從而阻礙了衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)領(lǐng)域中樣本量估計(jì)的普遍應(yīng)用,尤其是計(jì)算過(guò)程較為復(fù)雜的Bayesian方法的應(yīng)用。
本文將首先介紹Bayesian方法的理論背景,然后通過(guò)SAS 9.4編程實(shí)現(xiàn)不同參數(shù)設(shè)置下的樣本量估計(jì),并分析各參數(shù)與樣本量及檢驗(yàn)效能之間的相互影響,以期為該方法的應(yīng)用提供便利工具和參考意見(jiàn)。
1.衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)的貝葉斯NMB模型
衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)中,常用的成本效果評(píng)價(jià)指標(biāo)為凈效益(net monetary benefit,NMB),即
NMB=K△e-△c=K(μ1-μ2)-(γ1-γ2)
(1)
NMB是新方法與標(biāo)準(zhǔn)方法在貨幣尺度上的相對(duì)凈效益,是關(guān)于K的函數(shù)。式中,K表示意愿支付的界值(willing to pay,WTP),△e代表兩種方法效果的均數(shù)差,即μ1-μ2,μ1和μ2分別表示兩種方法的平均效果;△c代表兩種方法成本的均數(shù)差,即γ1-γ2,γ1和γ2分別表示兩種方法的平均成本。當(dāng)NMB=0時(shí),表示新方法相對(duì)于標(biāo)準(zhǔn)方法沒(méi)有多余的效益;當(dāng)NMB>0時(shí),表示新方法相對(duì)于標(biāo)準(zhǔn)方法是具有成本效果的。與普通的Bayesian方法(只考慮單一的先驗(yàn)信息)不同,這里在分析階段和設(shè)計(jì)階段分別考慮了不同的先驗(yàn)信息。
(1)分析階段
在分析階段,如果獲得數(shù)據(jù)的后驗(yàn)概率至少為ω使得NMB>0,那么我們可以認(rèn)為研究結(jié)果是陽(yáng)性的,即新方法是具有成本效果的。ω的含義和傳統(tǒng)假設(shè)檢驗(yàn)中的1-α非常類(lèi)似,在Bayesian分析中,當(dāng)先驗(yàn)概率很弱時(shí),其結(jié)果和傳統(tǒng)頻率理論得到的結(jié)果是相等的,此時(shí)ω=1-α。頻率方法中降低水平可以使結(jié)論更嚴(yán)格,同樣地,Bayesian方法中也可通過(guò)提高ω的值使得結(jié)論更加嚴(yán)格。
(2)設(shè)計(jì)階段
在設(shè)計(jì)階段,我們需要每組有充足的樣本量(n1和n2)使得陽(yáng)性結(jié)果出現(xiàn)的概率至少為δ,即P(NMB>0)>δ。δ與頻率理論中的檢驗(yàn)效能相似,但又有所不同。頻率理論中,我們假定一個(gè)真實(shí)的NMB,然后計(jì)算樣本NMB大于等于假定值的概率即為檢驗(yàn)效能。而B(niǎo)ayesian方法中,我們假定NMB的先驗(yàn)分布,然后計(jì)算先驗(yàn)分布下的平均檢驗(yàn)效能即為。如果設(shè)計(jì)階段NMB有很強(qiáng)的先驗(yàn)分布,那么NMB可以取一個(gè)特定值NMB0。另一方面,如果設(shè)計(jì)階段的先驗(yàn)信息很弱,那么NMB將很可能為正向的極端值或負(fù)向的極端值,致使無(wú)法求得合適的樣本量。因此,設(shè)計(jì)階段NMB應(yīng)有適當(dāng)?shù)南闰?yàn)分布。
該方法假設(shè)樣本成本和效果數(shù)據(jù)服從聯(lián)合正態(tài)分布,雖然個(gè)體觀測(cè)值不服從正態(tài)分布,但是根據(jù)中心極限定理,當(dāng)樣本足夠大時(shí)將會(huì)接近正態(tài)分布。同時(shí),假設(shè)先驗(yàn)分布也服從正態(tài)分布。
2.模型求解
根據(jù)分析階段的目的,獲得陽(yáng)性結(jié)果需要滿足如下不等式:
(2)
(3)
(4)
其中,ρ1和ρ2分別表示每組效果與成本的相關(guān)系數(shù),n1和n2分別表示兩組的樣本量,σ1與σ2表示兩組效果的標(biāo)準(zhǔn)差,τ1與τ2表示兩組成本的標(biāo)準(zhǔn)差。
在設(shè)計(jì)階段,我們需要選擇兩組合適的樣本量使得能夠以δ的概率滿足公式(2)。因此,綜合考慮分析階段和設(shè)計(jì)階段的先驗(yàn)分布,公式(2)變?yōu)椋?/p>
(5)
(6)
② 當(dāng)分析階段的先驗(yàn)信息很弱,設(shè)計(jì)階段有適當(dāng)?shù)南闰?yàn)信息時(shí);③ 普通的Bayesian試驗(yàn)設(shè)計(jì)方法,其中ma=md,Va=Vd。后面的實(shí)例分析將針對(duì)這三種類(lèi)型逐一分析。
3.SAS程序
通過(guò)SAS的IML模塊實(shí)現(xiàn)上文公式(5)的樣本量估計(jì),以下是SAS程序以及樣本量估計(jì)時(shí)所需的參數(shù)解釋。輸入分析階段和設(shè)計(jì)階段的先驗(yàn)期望及方差、樣本標(biāo)準(zhǔn)差、成本與效果的相關(guān)系數(shù)、組間樣本量的比值、意愿支付界值、omega和delta即可得到最小組的樣本量估計(jì)值。其中omega和delta為公式(5)中的ω和δ。
%letm_analysis={5,6000,6.5,7200};/*分析階段的期望值,依次為第一組效果、第一組成本、第二組效果和第二組成本*/
%letm_design={5,6000,6.5,7200};/*設(shè)計(jì)階段的期望值,向量元素含義同上*/
%letv_analysis=.;/*分析階段的方差矩陣,如果分析其逆為0的情況則賦值為缺省值“.”,反之賦值為相應(yīng)的方差矩陣即可*/
%letv_design={4 0 3 0,0 10000000 0 0,3 0 4 0,0 0 0 10000000};/*設(shè)計(jì)階段的方差矩陣*/
%letsd={4.04,8700,4.04,8700};/*樣本標(biāo)準(zhǔn)差,依次為第一組效果、第一組成本、第二組效果和第二組成本*/
%letp={0,0};/*依次為第一組和第二組中成本與效果的相關(guān)系數(shù)*/
%letr=1;/*第二組與第一組樣本量的比值,如n1∶n2=1∶2,則r=2,此時(shí)得到的是較小組的樣本量*/
%letk=10000;/*意愿支付界值*/
%letomega=0.975;/*取得陽(yáng)性結(jié)果的后驗(yàn)概率,*/
%letdelta=0.7;
prociml;
va=&v_analysis;
ifva=.thenva_inv=0;
elseva_inv=inv(va);
a={-&k,1,&k,-1};
sigma1=&sd[1]##2;
sigma2=&sd[3]##2;
tau1=&sd[2]##2;
tau2=&sd[4]##2;
s=j(4,4,0);/*樣本方差矩陣*/
s[1,1]=sigma1/i;
s[1,2]=&p[1]#&sd[1]#&sd[2]/i;
s[2,1]=&p[1]#&sd[1]#&sd[2]/i;
s[2,2]=tau1/i;
s[3,3]=sigma2/(&r#i);
s[3,4]=&p[2]#&sd[3]#&sd[4]/(&r#i);
s[4,3]=&p[2]#&sd[3]#&sd[4]/(&r#i);
s[4,4]=tau2/(&r#i);
vv=inv(va_inv+inv(s));/*后驗(yàn)方差矩陣*/
left=t(a)*vv*(va_inv*&m_analysis+inv(s)*&m_design);/*不等式左邊*/
right1=abs(quantile(“normal”,1-&omega))#sqrt(t(a)*vv*a);/*不等式右邊第一項(xiàng)*/
right2=abs(quantile(“normal”,1-&delta))#sqrt(t(a)*vv*inv(s)*(&v_design+s)*inv(s)*vv*a);
index=left-right1-right2;/*不等式右邊第二項(xiàng)*/
ifindex>=0thenstop;/*不等式成立則停止迭代*/
end;
printi;/*最小組所需的樣本量*/
quit;
利用上文的SAS程序分析常見(jiàn)的分析階段和設(shè)計(jì)階段三種不同的先驗(yàn)信息組合下樣本量的估計(jì)。為了便于比較,本文引用與O′HaganA[1]相同的例子,Briggs和Tambour[11]也利用頻率方法分析過(guò)這個(gè)例子。
1.分析階段先驗(yàn)信息弱,設(shè)計(jì)階段先驗(yàn)信息強(qiáng)
表中給出了不同效應(yīng)量(1.5和0.8)、不同相關(guān)系數(shù)(0、0.5和-0.5)以及不同意愿支付界值(10000、20000和30000)下的樣本量估計(jì)結(jié)果??梢?jiàn)效應(yīng)量較大時(shí)需要的樣本量相對(duì)較小,這與公式(5)一致。不等式左邊為兩個(gè)先驗(yàn)期望值的加權(quán),效應(yīng)量越大左邊越大,不等式越容易成立。再者,效果與成本的相關(guān)系數(shù)也會(huì)對(duì)樣本量的估計(jì)結(jié)果產(chǎn)生影響,從表中可以看出相關(guān)系數(shù)正向越大所需樣本量越小,反之,負(fù)向越大所需樣本量越大,這與ALMJ[6]在文中的結(jié)論一致。此外,隨著意愿支付界值的升高,所需樣本量越小。
表1 分析階段先驗(yàn)信息弱,設(shè)計(jì)階段先驗(yàn)信息強(qiáng)時(shí)樣本量估計(jì)結(jié)果
2.分析階段先驗(yàn)信息弱,設(shè)計(jì)階段先驗(yàn)信息適當(dāng)
樣本量估計(jì)結(jié)果見(jiàn)表2。
表2 分析階段先驗(yàn)信息弱,設(shè)計(jì)階段先驗(yàn)信息適當(dāng)時(shí)樣本量估計(jì)結(jié)果
與情形①不同的是效應(yīng)量大小的設(shè)置。效應(yīng)量為0.8時(shí)超出了迭代算法中設(shè)置的最大樣本量(N=100000),現(xiàn)實(shí)情況下不具有操作性,故表2給出了效應(yīng)量分別為1.5和1.0時(shí)的樣本量估計(jì)結(jié)果。與表1的結(jié)果相比,相同參數(shù)條件下表2中所需的樣本量相對(duì)較大,原因是情形①中設(shè)計(jì)階段的先驗(yàn)信息非常強(qiáng)。先驗(yàn)信息越強(qiáng),所需樣本量相對(duì)越小。其他參數(shù)之間的規(guī)律與情形①保持一致。
3.分析階段和設(shè)計(jì)階段先驗(yàn)信息相等
本例中,我們假設(shè)分析階段和設(shè)計(jì)階段都有適當(dāng)?shù)南闰?yàn)信息,且相等。即,ma=md,Va=Vd取值情況與情形②相同。其中,考慮到效應(yīng)量等于0.8時(shí)的不可操作性本例也給出了1.5和1.0兩種情況下的結(jié)果。此時(shí),樣本量的估計(jì)結(jié)果見(jiàn)表3。
與表2的結(jié)果相比可以看出,相同參數(shù)條件下,分析階段有適當(dāng)?shù)南闰?yàn)信息也可以減少所需要的樣本量。其他參數(shù)之間的規(guī)律與情形①保持一致。
表3 分析階段和設(shè)計(jì)階段先驗(yàn)信息相等時(shí)樣本量估計(jì)結(jié)果
衛(wèi)生經(jīng)濟(jì)學(xué)評(píng)價(jià)中樣本量的估計(jì)方法包括頻率方法和Bayesian方法,Bayesian方法的優(yōu)勢(shì)是可以看到分析階段和設(shè)計(jì)階段不同先驗(yàn)信息對(duì)樣本量估計(jì)的重要性。而且,Bayesian方法還可以包含頻率方法,并求得相等的樣本量,這也體現(xiàn)了該方法的靈活性。近二十年成本效果分析的方法學(xué)日益發(fā)展,但是應(yīng)用方面樣本量的計(jì)算受到很大限制,很大程度上是由于沒(méi)有專(zhuān)用的統(tǒng)計(jì)軟件或便利的程序?qū)崿F(xiàn)。為了彌補(bǔ)該領(lǐng)域發(fā)展的不足,本文基于O′Hagan A等人的文章[1]給出了Bayesian方法的SAS實(shí)現(xiàn)。用SAS編寫(xiě)成宏,只需要輸入所需參數(shù)就可以得到樣本量的估計(jì)結(jié)果。
本文只給出了平行設(shè)計(jì)中Bayesian方法的樣本量估計(jì),后續(xù)將考慮不同試驗(yàn)設(shè)計(jì)下的樣本量估計(jì)方法,如配對(duì)設(shè)計(jì)、交叉設(shè)計(jì)等。
[1]O′Hagan A,Stevens JW.Bayesian assessment of sample size for clinical trials of cost-effectiveness.Medical Decision Making,2001,21(6):219-230.
[2]Australia Commonwealth Department of Human Services and Health.Guidelines for the Pharmaceutical Industry on Preparation of Submissions to the Pharmaceutical Benefits Advisory Committee:Including Major Submissions Involving Economic Analysis.Canberra:Australia Government Publishing Service,1995.
[3]Canadian Coordinating Office for Health Technology Assessment.Guidelines for Economic Evaluation of Pharmaceuticals:Canada(2nd ed).Ottawa:Canadian Coordinating Office for Health Technology Assessment,1997.
[4]Ramsey SD,Willke RJ,Briggs AH,et al.Good research practices for cost effectiveness analysis alongside clinical trials:the ISPOR RCT-CEA Task Force report.Value in Health,2005,8(5):521-33.
[5]Ramsey SD,Willke RJ,Glick H,et al.Cost-Effectiveness Analysis Alongside Clinical Trials II-An ISPOR Good Research Practices Task Force Report.Value in Health,2015,18(2):161-172.
[6]AL MJ,Van Hout BA.Michel BC,et al.Sample size calculation in economic evaluations,Health Economics,1998,7(4):327-335.
[7]Laska EM,Meisner M,Siegel C.Power and sample size in cost-effectiveness analysis,Medical Decision Making,1999,19(3):339-343.
[8]Willan AR,O′Brien BJ.Sample size and power issues in estimating incremental cost-effectiveness ratios from clinical trials data.Health Economics,1999,8(3):203-211.
[9]Gafni A,Walter SD,Birch S,et al.An opportunity cost approach to sample size calculation in cost-effectiveness analysis.Health Economics,2008,17(1):99-107.
[10]O′Hagan A,Stevens JW,Montmartin J.Bayesian cost-effectiveness analysis from clinical trial data.Statistics in Medicine,2001,20(5):733-753.
[11]Briggs A,Tambour M.The design and analysis of stochastic cost-effectiveness studies for the evaluation of health care interventions.Drug Information Journal,2001,35(4):1455-1468.
(責(zé)任編輯:鄧妍)
陳平雁,Email:chenpy99@126.com
=10to100000;/*設(shè)定迭代過(guò)程的初始值和最大值*/
中國(guó)衛(wèi)生統(tǒng)計(jì)2016年4期