劉俊麟陸 濤,3李智慧林 曉王 菲言方榮△
基于非參數(shù)回歸的生物等效性多重檢驗*
劉俊麟1,2陸 濤1,2,3李智慧1,2林 曉1,2王 菲1,2言方榮1,2△
目的本文提出一種基于非參數(shù)模型的生物等效性檢驗的新方法。方法首先利用非參數(shù)回歸的方法估計血藥濃度-時間曲線,并建立血藥濃度估計值線性混合效應(yīng)模型估計藥物效應(yīng)系數(shù),在此模型的基礎(chǔ)上采用多重檢驗的方法對曲線上每一時間點處的藥物效應(yīng)系數(shù)進行生物等效性檢驗。若在所有時間點處等效,則兩種藥物等效。結(jié)果模擬和實例分析表明此方法能消除周期效應(yīng)和序列效應(yīng)的影響,同時在數(shù)據(jù)稀疏時可降低生物等效性檢驗的I類誤差率,并能提高在測量誤差較大時的檢驗效能。結(jié)論本文提出的多重檢驗方法有較高的檢驗效能和較低的I類誤差率,可應(yīng)用于生物等效性檢驗。
生物等效性 非參數(shù)回歸 線性混合效應(yīng)模型 多重檢驗
人體中血藥濃度-時間曲線在生物等效性檢驗中扮演非常重要的角色。經(jīng)典的生物等效性檢驗方法是使用藥時曲線下面積AUC或者最大血藥濃度Cmax進行雙向單側(cè)t檢驗[1]。Anne Dubois[2]提出通過AUC或者Cmax建立線性混合效應(yīng)模型,同時考慮藥物效應(yīng)、周期效應(yīng)和序列效應(yīng),并采用藥物效應(yīng)的估計值進行生物等效性檢驗。但利用AUC或Cmax進行生物等效性檢驗存在一些不足:首先,AUC或Cmax的計算受到測量時間點多寡的影響。Mauger和Chinchilli[3]建議增加測量時間點,使得血藥濃度-時間曲線更平滑,且在每個時間區(qū)間內(nèi)就濃度總和進行生物等效性檢驗,以便更合理的檢驗生物等效性,然而一個不足是增加血藥濃度測量時間點勢必會導(dǎo)致試驗成本的增加,另外,對于一些特殊類型用藥,比如兒童用藥和老年用藥,增加血藥濃度測量點也存在倫理學的限制。其次,AUC和Cmax為血藥濃度-時間曲線的點估計,而研究表明點估計等效時對應(yīng)的血藥濃度-時間曲線未必等效。因此,研究就整個血藥濃度-時間曲線探討生物等效性檢驗值得我們深入討論。
黃鳳凰[4]首次提出了基于參數(shù)模型的平均生物等效性檢驗,其基本思想是:通過房室模型估計血藥濃度-時間曲線,采用多個時間點處的血藥濃度估計值進行多重檢驗或者建立兩種藥物平均血藥濃度-時間曲線差值的聯(lián)合置信區(qū)間來檢驗生物等效性。然而,當房室模型選定錯誤或房室模型參數(shù)估計出現(xiàn)較大偏差時,會引起藥時曲線估計的偏倚,從而導(dǎo)致生物等效性檢驗效能的降低或檢驗I類誤差率的提高。因此,研究更為有效的模型擬合方法,對提高生物等效性檢驗效能有著非常重要的作用。
為解決上述問題,本文提出了基于非參數(shù)回歸的生物等效性多重檢驗。首先采用非參數(shù)回歸中的光滑樣條方法擬合血藥濃度-時間曲線。然后選取多個時間點處的血藥濃度為響應(yīng)變量,藥物效應(yīng)、周期效應(yīng)與序列效應(yīng)為固定效應(yīng),建立線性混合效應(yīng)模型。估計每個時間點處的藥物效應(yīng)并進行多重檢驗。若兩種藥物在所選取的所有時間點處都等效,則可認為生物等效。
1.血藥濃度-時間曲線的非參數(shù)回歸[5]
假設(shè)有N位受試者分別在m個時間點測得的血藥濃度,對于每一位受試者,利用其測量時間點以及對應(yīng)的血藥濃度可建立N個如下的非參數(shù)回歸模型:
其中tj表示第j個測量時間點,yij表示第i個受試者在第j個測量時間點對應(yīng)的血藥濃度。fi(·)表示i個受試者的待估計非參數(shù)回歸函數(shù)。εij表示測量誤差,其服從均值為0的正態(tài)分布。σi表示第i位受試者非參數(shù)回歸模型的測量誤差的標準差。本文利用光滑樣條的方法對模型(1)進行估計,利用R軟件中的smooth.spline函數(shù)進行計算,可得到每個受試者的血藥濃度-時間曲線以及每個個體任意時間點上血藥濃度的估計值,記為將從中選取多個時間點處的血藥濃度,用于生物等效性的多重檢驗。此方法主要有兩個優(yōu)點:一是不受房室模型的限制,不存在模型指定錯誤或者參數(shù)估計偏差的問題。二是在兒童或老年用藥等測量點較少、數(shù)據(jù)稀疏的情況下,可通過非參數(shù)回歸數(shù)據(jù)擴大法對血藥濃度曲線進行插值估計,增加數(shù)據(jù)的樣本量[6]。
2.基于線性混合效應(yīng)模型的生物等效性的多重檢驗
FDA[7]推薦采用AUC或者Cmax檢驗藥物的生物等效性。Anne Dubois[2]建立基于AUC和Cmax的線性混合效應(yīng)模型,并利用雙向單側(cè)t檢驗進行生物等效性檢驗。然而AUC或Cmax等效,對應(yīng)的藥時曲線未必等效。本文中,將此模型應(yīng)用于檢驗藥和參比藥藥時曲線上的多個時間處的血藥濃度估計值,若選取的所有血藥濃度都等效,可說明兩種藥物的血藥濃度-時間曲線等效,繼而可得出兩種藥物生物等效性的結(jié)論。
假設(shè)采用交叉試驗設(shè)計進行生物等效性檢驗,樣本量即受試者人數(shù)為N,交叉試驗中有C種藥物,K個周期,Q個序列,并假定交叉試驗中第一序列第一周期受試者服用參比藥。ij(i=1,2,…,N,j=1,2,…m)為第i個受試者在時間點j時的血藥濃度估計值,利用選取的m個時間處的對數(shù)血藥濃度估計值為響應(yīng)變量分別建立如下m個線性混合效應(yīng)模型:
其中,vj表示時間點j處參比藥血藥濃度估計值的期望為時間點j處藥物效應(yīng)、周期效應(yīng)、序列效應(yīng)的系數(shù)向量,其維數(shù)分別為C,K和Q;Ti,Pi,Si為已知藥物、周期和序列的協(xié)變量向量,其維數(shù)分別為C,K和Q。ηij和εij分別為隨機個體效應(yīng)和殘差。vj為第一序列第一周期參比藥的血藥濃度在時間點j處
H0{至少存在一個j=1,2,…,m,使得或者
將其分解為m個原假設(shè),為
由文獻[2]知,W1j和W2j服從自由度為(N-2)的t分布,當置信水平為(1-α)%時,有
由文獻[8],在第j個時間點進行雙向單側(cè)檢驗的P值為:
在置信水平(1-α)%下,將p1,p2,…,pm排序,得到p(1)≤p(2)≤…≤p(m)。應(yīng)用Bonferroni[9]不等式,若
則可得出結(jié)論:第c種藥物與參比藥經(jīng)多重檢驗生物等效。
為評估本文方法在生物等效性檢驗中的檢驗效能,設(shè)置模擬分析如下:采用經(jīng)典的2×2交叉試驗設(shè)計,為簡便計算,假設(shè)周期效應(yīng)和序列效應(yīng)為0。在此模擬分析中,我們采用了兩種方法進行等效性檢驗:第一種方法為本文提出的基于非參數(shù)回歸的生物等效性多重檢驗方法,將此種方法記為ST;第二種方法為不對現(xiàn)有的血藥濃度-時間數(shù)據(jù)進行非參數(shù)回歸的擬合,而是將實驗得到的血藥濃度直接帶入模型(2)中,后面的檢驗過程與方法ST相同,將此種方法記為LT。在模擬分析中,參照文獻[10],用如下一房室模型產(chǎn)生N位受試者在m個時間點測得血藥濃度數(shù)據(jù):
其中d為給藥劑量,在模擬中取值為50。V,kα,ke分布為分布容積、吸收速率常數(shù)和消除速率常數(shù)。在本模擬分析中,進行生物等效和生物不等效的兩組模擬。
其中,參比藥的參數(shù)設(shè)置都為(VR,kαR,keR)=(15,0.4,0.2)。對于檢驗藥,假設(shè)生物不等效時,研究以下三種情況:
假設(shè)生物等效時,研究以下三種情況:
為考察不同的樣本量以及不同數(shù)量的測量時間點對檢驗的影響,模擬N=16或者24,m=8或者13四種情況。當m=8時,在給藥后0.5,1,2,4,6,8,10,12小時后獲得血藥濃度。當m=13時,在給藥后0.5,1,1.5,2,2.5,3,3.5,4,5,6,8,10,12小時后獲得血藥濃度。m=8和m=13時的血藥濃度-時間曲線分別見圖1和圖2。當m=8時,采用ST方法進行檢驗時,通過非參數(shù)數(shù)據(jù)擴大法,對血藥濃度曲線進行插值估計,可得到任意時間點的血藥濃度估計值,選取與m=13時同樣的13個時間點處的血藥濃度估計值進行檢驗;而對于LT方法,不通過非參數(shù)數(shù)據(jù)擴大,直接采用已知的8個血藥濃度進行檢驗。同時,為分析測量誤差的影響,我們同時對上述每一種情況模擬測量誤差較小和較大兩種情況,即σ=0.05或σ=0.1。
圖1 m=8時六種情況下血藥濃度-時間曲線(實線為參比藥,點線為檢驗藥)
對于上述每一種情況和參數(shù)設(shè)置,我們均采用ST,LT兩種方法進行1000次模擬。在N1-N3中,滿足生物等效性的百分率為在真實情況為生物不等效的情況下經(jīng)檢驗認為生物等效的百分率,即Ⅰ型錯誤率,結(jié)果見表1。在A1-A3中,滿足生物等效性的百分率為在真實情況為等效的情況下經(jīng)檢驗仍為生物等效的百分率,即為檢驗效能,結(jié)果見表2。
從表1可得到以下結(jié)論。首先,當σ=0.05時,ST和LT方法得到的Ⅰ型錯誤率都明顯小于σ=0.1時得到的Ⅰ型錯誤率,因此當個體變異性高,測量誤差較大時,生物等效性檢驗的Ⅰ型錯誤率都會增大。但是,當σ=0.1,即測量誤差較大時,ST方法得到的Ⅰ型錯誤率小于LT方法得到的Ⅰ型錯誤率,可得出結(jié)論非參數(shù)回歸能一定程度去除測量誤差的影響,提高生物等效性的準確度。其次,可看出在m=13時,ST方法和LT方法得到的Ⅰ型錯誤率都非常小,但當m=8時,ST和LT方法的Ⅰ型錯誤率明顯的有一定程度的膨脹,但相比而言,ST方法的Ⅰ型錯誤率更小,因此,當采血樣本點較少時,本文提出的ST方法能通過非參數(shù)回歸擴大血藥濃度的樣本,更好的控制Ⅰ型錯誤率。最后,樣本量對ST和LT兩種方法的Ⅰ型錯誤率影響不明顯。
圖2 m=13時六種情況下血藥濃度-時間曲線(實線為參比藥,點線為檢驗藥)
表1 α=0.1時的I型錯誤率
表2 α=0.1時的檢驗效能
從表2可得出以下結(jié)論。首先,當σ=0.05時,ST和LT方法得到的檢驗效能都較好。在σ=0.1時,ST方法的檢驗效能明顯高于LT方法得到的檢驗效能。可得出結(jié)論,當個體的變異性高,測量誤差較大時,非參數(shù)回歸能去除測量誤差的影響,因此采用ST方法檢驗生物等效性有更高的檢驗效能。其次,從整張表可看出,當樣本量增加或者每個個體血藥濃度的采樣點增多時,檢驗效能都會增加。因此,采用非參數(shù)數(shù)據(jù)擴大法,能提高生物等效性的檢驗效能。
將本方法應(yīng)用于兩種緩控釋茶堿制劑的生物等效性檢驗中,數(shù)據(jù)來源于文獻[11]。采用交叉試驗設(shè)計,此研究中有18位受試者,每位受試者隨機分配到交叉試驗中的序列1或者序列2。序列1中的9位受試者先服用參比藥再服用檢驗藥,序列2中的9位受試者先服用檢驗藥后服用參比藥。在18位受試者服藥后2,3,4,5,6,7,8,10,12,14,16,18,20,22,24,28,36,40,44小時后測量其血藥濃度。利用本文提出的方法檢驗兩種茶堿藥物的生物等效性,因其在19個時間點處測量了血藥濃度,所以多重檢驗中取19,即進行19次雙向單側(cè)檢驗,得到的結(jié)果見表3和表4。從表4可知,所選取的每個時間點處得到的p值都大于調(diào)整后的顯著水平,因此經(jīng)多重檢驗這兩種藥物生物不等效,與文獻[11]中的結(jié)果是一致。
表3 不同時間點得到的檢驗統(tǒng)計量的W值和p值
表4 多重檢驗中19個p值排序以及其對應(yīng)的調(diào)整后顯著水平
本文在傳統(tǒng)的基于AUC和Cmax采用雙向單側(cè)檢驗進行生物等效性檢驗的基礎(chǔ)上,發(fā)展了一種新的基于非參數(shù)回歸的生物等效性多重檢驗方法,此方法在生物等效性檢驗中主要有以下優(yōu)勢:首先,對于藥時曲線的估計不受房室模型的限制,不存在模型選擇錯誤和參數(shù)估計偏差的問題。其次,采用非參數(shù)回歸的方法估計血藥濃度-時間曲線,并利用血藥濃度的估計值進行生物等效性多重檢驗,能在采樣點較少、數(shù)據(jù)稀疏時擴大血藥濃度的樣本量,降低Ⅰ型錯誤率并能在測量誤差較大時提高生物等效性檢驗的檢驗效能。另外,此方法可直接檢驗兩條血藥濃度-時間曲線是否等效,對于兩種藥物的生物等效性要求更嚴格。最后,現(xiàn)有的文獻大多在兩種藥物,交叉試驗設(shè)計框架下進行基于模型的生物等效性研究,但本文提出的方法能應(yīng)用于多種藥物,任何周期與序列數(shù)的交叉試驗,更具有一般性,并能在模型擬合的過程中消除周期效應(yīng)和序列效應(yīng)對藥物效應(yīng)的影響,使生物等效性檢驗更準確。
但此方法仍然存在一些待完善的內(nèi)容:首先,本文利用了光滑樣條進行非參數(shù)回歸,估計藥時曲線。但還可用局部多項式和懲罰樣條等方法可進行藥時曲線的估計,需要進一步的討論與驗證哪種方法能最好的擬合血藥濃度-時間曲線。其次,樣本點的選取也可能影響此方法的準確性。若樣本點的選取不合適,如間距太大或者數(shù)量太少,也會影響血藥濃度-時間曲線的非參數(shù)估計的準確性,從而影響生物等效性檢驗。最后,在非參數(shù)回歸后,選取多少個血藥濃度進行生物等效性多重檢驗,使之有最大的檢驗效能和最小的Ⅰ型錯誤率,并符合臨床實際要求也是一個需要進一步研究的問題。
1.韓偉,姜晶.生物等效性統(tǒng)計評價方法概述.中國衛(wèi)生統(tǒng)計,2010,27(4):441-445.
2.Dubois A,Lavielle M,Gsteiger S,et al.Model-based Analyses of Bioequivalence Crossover Trials Using the Stochastic Approximation Expectation Maximisation Algorithm.Statistics in Medicine,2011,30(21):2852-2600.
3.Mauger DT,Chinchilli VM.An alternative index for assessing profile similarity in bioequivalence trials.Statistics in Medicine,2000,19(20):2855-2866.
4.黃鳳凰.單區(qū)藥物動力學模式中根據(jù)藥物濃度時間側(cè)寫檢定生物等效性的研究.國立中央大學統(tǒng)計研究所碩士論文.
5.Wang Y,Eskridge KM,Zhang S.Semiparametric Mixed-effects Analysis of PK/PD Models Using Differential Equations.Journal of Pharmacokinetics and Pharmacodynam ics,2008,35(4):443-463.
6.陶禹希,陸濤,言方榮.局部多項式數(shù)據(jù)擴大法在群體藥動學稀疏數(shù)據(jù)中的應(yīng)用.中國新藥雜志,2013,12:1361-1366.
7.FDA.Guidance for Industry-Statistical Approaches to Establishing Bioequivalence,Technical report,F(xiàn)DA,2001.
8.Berger RL,Hsu JC.Bioequivalence Trials,Intersection-union Tests and Equivalence Confidence Sets.Statistical Science,1996,11(4):283-319.
9.Benjamini Y,Hochberg Y.Controlling the False Discovery Rate:A Practical and Powerful Approach to Multiple Testing.Journal of the Royal Statistical Society.Series B(Methodological),1995,57(1):289-300.
10.Chen YI,Huang CS.Multiple Testing for Bioequivalence With Pharmacokinetic Data in 2×2 Crossover Designs.Statistics in Medicine,2009,28(28):3567-3579.
11.Senn SS.Bioequivalence Studies in Drug Development.England:John Wily&Sons,2007:135-145.
(責任編輯:劉 壯)
Multiple Testing for Bioequivalence Based on Nonparametric Regression
Liu Junlin,Lu Tao,Li Zhihui,et al(State Key Laboratory of Natural Medicines,China Pharmaceutical University(210009),Nanjing)
ObjectiveWe proposed a new method of multiple testing for bioequivalence based on nonparametric regression.MethodsDrug concentration-time curves were estimated by nonparametric regression and linear mixed effect models for drug concentration estimates at different time points were established.A multiple test based on the drug effect coefficients at different time points was then proposed for testing the bioequivalence of the drug concentration-time curves.ResultsThe results of simulation study and application analysis indicate that the proposed method can eliminate period and sequence effects,decrease type I error rate when data is sparse and enhance test power when measurement error is large.ConclusionThe proposed multiple testing method for bioequivalence based on nonparametric regression is applicable because of its good power performance and low type I error rate.
Bioequivalence;Nonparametric regression;Linear mixed effect models;Multiple testing
中央高校專項業(yè)務(wù)經(jīng)費(JKPZ2013015,JKQZ2013026):國家自然科學基金重點項目(NSFC 81130068)
1.中國藥科大學天然藥物活性物質(zhì)與功能國家重點實驗室(210009)
2.中國藥科大學理學院數(shù)學教研室
3.中國藥科大學分子設(shè)計與藥物發(fā)現(xiàn)實驗室
△通信作者:言方榮,E-mail:f.r.yan@163.com