代 菲,舒麗芯,儲(chǔ) 藏,陳盛新,儲(chǔ)文功(第二軍醫(yī)大學(xué)藥事管理教研室,上海200433)
目前,我國(guó)藥物不良反應(yīng)報(bào)告數(shù)據(jù)的提取主要從醫(yī)院信息系統(tǒng)(hospital information systems,HIS)和國(guó)家藥物不良反應(yīng)監(jiān)測(cè)中心提取,而國(guó)外藥物不良事件報(bào)告多來(lái)自自發(fā)呈報(bào)系統(tǒng),隨著近年我國(guó)醫(yī)院信息系統(tǒng)的完善和藥物不良反應(yīng)信息知識(shí)的宣傳,我國(guó)ADR自發(fā)呈報(bào)數(shù)據(jù)數(shù)量迅速增加,如何從中提取藥物的不良信號(hào),為臨床合理用藥提供參考,成為大家關(guān)注的問(wèn)題。經(jīng)相關(guān)文獻(xiàn)研究,總結(jié)了目前國(guó)內(nèi)和國(guó)外應(yīng)對(duì)藥物不良信號(hào)監(jiān)測(cè)的幾種常見(jiàn)用法。而這些常用方法都是基于比例失衡報(bào)告信號(hào)基礎(chǔ)上發(fā)現(xiàn)的,因此首先我們應(yīng)該了解什么是比例失衡。
比例失衡是指將藥物不良反應(yīng)(adverse drug reaction,ADR)數(shù)據(jù)庫(kù)中所有藥物不良事件報(bào)告作為一個(gè)整體和背景,如果某特定藥物-藥物不良反應(yīng)(Drug-ADR)組合報(bào)告比例在此背景下表現(xiàn)失衡即稱為比例失衡[1]。一些方法就是通過(guò)藥物不良反應(yīng)比例失衡報(bào)告來(lái)發(fā)現(xiàn)ADR信號(hào)。對(duì)自動(dòng)上報(bào)系統(tǒng)(spontaneous reporting system,SRS)的數(shù)據(jù)執(zhí)行比例失衡分析所使用的不同數(shù)據(jù)挖掘算法,很大程度上促進(jìn)了藥物安全監(jiān)測(cè)的發(fā)展,然而有些比例失衡報(bào)告信號(hào)只是與藥物作用于人體的某項(xiàng)指征有關(guān),而不是一個(gè)不良事件或不良反應(yīng)。
目前美國(guó)、歐洲和日本等對(duì)于數(shù)據(jù)挖掘算法應(yīng)用相對(duì)比較成熟,經(jīng)國(guó)內(nèi)外的文獻(xiàn)研究,除了傳統(tǒng)的方法提取不良反應(yīng)信號(hào)外,還總結(jié)了目前國(guó)內(nèi)外使用的所有藥物不良反應(yīng)信號(hào)挖掘方法如下:壺模型(urn-model)、報(bào)告比數(shù)比法(reporting odds ratio ROR)、比例報(bào)告比值法(proportional reporting ratio PRR)、綜合標(biāo)準(zhǔn)法(MHRA或MCA)、伽瑪泊松分布縮減法(gamma Poisson Shrinker GPS)、經(jīng)驗(yàn)貝葉斯監(jiān)測(cè)(EBS)、多項(xiàng)伽馬-泊松縮量估計(jì)法(multi-item gamma passion shrinker,MGPS)和貝葉斯可信傳播神經(jīng)網(wǎng)絡(luò)法(Bayesian confidence propagation neural network,BCPNN)、最終實(shí)驗(yàn)室檢查結(jié)果比較法(comparison on extreme laboratory test results,CERT)。上市后藥物ADR信號(hào)監(jiān)測(cè)方法主要用于監(jiān)測(cè)和分析自主呈報(bào)系統(tǒng)的ADR報(bào)告的數(shù)據(jù)。拓展臨床評(píng)價(jià)更大組別的分析能力。
2.1 壺模型(urn-model) 壺模型是由Hochberg等人描述的,壺模型原來(lái)是判斷摸到壺里各種顏色球的概率,后來(lái)擴(kuò)展應(yīng)用到數(shù)據(jù)庫(kù)分布相關(guān)的某一行為表現(xiàn)[2]。病例報(bào)告和證據(jù)水平的分類是按納蘭霍(Naranjo)標(biāo)準(zhǔn)執(zhí)行,對(duì)一些問(wèn)題進(jìn)行打分即Yes、No和 Black三種打分法。壺模型報(bào)告比值(RR)>1.0,事件計(jì)數(shù)>2,統(tǒng)計(jì)上不會(huì)發(fā)生預(yù)想結(jié)果的值>N/0.05,N表示所有不良事件的總的數(shù)量,同時(shí)滿足這些條件,表示產(chǎn)生藥物不良反應(yīng)信號(hào)。被應(yīng)用于美國(guó)FDA不良事件報(bào)告系統(tǒng)數(shù)據(jù)庫(kù),產(chǎn)生1 562個(gè)不相稱報(bào)告信號(hào)。
2.2 報(bào)告比數(shù)比法(ROR) 報(bào)告比數(shù)比法(ROR)代表比例失衡的一種測(cè)量方法,頻繁被用于自發(fā)報(bào)告的分析,用于鑒別報(bào)告藥物與不良事件之間的潛在的聯(lián)系,ROR比較了每種藥物相對(duì)于所有其他藥物相應(yīng)的比值。在整個(gè)觀察的數(shù)據(jù)中目標(biāo)不良事件與非目標(biāo)不良事件的比值,體現(xiàn)一個(gè)顯著有意義的比例失衡就是95%的可信區(qū)間的下限>1,說(shuō)明該藥物所導(dǎo)致的藥物不良反應(yīng)是值得注意的ADR信號(hào)。應(yīng)用ROR方法,在驗(yàn)證抗菌藥與扭轉(zhuǎn)性室速是否存在聯(lián)系時(shí),除了發(fā)現(xiàn)藥品說(shuō)明書上會(huì)出現(xiàn)的藥物不良反應(yīng),還發(fā)現(xiàn)了5個(gè)新的信號(hào)[3]。
2.3 比例報(bào)告比值 比例報(bào)告比值(PRR)是由Evans等描述的,PRR算法須滿足PRR>2.0,事件計(jì)數(shù)大于2,關(guān)聯(lián)的卡方值χ2>4.0。PRR和ROR的計(jì)算是基于一個(gè)四聯(lián)表,體現(xiàn)了藥物-事件的組合,它包括了目標(biāo)藥物和目標(biāo)事件的數(shù)目、目標(biāo)藥物以外的其他藥物及目標(biāo)事件以外的其他事件的數(shù)目,從而計(jì)算PRR值。計(jì)算PRR的95%的可信區(qū)間(CI),如果95%CI下限>1,則表示生成一個(gè)信號(hào)。PRR算法很少用于處理分層問(wèn)題,文獻(xiàn)研究發(fā)現(xiàn)Woo[4]等基于PRR算法首次使用分層分析,但是分層的效果發(fā)現(xiàn)比例失衡報(bào)告信號(hào)的數(shù)量是適度的,敏感性和特異性卻很低。
2.4 綜合標(biāo)準(zhǔn)法 綜合標(biāo)準(zhǔn)法(MHRA或MCA)是含有多個(gè)指標(biāo)的綜合標(biāo)準(zhǔn)法,同時(shí)也是基于四聯(lián)表的數(shù)據(jù)進(jìn)行計(jì)算,判別信號(hào)的標(biāo)準(zhǔn)是:a≥3,PRR≥-2,χ2≥4,3個(gè)條件同時(shí)具備,才提示生成一個(gè)信號(hào)[5]。
2.5 伽瑪泊松分布縮減法(Gamma Poisson Shrinker,GPS)和多項(xiàng)伽馬-泊松縮量估計(jì)法(multi-item gamma passion shrinker,MGPS)GPS算法是由Du-Mouchel描述的,用SAS/IML程序可執(zhí)行,通過(guò)限制編碼經(jīng)驗(yàn)貝葉斯幾何平均數(shù)(EBGM)95%的可信區(qū)間下限,一般用EB05計(jì)算信息分?jǐn)?shù)。GPS算法需要藥物的一個(gè)輸入矩陣以及所有藥物個(gè)數(shù)和所有事件術(shù)語(yǔ)即至少100個(gè)案例(N代表藥物不良反應(yīng)數(shù)目,i代表行變量,j代表列變量 Nj>100,Ni>100),可在年齡、性別和報(bào)告資源的年份上進(jìn)行分層。GPS算法一般用 EB05的分?jǐn)?shù) >2.0,N>0,EB05的值低于經(jīng)驗(yàn)貝葉斯幾何平均數(shù)(EBGM)的95%可信區(qū)間,滿足這個(gè)條件,可生成一個(gè)比例失衡報(bào)告信號(hào)。MGPS是 GPS的擴(kuò)展,是由美國(guó)的Waltham提出的,用于探索用藥人群特征是否與不良事件之間存在關(guān)聯(lián)及變量的交互作用等[6]。MGPS可用EBGM>2或者EB05≥2發(fā)現(xiàn)信號(hào)。
2.6 貝葉斯可信傳播神經(jīng)網(wǎng)絡(luò)法(Bayesian confidence propagation neural network,BCPNN) 貝葉斯可信傳播神經(jīng)網(wǎng)絡(luò)法反映一種關(guān)聯(lián)程度,通過(guò)藥物發(fā)生的先驗(yàn)概率和后驗(yàn)概率的比值的對(duì)數(shù)值來(lái)表示,即 IC(information component),IC >0,IC 95%可信區(qū)間的下限>0,說(shuō)明可疑藥物與可疑不良反應(yīng)發(fā)生之間存在某種聯(lián)系,提示生成一個(gè)信號(hào),當(dāng)藥物-事件的組合盡最大可能多報(bào)告時(shí),IC接近于0[7]。烏普薩拉監(jiān)測(cè)中心(Uppsala Monitoring System,SRS)是由47個(gè)國(guó)家組成的世界衛(wèi)生組織(WHO)合作中心用于世界范圍的藥物信號(hào)監(jiān)測(cè),率先使用BCPNN方法監(jiān)測(cè)36 000例報(bào)告,監(jiān)測(cè)IC的信號(hào)由陰性值變?yōu)殛?yáng)性值[8]。
2.7 最終實(shí)驗(yàn)室檢查結(jié)果比較法(Comparison on extreme laboratory test results,CERT)和卡方 CERT方法[9]是由Man Young Park描述的,將藥物與實(shí)驗(yàn)室檢查結(jié)果進(jìn)行配對(duì),用配對(duì)t檢驗(yàn)的概率P值或McNemar's檢驗(yàn)值與0.05進(jìn)行比較,當(dāng)P<0.05時(shí),即生成一個(gè)信號(hào)。2011年韓國(guó)亞洲大學(xué)醫(yī)學(xué)院首次使用10年的醫(yī)院電子病歷的數(shù)據(jù),總共523 829例病人,包含32 033 710張?zhí)幏?15 241 147項(xiàng)實(shí)驗(yàn)室檢查,用某種具有代表性的實(shí)驗(yàn)室檢查來(lái)觀測(cè)藥物不良反應(yīng)的發(fā)生,隨機(jī)選擇10類藥物進(jìn)行分析與51項(xiàng)實(shí)驗(yàn)室的值進(jìn)行配對(duì),得到結(jié)果:每種藥物實(shí)驗(yàn)室檢查異常信號(hào)的平均值為27±7.5,敏感性、特異性、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值分別為64% ~100%,22% ~76%,22% ~75%,54% ~100%。
卡方計(jì)算信號(hào)生成方法,即當(dāng)χ2>3.84時(shí),且n>1時(shí)[10],生成一個(gè)藥物不良反應(yīng)信號(hào),被用于中樞性神經(jīng)藥物哌甲酯的信號(hào)監(jiān)測(cè)。
由于不良反應(yīng)數(shù)據(jù)的不完整性,各種算法生成信號(hào)限制的條件和原理也有一定程度的不同,所以信號(hào)產(chǎn)生的數(shù)量也不同以及假陽(yáng)性和假陰性的結(jié)果也有差異。為了減少遺漏的信號(hào),藥物-不良事件常采用多種方法聯(lián)用,以減少偏倚和降低假陽(yáng)性和假陰性信號(hào)的數(shù)量。
3.1 壺模型、GPS和PRR方法聯(lián)用 美國(guó)FDA使用自動(dòng)呈報(bào)系統(tǒng)數(shù)據(jù)庫(kù)中2002~2005年的報(bào)告數(shù)據(jù),采用壺模型產(chǎn)生1562個(gè)比例失衡報(bào)告信號(hào)(SDRS),用伽瑪泊松分布縮減法(GPS)獲得比列失衡報(bào)告信號(hào)的最低總產(chǎn)量(763),在匹配相關(guān)事件數(shù)據(jù)庫(kù)方面獲得最高數(shù)量(89 SDRS,比例失衡報(bào)告信號(hào)11.7%),壺模型產(chǎn)生相對(duì)多的比例失衡報(bào)告信號(hào)SDRS(1 562),獲得相對(duì)低的匹配(175 SDRS,11.2%)。PRR監(jiān)測(cè)了更多的SDRS(3 616),但是卻獲得更低的配對(duì)(296 SDRS,8.2%),在這些算法中,在比例失衡報(bào)告信息的重疊性方面,PRR獨(dú)一無(wú)二的監(jiān)測(cè)了最高數(shù)量的SDRS(2231,144,或者6.5%,匹配)。接著是壺模型(212,26,或者12.3%,匹配),然后是GPS 監(jiān)測(cè)到0 個(gè)SDRS[11]。3種方法中GPS的敏感性和特異性最好,PRR敏感性和特異性非常的低,壺模型居中。
3.2 PRR和MGPS聯(lián)用 34個(gè)相關(guān)的新奇的反應(yīng)包括29種藥物,17種不同的藥品分類,用PRR算法12個(gè)藥物-事件聯(lián)合在MEDLINE里出現(xiàn)過(guò),4個(gè)是同時(shí)發(fā)生的,11個(gè)是之后才有的,用MGPS的EBGM分析,12個(gè)信號(hào)以前監(jiān)測(cè)到,3個(gè)同時(shí)發(fā)生的,第一次文獻(xiàn)引文出版后有11個(gè)。EB05分析6個(gè)信號(hào)以前檢測(cè)到,2個(gè)新產(chǎn)生的,4個(gè)在MDELINE引文后才有的[12]。相比MGPS法用PRR法發(fā)現(xiàn)了最多的信號(hào),具有高度的敏感性,EBGM分析比EB05監(jiān)測(cè)到了更多的信號(hào)。
3.3 GPS、BCPNN、MCA 、PRR 和ROR聯(lián)用 Kubota K等提取日本自動(dòng)報(bào)告系統(tǒng)1998年~2000年數(shù)據(jù),使用5種方法,總共有38 731個(gè)藥物-事件的組合,發(fā)現(xiàn)PRR 95%CI和ROR 95%CI的kappa值>0.9,MCA 和 BCPNN的 kappa值 >0.9,GPS和MCA的kappa值大約是0.6左右,GPS和BCPNN的kappa值大約也在 0.6,其它對(duì)比都小于 0.2[13]。ROR和PRR之間,MCA和BCPNN之間具有最好的一致性;GPS和MCA之間,GPS和BCPPN之間也具有良好的一致性。
除最終實(shí)驗(yàn)室檢查結(jié)果比較法(CERT)以外,其余幾種方法主要基于一個(gè)四聯(lián)表來(lái)計(jì)算。見(jiàn)表1和表2。
表1 藥物與藥物不良反應(yīng)四格表
表2 幾種信號(hào)挖掘算法的計(jì)算公式
5.1 江蘇省藥物不良反應(yīng)監(jiān)測(cè)中心數(shù)據(jù)庫(kù) 2006年復(fù)旦大學(xué)首次在國(guó)內(nèi)嘗試使用報(bào)告比(proportional reporting ratios PRRs)方法對(duì)江蘇省藥物不良反應(yīng)監(jiān)測(cè)中心數(shù)據(jù)庫(kù)2004~2005年所有不良反應(yīng)報(bào)告的信號(hào)篩選與檢測(cè),篩選結(jié)果與同期的產(chǎn)品說(shuō)明書進(jìn)行比較。共對(duì)數(shù)據(jù)庫(kù)進(jìn)行了三次信號(hào)檢測(cè),第一次信號(hào)檢測(cè)對(duì)象為該中心數(shù)據(jù)庫(kù)中2004年所有病例報(bào)告,獲得115個(gè)符合最低檢測(cè)標(biāo)準(zhǔn)且沒(méi)有在說(shuō)明書上標(biāo)明的陽(yáng)性結(jié)果。同時(shí),在2005年新增報(bào)告的基礎(chǔ)上進(jìn)行第二次、第三次的信號(hào)檢測(cè),檢測(cè)周期為半年。分別獲得133個(gè)和268個(gè)符合條件的結(jié)果。
5.2 上海市藥品不良反應(yīng)監(jiān)測(cè)中心數(shù)據(jù)庫(kù) 2008年第二軍醫(yī)大學(xué)統(tǒng)計(jì)學(xué)教研室總共收集上海市藥品不良反應(yīng)監(jiān)測(cè)中心2003年12月~2007年4月間上報(bào)的不良反應(yīng)報(bào)告31 930份,其中涉及藥物2 147種,不良反應(yīng)621種,藥物-不良反應(yīng)組合共計(jì)61 444個(gè)。通過(guò)貝葉斯神經(jīng)網(wǎng)絡(luò)可信區(qū)間遞推法(BCPNN)篩選得到可疑信號(hào)1 340個(gè),并對(duì)該1 340個(gè)信號(hào)進(jìn)行了敏感度與特異度的分析,得到結(jié)果:靈敏度0.29(去除小于3例的報(bào)告后可達(dá)到0.62),特異度0.92,假陰性率0.71,假陽(yáng)性率0.08,約登指數(shù)0.21,ROC曲線下面積0.657(P<0.001)。2009年第二軍大學(xué)統(tǒng)計(jì)學(xué)教研室利用上海市藥物不良反應(yīng)監(jiān)測(cè)中心2003年12月~2007年4月的數(shù)據(jù)庫(kù)32 746份原始不良反應(yīng)報(bào)告運(yùn)用ROR、POR、BCPNN、MHRA分別監(jiān)測(cè)到1 430、1 419、868、997個(gè)可能的藥物-事件組合的信號(hào)。
5.3 廣東省藥物不良反應(yīng)監(jiān)測(cè)中心的數(shù)據(jù)庫(kù)2009年廣東工業(yè)大學(xué)和第四軍醫(yī)大學(xué)合作利用廣東省藥物不良反應(yīng)監(jiān)測(cè)中心的數(shù)據(jù)庫(kù)采用BCPNN方法對(duì)2006第4季度~2007第4季度的甲硝唑和惡心反應(yīng)信號(hào)監(jiān)測(cè),結(jié)果顯示這4個(gè)季度的IC均>1.5,從而進(jìn)行自動(dòng)預(yù)警。
上述所介紹的方法均是用來(lái)監(jiān)測(cè)藥物不良反應(yīng)的信號(hào),信號(hào)監(jiān)測(cè)方法為藥物和藥物導(dǎo)致的ADR提供了額外的附加信息,且這些信息可以周期性的產(chǎn)生。此外定量的信號(hào)挖掘算法還可以被用于研究復(fù)雜的聯(lián)系,比如藥物和藥物之間相互作用與相應(yīng)的癥狀之間的關(guān)系,信號(hào)挖掘算法則是對(duì)傳統(tǒng)方法分析的額外補(bǔ)充。文獻(xiàn)研究顯示,國(guó)際上使用的數(shù)據(jù)挖掘算法并沒(méi)有一種統(tǒng)一的標(biāo)準(zhǔn),每種方法都有其優(yōu)點(diǎn)和局限性,目前國(guó)內(nèi)僅有廣東、上海、江蘇3個(gè)地區(qū)藥品不良反應(yīng)監(jiān)測(cè)中心借鑒國(guó)外的一些算法簡(jiǎn)單的對(duì)數(shù)據(jù)來(lái)發(fā)現(xiàn)不良信號(hào)。由于我國(guó)自動(dòng)呈報(bào)系統(tǒng)數(shù)據(jù)的質(zhì)量與國(guó)外存在差別,幾種監(jiān)測(cè)方法聯(lián)合使用可同時(shí)監(jiān)測(cè)到不同信號(hào),因此根據(jù)研究的需要找出適合的藥物不良反應(yīng)的信號(hào)監(jiān)測(cè)算法是十分必要的。由于我國(guó)患病人口基數(shù)大,使用這些方法在一定程度上不僅可以初步檢驗(yàn)藥品說(shuō)明書上的不良反應(yīng)書寫的完整性,同時(shí)對(duì)于藥品的安全用藥也起到預(yù)防作用,增強(qiáng)藥物使用的安全警戒,從而提高人類的生命質(zhì)量。
[1]Moore N,Thiessard F,Begaud B.The history of disproportionality measures(reporting odds ratio,proportional reporting rates)in spontaneous reporting of adverse drug reactions[J].Pharmacoepidemiol Drug Saf,2005,14(4):285.
[2]Rahul S,Amitava M.An urn model with applications to database performance evaluation[J].Computers &Operations Research,1997,24(4):289.
[3]Poluzzi E,Raschi E,Motola D,et al.De Ponti F.Antimicrobials and the risk of torsades de pointes:the contribution from data mining of the US FDA Adverse Event Reporting System[J].Drug Saf,2010,33(4):303.
[4]Woo EJ,Ball R,Burwen DR,et al.Effects of stratification on data mining in the us vaccine adverse event reporting system[J].DrugSaf,2008,31(8):667.
[5]陳炯華,魏永越,謝雁鳴.基于SRS的中藥上市后安全性信號(hào)監(jiān)測(cè)方法介紹[J].中成藥,2010,(06):1036.
[6]葉小飛,王海南,陳 文,等.數(shù)據(jù)挖掘在藥物警戒中的應(yīng)用[J].中國(guó)藥物警戒,2008,(01):36.
[7]Manfred Hauben,Sebastian Horn ,Lester Reich Potential.Use of Data-Mining Algorithms for the Detection of surprise Adverse Drug Reactions[J].Drug Saf,2007,30(2):143.
[8]Bate A,Lindquist M,Edwards IR,et al.A Bayesian neural network method for adverse drug reaction singal generation[J].Eur J Clin Pharmacol,1998,54(4):315.
[9]Man YP,Dukyong Y.A novel algorithm for detection of adverse drug reaction signals using a hospital electronic medical record database[J].Pharmacoepidemiol Drug Saf,2011,20(6):598.
[10]Kim J,Kim M,Ha JH,et al.Signal detection of methylphenidate by comparing a spontaneous reportingdatabase with a claims database[J].Regul Toxicol Pharmacol,2011,61(2):154.
[11]Hochberg AM,Hauben M,Pearson RK,et al.An evaluation of three signal-detection algorithms using a highly inclusive reference event database[J].Drug Saf,2009,32(6):509.
[12]Bate A.Bayesian confidence propagation neural network[J].Drug Saf,2007,30(7):623.
[13]Kubota K,Koide D,Hirai T.Comparison of data mining methodologies using Japanese spontaneous reports[J].Pharmacoepidemiol Drug Saf,2004,13(6):387.