姚曉梅
1.1 時間-事件計算絕對效應值的理論依據(jù)和方法 時間-事件結局在臨床研究時常遇到,特別是在腫瘤學領域。對于癌癥患者,最關注的結果之一是總生存期(OS)。無進展生存期(PFS)、無病生存期(DFS)和無事件生存期(EFS)也是經(jīng)常被報道的結果,為OS提供了補充信息。此外,事件-時間分析可以描述除生存之外的結果,例如入院時間、輸尿管結石排出時間、發(fā)生特定不良事件的時間。
時間-事件分析方法的一個顯著特點是,納入了因為各種原因離開研究的受試者在離開前的信息。為了比較不同干預對兩組時間-事件結果的影響,如果通過Cox回歸模型計算風險比(HR)及其置信區(qū)間作為相對效應值。然而,由于絕對效應值(即風險差異、需要治療的病患數(shù)量)考慮了對照組中事件的潛在基線風險,因此絕對效應值的估計比相對效應值的估計更不容易受到夸大效應解釋的影響[1]。
對于系統(tǒng)評價和醫(yī)學指南的制作者來說,絕對效應值計算的方法可分為直接法和間接法。①直接法:某特定結局,個體受試者的數(shù)據(jù)可以從所有納入的原始研究中獲得,且風險差可從Meta分析中算出。②間接法:在應用匯總HR間接計算絕對效應值時,選擇的基線風險率要適用于應用群體及其特征。間接計算絕對效應值的關鍵在于如何確定適當?shù)膶φ战M的基線風險率,主要方法有2種。第一種是使用外源基線風險率,在醫(yī)學文獻中找尋低偏倚風險的大型、有代表性的觀察性研究,提供適當?shù)幕€風險率。第二種是使用該系統(tǒng)評價中納入文獻中對照組的基線風險率,建議選擇低偏倚風險文獻中的對照組。為了代表人群中的多個風險組,不論是使用外源的,還是使用該系統(tǒng)評價中低風險文獻的對照組,都需要從臨床角度考慮不同基線風險的人群分組(即高、中和低風險組)來計算干預組的絕對效應值。
在計算絕對效應值時,對照組的基線風險率確定時,一般僅考慮匯總HR的不確定性,而不考慮Kaplan-Meier曲線生存時間點和相應的基線風險率的不確定性。在某些情況下,基線風險率的不確定性可能會比較重要,甚至是總不確定性的來源之一[2],PropImp的方法有助于幫助估算絕對效應值[3],但先決條件是基線風險率的估計來自于Meta分析之外的文獻提取數(shù)據(jù),并且基線風險率和匯總HR有足夠的點估計和置信區(qū)間可用。PropImp計算方法和MS Excel表格可參見文獻[3]。在應用間接法獲得對照組基線風險率時,基線風險的不確定性和相對效果有關,只有包括重新采樣在內的復雜方法才能將對照組的基線風險率的不確定性考慮在內,以構建絕對效應值的有效置信區(qū)間[4]。然而,并非總要考慮對照組基線風險率的不確定性,如果其估計的標準誤差較小,且匯總HR的標準誤差不是總不確定性的主要來源,此時可忽略不計。特別是考慮不同基線風險的人群分組(即高、中和低風險組)來計算干預組的絕對效應值時,僅考慮匯總HR的不確定性就足夠。
無論采用哪種方法,透明地報告基線風險率數(shù)據(jù)的來源非常重要[5],清楚地描述對照組的基線風險率來源和選擇的時間結點(不是一段時間,不同時間結點會有很大差異),絕對效應值應在結果總結表和摘要中報告[6,7]。
1.2 舉例 首先明確研究的結局事件是死亡還是無事件生存(存活),也就是說,在計算HR時明確分子與分母人群。比如在GRADEpro醫(yī)學指南制作軟件中[8],當選擇結局為時間事件時,軟件就會提供如下2個選擇,即結局是事件還是無事件生存。
1.2.1 計算EFS的絕對效應值(例如,OS、PFS) 絕對效應值的計算基于Tierney等[1]描述的方法,即基于生存風險成比例的假設,并在此研究中始終保持一致。HR是在研究時間結點之前,任一時刻干預組與對照組中無事件患者風險的比例。其計算公式為:
例如,如果匯總HR為0.42(95%CI:0.25~0.72),表示死亡風險在干預組低于對照組。假設對照組患者無事件生存率在隨訪2年時為0.9,根據(jù)上述公式干預組患者無事件生存率為0.96(95%CI:0.93~0.97)。
1.2.2 計算事件生存期的絕對效應值(例如死亡率) 同樣以上述匯總HR為0.42(95%CI:0.25~0.72)為例,表示死亡風險在干預組低于對照組。假設對照組患者死亡率在隨訪2年時為0.1,根據(jù)下述公式干預組患者死亡率為0.04(95%CI:0.03~0.07)。
r1=1-exp(ln(1-r0)×HR)=1-(1-r0)HR
1.2.3 圖形演示 GRADEpro軟件提供了在結果表格中以圖像方式呈現(xiàn)系統(tǒng)評價中絕對效應值[8]。這種格式呈現(xiàn)了可視化的絕對效果量,以便于干預組與控制組的每個結局進行比較。
1.2.4 根據(jù)事件或無事件生存計算需要治療的人數(shù)(NNT) NNT等于干預組和對照組之間風險差的倒數(shù)[9]。
對照組風險率-干預組風險率=風險差異[95%CI(對照組風險率-干預組風險率95%CI的上限;對照組風險率-干預組風險率95%CI的下限)]
例如,Ⅱ期肺癌患者2年死亡率在對照組為45/100,在干預組為41/100(95%CI:37/100~44/100),則兩組的風險差異=45/100-41/100=4/100(95%CI:1/100~8/100),NNT=1/風險差異=25(95%CI:12.5~100)。這意味著25(95%CI:13~100)例Ⅱ期肺癌患者接受此干預治療可避免1例患者在2年內死亡。
1.2.5 中位生存時間的計算 在應用HR計算中位(無事件)生存時間可能對患者、臨床工作者和利益相關者的臨床決策有意義。對照組達到中位生存時間意味著50%處于危險中的患者已經(jīng)死亡??梢允褂靡韵鹿?基于MST0固定的假設),從對照組的中位生存時間(MST0)和匯總的HR中獲得干預組的中位生存時間(MST1):
MST1=MST0/HR
例如,假設匯總HR為0.42(95%CI:0.25~0.72),對照組的中位生存時間為80個月,干預組的中位生存時間為190.5個月(95%CI:111.1~320)。
時間事件結局以及生存分析在臨床研究時常遇到,特別是在腫瘤研究方面,但并不僅限于腫瘤研究領域。凡是涉及到對特定事件在何時發(fā)生的問題,都可以通過時間事件結局來評估干預措施的療效。例如發(fā)熱患者何時退燒,消化道出血患者何時復發(fā)等。在這類原始研究文章中,通常報道兩種結局,①在某一特定時間結點的干預組與對照組的生存率或死亡率及其HR(95%CI)或P值;②干預組和對照組分別達到50%死亡人數(shù)的時間及其HR(95%CI)或P值。HR與RR和OR相似,都是相對效應量值,對臨床工作者和患者來說,從HR數(shù)值表面不能直觀地判斷出干預組與對照組在臨床實踐中的區(qū)別有多大。因此,從HR值轉化為絕對效應值具有重要臨床意義。從HR值計算絕對效應值時,需注意以下幾點。
2.1 確定對照組基線風險率是關鍵 對于系統(tǒng)評價和醫(yī)學指南的制作者來說,能夠獲得所有納入文獻的個體患者數(shù)據(jù),從而直接計算絕對效應值是最佳選擇。但是絕大多數(shù)情況下,會從納入的文獻中偏倚風險低的研究中選擇特定時間結點的對照組基線風險率。如果對系統(tǒng)評價中納入文獻的對照組基線風險率的代表性不是十分有信心,可以在系統(tǒng)評價外進行文獻檢索,以尋找低偏倚風險的大型、有代表性的觀察性研究中在特定時間結點的對照組基線風險率。同時考慮是否需要將患者按不同風險分成亞組(即分為高、中和低風險組)以計算干預組中相應的絕對效應值。在極少數(shù)情況下,如果確定或高度懷疑對照組基線風險率存在著不穩(wěn)定性,PropImp統(tǒng)計學方法[3]可以用來幫助重新計算對照組基線風險率,然而根據(jù)提供的參考文獻,其統(tǒng)計學方法是否適合于各種對照組基線風險率不穩(wěn)的情況,有待進一步探討。因此,如果遇到這種情況時,建議咨詢有相關經(jīng)驗的統(tǒng)計學家。
值得強調的是,對照組基線風險率不是指對照組在開始研究時的風險率,而是研究結束時的風險率。例如治療2年或者3年后的對照組風險率。
2.2 在系統(tǒng)評價計算匯總HR時,要注意納入文獻中計算HR時分子與分母的一致性 一般來說,原始研究計算HR時,在某一時間結點干預組的生存率或死亡率為分子,對照組的生存率或死亡率為分母。如果有些原始研究以對照組的生存率或死亡率為分子計算HR,則需要對其進行轉換。例如,a情境:Ⅲ期卵巢癌患者手術治療后免疫抑制劑維持治療組與安慰劑維持治療組相比較,2年后HR=0.90(95%CI:0.75~1.10)。b情境:患者手術治療2年后安慰劑組與免疫抑制劑維持治療組相比較,HR=0.97(95%CI:0.85~1.15)。b情境的HR轉化為HR=1/0.97,其95%CI也要進行相應的轉化,HR=1.03(95%CI:0.87~1.18),與a情景的HR值進行匯總。這與明確研究的結局是事件還是無事件生存不同,在同一個研究中,無論研究結局是事件還是無事件生存,只要分子與分母保持一致,即干預組為分子,對照組為分母,其HR值就是相同的。
2.3 不應該假設原始研究時間結點前和后的HR值可能保持一致 絕對效應值的估計值會因選擇的時間點不同而有很大差異。在同一亞組人群中,患者接受治療后3年的絕對效應值與5年后的絕對效應值是不同的。例如,如果系統(tǒng)評價的目的需要匯總HR在治療2年后的結局,就不應該將1年后和2年后的HR結局進行匯總。報道HR在治療1年后的原始研究只能假設HR在1年之內是不變的,而不能外推到2年后HR。可以將治療3年后的HR結局的研究與治療2年后的HR的研究進行匯總,作為治療2年后的HR結局的評估,因為治療3年后的HR結局的研究的假設是在治療3年之內任何時間結點的HR都是一樣的。
2.4 很多情況下中位生存時間的計算方法不能直觀地反映兩組治療效果的不同 例如,在非小細胞肺癌Ⅲ期臨床試驗中,干預組與對照組的PFS的生存中位時間分別為12.3和11.1周,兩組相差約8 d,然而HR=0.71(95%CI:0.62~0.82;P<0.000 1)[10],根據(jù)研究提供的數(shù)據(jù),計算絕對效應值。絕對效應值更直接地反映兩組治療效果的不同。雖然有些作者在原文及摘要中只報告了中位生存時間及HR,但是在Kaplan-Meier曲線圖表中經(jīng)常呈現(xiàn)出有價值的數(shù)據(jù),給出時間結點的生存率等,可以根據(jù)這些數(shù)據(jù)及HR計算出絕對效應值。例如報告了兩組的中位生存時間(22.1和16.6個月)及HR=0.33(95%CI:0.25~0.45),但在Kaplan-Meier曲線圖表中報告了干預組與對照組在治療2年后無進展生存率分別為46%與28%[11]。
2.5 計算絕對效應值的另外一個益處在GRADE guidelines27文章中未提及 絕對效應值的計算有助于決策判斷。在醫(yī)學指南的制作過程中,制定推薦意見時需要考量多方向因素設置干預措施的閾值。干預組的絕對效應值及其95%CI是否跨過預先設定的閾值,直接影響對現(xiàn)有證據(jù)質量的評估和推薦意見強弱的判斷。
從系統(tǒng)評價和醫(yī)學指南制作者的角度,在報告時間事件結局的研究中,絕對效應量較相對效應值更重要。絕對效應值的計算為系統(tǒng)評價及醫(yī)學指南制作者在證據(jù)體質量評價過程中準確性領域的評估以及制定推薦意見時,如何判斷患者結局的效應值與事先設定的有效閾值之間的關系提供了有價值的依據(jù)。在時間事件結局的Meta分析和證據(jù)主體的確定性分級方面還有許多未解決的問題。①含有刪減機制的證據(jù)的確定性即刪減并非獨立于導致潛在偏倚風險的結局,可見文獻[12]。②治療轉換現(xiàn)象在癌癥試驗中很常見,如何在治療轉換的情況下對證據(jù)的確定性進行分級將在以后GRADE文章中探討。③在存在競爭風險事件的環(huán)境中,有時會進行Kaplan-Meier生存分析,這可能會高估潛在干預治療效果[13]。④在生存風險成比例的假設無效的情況下,可以使用HR的替代結局,例如組間受限平均生存時間的差異[14]。此時,系統(tǒng)評價和醫(yī)學指南制作者仍可根據(jù)納入的原始研究所提供的數(shù)據(jù)及信息,進行適當?shù)娘L險偏倚評估和數(shù)據(jù)分析。