谷鴻秋
在臨床研究統(tǒng)計分析思路與統(tǒng)計圖表系列的首篇文章中[1],我們將臨床研究的統(tǒng)計分析思路歸納為三部分:描述基線信息;估計效應(yīng)大小;補充敏感性分析。基線信息作為臨床研究論文結(jié)果中不可或缺的重要內(nèi)容,其統(tǒng)計分析方法和展現(xiàn)形式也值得臨床研究者重視。本文將結(jié)合研究實例闡述基線信息分析所涉及的統(tǒng)計方法和統(tǒng)計圖表。
“基線”并無嚴(yán)格的定義,Segen醫(yī)學(xué)詞典給臨床研究語境中基線(baseline)的解釋為:基線是研究人群在前瞻性研究中最開始時的健康狀況,是研究對象在接受試驗組或?qū)φ战M干預(yù)措施前的“0”時刻。藥物的安全性和有效性可從基線數(shù)據(jù)的變化中評估,基線數(shù)據(jù)組間分布的差異或?qū)Y(jié)果評估造成偏倚[2]。通常所謂的“基線”實則相對“隨訪”而言,專用于前瞻性研究設(shè)計,不過其它研究設(shè)計類型也可用“基線“泛指研究人群的基本情況?;€信息包括兩方面的內(nèi)容:(1)研究人群的入選排除過程。先用入選標(biāo)準(zhǔn)粗略圈定分析人群,再用排除標(biāo)準(zhǔn)修正分析人群;(2)研究人群基線特征的描述與比較?;€特征常包括社會人口學(xué)特征、臨床特征、實驗室檢查指標(biāo)及疾病史和用藥史等。
圖1 %ggBaseline 宏程序生成的基線信息表格示例Table I:兩組;Table Ⅱ:三組及以上;Table Ⅲ:帶標(biāo)化組間差值;Table Ⅳ:單組
研究人群的入選排除情況,常用的展示形式是研究人群流程圖,即文中的“圖1”。不同研究設(shè)計類型在具體的入排流程上有所不同,此前文章中已有提及,也展示過相應(yīng)實例[1],此處不再贅述。研究人群基線特征的描述與比較常用基線表格展示,即文中的“表1”?!氨?”在具體展示時,依據(jù)研究情形的不同,有不同形式:干預(yù)性研究中,按實驗組和對照組分組展示,如PLANTO、CHANCE等大型隨機對照臨床試驗[3,4];觀察性研究中,按不同的暴露因素分組,如CNSR Ⅱ研究中評估急性腦卒中合并非瓣膜房顫患者出院使用華法令的影響因素時按是否房顫分組去描述、比較基線信息[5],或按暴露因素的不同水平分組展示,如CKB研究組在研究肥胖和卒中發(fā)生的關(guān)系時,基線表格里按暴露因素BMI的18.0、20.5、23.0、25.0、27.5、30.0六個切點分成七組[6]。上述兩種思維均為從因到果的邏輯順序,適用于前瞻性的研究設(shè)計。若為回顧性研究設(shè)計,則按從果到因的逆向邏輯順序,依據(jù)結(jié)局分“病例”和 “對照”組,如Fox等在探討冠心病與兒童時期卒中危險因素關(guān)系時,以是否患冠心病分為病例組和對照組來描述和比較基線信息[7]。若不分組,可將所有研究人群作為單組描述,但這種情形較為少見,如跟著指南走(GWTG)的臺灣登記研究[8]。
研究人群的入選排除,只需統(tǒng)計每個排除標(biāo)準(zhǔn)的頻數(shù)和百分比即可,但應(yīng)采用層次排除法,以避免因不同的排除標(biāo)準(zhǔn)統(tǒng)計的人數(shù)有交叉致使合計排除人數(shù)與實際排除人數(shù)不一致。所謂層次排除法即分層次去統(tǒng)計每一個排除標(biāo)準(zhǔn)所排除的人數(shù)和百分比。如NRMI2研究中研究急性心梗患者的急救醫(yī)療服務(wù)與后續(xù)護理質(zhì)量時,其人群排除過程即采用了層次排除法[9]。
基線特征的描述與比較,需依據(jù)變量的不同特性(如連續(xù)變量、分類變量,正態(tài)、非正態(tài)),組別數(shù)(兩組、三組及以上)選擇相應(yīng)的描述形式和檢驗方法。連續(xù)變量采用“均數(shù)±標(biāo)準(zhǔn)差”或“中位數(shù)(四分位數(shù)間距)”描述,兩組時采用t檢驗或Wilcoxon秩和檢驗,三組時采用方差分析或Kruskal-Wallis檢驗。分類變量采用“頻數(shù)(百分比)”描述,卡方檢驗評估組間均衡性。傳統(tǒng)的假設(shè)檢驗采用P值評估協(xié)變量的組間均衡性,但大樣本時容易出現(xiàn)假陽性,且采用P值評估無法給出量化的差異,因此大樣本的隨機對照臨床試驗直接看均數(shù)和百分比,并不報告組間比較的P值。大樣本的觀察性研究則常采用標(biāo)化的組間差值[10]或Hodges-Lehmann估計數(shù)[11]評估兩組間均數(shù)或中位數(shù)的差異,具體統(tǒng)計方法見表1。
標(biāo)化的組間差值和Hodges-Lehmann估計數(shù)目前國內(nèi)的研究者使用較少,在此做一簡要介紹。連續(xù)變量的標(biāo)化組間差值計算公式如下:
其中,Pe和Pne分別表示暴露組和非暴露組某分類變量某一水平的組內(nèi)百分占比。標(biāo)化差值的絕對值超過10相當(dāng)于傳統(tǒng)假設(shè)檢驗的P<0.05,可認(rèn)為兩組間協(xié)變量的差異具有統(tǒng)計學(xué)意義,小于10可認(rèn)為組間均衡。Hodges-Lehmann估計數(shù)的想法簡單,即計算兩組數(shù)據(jù)配對后差值的中位數(shù)。
其中Yj,Xi分別表示兩組某變量的觀測值,n1,n2表示兩組的觀測個數(shù)。
研究人群入選流程圖的繪制,可先借助統(tǒng)計軟件,按層次排除法統(tǒng)計出各排除標(biāo)準(zhǔn)排除的人數(shù)和百分比,再借助傳統(tǒng)的流程圖繪制軟件(如Visio)或辦公軟件(MS Office/Power point),甚至一些小巧的在線工具如ProcessON(https://www.processon.com/)、draw.io(https://www.draw.io/)等繪制流程圖,再導(dǎo)出合適格式的圖片。
基線特征的描述與比較,借助傳統(tǒng)統(tǒng)計分析軟件(如SPSS、SAS、R、Stata)的默認(rèn)菜單或者模塊基本上均可實現(xiàn),但在操作難易度、便利性、可重復(fù)性、代碼留痕等方面各有優(yōu)劣。表2簡要列舉了SAS里常用的常用基線表格統(tǒng)計分析工具。此外,還可借助一些基于上述軟件的二次開發(fā)工具包更方便快捷的獲得基線統(tǒng)計表。如SAS軟件平臺里可借助筆者開發(fā)的基線表格宏程序%ggBaseline一鍵式自動生成適合學(xué)術(shù)期刊的RTF或PDF格式的統(tǒng)計表格[12]。%ggBaseline生成的統(tǒng)計表格,涵蓋單組、多組,用P值或者用標(biāo)化的組間差值/Hodges-Lehmann估計數(shù)評估組間均衡性等多種形式,具體樣式如圖1所示。其它軟件平臺,如R的qwraps2軟件包里面的summary_table()函數(shù)亦可嘗試[13]。
表1 基線表格的常用統(tǒng)計描述指標(biāo)及統(tǒng)計檢驗方法
表2 基線表格的常用統(tǒng)計描述指標(biāo)及統(tǒng)計檢驗方法的SAS實現(xiàn)
臨床研究基線信息是研究結(jié)果的重要部分,是研究人群社會人口學(xué)特征的基本刻畫,是同類研究結(jié)果互相比較的基礎(chǔ),同時也是對隨機對照研究隨機化過程的一種評價方法,此外,基線信息組間均衡性的比較也為后續(xù)多因素模型校正的效應(yīng)評估提供參考依據(jù)。