段 鋒 陳本超 朱珍真 陳 貞 孫 斌 張 麗 畢京峰 魏振滿
解放軍第三〇二醫(yī)院新藥臨床試驗(yàn)中心,北京 100039
藥物臨床試驗(yàn)中的數(shù)據(jù)管理與統(tǒng)計(jì)分析,是保證研究結(jié)果科學(xué)、可靠的重要環(huán)節(jié)之一。既往統(tǒng)計(jì)報(bào)表過程主要采取手工方式,即將統(tǒng)計(jì)軟件所生成的統(tǒng)計(jì)分析結(jié)果,應(yīng)用“復(fù)制”、“粘貼”的方法導(dǎo)入到報(bào)表之中。由于臨床試驗(yàn)往往產(chǎn)生海量的數(shù)據(jù),該過程費(fèi)時(shí)費(fèi)力,且需要耗費(fèi)大量的時(shí)間進(jìn)行校對(duì),即便如此,仍極易出現(xiàn)錯(cuò)誤。近年來隨著臨床試驗(yàn)的發(fā)展,產(chǎn)生了海量的試驗(yàn)數(shù)據(jù),這種簡(jiǎn)單的統(tǒng)計(jì)分析方法更無法滿足數(shù)據(jù)統(tǒng)計(jì)的需求。基于此,本研究組應(yīng)用SAS統(tǒng)計(jì)分析軟件,借助SAS宏語言進(jìn)行了計(jì)算機(jī)編程,實(shí)現(xiàn)了藥物Ⅰ期臨床試驗(yàn)分類資料統(tǒng)計(jì)分析自動(dòng)報(bào)表,全面提高了臨床試驗(yàn)的統(tǒng)計(jì)效率,保證了統(tǒng)計(jì)分析結(jié)果的科學(xué)性及可靠性。
以某Ⅰ期藥物臨床試驗(yàn)的部分性別、民族兩個(gè)人口學(xué)數(shù)據(jù)為例。本數(shù)據(jù)選取試驗(yàn)中的兩個(gè)劑量組進(jìn)行統(tǒng)計(jì)分析,其中1~4號(hào)為第一組,5-8號(hào)為第二組,具體信息見表1。目的為借助SAS軟件實(shí)現(xiàn)對(duì)試驗(yàn)數(shù)據(jù)中的性別、民族資料自動(dòng)生成報(bào)表(Excel報(bào)表)。見表2。
表1 某Ⅰ期藥物臨床試驗(yàn)人口學(xué)數(shù)據(jù)
表2 某Ⅰ期臨床試驗(yàn)人口學(xué)數(shù)據(jù)統(tǒng)計(jì)結(jié)果[n(%)]
統(tǒng)計(jì)之前,首先將“表1”導(dǎo)入SAS軟件,并生成名為SASUSER.SHUJV文件。其基本過程為文件→導(dǎo)入數(shù)據(jù)→選擇數(shù)據(jù)類型(如Excel)→NEXT→選擇表格→OK→NEXT→在Library中選擇SASUSER→給文件命名→Finish。
第一步:按劑量組拆分表格
①選擇第一組:
data Y1;/*建立表Y1*/
set sasuser.SHUJV(firstobs=1 obs=4);/*選擇表SHUJV(即表 1)中的 1~4 行 */run;
②選擇第二組:
data Y2;/*建立表 Y2*/
set sasuser.SHUJV(firstobs=5 obs=8);/*選擇表SHUJV(即表 1)中的 5~8 行 */run;
第二步:對(duì)表中的性別組成進(jìn)行頻數(shù)統(tǒng)計(jì)
①生成第一組中試驗(yàn)組的性別百分比data A11;/*建立表Y11*/set Y1;/*調(diào)用Y1表格*/if GROUP='1';/*如果 GROUP='1',即:選擇GROUP='1'的受試者數(shù)據(jù)*/
if sex=1 then m='男';else m='女';/*如果sex=1,那么令m='男',另外的m='女'*/
proc freq;/*求頻數(shù),即:頻數(shù)統(tǒng)計(jì)COUNT和總頻數(shù)百分比PERCENT*/
tables m/out=B11;/*利用sexm數(shù)據(jù)建立表B11(即表 3)*/run;
結(jié)果為:
表3 第一組中試驗(yàn)組性別統(tǒng)計(jì)結(jié)果
對(duì)所獲得的數(shù)值保留2位小數(shù),并且定義數(shù)據(jù)輸出的表達(dá)格式
data C11;/* 建立表 C11(即表 4)*/
set B11;/*調(diào)用表B11*/
percent=round(percent,0.01);/* 定義百分?jǐn)?shù)的長(zhǎng)度,0.01是小數(shù)點(diǎn)后2位*/
percent11=count||'('||percent||'%)';/*定義百分?jǐn)?shù)的格式*/
drop sex COUNT PERCENT;/*刪除 sex COUNT PERCENT列,只保留別定義格式的列percent11*/
在這一步驟中需要注意的是百分?jǐn)?shù)的格式定義,即“count||'('||percent||'%)'”步。 兩單引號(hào)之間只引符號(hào),“||”的作用是連接編碼與符號(hào),這樣才會(huì)得出所期望的表達(dá)結(jié)果,即“1(25%)”。
結(jié)果為:
表4 第一組中試驗(yàn)組性別定義小數(shù)點(diǎn)及數(shù)據(jù)格式的結(jié)果
②生成第一組中對(duì)照組的性別百分比
data A12;
set Y1;
if GROUP='2';
if sex=1 then m='男 ';else m='女 ';
proc freq;
tables m/out=B12;
run;
data C12;/*建立表 C12(即表 5)*/
set B12;
percent=round(percent,0.01);
percent12=count||'('||percent||'%)';
drop sex COUNT PERCENT;
結(jié)果為:
表5 第二組中對(duì)照組性別定義小數(shù)點(diǎn)及數(shù)據(jù)格式的結(jié)果
第三步:將試驗(yàn)組、對(duì)照組的表格進(jìn)行橫向合并
應(yīng)用以上兩組程序最后統(tǒng)計(jì)出的劑量1、2組中的性別表格分別為:C11、C12、C21、C22, 再將 4 個(gè)表格進(jìn)行橫向合并,添加統(tǒng)計(jì)量標(biāo)簽并定義字段長(zhǎng)度。data e1;
e='性別';/*表e1中只有性別,其目的是說明該部分內(nèi)容是性別部分*/
length e$30;/*$是定義長(zhǎng)度的意思,即30個(gè)字段*/
data f;/* 建立表 f(即表 6)*/
merge e1 C11 C12 C21 C22;/*表格進(jìn)行橫向合并,e1為變量名*/
rename percent11=shi11 percent12=dui11
percent21=shi12 percent22=dui12;
e=put(e,30.);m=put(m,30.);/* 定義字段長(zhǎng)度 */
shi1=put(shi11,30.);dui1=put(dui11,30.);/* 定義字段長(zhǎng)度*/
shi2=put(shi12,30.);dui2=put(dui12,30.);/* 定義字段長(zhǎng)度*/
run;
此步驟須注意的是定義字段長(zhǎng)度和屬性,其目的是告訴 SAS 所有的 e、m、shi1、shi1、dui1、dui1 的屬性理完全一樣的,因?yàn)閳?zhí)行SAS的縱向合并命令時(shí),要求縱向合并的內(nèi)容不光變量名相同,其屬性也必須完全一樣。如不進(jìn)行定義,那么當(dāng)下面兩表格縱向合并時(shí)結(jié)果將會(huì)不能全部表達(dá)出來,出現(xiàn)遺漏的情況。
結(jié)果為:
表6 性別統(tǒng)計(jì)結(jié)果
同理,民族的統(tǒng)計(jì)結(jié)果應(yīng)用以上兩組程序最后統(tǒng)計(jì)出的劑量1、2組中的性別表格分別為:D11、D12、D21、D22,4個(gè)表格進(jìn)行橫向合并,添加統(tǒng)計(jì)量標(biāo)簽并定義字段長(zhǎng)度。由以上步驟推出,見表7。
表7 民族統(tǒng)計(jì)結(jié)果
步驟四:對(duì)已橫向合并后的性別、年齡表格再縱向合并
data j;/* 建立表 j(即表 8)*/
set f g;/* 調(diào)用表 f、表 g(即表 6、表 7)*/run;
結(jié)果為:
表8 人口學(xué)數(shù)據(jù)統(tǒng)計(jì)結(jié)果
proc export data=work.h/*輸出表格 work.h(表 h即表2)*/
outlife="C:h.xls"/*輸出的文件地址及文件名*/
dbms=excel replace;
sheet="h";
run;
在SAS程序中,所設(shè)定的變量字段過長(zhǎng),下輸出表格“j.xls”多不能完整地表達(dá)數(shù)據(jù),而在Excel中被多設(shè)置出來的字段均由“空格”代替,所以使用“菜單-編輯-替換”這一操作,將“空格”全部替換掉,此法用于批量刪除空格。
使用以上操作后即得出所有數(shù)據(jù),實(shí)現(xiàn)SAS統(tǒng)計(jì)分析分類數(shù)據(jù)的自動(dòng)報(bào)表。
在我國(guó),由于近年臨床試驗(yàn)的蓬勃發(fā)展,每年有近800多種新藥進(jìn)行藥物Ⅰ期臨床試驗(yàn),速度增長(zhǎng)達(dá)40%[1],并有超過60家跨國(guó)企業(yè)開展臨床試驗(yàn),涉及人群50萬[2]。但是,由于我國(guó)藥物臨床試驗(yàn)起步晚,在數(shù)據(jù)管理、質(zhì)量控制、質(zhì)量保證體系及計(jì)算機(jī)信息技術(shù)的應(yīng)用方面與國(guó)際先進(jìn)標(biāo)準(zhǔn)仍有較大的差距[3]。因此,必須通過采取嚴(yán)格過程監(jiān)管、充分保護(hù)受試者權(quán)益,保證數(shù)據(jù)可靠等一系列質(zhì)量提升措施,全面提高藥物臨床試驗(yàn)質(zhì)量[4-5]。
科學(xué)的統(tǒng)計(jì)分析是對(duì)試驗(yàn)驗(yàn)藥物進(jìn)行科學(xué)評(píng)價(jià)的關(guān)鍵內(nèi)容之一。目前統(tǒng)計(jì)分析過程多借助軟件來完成,如SAS、SPSS、STATA等,而在得到統(tǒng)計(jì)分析結(jié)果后,如何實(shí)現(xiàn)準(zhǔn)確無誤的統(tǒng)計(jì)報(bào)表,將研究結(jié)果客觀、真實(shí)地展現(xiàn)研究者及相關(guān)評(píng)審專家面前,則是臨床試驗(yàn)的核心內(nèi)容。
隨著臨床試驗(yàn)越來越多的開展,試驗(yàn)數(shù)據(jù)的增多,應(yīng)用相關(guān)軟件實(shí)現(xiàn)統(tǒng)計(jì)分析自動(dòng)報(bào)表逐漸成為數(shù)據(jù)管理與統(tǒng)計(jì)分析的新方法和新手段。其最大的優(yōu)點(diǎn)是,省時(shí)省力,錯(cuò)誤率低,在效率上大大超過了手工操作[6];缺點(diǎn)是編程過程較為復(fù)雜,需要一定的編程技巧。如:戎氏借助report、data_null_過程步和宏變量自動(dòng)生成了統(tǒng)計(jì)表格[7];鄒建東[8]和許林勇等[9]通過調(diào)用相關(guān)SAS函數(shù),SAS語句及SAS過程編寫宏程序,實(shí)現(xiàn)統(tǒng)計(jì)分析報(bào)告自動(dòng)報(bào)表;童新元等[10]通過調(diào)用SAS宏程序,構(gòu)建了協(xié)方差分析的自動(dòng)報(bào)表;薛鈞等[11]借助SAS宏程序?qū)崿F(xiàn)了臨床試驗(yàn)數(shù)據(jù)盲態(tài)核查等。
雖然SAS宏程序因具有程序較短、操作簡(jiǎn)便的巨大優(yōu)勢(shì)而為統(tǒng)計(jì)專業(yè)人士所常用,但對(duì)于非專業(yè)或初學(xué)者來說理解起來比較困難,基于此,本研究從SAS自動(dòng)報(bào)表的基本原理出發(fā),對(duì)SAS自動(dòng)報(bào)表過程進(jìn)行分解講述,具有淺顯易懂、逐步深入的優(yōu)點(diǎn),特別適合非統(tǒng)計(jì)學(xué)專業(yè)的臨床科研人員或初學(xué)者。
[1]楊釗,李春瀟,武志昂.關(guān)于加強(qiáng)臨床試驗(yàn)中受試者權(quán)益保護(hù)的探討[J].中國(guó)藥師,2013,16(4):610-613.
[2]李軒,洪亮,邵蓉.完善我國(guó)藥物臨床試驗(yàn)受試者管理分析[J].現(xiàn)代商貿(mào)工業(yè),2013,6:140-142.
[3]彭朋,元唯安,胡薏慧,等.我國(guó)藥物臨床試驗(yàn)質(zhì)量管理規(guī)范實(shí)施過程中存在的問題及其對(duì)策[J].中國(guó)醫(yī)院藥學(xué)雜志,2012,32(24):2006-2007.
[4]耿琳,陳云飛,劉華.藥物臨床試驗(yàn)機(jī)構(gòu)在藥物臨床試驗(yàn)質(zhì)量保證體系中的重要作用[J].中國(guó)新藥與臨床雜志,2009,28(10):794-796.
[5]陳舒茵,梁春才,韋斌,等.談藥物臨床試驗(yàn)的質(zhì)量控制[J].中國(guó)醫(yī)藥導(dǎo)報(bào),2011,8(31):154-156.
[6]殷紅.臨床試驗(yàn)中統(tǒng)計(jì)分析報(bào)告自動(dòng)化生成的研究與應(yīng)用[D].上海:復(fù)旦大學(xué):殷紅,2009:1.
[7]戎芬,賈彬.用SAS的兩種不同語句自動(dòng)生成相同的統(tǒng)計(jì)表格[J].現(xiàn)代預(yù)防醫(yī)學(xué),2008,35(24):2-4.
[8]鄒建東.四格表指標(biāo)統(tǒng)計(jì)分析報(bào)表的SAS宏程序[J].中國(guó)臨床藥理學(xué)與治療學(xué),2005,10(3):357-360.
[9]許林勇,張偉.動(dòng)態(tài)血壓監(jiān)測(cè)評(píng)價(jià)降壓藥物療效的谷峰比率的SAS統(tǒng)計(jì)自動(dòng)報(bào)表[J].中國(guó)臨床藥理學(xué)與治療學(xué),2010,15(7):798-802.
[10]童新元,張高魁,姚晨.新藥臨床試驗(yàn)中協(xié)方差分析的SAS 統(tǒng)計(jì)報(bào)表[J].中國(guó)臨床藥理學(xué)與治療學(xué),2004,9(8):958-960.
[11]薛鈞,鄒建東,熊寧寧.臨床研究盲態(tài)數(shù)據(jù)核查常用的SAS 宏程序[J].中國(guó)臨床藥理學(xué)與治療學(xué),2008,13(5):535-540.