陳佰鋒,陳玉娟,朱 玉,李 杰,姚應(yīng)水
(皖南醫(yī)學(xué)院,安徽 蕪湖 241002)
● 經(jīng)驗(yàn)交流 ●
醫(yī)學(xué)科研中常見統(tǒng)計(jì)學(xué)誤用及其防范對(duì)策
陳佰鋒,陳玉娟,朱 玉,李 杰,姚應(yīng)水
(皖南醫(yī)學(xué)院,安徽 蕪湖 241002)
醫(yī)學(xué)科研的整個(gè)過程都需要統(tǒng)計(jì)學(xué)知識(shí),統(tǒng)計(jì)學(xué)的合理選擇及應(yīng)用直接影響到醫(yī)學(xué)科研的質(zhì)量。文章分別從研究設(shè)計(jì)、統(tǒng)計(jì)分析、統(tǒng)計(jì)學(xué)表達(dá)、結(jié)果解釋共4個(gè)方面對(duì)醫(yī)學(xué)科研中常見的統(tǒng)計(jì)學(xué)誤用進(jìn)行了歸納分析,并提出了相應(yīng)防范對(duì)策,為醫(yī)學(xué)科研工作者正確使用統(tǒng)計(jì)學(xué)知識(shí)提供參考依據(jù)。
醫(yī)學(xué)科研;統(tǒng)計(jì)學(xué)方法;統(tǒng)計(jì)學(xué)表達(dá);結(jié)果解釋
統(tǒng)計(jì)學(xué)作為一種強(qiáng)大的醫(yī)學(xué)科研工具,廣泛應(yīng)用于國內(nèi)外各種公開發(fā)行的醫(yī)學(xué)期刊中,然而其應(yīng)用水平往往不盡人意,大量的醫(yī)學(xué)科研論文被指出存在統(tǒng)計(jì)學(xué)誤用[1]。統(tǒng)計(jì)學(xué)誤用往往導(dǎo)致非常嚴(yán)重的后果,如結(jié)論錯(cuò)誤、數(shù)據(jù)造假、丟失有價(jià)值的數(shù)據(jù)信息等,醫(yī)學(xué)科研中的統(tǒng)計(jì)學(xué)誤用更是違背了醫(yī)學(xué)倫理學(xué)要求,甚至可能導(dǎo)致不良的臨床后果[2]。
為了使廣大醫(yī)學(xué)科研工作者認(rèn)識(shí)到統(tǒng)計(jì)學(xué)的重要性,筆者對(duì)近年來國內(nèi)醫(yī)學(xué)期刊中常見的統(tǒng)計(jì)學(xué)誤用從四個(gè)方面進(jìn)行了歸納分析,并提出了相應(yīng)的防范對(duì)策,以提高科研論文質(zhì)量及我國醫(yī)學(xué)科研的整體水平。
醫(yī)學(xué)科研順利開展的前提在于良好的設(shè)計(jì),設(shè)計(jì)階段的缺陷可能導(dǎo)致整個(gè)科研沒有意義,甚至得出某些錯(cuò)誤的結(jié)論[1],這也將嚴(yán)重違背醫(yī)學(xué)倫理學(xué)要求。統(tǒng)計(jì)學(xué)方面的設(shè)計(jì)主要包括確定研究類型、估算樣本含量、確定預(yù)期研究成果、選定統(tǒng)計(jì)分析指標(biāo)和方法等。在研究設(shè)計(jì)階段應(yīng)認(rèn)真考慮統(tǒng)計(jì)方面設(shè)計(jì)。
樣本含量、抽樣方法、組間均衡性、盲法等科研方法都應(yīng)在設(shè)計(jì)階段敘述清楚。樣本含量應(yīng)在研究設(shè)計(jì)階段進(jìn)行估計(jì),研究中途的退出者應(yīng)詳細(xì)記錄并體現(xiàn)在論文中,樣本含量不足時(shí)往往導(dǎo)致檢驗(yàn)效能低下,從而增加犯II類錯(cuò)誤的風(fēng)險(xiǎn)[3]。抽樣方法也應(yīng)詳細(xì)介紹,所有的統(tǒng)計(jì)推斷結(jié)論都是基于隨機(jī)樣本得到的,對(duì)于“隨意取得”的樣本沒有任何意義。組間均衡性問題也應(yīng)考慮,僅僅采用假設(shè)檢驗(yàn)來判定組間基線資料的均衡性是不夠的,特別是當(dāng)樣本量較小時(shí),由于缺乏檢驗(yàn)效能,結(jié)果往往不正確。當(dāng)組間不均衡時(shí),除非采用多元分析方法(如協(xié)方差分析)去校正混雜因素,否則統(tǒng)計(jì)學(xué)差異就不能簡(jiǎn)單的歸因于實(shí)驗(yàn)效應(yīng)。另外,為了減小研究偏倚,還應(yīng)盡量采用盲法等方法。研究設(shè)計(jì)中常見的統(tǒng)計(jì)學(xué)錯(cuò)誤和缺陷見表1。
表1 研究設(shè)計(jì)常見的統(tǒng)計(jì)學(xué)錯(cuò)誤和缺陷
同一種數(shù)據(jù)資料可選擇的統(tǒng)計(jì)分析方法有很多,但是研究者仍需慎重選擇最佳的統(tǒng)計(jì)方法。選擇任何統(tǒng)計(jì)學(xué)方法都應(yīng)嚴(yán)格考慮其應(yīng)用條件,然而不幸的是,在很多醫(yī)學(xué)期刊中,即使最簡(jiǎn)單的統(tǒng)計(jì)學(xué)方法(如t檢驗(yàn)和χ2檢驗(yàn)等)都常常出現(xiàn)誤用(如不滿足正態(tài)性和方差齊性的兩獨(dú)立樣本卻采用了t檢驗(yàn))。除了要選擇正確的統(tǒng)計(jì)學(xué)方法,還需要選擇正確的計(jì)算公式,如進(jìn)行四格表χ2檢驗(yàn)時(shí),公式的選擇需要考慮樣本含量及理論數(shù)的大小。
單因素K(K≥3)水平設(shè)計(jì)的定量資料,不能簡(jiǎn)單的對(duì)多個(gè)組進(jìn)行兩兩比較的t檢驗(yàn),否則會(huì)增大I類錯(cuò)誤的風(fēng)險(xiǎn)[4]。另外,設(shè)計(jì)初期沒有指定的多組間兩兩比較方法也應(yīng)避免使用,否則會(huì)給人以“經(jīng)營”統(tǒng)計(jì)學(xué)顯著性結(jié)論的印象[5]。多個(gè)組的兩兩比較往往是由于設(shè)計(jì)缺陷導(dǎo)致,這種缺陷通常可以在研究設(shè)計(jì)階段通過咨詢統(tǒng)計(jì)學(xué)家盡量避免。對(duì)于多組設(shè)計(jì)資料的比較,可采用非參數(shù)檢驗(yàn)或方差分析。如果存在某些可能的混雜因子或者組間基線資料不匹配,還必須采用多元分析方法。數(shù)據(jù)分析常見的統(tǒng)計(jì)學(xué)錯(cuò)誤和缺陷見表2。
表2 數(shù)據(jù)分析常見的統(tǒng)計(jì)學(xué)錯(cuò)誤和缺陷
醫(yī)學(xué)科研的數(shù)據(jù)及統(tǒng)計(jì)學(xué)方法應(yīng)詳細(xì)描述,以便讀者可以通過相關(guān)數(shù)據(jù)對(duì)研究結(jié)果進(jìn)行檢驗(yàn)。在論文中,雖然沒有必要介紹統(tǒng)計(jì)學(xué)的具體公式及計(jì)算過程,但所選擇的統(tǒng)計(jì)學(xué)方法的類型及其適用條件都應(yīng)詳細(xì)說明;另外,對(duì)于是否配對(duì)設(shè)計(jì),以及假設(shè)檢驗(yàn)的單雙側(cè)問題等都應(yīng)進(jìn)行說明。有的論文中將統(tǒng)計(jì)學(xué)方法簡(jiǎn)單的表述為“選擇合適的統(tǒng)計(jì)學(xué)方法”,雖然表面上作者好像是傾向于使用“合適”的統(tǒng)計(jì)學(xué)方法,實(shí)際上這種表達(dá)是不嚴(yán)謹(jǐn)?shù)摹?/p>
一個(gè)好的研究,其統(tǒng)計(jì)表達(dá)如同數(shù)據(jù)收集和統(tǒng)計(jì)分析一樣重要。若數(shù)據(jù)為正態(tài)分布或近似正態(tài)分布,用算數(shù)均數(shù)和標(biāo)準(zhǔn)差描述其集中趨勢(shì)和離散趨勢(shì)。表示方法上,采用“均數(shù)(標(biāo)準(zhǔn)差)”要好于“均數(shù)±標(biāo)準(zhǔn)差”,因?yàn)楹笳呷菀妆徽`讀為95%的置信區(qū)間。由于標(biāo)準(zhǔn)誤使數(shù)據(jù)看起來變異度更小,論文中常見用標(biāo)準(zhǔn)誤代替標(biāo)準(zhǔn)差進(jìn)行統(tǒng)計(jì)描述的錯(cuò)誤,而標(biāo)準(zhǔn)誤是統(tǒng)計(jì)推斷指標(biāo)而不是統(tǒng)計(jì)描述指標(biāo),必須避免這種誤用[6]。如果資料是偏態(tài)分布,應(yīng)使用中位數(shù)、四分位數(shù)間距或極差進(jìn)行描述。然而,研究者應(yīng)該認(rèn)識(shí)到極差容易受到極端值的影響,因此使用四分位數(shù)間距更穩(wěn)定。若檢驗(yàn)方法采用的是非參數(shù)檢驗(yàn),應(yīng)采用中位數(shù)、極差或四分位數(shù)間距進(jìn)行描述。此時(shí)用均數(shù)和標(biāo)準(zhǔn)差進(jìn)行描述就自相矛盾了。另外,統(tǒng)計(jì)描述時(shí)僅僅給出了集中趨勢(shì)指標(biāo)而沒有給出變異指標(biāo)也是不充分的。
假設(shè)檢驗(yàn)的P值僅僅反映現(xiàn)有樣本中H0成立的概率,它并不能反映組間差異的大小[7]。因此,為了反映組間差異的大小,對(duì)于主要的數(shù)據(jù)和結(jié)果還應(yīng)給出置信區(qū)間,而且,除了有每個(gè)組的置信區(qū)間,還應(yīng)該有組間差異的置信區(qū)間,這樣可以為讀者提供更多的信息。P值應(yīng)該寫出具體值,而不是簡(jiǎn)單的給出一個(gè)大小范圍(如P<0.05或P>0.05),但給出超高精確度P值也沒必要(如P=0.00321……),因?yàn)楦緹o法由一般大小的樣本含量去論證P值的超高精確度。統(tǒng)計(jì)學(xué)表達(dá)常見的統(tǒng)計(jì)學(xué)錯(cuò)誤和缺陷見表3。
表3 統(tǒng)計(jì)學(xué)表達(dá)中常見的錯(cuò)誤和缺陷
所有的研究結(jié)果必須有相關(guān)數(shù)據(jù)的支持,差異有統(tǒng)計(jì)學(xué)意義的結(jié)論必須來自于假設(shè)檢驗(yàn);差異無統(tǒng)計(jì)學(xué)意義時(shí),下結(jié)論也要慎重,因?yàn)榻y(tǒng)計(jì)學(xué)沒有差異并不一定說明沒有效果或沒有差異——特別是結(jié)論來自于小樣本資料時(shí)要考慮犯II類錯(cuò)誤的可能性,無統(tǒng)計(jì)學(xué)差異的結(jié)論也可能包含重要的臨床發(fā)現(xiàn)和對(duì)其他研究者有價(jià)值的信息。研究結(jié)果的解釋還需要充分考慮潛在的混雜因子和偏倚。統(tǒng)計(jì)分析結(jié)果解釋錯(cuò)誤或缺陷見表4。
表4 統(tǒng)計(jì)分析結(jié)果解釋錯(cuò)誤或缺陷
本文通過分析總結(jié)醫(yī)學(xué)科研中常見的統(tǒng)計(jì)學(xué)誤用情況,以幫助醫(yī)學(xué)科研工作者提高科研水平,重視數(shù)據(jù)在科研中的作用。本文分析了一些簡(jiǎn)單但又很實(shí)用的統(tǒng)計(jì)學(xué)問題,旨在幫助那些沒有系統(tǒng)學(xué)習(xí)過統(tǒng)計(jì)學(xué)知識(shí)的科研人員完善其科研中的統(tǒng)計(jì)學(xué)設(shè)計(jì)。然而,隨著醫(yī)學(xué)科研對(duì)統(tǒng)計(jì)學(xué)要求的提高,本文所提到的統(tǒng)計(jì)學(xué)問題還遠(yuǎn)遠(yuǎn)不足,其它一些統(tǒng)計(jì)學(xué)問題如隨機(jī)對(duì)照試驗(yàn)、meta分析、診斷試驗(yàn)等,需要研究者學(xué)習(xí)更廣泛和更深入的統(tǒng)計(jì)學(xué)知識(shí)[8]。
目前有很多非常簡(jiǎn)單的統(tǒng)計(jì)軟件包供科研者使用,即便是沒有什么統(tǒng)計(jì)學(xué)知識(shí)的研究人員同樣可以方便進(jìn)行統(tǒng)計(jì)分析,但是若研究人員缺乏相關(guān)統(tǒng)計(jì)學(xué)知識(shí)或相關(guān)概念模糊,可能會(huì)出現(xiàn)一些錯(cuò)誤的分析結(jié)果。另外,很多研究都是在設(shè)計(jì)已經(jīng)完成之后,在研究過程中出現(xiàn)問題后再去請(qǐng)教統(tǒng)計(jì)學(xué)專家,此時(shí)往往難以避免統(tǒng)計(jì)學(xué)的不足,從而導(dǎo)致科研的浪費(fèi)[9]。
有研究表明,醫(yī)學(xué)專業(yè)期刊的統(tǒng)計(jì)學(xué)審核還不夠嚴(yán)格,醫(yī)學(xué)雜志編輯應(yīng)該對(duì)稿件中相關(guān)統(tǒng)計(jì)學(xué)問題進(jìn)行專審。在論文發(fā)表前,需要統(tǒng)計(jì)學(xué)專家對(duì)所有統(tǒng)計(jì)學(xué)問題進(jìn)行審核,雜志也應(yīng)該在“稿約”中規(guī)定相關(guān)統(tǒng)計(jì)學(xué)的要求[10]。
生物醫(yī)學(xué)研究中統(tǒng)計(jì)學(xué)知識(shí)關(guān)系到一個(gè)病人的存活或者死亡、關(guān)系到健康的改善或損害、關(guān)系到醫(yī)學(xué)科學(xué)的進(jìn)步或者錯(cuò)誤。醫(yī)學(xué)科研的進(jìn)步需要合理的統(tǒng)計(jì)學(xué)實(shí)踐,研究者、雜志編輯、大學(xué)老師、統(tǒng)計(jì)學(xué)專家等,無論其水平和職業(yè)都有義務(wù)以專業(yè)性、合乎倫理的態(tài)度,嚴(yán)謹(jǐn)?shù)膽?yīng)用統(tǒng)計(jì)學(xué)方法來促進(jìn)科學(xué)研究。
[1] ALTMAN DG.Statistics in medical journals: some recent trends[J].Stat Med,2000,19(23):3275-3289.
[2] GARDENIER JS,RESNIK DB.The misuse of statistics:concepts,tools,and a research agenda[J].Account Res, 2002,9(2):65-74.
[3] OLSEN CH.Review of the use of statistics in Infection and Immunity[J].Infect Immun,2003,71(12):6689-6692.
[4] 王 倩,張博恒.五種中華醫(yī)學(xué)會(huì)系列雜志論著中統(tǒng)計(jì)方法的應(yīng)用現(xiàn)況[J].中華醫(yī)學(xué)雜志,1998,78(3):230-233.
[5] MOREIRA ED,STEIN Z,SUSSER E.Reporting on methods of subgroup analysis in clinical trials:a survey of four scientific journals[J].Brazilian J Med Biol Res,2001,34 (11):1441-1446.
[6] NAGELE P.Misuse of standard error of the mean (SEM) when reporting variability of a sample.A critical evaluation of four anaesthesia journals[J].Br J Anaesth,2001,90 (4):514-516.
[7] 孫紅衛(wèi),董兆舉,趙擁軍.對(duì)統(tǒng)計(jì)假設(shè)檢驗(yàn)的誤解與誤用[J].中國衛(wèi)生統(tǒng)計(jì),2012,29(1):147-150.
[8] MOHER D,SCHULZ KF,ALTMAN DG.The CONSORT statement:revised recommendations for improving the quality of reports of parallel-group randomised trials[J].Lancet, 2001,357(9263):1191-1194.
[9] ALTMAN DG,GOODMAN SN, SCHROTER S.How Statistical Expertise is used in Medical Research[J].JAMA,2002,287 (21):2817-2820.
[10] 王 玖,徐天和,祁愛琴,等.醫(yī)學(xué)論文統(tǒng)計(jì)學(xué)誤用及其防范對(duì)策[J].編輯學(xué)報(bào),2002,14(6):417-418.
(本文編輯:何慶節(jié))
Prevention measure to common statistical misuse in medical research
CHEN Bai-feng, CHEN Yu-juan, ZHU Yu, LI Jie, YAO Ying-shui
(Wannan Medical College, Wuhu Anhui 241002, China)
The entire process of medical research requires statistical knowledge. The reasonable selection and application of statistic directly influent the quality of medical research. This paper concludes and analyzes common statistical misuse in medical research as follow 4 aspects: study design, statistic analysis, statistics expression and result interpretation. it is widely recognized that the proper use of statistics is a key element of research integrity. It puts forward relevant prevention measures, providing the reference frame for proper using statistic to medical researchers.
medical research, statistical method, statistics expression, result interpretation
R195.1
A
1003-2800(2014)01-0058-03
2013-07-29
安徽省高等學(xué)校省級(jí)教學(xué)研究項(xiàng)目(20100612,2008jyxm529)
陳佰鋒(1980-),男,湖北建始人,講師,碩士,主要從事流行病學(xué)研究。
姚應(yīng)水(1972-),男,安徽銅陵人,教授,碩士生導(dǎo)師,主要從事流行病學(xué)和醫(yī)學(xué)統(tǒng)計(jì)學(xué)研究。