劉煥英 唐 顏 陳珊茗
醫(yī)學期刊編輯應注意文章的數(shù)據(jù)統(tǒng)計
劉煥英唐 顏陳珊茗
數(shù)據(jù)的統(tǒng)計方法對文章的結果和結論有重要的影響,針對醫(yī)學論文中統(tǒng)計方法應用的重要性,從研究設計、統(tǒng)計軟件的選擇、統(tǒng)計方法、統(tǒng)計描述及統(tǒng)計圖表幾個方面分析了統(tǒng)計分析中常見的錯誤。編輯對稿件進行加工時應注意文章的統(tǒng)計分析,從研究設計到結果描述進行嚴格審核,指導作者選擇正確的方法,提高稿件的科學性。
醫(yī)學期刊;編輯;數(shù)據(jù)統(tǒng)計
數(shù)據(jù)統(tǒng)計是論文的基礎,是醫(yī)學論文寫作上不可或缺的環(huán)節(jié),正確使用統(tǒng)計方法能使研究的結果和結論更科學、嚴謹和可靠。醫(yī)學期刊論文的統(tǒng)計學問題已經成為衡量論文質量的重要標準,統(tǒng)計學的錯誤會導致論文學術水平及學術質量的降低。
研究設計是工作的源頭,良好的研究設計是順利進行科學研究和數(shù)據(jù)統(tǒng)計分析及統(tǒng)計推斷的先決條件,也是獲得預期結果的重要保證。研究設計主要包括專業(yè)設計和統(tǒng)計設計兩部分,專業(yè)設計是基礎,統(tǒng)計設計是對資料搜集、整理和分析全過程總的設想和安排。醫(yī)學科學研究中常用的方法有實驗研究、調查研究、實地研究和文獻研究,特別是實驗研究和調查研究用得最多。編輯在對論文處理時發(fā)現(xiàn),實驗設計和調查設計存在不少問題。
大多數(shù)實驗設計存在以下錯誤:(1)未按照實驗設計的基本原則要求設立對照組,臨床試驗應設立對照組,病例報告類文章則無須設置對照組。對照是比較的基礎,設立對照組是控制混雜因素和偏倚的重要手段,只有設立對照組,處理因素的效應才會充分顯露出來;不設立對照組往往會導致錯誤的結論,誤將處理因素造成的偏倚當成處理效應。(2)設立的對照組沒有滿足組間的均衡性,把非處理因素造成的偏倚當成處理效應。在整個實驗過程中,對照組和實驗組應始終處于同時同地,即應設同期對照組。盡量不要用歷史對照或其他研究的資料作為對照。對照組設立后應對各組的基線資料進行統(tǒng)計分析比較,檢驗對照組及處理組開始時的狀態(tài)是否均衡。(3)實驗設計的受試對象沒有按隨機化原則分組。使用隨機的方式、對大量不可控制的非處理因素的重要手段,使每個受試對象有同等的機會被分到實驗組和對照組中。它可使不可控制的混雜因素在實驗組及對照組中影響相當,可視為實驗誤差。在實際實驗中,隨機化可通過隨機數(shù)字表和計算機的偽隨機數(shù)來實現(xiàn)。(4)實驗研究沒有進行重復,使實驗誤差過大。因實驗誤差是客觀存在的,只有在相同的實驗條件下對同一觀察指標進行多次重復測定,才能準確算出誤差的大小。
調查問卷在醫(yī)學論文中應用也比較多,它是通過有針對性地設計一系列的問題,直接對調查對象進行調查的一種方法,醫(yī)學研究中主要用于病因探討。調查設計包括調查研究資料的收集、整理和分析全過程的計劃和安排。調查設計類稿件主要存在的問題:(1)調查問卷的定義不夠準確,調查問卷的問題較含糊,使調查對象無所適從,搜集到的數(shù)據(jù)不準確[1]。(2)調查表的問題使用了不確切的詞,如“很久”“經?!薄耙恍钡雀痹~或形容詞。調查表制定的問題帶有引導式的提問或有斷定性問題,引導性的問題會使被調查者偏向同意問題中的暗示的結論。引導式的提問是調查的大忌,常會導致出現(xiàn)嚴重偏倚的結論。(3)沒有對調查表的內容進行效度、信度及可接受性進行考評。其中信度與效度的考評方法適用于各條目均有和分的調查表,信度與效度的相關系數(shù)越接近1越好,越接近0越差。(4)調查的抽樣方法使用錯誤,使調查結果的抽樣誤差過大。(5)調查表沒有對樣本含量進行估計,樣本含量過大過小都有其弊端。樣本含量過小,研究所得指標不穩(wěn)定,檢驗的功效低,推斷總人體模型的精密度和準確度差,難以獲得正確的研究結果。樣本量過大,浪費人力物力和時間,還會引入過多的混雜因素,從而影響數(shù)據(jù)的質量。
目前,醫(yī)學期刊中采用頻率較高的統(tǒng)計學軟件為SPSS、SAS、STATA、PEMS等,其中以SPSS軟件使用最為常見[2]。所有論文均需對數(shù)據(jù)處理所用軟件、版本、具體方法及檢驗水準進行詳細表述。SPSS和SAS進行統(tǒng)計分析時沒有給出假設檢驗的顯著性水平,或者沒有根據(jù)數(shù)據(jù)的類型給出正確檢驗方法。統(tǒng)計方法描述不準確如卡方檢驗里面,當n<40及T<1時采用χ2檢驗確切概率法進行檢驗,但大部分的稿件只籠統(tǒng)地描述為“χ2檢驗”。
醫(yī)學期刊中最常用的統(tǒng)計推斷方法為t檢驗、χ2檢驗、F檢驗、方差分析、相關分析、回歸分析。處理稿件時比較常見的錯誤:(1)t檢驗使用不當,t檢驗一般用于兩組資料的對比,對數(shù)據(jù)要求正態(tài)、隨機。多組資料的分析用方差分析,方差分析的前提條件是樣本獨立隨機,正態(tài)分布,方差齊。稿件中作者往往沒有對數(shù)據(jù)進行方差齊性檢驗,對方差不齊的數(shù)據(jù)也用此檢驗,導致檢驗結果不可靠。多組資料比較差異有統(tǒng)計學意義時,再選擇合適的方法進一步兩兩比較,而非簡單選用兩樣本的t檢驗,增加犯一類錯誤的概率。(2)卡方檢驗方法或結果選擇錯誤,部分文章隨意使用卡方檢驗??ǚ綑z驗的適用范圍為:當n>40且T>5時,使用一般的卡方檢驗;但當1<T<5,或n≥40時,應采用校正后的χ2檢驗;當n<40及T<1時采用χ2檢驗確切概率法進行檢測。對卡方檢驗結果選擇錯誤,一般的卡方檢驗所讀結果為peason chi-square,校正的卡方檢驗所讀的結果為continuty correct,確切概率法檢驗結果為fisher’s exact test。(3)相關分析和回歸分析混淆,相關系數(shù)和決定系數(shù)使用錯誤,相關分析主要是用于分析兩變量的相關關系,回歸是從預測的角度反映兩變量的變化規(guī)律。(4)相關分析時,只求出相關系數(shù),并沒有對相關系數(shù)進行統(tǒng)計檢驗[3]。
一般來說,選擇了合適的統(tǒng)計軟件,運用正確的統(tǒng)計方法對數(shù)據(jù)處理后,數(shù)據(jù)的標注問題不大。統(tǒng)計結果描述的常見錯誤有以下幾種:(1)對于符合正態(tài)分布的定量數(shù)據(jù)的描述,一般用“均數(shù)±標準差”或“均數(shù)±標準誤”表示,而非正態(tài)分布資料則用中位數(shù)、四分數(shù)間距或眾數(shù)來表示。(2)對于定性數(shù)據(jù),要正確區(qū)分構成比和率。率和構成比是兩個不同的概念,不能混淆更不能以率代替構成比,構成比是說明各組成部分的比重或分布,而率是說明某現(xiàn)象發(fā)生的頻率或強度。用率和構成比對資料進行比較時,要注意資料間的可比性,合并計算分組資料的率時,不能簡單相加。(3)算術均數(shù)、向何均數(shù)及中位數(shù)的誤用。算術均數(shù)適合正態(tài)分布的數(shù)據(jù),幾何均數(shù)適合等比數(shù)據(jù),而中位數(shù)適用于大樣本偏態(tài)分布的數(shù)據(jù)。(4)對統(tǒng)計學上的P值理解錯誤,僅根據(jù)P值的大小得出相應的結論。在實際工作中比較常見的錯誤表述是“P<0.05”認為差異顯著,“P<0.01”認為差異非常顯著,“P<0.001”認為差異極其顯著。其實P值并不代表各組數(shù)值差異的大小,P值越小只能說明組間的比較有差異,而不能反映研究對象差異的大小。(5)統(tǒng)計值或P值描述不清以及統(tǒng)計值缺失問題。許多稿件對統(tǒng)計結果進行描述時,沒有完整地描述統(tǒng)計值和P值,統(tǒng)計結果未列出具體的P值,僅用“P<0.05”或“P>0.05”得出結論,或僅列出具體的P值,缺少相應的統(tǒng)計值。(6)直接在論文中寫P=0。SPSS對數(shù)據(jù)進行統(tǒng)計分析時,當P值過小的情況下,系統(tǒng)會輸出P=0.0000,但實際上P值并不等于零,應描述為P<0.001或P<0.0001[4]。
論文中的數(shù)據(jù)一般以統(tǒng)計圖或統(tǒng)計表來表示,統(tǒng)計圖與統(tǒng)計表的錯誤非常常見,稿件中常見的圖表問題:(1)統(tǒng)計表違背了編排規(guī)范,主謂安排不當,標目重復。編排規(guī)范上的錯誤主要是由于作者對規(guī)范掌握不足,而統(tǒng)計表格的錯誤主要是由于作者的主觀偏好或列表習慣所致。(2)橫縱標目不明確,主辭和賓辭倒置。個別作者為了統(tǒng)計表格的美觀,縱橫標目倒置,以至于表格不能表達本來的意義。(3)統(tǒng)計表中缺少顯著性結果的標注,有些表格有多個因素需要用不同的符號或字母進行標注,表格中沒有作含義說明,標注不明確。(4)統(tǒng)計圖中有統(tǒng)計學差異結果的標注。有些圖沒有標準差或標準誤,有些多種標識沒有圖注。審核標注結果時,圖表需簡單明了,做好相應的圖注和表注。(5)統(tǒng)計圖中的坐標單位選擇不當、圖例形式選擇不當和坐標軸缺失等。(6)統(tǒng)計圖中坐標軸上各標值線間隔表示的數(shù)量不相等,當坐標標值不等距且有一定規(guī)律時,可改為對數(shù)坐標或半對數(shù)線圖或改為直條圖[5]。
編輯不僅要注意統(tǒng)計圖表中的數(shù)據(jù)標注問題,還要審核圖表的文字描述,文字描述要與圖表的表述相一致。當統(tǒng)計分析結果顯示差異沒有統(tǒng)計學意義時,作者表述時不宜用略有增加減少,或者描述為呈增加或減少的趨勢等。
統(tǒng)計分析方法的正確與否關系到科研結果的可信度及有效性高低,對數(shù)據(jù)處理方法的合理性及科學性的把握,影響到論文學術質量[6]。編輯加工時應注意文章的數(shù)據(jù)統(tǒng)計,從研究設計到統(tǒng)計軟件選擇再到數(shù)據(jù)統(tǒng)計指標、文字描述及統(tǒng)計圖表都要認真審核,提醒作者運用正確的方法。要做好統(tǒng)計學的審核工作,需培養(yǎng)編輯人員的統(tǒng)計能力。首先,要提高編輯人員的統(tǒng)計學水平,采用多元化渠道對統(tǒng)計學知識進行學習;其次,聘請統(tǒng)計學專業(yè)的專家給予指導[7]。
編輯對數(shù)據(jù)統(tǒng)計方法的認真審核,有助于作者自覺地按照規(guī)范的方法進行醫(yī)學研究設計、數(shù)據(jù)分析及數(shù)據(jù)推斷,而且有助于編輯對研究設計的結果核實,更有助于滿足meta分析等文獻再分析的需要。統(tǒng)計軟件和統(tǒng)計方法的選擇正確能提高結果的可信度,從而提高論文的科學性。
[1]邵曉軍.科技期刊編輯應注意統(tǒng)計描述中的錯誤[J].赤峰學院學報(自然科學版),2011(8):208-210.
[2]張巧蓮,楊晨晨.3種醫(yī)學期刊統(tǒng)計學軟件及統(tǒng)計學推斷方法應用現(xiàn)狀分析[J].新疆醫(yī)科大學學學報,2016(1):126-129.
[3]魏中青.編輯加工時應注意文章的數(shù)據(jù)統(tǒng)計——以《生態(tài)學雜志》為例[J].農業(yè)圖書情報學刊,2015(3):162-164.
[4]吳艷妮,周春蘭,江霞,等.國內護理學統(tǒng)計源期刊論文中報告精確P值常見錯誤:P=0.000[J].編輯學報,2016(2):133-134.
[5]汪勤儉,耿鵬,劉洪娥,等.科技論文中統(tǒng)計線圖坐標標值不等距的處理方法[J].編輯學報,2008(2):118-119.
[6]姜春霞.論醫(yī)學期刊編輯的統(tǒng)計學審核[J],中國科技期刊研究,2014(6):782-784.
[7]吳學軍,廖粵新.科技期刊編輯應注重統(tǒng)計數(shù)據(jù)的審核[J].編輯學報,2010(5):416-417.
劉煥英、唐顏、陳珊茗(通訊作者),廣州市第一人民醫(yī)院。