叢乃霞 陳頌
醫(yī)學(xué)統(tǒng)計學(xué)在醫(yī)學(xué)科學(xué)研究中應(yīng)用比較廣泛。在文獻(xiàn)研究設(shè)計、實(shí)驗觀察、數(shù)據(jù)收集、資料分析、結(jié)果表達(dá)與解釋、論文寫作和發(fā)表等環(huán)節(jié)無不涉及統(tǒng)計學(xué)問題。如果統(tǒng)計學(xué)內(nèi)容出了差錯,就會造成實(shí)驗設(shè)計不合理、實(shí)驗方法錯誤、數(shù)據(jù)錯誤,導(dǎo)致結(jié)果和結(jié)論出現(xiàn)偏差等嚴(yán)重問題,因此,醫(yī)學(xué)論文正確運(yùn)用統(tǒng)計學(xué)是保證科學(xué)研究可信度的關(guān)鍵,也是確保醫(yī)學(xué)論文質(zhì)量的關(guān)鍵[1-2]。程亮星發(fā)現(xiàn)[3],《腫瘤基礎(chǔ)與臨床》編輯部修回稿件的直觀性統(tǒng)計學(xué)差錯分析中,796篇修回稿件,直觀性統(tǒng)計學(xué)差錯率為85.93%。郝麗潔等[4]發(fā)現(xiàn),某醫(yī)學(xué)期刊413篇論文中,255篇存在統(tǒng)計學(xué)差錯問題,發(fā)生率為61.74%。汪媛等[5]發(fā)現(xiàn),24種腫瘤學(xué)期刊中,18種期刊在論文報告P值時出現(xiàn)了P值的誤用情況,占75.00%。近幾年,作者和編輯越來越重視統(tǒng)計學(xué)問題,但從作者投稿和出刊情況來看,統(tǒng)計學(xué)差錯問題依然很多。本文通過整理常見問題加以分析,希望引起作者和編輯的重視,減少統(tǒng)計學(xué)常見差錯問題。
在《中國療養(yǎng)醫(yī)學(xué)》雜志稿件庫中,隨機(jī)抽取某一年100篇連續(xù)編號的文章,其中有3篇文章未涉及統(tǒng)計學(xué)內(nèi)容,97篇文章納入統(tǒng)計學(xué)分析,通過直觀審核和SPSS 26.0軟件統(tǒng)計分析判斷正誤。
通過對97篇文章的審核,發(fā)現(xiàn)統(tǒng)計學(xué)問題比較突出,主要表現(xiàn)在5個方面,見表1。
表1 97篇文章統(tǒng)計學(xué)問題差錯率[n(%)]
3.1 統(tǒng)計學(xué)方法描述不全面 統(tǒng)計學(xué)方法描述過于簡單和籠統(tǒng),不能很好地解釋和概況研究方法,編輯人員也無法審核研究方法的正誤,統(tǒng)計學(xué)方法應(yīng)寫的具體和詳細(xì)。比如,對于計量資料,只寫采用t檢驗,沒有寫清楚具體采用了何種t檢驗,因為t檢驗包括單樣本t檢驗、獨(dú)立樣本t檢驗和配對樣本t檢驗。
簡單示例:統(tǒng)計學(xué)方法以SPSS 20.0處理,計量資料用t檢驗,計數(shù)資料用χ2檢驗,P<0.05為有差異性。
正確示例:統(tǒng)計學(xué)方法,數(shù)據(jù)以SPSS 20.0處理,計量資料以(±s)表示,采用t檢驗,組間比較采用獨(dú)立樣本t檢驗,組內(nèi)比較采用配對樣本t檢驗。計數(shù)資料以率表示,采用χ2檢驗,P<0.05表示差異有統(tǒng)計學(xué)意義。
3.2 統(tǒng)計學(xué)方法描述不一致 文章在統(tǒng)計學(xué)方法中提到采用了某種統(tǒng)計分析方法,但在結(jié)果或圖表中并沒有對應(yīng)的統(tǒng)計數(shù)據(jù)呈現(xiàn),或者在結(jié)果或圖表中出現(xiàn)了統(tǒng)計量及P值,但在統(tǒng)計學(xué)方法中并未進(jìn)行對應(yīng)描述,出現(xiàn)前后不呼應(yīng)的情況,導(dǎo)致條理不清,邏輯混亂,嚴(yán)重影響閱讀。
3.3 統(tǒng)計學(xué)方法誤用 研究應(yīng)基于實(shí)驗設(shè)計類型和分析目的不同,選用合適的統(tǒng)計分析方法。通過對97篇論文統(tǒng)計學(xué)分析,發(fā)現(xiàn)統(tǒng)計學(xué)方法誤用問題比較嚴(yán)重,比如,一般χ2誤用Fisher精確卡方檢驗,一般χ2誤用配對卡方檢驗。本次統(tǒng)計,單向有序分類資料統(tǒng)計學(xué)方法誤用比例高達(dá)37%。對于分組變量無序、對比指標(biāo)變量有序的單項有序統(tǒng)計資料,如果是比較觀察指標(biāo)不同組間等級強(qiáng)度有無差別,可以根據(jù)分組數(shù)不同選擇不同的非參數(shù)統(tǒng)計分析方法。如果分組數(shù)是兩組,選用兩獨(dú)立樣本比較的Wilcoxon秩和檢驗進(jìn)行分析,如果分組數(shù)大于等于3種, 則應(yīng)選用多個獨(dú)立樣本比較的Kruskal-Wallis H檢驗和Mann-Whitney U檢驗[6],而不是選擇χ2檢驗。
舉例說明,兩組飛行員治療效果比較,表1比較療效采用了卡方檢驗屬于統(tǒng)計學(xué)方法誤用[7],表2采用秩和檢驗是正確的,見表1~2。
表1 兩組飛行員治療效果比較[n(%)]
表2 兩組飛行員治療效果比較[n(%)]
3.4 統(tǒng)計結(jié)果問題
3.4.1 統(tǒng)計結(jié)果未提供t值 作者在結(jié)果中只給出P值,未給出t值,或者只給出P值范圍,未給出P值具體數(shù)值,這些都屬于內(nèi)容表述不完整問題。在寫作中需要給出具體的t值和P值,突出科學(xué)的嚴(yán)謹(jǐn)性,方便其他作者和編輯驗證方法的可行性和準(zhǔn)確性。
3.4.2 統(tǒng)計值差錯問題 統(tǒng)計值出現(xiàn)差錯,有的是作者制表錄入時粘貼復(fù)制導(dǎo)致的差錯,有的是作者統(tǒng)計學(xué)方法選擇不當(dāng)導(dǎo)致的差錯,有的是作者計算錯誤導(dǎo)致的差錯,也有因作者保留小數(shù)位數(shù)不當(dāng)導(dǎo)致的差錯,統(tǒng)計值差錯會直接影響結(jié)論,所以,要求統(tǒng)計值計算和表述準(zhǔn)確無誤。
3.4.3P值表述問題P<0.05時,表示對比組之間差異具有統(tǒng)計學(xué)意義,而不應(yīng)說對比組之間差別有顯著性或者具有顯著性差別[8]。P值為0.00或0.000時,應(yīng)書寫為P<0.01或P<0.001,而不是直接書寫0.00或0.000。
統(tǒng)計學(xué)在醫(yī)學(xué)科研整個過程中具有重要的作用,作者應(yīng)加強(qiáng)對統(tǒng)計學(xué)的認(rèn)識,不斷提高統(tǒng)計學(xué)應(yīng)用水平與科研能力,培養(yǎng)嚴(yán)謹(jǐn)?shù)目茖W(xué)態(tài)度,保證統(tǒng)計數(shù)據(jù)結(jié)果的準(zhǔn)確性和真實(shí)性[9]。編輯應(yīng)重視統(tǒng)計學(xué)知識的培訓(xùn)和學(xué)習(xí),可以參加培訓(xùn)班,研讀統(tǒng)計學(xué)教材及相關(guān)論文提升自身統(tǒng)計學(xué)知識水平[10]。編輯要重視對統(tǒng)計學(xué)問題的審核,嚴(yán)把統(tǒng)計學(xué)問題關(guān),難以把握的統(tǒng)計學(xué)問題要與作者反復(fù)的溝通,可以向作者要原始數(shù)據(jù)加以核對,也可以送統(tǒng)計學(xué)專家外審。