張久權(quán),蘇以榮,黃一蘭,張 瀛
(1.中國(guó)農(nóng)業(yè)科學(xué)院煙草研究所,青島 266101;2.中國(guó)科學(xué)院亞熱帶農(nóng)業(yè)生態(tài)研究所,長(zhǎng)沙 410125;3.中國(guó)科學(xué)院大學(xué),北京 100049;4.福建省煙草公司三明市公司,福建 三明 365000)
農(nóng)作物試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析值得注意的7個(gè)問(wèn)題
張久權(quán)1,2,3,蘇以榮2,黃一蘭3,4,張 瀛3,4
(1.中國(guó)農(nóng)業(yè)科學(xué)院煙草研究所,青島 266101;2.中國(guó)科學(xué)院亞熱帶農(nóng)業(yè)生態(tài)研究所,長(zhǎng)沙 410125;3.中國(guó)科學(xué)院大學(xué),北京 100049;4.福建省煙草公司三明市公司,福建 三明 365000)
進(jìn)行科學(xué)試驗(yàn)研究時(shí),試驗(yàn)設(shè)計(jì)的正確性和統(tǒng)計(jì)分析的合理性直接影響結(jié)論的可靠性。目前,農(nóng)作物試驗(yàn)研究存在大量的統(tǒng)計(jì)問(wèn)題,此給我國(guó)的科技創(chuàng)新造成了較大的負(fù)面影響。為了進(jìn)一步提高相關(guān)科技工作者的研究水平,更好地運(yùn)用統(tǒng)計(jì)學(xué),提高科技創(chuàng)新的效率,筆者對(duì)農(nóng)作物試驗(yàn)研究中經(jīng)常出現(xiàn)的統(tǒng)計(jì)方面的問(wèn)題進(jìn)行了闡述,如對(duì)試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析重視不夠,試驗(yàn)計(jì)劃不完善,將統(tǒng)計(jì)的顯著水準(zhǔn)視為固定的標(biāo)準(zhǔn),忽視方差分析的前提條件,濫用回歸分析,對(duì)重復(fù)測(cè)量數(shù)據(jù)的分析不合理,對(duì)統(tǒng)計(jì)的表達(dá)不恰當(dāng)?shù)?。并?duì)部分問(wèn)題提出了相應(yīng)的解決辦法。
試驗(yàn)設(shè)計(jì);統(tǒng)計(jì)分析;問(wèn)題;農(nóng)作物
國(guó)內(nèi)外科技界普遍認(rèn)為,SCI數(shù)據(jù)庫(kù)所收錄的科技論文質(zhì)量高,數(shù)據(jù)可靠,值得信賴,然而,其中的一些論文仍然存在試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析方面的問(wèn)題。有學(xué)者從具有極高影響因子的 SCI期刊中選取 49 篇文章,其被引次數(shù)均超過(guò) 1000 次,發(fā)現(xiàn)其中 33%的論文所報(bào)道的結(jié)果經(jīng)不起時(shí)間和實(shí)踐的檢驗(yàn)[1]。更有甚者,美國(guó)波士頓 Tufts 大學(xué)醫(yī)學(xué)院的 John Ioannidis 撰文,從統(tǒng)計(jì)學(xué)角度證明大多數(shù)已發(fā)表的論文其研究結(jié)果是錯(cuò)誤的[2]。究其原因,很多情況下是因?yàn)樵囼?yàn)設(shè)計(jì)或統(tǒng)計(jì)分析出了問(wèn)題。高水平的 SCI論文尚且如此,我國(guó)的情況如何呢?張亙稼[3]采用類(lèi)型抽樣法,從 CNKI 中選取較有影響的100 種科技期刊,進(jìn)行統(tǒng)計(jì)方法誤用方面的調(diào)查,發(fā)現(xiàn)農(nóng)林類(lèi)期刊論文中誤用率最低為 9.4%,最高達(dá)27.5%,平均為 18.45%。此僅僅是該學(xué)者獨(dú)自進(jìn)行的統(tǒng)計(jì)方法方面的錯(cuò)誤調(diào)查,如果邀請(qǐng)一個(gè)專家小組對(duì)試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析錯(cuò)誤進(jìn)行全面調(diào)查,錯(cuò)誤率和錯(cuò)誤的嚴(yán)重程度估計(jì)會(huì)更高。
著名統(tǒng)計(jì)學(xué)學(xué)家胡良平教授經(jīng)過(guò)多年審讀期刊文稿和參與科研成果評(píng)審后得出結(jié)論:“在國(guó)內(nèi)已發(fā)表的醫(yī)學(xué)研究成果中,從科研設(shè)計(jì)、統(tǒng)計(jì)分析到結(jié)論都正確的很難尋覓”[4]。縱觀已發(fā)表的科技論文,從試驗(yàn)設(shè)計(jì)、數(shù)據(jù)收集、統(tǒng)計(jì)分析,到結(jié)果的解釋和所下結(jié)論等環(huán)節(jié),都能找出破綻,有的會(huì)出現(xiàn)實(shí)質(zhì)性的問(wèn)題,如結(jié)論錯(cuò)誤[5]。筆者曾閱讀過(guò)農(nóng)作物方面的科技論文近6000篇,親自審閱稿件3000余篇,發(fā)現(xiàn)論文中最多、最嚴(yán)重的是試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析方面的問(wèn)題。某些科技論文因?yàn)樵囼?yàn)設(shè)計(jì)不妥或統(tǒng)計(jì)方法不對(duì),所得結(jié)論很難令人信服。
出現(xiàn)此情況的原因是多方面的,其中,有兩點(diǎn)最為突出:一是隨著計(jì)算機(jī)統(tǒng)計(jì)軟件包的普及,尤其是窗口式統(tǒng)計(jì)軟件包如 SPSS,DPS 等的廣泛運(yùn)用,給廣大科技工作者帶來(lái)了極大的便利,但同時(shí)也帶來(lái)了巨大的潛在危險(xiǎn)和問(wèn)題。因?yàn)槲覀兪褂眠@些窗口式軟件時(shí),往往忽視了統(tǒng)計(jì)方法必須滿足的前提條件和數(shù)據(jù)特點(diǎn),只是將數(shù)據(jù)輸入計(jì)算機(jī),盲目運(yùn)行程序,這樣計(jì)算出來(lái)的結(jié)果,往往是不可信的,有時(shí)甚至是錯(cuò)誤。二是某些試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析教科書(shū)質(zhì)量本身不是很高、遠(yuǎn)離實(shí)際應(yīng)用。統(tǒng)計(jì)學(xué)本身是一門(mén)很難的課程,涉及的理論較深、范圍較廣,學(xué)完了統(tǒng)計(jì)課程后往往不會(huì)解決實(shí)際問(wèn)題,這在碩士和博士研究生中大有人在,甚至一些擁有博士頭銜的統(tǒng)計(jì)學(xué)教師都不會(huì)進(jìn)行合理的試驗(yàn)設(shè)計(jì)或數(shù)據(jù)分析[4]。
為了更好地進(jìn)行科技創(chuàng)新,充分利用統(tǒng)計(jì)學(xué)知識(shí)完善農(nóng)作物類(lèi)試驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析,使研究結(jié)論盡量趨于完善合理,符合邏輯,盡量減少統(tǒng)計(jì)方面的錯(cuò)誤,筆者就容易出現(xiàn)的7個(gè)方面的統(tǒng)計(jì)問(wèn)題進(jìn)行概述。在隨后的系列文章中,筆者將對(duì)這些問(wèn)題和解決辦法進(jìn)行詳細(xì)討論。
進(jìn)行科學(xué)研究時(shí),我們根據(jù)前提條件,結(jié)合試驗(yàn)數(shù)據(jù),也就是論據(jù),通過(guò)論證,得出符合邏輯的結(jié)論,發(fā)現(xiàn)規(guī)律。在這個(gè)過(guò)程中,只有正確合理的試驗(yàn)設(shè)計(jì)、數(shù)據(jù)收集和統(tǒng)計(jì)分析,才能作出科學(xué)的推斷。統(tǒng)計(jì)學(xué)作為科研的必備工具,使我們頭腦更清醒、智力更超常、眼睛更明亮、手段更有力。如果缺乏統(tǒng)計(jì)學(xué)知識(shí),忽視統(tǒng)計(jì)學(xué)在科學(xué)研究中的地位和作用,或者誤用統(tǒng)計(jì)方法,所得到的結(jié)論往往沒(méi)有說(shuō)服力,會(huì)經(jīng)不起時(shí)間的考驗(yàn)[1],甚至是錯(cuò)誤的,這樣就造成了人力、物力和時(shí)間的巨大浪費(fèi)。
目前,在農(nóng)作物類(lèi)研究中一些科技人員整天忙于各種會(huì)議、應(yīng)酬、項(xiàng)目申報(bào)和鑒定,不能靜下心來(lái)進(jìn)行認(rèn)真的思考和研究,工作浮躁,往往輕視試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析在科學(xué)研究中的作用。試驗(yàn)施行時(shí),缺乏試驗(yàn)設(shè)計(jì);試驗(yàn)結(jié)束后,無(wú)法進(jìn)行統(tǒng)計(jì)分析。有的學(xué)者試驗(yàn)結(jié)束后未進(jìn)行統(tǒng)計(jì)分析,單憑數(shù)值的大小進(jìn)行直觀比較[6],做出差異顯著的結(jié)論,這是缺乏統(tǒng)計(jì)學(xué)意識(shí)的突出表現(xiàn)[7]。
另一個(gè)普遍現(xiàn)象是雖然做了正確的試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析,但他們?cè)诿枋鼋Y(jié)果時(shí),完全拋開(kāi)了統(tǒng)計(jì)結(jié)果,武斷地認(rèn)為處理A比處理B好,雖然方差分析和多重比較結(jié)果表明他們之間并無(wú)顯著差異。有的不進(jìn)行多重比較,或者多重比較方法不正確,尤其是比較復(fù)雜的多因子全因素試驗(yàn),許多學(xué)者只進(jìn)行主處理間的多重比較,忽視因子間交互作用的多重比較,裂區(qū)試驗(yàn)不知道如何進(jìn)行主區(qū)因子或付區(qū)因子、以及他們之間的交互作用的多重比較等[8]。
更有甚者,一些學(xué)者在進(jìn)行農(nóng)作物試驗(yàn)時(shí),往往為了趕季節(jié),準(zhǔn)備不充分,未進(jìn)行合理的試驗(yàn)設(shè)計(jì),試驗(yàn)過(guò)程中雖然收集了大量的數(shù)據(jù),試驗(yàn)結(jié)束后才發(fā)現(xiàn)不知資料應(yīng)該如何進(jìn)行統(tǒng)計(jì)分析。事實(shí)上,前面的環(huán)節(jié)如試驗(yàn)設(shè)計(jì)、數(shù)據(jù)收集等錯(cuò)了,后期根本無(wú)法進(jìn)行正確的統(tǒng)計(jì)分析。這種現(xiàn)象在農(nóng)作物試驗(yàn)中很普遍。當(dāng)然,要做好試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析對(duì)科技工作者是一個(gè)較大的挑戰(zhàn)。因?yàn)槠渌婕暗膬?nèi)容較多,統(tǒng)計(jì)理論較深?yuàn)W。國(guó)外許多研究機(jī)構(gòu)尤其是農(nóng)業(yè)和醫(yī)學(xué)方面的機(jī)構(gòu),都有專門(mén)的統(tǒng)計(jì)學(xué)專家負(fù)責(zé)協(xié)助進(jìn)行試驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析。作為合格的科技工作者,我們應(yīng)該樹(shù)立正確的統(tǒng)計(jì)思想,充分利用正確的統(tǒng)計(jì)學(xué)知識(shí),進(jìn)行合理的試驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析,保證所得結(jié)論的科學(xué)性。
為了保證科學(xué)研究的客觀性和嚴(yán)謹(jǐn)性,我們需要投入大量的時(shí)間和精力,運(yùn)用專業(yè)知識(shí),充分考慮統(tǒng)計(jì)方面的要求,制訂詳盡的試驗(yàn)計(jì)劃,為數(shù)據(jù)收集和統(tǒng)計(jì)分析打好基礎(chǔ)。設(shè)計(jì)一個(gè)良好的試驗(yàn)計(jì)劃實(shí)際上是一項(xiàng)難度較大的工作,其中試驗(yàn)設(shè)計(jì)又是試驗(yàn)計(jì)劃的核心,因此,做好試驗(yàn)設(shè)計(jì)至關(guān)重要。國(guó)外有學(xué)者曾引用亞伯拉罕.林肯的格言:“如果有8小時(shí)砍樹(shù),就用 6小時(shí)磨斧子”。然而,目前一些學(xué)者對(duì)試驗(yàn)設(shè)計(jì)的不夠重視,所做的設(shè)計(jì)不合理,主要表現(xiàn)在以下方面。
2.1 違背“隨機(jī)原則”
統(tǒng)計(jì)分析都依賴于某種統(tǒng)計(jì)分布(如 t分布),而絕大部分分布函數(shù)最基本的假設(shè)條件就是變量是隨機(jī)的。只有隨機(jī),我們才能獲得誤差的無(wú)偏估計(jì),消除其他非試驗(yàn)因素所帶來(lái)的誤差[9],從而進(jìn)行正確的統(tǒng)計(jì)推斷。設(shè)計(jì)試驗(yàn)時(shí),如果對(duì)試驗(yàn)單元(如小區(qū))不進(jìn)行隨機(jī)化,就違背了統(tǒng)計(jì)檢驗(yàn)的基本條件,所得結(jié)果就會(huì)缺乏理論根據(jù)。
遺憾的是,一些科技人員進(jìn)行試驗(yàn)時(shí),小區(qū)排列仍然采用順序或?qū)Ρ扰帕性O(shè)計(jì),使試驗(yàn)結(jié)果的可信度大大降低。個(gè)別學(xué)者對(duì)隨機(jī)化原則不理解,或者雖然了解但因嫌麻煩不認(rèn)真執(zhí)行,甚至為了提高論文的錄用率,隨便冠以隨機(jī)化的字眼,這樣就失去了科學(xué)研究的真正意義。因此,在進(jìn)行試驗(yàn)設(shè)計(jì)時(shí),我們應(yīng)該從統(tǒng)計(jì)學(xué)的角度認(rèn)真做好隨機(jī)化的工作。比如,采用合理的排列方式(完全隨機(jī)、隨機(jī)區(qū)組等),將處理組合指定到某個(gè)試驗(yàn)單元(如,小區(qū))時(shí),采用隨機(jī)數(shù)字表或者計(jì)算機(jī)生成隨機(jī)數(shù)字來(lái)完成[9]。
2.2 試驗(yàn)未設(shè)重復(fù)
除極個(gè)別的探索性試驗(yàn)外,試驗(yàn)都要求設(shè)重復(fù),用來(lái)估計(jì)試驗(yàn)誤差,減少試驗(yàn)誤差和消除非試驗(yàn)因素的影響。如果試驗(yàn)不設(shè)重復(fù),從一個(gè)試驗(yàn)單元得到的結(jié)果有可能是偶然因素造成的,無(wú)法驗(yàn)證。從操作層面上講,如果試驗(yàn)沒(méi)有重復(fù),統(tǒng)計(jì)分析也無(wú)法進(jìn)行,只能進(jìn)行簡(jiǎn)單的直觀比較。
目前,在農(nóng)作物類(lèi)試驗(yàn)中,不設(shè)重復(fù)的現(xiàn)象仍然存在,需要引起注意。有些學(xué)者不設(shè)試驗(yàn)小區(qū)重復(fù),在同一小區(qū)進(jìn)行重復(fù)取樣,并將其等同于“小區(qū)重復(fù)”,這是完全錯(cuò)誤的。重復(fù)取樣只是重復(fù)測(cè)量,與試驗(yàn)所要求的重復(fù)有著本質(zhì)的區(qū)別。重復(fù)取樣根本不能取代試驗(yàn)設(shè)計(jì)所指的小區(qū)重復(fù)。
2.3 違背“唯一差異原則”
唯一差異原則是指除了處理因素有區(qū)別外,其他非試驗(yàn)因素要盡量保持一致[10]。否則無(wú)法區(qū)分處理效應(yīng)和非試驗(yàn)因素所帶來(lái)的干擾。如,某學(xué)者進(jìn)行玉米噴施鉬肥試驗(yàn),以不噴為對(duì)照,設(shè)一個(gè)噴鉬處理。由于噴鉬時(shí)同時(shí)也噴灑了水。如果天氣干旱,我們就無(wú)法分清到底是鉬肥還是水,或者是二者一起產(chǎn)生的效果。若將對(duì)照改為噴等量的水,就不會(huì)混淆了。因此,在進(jìn)行試驗(yàn)設(shè)計(jì)時(shí),要堅(jiān)持“唯一差異原則”。
統(tǒng)計(jì)學(xué)上通常將 α= 0.05、0.01、0.001 作為顯著性水準(zhǔn),以此來(lái)界定某幾個(gè)樣本是否屬于某特定總體,或處理之間是否有顯著差異等。可能是受教科書(shū)的影響,許多學(xué)者把這3個(gè)顯著水準(zhǔn)當(dāng)成固定的標(biāo)準(zhǔn),這是不可取的。當(dāng)初 Fisher選用 0.05、0.01、0.001 這 3 個(gè)水準(zhǔn)時(shí),完全是出于對(duì)這 3 個(gè)數(shù)字方便的考慮,沒(méi)有特定的科學(xué)依據(jù)。由于某種原因,就通過(guò)教科書(shū)和科技期刊一直沿用下來(lái)并成為“固定的標(biāo)準(zhǔn)水準(zhǔn)”了。
統(tǒng)計(jì)分析的基礎(chǔ)是概率論,而統(tǒng)計(jì)結(jié)論的理論依據(jù)是小概率事件。如果得出的概率為≤4%,表明該 2 個(gè)樣本來(lái)自于同一個(gè)總體的可能性≤4%,也就是說(shuō)有≥96%的可能性這 2 個(gè)樣本所屬總體不同,由此推斷他們之間存在顯著差異。一般地,p值越小,就越有理由認(rèn)為差異越顯著,但并不是說(shuō)小概率事件就不發(fā)生。在進(jìn)行假設(shè)檢驗(yàn)和統(tǒng)計(jì)推斷時(shí),存在犯 I型錯(cuò)誤(如處理 A與處理B事實(shí)上沒(méi)有差異,但統(tǒng)計(jì)檢驗(yàn)的結(jié)果顯示處理A與處理B有顯著差異)或 II型錯(cuò)誤(如處理 A 與處理 B 事實(shí)上有差異,但統(tǒng)計(jì)檢驗(yàn)的結(jié)果顯示處理A與處理B沒(méi)有顯著差異)的概率,因此,具體標(biāo)準(zhǔn)定在 0.05 還是其他值,應(yīng)結(jié)合專業(yè)知識(shí),根據(jù)具體情況具體對(duì)待。實(shí)際上,對(duì)于某些涉及公共安全或金融方面的統(tǒng)計(jì)檢驗(yàn),我們可以把臨界值 α 定的很低,如 0.005。
方差分析在農(nóng)作物試驗(yàn)中應(yīng)用廣泛,遺憾的是,很多學(xué)者在進(jìn)行方差分析時(shí)并沒(méi)有檢查方差分析所需要的前提條件,例如,一元方差分析要求樣本是獨(dú)立的,數(shù)據(jù)為正態(tài)分布且為計(jì)量數(shù)據(jù),方差相等(齊性)等[11-13]。
目前,由于統(tǒng)計(jì)軟件的使用比較方便,一些學(xué)者往往未事先檢驗(yàn)方差分析的前提條件,直接將數(shù)據(jù)輸入計(jì)算機(jī),數(shù)秒后出來(lái)一大堆結(jié)果,但這些結(jié)果很可能是錯(cuò)誤的。
需要注意的是,方差分析對(duì)正態(tài)性的要求,是針對(duì)各處理水平的,即要求某特定處理水平所包含的所有重復(fù)的數(shù)據(jù)為正態(tài)分布,不是針對(duì)整個(gè)試驗(yàn)數(shù)據(jù)的。對(duì)于一個(gè)單因子5水平完全隨機(jī)試驗(yàn),我們需要保證所有5水平的數(shù)據(jù)均為正態(tài)分布。
如果數(shù)據(jù)不滿足方差分析的前提條件,我們應(yīng)當(dāng)進(jìn)行數(shù)據(jù)轉(zhuǎn)換。如果轉(zhuǎn)換后仍然不滿足,我們只能做非參數(shù)檢驗(yàn)了,如 Mann Whitney 檢驗(yàn)[9,13]。具體檢驗(yàn)方法筆者將在后續(xù)文章中詳細(xì)介紹。另外,要分清數(shù)據(jù)類(lèi)型。如方差分析、t檢驗(yàn)、多重比較等主要是針對(duì)計(jì)量定量資料的,計(jì)數(shù)資料和定性資料應(yīng)采用卡方檢驗(yàn)等[10,13]。對(duì)于非參數(shù)統(tǒng)計(jì),他們中的許多方法假設(shè)條件簡(jiǎn)單,不需要是正態(tài)分布??梢杂盟麄冞M(jìn)行序數(shù)、計(jì)數(shù)、比例、比率、分類(lèi)等數(shù)據(jù)類(lèi)型的統(tǒng)計(jì)分析[13]。
目前,顯著性檢驗(yàn)方法選擇不當(dāng)甚至錯(cuò)誤是首當(dāng)其沖的問(wèn)題[12],可以通過(guò)咨詢統(tǒng)計(jì)專業(yè)人員或參考相關(guān)書(shū)目來(lái)解決。
隨著統(tǒng)計(jì)軟件的推廣,人們可以非常方便地進(jìn)行回歸分析。一些學(xué)者事先不做散點(diǎn)圖,任意地將2組或多組數(shù)據(jù)輸入計(jì)算機(jī),立即獲得回歸方程和各種參數(shù),有的甚至連p 值是否小于 0.05 都不檢查,只要決定系數(shù)超過(guò) 0.5,就認(rèn)為回歸方程合理。實(shí)際上,如果考察散點(diǎn)圖,就會(huì)發(fā)現(xiàn)某些情況下自變量和因變量之間的關(guān)系并不明顯,或者并不是我們所想象的直線關(guān)系,有的甚至呈一圓盤(pán)狀。此時(shí),我們不能為了早出成績(jī)、多出成績(jī),勉強(qiáng)湊合建立這種回歸模型。許多毫無(wú)聯(lián)系的數(shù)據(jù),通過(guò)計(jì)算機(jī)運(yùn)行后,計(jì)算機(jī)都會(huì)擬合某種方程,尤其是數(shù)據(jù)量大的情況,但此并不代表他們之間有真正的統(tǒng)計(jì)學(xué)或?qū)I(yè)意義。
建立回歸模型時(shí),首先要考察變量間是否真正存在專業(yè)意義上的關(guān)系,然后繪制散點(diǎn)圖,如果各散點(diǎn)圖呈圓盤(pán)狀時(shí),說(shuō)明2變量無(wú)關(guān),不必進(jìn)行回歸分析[14]。如果變量間相關(guān),應(yīng)根據(jù)變量的數(shù)據(jù)特征和分布,采用不同的建模方法[15]。例如,只有當(dāng)因變量為連續(xù)性定量變量、方差相等、相互獨(dú)立、且為正態(tài)分布時(shí),我們方能進(jìn)行簡(jiǎn)單線性回歸或多元回歸分析[13];如果上述條件滿足,但自變量之間存在多重共線性時(shí),我們可以進(jìn)行主成分回歸或嶺回歸分析[13]。如果因變量為二值或多值名義變量、多值有序變量,我們可以進(jìn)行多重 logistic 回歸分析或 Probit 回歸分析[13,15]。如果因變量為計(jì)數(shù)資料,我們可以進(jìn)行 Probit 回歸或 Poisson 回歸。一些學(xué)者往往不顧數(shù)據(jù)特征,盲目進(jìn)行回歸是不妥的。
在多元回歸分析中,很多學(xué)者使用逐步回歸方法來(lái)選擇自變量,但國(guó)外有學(xué)者[16]主張?jiān)谌魏螘r(shí)候都不要使用該方法,主要是因?yàn)樵S多情況下自變量并不相互獨(dú)立,存在多重共線性現(xiàn)象,使用逐步回歸方法所得到的模型只對(duì)本套數(shù)據(jù)有效,如果將所得模型運(yùn)用到新數(shù)據(jù)進(jìn)行預(yù)測(cè)時(shí)往往失敗。SAS,SPSS 等軟件已經(jīng)開(kāi)發(fā)了新的模塊來(lái)避免此問(wèn)題,如在 GLMSELECT 程序里,可以使用 LASSO 或LAR 等方法進(jìn)行自變量的篩選[13]。
對(duì)于重復(fù)測(cè)量所得的同一個(gè)自變量或因變量數(shù)據(jù),進(jìn)行回歸時(shí),我們往往取平均值進(jìn)行建模,這樣就人為地降低了試驗(yàn)誤差,更可惜的是損失了大量有用的信息。此時(shí)應(yīng)該按具有重復(fù)測(cè)量數(shù)據(jù)的回歸方法進(jìn)行分析[13-14]。
對(duì)于異常值,一些學(xué)者在進(jìn)行回歸分析時(shí),往往不仔細(xì)觀察和分析散點(diǎn)圖,通過(guò)計(jì)算機(jī)直接運(yùn)行程序,造成所得模型基本上由某一個(gè)異常值所控制的現(xiàn)象,這種回歸模型肯定是沒(méi)有任何意義的。當(dāng)然,我們不能隨便舍棄可能的異常值,要結(jié)合專業(yè)知識(shí)和通過(guò)統(tǒng)計(jì)手段,進(jìn)行綜合判斷。遇到此種情況時(shí),建議使用 SAS 的 ROBUSTREG 程序或其他軟件的相應(yīng)程序進(jìn)行處理[13]。
對(duì)于具有層次結(jié)構(gòu)特征的數(shù)據(jù)的處理[17-19],也應(yīng)該引起重視。例如,在我國(guó),由于氣候、人文(如飲食習(xí)慣、口味偏好)等條件存在地域差異,不同地域的煙民對(duì)同一卷煙的感覺(jué)不同,因此,我們研究感官質(zhì)量時(shí),宜建立二水平模型[19]。在過(guò)去,由于受統(tǒng)計(jì)手段的限制,人們常常對(duì)多水平數(shù)據(jù)進(jìn)行不適當(dāng)?shù)睾?jiǎn)化處理,僅當(dāng)成單層數(shù)據(jù)進(jìn)行分析。歐美國(guó)家上世紀(jì) 80 年代中后期發(fā)展起來(lái)的多水平模型分析技術(shù),可有效處理傳統(tǒng)多元統(tǒng)計(jì)方法難以分析的問(wèn)題[17-18]。
農(nóng)作物常常需要進(jìn)行多點(diǎn)或多年試驗(yàn),對(duì)某些觀察值進(jìn)行重復(fù)測(cè)量記載。在分析此類(lèi)數(shù)據(jù)時(shí),有些學(xué)者只是按各地點(diǎn)或年份進(jìn)行單獨(dú)分析,或者取平均數(shù)進(jìn)行分析,如按完全隨機(jī)或隨機(jī)區(qū)組等設(shè)計(jì)進(jìn)行統(tǒng)計(jì)分析,也有的學(xué)者把地點(diǎn)或時(shí)間當(dāng)成一個(gè)因子,按照裂區(qū)設(shè)計(jì)進(jìn)行統(tǒng)計(jì)分析,這些都是不可取的。
多年或多點(diǎn)試驗(yàn)數(shù)據(jù)之間有可能存在相關(guān)性,SAS、SPSS、Stata 等統(tǒng)計(jì)軟件有專門(mén)的程序和統(tǒng)計(jì)方法對(duì)此進(jìn)行統(tǒng)計(jì)分析[13],如 SAS 的混合模型[12]。如果這些數(shù)據(jù)在空間或時(shí)間上相互獨(dú)立,我們可以采用一些參數(shù)或非參數(shù)的統(tǒng)計(jì)分析方法對(duì)其進(jìn)行分析;如果數(shù)據(jù)在空間或時(shí)間上相關(guān),可以采用區(qū)域化變量分析[20](regionalized variable analysis)和時(shí)間序列分析方法進(jìn)行分析。具體分析方法筆者將在后續(xù)文章里詳細(xì)闡述。
對(duì)于重復(fù)測(cè)量數(shù)據(jù),我們面臨簇內(nèi)協(xié)方差矩陣的問(wèn)題。通常利用 SAS 或 SPSS 的 GLM 模塊進(jìn)行處理,檢查球?qū)ΨQ性條件,如果需要,調(diào)整誤差自由度并對(duì)重復(fù)測(cè)量因子進(jìn)行統(tǒng)計(jì)檢驗(yàn)。這在以前是標(biāo)準(zhǔn)做法。最近,SAS等軟件為我們提供了更好的統(tǒng)計(jì)方法,通過(guò)使用混合模型分析協(xié)方差結(jié)構(gòu),進(jìn)而選取最佳模型。對(duì)于連續(xù)型變量,我們可以利用SAS 的 MIXED,NLMIXED 和 GLIMMIX 程序進(jìn)行分析;對(duì)于離散數(shù)據(jù),可以采用 GENMOD,NLMIXED 和 GLIMMIX 程序進(jìn)行分析[13]。
統(tǒng)計(jì)表達(dá)最常見(jiàn)的錯(cuò)誤之一是將統(tǒng)計(jì)顯著性與專業(yè)術(shù)語(yǔ)上的差異程度混為一談。一些學(xué)者認(rèn)為,統(tǒng)計(jì)分析所得p值越小,差異就越大,此完全是錯(cuò)誤的。p值僅表示統(tǒng)計(jì)意義的大小,并不表示數(shù)據(jù)間的差異大小。數(shù)據(jù)達(dá) 5%顯著差異,如,所得 p 值≤0.03,此表示從概率的角度講,有≥97%的可能性此2組數(shù)據(jù)確實(shí)不是來(lái)自于同一個(gè)總體,有差異,但有≤3%的可能性他們來(lái)自同一總體,沒(méi)有差異。如果所得 p 值≤0.003(達(dá) 1%極顯著水準(zhǔn)),表示有≥99.7%的可能性此 2 組數(shù)據(jù)不是來(lái)自于同一個(gè)總體,有差異,但有≤0.3%的可能性他們來(lái)自同一總體,沒(méi)有差異。此與2組數(shù)據(jù)究竟差異多大沒(méi)有一點(diǎn)關(guān)系!為了避免歧義,建議用“差異有極顯著意義”、“差異有顯著意義”代替“差異極顯著”、“差異顯著”等說(shuō)法。最近也有學(xué)者建議將“顯著意義”(significant)改為“非偶然的”更貼切[21]。
對(duì)于計(jì)量資料,多數(shù)學(xué)者一概用算術(shù)平均數(shù)來(lái)衡量數(shù)據(jù)的平均水平。其實(shí),只有當(dāng)數(shù)據(jù)為正態(tài)或?qū)ΨQ分布時(shí),才宜用算術(shù)平均數(shù);如果數(shù)據(jù)呈偏態(tài)分布,用中位數(shù)更合適[10]。如果描述離散趨勢(shì)應(yīng)用四分位數(shù)間距等[7]。
很多學(xué)者用“平均數(shù)±標(biāo)準(zhǔn)差”來(lái)表示試驗(yàn)結(jié)果,殊不知這種表示主要用來(lái)表達(dá)呈正態(tài)分布的資料,說(shuō)明其數(shù)據(jù)分布的集中和離散趨勢(shì)。如果數(shù)據(jù)本身呈偏態(tài)分布,此就不能表示其數(shù)據(jù)分布的集中和離散趨勢(shì)了。有的學(xué)者將標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤混淆,用“平均數(shù)±標(biāo)準(zhǔn)誤”來(lái)表示數(shù)據(jù)分布的集中和離散趨勢(shì)是不妥的,因?yàn)椤捌骄鶖?shù)±標(biāo)準(zhǔn)誤”反映的是樣本均值與總體均值的接近程度。
在科技論文和試驗(yàn)報(bào)告中,許多作者對(duì)所使用的方法和過(guò)程的描述過(guò)于簡(jiǎn)單,對(duì)所采用的試驗(yàn)設(shè)計(jì)類(lèi)型(如完全隨機(jī)、隨機(jī)區(qū)組、裂區(qū)、全因子設(shè)計(jì)等)[22],重復(fù)次數(shù),所使用的具體統(tǒng)計(jì)方法,假設(shè)檢驗(yàn)所使用的檢驗(yàn)水準(zhǔn)等,都沒(méi)有交代清楚[10]。尤其是室內(nèi)試驗(yàn),往往缺乏對(duì)試驗(yàn)單元排列方式的描述。對(duì)于復(fù)雜的統(tǒng)計(jì)模型,也未對(duì)變量進(jìn)行定義或過(guò)程進(jìn)行說(shuō)明,只是籠統(tǒng)地提及用何種軟件進(jìn)行統(tǒng)計(jì)分析,讓讀者無(wú)法判斷結(jié)果的正確性[9]。
在統(tǒng)計(jì)圖上添加誤差線(Error Bar)得到了廣泛的運(yùn)用,誤差線的長(zhǎng)度表示標(biāo)準(zhǔn)差的大小,說(shuō)明其數(shù)據(jù)分布的集中和離散趨勢(shì)。然而,如前所屬,此種表示必須以數(shù)據(jù)為正態(tài)分布為前提,否則不妥。另外,如果原始數(shù)據(jù)存在成簇(clustered)現(xiàn)象,如重復(fù)測(cè)量數(shù)據(jù),所計(jì)算得到的誤差線會(huì)長(zhǎng)一些,會(huì)引起誤解。
對(duì)于廣大科技工作者來(lái)說(shuō),要全面、正確地掌握統(tǒng)計(jì)學(xué),并合理運(yùn)用到作物類(lèi)科研中,是一項(xiàng)極富挑戰(zhàn)性的任務(wù)。我們不可能掌握所有的統(tǒng)計(jì)學(xué)知識(shí),但要充分認(rèn)識(shí)統(tǒng)計(jì)學(xué)在科研中的重要地位和作用,在統(tǒng)計(jì)專業(yè)人員的協(xié)助下,盡量減少試驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析方面的錯(cuò)誤。筆者在此對(duì)農(nóng)作物試驗(yàn)中常常出現(xiàn)的問(wèn)題進(jìn)行了概述,在后續(xù)文章中,將針對(duì)這些問(wèn)題進(jìn)行更為詳細(xì)的說(shuō)明,并探討確實(shí)可行的解決辦法。
[1]蔣文. 臨床研究結(jié)果面臨時(shí)間的考驗(yàn)[J]. 中國(guó)醫(yī)學(xué)論壇報(bào),2005,31(27):1.
[2]Ioannidis J P A. Why Most Published Research Findings Are False [J]. PLoS Medicine, 2005, 2(8): e124.
[3]張亙稼. 略論科技期刊論文中統(tǒng)計(jì)方法的誤用[J]. 中國(guó)科技期刊研究,2012(3):413-415.
[4]胡良平. 科研設(shè)計(jì)與統(tǒng)計(jì)分析:怎么強(qiáng)調(diào)都不過(guò)分[J].科技導(dǎo)報(bào),2008,26(18):99
[5]胡良平. 在醫(yī)學(xué)科研和醫(yī)學(xué)寫(xiě)作中如何正確運(yùn)用統(tǒng)計(jì)學(xué)[J]. 中國(guó)骨腫瘤骨病,2002,1(3):157-159.
[6]劉起業(yè),劉洪祥,劉中慶,等. 烤煙新品種魯煙 2 號(hào)的選育及其主要特征特性[J]. 中國(guó)煙草科學(xué),2014,35(1):1-6.
[7]蘇虹,朱啟星. 科研資料統(tǒng)計(jì)分析的常見(jiàn)問(wèn)題[J]. 安徽預(yù)防醫(yī)學(xué)雜志,2004(2):126-129.
[8]閆伸,符云鵬,景沙沙,等. 豫中煙區(qū)烤煙移栽期和成熟度與質(zhì)體色素及降解產(chǎn)物的關(guān)系[J]. 中國(guó)煙草科學(xué),2014,35(2):43-48.
[9]張建軍. 科技論文中 的 統(tǒng) 計(jì)問(wèn)題[J]. 中國(guó)比較醫(yī)學(xué)雜志,2008(11):77-79.
[10]韓維棟,黨少農(nóng). 科技論文中常見(jiàn)的統(tǒng)計(jì)學(xué)問(wèn)題及解決意見(jiàn)[J]. 中國(guó)編輯,2009(5):47-49.
[11]高輝,胡良平,金松華,等. 常見(jiàn)試驗(yàn)設(shè)計(jì)定量資料統(tǒng)計(jì)分析錯(cuò)誤辨析[J]. 中西醫(yī)結(jié)合學(xué)報(bào),2008,69(9):979-982.
[12]王書(shū)亞,譚穎波,王云亭. 醫(yī)學(xué)科研論文中實(shí)驗(yàn)設(shè)計(jì)和統(tǒng)計(jì)分析內(nèi)容的正確表述[J]. 中國(guó)科技期刊研究,2005(1):116-118.
[13]SAS Institute. SAS 技 術(shù)支 持[EB/OL]. [2014-11-20]. http://support.sas.com/techsup/.
[14]胡良平. 醫(yī)學(xué)科研與新藥評(píng)價(jià)等工作中一個(gè)不可忽視的問(wèn)題—輕視和誤用統(tǒng)計(jì)學(xué)[J]. 軍事醫(yī)學(xué)科學(xué)院院刊,1996,20(3):202-205.
[15]UCLA Statistical, Consulting-Group. What statistical analysis should I use?[EB/OL]. [2014-11-20]. www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm.
[16]Thompson B. Stepwise regression and stepwise discriminant analysis need not apply here: A guidelines editorial[J]. Educational and Psychological Measurement, 1995, (55): 525-534.
[17]吳曉云,曾慶,周燕榮. 多水平模型的最新進(jìn)展[J]. 數(shù)理醫(yī)藥學(xué)雜志,2003,16(2):152-154.
[18]李佳萌. 多水平模型及其在衛(wèi)生領(lǐng)域的應(yīng)用[J]. 中國(guó)慢性病預(yù)防與控制,2007(5):514-515.
[19]楊建云,張?zhí)鞐?,朱東來(lái),等. 多水平模型在區(qū)域環(huán)境卷煙感官質(zhì)量評(píng)價(jià)中的應(yīng)用[J]. 西南農(nóng)業(yè)學(xué)報(bào),2013(6):2514-2521.
[20]Virk D S, Witcombe J R. Evaluating cultivars in unbalanced on-farm participatory trials[J]. Field Crops Research, 2008, 106(2): 105-15.
[21]楊錦忠,宋希云. 單一響應(yīng)變量統(tǒng)計(jì)分析在煙草學(xué)研究中應(yīng)用的若干問(wèn)題[J]. 中國(guó)煙草學(xué)報(bào),2014(4):108-114.
[22]楊錦忠,宋希云. 煙草學(xué)術(shù)論文的統(tǒng)計(jì)學(xué)表達(dá)與展示[J].中國(guó)煙草學(xué)報(bào),2013(4):114-118.
Seven Problematic Areas of Design and Statistical Analysis in Crop Experiments
ZHANG Jiuquan1,2,3, SU Yirong2, HUANG Yilan3,4, ZHANG Ying3,4
(1. Tobacco Research Institute, Chinese Academy of Agricultural Science, Qingdao, 266101, China; 2. Institute of Subtropical Agriculture, Chinese Academy of Sciences, Changsha 410125, China; 3. University of Chinese Academy of Sciences, Beijing 100049, China; 4. Sanming Tobacco Company of Fujian Province, Sanming, Fujian 365000, China)
Correctness of experimental design and reasonability of statistical analysis influence the correctness of the results when conducting scientific experiments. Currently, statistical issues in crop study have caused much negative influence to scientific and technological innovation in China. We describe the problematic areas which occurred frequently when conducting crop experiments, which includes ignoring experiment design and statistical analysis, lack of study planning, placing importance on study results only when p values are less than .05, indiscriminant application of regression and analysis of variance, issue with repeated measurement data, and improper statistical expression, and suggest some resolutions to some of the problems, so that the related researchers can improve their research ability, make better use of statistics, and increase the efficiency of scientific and technological innovation.
experimental design; statistical analysis; problem; crop
S572
1007-5119(2014)06-0098-06
10.13496/j.issn.1007-5119.2014.06.020
中國(guó)煙草總公司面上項(xiàng)目“土地整理后土壤養(yǎng)分變化與修復(fù)及烤煙變量施肥技術(shù)研究”(2013-149)
張久權(quán),男,副研究員,主要從事煙草信息和栽培方面的研究。E-mail:zhangjiuquan@caas.cn
2014-08-10