楊小勇
雙因素?zé)o重復(fù)的方差分析法
楊小勇
(廣東石油化工學(xué)院 化學(xué)與生命科學(xué)學(xué)院,廣東 茂名 525000)
淺析了方差分析法的基本原理和方差分析的意義。方差分析就是將總的方差分解為各個(gè)方差的成分,再利用顯著性檢驗(yàn)法進(jìn)行分析判斷和做出適當(dāng)?shù)慕Y(jié)論。通過例題詳細(xì)地講解、介紹了雙因素的方差分析法,回答了學(xué)生在學(xué)習(xí)中經(jīng)常提出的有關(guān)問題。
方差;方差分析法;雙因素;無重復(fù);判斷
在實(shí)驗(yàn)教學(xué)過程中,常有學(xué)生問到這樣的問題:若干個(gè)實(shí)驗(yàn)者利用若干種不同的分析方法測(cè)定某種試樣的成分或每一參數(shù),每一種分析方法都重復(fù)測(cè)定幾次,如何判斷分析方法之間和分析者之間對(duì)測(cè)定結(jié)果有無顯著差異,哪一個(gè)平均值準(zhǔn)確可靠。若要回答學(xué)生這些問題,則需運(yùn)用方差分析法的有關(guān)知識(shí)。
在科學(xué)研究中,為了探索某一項(xiàng)分析任務(wù)的可靠性和影響因素,需要進(jìn)行大量的實(shí)驗(yàn)[1]。例如,取幾批試樣分別送到幾個(gè)相關(guān)的實(shí)驗(yàn)室用不同的方法進(jìn)行實(shí)驗(yàn),每一方法的測(cè)定又重復(fù)若干次,這樣就得到大量數(shù)據(jù)。根據(jù)得到的這些數(shù)據(jù),用什么方法可以判斷哪一個(gè)因素對(duì)測(cè)定結(jié)果影響最大?哪一個(gè)因素影響不大?常用的方差分析法就是一種處理和判斷數(shù)據(jù)的手段[2]。下面結(jié)合實(shí)例簡單淺析方差分析法有關(guān)知識(shí)。
在數(shù)理統(tǒng)計(jì)中常用標(biāo)準(zhǔn)偏差表示精密度,標(biāo)準(zhǔn)偏差(簡稱“標(biāo)準(zhǔn)差”)或稱均方誤差,用σ代表,表達(dá)式為:
式(1)是應(yīng)用于大量數(shù)據(jù)的條件下(一般有30次以上測(cè)定),這時(shí),測(cè)定的平均值接近于真值,用μ表示;根式的分子代表各次測(cè)定數(shù)據(jù)的偏差的平方和,N是測(cè)定次數(shù)。方差代表各偏差平方和的平均值,用σ2表示。我們知道,只有當(dāng)測(cè)定次數(shù)為無限多或者至少有30次以上時(shí),所得的平均值稱真值。但是,通常測(cè)定次數(shù)總是有限的,這樣,所得的平均值并不是真值,這時(shí),如果按式(1)計(jì)算標(biāo)準(zhǔn)偏差就不合理。
測(cè)定平均值與真值不相等,測(cè)定值與平均值之差同測(cè)定值與真值之差不相等。要表示有限測(cè)定次數(shù)的精密度,采用符號(hào)S代替σ,有限測(cè)定次數(shù)標(biāo)準(zhǔn)偏差的計(jì)算公式為:
與式(1)比較,用試樣平均值x代替了真值μ,用N-1代替N。N-1在數(shù)理統(tǒng)計(jì)中稱之為“自由度”,它說明在N次測(cè)定中,只有N-1個(gè)可變的偏差。自由度也可理解為:數(shù)據(jù)中可供對(duì)比的數(shù)目。例如,兩次測(cè)定a和b,只有一個(gè)a與b之間的比較,若三次測(cè)定,可有兩種比較(即其中任何兩個(gè)數(shù)據(jù)之間及這兩個(gè)數(shù)據(jù)的平均值與第三個(gè)數(shù)據(jù)之間比較),類推下來,N次測(cè)定只有N-1個(gè)可供對(duì)比。如果有幾個(gè)互相獨(dú)立的因素同時(shí)影響測(cè)定結(jié)果,設(shè)不同來源的方差分別為按方差的加和法則,總的方差σ2應(yīng)為各個(gè)方差之和:
方差分析就是將總的方差分解為各個(gè)方差的成分,再利用顯著性檢驗(yàn)法進(jìn)行分析判斷和做出適當(dāng)?shù)慕Y(jié)論[4]。方差分析有:(1)單因素的方差分析;(2)無重復(fù)雙因素的方差分析;(3)具有重復(fù)(等重復(fù)、不等重復(fù))雙因素的方差分析;(4)三因素的方差分析。
在無重復(fù)雙因素的方差分析方法中有兩個(gè)變動(dòng)因素。設(shè)雙因素試驗(yàn)中的兩個(gè)變動(dòng)因素為A和B,因素A有a個(gè)不同水平:A1,A2,…,Aa;因素B有b個(gè)不同水平:B1,B2,…,Bb,則因素A與因素B之間共有ab種不同的水平組合方式。對(duì)于兩個(gè)因素的所有不同水平組合方式均進(jìn)行試驗(yàn),稱為雙因素全面試驗(yàn)。在每一種試驗(yàn)條件下均進(jìn)行一次試驗(yàn)(r=1),稱為雙因素全面無重復(fù)試驗(yàn),簡稱雙因素?zé)o重復(fù)試驗(yàn)。
本文討論雙因素?zé)o重復(fù)方差分析,即幾個(gè)分析(實(shí)驗(yàn))者使用幾種不同的方法去測(cè)定某種試樣的成分(或某一參數(shù)),每一種方法都重復(fù)測(cè)定幾次,把分析者和分析方法同時(shí)作為影響分析結(jié)果的因素來考慮,同時(shí)判斷分析者之間和分析方法之間有無顯著差異。
如果影響測(cè)定結(jié)果的因素不止一個(gè)而是兩個(gè),那么總的平方和應(yīng)包括兩種因素所引入的平方和及實(shí)驗(yàn)誤差δ0的平方和:
和單因素的方差分析方法一樣,把平方和分解并計(jì)算平均平方,利用F檢驗(yàn)[6]就能作出判斷。
例題:20.0℃,常壓下,利用靜力學(xué)原理,用四種不同方法測(cè)定0.005 c/(mol·L-1)正丁醇的液體表面張力,每種方法由五名不同實(shí)驗(yàn)者測(cè)定5次,所得數(shù)據(jù)見表1[8]。把分析方法和分析者同時(shí)作為影響分析結(jié)果的因素來考慮,同時(shí)判斷分析方法之間和分析者之間對(duì)測(cè)定結(jié)果有無顯著差異。
表1 測(cè)定數(shù)據(jù) σ/10-3N·m-1
解:為了簡化計(jì)算過程,將原數(shù)據(jù)減出71.31,表1數(shù)據(jù)轉(zhuǎn)化為表2的數(shù)據(jù)。
表2 測(cè)定數(shù)據(jù) σ/10-3N·m-1
假如兩個(gè)因素的影響是相互獨(dú)立的,實(shí)驗(yàn)分析者這個(gè)因素自然影響每一種的總計(jì)值,但這應(yīng)該是一個(gè)恒定的系統(tǒng)誤差。方差分析的目的就是要檢定判斷出兩個(gè)因素各自的影響,即求得實(shí)驗(yàn)分析方法之間及實(shí)驗(yàn)分析者之間的平均平方。方差分析見表3。
表3 方差分析表
3.1 計(jì)算步驟
計(jì)算步驟如下:
1)求校正因子CF
2)計(jì)算總S
3)方法間的S
4)實(shí)驗(yàn)者間的S
5)殘差
6)自由度(d.f,方法間)=k-1=4-1=3
7)自由度(d.f,實(shí)驗(yàn)者間)=k-1=5-1=4
8)自由度(d.f,誤差平方和)=自由度(d.f)方法間×自由度(d.f)實(shí)驗(yàn)間=3×4=12
3.2 檢驗(yàn)
1)方法間
查F表得
2)實(shí)驗(yàn)者間
查F表得
由F檢驗(yàn)的臨界值
同時(shí)成立,判斷實(shí)驗(yàn)者之間影響不顯著,說明實(shí)驗(yàn)者之間不存在顯著差異,可以判斷每一個(gè)(實(shí)驗(yàn)者)平均值基本準(zhǔn)確可靠。至此,雙因素?zé)o重復(fù)的方差分析完畢。
在上述的例題中,每一方法和每一分析者均只進(jìn)行過一次測(cè)定,不能反映出測(cè)定本身的誤差。按上述計(jì)算所得的殘差可能同時(shí)包含有真正偶然誤差和交互效應(yīng),用這樣的簡單雙因素方差分析不可能把真正偶然誤差與交互效應(yīng)區(qū)別開來。因此,在顯著性檢驗(yàn)中,把殘差作為實(shí)驗(yàn)偶然誤差的估量值來計(jì)算,是不夠合理的。若要改善這點(diǎn),可使用具有重復(fù)(等重復(fù)、不等重復(fù))雙因素的方差分析法,使兩因素的交互效應(yīng)可以容易地從試驗(yàn)誤差中分離出來,即測(cè)定出交互效應(yīng)的顯著與否。
[1]任弘,章潮暉,王利群,等.運(yùn)用方差分析法估價(jià)測(cè)量可靠性的探討[J].北京體育大學(xué)學(xué)報(bào),2004,27(3):359-360.
[2]東北師范大學(xué).物理化學(xué)實(shí)驗(yàn)[M].2版.北京:高等教育出版社,1989:20.
[3]宋清.定量分析中的誤差和數(shù)據(jù)評(píng)價(jià)[M].北京:人民教育出版社,1982:14-15.
[4]郭太安.方差分析法的簡易算法[J].數(shù)理統(tǒng)計(jì)與管理,1987(6):36.
[5]辛益軍.方差分析與實(shí)驗(yàn)設(shè)計(jì)[M].北京:中國財(cái)政經(jīng)濟(jì)出版社,2001:72-68.
[6]東北師范大學(xué).物理化學(xué)實(shí)驗(yàn)[M].2版.北京:高等教育出版社,1989:21.
[7]宋清.定量分析中的誤差和數(shù)據(jù)評(píng)價(jià)[M].北京:人民教育出版社,1982:110-112.
[8]楊小勇.方差分析法淺析——單因素的方差分析[J].實(shí)驗(yàn)科學(xué)與技術(shù),2013,11(1):42.
Discussion of Variance Analysis:Double Factors-no Repeated Variance Analysis
YANG Xiaoyong
(College of Chemistry and Life Science,Guangdong University of Petrochemical Technology,Maoming 525000,China)
The basic principle and the significance of variance analysismethod are discussed.Variance analysis is defined as that total variance,which is first decomposed into each variance component.Then,analysis,judgment,and appropriate conclusion are made through the use of significance testmethod.Double factor variance analysismethod is introduced and explained Through the examples,and questions raised by students are answered,such as how to judge the plurality in testing the components of a sample using several differentmethods by different investors and why every kind of analyticalmethod are repeated several times,and how to judge if there is significant difference in results between different analysismethods and investors.
variance;variance analysis;double factors;no repeat;judgment
O212.1
A
10.3969/j.issn.1672-4550.2014.05.012
2013-05-31;修改日期:2013-07-02
楊小勇(1959-),男,大學(xué)本科,高級(jí)實(shí)驗(yàn)師,主要從事物理化學(xué)實(shí)驗(yàn)教學(xué)工作。