邵建新
(石河子大學(xué) 師范學(xué)院,新疆 石河子 832003)
在測量誤差、測量不確定度及數(shù)據(jù)處理的文獻中,都無一例外地會給出Bessel公式。但仔細研究會發(fā)現(xiàn)如下問題:一是有關(guān)量(參數(shù))的符號表示混亂,使得本就公理化體系不夠嚴密的誤差理論或不確定度理論從源頭上產(chǎn)生迷霧;二是Bessel公式數(shù)學(xué)表述不統(tǒng)一;三是經(jīng)典的證明方法或多或少存在一些不足;四是公式的適用范圍眾說不一。筆者認為產(chǎn)生這些問題的根本原因是由于對核心概念—標準偏差的定義和意義沒有完全認清的緣故。本文先將有關(guān)量(參數(shù))的符號表示統(tǒng)一起來,然后分析討論兩類經(jīng)典證明方法存在的不足,在給出各種標準偏差的定義且闡明其意義的基礎(chǔ)上,對經(jīng)典證法進行改進,并提出一種新的Bessel公式的證明方法,最后討論Bessel公式的適用范圍,這對完整準確地理解和應(yīng)用Bessel公式具有很好的指導(dǎo)意義。
為了分析、研究、解決問題方便,有關(guān)量的符號表示應(yīng)當(dāng)兼顧理論研究與實際應(yīng)用的需要。建議符號表示采用下述規(guī)定:大寫英文字母表示隨機變量總體,小寫英文字母表示隨機變量可能的取值。如X、Y等表示隨機變量總體,x、y(可帶有下標如xi、yi)表示隨機變量可能的取值表示隨機變量總體的均值,“”表示隨機變量總體均值的取值。樣本測得值(又稱觀測值、觀察值)也用小寫英文字母表示。
在參數(shù)估計中,除了用大寫的希臘字母表示統(tǒng)計量外,也常用小寫的希臘字母表示統(tǒng)計量如θ、μ等。有時,這種情況下其估計量用表示,其估計值用表示。
上述規(guī)定的核心可以概括為:大寫字母表示“量”,小寫字母表示“值”。
由于相關(guān)量(參數(shù))的符號表示混亂及對各種標準偏差的意義認識不清等原因,造成Bessel公式的數(shù)學(xué)表達式有多種形式,并由此帶來不必要的麻煩。
文獻[1-6]給出的Bessel公式的證法可作為第一類經(jīng)典證法的代表。這類證法對概率論和數(shù)理統(tǒng)計的知識要求較高。為避開概率論與數(shù)理統(tǒng)計知識的束縛,文獻[7-10]給出的Bessel公式的證法可作為第二類經(jīng)典證法的代表。其突出特征是利用下面的等式
(δi=xi-μ 稱為測得值 xi的誤差,稱為算術(shù)平均值的誤差,μ為被測量的真值)
為了得出等式
證明Bessel公式,需要利用當(dāng)n充分大時,有
成立。文獻[7-10]對式(3)的證明只是簡單的一筆帶過,認為當(dāng)n充分大時,式(3)一定成立,理由是δi很小,隨機誤差滿足正態(tài)分布。
文獻[11]給出的證法可作為第三類經(jīng)典證法的代表,其突出特征是將誤差看作隨機變量,并假定隨機誤差服從正態(tài)分布。
文獻[12-15]對第二類證法提出了質(zhì)疑,認為當(dāng)n充分大時式(3)并不成立。理由是當(dāng)式(3)成立時,由式(1)一定可以得到:
在第二類證法中,當(dāng)n充分大時,式(3)及式(4)都是成立的。因為誤差理論中是將隨機誤差看作無窮小量處理的,而兩個無窮小量的乘積是無窮小量,有限個無窮小量的和仍然是無窮小量。若δi是無窮小量,則是δi的高階無窮小量。
至于第三類證法,假定測量數(shù)據(jù)服從正態(tài)分布也是不合理的,因為Bessel公式的成立并不需要正態(tài)分布這一條件。
為了便于分析論證,有必要先給出各種標準偏差的定義,并闡明其意義。我們的方法是:先建立理想模型(數(shù)學(xué)模型),其次考慮測量實際,然后建立理想模型與實際測量之間的邏輯聯(lián)系。
3.1.1 總體標準偏差的定義
在計量學(xué)中,總體是指對被測量X在測量重復(fù)性條件下或復(fù)現(xiàn)性條件下無限多次測得值的集合:
這是一個無窮集合。其數(shù)據(jù)的分散性用標準偏差(簡稱標準差)σ來描述,定義成:
眾所周知,方差σ2反映了測得值的分散程度,但由于方差的量綱是被測量的平方,使用起來不直觀,也不方便,因此引入標準偏差(簡稱標準差)σ這個量。
3.1.2 總體標準偏差σ的意義
(1)σ是總體內(nèi)所有的無窮多個測得值與真值之差的方和均值的正平方根(又說成是總體方差的正平方根,物理學(xué)上稱之為方均根值),它是從總體上描述各測得值xi相對于被測量真值μ的平均分散程度的一個參數(shù)。因而σ稱為總體的標準偏差。σ值小,表明平均來講測得值相對于被測量真值μ比較集中;σ值大,表明平均來講測得值相對于被測量真值μ比較分散。
(2)σ僅具有理論意義。σ的表達式中含有被測量的真值μ,而真值通常是不能確知的;而且測量次數(shù)n也不可能是無窮多次,因此σ是一個不能確知的參數(shù)(即便是某些個別情況下知道真值,或采用約定真值,也不能確知,因為測量次數(shù)不可能做到無窮多次)。
(3)σ的實質(zhì)是針對真值可以確知且測量次數(shù)可以為無窮多次的理想情況下,反映各測得值相對于被測量真值μ的平均分散程度分散的一個特征參數(shù)。既然σ表征的是平均分散程度,那就意味著測得值集合即總體內(nèi)任何一個單次測得值xi的分散性都是σ。故又稱σ是單次測得值xi的測量標準偏差,所以有時也將σ寫作σ(xi)。但需要特別注意的是,將σ稱作單次測得值xi的標準偏差,容易造成僅有xi時,仍有σ(xi)的錯誤認識。實際上,這里談到的σ(xi)是基于式(5)中的所有測得值,離開了除xi的其它測得值,談σ(xi)就沒有意義了。
3.2.1 實驗標準偏差的定義
由于任何實際的測量,重復(fù)測量的次數(shù)n總是有限的,因此式(6)給出的是個理想模型,實際中無法求出σ。設(shè)在重復(fù)性或復(fù)現(xiàn)性條件下,對被測量進行有限的n次獨立重復(fù)觀測,獲得測得值集合:
顯然,式(8)是個有限集合。如果測量僅僅存在隨機性誤差,則相應(yīng)的算術(shù)平均值是被測量真值μ的最佳估計值:
由于各種影響量的隨機變化或隨機效應(yīng)時空影響的不同,導(dǎo)致各次測得值xi不盡相同,也即數(shù)據(jù)存在分散性。其分散性用實驗標準偏差s(xi)(簡稱實驗標準差)來描述,定義成:
式(11)就是著名的Bessel公式。
當(dāng)然,式(8)中各測得值的分散性是個客觀存在的事實,描述其分散性的實驗標準偏差s(xi)的計算式不止Bessel公式一種。還有極差法、最大似然法、彼得斯公式法、最大誤差法、最大殘差法、最大方差法、最大類間方差法、聯(lián)合方差法、閉合差法和最小二乘法等等。但Bessel公式法最為基本、最為常用。
3.2.2 實驗標準偏差的意義
(1)s(xi)是測得值集合的標準偏差(又稱樣本標準偏差)。s(xi)反映的是式(8)這個測得值集合中所有的n個測得值相對于樣本均值(算術(shù)平均值、最佳估計值)的分散性,它是從整體上描述各測得值xi相對于的平均分散程度的一個參數(shù),因此s(xi)通常也寫成s。(s2(xi)常寫成s2)。
(2)s(xi)的實質(zhì)是表示測得值集合中各測得值相對于樣本均值(算術(shù)平均值、最佳估計值)的平均分散程度。既然是平均分散程度,那就表明測得值集合即式(8)內(nèi)任何一個單次測得值xi的分散性都是s(xi),故又稱s(xi)是單次測得值xi的實驗標準偏差。但這種說法容易造成僅有xi時,仍有s(xi)的錯誤認識。實際上,這里談到的s(xi)是基于式(8)中的n個測得值,離開了除xi的其它測得值,談s(xi)就沒有意義了。
(3)實驗標準差s(xi)是總體標準差σ(xi)的有偏估計(s2(xi)是總體方差σ2的無偏估計)。為了使估計更可靠,應(yīng)盡可能增加測量次數(shù)n。因為貝塞爾公式(11)成立的條件是n充分大。
如果被測量的估計值不隨時間發(fā)生變化,則有:
即實驗標準偏差s(xi)的期望值是σ(xi)。
(4)s(xi)是規(guī)定條件下特定測量系統(tǒng)的固有特性。在明確了被測量、測量方法、測量程序等規(guī)范化的常規(guī)測量中,s(xi)是該規(guī)定條件下的一個特定測量系統(tǒng)的固有特性,也是該特定測量系統(tǒng)的一項技術(shù)指標,即它是表征測得值之間分散性的指標。這里,測量系統(tǒng)的含義是指“將一臺或多臺測量儀器與其他器具(包括任何試劑和電源)組裝起來,適用于在特定種類的量的規(guī)定區(qū)間內(nèi)給出測得值的全套裝置”。并且,由本文提供的新證法可以看出,由式(11)計算出的實驗標準差與數(shù)據(jù)的分布規(guī)律無關(guān)。
3.3.1 為什么要引入平均值的實驗標準偏差
由上文的討論可知,s(xi)是表征在規(guī)定條件下的一個特定測量系統(tǒng)測得值分散性的參數(shù),通常并不是用來描述測得值分散性的參數(shù)(當(dāng)然,如果在眾多的測得值中取某個值xi作為測量結(jié)果這種情況除外)。因為在通常的重復(fù)測量中,我們是用多次測得值的算術(shù)平均值作為測量結(jié)果的。顯然,s(xi)無法描述的分散性,故需要引入描述算術(shù)平均值分散性的參數(shù)—平均值實驗標準偏差。
3.3.2 平均值的實驗標準偏差的定義
算術(shù)平均值是個隨機變量。如果在相同的條件下對同一被測量值作多組重復(fù)的系列測量,則每一系列測量都存在一個算術(shù)平均值由于隨機誤差的存在,各個測量列的算術(shù)平均值也不相同,它們圍繞算術(shù)平均值的數(shù)學(xué)期望值—a有一定的分散性。這種分散性可用相應(yīng)的標準偏差——平均值實驗標準差s(來描述?;贐essel公式給出實驗標準偏差的定義方法不難給出s()的定義:
設(shè)對被測量X作n組重復(fù)的系列測量,每組測量對應(yīng)的算術(shù)平均值是(i=1,2,...,n)則各構(gòu)成集合:
3.3.3 平均值實驗標準偏差的意義
由于式(15)中含有算術(shù)平均值的數(shù)學(xué)期望值,實際上難以用它求出s()。而且,對于通常的測量一般并不實施對被測量進行多組重復(fù)測量的操作(除非有特殊需要)。為此必須尋求s()另外的計算公式。
對式(9)兩邊取方差,可得:
為給出基于標準偏差意義證明Bessel公式的新方法,還需給出總體均值的標準偏差σ(*)。
3.4.1 總體均值的定義
由于誤差普遍存在,為了提高測量精度,理論上是將式(1)中的算術(shù)平均值—總體均值作為測量結(jié)果,因此總體均值(即被測量X的數(shù)學(xué)期望)定義如下:
顯然,式(17)定義的總體均值只具有理論意義,實際測量時無法實現(xiàn)。這里用*表示總體均值,是為了和測量列(樣本)的均值相區(qū)別。
3.4.2 總體均值的標準偏差的定義
參照平均值實驗標準偏差的定義方法不難給出總體均值的標準偏差的定義。
設(shè)在相同條件下對被測量作無窮多組重復(fù)的系列測量,每組測量的算術(shù)平均值是(i=1,2,...,∞)則總體均值的標準偏差為:
3.4.3 總體均值標準偏差的意義
顯然,總體均值標準偏差仍然只有理論意義。因為這里不僅涉及到真值,每個測量列中還要求測量次數(shù)無窮多,而且測量列的組數(shù)也是無窮多。
利用4.3.4中的方法不難得到下式:
Bessel公式解決用實驗標準差s去估計總體標準差σ的問題。問題是s的表達式即Bessel公式:
如何得到?
上述思路是正確的。下面就按照這種思路對Bessel公式第二類證法進行改進。
第一步,引入測得值誤差、殘余誤差、算術(shù)平均值誤差的概念。
定義:
稱為測得值xi與真值μ的誤差(不可測量)。
稱為測得值xi與算術(shù)平均值的殘余誤差(簡稱殘差)。
并定義測量列的算術(shù)平均值的誤差(不可測量)為:
第二步,用殘差vi和算術(shù)平均值的誤差改造誤差δi,尋找的替代式。
式(23)、(24)、(25)結(jié)合可得:
由式(26)可得:
因殘差之和必為零,即有:
式(28)代入式(27)可得:
由式(26)、(28)可得:
當(dāng)n充分大時,可以認為式(3)成立,理由如2.3中所述。式(3)代入式(30)可得式(2),式(2)代入式(29)可得:
解上式可得
第四步,用充分大的n替代極限運算,得到Bessel公式。
式(31)代入式(6)可得:
當(dāng)n充分大時,可得到σ的估計值σ^的表達式,即Bessel公式:
從上述討論可知,Bessel公式第二類證法及改進的證法中,仍然需要用到式(3)。而證明式(3)成立需要加限制條件:δi為無窮小量且對稱分布。表面上看式(3)是關(guān)鍵,而實際上最關(guān)鍵的是式(2),式(3)只是為得到式(2)準備的。那么,有沒有別的方法避開證明式(3)而得到式(2)呢?
文獻[12-14]注意到了這一點,指出“深入分析標準差σ的本質(zhì)和作用,可知σ是δi統(tǒng)計意義上的平均值”,因此可用 σ()來代替即有
由式(35)、(36)可得:
將式(37)代入式(29)結(jié)合σ的定義式可得到Bessel公式。
上述證明方法存在三個方面的問題,一是怎樣深入分析標準差σ的本質(zhì)和作用沒有給出;二是沒有給出σ()的定義及意義(這樣便無法分析 σ()的意義);三是 σ()恒為正值,可正可負,兩者不可能恒相等。因而這類證法顯得牽強附會,“湊證明”的味道很濃。實際上,文獻[16]曾經(jīng)利用式(37)證明過Bessel公式,但沒有說明式(37)成立的理由。
因此,基于標準偏差的意義證明Bessel公式,必須先建立各種標準偏差的完整定義,明確它們的本質(zhì)含義,并建立各種標準偏差之間清晰的邏輯關(guān)系,這樣才能正確應(yīng)用。
證明的前面兩步與3.4.2中相同,只是第三步消去δ的方法不同。
式(38)、(20)結(jié)合可得:
式(39)代入式(29)得:
即:
聯(lián)立式(40)、(41)可得:
即有:
從我們提供的新證法中可得到以下幾點結(jié)論:
(1)Bessel公式并不要求被測量或測量誤差服從正態(tài)分布。但經(jīng)典證法中由于要利用式(3),不得不要求測量誤差服從對稱分布,從而限制了Bessel公式的適用范圍。
(2)Bessel公式成立需要測量的重復(fù)性或復(fù)現(xiàn)性條件能夠充分保證,而且要求“等精度測量”這個條件。這一條限制是因為在證明過程中用到了式(20)的緣故。文獻[17]指出不需要等精度測量”這個條件看來是有問題的,文獻[18]談不等精度測量的標準差的估計從另一個角度證明了Bessel公式的成立確實需要滿足等精度測量這個條件。
(3)不要求測量列給出的是彼此不相關(guān)的測量結(jié)果,s應(yīng)該只是給定條件下的數(shù)據(jù)的分散性。
(4)要求測量的次數(shù)足夠多,以保證式(38)及式(41)能夠很好的成立,從而保證用Bessel公式估計的σ有較高的精度。估計值s(xi)的相對標準偏差與測量次數(shù)的關(guān)系由下式給出
[1]毛英泰.誤差理論與精度分析[M].北京:國防工業(yè)出版社,1982.
[2]肖明耀.誤差理論與應(yīng)用[M].北京:計量出版社,1985.
[3]龔鎮(zhèn)雄.普通物理實驗中的數(shù)據(jù)處理[M].西安:西北電訊工程學(xué)院出版社,1985.
[4]黃俊欽.測試誤差分析與數(shù)學(xué)模型[M].北京:國防工業(yè)出版社,1985.
[5]Les Kirkup,Bob Frenkel.曾翔君,駱一萍,申淼譯.An Introduction to Uncertainty in Measurement[M].西安:西安交通大學(xué)出版社,2011.
[6]〔日〕岡積滿.測量誤差計算[M].北京:人民鐵道出版社,1975.
[7]費業(yè)泰.誤差理論與數(shù)據(jù)處理[M].北京:機械工業(yè)出版社,(第六版),2010.
[8]王武義.誤差原理與數(shù)據(jù)處理[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2001.
[9]馬宏,王金波.誤差理論與儀器精度[M].西安:陜西人民教育出版社,2007.
[10]朱鶴年.基礎(chǔ)物理實驗教程[M].北京:高等教育出版社,2003.
[11]王中宇,劉智敏,夏新濤,等.測量誤差與不確定度評定[M].北京:科學(xué)出版社,2008.
[12]朱洪海.對貝塞爾公式證法的探討[J].計量與測試技術(shù),2001,28(6).
[13]馬美娟.貝塞爾公式推導(dǎo)的再研究[J].佳木斯大學(xué)學(xué)報(自然科學(xué)版),2011,29(2).
[14]朱安遠.各種估計總體標準差方法的誤差分析和比較研究(上)[J].中國市場,2013,(10).
[15]鄧永和.中誤差貝塞爾公式的推導(dǎo)[J].大地測量與地球動力學(xué),2009,29(3).
[16]劉智敏.誤差與數(shù)據(jù)處理[M].北京:原子能出版社,1981.
[17]李慎安.測量不確定度百問[M].北京:中國計量出版社,2009.
[18]陶靖軒,顧龍芳,宋明順,等.不等精度測量結(jié)果標準差的估計[J].計量學(xué)報,2012,33(1).