申加康,徐 俊,張建軍,李 賀,萬(wàn) 軍
(1.中國(guó)航空綜合技術(shù)研究所,北京 100028;2.西南技術(shù)工程研究所,重慶 400039)
GJB150A推薦根據(jù)實(shí)測(cè)數(shù)據(jù)來(lái)確定振動(dòng)試驗(yàn)條件[1]。美軍標(biāo)MIL-STD-810H中給出了振動(dòng)、沖擊環(huán)境的多種統(tǒng)計(jì)歸納方法[2]。其中,對(duì)于符合正態(tài)分布的振動(dòng)功率譜密度數(shù)據(jù),常使用正態(tài)單邊容差上限方法進(jìn)行統(tǒng)計(jì)歸納[3]。近年來(lái),眾多專家對(duì)振動(dòng)功率譜密度數(shù)據(jù)的歸納方法進(jìn)行了研究,并將歸納方法應(yīng)用于飛機(jī)、艦船、車輛等裝備的試驗(yàn)條件確定[4-19],但尚未有專家對(duì)正態(tài)單邊容差上限的估計(jì)誤差進(jìn)行研究。
正態(tài)單邊容差上限的計(jì)算過(guò)程涉及到一個(gè)關(guān)于無(wú)限多的樣本記錄的極限運(yùn)算,而工程上無(wú)法做到極限運(yùn)算,工程上統(tǒng)計(jì)分析的結(jié)果只是一個(gè)關(guān)于上限真值的樣本估計(jì),因此對(duì)于實(shí)際的統(tǒng)計(jì)歸納結(jié)果一定會(huì)有統(tǒng)計(jì)誤差。根據(jù)概率統(tǒng)計(jì)知識(shí)可知,樣本越多,統(tǒng)計(jì)誤差就越小。然而,通常情況下,獲取實(shí)測(cè)振動(dòng)數(shù)據(jù)成本較高,振動(dòng)功率譜密度樣本量不可能獲取太多。例如,一個(gè)架次飛機(jī)試飛,往往就需要耗費(fèi)大量的人力物力和財(cái)力。因此,有必要研究正態(tài)單邊容差上限估計(jì)誤差與樣本量之間的關(guān)系,為預(yù)先定量確定實(shí)測(cè)次數(shù)提供參考。
本文推導(dǎo)了正態(tài)單邊容差上限估計(jì)的均方根誤差和百分比誤差的數(shù)學(xué)公式,并給出了上限估計(jì)誤差與樣本量之間的定量關(guān)系。
HB20237—2014《軍用飛機(jī)平臺(tái)環(huán)境測(cè)量數(shù)據(jù)歸納方法》[20]中對(duì)正態(tài)單邊容差上限有著明確的定義。隨機(jī)變量x的正態(tài)單邊容差上限估計(jì)為在規(guī)定的置信度γ下,該值大于其真值xH的概率為100β%,由式(1)和式(2)給出
(1)
(2)
正態(tài)單邊容差上限的NTL(N,β,γ)為
(3)
置信度取100γ%,分位點(diǎn)取100β%的正態(tài)單邊容差上限稱之為P(100β)/(100γ)上限,其物理意義為這個(gè)上限值以100γ%的置信度覆蓋了100β%的測(cè)量數(shù)據(jù)點(diǎn),常用的正態(tài)單邊容差上限有P95/50上限和P99/90上限。
由正態(tài)單邊容差上限的定義可知,當(dāng)總體期望和總體標(biāo)準(zhǔn)差確定時(shí),100β%覆蓋概率的正態(tài)單邊容差上限xH也隨之確定,因此正態(tài)單邊容差上限xH也是反映總體的一個(gè)參數(shù)。
(4)
(5)
在進(jìn)行公式推導(dǎo)之前,先給出概率統(tǒng)計(jì)中常用公式
(6)
(7)
(8)
(9)
其中,M的表達(dá)式為
(10)
因?yàn)?
(11)
所以:
(12)
其中,
(13)
(14)
(15)
(16)
(17)
正態(tài)單邊容差上限的百分比誤差
(18)
(19)
其中,cv=σx/μx在概率論中被稱為變異系數(shù),又稱離散系數(shù)。根據(jù)功率譜密度的物理意義,此處cv為正值。
從式(19)中可以看出,當(dāng)樣本的數(shù)量N、置信度γ和覆蓋概率100β%一定時(shí),正態(tài)單邊容差上限的百分比誤差受各頻點(diǎn)的功率譜密度值概率分布的變異系數(shù)cv影響。
需要說(shuō)明的是,式(19)的百分比誤差是一個(gè)期望誤差,即由N個(gè)樣本計(jì)算得到誤差在ε附近波動(dòng)。
基于實(shí)測(cè)振動(dòng)功率譜密度樣本統(tǒng)計(jì)歸納的過(guò)程,可認(rèn)為是從某一確定的正態(tài)總體中隨機(jī)選擇有限個(gè)樣本,并基于有限個(gè)樣本估計(jì)總體的上限。由于樣本選擇的隨機(jī)性,使得上限估計(jì)存在一定的誤差。因此,為了驗(yàn)證,可采用如下思路驗(yàn)證式(19)的正確與否:
(1) 給定正態(tài)總體的期望和方差,生成一組呈正態(tài)分布的數(shù)據(jù)A,數(shù)據(jù)個(gè)數(shù)為1 000 000;
(4) 改變挑選的樣本個(gè)數(shù)N,重復(fù)過(guò)程(2)~(3),得到不同樣本數(shù)的上限估計(jì)的百分比誤差。
根據(jù)上述思路,設(shè)計(jì)多組仿真案例,如表1所示。
表1 仿真案例表Tab.1 Simulation case table
分別計(jì)算表1中案例的P95/50上限的百分比誤差、P99/90上限的百分比誤差以及對(duì)應(yīng)的按式(19)理論計(jì)算得到的誤差,繪制上限估計(jì)誤差隨樣本數(shù)量變化曲線,如圖1和圖2所示。
圖1 案例1~案例4的P95/50上限估計(jì)誤差隨樣本量的變化曲線Fig.1 The curve of P95/50 upper limit estimation error of case 1 to case 4 as a function of sample size
圖2 案例1~案例4的P99/90上限估計(jì)誤差隨樣本量的變化曲線Fig.2 The curve of P99/90 upper limit estimation error of case 1 to case 4 as a function of sample size
從圖1和圖2中可以看出:
(1) 案例1~案例4的仿真結(jié)果與理論計(jì)算結(jié)果基本一致,表明1.3節(jié)中推導(dǎo)的正態(tài)單邊容差上限估計(jì)的百分比誤差公式是正確的;
(2) 案例3和案例4的仿真結(jié)果基本一致,表明正態(tài)單邊容差上限估計(jì)的百分比誤差與總體方差和期望的大小無(wú)關(guān),而與二者的比值——變異系數(shù)相關(guān);
(3) 總體分布的變異系數(shù)越大,正態(tài)單邊容差上限估計(jì)的誤差也就越大;
(4) 樣本量越大,正態(tài)單邊容差上限估計(jì)的誤差越小。
根據(jù)正態(tài)單邊容差上限的百分比誤差公式,即可確定樣本量與上限估計(jì)誤差的關(guān)系。然而在工程應(yīng)用中,受限于實(shí)測(cè)成本,很難獲得大量的功率譜密度樣本,所以很難獲知功率譜密度值概率分布的總體變異系數(shù)。因此,需要對(duì)功率譜密度值的總體分布情況進(jìn)行合理的假設(shè)。
根據(jù)正態(tài)分布的性質(zhì)可知,呈正態(tài)分布的變量其值落在[ux-3σx,ux+3σx]的概率為0.997 3,所以,可認(rèn)為ux-3σx是正態(tài)分布的最小值。同時(shí),考慮到功率譜密度均為正值,因此有:
ux-3σx>0
(20)
即:
cv<1/3
(21)
因此有:
(22)
式(22)是基于正態(tài)分布的3σ原則的簡(jiǎn)化得到,存在大小不滿足的情況,但這種情況的發(fā)生是小概率事件。因此式(22)對(duì)于確定正態(tài)單邊容差上限估計(jì)誤差的最大值有一定的指導(dǎo)意義。
不同總體分布變異系數(shù)的P95/50上限估計(jì)誤差隨樣本量的變化曲線如圖3所示,不同總體分布變異系數(shù)的P99/90上限估計(jì)誤差隨樣本量的變化曲線如圖4所示。
圖3 不同變異系數(shù)的P95/50上限估計(jì)誤差隨樣本量的變化曲線Fig.3 The curve of the P95/50 upper limit estimation error of different coefficients of variation as a function of sample size
圖4 不同變異系數(shù)的P99/90上限估計(jì)誤差隨樣本量的變化曲線Fig.4 The curve of the P99/90 upper limit estimation error of different coefficients of variation as a function of sample size
從圖3中可以看出:
(1) 5個(gè)樣本可使P95/50上限估計(jì)的誤差不超過(guò)20%;
(2) 9個(gè)樣本可使P95/50上限估計(jì)的誤差不超過(guò)15%;
(3) 20個(gè)樣本可使P95/50上限估計(jì)的誤差不超過(guò)10%;
(4) 70個(gè)樣本可使P95/50上限估計(jì)的誤差不超過(guò)5%。
從圖4中可以看出:
(1) 7個(gè)樣本可使P99/90上限估計(jì)的誤差不超過(guò)40%;
(2) 17個(gè)樣本可使P99/90上限估計(jì)的誤差不超過(guò)20%;
(3) 28個(gè)樣本可使P99/90上限估計(jì)的誤差不超過(guò)15%;
(4) 54個(gè)樣本可使P99/90上限估計(jì)的誤差不超過(guò)10%。
通過(guò)前3章內(nèi)容可以看出,當(dāng)樣本量較小時(shí),采用正態(tài)單邊容差上限方法進(jìn)行振動(dòng)功率譜統(tǒng)計(jì)歸納時(shí)誤差較大,而Bootstrap法在小樣本量統(tǒng)計(jì)歸納則具有一定優(yōu)勢(shì),因此可對(duì)比正態(tài)單邊容差上限法估計(jì)誤差和自助容差上限法估計(jì)誤差隨樣本量的變化關(guān)系。
自助容差上限估計(jì)的詳細(xì)步驟如下:
(5) 重復(fù)(3),(4)步N次,N≥1 000;
為了對(duì)比小樣本下正態(tài)單邊容差上限估計(jì)和自助容差上限估計(jì)誤差,采用如下思路研究自助容差上限估計(jì)誤差隨樣本量的變化關(guān)系:
(1) 給定正態(tài)總體的期望和標(biāo)準(zhǔn)差,生成一組呈正態(tài)分布的數(shù)據(jù)A,數(shù)據(jù)個(gè)數(shù)為1 000 000;
(2) 從A中隨機(jī)挑選N個(gè)樣本計(jì)算其自助容差上限xu(N,γ,β);
(4) 改變挑選的樣本個(gè)數(shù)N,重復(fù)過(guò)程(2)~(3),得到不同樣本數(shù)的自助容差上限估計(jì)的百分比誤差。
假定某一帶寬內(nèi)的功率譜密度樣本服從正態(tài)分布N(0.1,(1/30)2),采用自助容差上限方法分別計(jì)算覆蓋概率為95%、置信度為50%的估計(jì)上限和覆蓋概率為99%、置信度為90%的估計(jì)上限,并分別計(jì)算其百分比誤差,并與變異系數(shù)為1/3的正態(tài)單邊容差上限的百分比誤差的理論解(式(22)的)對(duì)比,如圖5和6所示。
圖5 覆蓋概率95%置信度50%的上限估計(jì)誤差隨樣本量的變化曲線Fig.5 The curve of the Estimation error of upper tolerance limit with coverage probability of 95% and confidence of 50% versus sample size curve
從圖5中和圖6可以看出:
圖6 覆蓋概率99%置信度90%的上限估計(jì)誤差隨樣本量的變化曲線Fig.6 The curve of the Estimation error of upper tolerance limit with coverage probability of 99% and confidence of 90% versus sample size curve
(1) 統(tǒng)計(jì)歸納覆蓋概率為95%,置信度為50%的上限時(shí),自助容差上限相比正態(tài)單邊容差上限沒(méi)有優(yōu)勢(shì);
(2) 統(tǒng)計(jì)歸納覆蓋概率為99%,置信度為90%的上限時(shí),且當(dāng)樣本量小于20時(shí),自助容差上限方法相比正態(tài)單邊容差上限方法能明顯降低估計(jì)上限的誤差,而當(dāng)樣本量較大時(shí),自助容差上限相比正態(tài)單邊容差上限沒(méi)有優(yōu)勢(shì)。
因此,當(dāng)統(tǒng)計(jì)歸納小樣本量(樣本量小于20)覆蓋概率為99%,置信度為90%的上限時(shí),優(yōu)先選用自助容差上限方法。
本文根據(jù)正態(tài)單邊容差上限的定義,推導(dǎo)了正態(tài)單邊容差上限估計(jì)的均方根誤差和百分比誤差的公式,并結(jié)合數(shù)值仿真結(jié)果,校驗(yàn)了公式的正確性。同時(shí)給出了振動(dòng)功率譜密度P95/50和P99/90上限估計(jì)在不同樣本量時(shí)的最大誤差。最后,對(duì)比了正態(tài)單邊容差上限和自助容差上限估計(jì)誤差隨樣本量的變化關(guān)系。
本文得到以下結(jié)論:
(1) 正態(tài)單邊容差上限的估計(jì)誤差與樣本個(gè)數(shù)和總體分布的變異系數(shù)相關(guān);
(2) 正態(tài)單邊容差上限的估計(jì)誤差隨樣本量的增加而減小;
(3) 正態(tài)單邊容差上限的估計(jì)誤差隨變異系數(shù)的增加而增加;
(4) 當(dāng)樣本量小于20時(shí),統(tǒng)計(jì)歸納覆蓋概率為99%、置信度為90%的上限時(shí),自助容差上限估計(jì)誤差明顯小于正態(tài)單邊容差上限方法。