尹江麗,王琳靜
(中國(guó)人民解放軍裝備學(xué)院基礎(chǔ)系,北京 101416)
在兵工產(chǎn)品試驗(yàn)過程中,經(jīng)常會(huì)出現(xiàn)這樣的現(xiàn)象:一組重復(fù)測(cè)量的試驗(yàn)數(shù)據(jù)里,會(huì)出現(xiàn)少數(shù)幾個(gè)偏差特別大的數(shù)據(jù),這類數(shù)據(jù)稱為可疑值。可疑值產(chǎn)生的原因主要有以下2個(gè)方面:①各種隨機(jī)因素影響所致。此時(shí),可疑值客觀地反映了測(cè)量設(shè)備在特定條件下進(jìn)行測(cè)量的隨機(jī)波動(dòng)性,與其它值屬于同一總體,應(yīng)當(dāng)予以保留。② 由于設(shè)備工作偶然異常、外來干擾或人為操作錯(cuò)誤等原因產(chǎn)生的過失誤差所致。這種可疑值的分布規(guī)律和正常值的分布規(guī)律相悖,與正常值不屬于同一總體,這類可疑值稱為異常值,應(yīng)當(dāng)予以剔除[1]。本文采用假設(shè)檢驗(yàn)的方法,對(duì)兵器試驗(yàn)中的異常值問題進(jìn)行分析判斷。
兵器試驗(yàn)中,一般很難查出可疑值產(chǎn)生的原因,這時(shí)只好借助于統(tǒng)計(jì)方法進(jìn)行判別是否是異常值。用統(tǒng)計(jì)方法進(jìn)行判別的基本思想是:給定一置信度,當(dāng)誤差超過這一置信度時(shí),則認(rèn)為是異常數(shù)據(jù),應(yīng)予剔除。因此,判別異常值的統(tǒng)計(jì)方法也是一種假設(shè)檢驗(yàn)[2]。
兵器試驗(yàn)中對(duì)異常值進(jìn)行檢驗(yàn)的前提是:被檢驗(yàn)的總體服從正態(tài)分布[3]。該問題的假設(shè)檢驗(yàn)可以采用以下方式描述。
設(shè) X1,X2…,Xn是取自正態(tài)總體 N(μ,σ2)的樣本,其中μ未知,σ2已知或未知,將 X1,X2,…,Xn按著從小到大的順序排列得:X(1),X(2),…,X(n),這里若 X(n)或者 X(1)明顯偏離其他值,則為可疑值。若 X(n)或者 X(1)與其它的 X(i)( i≠1,n)屬于同一總體,則為正常值,否則為異常值,對(duì)異常值必須予以剔除,因此提出如下形式的檢驗(yàn):
H0:X(n)(or X(1))為正常值
H1:X(n)(or X(1))為異常值
常見的假設(shè)檢驗(yàn)方法有很多,比如拉依達(dá)法、肖維勒法、格拉布斯法、狄克遜法、t檢驗(yàn)法等。在兵器試驗(yàn)中常用的檢驗(yàn)方法為格拉布斯法和狄克遜法。本文針對(duì)以上描述問題,重點(diǎn)分析這2種方法在不同條件下的異常值檢驗(yàn)?zāi)P?,并結(jié)合兵器試驗(yàn)的數(shù)據(jù)處理實(shí)例進(jìn)行分析判斷。
1)對(duì)于隨機(jī)變量X1,X2,…,Xn,計(jì)算樣本均值ˉx的值。
2)計(jì)算統(tǒng)計(jì)量G的值
3)對(duì)于給定的顯著性水平α,用n,α查表1得βα的值。
4)若G>βα,則拒絕H0,認(rèn)為x(n)(或x(1))為異常值,應(yīng)予以剔除,否則保留。
表1 G分布的臨界值βα表
1)對(duì)于隨機(jī)變量X1,X2,…,Xn,計(jì)算樣本均值ˉx和標(biāo)準(zhǔn)差S得值。
2)計(jì)算統(tǒng)計(jì)量Q的值
3)對(duì)于給定的顯著性水平α,用n,α查表2得qα的值。
4)若Q>qα,則拒絕H0,認(rèn)為x(n)(或x(1))為異常值,應(yīng)予以剔除,否則保留。
例如:某榴彈裝藥射角射擊8發(fā)。得射程X的樣本值如下(單位:m):2 179,2 177,2 184,2 185,2 173,2 158,2 163,2 146,經(jīng)統(tǒng)計(jì)有關(guān)歷史資料,在該裝藥該射角下,標(biāo)準(zhǔn)差σ=15 m,在顯著性水平α=0.01下分析其中有無異常值。
解:在兵器試驗(yàn)中,認(rèn)為射程X是正態(tài)分布[3]。
1)將樣本值從小到大排列后發(fā)現(xiàn)x(1)=2 146明顯偏離其他值,視為可疑值。
表2 Q分布的臨界值qα表
1)計(jì)算統(tǒng)計(jì)量 ri(i=1,2,3,4)的值
若3≤n≤7,使用 r1;若 8≤n≤10,使用 r2;若 11≤n≤13,使用 r3;若 14≤n≤30,使用 r4。
2)對(duì)于給定的顯著性水平α,用n,α查表3得rα的值。
3)若 ri> rα(i=1,2,3,4),則拒絕H0,認(rèn)為x(n)為異常值,應(yīng)予以剔除,否則保留。
把3.1中的檢驗(yàn)統(tǒng)計(jì)量換為:
其他步驟同 3.1,就可以用來檢驗(yàn) X(1)是否為異常值[4-5]。
例如,某型號(hào)導(dǎo)彈落點(diǎn)橫向偏差的數(shù)據(jù)如表4,根據(jù)經(jīng)驗(yàn),落點(diǎn)橫向偏差服從正態(tài)分布,在顯著性水平α=0.05下,判斷是否有異常值。
解:顯然x(1)=-81 910和x(7)=19 994為可疑值。由上述理論知識(shí)可知:
查表3 得 rα=0.507,顯然 r'1> rα,r1< rα,故認(rèn)為 x(1)為異常值,予以剔除,但沒有理由認(rèn)為x(7)是異常的,故應(yīng)當(dāng)保留。
表 3 ri(i=1,2,3,4)分布的臨界值rα 表
表4 某導(dǎo)彈落點(diǎn)橫向偏差的樣本值
實(shí)例分析結(jié)果證明,假設(shè)檢驗(yàn)方法是兵器試驗(yàn)中異常值檢驗(yàn)的一種有效方法。格拉布斯法適用于剔除一個(gè)異常值,而狄克遜法一次可以剔除多個(gè)異常值,當(dāng)目測(cè)估計(jì)有多個(gè)異常值時(shí),建議使用狄克遜法,并且狄克遜法不需要計(jì)算樣本的均值和標(biāo)準(zhǔn)差,方法比較簡(jiǎn)單。
[1] 包國(guó)忱.電子裝備試驗(yàn)數(shù)據(jù)處理[M].北京:國(guó)防科工委司令部,1997:153-154.
[2] 高峻.軍品質(zhì)量檢驗(yàn)技術(shù)[M].北京:國(guó)防工業(yè)出版社,2004:132-134.
[3] 閆章更.試驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)分析[M].北京:國(guó)防工業(yè)出版社,2001:51-101.
[4] 魏治文,程琳.幾種異常值判別準(zhǔn)則在安全檢測(cè)數(shù)據(jù)處理中的應(yīng)用[J].大壩與安全,2009(1):67 -69.
[5] 蘇健,朱炬波.導(dǎo)引精度分析中的異常值檢驗(yàn)[J].飛行器測(cè)控學(xué)報(bào),2008,27(2):62 -65.
[6] 王君,高穎慧,王平,等.一種ICP改進(jìn)算法[J].重慶理工大學(xué)學(xué)報(bào):自然科學(xué)版,2011(10):71-76.
[7] 汪輝,杜紅梅,楊亮.復(fù)雜電磁環(huán)境對(duì)兵器試驗(yàn)靶場(chǎng)測(cè)控裝備的影響[J].四川兵工學(xué)報(bào),2012(8):92-94.
(責(zé)任編輯楊繼森)