孫江暉++龍燕
摘 要眾所周知,計(jì)量測(cè)量工作對(duì)獲取數(shù)據(jù)的精準(zhǔn)性有著極高的要求,而要確保獲取數(shù)據(jù)的精準(zhǔn)性,除了需在數(shù)據(jù)獲取后進(jìn)行科學(xué)、有效的處理外,尚需剔除其中一些異常數(shù)據(jù),之后方可作為相關(guān)科研工作的參考依據(jù)。本文通過(guò)論述計(jì)量?jī)x器出現(xiàn)誤差的原因,并以實(shí)例來(lái)說(shuō)明計(jì)量測(cè)試中異常數(shù)據(jù)剔除的措施,能夠保證計(jì)量測(cè)試的準(zhǔn)確性和科學(xué)性。
【關(guān)鍵詞】計(jì)量測(cè)試 異常數(shù)據(jù) 剔除措施
計(jì)量測(cè)量,其本身便是一項(xiàng)對(duì)數(shù)據(jù)精準(zhǔn)性有著極高要求的工作。而要確保數(shù)據(jù)獲取的精準(zhǔn)性,除了需科學(xué)處理計(jì)量測(cè)量所得出的數(shù)據(jù)外,尚需找出其中的異常數(shù)據(jù)并將之剔除,如此方能作為相關(guān)科學(xué)的參考依據(jù)。當(dāng)前,國(guó)內(nèi)已然根據(jù)計(jì)量測(cè)量中異常數(shù)據(jù)的出現(xiàn)原因提出了4種有針對(duì)性的異常數(shù)據(jù)剔除方法,這些方法可獨(dú)立使用,亦可綜合利用,其目的均在于判定異常值并將之剔除,以確保計(jì)量測(cè)量數(shù)據(jù)的準(zhǔn)確性。
1 計(jì)量?jī)x器出現(xiàn)誤差的原因
由于計(jì)量?jī)x器對(duì)外部環(huán)境有著極高的要求,加之其本身也是一種高精密的儀器,因而任何外部環(huán)境的變化都可能導(dǎo)致儀器測(cè)試結(jié)果產(chǎn)生偏差,并最終影響到檢測(cè)結(jié)果的準(zhǔn)確性。就當(dāng)前的外部環(huán)境而言,可能導(dǎo)致計(jì)量?jī)x器產(chǎn)生誤差的原因主要包括以下幾個(gè)方面:
(1)儀器受到了外界諸如震動(dòng)、機(jī)械動(dòng)蕩一類的自然或人為因素影響;
(2)受電磁干擾或因供電電壓不穩(wěn)而導(dǎo)致的檢測(cè)儀器出現(xiàn)故障;
(3)操作人員本身經(jīng)驗(yàn)不足,加之操作事物所因其的檢測(cè)不準(zhǔn)確;
(4)儀器本身存在如元件損壞、零件松動(dòng)一類的質(zhì)量問(wèn)題,這類問(wèn)題一旦發(fā)生,將直接導(dǎo)致檢測(cè)結(jié)果不準(zhǔn)確,從而影響到工作人員的正常測(cè)量。
對(duì)于以上影響因素,操作人員在實(shí)際的操作過(guò)程中,務(wù)必全面排除,如此方能確保測(cè)量結(jié)果的準(zhǔn)確性。當(dāng)然,在此過(guò)程中,針對(duì)異常值的剔除尚需注意采取合適的剔除方法,若剔除方法選擇不當(dāng)則可能收獲適得其反的效果。簡(jiǎn)言之,即針對(duì)異常值不同的產(chǎn)生原因需采取有針對(duì)性的剔除方法,方能確保儀器測(cè)量結(jié)果達(dá)到規(guī)定的使用標(biāo)準(zhǔn)。
在實(shí)際的判斷異常值過(guò)程中,以下幾種是當(dāng)前人們最常用的異常值判斷準(zhǔn)則,即3∑準(zhǔn)則、肖維勒準(zhǔn)則、t檢驗(yàn)法以及格拉布斯準(zhǔn)則。
2 計(jì)量測(cè)試中異常數(shù)據(jù)剔除的措施
以上所提準(zhǔn)則,雖其實(shí)際內(nèi)容各不相同,但卻均是置信概率的運(yùn)用基礎(chǔ),而所謂的置信概率,即隨機(jī)變量于置信區(qū)間內(nèi)的落入概率。若實(shí)際的運(yùn)用過(guò)程中,將置信區(qū)間內(nèi)的測(cè)量數(shù)據(jù)實(shí)際范圍用X來(lái)表示,那么以上所提之準(zhǔn)則則能用以下方式來(lái)表達(dá):
2.1 3∑準(zhǔn)則
該式子所表達(dá)的含義為可疑數(shù)據(jù)與整租數(shù)據(jù)的算術(shù)平均差,其目的是要找出該差與3倍噠的絕對(duì)值之間的差異,若偏差較大則將此數(shù)值舍棄。在實(shí)際的運(yùn)用過(guò)程中,將所測(cè)數(shù)據(jù)代入上式,若與上式相符,則可判斷該值為異常值,應(yīng)將其剔除。
2.2 肖維勒準(zhǔn)則
在該公式的使用過(guò)程抓奶哥,若將測(cè)得的獨(dú)立數(shù)據(jù)帶入,上式仍然成立則可判定Xd為異常值,可將之剔除。
2.3 格布拉斯準(zhǔn)則
該式中,Xd表示測(cè)量數(shù)據(jù),s則代表著貝塞爾公式計(jì)算的標(biāo)準(zhǔn)差,至于其他的如G、與n均可在表中查詢。
2.4 t檢驗(yàn)法
該檢驗(yàn)法是將Xi這一可疑數(shù)值意外的數(shù)值假定為數(shù)據(jù)的集合總體,進(jìn)而根據(jù)該數(shù)據(jù)集總體設(shè)定其正態(tài)分布。對(duì)于該數(shù)據(jù),雖僅是假定其分布狀態(tài),但無(wú)論其是否為正態(tài)均需通過(guò)進(jìn)一步的判定。當(dāng)然,于實(shí)際的運(yùn)用過(guò)程中,通常都不進(jìn)行深入判定該樣本是否符合正態(tài)分布特征,而僅是將其樣本視作近似為正態(tài)分布,如此便可將Xi這一可疑數(shù)據(jù)視作一個(gè)總?cè)萘繛?的樣本,進(jìn)而在比較兩者的總體時(shí),若兩者均在同一總體中被包含,則兩者之間顯然不應(yīng)存在這樣的差異,從而可由此計(jì)算出統(tǒng)計(jì)量k,具體的表達(dá)式為:
于上式中,針對(duì)樣本的數(shù)據(jù)算術(shù)平均值,我們用X表示,那么S所代表者則為樣本數(shù)據(jù)的標(biāo)準(zhǔn)差,之后通過(guò)計(jì)算得出K指,并通過(guò)與查詢所得的T分布表所得之進(jìn)行比較,若比較結(jié)果顯示:顯著性水平a下的t檢驗(yàn)值較大,則表明Xi的出現(xiàn)應(yīng)是一個(gè)小概率事件,可將之視作異常值而予以剔除。
3 實(shí)例判定
以下為結(jié)合實(shí)例所判定的異常值判斷準(zhǔn)則:如經(jīng)過(guò)某測(cè)量得出了如下一系列的測(cè)量數(shù)據(jù):10.002,10.204,0.218,10.228,10.230,10.312,10.320,10.342,10.346,結(jié)合以上方式進(jìn)行判斷并剔除異常值,那么置信概念的可取值可設(shè)定為95%,那么相應(yīng)地。
此時(shí),我們將異常值懷疑為10.346,之后通過(guò)計(jì)算可得出這十個(gè)數(shù)的平均值為10.2317,那么對(duì)應(yīng)的X1的平均值則為10.2231,,經(jīng)過(guò)綜合計(jì)算,得出10.346為異常值,應(yīng)將其剔除。
通過(guò)采用四種方法來(lái)進(jìn)行判定,其10346為異常值,而G(a,n)與10.002-10.2317非常相近,這在一定程度上說(shuō)明了應(yīng)用格拉布斯準(zhǔn)則的效果較好。在整個(gè)判定過(guò)程中,作為判定異常數(shù)值的基本思想是:先做好某一個(gè)統(tǒng)計(jì)量,如果這個(gè)統(tǒng)計(jì)量在規(guī)定的范圍之內(nèi),便可以認(rèn)為是服從止態(tài)分布,否則就認(rèn)為相關(guān)的數(shù)據(jù)并不服從止態(tài)分布,這則說(shuō)明了其中的數(shù)據(jù)存在一定的誤差。
4 結(jié)語(yǔ)
在實(shí)際的運(yùn)用過(guò)程中,為切實(shí)保障準(zhǔn)側(cè)的景準(zhǔn)確并盡量降低誤判現(xiàn)象的發(fā)生概率,通常情況下可結(jié)合兩種或三種判定準(zhǔn)則進(jìn)行綜合判定,若集中判定方式所得出之結(jié)論均保持一直,則可將之可疑數(shù)據(jù)剔除,如此判斷方式方可切實(shí)提升測(cè)量的準(zhǔn)確性。當(dāng)然,若幾種方法的綜合使用,所得判定結(jié)果存在差異,則應(yīng)慎重考慮該數(shù)據(jù)是否要進(jìn)行剔除,并進(jìn)行反復(fù)驗(yàn)證。對(duì)于這種情況,筆者的建議是將處理數(shù)據(jù)全部保留,以確保異常數(shù)據(jù)剔除的高效性與準(zhǔn)確性,進(jìn)而保障測(cè)得數(shù)據(jù)的有效性。
參考文獻(xiàn)
[1]趙媞,孫明珠,王中禹.計(jì)量測(cè)試中異常數(shù)據(jù)剔除方法的探討[J].科技創(chuàng)新與應(yīng)用,2014(28):293-293.
[2]徐丹,王中禹.計(jì)量測(cè)試中異常數(shù)據(jù)剔除的措施[J].科技經(jīng)濟(jì)導(dǎo)刊,2016(20):156-157.
[3]王瑩,劉佳,王欣,等.計(jì)量檢測(cè)中異常數(shù)據(jù)剔除的有效方法[J].電子世界,2016(24):93-93.
[4]翟志強(qiáng).試論計(jì)量檢定中的異常值及其剔除方法[J].中國(guó)科技博覽,2015(33):390-390.
作者單位
東華計(jì)量測(cè)試研究院 江西省南昌市 330029endprint