馬文麗,林立民,孫艷勤,宋曉東
(內(nèi)蒙古蒙牛乳業(yè)(集團(tuán))股份有限公司,內(nèi)蒙古 呼和浩特 011500)
數(shù)據(jù)是指對客觀事件進(jìn)行記錄并可以鑒別的符號,是對客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號或這些物理符號的組合。它是可識別的、抽象的符號。利用穩(wěn)健(Robust)統(tǒng)計法、格拉布斯檢驗法(Grubbs)、科克倫(Cochran)檢驗法三種統(tǒng)計方法對實驗室間比對的檢測數(shù)據(jù)進(jìn)行統(tǒng)計分析,發(fā)現(xiàn)在計算過程特別是離群值判斷方面存在較大差異,現(xiàn)將三種統(tǒng)計方法進(jìn)行詳細(xì)介紹與分析,對結(jié)果進(jìn)行客觀的評價。
采用穩(wěn)健統(tǒng)計法進(jìn)行統(tǒng)計分析的前提是假設(shè)分析的結(jié)果服從正態(tài)分布。在開始進(jìn)行統(tǒng)計分析之前,應(yīng)確保所采集的數(shù)據(jù)是正確、合理的,并對數(shù)據(jù)中的粗大誤差和潛在問題進(jìn)行識別。通常在數(shù)據(jù)統(tǒng)計過程中需要統(tǒng)計結(jié)果數(shù)、中位值、標(biāo)準(zhǔn)四分位間距(標(biāo)準(zhǔn)化IQR)、穩(wěn)健CV、最小值、最大值和極差七種統(tǒng)計量。這些統(tǒng)計量的計算是進(jìn)行實驗室結(jié)果統(tǒng)計評價的基礎(chǔ)。其中最重要的統(tǒng)計量是中位值和標(biāo)準(zhǔn)化IQR,它們是數(shù)據(jù)集中和分散的量度,屬于穩(wěn)健統(tǒng)計量,不受數(shù)據(jù)中離群值的影響。
對實驗室檢測結(jié)果應(yīng)使用基于穩(wěn)健總計統(tǒng)計量的Z比分?jǐn)?shù)(中位值和標(biāo)準(zhǔn)化IQR)進(jìn)行評價。對于分割水平對樣品a和樣品b應(yīng)統(tǒng)計計算兩個Z比分?jǐn)?shù)——實驗室間Z比分?jǐn)?shù)(ZB)和實驗室內(nèi)Z比分?jǐn)?shù)(ZW)。它們分別基于結(jié)果對的標(biāo)準(zhǔn)化和(S)和標(biāo)準(zhǔn)化差(D)來進(jìn)行計算,標(biāo)準(zhǔn)化和(S)和標(biāo)準(zhǔn)化差(D)的計算公式如下:
(1)
(2)
通過計算各實驗室的標(biāo)準(zhǔn)化和(S)和標(biāo)準(zhǔn)化差(D),可統(tǒng)計出所有參加實驗室的S和D的中位值和標(biāo)準(zhǔn)化IQR,再根據(jù)公式(3)和公式(4)計算實驗室間Z比分?jǐn)?shù)(ZB)和實驗室內(nèi)Z比分?jǐn)?shù)(ZW)。
(3)
(4)
實驗室結(jié)果依據(jù)Z比分?jǐn)?shù)(包括ZB和ZW)進(jìn)行評定。|Z|≥3的結(jié)果為離群值,2<|Z|<3時為可疑值。正的實驗室間離群(即ZB≥3)表明該樣品對的兩個結(jié)果太高,負(fù)的實驗室間離群值(即ZB≤-3)表明其結(jié)果太低,而實驗室內(nèi)離群值則表明其兩個結(jié)果間的差值太大。
科克倫檢驗法應(yīng)用于所有標(biāo)準(zhǔn)差都是在重復(fù)性條件下,且由相同數(shù)目(n)的測試結(jié)果計算得出的情形。實際中由于數(shù)據(jù)的缺失或剔除,測試結(jié)果數(shù)可能不同。所以假定在正常組織的試驗中,每個實驗室的測試結(jié)果數(shù)目不同所造成的影響是有限且可以忽略的,科克倫檢驗中所用的n可取多數(shù)實驗室的測試結(jié)果數(shù)。
該統(tǒng)計方法是對標(biāo)準(zhǔn)差的最大值進(jìn)行評定,屬于單側(cè)檢驗。統(tǒng)計過程為先將全組實驗室檢測結(jié)果標(biāo)準(zhǔn)差從小到大排列,然后根據(jù)標(biāo)準(zhǔn)差的最大值計算科克倫檢驗的統(tǒng)計量,見公式(5)。查閱科克倫檢驗臨界值表,通過比較相同顯著水平下的臨界值來判定該最大標(biāo)準(zhǔn)差是否為離群值。如果標(biāo)準(zhǔn)差的最大值是離群值,則將該值舍去后對剩余的標(biāo)準(zhǔn)差重新計算科克倫檢驗的統(tǒng)計量。
(5)
式中,si為實驗室的標(biāo)準(zhǔn)差,smax是si中最大值。
離群值的判斷:
(a)當(dāng)統(tǒng)計量小于等于5%的臨界值時,認(rèn)為該值是正常值。(b)當(dāng)統(tǒng)計量大于5%的臨界值且小于等于1%的臨界值時,該值為可疑值。(c)當(dāng)統(tǒng)計量大于1%臨界值時,認(rèn)為該值是統(tǒng)計離群值。
格拉布斯檢驗法適用于判定一組檢測結(jié)果中最大值或最小值是否為離群值,此方法通過計算平均值和標(biāo)準(zhǔn)偏差(s)然后再計算統(tǒng)計量(G),見公式(6)、公式(7)。通過查閱Grubbs檢驗臨界值表獲得一定顯著性水平(α)下的臨界值,比較統(tǒng)計量(G)與查到的臨界值。當(dāng)統(tǒng)計量(G)大于臨界值時,此數(shù)據(jù)即為離群值,并對剩余數(shù)據(jù)繼續(xù)檢驗,直到數(shù)據(jù)中無異常值為止。
Grubbs檢驗的統(tǒng)計量計算公式為:
(6)
最小值x1的統(tǒng)計量計算公式為:
(7)
式中,x1為一系列數(shù)據(jù)xi(i=1,2,…,p)中的最小值。
離群值的判斷:
(a)當(dāng)統(tǒng)計量小于等于5%的臨界值時,認(rèn)為該值是正常值。(b)當(dāng)統(tǒng)計量大于5%的臨界值且小于等于1%的臨界值時,該值為可疑值。(c)當(dāng)統(tǒng)計量大于1%臨界值時,認(rèn)為該值是統(tǒng)計離群值。
樣品檢測結(jié)果見表1。
表1 實驗室間比對結(jié)果
本次牛奶中營養(yǎng)元素指標(biāo)實驗室間比對采用“分割水平”的樣品設(shè)計,脂肪的樣品分為A、B兩組,蛋白質(zhì)的樣品分為C、D兩組。在對實驗室檢測能力進(jìn)行評定時,不出具“合格”與否的結(jié)論,而是使用“滿意”、“可疑”或“離群”的概念。如果一個結(jié)果被評定為離群值,這意味著從統(tǒng)計上看它明顯地不同于同組的其他結(jié)果。
用穩(wěn)健統(tǒng)計法計算各參加實驗室的實驗室間Z值(ZB)和實驗室內(nèi)Z值(ZW)。通過對檢測結(jié)果進(jìn)行統(tǒng)計分析,本次脂肪檢測項目發(fā)現(xiàn)實驗室間離群4家,實驗室間可疑0家,實驗室內(nèi)離群4家,實驗室內(nèi)可疑0家;對于蛋白質(zhì)檢測項目,此次有實驗室間離群4家,實驗室間可疑1家,實驗室內(nèi)離群0家,實驗室內(nèi)可疑4家。將實驗室Z值(ZB和ZW)合并統(tǒng)計,本次脂肪項目共有91.11%的實驗室結(jié)果滿意,8.99%的實驗室離群;蛋白質(zhì)項目共有90%的實驗室結(jié)果滿意,5.56%的實驗室可疑,4.44%的實驗室離群。具體穩(wěn)健統(tǒng)計如表2。
表2 實驗室間比對穩(wěn)健統(tǒng)計結(jié)果
由統(tǒng)計數(shù)據(jù)可見,實驗室內(nèi)的離群與可疑明顯多于實驗室間離群與可疑,說明實驗室內(nèi)部檢測過程中的隨機誤差比較多,而實驗室間的系統(tǒng)誤差要少一些。
用科克倫檢驗法進(jìn)行數(shù)據(jù)統(tǒng)計時,需要計算統(tǒng)計量C,再與臨界值進(jìn)行比較判定離群值??瓶藗悪z驗法是對檢測結(jié)果的標(biāo)準(zhǔn)偏差進(jìn)行統(tǒng)計以剔除離群值。經(jīng)過統(tǒng)計計算,本次實驗室比對活動中,樣品A、樣品B、樣品C、樣品D均無可疑值和離群值。
表3 實驗室間比對柯克倫檢驗統(tǒng)計結(jié)果
根據(jù)科克倫統(tǒng)計原理,采用此方法時,參與實驗室數(shù)量越多,其對應(yīng)的臨界值越小,即要求標(biāo)準(zhǔn)偏差的離散程度要小。參與實驗室數(shù)量少時,對應(yīng)的臨界值大,那么對于數(shù)據(jù)標(biāo)準(zhǔn)偏差離散程度的要求就不是那么嚴(yán)格。因此,在此次實驗室間比對活動參與實驗室較多,而數(shù)據(jù)的離散程度偏大的情況下,科克倫檢驗法評定剔除的離群值相對較多。
在此次實驗室間比對中,對同一種樣品的檢測結(jié)果呈兩端離散的形式,所以在采用格拉布斯檢驗法進(jìn)行數(shù)據(jù)統(tǒng)計時,需要同時對最大值和最小值計算統(tǒng)計量Gp和G1,再與臨界值G(α)比較。如果Gp>G1且Gp>G(α),則評定最大值為離群值;如果G1>Gp且G1>G(α),則評定最小值為離群值。對于樣品A,計算發(fā)現(xiàn)離群值1個;對于樣品B,計算發(fā)現(xiàn)可疑值1個,離群值2個;對于樣品C,計算發(fā)現(xiàn)離群值2個;對于樣品D,計算發(fā)現(xiàn)離群值1個。
格拉布斯檢驗法是對實驗室檢測結(jié)果的平均值進(jìn)行統(tǒng)計,從而剔除離群值。在數(shù)據(jù)量較少時,其對應(yīng)的臨界值越小,那么剔除離群值的概率就較大。在數(shù)據(jù)量較大時,其對應(yīng)的臨界值越大,那么剔除離群值的概率就較低。
對于本次實驗室間比對樣品的參考值,不同的統(tǒng)計方法依據(jù)不同的統(tǒng)計量來反映。穩(wěn)健統(tǒng)計法采用中位值反映樣品的參考值,而科克倫檢驗與格拉布斯檢驗則采用總平均值??偲骄挡⒉皇菍σ唤M數(shù)據(jù)計算其平均值得到的,而是首先通過科克倫檢驗法對標(biāo)準(zhǔn)偏差進(jìn)行評價剔除離群值,然后通過格拉布斯檢驗法剔除平均值的離群值,之后再對剩余的數(shù)據(jù)計算平均值即為總平均值。
表4 實驗室間比對格拉布斯統(tǒng)計結(jié)果
通過對本次實驗室間比對數(shù)據(jù)的計算,得到的參考值與離群情況見表5、表6。
表5 實驗室間比對參考值比較
表6 實驗室間比對結(jié)果統(tǒng)計
由表5、表6可以看出,雖然通過穩(wěn)健統(tǒng)計法判定出的可疑值與離群值數(shù)量與通過科克倫檢驗法和格拉布斯檢驗法剔除的可疑值與離群值數(shù)量有較大的差別,但是兩種統(tǒng)計方法計算的樣品參考值是很接近的。由此可以看出,穩(wěn)健統(tǒng)計法和由科克倫檢驗法與格拉布斯檢驗法組合檢驗這兩種檢驗方法的統(tǒng)計參數(shù)受極端值的影響都不大。
通過對此次實驗室間比對數(shù)據(jù)的分析統(tǒng)計,可以看出,穩(wěn)健統(tǒng)計法不受數(shù)據(jù)量多少的影響,而且受極端值的影響也不大。由科克倫檢驗法與格拉布斯檢驗法組合檢驗的統(tǒng)計方法,受數(shù)據(jù)量多少的影響較大,而受極端值的影響較小。不過兩種統(tǒng)計方法相比較,穩(wěn)健統(tǒng)計法在數(shù)據(jù)處理和計算程序上更加科學(xué)、直觀和簡潔方便。