李海峰 史乃捷 王 軍 唐一川 馬聯(lián)弟
摘要建立了一種基于對能力驗(yàn)證數(shù)據(jù)進(jìn)行聚類分析的方法,克服了以往采用穩(wěn)健統(tǒng)計方法處理的層次性和深度不足的缺陷,可將參加實(shí)驗(yàn)室按測試結(jié)果及相似性進(jìn)行分組,便于對檢測過程存在問題的查找和分析,也有利于檢測實(shí)驗(yàn)室對自身測試水平的認(rèn)識和評價。
關(guān)鍵詞聚類分析;穩(wěn)健統(tǒng)計方法;計量;對比
中圖分類號 O212.1 文獻(xiàn)標(biāo)識碼A文章編號 1007-5739(2009)06-0258-06
聚類分析(Cluster Analysis)是進(jìn)行數(shù)據(jù)統(tǒng)計分析的一類重要工具[1-5],廣泛應(yīng)用于商業(yè)、經(jīng)濟(jì)、醫(yī)藥等領(lǐng)域,通過數(shù)據(jù)分類獲得有用的統(tǒng)計信息,是多元統(tǒng)計分析的一個重要分支,根據(jù)分類對象的數(shù)量指標(biāo),定量地確定分類對象之間的相似關(guān)系并進(jìn)行分類。聚類分析中應(yīng)用廣泛的是層次聚類法和K-Means算法。能力驗(yàn)證,作為我國實(shí)現(xiàn)量值溯源并確保分析實(shí)驗(yàn)室數(shù)據(jù)可靠、準(zhǔn)確一致的重要工具,發(fā)揮著日益廣泛和深入的作用[6]。在數(shù)據(jù)處理上一般采用穩(wěn)健統(tǒng)計方法進(jìn)行評價[7-11]。
穩(wěn)健統(tǒng)計方法是世界各國計量機(jī)構(gòu)在組織能力驗(yàn)證或國際比對中常用的統(tǒng)計方法,該方法在數(shù)據(jù)非正態(tài)分布或存在離群值時優(yōu)勢明顯,Z比分?jǐn)?shù)為其評價的重要指標(biāo)[12]。其缺點(diǎn)是提供信息較少,缺乏深入和細(xì)致的描述,無法描述實(shí)驗(yàn)室數(shù)據(jù)相關(guān)性之間的聯(lián)系。當(dāng)測試對象為多元素或多組分時,只能單個項(xiàng)目分析,缺乏整體判斷和描述,無法適應(yīng)比對內(nèi)容與對象不斷增加的趨勢[13]。
本文嘗試將聚類分析應(yīng)用在能力驗(yàn)證數(shù)據(jù)處理中,結(jié)合穩(wěn)健統(tǒng)計方法,以獲得更加細(xì)致全面的數(shù)據(jù)信息。通過把不同實(shí)驗(yàn)室測量數(shù)據(jù)劃分為不同的集合和小組,方便對能力驗(yàn)證數(shù)據(jù)的分析和比對原因的查找,可對不同實(shí)驗(yàn)室的共性問題,如測量方法的比較等進(jìn)行深入的探討,為化學(xué)計量領(lǐng)域理論和實(shí)踐中深入處理實(shí)驗(yàn)數(shù)據(jù)提供方法基礎(chǔ)和探討依據(jù)。通過文獻(xiàn)檢索,目前國內(nèi)外尚無類似報道。
本文將聚類分析與穩(wěn)健統(tǒng)計方法結(jié)合起來,對CNAS T0402糧食中重金屬鉛、鎘含量測定的數(shù)據(jù)進(jìn)行處理。中國合格評定國家認(rèn)可委員會于2008年組織的全國范圍的一次能力驗(yàn)證,由中國計量科學(xué)研究院組織實(shí)施,其目的是了解我國目前糧食檢測機(jī)構(gòu)實(shí)際的測量水平和潛在問題。研究表明,該方法可以分層次、多角度對數(shù)據(jù)進(jìn)行分析,具有廣泛的應(yīng)用價值。
1材料與方法
1.1能力驗(yàn)證樣品的制備
此次能力驗(yàn)證樣品選用河南省重金屬污染區(qū)生長的小麥,經(jīng)清理除雜,去除糠、麩皮以及子實(shí)、胚芽,用鄂式破碎機(jī)初碎,將候選物在70℃烘干24h,去除水分。用高鋁球磨機(jī)研磨36~48h,使樣品99%以上通過80目。制備好的樣品裝入清潔塑料桶中,封口保存。經(jīng)均勻性檢驗(yàn)合格后混勻分裝。用Co60輔照滅活,置于干燥陰涼處保存。
1.2樣品的均勻性和穩(wěn)定性
樣品采用等離子體發(fā)射光譜法(ICPOES)和等離子體質(zhì)譜法(ICPMS)進(jìn)行均勻性和穩(wěn)定性檢驗(yàn)。在均勻性檢驗(yàn)中,隨機(jī)抽取15瓶樣品,每瓶在上部和底部取2個樣品。每個樣品準(zhǔn)確稱取0.2g,加入5mL濃硝酸,用微波消解爐進(jìn)行消解。完畢待冷卻后,轉(zhuǎn)移到潔凈塑料瓶中,加入In或Y內(nèi)標(biāo),上機(jī)測試。經(jīng)F分析,樣品中Pb、Cd均勻性良好。經(jīng)t檢驗(yàn),樣品穩(wěn)定性檢驗(yàn)良好。
1.3推薦方法
此次能力驗(yàn)證推薦方法為GB/T5009.12-2003食品中鉛的測定方法和GB/T5009.15-2003食品中鎘的測定方法。
1.4數(shù)據(jù)統(tǒng)計分析方法和軟件
該研究選用SPSS軟件進(jìn)行數(shù)據(jù)處理。分層聚類分析子模塊,聚類法采用組間連接法(Between Groups Linkage),測度方法選擇歐氏距離平方(Squared Euclidean Distance),即2項(xiàng)之間的距離是每個變量值之差的平方和[14]。
2結(jié)果與討論
2.1采用分析方法的統(tǒng)計情況
在此次能力驗(yàn)證中,共采用4種測量方法,分別是原子吸收分析方法(AAS)、等離子體發(fā)射光譜法(ICPOES)、等離子體質(zhì)譜法(ICPMS)、原子熒光光譜法(AFS)(見表1)。綜合分析,AAS、ICP、ICPMS之間的比例接近7:1:1。這說明原子吸收作為國家標(biāo)準(zhǔn)GB/T5009.12-2003和GB/T5009.15-2003的推薦方法,在實(shí)驗(yàn)室分析領(lǐng)域仍占據(jù)相當(dāng)?shù)谋戎亍?/p>
2.2正態(tài)分布檢驗(yàn)
穩(wěn)健統(tǒng)計方法適合多種分布情況的數(shù)據(jù)分析,尤其分析非正態(tài)分布數(shù)據(jù)具有很大的優(yōu)勢。采用SPSS軟件進(jìn)行分析,鉛元素和鎘元素檢驗(yàn)結(jié)果分別為Asymy.sig=0.10和Asymy.sig=0.02。進(jìn)一步采用峰態(tài)系數(shù)和偏態(tài)系數(shù)法數(shù)據(jù)進(jìn)行檢驗(yàn)[15]。將數(shù)據(jù)匯總后,按從小到大排列,計算偏態(tài)系數(shù)和峰態(tài)系數(shù),分別用于檢驗(yàn)數(shù)據(jù)的不對稱性和峰態(tài)(見表 2)。數(shù)據(jù)表明,鉛的偏態(tài)系數(shù)遠(yuǎn)大于臨界值(n=67,P=0.95),鎘元素的偏態(tài)系數(shù)接近仍大于臨界系數(shù)(n=68,P=0.95)。原始數(shù)據(jù)的分布類型均為非正態(tài)分布。
2.3能力驗(yàn)證統(tǒng)計結(jié)果
能力驗(yàn)證結(jié)果見表3,采用穩(wěn)健變異系數(shù)和Z比分?jǐn)?shù)法進(jìn)行評價,其評價標(biāo)準(zhǔn)為|Z|≤2為滿意結(jié)果;2<|Z|<3為有問題的結(jié)果;|Z|≥3為不滿意(離群)結(jié)果。從表3可知,對鉛和鎘元素,分別有6家實(shí)驗(yàn)室和7家實(shí)驗(yàn)室Z比分?jǐn)?shù)離群,約占參加實(shí)驗(yàn)室總數(shù)的1/10。有人認(rèn)為當(dāng)參加實(shí)驗(yàn)室較多時,計算出的標(biāo)準(zhǔn)差可能偏小,易導(dǎo)致部分實(shí)驗(yàn)室的Z比分?jǐn)?shù)大于2,而被誤判為有問題或不滿意[16]。
2.4鉛數(shù)據(jù)分布特征
根據(jù)能力驗(yàn)證項(xiàng)目各實(shí)驗(yàn)室對小麥粉中鉛的測試結(jié)果之間的相似程度,用聚類分析進(jìn)行分組(見圖1)。由圖1可知,參加實(shí)驗(yàn)室可以劃分為2個組,其中22、39、25、3、49、50號為1組,標(biāo)記為1~2,鉛測定結(jié)果為0.60~1.04mg/kg,與表3所列中位值相比偏低;其余實(shí)驗(yàn)室為1組1-1。該組又可劃分為1-1-1、1-1-2,分別可進(jìn)一步細(xì)分為1-1-1-1、1-1-1-2和1-1-2-1、1-1-2-2共4組,在此基礎(chǔ)上仍可細(xì)分。分析數(shù)據(jù)可知,1-1-1-1的數(shù)據(jù)范圍為1.24~1.33mg/kg,1-1-1-2組主要集中在1.41~1.55mg/kg。1-1-2的數(shù)據(jù)范圍為1.61~1.81mg/kg。結(jié)合表3數(shù)據(jù),對于22、39、25、3、49、50號實(shí)驗(yàn)室,其Z比分?jǐn)?shù)分別為-2.5,-2.5,-2.2,-3.1,-4.0,-5.7。對于20、57、31、65、44號實(shí)驗(yàn)室其Z比分?jǐn)?shù)分別為2.6,2.4,3.8,3.8,3.3。Z比分?jǐn)?shù)絕對值大于2的實(shí)驗(yàn)室總數(shù)11家與圖中離群實(shí)驗(yàn)室一致,說明采用該2種分析方法有相似之處,均可實(shí)現(xiàn)對離群值的識別。
2.5鎘數(shù)據(jù)分布特征
根據(jù)參加實(shí)驗(yàn)室鎘的測試結(jié)果數(shù)據(jù)的相似性,通過聚類分析可以劃分為2個組,2-1和2-2。該組又可劃分為2-1-1、2-1-2,2-1-1可進(jìn)一步細(xì)分為2-1-1-1、2-1-1-2,在此基礎(chǔ)上仍可細(xì)分,如圖2所示。分析數(shù)據(jù)可知,2-1-1-1的數(shù)據(jù)范圍為0.065~0.078mg/kg,2-1-1-2組主要集中在0.081~0.086mg/kg,2-1-2只包括22號實(shí)驗(yàn)室,為0.050 mg/kg。其余實(shí)驗(yàn)室劃分為2-2號,包括29、39、30、23、53、36號實(shí)驗(yàn)室,測定結(jié)果大于0.098mg/kg,其Z比分?jǐn)?shù)分別為4.61、4.55、4.43、5.11、4.95。表4中穩(wěn)健統(tǒng)計方法Z比分?jǐn)?shù)絕對值大于2的實(shí)驗(yàn)室總數(shù)10家,不僅包括了圖2中2-2組,也包括了2-1-2組以及2-1-1-2組的9號、31號、25號實(shí)驗(yàn)室。從該圖中聚類分析結(jié)果可以看出,穩(wěn)健統(tǒng)計方法結(jié)合聚類分析可以對實(shí)驗(yàn)室的測試結(jié)果更好地進(jìn)行判斷,尤其是當(dāng)實(shí)驗(yàn)室測定結(jié)果處在臨界點(diǎn)附近時。
2.6綜合聚類分析
通過對參加鉛和鎘元素測定的實(shí)驗(yàn)室進(jìn)行統(tǒng)計分組(見圖3)??梢钥闯觯蠖鄶?shù)實(shí)驗(yàn)室集中在4個大組,分別是G1、G2、G3、G4。G1包括19、45、35、40、41、10、42、15、54、61、4、33、51號實(shí)驗(yàn)室。G2包括24、59、63、28、69、16、13、62、12、1、8、46、68、18、7、23、53、14、56、67、5、26、55、6號實(shí)驗(yàn)室。G3又可劃分為2組,即G3-1、G3-2,前者包括27、32、58、30、60、48、52、17、11、47、70、64、9、36號實(shí)驗(yàn)室;后者包括21、38、2、29、43號實(shí)驗(yàn)室。G4包括20、57、31、44、25、39、22、49、50號實(shí)驗(yàn)室。從圖3中可以很清楚的看到,不同實(shí)驗(yàn)室之間的聯(lián)系及在整個比對中的位置和狀況,尤其是對于相對離群的實(shí)驗(yàn)室而言,可能存在共性的問題。例如20、57號實(shí)驗(yàn)室劃分為1組,31、44號為1組,25、39、22號為1組,49、50號為1組。在表3中該組實(shí)驗(yàn)室大多數(shù)據(jù)離群,分析過程可能有類似的問題。如49、50號實(shí)驗(yàn)室,均采用原子吸收的分析方法,結(jié)果類似,鉛的測試結(jié)果均明顯偏低。通過分組的方法可以比較直觀地把實(shí)驗(yàn)室的情況表示出來,方便能力驗(yàn)證組織者和參加實(shí)驗(yàn)室對分析結(jié)果問題原因的查找和改正,為問題的解決提供更詳細(xì)的信息和指導(dǎo)。
通過表4數(shù)據(jù)可知,浙江、上海、江蘇、廣西、福建等地區(qū)參加的實(shí)驗(yàn)室主要集中在G1~G3,離群數(shù)目相對較少,整體水平較好。廣東與山東省參加實(shí)驗(yàn)室較多,分布相對均勻。廣東省實(shí)驗(yàn)室數(shù)據(jù)主要集中在G2和G3組,山東省數(shù)據(jù)主要集中在G2和G4組。四川省參加實(shí)驗(yàn)室主要集中在G3和G4組,說明離群實(shí)驗(yàn)室比例高于平均水平。
采用原子吸收方法的實(shí)驗(yàn)室占分組后納入統(tǒng)計的75%和69%,而且在G3和G4組所占比例稍高,說明參加實(shí)驗(yàn)室該測試技術(shù)仍有待提高;納入統(tǒng)計使用ICP、ICPMS、AFS各方法的實(shí)驗(yàn)室均在10%左右,落入G4組的比值均接近總體平均水平。使用ICPMS方法的實(shí)驗(yàn)室在G1組的比例較高,使用ICPOES方法的實(shí)驗(yàn)室在G2組的比例較高。對于鎘元素的分析,采用AFS方法的實(shí)驗(yàn)室主要集中在G1和G2組,整體較好??傮w上,由于采用ICP、ICPMS、AFS方法的實(shí)驗(yàn)室總數(shù)偏低,分組后各組數(shù)目更少,偶然性因素影響較大,尚不能下結(jié)論。
3小結(jié)
(1)穩(wěn)健統(tǒng)計方法和聚類分析均可對能力驗(yàn)證結(jié)果,尤其是非正態(tài)分布數(shù)據(jù),進(jìn)行統(tǒng)計分析,發(fā)現(xiàn)離群值。
(2)聚類分析可以對處于穩(wěn)健統(tǒng)計方法臨界值附近的實(shí)驗(yàn)室的判斷和歸屬提供依據(jù),2種方法可相互補(bǔ)充。
(3)作為多元統(tǒng)計分析工具,聚類分析可以對同時參加多項(xiàng)內(nèi)容測試的實(shí)驗(yàn)室進(jìn)行綜合分析,克服了穩(wěn)健統(tǒng)計分析只能單項(xiàng)逐一分析的缺點(diǎn)。如何對實(shí)驗(yàn)室整體水平進(jìn)行判斷,需要理論和實(shí)踐的進(jìn)一步發(fā)展,該研究提供了有益的嘗試。
(4)聚類分析可以根據(jù)研究目的,有針對性地深入開展研究。比如了解不同測試方法的比較,不同行業(yè)的測試結(jié)果以及不同地區(qū)的測試水平等。
4參考文獻(xiàn)
[1] 陳軍輝,謝明勇,傅博強(qiáng),等.西洋參中無機(jī)元素的主成分分析和聚類分析[J].光譜學(xué)與光譜分析,2006,26(7):1326-1329.
[2] 張志祥,劉鵬,康華靖,等.基于主成分分析和聚類分析的FTIR不同地理居群香果樹多樣性分化研究[J].光譜學(xué)與光譜分析,2008,28(9):2081-2086.
[3] 杜曉軍,姜鳳歧,焦志華.遼寧西部低山丘陵區(qū)植被恢復(fù)研究:基于演替理論和生態(tài)系統(tǒng)退化程度[J].應(yīng)用生態(tài)學(xué)報,2004,15(9):1507-1511.
[4] PRAVEENA S M,AHMED A,RADOJEVIC M,et al. Factor-Cluster Analysis and enrichment Study of Mangrove sediments-An example From Mengkabong,Sabah [J]. The Malaysian journal of Analytical Sciences, 2007,11(20):421-430.
[5] SANCHEZ LOPEZ F J, GIL GARCIA M D,MARTINEZ VIDAL JOSE L,et al. A.garrido frenich.assessment of metal contamination in donana national rark(spain)using crayfish(rpocamburus clarkii)[J].Environmental Monitoring and Assessment,2004(93):17-29.
[6] 紀(jì)潔.以CNAS T0250檢測能力驗(yàn)證為例談化學(xué)計量的重要性[J].中國計量,2008(8):67.
[7] 董亮星.能力驗(yàn)證中指定值的確定方法[J].中國計量,2006(10):70-71.
[8] 馬沖先.能力驗(yàn)證及其評價[J].理化檢驗(yàn)——化學(xué)分冊,2005(41):861-870.
[9] 宋國強(qiáng),施敏芳,李可芳,等. 用有證標(biāo)準(zhǔn)樣品進(jìn)行能力驗(yàn)證的方法探討[J].環(huán)境科學(xué)與技術(shù),2004,27(6):42-43.
[10] 王麗玲.能力驗(yàn)證、實(shí)驗(yàn)室比對常用統(tǒng)計技術(shù)及評定方法[J].中國衛(wèi)生檢驗(yàn)雜志,2006,16(8):985-986.
[11] 黃亨建,李萍,宋昊嵐,等.應(yīng)用質(zhì)量控制多規(guī)則分析能力驗(yàn)證結(jié)果[J].中華檢驗(yàn)醫(yī)學(xué)雜志,2006,29(9):839-840.
[12] 劉智敏.穩(wěn)健統(tǒng)計與實(shí)驗(yàn)室不確定度和能力驗(yàn)證[J].中國計量學(xué)院學(xué)報,2006,17(1):8-16.
[13] 王軍,趙墨田.同位素稀釋質(zhì)譜法測定IMEP-6水樣中的痕量鎘和鉛[J].環(huán)境化學(xué),2000,19(4):369-372.
[14] RICHARD AJOHNSON,DEAN W WICHEM.實(shí)用多元統(tǒng)計分析(第四版)[M]. 陸璇,譯.北京:清華大學(xué)出版社,2001.
[15] 全浩,韓永志.標(biāo)準(zhǔn)物質(zhì)及其應(yīng)用技術(shù)(第二版)[M].北京:中國標(biāo)準(zhǔn)出版社,2003.
[16] 徐建平,刁鳳鳴.Z比分?jǐn)?shù)在實(shí)驗(yàn)室能力驗(yàn)證檢測中的運(yùn)用[J].環(huán)境檢測管理與技術(shù),2003,15(1):42-43.