崔 嵩,李一凡,2,馬萬(wàn)里,田崇國(guó),賈宏亮,張 志,齊 虹,劉麗艷
(1.哈爾濱工業(yè)大學(xué)城市水資源與水環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室國(guó)際持久性有毒物質(zhì)聯(lián)合研究中心,150090 哈爾濱,cuisong-bq@163.com;2.加拿大環(huán)境部科學(xué)技術(shù)局,M3H 5T4 加拿大多倫多;3.中國(guó)科學(xué)院煙臺(tái)海岸帶研究所,264003 山東煙臺(tái);4.大連海事大學(xué)國(guó)際持久性有毒物質(zhì)聯(lián)合研究中心,116023 遼寧大連)
哈爾濱大氣中多環(huán)芳烴污染的FCM聚類(lèi)算法
崔 嵩1,李一凡1,2,馬萬(wàn)里1,田崇國(guó)3,賈宏亮4,張 志1,齊 虹1,劉麗艷1
(1.哈爾濱工業(yè)大學(xué)城市水資源與水環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室國(guó)際持久性有毒物質(zhì)聯(lián)合研究中心,150090 哈爾濱,cuisong-bq@163.com;2.加拿大環(huán)境部科學(xué)技術(shù)局,M3H 5T4 加拿大多倫多;3.中國(guó)科學(xué)院煙臺(tái)海岸帶研究所,264003 山東煙臺(tái);4.大連海事大學(xué)國(guó)際持久性有毒物質(zhì)聯(lián)合研究中心,116023 遼寧大連)
為提高環(huán)境中持久性有毒物質(zhì)殘留水平的分析能力,以2007年1~4月哈爾濱市4個(gè)不同功能區(qū)域(市區(qū)—郊區(qū)—農(nóng)村—偏遠(yuǎn)地區(qū))的大氣中多環(huán)芳烴(PAHs)的監(jiān)測(cè)質(zhì)量濃度為數(shù)據(jù)樣本,運(yùn)用模糊C均值聚類(lèi)算法作為樣本聚類(lèi)的方法,研究該地區(qū)2007年春季大氣中PAHs的分布特征,并得到不同樣本的聚類(lèi)中心以及樣本的隸屬度矩陣,為樣本的特征分析提供量化依據(jù).分類(lèi)結(jié)果發(fā)現(xiàn):城市工業(yè)區(qū)的污染狀況最為嚴(yán)重,農(nóng)村地區(qū)和介于市區(qū)和工業(yè)區(qū)的居民區(qū)的區(qū)域次之,而遠(yuǎn)離污染源的市內(nèi)居民區(qū)、城市上風(fēng)向和偏遠(yuǎn)地區(qū)污染較輕.分析結(jié)果表明,哈爾濱市區(qū)大氣中PAHs主要來(lái)自于燃煤和工業(yè)排放,農(nóng)村大氣中的PAHs主要來(lái)自于農(nóng)作物秸稈的燃燒.市區(qū)和農(nóng)村地區(qū)大氣中PAHs對(duì)于人類(lèi)的健康存在較大潛在威脅.
哈爾濱;大氣;多換芳烴;模糊C均值聚類(lèi)
多環(huán)芳烴(PAHs)作為環(huán)境中一種廣泛存在的持久性有毒物質(zhì)(PTSs),具有致癌性、生物富集性和長(zhǎng)距離遷移特性,并且有些PAHs還具有致癌、致畸及致突變等“三致”效應(yīng).在眾多污染源中,垃圾焚燒、煤的燃燒、煉油廠、焦化廠以及汽車(chē)等機(jī)動(dòng)車(chē)輛尾氣的排放是 PAHs的主要來(lái)源[1].PAHs存在于大氣、土壤、植物和水體等環(huán)境介質(zhì)中,可以通過(guò)皮膚接觸、呼吸作用及食物鏈進(jìn)入人體,對(duì)人體造成潛在的危害,因此,開(kāi)展PAHs的研究對(duì)環(huán)境影響評(píng)價(jià)具有重要意義[2-4].
聚類(lèi)分析就是將所研究的數(shù)據(jù)對(duì)象,根據(jù)其相似性分組成多個(gè)簇或類(lèi),使其在同一簇中組分之間的相似度較高,而在不同簇中的組分差別則較大[5].模糊聚類(lèi)算法與硬聚類(lèi)(每一元素只能歸屬于某一類(lèi))算法相比較而言,在作樣本分析時(shí)能夠很好地體現(xiàn)樣本特征,同時(shí)模糊聚類(lèi)引入了隸屬度的概念,能夠更好地給出樣本分屬于各類(lèi)的隸屬度,從而為制定相關(guān)的決策提供有價(jià)值的參考依據(jù).在模糊 C均值(Fuzzy C-Means,F(xiàn)CM)聚類(lèi)算法中,每一個(gè)數(shù)據(jù)點(diǎn)都按照一定的隸屬度隸屬于某一聚類(lèi)中心.這一聚類(lèi)技術(shù),首先由Dunn于1974年提出,并由Jim Bezdek于1981年改進(jìn)[6].該方法提供了一種如何將多維空間分布的數(shù)據(jù)點(diǎn)分組成特定數(shù)目群的途徑,并且該方法首先隨機(jī)選取若干聚類(lèi)中心,所有數(shù)據(jù)點(diǎn)都被賦予對(duì)聚類(lèi)中心一定的模糊隸屬度,然后通過(guò)迭代方法不斷修正聚類(lèi)中心,迭代過(guò)程中以極小化所有數(shù)據(jù)點(diǎn)到各個(gè)聚類(lèi)中心的距離與隸屬度值的加權(quán)和為優(yōu)化目標(biāo)[7].在實(shí)際應(yīng)用中,由于模糊 C均值聚類(lèi)算法是基于距離的算法,這就使得聚類(lèi)結(jié)果可能會(huì)受到數(shù)據(jù)集中孤立點(diǎn)的影響.目前,F(xiàn)CM已應(yīng)用于多種領(lǐng)域,如醫(yī)學(xué)診斷、目標(biāo)識(shí)別、沉積物污染特征、巖石分類(lèi)、顧客關(guān)系管理[8]等,但該方法用于環(huán)境影響評(píng)價(jià)的報(bào)道很少.本文采用模糊C均值聚類(lèi)算法,以2007年春季哈爾濱大氣氣相中16種PAHs為屬性指標(biāo),在技術(shù)上對(duì)不同功能區(qū)進(jìn)行了聚類(lèi),并對(duì)聚類(lèi)結(jié)果進(jìn)行了分析,以期能夠更好地研究該地區(qū)大氣中PAHs的分布特征,為進(jìn)一步研究PAHs污染所造成的區(qū)域性環(huán)境污染評(píng)價(jià)進(jìn)行初探,為環(huán)境保護(hù)部門(mén)制定相應(yīng)的決策提供科學(xué)依據(jù).
本文將模糊C均值聚類(lèi)算法應(yīng)用于區(qū)域性環(huán)境污染評(píng)價(jià),其基本原理為:首先假設(shè)聚類(lèi)目標(biāo)X={x1,x2,…,xn}∈ Rs是存在于一個(gè) s維實(shí)數(shù)空間Rs中的有限樣本數(shù)據(jù)集,n表示樣本數(shù)據(jù)集中的元素個(gè)數(shù),本研究中樣本數(shù)據(jù)集為8個(gè),每個(gè)樣本數(shù)據(jù)集中的元素個(gè)數(shù)為16個(gè),即不同的采樣點(diǎn)所監(jiān)測(cè)到的大氣中多環(huán)芳烴的種類(lèi).設(shè)ci為FCM聚類(lèi)算法把樣本數(shù)據(jù)聚為c個(gè)模糊類(lèi)時(shí),每一個(gè)類(lèi)i相應(yīng)的聚類(lèi)中心,dij=||ci-xi||為歐幾里得距離,表示為ci中的第i個(gè)聚類(lèi)中心與第j個(gè)數(shù)據(jù)點(diǎn)間的距離,m∈[1,∞)為加權(quán)指數(shù),U={uij}為隸屬度,是一個(gè)c×n維的矩陣,且它們須:
FCM聚類(lèi)算法的基本過(guò)程就是求在約束條件式(1)成立的情況下,式(2)取最小值時(shí)的數(shù)值解.式(1)表示樣本中每個(gè)元素屬于各類(lèi)的隸屬度之和為1;式(2)則表示判定距離之和的目標(biāo)函數(shù).該算法的特點(diǎn)是,類(lèi)數(shù)c需要事先給出才能進(jìn)行下一步運(yùn)算[9-10].
FCM聚類(lèi)算法的具體運(yùn)算步驟如下:1)給出擬定的分類(lèi)數(shù)c和相應(yīng)的加權(quán)指數(shù)m;2)初始化隸屬矩陣U,用值在[0,1]區(qū)間的隨機(jī)數(shù)進(jìn)行初始化,同時(shí)使其滿足約束條件(1);3)計(jì)算相應(yīng)的c個(gè)聚類(lèi)中心ci,i=1,…c;4)計(jì)算目標(biāo)函數(shù)(2),如果某個(gè)給定的閾值大于J值,或者J值的改變量相對(duì)于上一次仍小于某個(gè)閾值時(shí),則停止運(yùn)算;否則重新計(jì)算隸屬矩陣U,并返回上一步驟.
聚類(lèi)有效性的判別是對(duì)聚類(lèi)結(jié)果客觀合理性的驗(yàn)證,應(yīng)用MATLAB7.1提供的模糊邏輯工具箱(Fuzzy Logic Toolbox)中的fcm函數(shù)可以很好地對(duì)樣本數(shù)據(jù)進(jìn)行聚類(lèi),此時(shí),只需要輸入樣本所分的類(lèi)數(shù)c,即初始變量,就可以得出相應(yīng)的結(jié)果.但是,有關(guān)初始變量c值的給定,在某種程度上存在一定的主觀性,因?yàn)閏值的不同會(huì)導(dǎo)致不同的聚類(lèi)結(jié)果,即使在同一c值的情況下,也可能產(chǎn)生不同的結(jié)果.這是由于算法結(jié)果本身過(guò)分地依賴于初始給定值,而初始值的給定在具體的計(jì)算過(guò)程中又是隨機(jī)的,有時(shí)也會(huì)不可避免地造成局部最優(yōu)而并非能夠達(dá)到全局最優(yōu)[11-13],而這就可能導(dǎo)致計(jì)算結(jié)果對(duì)真實(shí)情況產(chǎn)生偏差,此時(shí),就需要考慮聚類(lèi)的有效性問(wèn)題.而聚類(lèi)的有效性問(wèn)題一般可以通過(guò)建立有效性函數(shù)的方法來(lái)加以解決.這種函數(shù)通常用于衡量聚類(lèi)的分離度和緊密度,并以此來(lái)判定聚類(lèi)的有效性.1991年由XIE,X L和BENI,G共同提出的模糊聚類(lèi)有效性函數(shù),可以很好地解決這個(gè)問(wèn)題,具體判別如下:
其中:c為所劃分的類(lèi)數(shù),n為所采集數(shù)據(jù)點(diǎn)的個(gè)數(shù),Vi為第i類(lèi)的聚類(lèi)中心,Vk為第k類(lèi)的聚類(lèi)中心,μik(i=1,2,…,c;k=1,2,…,n)為第k個(gè)點(diǎn)屬于第i類(lèi)的模糊隸屬度,‖Vi-Vk‖2表示第i個(gè)聚類(lèi)中心和第j個(gè)聚類(lèi)中心之間的距離最小值,用來(lái)衡量類(lèi)間的分離度;表示每一點(diǎn)到其相應(yīng)聚類(lèi)中心的平均偏差和,用來(lái)衡量每一類(lèi)的緊密度.通常一個(gè)好的聚類(lèi)結(jié)果應(yīng)該是,具有相同特征的數(shù)據(jù)點(diǎn)盡可能地劃分為同一類(lèi),具有不同特征的數(shù)據(jù)點(diǎn)盡可能地劃分為不同的類(lèi)別,即S值越大,表明所有的聚類(lèi)都是分離的,S越小,表明所有聚類(lèi)緊密且相互獨(dú)立,聚類(lèi)效果越好.
根據(jù)大量研究和使用經(jīng)驗(yàn),以及相關(guān)理論依據(jù)給出[14],通常 c的范圍在[2],通過(guò)計(jì)算c在其取值范圍2≤c≤內(nèi),每個(gè)整數(shù)c所對(duì)應(yīng)的S值,進(jìn)一步比較取不同c值所對(duì)應(yīng)的S值,當(dāng)S值達(dá)到最小時(shí)所對(duì)應(yīng)的c值即為所求的聚類(lèi)數(shù),此時(shí),所取的類(lèi)數(shù)c獲得聚類(lèi)的效果最好,且符合客觀實(shí)際,從而減少計(jì)算可能導(dǎo)致的結(jié)果偏差.
選擇哈爾濱地區(qū)為研究區(qū)域,大氣樣品的采集、16種PAHs的分析等詳見(jiàn)文獻(xiàn)[1].2007年春季(從1月末至4月末),在哈爾濱地區(qū),根據(jù)不同功能區(qū)特點(diǎn),系統(tǒng)布設(shè)市區(qū)3個(gè)(UR)、郊區(qū)1個(gè)(SU)、農(nóng)村3個(gè)(RU)和偏遠(yuǎn)地區(qū)1個(gè)(BA)等8個(gè)采樣點(diǎn),利用聚氨酯泡沫材料(PUF)被動(dòng)采樣器進(jìn)行大氣樣品的采集,采樣時(shí)間從放置被動(dòng)采樣器至樣品取回,為一次監(jiān)測(cè)并按監(jiān)測(cè)天數(shù)取平均值,樣品的分析以及PAHs質(zhì)量濃度數(shù)據(jù)的獲得均在哈爾濱工業(yè)大學(xué)國(guó)際持久性有毒物質(zhì)聯(lián)合研究中心(IJRC-PTS)實(shí)驗(yàn)室進(jìn)行.有關(guān)研究表明,應(yīng)用PUF被動(dòng)采樣器進(jìn)行污染物大氣質(zhì)量濃度的監(jiān)測(cè),能夠獲得大氣中污染物的準(zhǔn)確質(zhì)量濃度,但是也受很多客觀因素的影響,其中采集氣體的體積為主要影響因素,采樣體積一般可以通過(guò)采樣速率和采樣時(shí)間計(jì)算得出.大量的研究表明,PUF的采樣平均速率通常在 3~4 m3/d[15-16],因 此,假 定 該 地 區(qū) 采 樣 速 率 為3.5 m3/d,從而得到每立方米PAHs的具體質(zhì)量濃度數(shù)值.采樣點(diǎn)分布和詳細(xì)情況見(jiàn)文獻(xiàn)[1],哈爾濱市大氣中16種 PAHs的平均質(zhì)量濃度見(jiàn)表1.
表1 哈爾濱市大氣中16種PAHs平均質(zhì)量濃度[1] ng·m-3
1)使用MATLAB7.1中的FCM函數(shù)對(duì)以上數(shù)據(jù)進(jìn)行聚類(lèi)運(yùn)算,并進(jìn)行聚類(lèi)有效性的判定,得到如下結(jié)果:
對(duì)聚類(lèi)有效性函數(shù)(3),確定類(lèi)數(shù)c.一般地,取經(jīng)驗(yàn)值m=2,分母權(quán)值均為1,由于本文采樣點(diǎn)數(shù)有限,當(dāng)類(lèi)數(shù)2≤c≤ 2時(shí),c只能取2,由此得到聚類(lèi)中心矩陣為
然而當(dāng)n為3時(shí),得到的聚類(lèi)中心矩陣為
聚類(lèi)中心點(diǎn)在各個(gè)維的取值均表征了該類(lèi)的特征,由此可以看出,當(dāng)n=3時(shí),即分為3類(lèi)時(shí),特征比較明顯,此時(shí)S值也為最小.
2)隸屬度矩陣U.隸屬度矩陣U為一個(gè)3×8的矩陣,這表示8個(gè)不同功能區(qū)域分別屬于3種類(lèi)型的隸屬度.由于所劃分的功能區(qū)域即采樣區(qū)域數(shù)目有限,在此任取兩個(gè)樣本點(diǎn)作以分析.
從以上兩個(gè)樣本可以看出,矩陣U1及U2每一列的和均為1,符合每一樣本的各類(lèi)隸屬度之和為1的前提.因此,取樣本中每一列的最大值,則最大值所在的行數(shù)就表示該樣本屬于其相應(yīng)的類(lèi)型.例如樣本1,其最大值在第3行,所以屬于第3種類(lèi)型;而樣本2,取其最大值則屬于第2種類(lèi)型,但從結(jié)果中可以分析出,樣本2還兼具有類(lèi)型3的特征,說(shuō)明這一樣本有可能處于農(nóng)村地區(qū)并且該地區(qū)介于城市與偏遠(yuǎn)地區(qū)之間.
通過(guò)以上運(yùn)算還可具體得到單個(gè)樣本所屬類(lèi)型,如表2所示.
表2 樣本所屬類(lèi)型
3)聚類(lèi)結(jié)果分析.從聚類(lèi)結(jié)果可以看出,城區(qū)環(huán)境中PAHs的主要來(lái)源是人類(lèi)活動(dòng),主要包括煤或石油化工等燃料的不完全燃燒.在本研究中,大氣中PAHs的質(zhì)量濃度最大值出現(xiàn)在UR3,該采樣點(diǎn)處在哈爾濱市內(nèi)的主要工業(yè)區(qū)內(nèi),石油化工、金屬冶煉等工業(yè)源排放及汽車(chē)等機(jī)動(dòng)車(chē)的尾氣排放,取暖燃煤,可能是導(dǎo)致該采樣點(diǎn)高含量PAHs的原因.其中取暖用煤的不完全燃燒可能是導(dǎo)致該地區(qū)春季大氣中PAHs高質(zhì)量濃度的主要原因,哈爾濱地區(qū)供暖一般在每年的4月中旬結(jié)束.本研究中采集時(shí)間為1月末~4月末,正好處在冬春季采暖期,市區(qū)供暖燃燒用煤會(huì)產(chǎn)生大量PAHs,從而導(dǎo)致大氣中 PAHs質(zhì)量濃度相應(yīng)增加.
第二類(lèi)結(jié)果,其污染源可能主要來(lái)自于農(nóng)村地區(qū)(RU1,RU3)的供暖,東北地區(qū)農(nóng)村冬春兩季大多采用燃燒秸稈和木材取暖以及烹飪,有研究表明,冬季采取煤炭和秸稈等取暖普遍存在于中國(guó)北部平原地區(qū)[17].而市區(qū)內(nèi)介于工業(yè)區(qū)和居民區(qū)之間的區(qū)域(UR2)屬于這一類(lèi)的原因可能是區(qū)域內(nèi)的燃煤供暖及汽車(chē)尾氣的排放.
第三類(lèi)為城市上風(fēng)向(SU1,RU2)、偏遠(yuǎn)地區(qū)(BA1)及遠(yuǎn)離污染源的市內(nèi)居民區(qū)(UR1),由于北方冬春兩季受北風(fēng)的影響以及風(fēng)力作用會(huì)對(duì)這些區(qū)域大氣中的PAHs產(chǎn)生稀釋作用,另外市內(nèi)居民區(qū)內(nèi)沒(méi)有大量的PAHs排放源如工業(yè)排放、汽車(chē)尾氣及燃煤供暖等,所以會(huì)導(dǎo)致這些區(qū)域大氣氣相中PAHs的質(zhì)量濃度較低.
1)相對(duì)于硬聚類(lèi)方法,模糊C均值聚類(lèi)能夠很好地對(duì)所研究的不同功能區(qū)域進(jìn)行聚類(lèi),當(dāng)然,將模糊C均值聚類(lèi)算法用于不同功能區(qū)域樣本特征進(jìn)行聚類(lèi)還存在尚待解決的問(wèn)題.基于距離的模糊c均值聚類(lèi)算法,由于樣本點(diǎn)較少或存在孤立點(diǎn)可能會(huì)影響到聚類(lèi)的效果,另外,該算法所存在的局限性在于,算法本身需要事先給出所需聚類(lèi)的類(lèi)數(shù)即參數(shù)c,這就會(huì)導(dǎo)致算法結(jié)果對(duì)這個(gè)參數(shù)十分敏感,c取值的不同,聚類(lèi)的結(jié)果也會(huì)截然不同,因此,對(duì)于使用者來(lái)說(shuō),這個(gè)算法還需要根據(jù)實(shí)際情況加以判斷.而聚類(lèi)有效性函數(shù)的搜索范圍在其他文獻(xiàn)的研究中能夠起到很好的效果,在本文中卻并不適用,可能是由于本文樣本點(diǎn)較少所導(dǎo)致.然而本文的實(shí)際聚類(lèi)效果卻比較理想.
2)市區(qū)工業(yè)區(qū)內(nèi)的受污染程度最大,而上風(fēng)向和偏遠(yuǎn)地區(qū)的污染相對(duì)較小.由于本文的研究范圍為冬春季,分類(lèi)結(jié)果也可對(duì)我國(guó)北方同時(shí)期不同功能區(qū)域大氣污染分布特征的研究起到借鑒意義.另外,分類(lèi)結(jié)果也表明,市區(qū)工業(yè)區(qū)和農(nóng)村地區(qū)由于季節(jié)性燃煤和秸稈的燃燒導(dǎo)致PAHs在大氣中的質(zhì)量濃度增多,對(duì)人類(lèi)的健康可能存在較大的潛在威脅,這也可為進(jìn)一步對(duì)人類(lèi)健康風(fēng)險(xiǎn)評(píng)價(jià)的研究起到一定的參考作用.
[1]馬萬(wàn)里,李一凡,孫德智,等.哈爾濱市大氣氣相中多環(huán)芳烴的研究[J].環(huán)境科學(xué),2009,30(11):49-54.
[2]WANG X P,XU B Q,KANG S C,et al.The historical residue trends of DDT,hexachlorocyclohexanes and polycyclic aromatic hydrocarbons in an ice core from Mt.Everest,central Himalayas,China[J].Atmos Environ,2008,42(27):6699-6709.
[3]HUNG H,BLANCHARD T P,HALSALL C J,et al.Temporal and spatial variabilities of atmospheric polychlorinated biphenyls(PCBs),organochlorine(OC)pesticides and polycyclic aromatic hydrocarbons(PAHs)in the Canadian Arctic:results from a decade of monitoring[J].Sci Total Environ,2005,342(1/3):119-144.
[4]SIMCIK M F,EISENREICH S J,LIO Y P J.Source apportionment and source/sink relationships of Polycyclic Aromatic Hydrocarbons(PAHs)in the coastal atmosphere of Chicago and Lake Michigan[J].Atmos Environ,1999,33(30):5071-5079.
[5]HSU T H.An application of fuzzy clustering in grouppositioning analysis[J].Proc Natl Sci,Counc ROC(C),2000,10(2):157 -167.
[6]MICHALOPOULOS M,DOUNIAS G D,THOMAIDIS N T.Decision making using fuzzy C-means and inductive machine learning for managing bank branches performance [EB/OL]. http://citeseer. nj. nec. com/458829,html,2002.
[7]吳曉莉,林哲輝.MATLAB輔助模糊系統(tǒng)設(shè)計(jì)[M].西安:西安電子科技大學(xué)出版社,2002:158-159.
[8]梁靜國(guó),張亞光,戈華.CRM中的模糊C均值(FCM)客戶聚類(lèi)算法研究[J].哈爾濱工程大學(xué)學(xué)報(bào),2004,25(2):257-260.
[9]XIE X L,BENI G.A validity measure for fuzzy clustering[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1991,13(8):841 -847.
[10]HAN J,MICHELINE K.數(shù)據(jù)挖掘:概念與技術(shù)[M].范明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2001:126-128.
[11]張智星,張春在,[日]水谷英二.神經(jīng)-模糊和軟計(jì)算[M].西安:西安交通大學(xué)出版社,2000:93-97.
[12]劉小覽,趙英凱,陸金桂.數(shù)據(jù)挖掘中Fuzzy C-means的自適應(yīng)聚類(lèi)算法[J].南京化工大學(xué)學(xué)報(bào):自然科學(xué)版,2001,23(5):23 -25.
[13]吳成茂,范九倫.基于數(shù)據(jù)劃分最大信息的聚類(lèi)有效性函數(shù)[J].西安電子科技大學(xué)學(xué)報(bào):自然科學(xué)版,2001,28(6):781 -784.
[14]于劍,程乾生.模糊聚類(lèi)方法中的最佳聚類(lèi)數(shù)的搜索范圍[J].中國(guó)科學(xué):E 輯,2002,32(2):274-280.
[15]ZHANG Z,LIU L,LI Y F,et al.Analysis of polychlorinated biphenyls in concurrently sampled Chinese air and surface soil[J].Environ Sci Technol,2008,42(17):6514-6518.
[16]SHOEIB M,HARNER T.Characterization and comparison of three passive air samplers for persistent organic pollutants[J].Environ Sci Technol,2002,36(19):4142-4151.
[17]LIU S Z,TAO S,LIU W X,et al.Atmospheric polycyclic aromatic hydrocarbons in north China:a wintertime study[J].Environ Sci Technol,2007,41(24):8256-8261.
Source identification and spatial characterization of polycyclic aromatic hydrocarbons in Harbin air by using fuzzy C-means clustering algorithm
CUI Song1,LI Yi-fan1,2,MA Wan-li1,TIAN Chong-guo3,JIA Hong-liang4,ZHANG Zhi1,QI Hong1,LIU Li-yan1
(1.International Joint Research Center for Persistent Toxic Substances,State Key Laboratory of Urban Water Resource and Environment,Harbin Institute of Technology,150090 Harbin,China,cuisong - bq@163.com;2.Science and Technology Branch,Environment Canada,M3H 5T4,Toronto,Ontario Canada;3.Yantai Institute of Coastal Ione Research,Chinese Academy of Sciences,264003 Yantai,Shandong,China;4.International Joint Research Center for Persistent Toxic Substances,Dalian Maritime University,116023 Dalian,Liaoning,China)
To improve the analysis ability of residue levels of persistent toxic substances(PTS)in environment,this paper investigated the distribution characteristics of air concentrations of polycyclic aromatic hydrocarbons(PAHs)during the Spring of 2007(January to April)in 4 different functional areas(urban,suburban,rural,and remote areas)in and near the Harbin metropolitan by using the fuzzy C -means clustering algorithm,and got the cluster centers of different samples and a membership matrix which offered quantity foundation for analysis of samples description.Results showed that the contamination level in the urban industrial area was the highest,followed by those in the other urban places and rural area,and the contamination levels in the remote area and in the places on the windward were the lowest.PAHs in Harbin urban atmospheric were mainly from coal- burning and industrial emissions,those in rural areas were mainly from the burning of crop stalks.PAHs in air in this region have imposed a potential threat on human health.
Harbin;air;polycyclic aromatic hydrocarbons;fuzzy C-means clustering algorithm
X823
A
0367-6234(2011)08-0065-05
2009-12-28.
城市水資源與水環(huán)境國(guó)家重點(diǎn)實(shí)驗(yàn)室自主課題項(xiàng)目(2008DX01).
崔 嵩(1981—),男,博士研究生;
李一凡(1949—),男,教授,博士生導(dǎo)師.
(編輯 劉 彤)