張慶慶,許月萍,牛少鳳,樓章華
(浙江大學(xué)水文與水資源研究所,浙江 杭州 310058)
水質(zhì)綜合評(píng)價(jià)是以定性的方式對(duì)水環(huán)境的總體狀況做出評(píng)價(jià),為水資源污染的控制和管理提供科學(xué)依據(jù)。由于水質(zhì)指標(biāo)的多樣性,選擇一個(gè)合理的綜合評(píng)價(jià)方法成為首要的問題。隨著新的數(shù)學(xué)方法在分類學(xué)中的廣泛應(yīng)用,新的水質(zhì)綜合評(píng)價(jià)方法層出不窮,如模糊數(shù)學(xué)法[1-3]、灰色系統(tǒng)理論法[4-5]、物元理論與可拓集合法等[6-7]。較常用的有灰色聚類法以及模糊綜合指數(shù)法等。然而,灰色聚類法和模糊綜合指數(shù)法的計(jì)算過程都相當(dāng)復(fù)雜, 雖然編寫程序可使運(yùn)算速度加快, 但由于白化函數(shù)和隸屬度函數(shù)的計(jì)算均要求水質(zhì)的污染程度與污染物濃度成正比,而對(duì)于像DO這樣濃度越高水質(zhì)越好的因子,則需要調(diào)整白化函數(shù)和隸屬度函數(shù)的計(jì)算公式。若每次水質(zhì)評(píng)價(jià)時(shí)選取的指標(biāo)不完全一樣, 則編寫的程序需作相應(yīng)調(diào)整后方可使用, 增加了評(píng)價(jià)工作的難度。
歐式距離是聚類分析中經(jīng)常使用的概念。Kodaz等[8]所提出的基于信息增益的人工免疫識(shí)別系統(tǒng)(IG-AIRS)正是利用基于信息的歐式距離從眾多疾病數(shù)據(jù)中識(shí)別出動(dòng)脈硬化;Mohamed等[9]通過計(jì)算輸入的英文字母與指定的相關(guān)參數(shù)之間的歐式距離建立了識(shí)別手寫字的分割算法;Ruzanski 等[10]在研究人類語音所反映的壓力水平時(shí),在包含頻率特征和Teager能量算子特征的多屬性空間中應(yīng)用歐式距離實(shí)現(xiàn)了對(duì)壓力水平的分類。同樣,水質(zhì)綜合評(píng)價(jià),作為一個(gè)多屬性分類問題,也可以借助歐式距離來完成。如果對(duì)歐氏距離賦予權(quán)重,則變成加權(quán)歐式距離。如果權(quán)重是變化的,則變成變權(quán)歐式距離。本文將利用變權(quán)歐式距離模型對(duì)水質(zhì)進(jìn)行評(píng)價(jià),并將變權(quán)歐式距離模型、灰色聚類法和模糊綜合指數(shù)法應(yīng)用于錢塘江支流東陽江水質(zhì)評(píng)價(jià),最后對(duì)三個(gè)評(píng)價(jià)結(jié)果進(jìn)行比較和理論分析。
為了將歐式距離應(yīng)用于水質(zhì)綜合評(píng)價(jià),必須考慮不同污染因子對(duì)于水質(zhì)影響程度的不同,即污染因子的權(quán)重。利用變權(quán)歐式距離模型對(duì)水質(zhì)進(jìn)行綜合評(píng)價(jià)的原理為:對(duì)于某一個(gè)待評(píng)價(jià)單元(即某個(gè)監(jiān)測(cè)斷面在某個(gè)監(jiān)測(cè)時(shí)間的各污染因子的監(jiān)測(cè)值),根據(jù)污染因子的污染貢獻(xiàn)率計(jì)算其權(quán)重,該權(quán)重對(duì)于每個(gè)監(jiān)測(cè)值都有所不同,所以稱為變權(quán)。另外,在根據(jù)污染貢獻(xiàn)率計(jì)算權(quán)重時(shí),應(yīng)將DO這種濃度越高污染越小的污染因子與其他濃度越高污染越重的污染因子區(qū)分開來。建立以各個(gè)污染因子為坐標(biāo)軸的n維空間,以水質(zhì)標(biāo)準(zhǔn)中的I級(jí)濃度限制為“原點(diǎn)”,然后結(jié)合污染因子的權(quán)重系數(shù)計(jì)算每個(gè)待評(píng)價(jià)單元以及水質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)中其他各級(jí)別水質(zhì)與“原點(diǎn)”間的變權(quán)歐式距離,并將后者作為劃分每個(gè)待評(píng)價(jià)單元水質(zhì)級(jí)別的標(biāo)準(zhǔn)。其計(jì)算步驟如下:
1.1.1 建立歐式空間。記i=1,2,…,m為待評(píng)價(jià)單元;j=1,2,…n為參與評(píng)價(jià)的污染因子;k=1,2,…5為根據(jù)地表水質(zhì)量標(biāo)準(zhǔn)劃分的水質(zhì)等級(jí);設(shè)實(shí)測(cè)樣本矩陣為C,cij(i=1,2,…m;j=1,2,…n)為第i個(gè)待評(píng)價(jià)單元第j個(gè)污染因子的實(shí)測(cè)濃度值。根據(jù)國家規(guī)定的水質(zhì)分級(jí)標(biāo)準(zhǔn),設(shè)含有n個(gè)污染因子的5級(jí)水質(zhì)標(biāo)準(zhǔn)矩陣為B,其中bjk(j=1,2,…n;k=1,2,…5)為第j個(gè)污染因子的第k級(jí)標(biāo)準(zhǔn)濃度限值。將C中的每一行和B中的每一列均看作以n個(gè)污染因子為坐標(biāo)軸的歐式空間中的點(diǎn)。
1.1.2 歐式空間坐標(biāo)轉(zhuǎn)換。將水質(zhì)標(biāo)準(zhǔn)矩陣B的Ⅰ級(jí)濃度限值作為歐式空間的原點(diǎn),則C和B的坐標(biāo)變?yōu)椋?/p>
(1)
(2)
1.1.3 權(quán)重的確定。根據(jù)污染貢獻(xiàn)率計(jì)算各個(gè)監(jiān)測(cè)值的權(quán)重,即某監(jiān)測(cè)值超標(biāo)倍數(shù)越多,其權(quán)重越大[2]:
(3)
式中,ωij,cij分別為第i個(gè)待評(píng)單元中第j個(gè)污染因子的權(quán)重和實(shí)測(cè)濃度;cij/bj1反映了污染因子的超標(biāo)量。
對(duì)于像DO這樣濃度越高,水質(zhì)越好的因子,上述權(quán)重系數(shù)的公式應(yīng)當(dāng)作出調(diào)整。因此,假設(shè)第λ(1≤λ≤n)個(gè)因子濃度越高,水質(zhì)越好,則第i個(gè)待評(píng)價(jià)單元中DO實(shí)測(cè)值的權(quán)重為:
(4)
1.1.4 變權(quán)歐式距離的確定。利用前述得出的ωij分別計(jì)算第i個(gè)待評(píng)價(jià)單元轉(zhuǎn)換后的坐標(biāo)和第k級(jí)水質(zhì)標(biāo)準(zhǔn)轉(zhuǎn)換后的坐標(biāo)到原點(diǎn)的變權(quán)歐式距離[11]:
(5)
(6)
可見0≤Δik≤1。 將δi與Δik比較即可判斷第i個(gè)待評(píng)價(jià)單元的水質(zhì)級(jí)別。
1.1.5 水質(zhì)綜合評(píng)價(jià)等級(jí)。當(dāng)δi≤1時(shí),若Δik≤δi≤Δi,k+1(k=1,2,…,p-1),對(duì)水質(zhì)進(jìn)行綜合評(píng)價(jià)的等級(jí)定義如下:
(7)
式中,k為待評(píng)價(jià)單元所屬水質(zhì)級(jí)別。當(dāng)δi>1時(shí),第i個(gè)待評(píng)價(jià)單元的水質(zhì)級(jí)別為Ⅴ類,即H=5。
1.2.1 灰色聚類法。灰色聚類分析的提出是為了解決分類學(xué)中的灰色性問題。該方法建立在灰數(shù)的白化函數(shù)生成的基礎(chǔ)上,通過對(duì)聚類對(duì)象進(jìn)行非等權(quán)白化來進(jìn)行分類,既考慮了水環(huán)境質(zhì)量系統(tǒng)的灰色性,也考慮了系統(tǒng)的白化程度。記i= 1, 2, …,m,i為聚類對(duì)象(即各待測(cè)評(píng)價(jià)單元);j= 1, 2, …,n,j為聚類指標(biāo)(即各污染因子);k= 1, 2, …,k為灰類(即各水質(zhì)級(jí)別)?;疑垲惙ㄔu(píng)價(jià)水質(zhì)的步驟如下[4]:
①對(duì)數(shù)據(jù)進(jìn)行無量綱化處理。
④根據(jù)聚類結(jié)果確定最終污染級(jí)別。
1.2.2 模糊綜合指數(shù)法。模糊數(shù)學(xué)在水質(zhì)評(píng)價(jià)中的應(yīng)用時(shí)為了解決水質(zhì)分類存在的模糊性問題。不同水質(zhì)級(jí)別之間無法制定一個(gè)明確的邊界,因?yàn)樗鼈兪且粋€(gè)連續(xù)的過程。為了解決這個(gè)問題,在水質(zhì)綜合評(píng)價(jià)中引入模糊數(shù)學(xué)的概念即得到模糊綜合評(píng)價(jià)法。代表性方法有模糊綜合評(píng)判法、模糊概率法和模糊綜合指數(shù)法等。模糊綜合指數(shù)法的步驟如下[2]:①確定水質(zhì)標(biāo)準(zhǔn)S;②建立模糊關(guān)系矩陣R;③計(jì)算權(quán)重矩陣A,計(jì)算公式同式(3)和式(4);④多指標(biāo)模糊綜合評(píng)價(jià)矩陣:B=A·R;⑤計(jì)算模糊綜合指數(shù):FCI=Y·S。
本文選取錢塘江支流東陽江許村斷面1996-2006年7個(gè)污染因子的部分監(jiān)測(cè)數(shù)據(jù)為評(píng)價(jià)對(duì)象,監(jiān)測(cè)數(shù)據(jù)見表1。7個(gè)污染因子的等級(jí)根據(jù)《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》(GB 3838-2002)進(jìn)行劃分。
表1 東陽江許村斷面水質(zhì)監(jiān)測(cè)數(shù)據(jù)
首先利用式(2)對(duì)7個(gè)污染因子的水質(zhì)標(biāo)準(zhǔn)進(jìn)行坐標(biāo)轉(zhuǎn)換,結(jié)果見表2。
表2 坐標(biāo)轉(zhuǎn)換后的評(píng)價(jià)標(biāo)準(zhǔn)值
根據(jù)評(píng)價(jià)因子的污染貢獻(xiàn)率,由式(3)和式(4)計(jì)算所得的權(quán)重系數(shù)見表3。
根據(jù)表2和3,公式(6)計(jì)算出各個(gè)待測(cè)單元的各級(jí)水質(zhì)標(biāo)準(zhǔn)與I級(jí)水質(zhì)標(biāo)準(zhǔn)的變權(quán)歐式距離Δ,見表4。
表3 各待評(píng)價(jià)單元中各污染因子的權(quán)重系數(shù)
表4 變權(quán)歐式距離Δ
Table 4 Euclidean distance with varying weights Δ
表5給出了利用式(1)對(duì)實(shí)測(cè)樣本表1進(jìn)行坐標(biāo)轉(zhuǎn)換后后由式(5)計(jì)算出的每個(gè)待測(cè)單元與I級(jí)水質(zhì)標(biāo)準(zhǔn)的變權(quán)歐式距離δ然后利用式(7)對(duì)每個(gè)待測(cè)單元的水質(zhì)進(jìn)行評(píng)價(jià)得到的水質(zhì)評(píng)價(jià)結(jié)果。表5同時(shí)也給出了灰色聚類法和模糊綜合指數(shù)法的水質(zhì)評(píng)價(jià)結(jié)果。
通過比較可以看出,變權(quán)歐式距離模型的評(píng)價(jià)結(jié)果與灰色聚類法、模糊綜合指數(shù)法的評(píng)價(jià)結(jié)果基本一致,這說明了變權(quán)歐式距離模型應(yīng)用于水質(zhì)綜合評(píng)價(jià)的合理性。根據(jù)3種評(píng)價(jià)方法的評(píng)價(jià)過程以及評(píng)價(jià)結(jié)果可得到以下結(jié)論:
1)模糊綜合指數(shù)方法以及變權(quán)歐式距離模型都是變權(quán)的評(píng)價(jià)方法,其權(quán)重的計(jì)算方法充分體現(xiàn)了超標(biāo)污染物對(duì)水質(zhì)的影響?;疑垲惙▌t認(rèn)為某個(gè)污染因子在水質(zhì)標(biāo)準(zhǔn)中的標(biāo)準(zhǔn)值越小,則水質(zhì)對(duì)其越敏感,該因子所占權(quán)重也就越大,并根據(jù)不同的水質(zhì)類別確定相應(yīng)級(jí)別的各污染指標(biāo)的權(quán)重。這種權(quán)重計(jì)算方法顯然沒有考慮超標(biāo)污染物對(duì)水質(zhì)的損害,所以,灰色聚類法評(píng)價(jià)水質(zhì)容易偏輕。
表5 1996-2006年東陽江許村斷面水質(zhì)評(píng)價(jià)結(jié)果
2) 變權(quán)歐式距離模型按照污染貢獻(xiàn)率計(jì)算污染因子的權(quán)重有助于對(duì)水質(zhì)進(jìn)行單因子分析,確定主要致污因子。比較表3的數(shù)據(jù),TN和NH3-N的污染貢獻(xiàn)率要明顯高于其他5項(xiàng)污染因子,是東陽江許村斷面在1996-2006年期間的主要致污因子。
3)從表5來看,雖然用3種方法得到2004年7月和2005年7月的水質(zhì)評(píng)價(jià)結(jié)果均為Ⅴ類,但變權(quán)歐式距離模型能得到更進(jìn)一步的結(jié)論:前者的H值大于后者的H值,故前者的水質(zhì)要劣于后者;二者的H值都遠(yuǎn)遠(yuǎn)超過了5,所以二者均屬于劣Ⅴ類水質(zhì)。但是,對(duì)于2004年3月、2006年7月和11月這種δi>1的情況,只能判斷均為Ⅴ類水質(zhì)卻不能判斷污染程度孰重孰輕,但一般情況下,δi越大則污染程度越重的可能性比較大。
通過變權(quán)歐式距離模型的應(yīng)用,以及將其評(píng)價(jià)結(jié)果與灰色聚類法、模糊綜合指數(shù)法的評(píng)價(jià)結(jié)果進(jìn)行比較,驗(yàn)證了變權(quán)歐式距離模型應(yīng)用于水質(zhì)綜合評(píng)價(jià)的科學(xué)性和合理性。綜上分析,變權(quán)歐式距離模型具有如下優(yōu)點(diǎn):
1) 變權(quán)歐式距離模型不僅全面考慮了各污染因子,而且強(qiáng)調(diào)了超標(biāo)污染物對(duì)水質(zhì)的影響,便于對(duì)水質(zhì)進(jìn)行因子分析。
2) 當(dāng)δi>1時(shí),變權(quán)歐式距離模型評(píng)價(jià)結(jié)果中的H,不僅給出水質(zhì)級(jí)別,而且能夠給出待評(píng)價(jià)單元對(duì)于某級(jí)別水質(zhì)的貼近度,詳細(xì)地體現(xiàn)了水質(zhì)的變化趨勢(shì)。
3) 變權(quán)歐氏距離模型形象、直觀、方便、準(zhǔn)確率較高,能夠較完整地反映水環(huán)境污染程度,適用于水質(zhì)綜合評(píng)價(jià)。
參考文獻(xiàn):
[1] ADEBOWALE K O, AGUNBIADE F O, OLU-OWOLABI B I. Fuzzy comprehensive assessment of metal contamination of water and sediments in Ondo Estuary, Nigeria[J]. Chemistry and Ecology, 2008, 24(4):269-283.
[2] 朱雷, 陳威. 模糊綜合指數(shù)法在水質(zhì)評(píng)價(jià)中的應(yīng)用[J]. 武漢理工大學(xué)學(xué)報(bào), 2001, 23(8): 61-65.
[3] SASIKUMAR K, MUJUMDAR P P. Application of fuzzy probability in water quality management of a river system [J]. Systems Science, 2000, 31(5): 575-597.
[4] 許文杰, 陳文國. 應(yīng)用灰色聚類法評(píng)價(jià)湖泊水體富營養(yǎng)化[J]. 山東建筑大學(xué)學(xué)報(bào), 2007, 22(1): 49-51.
[5] 劉金英, 楊天行, 李明, 等. 一種加權(quán)絕對(duì)灰色關(guān)聯(lián)度及其在密云水庫水質(zhì)評(píng)價(jià)中的應(yīng)用[J]. 吉林大學(xué)學(xué)報(bào):地球科學(xué)版, 2005, 35(7): 54-58.
[6] SUN Xiuling, TAN Yongming, XU Xiaochi. Matter Element Extension Evaluating Model Based on Synthesis Weights and Approach Degree and its Application [C]. The 2nd International Conference on Bioinformatics and Biomedical Engineering. Shanghai,China:Inst of Elec and Elec Eng Computer Society, 2008:3661-3665.
[7] 張龍?jiān)? 曹升樂. 物元可拓法在黃河水質(zhì)評(píng)價(jià)中的改進(jìn)及其應(yīng)用[J]. 山東大學(xué)學(xué)報(bào):工學(xué)版, 2007,37(6): 91-96.
[8] KODAZ H, KARA S, LATIOGLU F, et al. A new hybrid classifier system: Information gain-based artificial immune recognition system [J]. Experimental Techniques, 2007, 31(6): 36-43.
[9] MOHAMED S, ABDELKRIM L, ALI B H, e al. A segmentation method to handwritten word recognition [J]. Neural Network World, 2007, 17(3): 225-236.
[10] RUZANSKI E, HANSEN J H L, MEYERHOFF J, et al. Stress level classification of speech using Euclidean distance metrics in a novel hybrid multi-dimensional feature space [C]//2006 IEEE International Conference on Acoustics, Speech, and Signal Processing. Toulouse:Institute of Electrical and Electronics Engineers Inc, 2006: 1425-1428.
[11] KURNIAWATI R, JIN J S, SHEPHERD J A. An efficient nearest-neighbour search while varying Euclidean metrics [C]//Proceedings of the sixth ACM international conference on Multimedia. New York: Association for Computing Machinery, 1998: 411-418.