陳 雋, 洪思揚, 程 濤, 焦志倩
(1.環(huán)境保護部 華南環(huán)境科學研究所,廣東 廣州 510655;2.北京師范大學 水科學研究院,北京 100875)
?
基于熵權的集對分析方法在水質(zhì)評價中的應用
——以鄭州市為例
陳 雋1, 洪思揚2, 程 濤2, 焦志倩2
(1.環(huán)境保護部 華南環(huán)境科學研究所,廣東 廣州 510655;2.北京師范大學 水科學研究院,北京 100875)
采用基于熵值的集對分析評價方法對鄭州市伊洛河七里鋪和黃河花園口兩個地表水監(jiān)測點的水質(zhì)進行分析,計算出這兩個監(jiān)測斷面的水質(zhì)評價結果,并進一步將計算結果與其它兩種水質(zhì)評價方法的結果進行了對照.結果表明,在水質(zhì)分析中,基于熵權的集對分析法與其他評價方法的結果較為吻合,且能更好地反映水質(zhì)狀況.該方法基于VBA編程,易于操作,可以為水環(huán)境保護與管理決策提供技術支持.
水質(zhì)評價;熵權;集對分析;VBA
水污染一直是困擾著人類的一個重大環(huán)境問題,每年我國由于水質(zhì)污染造成的人員傷亡、經(jīng)濟損失不可估量.近三十年來,由于經(jīng)濟的飛速發(fā)展,污水排放量增大,大量工業(yè)垃圾、農(nóng)業(yè)污染物沒有得到充分處理即被排放,造成了江河湖泊水質(zhì)的嚴重污染,且水體污染有加重趨勢,了解水質(zhì)污染的具體情況,是有效控制和治理水污染.實施合理高效的水資源管理的基礎.水質(zhì)評價是了解水體情況的重要一步,對水質(zhì)監(jiān)測結果進行分析評價,對保護和治理水環(huán)境,推動水環(huán)境管理與社會經(jīng)濟發(fā)展的高效融合,具有重要的現(xiàn)實意義.
目前,水質(zhì)評價的方法較多.其中,單因子評價法是在各個水質(zhì)單項評價指標中,選取最差的一項作為評價最終水質(zhì)級別的依據(jù),這是現(xiàn)行國家水質(zhì)標準中已經(jīng)確定的悲觀評價原則,對相關管理部門的監(jiān)察有重要意義,但無法對水質(zhì)做出綜合評價.污染指數(shù)評價法是將各個水質(zhì)單項評價結果與評價標準相除,得到該項評價指標的分指數(shù),繼而通過相關數(shù)學方法的運用,計算得到水質(zhì)的綜合污染指數(shù).但該方法也存在一定弊端,如水質(zhì)評價結果是相對值,無法得到明確的水質(zhì)分類級別.模糊綜合評價法是針對水質(zhì)評價指標、各個水質(zhì)級別的分類標準具有模糊性這一特點而發(fā)展的一種應用較為廣泛的方法,其弊端在于評價結果的表達形式是隸屬度矩陣,呈現(xiàn)形式并不直觀.灰色系統(tǒng)分析法是將整個水體看作一個擁有部分已知信息和部分不確定信息的灰色系統(tǒng),通過計算各項評價指標的實測值與對應指標評價標準的關聯(lián)度,進而確定評價水體的水質(zhì)級別,但該方法較為復雜,不太易于計算.每種評價方法都有其優(yōu)缺點[1-4].水質(zhì)狀況本身即具有不確定性,評價指標與分類等級之間存在一定的非線性關系[5].因此,恰當?shù)脑u價方法的選取在水質(zhì)分析中具有重要作用.
集對分析(Set pair analysis,簡稱SPA) 是我國民間學者趙克勤結合確定性分析和不確定性分析方法,于1989年首次提出的一種利用聯(lián)系度描述和處理綜合集成問題的一種全新的系統(tǒng)分析方法,該方法已廣泛應用于水質(zhì)評價工作中.集對分析可用于處理模糊、隨機和信息不完全所致的不確定性系統(tǒng)的理論和方法[6],利于水質(zhì)因子與水質(zhì)等級間復雜的非線性關系的反映.因此,將該分析應用于水環(huán)境質(zhì)量評價是合理且可行的.本文將集對分析方法引入伊洛河的水質(zhì)評價中,并將研究結果與傳統(tǒng)方法進行對照,以驗證其合理性,進而為區(qū)域水環(huán)境保護與管理決策提供技術支持.
1.1 集對分析基本模型的構建
(1)集對分析理論的基本原理 設X和Y是有聯(lián)系的兩個集合,X集合中有n個對象,即X=(x1,x2,…,xn),Y集合中亦有n個對象,即Y=(y1,y2,…,yn).集合X與集合Y構成集對H(X,Y),其聯(lián)系度可以定義為
(1)
式中:μx-y表示集合X和Y的聯(lián)系度;S為集對H(X,Y)中具有同一性的對象的數(shù)目;F為具有差異性的對象的數(shù)目;P為具有對立性的對象的數(shù)目;三者之和為n.代表差異度系數(shù),取值范圍在-1~1之間,當其取值為1時,差異性即轉(zhuǎn)化成同一性;其值越趨于0,即表現(xiàn)越顯著的不確定性.j代表對立度系數(shù),這里將其取值為-1.若令a=S/N為同一度,b=F/N為差異度,c=P/N為對立度,則(1)式可改寫為
(2)
a越趨近于1,表明集合X和Y的特征越趨近于同一;c越趨近于1,表明集合X和Y的特征越趨近于對立;b越趨近于1,表明集合X和Y的特征越趨近于差異.
在水質(zhì)評價中,將水質(zhì)監(jiān)測數(shù)據(jù)作為集合X,將監(jiān)測項目所對應的水質(zhì)等級劃分指標作為集合Y,使實際監(jiān)測的評價因子數(shù)據(jù)與水質(zhì)評價標準指標間構成一個集對,通過計算2個集合的聯(lián)系度,評判水質(zhì)級別.
(2)確定聯(lián)系度 在不確定系統(tǒng)中,聯(lián)系度可以對具有一定關聯(lián)的兩個集合進行量化,從而清晰地顯示兩者之間的定量關系.首先按單因子評價方法,參照《國家地表水環(huán)境質(zhì)量標準》,計算出每個單項指標的水質(zhì)等級.對于處于某個等級內(nèi)的單項指標,我們定義其與該等級的聯(lián)系度為1,定義其與該單項的水質(zhì)等級相隔的水質(zhì)等級的聯(lián)系度為-1,對于相鄰的水質(zhì)等級,則通過聯(lián)系度來確定實測指標與評價指標之間的距離,計算公式如下.
a. 樣本i的第j項實測指標與第Ⅰ級水質(zhì)聯(lián)系度表示如下:
(3)
式中:xij為樣本i第j項的實測指標值;s1j,s2j為指標分類的限制值.
b. 樣本i的第j項實測指標與第Ⅱ級水質(zhì)聯(lián)系度表示如下:
(4)
式中:s3j為指標分類的限制值.
c. 樣本i的第j項實測指標與第Ⅲ級水質(zhì)聯(lián)系度表示如下:
(5)
式中:s4j為指標分類的限制值.
d. 樣本i的第j項實測指標與第Ⅳ級水質(zhì)聯(lián)系度表示如下:
(6)
式中:s5j為指標分類的限制值.
e. 樣本i的第j項實測指標與第Ⅴ級水質(zhì)聯(lián)系度表示如下:
(7)
式中:s5j為指標分類的限制值,為了便于計算評價指標位于Ⅴ級時與Ⅳ級評價標準之間的聯(lián)系度,將s5j賦值為2s4j-s3j.
1.2 熵值法確定權重
權重是針對某一研究對象而言的相對指標,同其他研究方法相比,熵值法能夠更加有效地反映指標信息熵值的效應,較適應于水質(zhì)污染情況的評價[7].熵權的大小與被評價對象的指標值有顯著的聯(lián)系,根據(jù)其原理,標準化方法的選擇和實測指標數(shù)據(jù)的性質(zhì)是影響賦權的重要因素[8].在水質(zhì)評價的權重確定中,引入熵值這一概念來反映水質(zhì)指標值的無序化程度,利用信息熵這種方法,根據(jù)各個評價指標之間的差異度,進而計算出各個評價指標的權重.相對于其它賦權方法,熵值法是相對漸變且有效的[9].具體計算步驟如下.
(1)數(shù)據(jù)標準化 設有m個采樣點、n項指標,用原始數(shù)據(jù)矩陣X=(xij)m×n(i=1,2,…,m;j=1,2,…,n)表示.這里采用極值處理法對原始數(shù)據(jù)進行標準化,轉(zhuǎn)換公式如下:
(8)
(9)
(2)熵值法的原理 傳統(tǒng)熵值法定義各個評價指標的熵:
(10)
從(10)式中可以看出,若fij=0,lnfij是沒有意義的,故需要對fij進行修正,進一步將其定義為
(11)
計算評價指標的熵值為W,W=(Wj)1×n.
(12)
通過上面的公式可以計算出各特征權重系數(shù).
(3)聯(lián)系度的確定 樣本與各評價等級之間的聯(lián)系度,并加權處理:
(13)
式中:μik為樣值i與評價等級k之間的聯(lián)系度;μijk為樣本i中評價等級j對k評價標準的聯(lián)系度,選取聯(lián)系度數(shù)值最大的評價等級作為最終水質(zhì)的評價等級.
1.3 基于熵權的集對分析方法在VBA編程中的實現(xiàn)
Visual Basic for Applications簡稱VBA,是一種編程語言,是微軟公司開發(fā)出的,用以完成通用的自動化任務.主要能用來擴展Windows的應用程式功能,特別是Microsoft Office軟件.基于Excel的VBA編程功能,對錄入到Excel中的數(shù)據(jù)進行批量化處理,通過中間程序的功能實現(xiàn),直接在表格中給出每個樣本的水質(zhì)等級,具體計算步驟如下.
首先按固定的格式錄入水質(zhì)數(shù)據(jù)和水質(zhì)標準,錄入的水質(zhì)數(shù)據(jù)和水質(zhì)標準分別放在兩個Excel工作表(“水質(zhì)數(shù)據(jù)”及“水質(zhì)標準及熵值”)中,以便分別調(diào)用.數(shù)據(jù)錄入應該按照固定的格式,便于程序的運行管理.
第二步是計算熵權值,即對所有樣本按前文所述步驟計算每個水質(zhì)指標的熵權值(占最終水質(zhì)等級的比重),熵權值的計算與所給的樣本值的多少有關,樣本值越多,越能反應區(qū)域變化特征和時間變化特征.熵權值計算在VBA中的實現(xiàn)需要借助多層循環(huán)語句和選擇語句,以便于精簡程序語言,減少運行時間.計算出的熵權值存儲在一個“水質(zhì)標準及熵值”工作表中水質(zhì)標準之后.
第三步是計算分級聯(lián)系度,即利用水質(zhì)數(shù)據(jù)和水質(zhì)標準,應用前文所述原理和公式,進行編程語言的設計,批量計算出每個水質(zhì)指標與每個水質(zhì)等級的聯(lián)系度,并放入“單項聯(lián)系度”工作表中.然后根據(jù)第二步計算得到的每個水質(zhì)指標的熵權值,乘以相應的水質(zhì)指標的聯(lián)系度.最后,對水質(zhì)指標中與相同水質(zhì)等級的聯(lián)系度相加,得到水質(zhì)樣本與五個水質(zhì)等級的最終聯(lián)系度,放入“最終聯(lián)系度”工作表中.
最后,對于每個水質(zhì)樣本,分別確定聯(lián)系度最大的那個水質(zhì)等級,作為水質(zhì)樣本的水質(zhì)等級,放入“水質(zhì)數(shù)據(jù)”工作表中相應的水質(zhì)樣本后.
伊洛河流域地處我國黃河流域的中段,位于東經(jīng)109°45′-113°06′、北緯33°33′-35°05′之間,流域面積18881km2,屬暖溫帶季風氣候區(qū),春季干燥多風,夏季易發(fā)暴雨,秋冬干旱少雨,多年平均徑流量為27億m3.流域地勢險峻,地形復雜多樣.流域中部及西部地區(qū)降水量大,洛河和伊河兩岸的丘陵區(qū)降水量較少,降水量隨海拔高度增加而減少,是黃河中部的重要供水來源之一.
為了驗證集對分析方法的合理性,本文采用鄭州市的伊洛河七里鋪和黃河花園口兩個地表水監(jiān)測斷面2010、2011和2012年各月的水質(zhì)監(jiān)測數(shù)據(jù),以溶解氧(DO)、高錳酸鹽指數(shù)(M)、五日生化需氧量(BOD5)、氨氮 (NH4-N)、化學需氧量(COD)、總氮(N_total)、總磷(P_total)、糞大腸菌群(Coo_org)為評價指標,分類標準參照《地表水環(huán)境質(zhì)量標準》(GB 3838-2002),詳見表1.
表1 地表水環(huán)境質(zhì)量標準
這里以伊洛河七里鋪監(jiān)測斷面的實測水質(zhì)數(shù)據(jù)為例,對基于熵權的集對分析方法在水質(zhì)評價中的應用進行具體說明.表2為七里鋪斷面2010年1月的水質(zhì)指標值.首先,根據(jù)熵權值計算公式,得出各指標在水質(zhì)評價中的權重分別0.123,0.131,0.149,0.118,0.111,0.116,0.139和0.113.其次,計算得到水質(zhì)指標與五個等級的聯(lián)系度,結果如表3所示.從表中最后一行可以看出,該測量斷面在該日的水質(zhì)等級為Ⅳ類.參照此方法,計算七里鋪和花園口2010、2011、2012年各月的水質(zhì)等級,結果見表4.
表2 七里鋪斷面水質(zhì)指標值
從表4中可以看出單因子分析的計算結果普遍高于集對分析和模糊數(shù)學綜合分析法的計算結果,這是因為單因子分析法是將各項水質(zhì)評價指標中最大的一項作為最終的數(shù)值等級,故指標相對偏高,也是不太能夠反映實際情況的;同時,集對分析與模糊數(shù)學綜合分析方法對水質(zhì)的評價結果在大部分的月份保持一致,這是由于兩種方法都是基于較為復雜的數(shù)學方法進行評價,兩種結果能夠互相驗證,一定程度上驗證了集對分析方法的有效性.
表3 水質(zhì)指標與五個等級的聯(lián)系度
表4 鄭州市某監(jiān)測斷面不同時間的水質(zhì)監(jiān)測結果等級
但是在花園口斷面若干月份的評價結果中,集對分析與模糊數(shù)學綜合分析方法得出的結果差異較大,這是因為模糊綜合評價過程中,較常采用是線性加權平均法,評價結果容易出現(xiàn)失真的現(xiàn)象,且計算過程比較復雜,實際操作性較差[10].集對分析方法能綜合反映水質(zhì)不同指標的特征,較好地體現(xiàn)水質(zhì)的實際情況.
同時,我們發(fā)現(xiàn),在花園口斷面若干個監(jiān)測月份的評價結果中,集對分析的結果明顯小于單因子分析和模糊數(shù)學綜合分析的評價結果,可能的原因包括兩方面:一是兩種評價方法本身存在差異.兩種評價方法都是基于相應函數(shù)的建立,模糊綜合評價的水質(zhì)等級是通過隸屬度的值確定的,其取值范圍在0-1之間,但不同水質(zhì)等級之間如何過渡沒有給出描述,而集對分析法的水質(zhì)等級是通過聯(lián)系度而確定的,其取值范圍在-1-1之間,且不同水質(zhì)等級之間的過渡性通過差異度、對立度等指標表現(xiàn),因而評價結果更為準確、合理.二是兩種評價方法的權重是通過不同方法確定的.對于模糊綜合評價而言,其權重是由水質(zhì)的實測值與對應的評價指標相除獲得的,使得權重只與水質(zhì)的實測值相關,進而導致某一類實測值偏高使得整體評價結果偏高現(xiàn)象的發(fā)生,從而使其評價結果高于集對分析法的評價結果.此外,模糊綜合評價法是根據(jù)單一數(shù)值確定權重的方法,本身存在一定的誤差.本研究在計算權重時運用信息熵的方法,這樣能夠減小單一指標確定權重時所產(chǎn)生的誤差,并且能夠體現(xiàn)各個評價指標的集中趨勢.
另外,花園口站位于七里鋪站的下游,伊洛河作為黃河中游的主要支流,對于黃河的水質(zhì)會產(chǎn)生較大的影響.通過這兩個監(jiān)測斷面數(shù)據(jù)的評價結果可知,單因子評價法及模糊數(shù)學綜合評價法的評價結果表明,花園口斷面的水質(zhì)相較于七里鋪斷面更好,而利用集對分析得到的評價結果得到類似的結果,但也在一部分月份表現(xiàn)出相反的結果,這是由于集對分析方法除了反應當前站點監(jiān)測數(shù)據(jù)所表現(xiàn)出的水質(zhì)信息,同時利用了更多的空間信息,考慮了兩個站點之間監(jiān)測信息的互相影響,評價結果更加合理.兩個監(jiān)測斷面的水質(zhì)評價結果顯示伊洛河七里鋪站的水質(zhì)年際變化不太大,而花園口站的水質(zhì)年際變化較大,這是由于伊洛河作為支流,導致水量和水質(zhì)變化的因子較為穩(wěn)定,對水質(zhì)影響不大,而黃河作為中國第二大河,受到的中上游帶來的不確定性影響較大,水質(zhì)年際變化較為明顯.
本文通過構建水質(zhì)指標實測值與對應評價標準之間的集對關系,計算聯(lián)系度,進而確定水質(zhì)等級,采用熵權法確定各指標的權重,有效避免了人為賦權的主觀影響,得到了更加合理的評價結果.集對分析法原理易懂、計算簡便、結果直觀,適合大部分地區(qū)的水質(zhì)評價.相比于其它水質(zhì)評價方法,集對分析的評價結果更加真實客觀.借用VBA編程對評價方法進行集成,能夠高效地批量處理數(shù)據(jù),直接輸出評價結果,方便快捷.將計算方法集成在Visual Basic上,通過按鈕和數(shù)據(jù)表格的形式更加智能便捷地實現(xiàn)其功能,以方便非編程專業(yè)研究人員的操作和實踐,是下一步的工作方向.同時,本文對比了同一地區(qū)的兩條河流水質(zhì)監(jiān)測站點的水質(zhì)評價結果,分析了上下游關系以及河流規(guī)模對于斷面水質(zhì)的影響.
[1] 陳南祥,蘇榮,曹文庚.基于熵權的集對分析法在土默特左旗地下水水質(zhì)評價中的應用[J].干旱區(qū)資源與環(huán)境,2013,27(6):30-34.
[2] 張冉,孫寶盛,王永亮,等.黃河入??谒|(zhì)評價與預測[J].環(huán)境工程學報,2013,(8):3089-3093.
[3] 姜云超,南忠仁.三種不確定性水質(zhì)綜合評價方法比較研究[J].干旱區(qū)資源與環(huán)境,2011,25(3):177-181.
[4] DAHIYA S, SINGH B, GAUR S, et al. Analysis of groundwater quality using fuzzy synthetic evaluation[J]. Journal of Hazardous Materials, 2007,147( 3):938-946.
[5] 孟憲萌,胡和平.基于熵權的集對分析模型在水質(zhì)綜合評價中的應用[J].水利學報,2009,40(3):257-262.
[6] 童英偉,劉志斌,常歡.集對分析法在河流水質(zhì)評價中的應用[J].安全與環(huán)境學報,2008,(6):84-86.
[7] 葉斌.基于改進熵值法的內(nèi)河水運評價研究[D].成都:成都理工大學,2012:15-16.
[8] 任化準,溫忠輝,等.基于熵權的集對分析方法在地下水脆弱性評價中的應用[J].工程勘察,2010,(4):44-47.
[9] 鄭志宏,魏明華.基于熵值法的改進集對分析水質(zhì)模糊評價[J].河海大學學報,2013,41(2):136-139.
[10] 薛巧英.水環(huán)境質(zhì)量評價方法的比較分析[J].環(huán)境保護科學,2004,30(124):64-67.
Application of Set Pair Analysis based on Information Entropy in Water Quality Evaluation——Take Zhengzhou as an example
CHEN Juan1, HONG Si-yang2, CHENG Tao2, JIAO Zhi-qian2
(1. South China Institute of Environmental Sciences, Ministry of Environmental Protection, Guangzhou 510655, China; 2.College of Water Science, Beijing Normal University, Beijing 100875, China)
This paper introduces set pair analysis based on information entropy, and the method is translated into VBA programming and then applied in Qilipu and Garden surface water monitoring sections’ water quality analysis in Zhengzhou city. The result of three monitoring years is calculated out by the program. Then the result is compared with the results calculated by other two methods. The comparison shows that the result of set pair analysis has better effect. Method based on VBA programming is easy to operate, and it is a relatively good technical support for water environment conservation and management decision.
water quality assessment; entropy weights; set pair analysis; VBA
2016-03-01
陳雋(1967-),男,山西太原人,高級工程師, 主要從事水資源與水環(huán)境方面的研究.通訊作者:洪思揚(1990-)女,博士研究生,主要從事水資源系統(tǒng)分析方面的研究.
10.14182/J.cnki.1001-2443.2016.05.010
X824
A
1001-2443(2016)05-0449-06