賴文哲,毛志勇,岳立柱,湯家喜
(1.遼寧工程技術(shù)大學(xué) 工商管理學(xué)院,遼寧 葫蘆島 125105;2.遼寧工程技術(shù)大學(xué) 環(huán)境科學(xué)與工程學(xué)院,遼寧 阜新 123000)
流域水系作為重要的內(nèi)陸水資源,用于市政、工業(yè)和灌溉,極易受到破壞[1]。近年來,由于河流沿岸城市工業(yè)的粗放型發(fā)展加劇了水環(huán)境的破壞,我國多數(shù)流域河流水源普遍受到不同程度的污染。隨著人們對環(huán)境問題的逐步重視以及對淡水資源的迫切需求,水質(zhì)的監(jiān)控與管理仍需進(jìn)一步加強(qiáng)與改善,水質(zhì)評價作為監(jiān)控與管理的重要環(huán)節(jié)已成為專家學(xué)者們的研究重點(diǎn)[2]。
水質(zhì)評價所需數(shù)據(jù)集復(fù)雜多變,常表現(xiàn)為不確定、弱相關(guān)和高維度等特性[3],影響了數(shù)據(jù)的精度,給水質(zhì)評價帶來挑戰(zhàn)[4]。隨著該領(lǐng)域相關(guān)研究的不斷深入,國內(nèi)外眾多學(xué)者取得了很多高水平的研究成果,綜合起來大致可分為5類:①應(yīng)用模糊綜合評價理論建立的評價模型。如Chang等[5]使用3種模糊綜合評估技術(shù)來評估水質(zhì)條件,成功地協(xié)調(diào)固有的指標(biāo)差異并解釋復(fù)雜的水質(zhì)評價條件。②應(yīng)用主成分分析法建立的評價模型。如蔡廣強(qiáng)等[6]采用主成分分析方法對水庫水質(zhì)進(jìn)行綜合評價,明確了影響水質(zhì)的主要因素與水質(zhì)的變化規(guī)律。③應(yīng)用集對分析理論建立的評價模型。如剛什婷等[7]運(yùn)用熵權(quán)法確定評價指標(biāo)的權(quán)重,構(gòu)建了基于熵權(quán)法的集對分析模型,評價結(jié)果與實(shí)際相符,具有較高的可靠性。④應(yīng)用物元可拓評價模型建立的評價模型。如虞未江等[8]以綜合權(quán)重和改進(jìn)物元可拓評價模型為基礎(chǔ),準(zhǔn)確地評價出水質(zhì)等級。⑤應(yīng)用神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法建立的評價模型。如彭越兮等[9]提出在傳統(tǒng)粒子群算法基礎(chǔ)上,建立利用改進(jìn)粒子群算法訓(xùn)練模糊神經(jīng)網(wǎng)絡(luò)的新模型,評級結(jié)果比其他神經(jīng)網(wǎng)絡(luò)模型更高效。上述方法①—方法④屬于等級貼近度模式,該模式下等級的劃分多由專家憑借自身經(jīng)驗(yàn)給出,專家以所學(xué)領(lǐng)域理論為基礎(chǔ),對等級進(jìn)行歸類。此類方法中專家經(jīng)驗(yàn)雖得到充分發(fā)揮,但缺乏一般性,數(shù)據(jù)自身蘊(yùn)含的的信息往往被忽視。方法⑤屬于樣本自分類模式,即依據(jù)樣本的期望值進(jìn)行等級劃分,雖適用性較強(qiáng)但容易忽略專家經(jīng)驗(yàn),若沒有大量樣本數(shù)據(jù)支持,可信度會降低。
綜合考慮上述方法的優(yōu)缺點(diǎn),本研究采用熵權(quán)法求出指標(biāo)權(quán)重,得到蘊(yùn)含權(quán)重信息的偏序集,以偏序關(guān)系替代原有對權(quán)重準(zhǔn)確賦值的要求,可在一定程度上降低對樣本量的依賴,同時還可以克服以往賦權(quán)方法中主觀性爭議問題,進(jìn)一步提升了評價模型的準(zhǔn)確性,對于多監(jiān)測點(diǎn)、多指標(biāo)、指標(biāo)變權(quán)重評價問題表現(xiàn)更佳,為水質(zhì)評價提供了一種新思路。
熵權(quán)法是一種客觀賦權(quán)方法。在具體使用過程中,熵權(quán)法根據(jù)各指標(biāo)的熵值所反映出的信息量大小來確定指標(biāo)權(quán)重,從而克服人為因素干擾。對于m個待評項(xiàng)目、n個評價指標(biāo),形成原始評價矩陣R′(rij)m×n,有如下計算步驟:
(1)數(shù)據(jù)無量綱化處理。
偏序集評價是一個非常有吸引力的評價方法[10],揭示了集合中元素間的層級關(guān)系,在該方法下數(shù)據(jù)間無需假定有無線性相關(guān)關(guān)系,也不需假定數(shù)據(jù)分布特征[11]。只需了解指標(biāo)權(quán)重的序數(shù)性質(zhì)便可應(yīng)用,在一定程度上避免了主觀性影響,進(jìn)而保證高標(biāo)準(zhǔn)的客觀性[12]與較強(qiáng)的穩(wěn)健性。偏序集定義[13]如下。
設(shè)集合A上存在一個二元關(guān)系R,若R滿足自發(fā)性、反對稱性、傳遞性,則稱R為A上的一個偏序關(guān)系。
(1)自反性:對任意x∈A,有關(guān)系xRx。
(2)反對稱性:對任意x、y∈A,若xRy且yRx,則x=y。
(3)傳遞性:對任意x、y、z∈A,若xRy、yRz,則xRz。
在應(yīng)用過程中,通常會使用“?”表示偏序關(guān)系,偏序關(guān)系?和集合A一起組成偏序集,記為(A,?)。對于含有m個樣本、n個指標(biāo)的決策問題,岳立柱等[14]以各指標(biāo)重要程度(即(A,?)內(nèi)部準(zhǔn)則權(quán)重序次ω1≥ω2≥ω3≥ … ≥ωn)為依據(jù),用矩陣的形式將蘊(yùn)含權(quán)重信息的方案決策問題表示為
Q=D·I=
(1)
其中評價矩陣
若矩陣Q中第i行的數(shù)據(jù)≥第j行的數(shù)據(jù),便可得出AiAj,即i與j對應(yīng)的方案前者優(yōu)于后者。由此便可得出方案間的層級關(guān)系。根據(jù)式(1)進(jìn)行累加變換后對每一行進(jìn)行迭代比較,構(gòu)造出內(nèi)含權(quán)重信息的偏序關(guān)系,即給定偏序集 (A,?)。對于?ai、aj∈A,若aj?ai,則記作rij=1;若aj和ai不可比或ai?aj,則記作rij=0,稱R(rij)m×n為(A,?)的比較關(guān)系矩陣。由比較關(guān)系矩陣通過保留最大路徑的方式得到Hasse矩陣,對于排除非最大路徑問題,范懿[15]給出了比較關(guān)系矩陣和Hasse矩陣之間的轉(zhuǎn)換公式,則
HR=(R-I)-(R-I)*(R-I) 。
(2)
式中:HR為Hasse矩陣;R為關(guān)系矩陣;I為單位矩陣;*為布爾運(yùn)算,即(1+1=1,1+0=1,0+0=0,1×1=1,1×0=0,0×0=0),布爾運(yùn)算中矩陣中的乘法相當(dāng)于取交集,加法相當(dāng)于取并集。
完成上述過程后,由Hasse矩陣畫出Hasse圖。在偏序集理論研究過程中Hasse圖是極其重要的工具,圖形所展示出的信息能夠充分體現(xiàn)出各樣本間的相關(guān)性、傳遞性、結(jié)構(gòu)性,幫助決策者更準(zhǔn)確、更直觀地了解方案間的層級信息與歸類情況。
表1 地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)Table 1 Criterion of surface water quality
(1)構(gòu)建指標(biāo)集合并確定水質(zhì)分類標(biāo)準(zhǔn)。
(2)數(shù)據(jù)預(yù)處理。
(3)運(yùn)用熵權(quán)法求出權(quán)重,并依據(jù)所得權(quán)重對評價指標(biāo)由大到小排序。
(4)數(shù)據(jù)累加變換得出Hasse矩陣。
(5)得出Hasse圖,對樣本進(jìn)行歸類并比較。
(6)結(jié)果分析,若偏序滿足精度則停止計算,否則應(yīng)用式(3)計算秩均值的近似值:
(3)
圖1 模型評價流程Fig.1 Flowchart of model evaluation
重慶主城區(qū)地處長江上游,該地區(qū)位于重慶市中心地帶,南高北低,地勢起伏較大。長江水系自西向東穿越重慶,全長約220 km[16],是重慶經(jīng)濟(jì)文化中心地帶。嘉陵江由東注入長江,屬于長江水系。城市內(nèi)部流域面積可達(dá)4 200 km2,是重慶市水資源重要組成部分。近年來工業(yè)廢水和生活廢物的流入導(dǎo)致長江及嘉陵江部分流域污染嚴(yán)重,水環(huán)境治理已迫在眉睫,可見水質(zhì)評價模型的建立具有現(xiàn)實(shí)的必要性。
指標(biāo)集合的構(gòu)建是水質(zhì)評價的重要依據(jù),是水體質(zhì)量的重要參數(shù)。本研究以長江和嘉陵江干流水域?yàn)橹饕芯繉ο?,依?jù)我國《地表水環(huán)境評價標(biāo)準(zhǔn)》歷次修訂概要及啟示[17],選取具有代表性的溶解氧(DO)、高錳酸鹽指數(shù)(CODMn)、重鉻酸鹽指數(shù)(CODcr)、氨氮(NH3-N)、總磷(TP)、五日生化需氧量(BOD5)、氟化物7個重要指標(biāo)(分別記作y1、y2、y3、y4、y5、y6、y7)構(gòu)成評價指標(biāo)集合。
依據(jù)《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》,選用上述7個指標(biāo)濃度限值將水環(huán)境質(zhì)量分為Ⅰ類、Ⅱ類、Ⅲ類、Ⅳ類、Ⅴ類5種類別(見表1)。其中,源頭水、國家自然保護(hù)區(qū)水質(zhì)為Ⅰ類;地表水源地一級保護(hù)區(qū)、珍稀水生生物棲息地水質(zhì)為Ⅱ類;地表水源地二級保護(hù)區(qū)、水產(chǎn)養(yǎng)殖區(qū)等漁業(yè)水域及游泳區(qū)水質(zhì)為Ⅲ類;一般工業(yè)用水區(qū)及娛樂用水區(qū)水質(zhì)為Ⅳ類;Ⅴ類水質(zhì)主要適用于農(nóng)業(yè)用水區(qū)及一般景觀要求水域。
選取2015年重慶市水文局在長江及嘉陵江干流段布置的9個監(jiān)測點(diǎn)(A1白沙、A2漁洞、A3九渡口、A4菜園壩、A5望龍門、A6寸灘、A7合川自來水廠、A8井口、A9大溪溝)所檢測到的各指標(biāo)作為樣本數(shù)據(jù),由此確立了模型的評價樣本。
根據(jù)準(zhǔn)則獲取偏序關(guān)系,依據(jù)偏序集理論構(gòu)造蘊(yùn)含權(quán)重信息的樣本集合,并通過權(quán)重所反映出的重要性由大到小排序來確定層級間的優(yōu)劣關(guān)系,以便獲取科學(xué)且準(zhǔn)確的評價結(jié)果。本研究選取各指標(biāo)標(biāo)準(zhǔn)區(qū)間內(nèi)的中值點(diǎn)數(shù)據(jù)作為分級樣本,再根據(jù)分級樣本對評價樣本進(jìn)行等級劃分。由于數(shù)據(jù)來源于實(shí)地監(jiān)測和前人資料的綜合考量,故對各指標(biāo)標(biāo)準(zhǔn)區(qū)間進(jìn)行中值點(diǎn)插值所得的分級樣本也應(yīng)該符合研究區(qū)域水質(zhì)特點(diǎn)。以指標(biāo)y1插值為例:指標(biāo)y1在[9.00,6.00) mg/L范圍屬于Ⅰ類標(biāo)準(zhǔn),將[9.00,6.00) mg/L 二等分,即所得插值樣本點(diǎn)為7.5 mg/L,屬于水環(huán)境質(zhì)量Ⅰ 類標(biāo)準(zhǔn);同理指標(biāo)y1在[6.00,5.00) mg/L內(nèi)的插值樣本點(diǎn)為5.5 mg/L,屬于Ⅱ類標(biāo)準(zhǔn);在[5.00,3.00) mg/L內(nèi)的插值樣本點(diǎn)為4 mg/L,屬于Ⅲ類標(biāo)準(zhǔn);在[3.00,2.00) mg/L區(qū)間內(nèi)的插值樣本點(diǎn)為2.5 mg/L,屬于Ⅳ類標(biāo)準(zhǔn);在[2.00,0) mg/L內(nèi)的插值樣本點(diǎn)為1 mg/L,屬于Ⅴ類標(biāo)準(zhǔn)。按此方法,得到其余6個指標(biāo)在各區(qū)間內(nèi)插值樣本點(diǎn),由此便構(gòu)造出5個全新的分級樣本,并按隸屬的等級從優(yōu)到劣編號為A10、A11、A12、A13、A14,與上述9個評價樣本共同組成新的樣本集合。
表4 Hasse矩陣Table 4 Hasse matrix
7個指標(biāo)中除y1外其余各指標(biāo)均為反向指標(biāo),即數(shù)值越小屬性越優(yōu),需取倒數(shù)處理,即aij=1/aij。由于各指標(biāo)間單位和量級不同無法直接進(jìn)行評價,需運(yùn)用公式xij=(aij-amin)/(amax-amin)對新樣本集合內(nèi)14組樣本數(shù)據(jù)進(jìn)行無量綱化處理,計算結(jié)果見表2。
偏序集評價方法,要求必須獲取指標(biāo)權(quán)重的排序信息方可進(jìn)行。各評價指標(biāo)的權(quán)重次序直接影響評價結(jié)果的準(zhǔn)確性,本文通過熵權(quán)法所得權(quán)重可有效克服人為因素的影響,同時還可為偏序集評價模型提供指標(biāo)的權(quán)重排序信息。
表2 各監(jiān)測點(diǎn)指標(biāo)檢測值無量綱化處理結(jié)果Table 2 Dimensionless detected values of each point
為實(shí)施熵權(quán)法以確定指標(biāo)權(quán)重,選取前述9個監(jiān)測點(diǎn)評價樣本進(jìn)行計算(結(jié)果見表3)。依據(jù)計算結(jié)果將指標(biāo)從大到小排序?yàn)椋簓3、y4、y2、y5、y6、y1、y7。以便后續(xù)得出Hasse矩陣。
表3 各指標(biāo)熵權(quán)計算結(jié)果Table 3 Calculation result of entropy weight ofeach indicator
依據(jù)權(quán)重排序結(jié)果對預(yù)處理后的樣本矩陣運(yùn)用式(1)進(jìn)行累加變換,通過行向量的比較得出比較關(guān)系矩陣R(rij)m×n。矩陣中若第i行≥第j行,則有rij=1,否則rij=0。再根據(jù)式(2)將比較關(guān)系矩陣轉(zhuǎn)化為Hasse矩陣,如表4所示。
Hasse圖不僅與Hasse矩陣相對應(yīng),同時又考慮到偏序關(guān)系的自發(fā)性與傳遞性,即對已知的比較關(guān)系有向圖保留兩點(diǎn)間最大路徑,刪除此外的非最大路徑便得出Hasse圖,可清晰地反映出偏序關(guān)系的“層級”。如圖2所示,Hasse圖能夠直觀地表現(xiàn)出各水樣的聚類信息與層級關(guān)系,方便后期的對比與分析。
圖2 水環(huán)境質(zhì)量優(yōu)良性Hasse圖Fig.2 Hasse diagram of water environment quality
基于圖2,可以直觀地了解各樣本間層級信息和聚類情況。偏序集理論具有上級優(yōu)于下級的特性,例如在圖2中A10指向A7,表示A10優(yōu)于A7。同時又具有傳遞性,例如A10優(yōu)于A7,A7又優(yōu)于A2,可認(rèn)為A10優(yōu)于A2。因此,在圖2中,位置越靠上,樣本群體水質(zhì)越優(yōu)。Hasse圖的圖像性質(zhì)為:若某一樣本處于兩層級之間則隸屬于上一層級。由此,圖2中的14個樣本根據(jù)構(gòu)造出的5個分級樣本被分為5類水質(zhì)標(biāo)準(zhǔn)群:①第Ⅰ類標(biāo)準(zhǔn)群為A10、A7;②第Ⅱ類標(biāo)準(zhǔn)群為A11、A2、A1、A6;③第Ⅲ類標(biāo)準(zhǔn)群為A12、A9、A3、A5、A8;④第Ⅳ類標(biāo)準(zhǔn)群為A13、A4;⑤第Ⅴ類標(biāo)準(zhǔn)群為A14。
具體表述為:在14個水質(zhì)樣本中A10至A14是根據(jù)國家《地表水環(huán)境質(zhì)量標(biāo)準(zhǔn)》人為構(gòu)造出的分級樣本。由圖2可知,A7與虛擬樣本A10組成第Ⅰ類標(biāo)準(zhǔn)群。A2、A6、A1與虛擬樣本A11組成第Ⅱ類標(biāo)準(zhǔn)群,說明該層級樣本達(dá)到水環(huán)境質(zhì)量Ⅱ類標(biāo)準(zhǔn)。同理,樣本A9、A3、A5、A8達(dá)到水環(huán)境質(zhì)量Ⅲ類標(biāo)準(zhǔn);樣本A4達(dá)到水環(huán)境質(zhì)量Ⅳ類標(biāo)準(zhǔn),第Ⅴ類標(biāo)準(zhǔn)群內(nèi)部無樣本。
為達(dá)到預(yù)期精度,對同一層級內(nèi)的樣本水質(zhì)情況進(jìn)行比較,運(yùn)用式(3)計算各斷面秩均值,數(shù)值越大表示該斷面水質(zhì)越好。除虛擬樣本外,各斷面計算結(jié)果排序?yàn)?A7A2A6A1A5A3A9A8A4。模型評價結(jié)果與實(shí)際情況基本一致,達(dá)到預(yù)期精度?,F(xiàn)實(shí)中,嘉陵江干流合川自來水廠(A7)水質(zhì)最佳,達(dá)到國家水環(huán)境質(zhì)量Ⅰ類標(biāo)準(zhǔn)。菜園壩監(jiān)測點(diǎn)(A4)由于指標(biāo)CODCr與NH3-N較大,河段好氧型微生物繁盛,其代謝產(chǎn)物對水質(zhì)污染嚴(yán)重,水環(huán)境質(zhì)量較差,屬于Ⅳ類標(biāo)準(zhǔn)。九渡口(A3)、望龍門(A5)、井口(A8)、大溪溝(A9)流域工業(yè)廢水、生活污水的流入導(dǎo)致水質(zhì)嚴(yán)重惡化形成污染帶,需加大對以上4個監(jiān)測點(diǎn)所在流域水環(huán)境的治理力度。根據(jù)評價結(jié)果可以看出,重慶雖地處長江與嘉陵江交匯地,水量十分豐富,但可利用水資源仍匱乏,多數(shù)流域水質(zhì)仍處于Ⅲ類及以下標(biāo)準(zhǔn),水環(huán)境治理任務(wù)依然嚴(yán)峻。
實(shí)測結(jié)果是通過龐大的測量數(shù)據(jù)與相關(guān)的理論基礎(chǔ)相結(jié)合后給出的最終結(jié)果,該結(jié)果雖準(zhǔn)確性高,但所用方法十分繁瑣,實(shí)用性較低。實(shí)測結(jié)果與其它3種過程相對簡單的評價方法所得結(jié)果的分布如圖3所示。熵權(quán)-偏序集模型的評價結(jié)果與實(shí)際情況基本吻合,準(zhǔn)確性高于支持向量機(jī)和熵權(quán)-模糊綜合評價模型。
圖3 實(shí)測值與評價值分布Fig.3 Distribution of measured values and evaluationvalues
本文所研究的長江及嘉陵江流域綿長,水質(zhì)情況復(fù)雜多變,各斷面評價指標(biāo)的權(quán)重經(jīng)計算表現(xiàn)出差異性。以往評價模型對權(quán)重的準(zhǔn)確賦值要求較高,例如,應(yīng)用熵權(quán)-模糊綜合評價法對水質(zhì)進(jìn)行評價時,由于權(quán)重的微小波動誤將漁洞(A2)、寸灘(A6)的水質(zhì)分別評定為Ⅰ類和Ⅲ類;支持向量機(jī)算法雖然適用性較強(qiáng),但對樣本數(shù)量過于依賴,樣本數(shù)量不足時易出現(xiàn)過擬合或訓(xùn)練不充分現(xiàn)象,在對上述樣本進(jìn)行分類時誤將本應(yīng)為Ⅳ類的菜園壩(A4)分為Ⅲ類,忽視了數(shù)據(jù)自身蘊(yùn)含的信息。
與其它評價模型相比,偏序集評價模型不需要權(quán)重的準(zhǔn)確賦值,只要權(quán)重次序不變便可得到穩(wěn)定的評價結(jié)果。通過熵權(quán)法對9個監(jiān)測點(diǎn)多次的測量結(jié)果進(jìn)行權(quán)重計算,所得結(jié)果見表5。由此可以看出,指標(biāo)權(quán)重雖然出現(xiàn)微小波動,但總體排序結(jié)果基本未變,所以模型評價結(jié)果依然準(zhǔn)確。由此可見偏序集評價模型在兼顧了準(zhǔn)確性與客觀性的同時還具有更高的穩(wěn)健性。
表5 各監(jiān)測點(diǎn)指標(biāo)權(quán)重及模型對比結(jié)果Table 5 Weight values of indices at each monitoring point and comparison of evaluation result among different models
(1)基于偏序集理論建立了偏序集水質(zhì)評價模型,并利用該模型對9個樣本進(jìn)行評價,經(jīng)檢驗(yàn),評價結(jié)果是準(zhǔn)確且穩(wěn)定的,可見該模型方法具有一定的可行性。
(2)本文所研究偏序集評價模型采取了熵權(quán)法來確定權(quán)重,有效克服了傳統(tǒng)方法獲取權(quán)重時主觀性較強(qiáng)的不足。同時,偏序集方法的應(yīng)用并不要求獲取精確的權(quán)重,故在應(yīng)用熵權(quán)法時對樣本數(shù)量沒有很高的要求,進(jìn)一步提升了該方法的適用范圍。
(3)偏序集評價方法解決了以往水質(zhì)評價中的賦權(quán)爭議問題,是一種更為準(zhǔn)確且穩(wěn)健的評價方法?,F(xiàn)有規(guī)范方法計算量大且過程繁瑣。在實(shí)際監(jiān)測過程中,若出現(xiàn)同一監(jiān)測點(diǎn)各指標(biāo)數(shù)據(jù)處在不同標(biāo)準(zhǔn)區(qū)間內(nèi)時會進(jìn)一步提高計算量并依賴專家的主觀經(jīng)驗(yàn),無法達(dá)到高標(biāo)準(zhǔn)的客觀性。與之相比,熵權(quán)-偏序集評價方法具備更高的實(shí)用性,對于多指標(biāo)對應(yīng)數(shù)據(jù)處于不同層級問題具備自身獨(dú)特且有效的評價方法,簡化了繁瑣的評價過程,為水質(zhì)評價領(lǐng)域提供了一種新思路。未來,通過對大量實(shí)測數(shù)據(jù)的評價與相應(yīng)的改良將使熵權(quán)-偏序集評價方法滿足實(shí)際應(yīng)用的條件。