陶雙駿,邵光成*,蘇江霖,李育飛,張新宇,張邵華
(1.南方地區(qū)高效灌排與農(nóng)業(yè)水土環(huán)境教育部重點實驗室,河海大學水利水電學院,南京 210098;2.淮安市淮安區(qū)水利局,江蘇淮安 223200;3.沭河水利管理局,山東臨沂 276000;4.山東水利職業(yè)學院,山東日照 276800)
小流域面源污染風險評估研究
——基于多分類有序離散選擇模型
陶雙駿1,邵光成1*,蘇江霖2,李育飛2,張新宇3,張邵華4
(1.南方地區(qū)高效灌排與農(nóng)業(yè)水土環(huán)境教育部重點實驗室,河海大學水利水電學院,南京 210098;2.淮安市淮安區(qū)水利局,江蘇淮安 223200;3.沭河水利管理局,山東臨沂 276000;4.山東水利職業(yè)學院,山東日照 276800)
在目前流域環(huán)境污染監(jiān)測體系基礎(chǔ)上,篩選并建立小流域面源污染風險評估指標體系,通過因子分析法提取小流域面源污染風險評估等級的潛在變量,建立基于有序多分類離散選擇模型的小流域面源污染風險評估模型,提供具體的風險等級評判計算方法,并利用15個流域的面源污染監(jiān)測數(shù)據(jù)對模型進行了實例分析。結(jié)果表明,該風險評估模型能夠較好地挖掘污染風險等級與影響因子之間的關(guān)系,并能夠計算評估流域面源污染不同風險程度的概率,同時可利用觀測的指標變量表示潛在的指標變量,滿足小流域監(jiān)測資料缺乏的實際情況。相比于其他預測模型,該模型能更好地為小流域面源污染治理提供參考。
生態(tài)清潔小流域;面源污染;風險評估;多分類有序離散選擇模型
生態(tài)清潔小流域是指在傳統(tǒng)小流域綜合治理基礎(chǔ)上,將水土資源保護、面源污染防治、農(nóng)村垃圾及污水處理等相結(jié)合的一種新型綜合治理模式[1],最早是由北京市提出的[2],其目標就是保護水源、改善環(huán)境、防治災害、促進發(fā)展[3]。近年來隨著社會經(jīng)濟的發(fā)展,小流域內(nèi)居民生產(chǎn)生活方式不斷發(fā)生變化,由流域內(nèi)的農(nóng)業(yè)生產(chǎn)及居民生活所引起的面源污染已經(jīng)成為流域水污染的主要因素[4-5]。相對于城市生活及工業(yè)生產(chǎn)的點源污染,流域性的面源污染具有污染范圍廣、隨機性大、成分形成復雜等問題,這也加大了流域面源污染的治理難度。
目前對于流域面源污染風險評估研究最常用的方法有事故樹分析法、層次分析法、主成分分析法、隨機抽樣法等,這些方法雖然能為面源污染風險在系統(tǒng)屬性評價上提供強大的技術(shù)支撐,但是沒有考慮到系統(tǒng)中因子的有序性和結(jié)構(gòu)性,而且在利用概率統(tǒng)計方法時將影響因子的貢獻值限制在0~1,忽略了單個因子貢獻值可能大于1的情況[6-8]。加上對小流域面源污染認識落后,導致現(xiàn)階段各小流域沒有系統(tǒng)的監(jiān)測資料和詳細的基本信息,因而需要探討一種既符合小流域面源污染監(jiān)測基礎(chǔ)資料匱乏的實際,又能夠為小流域面源污染預防與治理提供參考的新方法。本文嘗試采用有序多分類離散選擇模型對造成小流域面源污染的幾個主要因子進行分析,以期建立一種方便、快捷、準確的小流域面源污染風險評估方法。
1.1 小流域面源污染風險評估體系構(gòu)建
小流域面源污染主要來源有水土流失、農(nóng)業(yè)面源污染、農(nóng)村生產(chǎn)生活污染、大氣干濕沉降等[9]。由于面源污染具有隨機性、多樣性、廣泛性和不易監(jiān)測性等特點[10-11],本文在小流域面源污染監(jiān)測指標體系的基礎(chǔ)上,選取泥沙含量、氨氮、總磷、總氮和化學需氧量5個基本環(huán)境監(jiān)測指標,建立小流域面源污染風險評估指標體系,具體如表1所示。
1.2 指標體系描述與分析
設(shè)小流域面源污染風險評估指標集R={x1,x2,…, xn},其中n≥2,xi代表指標集中第i個指標,假定應用因子分析從指標集R中提取出的流域面源污染風險潛在變量為F1、F2、F3。參考環(huán)境質(zhì)量標準對水質(zhì)污染等級的劃分,將污染風險程度設(shè)置為“良好、輕度污染、較重污染、重污染、嚴重污染”,分別用數(shù)字“1、2、3、4、5”表示,概率分別表示為P1、P2、P3、P4、P5。影響面源污染的因素有很多,而它們之間存在著多重共線性,因此利用因子分析法提取潛在變量,可有效解決多重共線性問題[15]。因子分析的代數(shù)模型如下.
表1 小流域面源污染風險評估指標體系Table 1 Risk assessment index system of non-point source pollution in small watershed
式中:X∈R,為觀測變量;Fm為風險潛在變量;Aim為潛在變量因子荷載,構(gòu)成旋轉(zhuǎn)后因子成分矩陣;εx為觀測誤差或噪聲。則有.
式中:Wmn為標準化后的X的加權(quán)系數(shù),構(gòu)成成分得分系數(shù)矩陣。
通過因子分析可得出Aim和Wmn分別對應的系數(shù)矩陣,從而可用觀測變量將潛在變量表示出來。
1.3 建立污染風險評估模型
1.3.1 有序離散選擇模型
有序多分類離散選擇模型不要求變量滿足正態(tài)分布或等方差性,可對不同程度面源污染的影響因素進行定量評價,在面源污染風險評估中,利用數(shù)字來表示風險程度的高低次序,假設(shè)y表示在{0,1,2,..., k}上取值的有序分類響應變量,對于其中某一個K值,解釋變量為x1,x2,...,xn,則其對應的有序離散選擇模型[16-17]為.
式中:yi為第i個研究區(qū)域面源污染的風險程度;Xi為第i個區(qū)域面源污染風險程度的影響因素向量;α為常數(shù)項;β為待估計的系數(shù)向量;ui為獨立同分布的隨機擾動項。
當ui~N(0,1)時,式(3)為有序Probit模型,當ui~Logistic時,式(3)為有序Logit模型,而Logistic分布模型可以將由解釋變量構(gòu)成的非線性函數(shù)轉(zhuǎn)換成線性函數(shù),進而可以判斷影響污染的某一種主要因素,并能夠計算出不同的自變量,此時各種污染程度的發(fā)生概率滿足面源污染風險評估的要求。因此,本文采用ui~Logistic分布的假設(shè)。
y表示風險程度,是一個不可觀測的值,當實際觀測取值時有k種類別,相應取值y=1,y=2,…,y=k,且各取值之間的關(guān)系為(y=1)<(y=2)<…<(y=k),這樣風險取值就有k-1個未知的臨界點,這些點將各相鄰的類別劃分開[18]。也可表述如下.
式中:ak表示風險的臨界點,其值越大代表的風險程度越高;y表示風險程度。
當ui~Logistic分布時,通常使用如下Logistic轉(zhuǎn)換函數(shù).
可以得到給定X的y的條件分布,即可以計算y取各個值的概率.
對于每一個k,都有其對應的似然函數(shù),通過極大似然估計可得到對應臨界值a和系數(shù)β的極大似然估計值。為簡化計算,將似然函數(shù)取其對數(shù),求解對數(shù)似然函數(shù)來估計a和β的值,對數(shù)似然函數(shù)如下所述[19,17].
1.3.2 基于有序離散選擇模型的風險判別分析
有序Logistic回歸模型用于污染風險評估時,通常用“序類數(shù)-1”個回歸方程描述自變量(預報變量)與響應變量的關(guān)系,因此可以用k-1個方程聯(lián)立給出.
式中:等式左邊為污染發(fā)生比的對數(shù)形式,即表示出現(xiàn)某一類狀態(tài)的機會大小的對數(shù)。等式右邊X1、X2、…、Xn為預報變量;β1、β2、…、βn為待估計的參數(shù),可通過極大似然估計得到;βn,0表示回歸方程截距及未知臨界點的集合[17]。
建立的聯(lián)立方程式(7)經(jīng)過統(tǒng)計檢驗后即可對面源污染進行風險分析。將一組污染影響因子數(shù)據(jù),帶入式(7)中,即可求解出p1、p2、…、pn-1的值,進而得到序類1、2、…、n的概率P1、P2、…、Pn.
式中:Pi=P(y=i),i=1,2,…,k,表示發(fā)生某一程度風險的概率。
在滿足樣本多樣性的基礎(chǔ)上,本文以16個污染程度各不相同的小流域的環(huán)境監(jiān)測數(shù)據(jù)為基礎(chǔ),對基于有序多分類離散選擇模型的小流域面源污染風險評估方法進行了實例分析,其中15個小流域建立模型,第16個為驗證模型。分析步驟如下.
(1)在所選15個小流域數(shù)據(jù)中,依據(jù)小流域面源污染風險評估指標體系(表1),選擇對應流域某一年的監(jiān)測數(shù)據(jù)建立小流域風險評估信息表,作為模型分析的樣本數(shù)據(jù)(表2)。
(2)對表2的評估信息數(shù)據(jù)進行Bartlett球體檢驗、KMO檢驗,結(jié)果顯示KMO抽樣適度測定值為0.536,大于0.5,Bartlett球形檢驗值為23.821,P(Sig.= 0.008)<0.05,據(jù)此認為該數(shù)據(jù)可用于因子分析。結(jié)果詳見表3。
表2 小流域風險評估信息表Table 2 Risk assessment information table of selected small watershed
(3)通過因子分析得到成分得分系數(shù)(表4)和旋轉(zhuǎn)成分矩陣和公共因子方差(表5),以及成分分析碎石圖(圖1)和旋轉(zhuǎn)成分圖(圖2)。
表3 KMO抽樣適度測定值與Bartlett球形檢驗值Table 3 KMO and Bartlett′s Test
表4 成分得分系數(shù)Table 4 Component score coefficient table
表5 旋轉(zhuǎn)成分矩陣和公因子方差Table 5 Rotated component matrix and communalities
根據(jù)碎石圖(圖1)分析可知,成分1和成分2的特征值均大于1,綜合考慮選擇因子個數(shù)對原變量解釋率要高于80%及選取因子的特征值大于1這兩個限制條件,選取3個因子,解釋率為90.7%。根據(jù)旋轉(zhuǎn)成分圖(圖2),可認為變量X3、X5是第一組,X2、X4是第二組,X1是第三組。
根據(jù)表4,得到如下成分系數(shù)方程.
式中:F代表潛在變量的成分;x表示污染指標。
由式(9)可知,成分F1,基本支配a2、a4,反映氨氮(NH3-N)和總氮(TN)的情況;成分F2,基本支配a3、a5,反映總磷(TP)和化學需氧量(COD)的情況;成分F3,基本支配a1,反映泥沙含量的情況。
據(jù)表2和式(9)得到潛在變量評價結(jié)果如表6。
(4)根據(jù)提取的潛在變量,通過SPSS 19.0統(tǒng)計分析軟件進行有序Logistic回歸分析,結(jié)果見表7。
圖1 成分分析碎石圖Figure 1 Scree plot of factor analysis
圖2 旋轉(zhuǎn)空間中的成分圖Figure 2 Component plot in rotated space
表6 潛在變量評價Table 6 Latent variable evaluation table
表7 Logistic回歸分析結(jié)果Table 7 Analysis of regression logistic
(5)模型回代估計和預測能力檢驗
通過Pearson方法和Deviance方法,對模型進行擬合優(yōu)度檢驗,結(jié)果均表明顯著性大于0.9(表8),可認為擬合結(jié)果較好。
將建立模型的樣本數(shù)據(jù)重新帶入模型中,通過模型判斷的風險程度與流域?qū)嶋H的風險程度的比較,對模型準確性進行驗證。準確率η=(1-n/m)100%(其中n表示判錯個數(shù),m表示樣本總個數(shù)),根據(jù)表2數(shù)據(jù),利用式(9)、式(10)、式(5)、式(8)計算得到對應風險程度的概率值。結(jié)果顯示,15個小流域判錯3個,準確率為80%。判錯的原因可能是樣本個數(shù)偏少,導致等級3和4的界限區(qū)分不夠明確,故應增加風險等級3和4的樣本數(shù)量以明確兩者之間的界限?;嘏蟹治鼋Y(jié)果見表9。
表8 擬合度檢驗結(jié)果Table 8 Goodness-of-fit test results
(6)根據(jù)小流域面源污染風險評估模型,對第16個小流域進行面源污染風險評估,其面源污染信息如表10。
根據(jù)式(9),提取潛在變量F1=5.418 68,F2= -3.713 11,F3=27.676 6,根據(jù)式(10)求解得到待評估區(qū)域的p值p1=0.059,p2=0.998,p3=0.999,p4=0.999,根據(jù)式(8)得到P值,如表11。
maxPi=P(y=i)=P2,則可評定區(qū)域農(nóng)業(yè)面源污染的風險級別為“2輕度污染”。
(7)通過以上小流域面源污染風險模型的判別分析,認為第16個小流域面源污染風險程度較低,其中污染物中總磷(TP)及化學需氧量(COD)指標較低,泥沙含量、氨氮(NH3-N)、總氮(TN)指標居中。鑒于該小流域主要以農(nóng)業(yè)和旅游業(yè)為主,流域內(nèi)植被豐富、覆蓋良好,水土流失量較少,雖然模型預測的污染風險程度較低,但是考慮到引起面源污染的污染物大多吸附在土壤中,尚無隨徑流進入水體,因此模型預測結(jié)果僅供參考。對于該流域,在加強面源污染管理的同時,也要提高流域內(nèi)居民的環(huán)境保護意識,統(tǒng)籌協(xié)調(diào)流域內(nèi)的經(jīng)濟發(fā)展與生態(tài)治理。
(1)小流域面源污染風險評估指標體系能夠滿足現(xiàn)階段小流域面源污染基礎(chǔ)資料匱乏的現(xiàn)實,在污染物及污染途徑上較好地反映了小流域面源污染的實際情況。
(2)統(tǒng)計樣本的回代表明,該模型能夠較好地對發(fā)生污染的風險進行預測,預測準確率達80%。但由于Logistic模型的判斷能力取決于樣本數(shù)據(jù)的準確性及代表性,本模型在樣本回代時“較重污染”和“重污染”出現(xiàn)誤判,還需進一步增加這兩個風險程度在樣本中比例。
表9 回判分析結(jié)果Table 9 Result of return judgment
表10 小流域面源風險評估信息Table 10 Risk assessment information of small watershed
表11 風險評估P值Table 11 Pvalue of risk assessment
(3)Logistic模型能夠較好地挖掘污染風險等級與影響因子之間的關(guān)系,能計算待評估流域面源污染不同風險程度的概率,通過利用觀測變量表示潛在變量,從一定程度上解決概率統(tǒng)計方法對影響因子限制的問題。相對于其他判別模型,Logistic模型可為面源污染風險治理提供更多的風險信息,因而是一個相對更優(yōu)的小流域面源污染風險判別方法。
[1]郝咪娜.浙江省生態(tài)清潔小流域建設(shè)措施研究[D].西安.西北農(nóng)林科技大學,2013.1-2.
HAO Mi-na.Research on construction measures of eco-clean small watershed in Zhejiang Province[D].Xi′an.Northwest A&F University, 2013.1-2.
[2]畢小剛,楊進懷,李永貴,等.北京市建設(shè)生態(tài)清潔型小流域的思路與實踐[J].中國水土保持,2005(1).18-20.
BI Xiao-gang,YANG Jin-huai,LI Yong-gui,et al.Reasons and practice on establishing ecological and clean-type small watersheds in Beijing municipality[J].Soil and Water Conservation in China,2005(1). 18-20.
[3]祁生林.生態(tài)清潔小流域建設(shè)理論及實踐[D].北京林業(yè)大學,2006. 23-24.
QI Sheng-lin.Study on the eco-clean small watersheds construction theory and practice[D].Beijing.Beijing Forestry University,2006.23-24.
[4]可欣,于維坤,尹煒,等.小流域面源污染特征及其控制對策[J].環(huán)境科學與技術(shù),2009,32(7).201-205.
KE Xin,YU Wei-kun,YIN Wei,et al.Some aspects of non-point pollution in small watershed.Characteristics and control strategies[J].Environmental Science&Technology,2009,32(7).201-205.
[5]楊艷霞,曾紅娟,張亞玲.流域面源污染危害及治理與管理對策分析[J].林業(yè)調(diào)查規(guī)劃,2008,33(6).43-46.
YANG Yan-xia,ZENG Hong-juan,ZHANG Ya-ling.Analysis on harmfulness control and management of non-point source pollution of watershed[J].Forest Inventory and Planning,2008,33(6).43-46.
[6]劉建昌,嚴巖,劉峰,等.基于多因子指數(shù)集成的流域面源污染風險研究[J].環(huán)境科學,2008,29(3).599-606.
LIU Jian-chang,YAN Yan,LIU Feng,et al.Risk assessment and safetyevaluation using system normative indexes integration method for nonpoint source pollution on watershed scale[J].Environmental Science, 2008,29(3).599-606.
[7]Lloyd D K,Lipow M.Reliability.Management,methods,and mathematics[M].New Jersey.Prentice Hall,Englewood Cliffs,1962.291-299.
[8]Saaty T L.How to make a decision.The analytic hierarchy process[J].European Journal of Operational Research,1990,48(1).9-26.
[9]余志敏,袁曉燕,施衛(wèi)明.小流域面源污染治理與評估模型研究進展[J].中國人口.資源與環(huán)境,2010,20(5).1-4.
YU Zhi-min,YUAN Xiao-yan,SHI Wei-ming.Research evolvement of small watershed pollution management and evaluation model[J].China Population,Resources and Environment,2010,20(5).1-4.
[10]徐建華.現(xiàn)代地理學中的教學方法[M].北京.高等教育出版社, 2002.84-92.
XU Jian-hua.Mathematical methods in contemporary geography[M]. Beijing.Higher Education Press,2002.84-92.
[11]張玉斌,鄭粉莉,武敏.土壤侵蝕引起的農(nóng)業(yè)非典源污染研究進展[J].水科學進展,2007,18(1).123-132.
ZHANG Yu-bin,ZHENG Fen-li,WU Min.Research progresses in agricultural non-point source pollution caused by soil erosion[J].Advances in Water Science,2007,18(1).123-132.
[12]章茹,周文斌,金可禮.深圳茜坑水庫小流域非點源污染負荷估算[J].江西師范大學學報(自然科學版),2008,32(5).627-630.
ZHANG Ru,ZHOU Wen-bin,JIN Ke-li.Loss of non-point source pollutants from Xikeng Reservoir small watershed in Shenzhen[J].Journal of Jiangxi Normal University(Natural Science),2008,32(5).627-630.
[13]盧寶鵬,張瑞霞.小流域面源污染監(jiān)測技術(shù)指標體系及監(jiān)測方法初探[J].吉林農(nóng)業(yè),2010(9).157,190.
LU Bao-peng,ZHANG Rui-xia.Preliminary study on monitoring index system and monitoring method of non-point source pollution in small watershed[J].Jilin Agricultural,2010(9).157,190.
[14]魏曦,史明昌,郭宏忠,等.小流域面源污染監(jiān)測技術(shù)體系的構(gòu)建[J].中國水土保持,2010(11).14-16.
WEI Xi,SHI Ming-chang,GUO Hong-zhong,et al.Construction of monitoring system for non-point source pollution in small watershed[J].Soil and Water Conservation in China,2010(11).14-16.
[15]牟鵬飛,張東玲.有序多分類離散選擇模型的信用評級與風險預警研究.以國內(nèi)20家上市企業(yè)為例[J].中國海洋大學學報(自然科學版),2012,42(9).90-96.
MU Peng-fei,ZHANG Dong-ling.Ordereddiscrete choice modelbased credit rating and risk warning.Illustrated by an example of twenty domestic listed companies[J].Periodical of Ocean University of China,2012,42(9).90-96.
[16]張冬玲,高齊圣.基于多分類離散選擇模型的農(nóng)產(chǎn)品安全風險評估研究[J].農(nóng)業(yè)系統(tǒng)科學與綜合研究,2009,25(1).5-9.
ZHANG Dong-ling,GAO Qi-sheng.Agricultural food safety risk evaluation based on multi-classification discrete choice model[J].Systemsciences and Comprehensive Studies Inagriculture,2009,25(1).5-9.
[17]張冬玲.農(nóng)產(chǎn)品質(zhì)量安全綜合評價理論與方法研究[D].青島.青島大學,2009.82-103.
ZHANG Dong-ling.Study on theory and method of synthetically evaluation of agricultural products quality and safety[D].Qingdao.Qingdao University,2009.82-103.
[18]李壁濤.有序多分類回歸模型及其在判斷空氣質(zhì)量等級方面的應用[D].昆明.云南大學,2015.11-14.
LI Bi-tao.The ordinal classification and regression model and its application in judgement the rank of air quality[D].Kunming.Yunnan U-niversity,2015.11-14.
[19]段鵬.離散選擇模型理論與應用研究[D].天津.南開大學,2010. 27-29.
DUAN Peng.Theoreticl research of discrete selection model and its applications[D].Tianjin.Nankai University,2015.27-19.
Research on small watershed non-point source pollution risk assessment.Based on the ordered multi-classification discrete choice model
TAO Shuang-jun1,SHAO Guang-cheng1*,SU Jiang-lin2,LI Yu-fei2,ZHANG Xin-yu3,ZHANG Shao-hua4
(1.Key Laboratory of Efficient Irrigation-Drainage and Agricultural Soil-Water Environment in Southern China,Ministry of Education,College of Water Conservancy and Hydropower Engineering,Hohai University,Nanjing 210098,China;2.Water Conservancy Bureau of Huaian District,Huaian City,Huaian 223200,China;3.Shuhe River Water Management Bureau,Linyi 276000,China;4.Shandong Water Conservancy Vocational Collage,Rizhao 276800,China)
The ordered multi-classification discrete choice model was introduced into the risk assessment of non-point source pollution in small watersheds.Based on small watershed environmental monitoring data,sediment concentration,ammonia nitrogen,total nitrogen,total phosphorus,and chemical oxygen demand,which influence the water environment of small watersheds,were selected as independent variables and pollution risk level as a dependent variable,to establish the discrimination formula of the non-point pollution risk.A Kaiser-Meyer-Olkintest of sampling adequacy and Bartlett′s test of sphericity were carried out to test the correlation of the model sample data. Goodness of fit and model predictive ability test were used to evaluate the model correctness.The results show that the model sample data have good correlation,and the model has excellent performance and forecasting ability.Unlike other models,the logistic distribution model has no requirement for the variable distribution.It can evaluate different levels of nonpoint source pollution influencing factors quantitatively and calculate the probability of different non-point source pollution risks.This study used the potential indicators to calculate model param-eters,which conforms to the current situation of small watersheds in China.As a result,source pollution risk assessment based on the ordered multi-classification discrete choice model is a better method for small watershed non-point source pollution risk assessment.
ecological clean small-watershed;non-point source pollution;risk assessment;ordered multi-classification discrete choice model
X592
A
1672-2043(2017)07-1293-07
10.11654/jaes.2017-0047
陶雙駿,邵光成,蘇江霖,等.小流域面源污染風險評估研究——基于多分類有序離散選擇模型[J].農(nóng)業(yè)環(huán)境科學學報,2017,36(7).1293-1299.
TAO Shuang-jun,SHAO Guang-cheng,SU Jiang-lin,et al.Research on small watershed non-point source pollution risk assessment.Based on the ordered multi-classification discrete choice model[J].Journal of Agro-Environment Science,2017,36(7).1293-1299.
2017-01-09
陶雙駿(1990—),男,江蘇南京人,碩士生,主要從事農(nóng)業(yè)水土資源高效利用研究。E-mail:1533044561@qq.com
*通信作者:邵光成E-mail:sgcln@126.com
江蘇高校優(yōu)勢學科建設(shè)工程項目
Project supported:The Priority Academic Program Development of Jiangsu Higher Education Institutions