劉 杰,王 強
(陜西理工大學 數(shù)學與計算機科學學院,陜西 漢中 723000)
基于回歸分析的漢江漢中段水體重金屬污染預(yù)測模型
劉 杰,王 強
(陜西理工大學 數(shù)學與計算機科學學院,陜西 漢中 723000)
以漢江流域漢中段2006—2015年水體重金屬濃度為基礎(chǔ)數(shù)據(jù),利用MATLAB軟件,采用非線性回歸分析法,建立了基于時間序列的重金屬濃度預(yù)測模型并進行模型仿真。實驗結(jié)果表明各種重金屬濃度隨時間變化的趨勢與實際情況基本吻合,該模型能以較高的預(yù)測精度反映漢江漢中段水體重金屬濃度隨時間變化趨勢。
漢江流域漢中段; 重金屬污染; 非線性回歸分析; 預(yù)測模型
水乃生命之源,生產(chǎn)之要,生態(tài)之基。隨著社會經(jīng)濟的飛速發(fā)展,大量的工業(yè)廢水和生活污水排入河流湖泊,已經(jīng)嚴重污染了水體。在排入水體的各種污染物中,重金屬因其難以降解而長期積累,具有來源廣且殘毒時間長的特點,對水體生物及人類的生產(chǎn)和生活造成了嚴重的危害,成為水污染治理的重點和難點。
漢江是“南水北調(diào)”中線工程和“引漢濟渭”工程的主要水源地,它發(fā)源于漢中,是長江最大的支流,在漢中境內(nèi)長約270 km,境內(nèi)流域面積1.97萬平方公里,大小支流共346條,年平均徑流量約100億立方米。隨著“南水北調(diào)”工程的正式通水,水源地的水質(zhì)保護對調(diào)水工程沿線的生態(tài)環(huán)境和居民生產(chǎn)生活將產(chǎn)生直接且深遠的影響。水質(zhì)的科學預(yù)測對水污染預(yù)防與治理有著極為重要的指導意義,可以利用采集到的各種水質(zhì)數(shù)據(jù),采用不同的預(yù)測方法建立模型來預(yù)測水質(zhì)未來的變化趨勢并探索其變化規(guī)律。目前,國內(nèi)外研究學者主要采用GM(1,1)預(yù)測模型、人工神經(jīng)網(wǎng)絡(luò)預(yù)測、數(shù)理統(tǒng)計預(yù)測以及混沌理論等預(yù)測方法。李如忠等[1]將灰色動態(tài)模型法引入河流水質(zhì)預(yù)測中;邱淑芳等[2]利用改進的GM(1,1)方法預(yù)測地下水環(huán)境;何丕文等[3]利用有限差分法對河流水質(zhì)進行了預(yù)測。Stewart和Bates提出了一種洪泛區(qū)污染物遷移的分布模型[4],可在河水達到一定范圍時對沉積和滲漏污染物進行立體分布預(yù)測。
本文采集漢江流域漢中段水體重金屬含量數(shù)據(jù),通過MATLAB軟件采用回歸分析法建立水體重金屬污染預(yù)測模型[5]。
陜西省漢中市洋縣黃金峽采樣點地處漢江流域漢中段下游,接近漢江在漢中的出境口,是“引漢濟渭”工程的直接取水區(qū)。因此本研究選取漢江干流的黃金峽斷面2006—2015年連續(xù)10年的每年1月份枯水期時水體As、Hg、Cr、Pb、Cd、Cu等6種主要重金屬濃度作為研究的基礎(chǔ)數(shù)據(jù)(文中所涉及的黃金峽斷面采樣點的6種重金屬濃度數(shù)據(jù)由漢中市環(huán)境監(jiān)測中心站的年度監(jiān)測報告提供),如表1所示。對監(jiān)測數(shù)據(jù)進行非線性回歸分析,建立該斷面隨時間推移各種重金屬在枯水期時的濃度預(yù)測模型。
表1 黃金峽采樣點2006—2015年1月份水體重金屬含量 (單位:mg/L)
2.1 回歸分析
回歸分析預(yù)測法是在掌握大量采集數(shù)據(jù)的基礎(chǔ)上,根據(jù)因變量(預(yù)測對象)和自變量(影響因素)的相關(guān)關(guān)系,利用數(shù)理統(tǒng)計法建立因變量和自變量之間的回歸方程,并利用該回歸方程來預(yù)測因變量未來發(fā)展趨勢的分析方法。根據(jù)自變量和因變量之間相關(guān)關(guān)系的不同,又可分為線性回歸和非線性回歸。線性回歸的因變量是自變量的一次函數(shù),回歸規(guī)律呈直線型,方法簡單但擬合結(jié)果往往與實際值的偏差較大。非線性回歸的因變量是自變量的n次方(n>1)以上的函數(shù)形式,回歸規(guī)律在圖形上呈現(xiàn)為各種曲線,預(yù)測結(jié)果更接近實際值[6]。為了保證預(yù)測的精確度,本研究利用MATLAB軟件進行非線性回歸分析預(yù)測。
2.2 回歸預(yù)測模型
通過對采樣數(shù)據(jù)的研究發(fā)現(xiàn),將預(yù)測時間與初次采集時間的間隔作為自變量x,某種重金屬濃度作為因變量y,建立該種重金屬濃度隨時間推移而變化的回歸模型。模型以初次采集時間2006年作為起始點記為0,相鄰的兩次采集時間間隔為1年,共有10次采集,最后一次與初次采集時間間隔為9年。
以重金屬Cr為例,在MATLAB中寫入并運行以下程序:
x=0:1:9;
y=[0.002578 0.004234 0.004499 0.004671 0.004532 0.004379 0.005989 0.006664 0.006498 0.007494];
cftool (x,y)
得到2006—2015年元素Cr的散點分布圖,如圖1所示。
圖1 2006—2015年元素Cr的濃度散點分布圖 圖2 重金屬Cr隨時間變化的濃度擬合圖
根據(jù)得到的散點分布圖,利用MATLAB進行多項式擬合。擬合是指根據(jù)某函數(shù)的若干離散函數(shù)值,通過調(diào)整該函數(shù)的若干待定系數(shù),使得該函數(shù)與已知點集的誤差最小。通常選取能使相關(guān)系數(shù)R2越接近1且殘差值越小的擬合次數(shù)作為最佳的擬合次數(shù),這使模型的預(yù)測精度相對也越高[7-9]。經(jīng)多次實驗和計算,發(fā)現(xiàn)擬合7次時達到最佳預(yù)測效果,R2=0.9908,殘差值為0.000 298 3,得到如圖2所示的重金屬Cr隨時間變化的濃度擬合圖。
經(jīng)7次擬合得到重金屬Cr濃度預(yù)測的回歸擬合方程為:
用同樣的方法可以得到其余5種重金屬As、Hg、Pb、Cd和Cu在該采樣點的回歸擬合方程,預(yù)測出該重金屬隨時間變化的濃度值:
表2 重金屬Cr濃度實測值與預(yù)測值 (單位:mg/L)
2.3 模型檢驗
2.3.1 實際值與預(yù)測值對比分析
預(yù)測值與實際值的對比分析可以反映出該模型的預(yù)測效果。將采集時間與初始采集時間的間隔代入某種重金屬濃度的擬合回歸方程,即可得到該重金屬濃度預(yù)測值。重金屬Cr濃度實測值與預(yù)測值如表2所示,從表中得出,模型預(yù)測值與實際值的誤差很小,其中8個預(yù)測值與其對應(yīng)的真實值之間誤差均小于0.0005,另外兩個誤差稍高于0.0005,總體上取得了較為滿意的預(yù)測效果。
2.3.2 模型檢驗
在數(shù)理統(tǒng)計中,通常用以下3個數(shù)值來檢驗回歸模型的有效性[8-10]:(1)相關(guān)系數(shù)R2越接近1,說明回歸方程越顯著;(2)顯著性F值越大,說明回歸方程越顯著;(3)與F對應(yīng)的概率P
利用MATLAB軟件進行回歸擬合和計算可得,重金屬Cr的預(yù)測回歸方程的相關(guān)系數(shù)R2=0.9908(約等于1),F(xiàn)=18.4702,P=0.000 34<0.05。
經(jīng)過對其余5種重金屬濃度預(yù)測值與真實值進行對比分析,同時對模型的有效性進行檢驗,實驗結(jié)果如表3所示。實驗結(jié)果證明回歸預(yù)測模型整體上符合數(shù)據(jù)變化規(guī)律,具有較高的預(yù)測精度。
表3 As、Hg、Pb、Cd和Cu回歸方程的模型有效性檢驗結(jié)果
研究選取漢江漢中段黃金峽斷面為采樣點,建立了該斷面基于時間序列的重金屬濃度預(yù)測模型,回歸分析和實驗仿真結(jié)果表明該模型能夠較真實地反映重金屬濃度隨時間的變化趨勢。由于水體重金屬濃度受多種因素影響,下一步研究將著重考慮將重金屬濃度的影響因子引入到模型中,進一步提高模型的預(yù)測精度,旨在為漢江水源地水體重金屬污染防控提供科學的指導依據(jù)。
[1] 李如忠,王超.灰色動態(tài)模型群法在河流水質(zhì)預(yù)測中的應(yīng)用初探[J].中國農(nóng)村水利水電,2003(1):76-78.
[2] 邱淑芳,周其華,王澤文.改進的GM(1,1)模型及其在地下水環(huán)境預(yù)測中的應(yīng)用[J].東華理工學院學報,2006,29(2):176-180.
[3] 何丕文.有限差分法在河流水質(zhì)預(yù)測中的應(yīng)用[J].長江大學學報(自科版),2006,3(1):38-39.
[4] CAMPOLO M,SOLDATI A,ANDREUSSI P. Forecasting river flow rate during low-flow period using neural network[J].Water resource,1999,35(11):3547-3552.
[5] 彭澤洲,楊天行,梁秀娟,等.基于一種時間序列模型的河流重金屬污染濃度預(yù)測研究[J].計算技術(shù)與自動化,2012,31(3):29-33.
[6] 魏世麗,葛永慧.一元非線性回歸兩種不同模型的比較[J].統(tǒng)計與決策,2015(4):29-31.
[7] 張利平,于貞杰,張建華,等.六種時間序列組合建模及應(yīng)用[J].統(tǒng)計與決策,2016(14):71-73.
[8] 寧可.基于MATLAB的湘江水質(zhì)重金屬污染預(yù)測模型研究[J].安徽農(nóng)業(yè)科學,2012,40(9):5496-5498.
[9] 顏廷文,孫寶盛,張冉.基于等維新息灰色馬爾可夫模型的河流水質(zhì)預(yù)測[J].水土保持通報,2013,33(5):130-134.
[10] 郭晶,李利強,黃代中,等.洞庭湖表層水和底泥中重金屬污染狀況及其變化趨勢[J].環(huán)境科學研究,2016,29(1):44-51.
[責任編輯:李 莉]
Prediction model of heavy metal pollution in Hanzhong section of Hanjiang river based on regression analysis
LIU Jie,WANG Qiang
(School of Mathematics and Computer Science,Shaanxi University of Technology,Hanzhong 723000,China)
The Prediction Model of Heavy Metal Pollution based on the time-series had been established for the first time through the nonlinear regression analysis using the software named MATLAB. The data of the concentration of heavy metal in 2006—2015 of Hanzhong section of Hanjiang river was collected as the basic data for this research. At the same time,the model emulation had been done in this paper. The experimental results showed that the variation with time of the predicted heavy metal content was basically consistent with the actual conditions,which indicated that this model could forecast the variation with time of heavy metal content in Hanzhong section of Hanjiang river well,and this model has a high precision.
Hanzhong section of Hanjiang river; heavy metal pollution; nonlinear regression analysis; prediction model
2096-3998(2017)03-0089-04
2016-12-28
2017-02-26
陜西省教育廳科學研究計劃項目(15JK1128)
劉杰(1982—),女,陜西省城固縣人,陜西理工大學副教授,碩士,主要研究方向為智能優(yōu)化算法及應(yīng)用;王強(1977—),男,陜西省勉縣人,陜西理工大學講師,主要研究方向為計算機科學技術(shù)及智能優(yōu)化。
S273.5
A