潘 淼
(遼寧潤(rùn)中供水有限責(zé)任公司,遼寧 沈陽(yáng) 110000)
經(jīng)濟(jì)社會(huì)的快速發(fā)展在大幅提升人們的生活水平的同時(shí),也不可避免地造成了日趨嚴(yán)重的環(huán)境污染。為有效利用水資源,減少水質(zhì)污染造成的負(fù)面影響,對(duì)水質(zhì)進(jìn)行科學(xué)、準(zhǔn)確、可靠的評(píng)價(jià)以及對(duì)其變化趨勢(shì)進(jìn)行有效預(yù)測(cè)極為重要[1]。網(wǎng)絡(luò)自適應(yīng)模糊推理系統(tǒng)(ANFIS)實(shí)現(xiàn)了人工神經(jīng)網(wǎng)絡(luò)技術(shù)和模糊控制技術(shù)的完美融合,可以在水質(zhì)評(píng)價(jià)和預(yù)測(cè)領(lǐng)域發(fā)揮更要重要的作用[2]。
水環(huán)境質(zhì)量通常是由多個(gè)水質(zhì)指標(biāo)數(shù)據(jù)體現(xiàn)出來(lái)的,而水環(huán)境質(zhì)量預(yù)測(cè)也需要依據(jù)權(quán)威的水質(zhì)監(jiān)測(cè)數(shù)據(jù)創(chuàng)建預(yù)測(cè)模型。2003年,國(guó)家環(huán)保部出臺(tái)的HJ-T100- 2003《水質(zhì)指標(biāo)的自動(dòng)分析儀技術(shù)》中提出了9項(xiàng)環(huán)境保護(hù)行業(yè)標(biāo)準(zhǔn),不僅包含了總氮、總磷、氨氮、pH等傳統(tǒng)慣例監(jiān)測(cè)項(xiàng)目,同時(shí)也包含了化學(xué)需氧量(COD)、生化需氧量(BOD)以及部分重金屬離子等水質(zhì)監(jiān)測(cè)參數(shù)。結(jié)合上述標(biāo)準(zhǔn)以及水質(zhì)監(jiān)測(cè)的實(shí)際需求,本次研究選取了水質(zhì)監(jiān)測(cè)站的COD、pH、溶解氧、氨氮和總磷等5個(gè)水質(zhì)質(zhì)量監(jiān)測(cè)指標(biāo)。其中,化學(xué)需氧量(COD)作為研究水域中還原性物質(zhì)污染程度的主要指標(biāo),是進(jìn)行水質(zhì)預(yù)測(cè)的重要參數(shù),因此將COD作為預(yù)測(cè)模型輸出計(jì)算的基本參數(shù)。
不同的水質(zhì)參數(shù)擁有不同的量綱和單位,會(huì)對(duì)模型的數(shù)據(jù)分析造成影響,因此必須要對(duì)數(shù)據(jù)進(jìn)行歸一化處理[3]。本次研究中擬采用如下的線性函數(shù)進(jìn)行歸一化處理。
(1)
式中,xmin—某組數(shù)據(jù)的最小值;xmax—某組數(shù)據(jù)中的最大值。
在數(shù)據(jù)進(jìn)行歸一化處理之后,試驗(yàn)數(shù)據(jù)將映射在區(qū)間[0,1]之間。
在模型試驗(yàn)過(guò)程中,對(duì)整體數(shù)據(jù)進(jìn)行聚類分析,將其中的離群數(shù)據(jù)刪除,可以有效提升模型本身的預(yù)測(cè)精度。因此,結(jié)合數(shù)據(jù)的實(shí)際特征,采取歐式距離法對(duì)水質(zhì)數(shù)據(jù)進(jìn)行聚類分析[4]。
基于ANFIS水質(zhì)預(yù)測(cè)模型的預(yù)測(cè)基本流程如圖1所示。
第一步,首先確定預(yù)測(cè)水域的主要參數(shù),本次研究選取了水質(zhì)監(jiān)測(cè)站的COD、pH、溶解氧、氨氮和總磷等5個(gè)參數(shù)。第二步,對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理:在剔除部分無(wú)效和離群數(shù)據(jù)后,將余下的數(shù)據(jù)進(jìn)行歸一化處理,在歸一化處理之后進(jìn)行測(cè)試和訓(xùn)練樣本分組。第三步,利用訓(xùn)練樣本對(duì)模型進(jìn)行訓(xùn)練,尋求并確定最合適的參數(shù)以及隸屬度函數(shù)。第四步,將測(cè)試數(shù)據(jù)輸入模型完成對(duì)COD水質(zhì)參數(shù)的預(yù)測(cè)。
圖1 ANFIS水質(zhì)預(yù)測(cè)模型的預(yù)測(cè)基本流程
在基于ANFIS的水質(zhì)預(yù)測(cè)模型中,隸屬度函數(shù)類型的選取以及數(shù)目的確定對(duì)模型預(yù)測(cè)精度具有較大影響[5]。常見(jiàn)的隸屬度函數(shù)通常包括高速函數(shù)、鐘型函數(shù)、梯形函數(shù)等幾種常見(jiàn)的函數(shù)。對(duì)上述3種函數(shù)的比較顯示,雖然都能擬合出原曲線,但是相對(duì)而言,高斯函數(shù)的擬合精度更高,因此在本次研究中擬采用高斯函數(shù)構(gòu)建基于ANFIS的水質(zhì)預(yù)測(cè)模型。
在隸屬度函數(shù)確定之后,確定隸屬度函數(shù)的數(shù)目。根據(jù)相關(guān)研究成果和實(shí)踐經(jīng)驗(yàn)[6],隸屬度函數(shù)的數(shù)目通常選取在[1,30]之間,研究中將不同數(shù)目的隸屬度函數(shù)依次帶入模型,實(shí)踐結(jié)果顯示,隸屬度函數(shù)的數(shù)目選定為5~20條之間時(shí),ANFIS的水質(zhì)預(yù)測(cè)模型均能對(duì)原曲線進(jìn)行準(zhǔn)確擬合,而隸屬度函數(shù)的數(shù)目少于3條的情況下,模型就不能對(duì)原曲線進(jìn)行準(zhǔn)確擬合。另一方面,函數(shù)數(shù)目的增加,雖然能夠提高擬合度的精準(zhǔn)度,但是提高較為有限,模糊子集之間的相互影響會(huì)顯著降低模型的靈敏度。本次研究最終確定隸屬度函數(shù)的數(shù)目為5條。
針對(duì)訓(xùn)練次數(shù),根據(jù)相關(guān)研究成果,引入一個(gè)性能指標(biāo)σ,設(shè)模擬精度為ε訓(xùn)練次數(shù)為n,trRMSE(n)為訓(xùn)練n次之后得到了RMSE值,根據(jù)公式(2),當(dāng)σ≤ε時(shí)的n的值極為最優(yōu)訓(xùn)練次數(shù)[7]。
σ=|trRMSE(n)-trRMSE(1)|
(2)
在本次研究中,初步設(shè)定模型的訓(xùn)練次數(shù)為500次,結(jié)合上述設(shè)定的高斯函數(shù)以及函數(shù)數(shù)目為5條等相關(guān)參數(shù),對(duì)模型展開(kāi)訓(xùn)練,獲得的RMSE隨訓(xùn)練次數(shù)變化的曲線如圖2所示。由圖2可知,當(dāng)訓(xùn)練次數(shù)達(dá)到35次時(shí),RMSE值的變化逐漸趨向平穩(wěn),根據(jù)公式(2)的要求,設(shè)定本次訓(xùn)練精度為0.02,最終得到最優(yōu)訓(xùn)練次數(shù)為378次。
圖2 RMSE值訓(xùn)練變化曲線
為了檢驗(yàn)基于ANFIS水質(zhì)預(yù)測(cè)模型的泛化性和實(shí)用性,研究中以遼寧省大伙房水庫(kù)出庫(kù)口的監(jiān)測(cè)數(shù)據(jù)為研究對(duì)象,由于該站每隔6小時(shí)采集記錄一次水質(zhì)監(jiān)測(cè)數(shù)據(jù),采集間隔時(shí)間合理,可以全面反映渾河該區(qū)段的水質(zhì)情況。實(shí)驗(yàn)選取的是大伙房水庫(kù)出庫(kù)口2017年4—10月的數(shù)據(jù),其中4—9月的數(shù)據(jù)進(jìn)行模型訓(xùn)練,10月份的數(shù)據(jù)輸入模型進(jìn)行測(cè)試,并將期望值和實(shí)際值進(jìn)行對(duì)比分析。其中,2017年4月1日6時(shí)至2017年4月5日0時(shí)的各項(xiàng)水質(zhì)指標(biāo)數(shù)值見(jiàn)表1。
表1 大伙房水庫(kù)庫(kù)口水質(zhì)監(jiān)測(cè)部分原始數(shù)據(jù)單位:mg/L
將原始數(shù)據(jù)進(jìn)行預(yù)處理后,進(jìn)行訓(xùn)練樣本和測(cè)試樣本劃分,然后將訓(xùn)練樣本輸入ANFIS模型進(jìn)行訓(xùn)練,在訓(xùn)練完畢后將測(cè)試樣本輸入模型,計(jì)算得出COD值的預(yù)測(cè)結(jié)果,然后與實(shí)際值進(jìn)行比較,結(jié)果如圖3所示。在軟件窗口顯示的模型預(yù)測(cè)值和實(shí)際值之間的相對(duì)誤差為0.0966,均方根誤差值為0.0610,均方根誤差為0.2363。由此可見(jiàn),ANFIS模型的預(yù)測(cè)值與真實(shí)值之間具有良好的擬合性,說(shuō)明模型本身具有較好的預(yù)測(cè)能力和準(zhǔn)確性。
圖3 模型計(jì)算得出預(yù)測(cè)值與實(shí)際值
為進(jìn)一步驗(yàn)證ANFIS模型的實(shí)用性和泛化性,橫向?qū)Ρ饶P皖A(yù)測(cè)能力的優(yōu)劣,研究中基于同組數(shù)據(jù),分別利用BP神經(jīng)網(wǎng)絡(luò)模型和RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)計(jì)算[8],其預(yù)測(cè)性能參數(shù)的對(duì)比結(jié)果見(jiàn)表2。由表2中的數(shù)據(jù)可以看出,ANFIS模型能夠?qū)喓哟蠡锓克畮?kù)段水體中的COD含量進(jìn)行較好的預(yù)測(cè),從相對(duì)誤差來(lái)看,該模型的誤差為0.0966,顯著小于BP神經(jīng)網(wǎng)絡(luò)模型的0.1315和RBF神經(jīng)網(wǎng)絡(luò)模型的0.1485的相對(duì)誤差值。因此,ANFIS模型相較于BP神經(jīng)網(wǎng)絡(luò)模型和RBF神經(jīng)網(wǎng)絡(luò)模型具有更好的泛化性和實(shí)用性。
表2 不同預(yù)測(cè)模型的性能參數(shù)對(duì)比結(jié)果
本文以渾河大伙房水庫(kù)庫(kù)口地表水為檢測(cè)對(duì)象,建立ANFIS預(yù)測(cè)模型對(duì)該河段水體COD含量進(jìn)行了預(yù)測(cè)研究,并獲得如下結(jié)論。
(1)結(jié)合國(guó)家環(huán)保部的相關(guān)標(biāo)準(zhǔn)以及水質(zhì)監(jiān)測(cè)的實(shí)際需求,研究中選取COD、pH、溶解氧、氨氮和總磷等五個(gè)水質(zhì)質(zhì)量監(jiān)測(cè)指標(biāo),并將COD作為預(yù)測(cè)模型輸出計(jì)算的基本參數(shù)。
(2)利用ANFIS模型對(duì)COD值進(jìn)行預(yù)測(cè)計(jì)算,并將結(jié)果與實(shí)際值進(jìn)行比較,結(jié)果顯示模型預(yù)測(cè)值和實(shí)際值之間具有良好的擬合性,說(shuō)明模型本身具有較好的預(yù)測(cè)能力和準(zhǔn)確性。
(3)將ANFIS模型與BP神經(jīng)網(wǎng)絡(luò)模型和RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比分析,結(jié)果顯示ANFIS模型相較于BP神經(jīng)網(wǎng)絡(luò)模型和RBF神經(jīng)網(wǎng)絡(luò)模型具有更好的泛化性和實(shí)用性。