黃琦蘭,范金祥
(天津工業(yè)大學(xué) 電氣工程與自動(dòng)化學(xué)院,天津 300387))
污水處理過(guò)程中,化學(xué)需氧量(chemical oxygen demand,COD)是衡量水中有機(jī)物含量的重要指標(biāo),能否對(duì)COD進(jìn)行實(shí)時(shí)準(zhǔn)確的監(jiān)測(cè)是水質(zhì)污染防治的關(guān)鍵。由于污水處理系統(tǒng)存在處理工藝復(fù)雜,污水控制干擾大等問(wèn)題,傳統(tǒng)測(cè)量方法由于測(cè)量手段有限,難以滿足精確性、實(shí)時(shí)性、經(jīng)濟(jì)性等要求,因此有必要建立高質(zhì)量的軟測(cè)量模型來(lái)預(yù)測(cè)出水水質(zhì)參數(shù)[1-6]。
近年來(lái),國(guó)內(nèi)外很多學(xué)者對(duì)污水處理過(guò)程中出水水質(zhì)軟測(cè)量模型進(jìn)行了大量的研究。人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)已成功應(yīng)用于許多污水處理廠的在線預(yù)測(cè)和過(guò)程監(jiān)控中[7]。Fernandez等[8]使用灰色模型和人工神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)廢水中的懸浮物和化學(xué)需氧量;Cong等[9]將小波神經(jīng)網(wǎng)絡(luò)和自適應(yīng)加權(quán)融合的混合軟測(cè)量模型用于出水COD的在線預(yù)測(cè)。然而,盡管人工神經(jīng)網(wǎng)絡(luò)表現(xiàn)出了優(yōu)異的性能,但仍然存在局限性,如擬合度過(guò)高、收斂速度慢、泛化性能差等缺點(diǎn)。
支持向量機(jī)(support vector machine,SVM)在解決復(fù)雜問(wèn)題方面具有獨(dú)特的優(yōu)勢(shì),在軟測(cè)量中得到廣泛的應(yīng)用。文獻(xiàn)[10]利用基于PSO-SVM混合模型對(duì)灌溉系統(tǒng)的沙濾池中出水濁度和pH值進(jìn)行預(yù)測(cè),并獲得了良好的性能;最小二乘支持向量機(jī)(LSSVM)利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則來(lái)代替?zhèn)鹘y(tǒng)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,使其對(duì)未來(lái)樣本有較好的泛化能力,但該算法的自適應(yīng)能力差,魯棒性不強(qiáng);文獻(xiàn)[11]利用PSO-LSSVM進(jìn)行污水COD預(yù)測(cè),但PSO自身收斂速度慢,對(duì)預(yù)測(cè)精度有一定影響[12]。
基于以上原因,本文提出一種基于改進(jìn)LSSVM的軟測(cè)量模型,該方法通過(guò)改進(jìn)粒子群算法(Improved PSO,IPSO)對(duì)LSSVM模型相關(guān)參數(shù)進(jìn)行優(yōu)化。IPSO算法旨在解決PSO算法早熟收斂問(wèn)題。通過(guò)IPSO算法尋找LSSVM模型參數(shù)的全局最優(yōu)解,建立基于IPSO優(yōu)化的LSSVM污水水質(zhì)參數(shù)預(yù)測(cè)模型。選用污水處理過(guò)程中具有代表性的特征向量作為預(yù)測(cè)模型的輸入向量,并且與傳統(tǒng)的LSSVM模型及基于PSO優(yōu)化LSSVM模型進(jìn)行了模型精度分析對(duì)比。
最小二乘支持向量機(jī)(LSSVM)通過(guò)求解線性規(guī)劃而非二次規(guī)劃來(lái)提高SVM算法的性能從而簡(jiǎn)化了計(jì)算雜過(guò)程,提高了運(yùn)算速度,是SVM算法的一種擴(kuò)展[13-14]。
設(shè)數(shù)據(jù)集T=[(xi,yi)],i=1,2,…,N為樣本總數(shù);則樣本的回歸模型為
式中:y(x)表示輸出;x 表示輸入變量;φ(x)為非線性逼近函數(shù);w和b分別表示權(quán)重項(xiàng)和偏置項(xiàng)。對(duì)于LSSVM,其優(yōu)化問(wèn)題變?yōu)?/p>
式中:ai為拉格朗日乘子。該方程通過(guò)對(duì)各個(gè)變量求其偏導(dǎo)并令偏導(dǎo)為0來(lái)求解,得到以下方程組:
消去w和ξi,問(wèn)題可以定義如下:
式中:Ω和I分別表示核矩陣和恒等式矩陣。核矩陣可表示為Ω=φT(xi)φ(xi)。
求解式(5)可以獲得LSSVM函數(shù)估計(jì)如下:
式中:K(xi,x)為核函數(shù),有不同類型的核函數(shù),如徑向基函數(shù)(RBF)和多項(xiàng)式函數(shù),本文以徑向基函數(shù)作為核函數(shù)。
式中:只有1個(gè)待定參數(shù)σ,表示徑向基函數(shù)寬度;根據(jù)LSSVM回歸理論,LSSVM存在1個(gè)可調(diào)參數(shù)γ>0。因此,當(dāng)應(yīng)用帶有RBF核函數(shù)的LSSVM方法時(shí),有2個(gè)可調(diào)參數(shù)(σ和γ)。
粒子群優(yōu)化算法(particle swarm optimization,PSO)是一種受鳥(niǎo)群或魚(yú)群等動(dòng)物之間社交互動(dòng)行為啟發(fā)的隨機(jī)優(yōu)化算法,最初由Eberhart和Kennedy于1995年提出,并由Shi和Eberhart于1998年進(jìn)一步改進(jìn)[15-16]。PSO算法在編碼上的簡(jiǎn)單性和一致性被認(rèn)為是該進(jìn)化算法的突出優(yōu)點(diǎn)[17]。在該算法中,每個(gè)解都由一群粒子表示,pbest和gbest分別表示粒子i的個(gè)體最優(yōu)解和種群中所有粒子之間的最優(yōu)解,為了達(dá)到最優(yōu)結(jié)構(gòu),每個(gè)粒子的更新速度vi和位置xi的數(shù)學(xué)方程描述如下:
式中:c1和 c2表示加速度常數(shù);r1、r2服從 U(0,1)分布的隨機(jī)數(shù);慣性權(quán)w重用于平衡局部勘探和全局勘探,慣性權(quán)重可由下列公式確定:
式中:wmax和wmin分別代表最終和初始權(quán)重;K表示迭代最大次數(shù)。
盡管PSO算法具有可調(diào)參數(shù)少、易于實(shí)現(xiàn)等優(yōu)點(diǎn),但是當(dāng)面對(duì)一些復(fù)雜的問(wèn)題,它也可能會(huì)過(guò)早收斂或陷入局部最優(yōu),即在一定時(shí)間內(nèi),每個(gè)粒子在種群中的最佳位置趨于固定值,并且每個(gè)粒子的速度也趨于零,為了解決這個(gè)問(wèn)題,本文提出改進(jìn)PSO(Improved PSO,IPSO)算法。
實(shí)驗(yàn)研究表明,慣性權(quán)重因子w是PSO的關(guān)鍵參數(shù)[18-19],它用于控制粒子先前速度對(duì)當(dāng)前速度的影響。w較大,則粒子具有更大的全局搜索能力,但計(jì)算量較大;而相對(duì)較小的w收斂速度更快,但更有可能落入局部最優(yōu)值。為了更好的保持種群的多樣性,提出一種可變慣性權(quán)重策略,即種群的慣性權(quán)重隨迭代次數(shù)的變化而變化。慣性權(quán)重因子重新定義如式(10),該策略使得慣性權(quán)重調(diào)整范圍逐漸壓縮并整體呈非線性遞減趨勢(shì),概率判斷的加入增強(qiáng)了w在整體遞減趨勢(shì)下的隨機(jī)性,避免了w單一變化的模式,有助于改善粒子的多樣性。
式中:rand(k)為當(dāng)前迭代次數(shù)的隨機(jī)概率。
圖1所示為慣性權(quán)重的變化曲線。
圖1 慣性權(quán)重的變化曲線圖Fig.1 Variation curve of inertial weight
由圖1可見(jiàn),本文提出的非線性遞減慣性權(quán)重在早期階段的權(quán)值下降速度大于傳統(tǒng)的線性遞減慣性權(quán)重,隨著當(dāng)前迭代次數(shù)的逐步增加,權(quán)值的下降速度逐漸緩慢最終在達(dá)到迭代的終止條件時(shí),權(quán)值會(huì)限定在。當(dāng)w從大到小變化時(shí),粒子搜索的范圍可從一個(gè)較大的空間逐漸變化到很小的區(qū)域。
為了進(jìn)一步防止PSO算法在迭代過(guò)程中陷入局部極值,本文通過(guò)引入極值擾動(dòng)算子調(diào)整粒子的個(gè)體極值和全局極值,使粒子逃離局部最優(yōu)區(qū)域,擴(kuò)大搜索范圍,這樣粒子有更大的概率去發(fā)現(xiàn)最優(yōu)解。本文在速度更新公式中引入一種非線性更新擾動(dòng)算子,對(duì)個(gè)體最優(yōu)值和全局最優(yōu)值進(jìn)行調(diào)整,擾動(dòng)算子值隨著迭代次數(shù)的增加而呈非線性遞減,有利于粒子進(jìn)化前期較大范圍搜索,后期在較優(yōu)解范圍內(nèi)的精確搜索。擾動(dòng)算子更新公式如式(11):
式中:dmax為最大極值擾動(dòng)算子;dmin為最小極值擾動(dòng)算子。
引入擾動(dòng)算子后,粒子群的速度更新公式變?yōu)椋?/p>
為了比較不同模型的優(yōu)劣性,本文采用均方根誤差(RSME)、模型決定系數(shù)(r2)以及平均相對(duì)誤差(MRE)作為模型的性能評(píng)價(jià)指標(biāo),各評(píng)價(jià)指標(biāo)定義分別如式(13)、式(14)、式(15):
LSSVM的參數(shù)優(yōu)化問(wèn)題通常會(huì)轉(zhuǎn)換為多元線性回歸函數(shù)的參數(shù)估計(jì)問(wèn)題。正則化參數(shù)和核參數(shù)在LSSVM建模中起著重要作用。因此,為了得到理想的預(yù)測(cè)模型,需要對(duì)這些參數(shù)進(jìn)行調(diào)整。本文采用IPSO算法對(duì)參數(shù)進(jìn)行優(yōu)化,并采用均方根誤差(RMSE)評(píng)估粒子的適應(yīng)度值。
利用提出的IPSO-LSSVM算法對(duì)污水處理廠出水COD預(yù)測(cè)模型建模,具體實(shí)現(xiàn)過(guò)程如圖2所示。
圖2 基于IPSO算法的LSSVM參數(shù)尋優(yōu)流程Fig.2 Flow chart of LSSVM parameters optimization based on IPSO
出水COD是評(píng)價(jià)一個(gè)污水處理廠工藝水平和運(yùn)行情況的重要指標(biāo)之一,對(duì)COD進(jìn)行模擬預(yù)測(cè)對(duì)污水處理廠的優(yōu)化運(yùn)行有重要意義,因此本文選取污水處理廠出水COD為模型的輸出變量。
本文實(shí)驗(yàn)數(shù)據(jù)采集自長(zhǎng)沙臨空某綜合污水處理中心,該廠的日處理能力為10萬(wàn)t/d,項(xiàng)目采用改良型生物池、高效沉淀池和反硝化濾池等工藝除去COD、總氮(TN),出水水質(zhì)執(zhí)行《地表水環(huán)境》(GB3838-2002)中的準(zhǔn)IV類排放標(biāo)準(zhǔn)。為了檢驗(yàn)IPSO-LSSVM模型的泛化能力,通常將樣本集分為訓(xùn)練樣本和測(cè)試樣本2部分。因此,本文將2019年的日運(yùn)行數(shù)據(jù)作為模型訓(xùn)練和測(cè)試數(shù)據(jù)。以出水COD為預(yù)測(cè)模型的輸出,以進(jìn)水懸浮固型物(SS)、進(jìn)水總氮(TN)、進(jìn)水溫度(T)、進(jìn)水化學(xué)需氧量(COD)、進(jìn)水量(Q)、進(jìn)水 pH值、生化池溶解氧(DO)為預(yù)測(cè)模型的輸入,建立7輸入1輸出的預(yù)測(cè)模型。
為了驗(yàn)證IPSO算法的尋優(yōu)能力,本文采用4種類型的測(cè)試函數(shù)對(duì)標(biāo)準(zhǔn)PSO、以及本文所提出的IPSO算法進(jìn)行仿真測(cè)試。其中,Ackley、Schaffer、Griewanks為多峰函數(shù),Rosenbrock為單峰函數(shù),表1給出了這些測(cè)試函數(shù)的維度、取值范圍以及理論極值。
表1 標(biāo)準(zhǔn)測(cè)試函數(shù)Tab.1 Standard test function
為了測(cè)試結(jié)果的公平性,將IPSO與標(biāo)準(zhǔn)PSO的公共參數(shù)設(shè)置一致。具體實(shí)驗(yàn)參數(shù)設(shè)置為:種群規(guī)模N=30,維數(shù)D=30,最大進(jìn)化代數(shù)為K=500,學(xué)習(xí)因子c1=c2=2.0;在IPSO中,最大慣性權(quán)wmax=0.9,最小慣性權(quán)重wmax=0.4,最大擾動(dòng)值dmax=0.85,最小擾動(dòng)值dmin=0.35。兩種算法對(duì)每一個(gè)測(cè)試函數(shù)分別單獨(dú)運(yùn)行30次。
圖3—圖6為各函數(shù)適應(yīng)度值進(jìn)化曲線。由圖可以看出,對(duì)于所選擇的4個(gè)測(cè)試函數(shù),本文提出的基于隨機(jī)非線性遞減慣性權(quán)重和加入非線性遞減極值繞動(dòng)策略的IPSO算法在收斂速度和尋優(yōu)精度上均優(yōu)于標(biāo)準(zhǔn)PSO算法。
圖3 Ackley函數(shù)曲線Fig.3 Curve of Ackley function
圖4 Rastrigin函數(shù)曲線Fig.4 Curve of Rastrigin function
圖5 Schaffer函數(shù)曲線Fig.5 Curve of Schaffer function
圖6 Rosenbrock函數(shù)曲線Fig.6 Curve of Rosenbrock function
實(shí)驗(yàn)結(jié)果對(duì)比見(jiàn)表2。由表2可以看出,IPSO相比標(biāo)準(zhǔn)PSO算法性能更優(yōu),證明當(dāng)慣性權(quán)重服從隨機(jī)變化和擾動(dòng)極值非線性遞減時(shí),粒子表現(xiàn)出較好的尋優(yōu)能力;其次,本文所提出的改進(jìn)PSO算法較標(biāo)準(zhǔn)PSO來(lái)說(shuō)平均收斂值最小,并且最優(yōu)收斂值更接近于測(cè)試函數(shù)的最優(yōu)值,說(shuō)明IPSO能有效避免粒子陷入早熟的狀態(tài),跳出局部最優(yōu)的能力更為突出。
表2 實(shí)驗(yàn)結(jié)果對(duì)比Tab.2 Comparison of experimental results
綜上所述,本文提出的IPSO算法較傳統(tǒng)的線性遞減PSO算法收斂速度更快、需要迭代的次數(shù)更少,能夠較接近收斂精度且沒(méi)有使算法出現(xiàn)早熟現(xiàn)象,有效改善了算法的整體尋優(yōu)性能。
為了驗(yàn)證IPSO-LSSVM算法的預(yù)測(cè)精度,本文選取傳統(tǒng)的LSSVM和基于PSO優(yōu)化的PSO-LSSVM模型,在相同的測(cè)試樣本上比較模型的精度。利用MATLAB工具箱,編寫(xiě)LSSVM、PSO-LSSVM及IPSOLSSVM算法程序,對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練預(yù)測(cè),得到滿足精度要求時(shí)的γ和σ2值,完成γ,σ2參數(shù)尋優(yōu)。采用IPSO算法和PSO算法優(yōu)化時(shí),設(shè)定公共參數(shù):設(shè)定粒子維度D=2,種群規(guī)模M=30,進(jìn)化最大次數(shù)Tmax=800,學(xué)習(xí)因子 c1=c2=1.5,慣性權(quán)重 ω =[0.4,0.9],模型參數(shù) γ,σ2取值范圍分別為[0.01,1 000],以樣本集的實(shí)測(cè)值和預(yù)測(cè)結(jié)果的均方差作為適應(yīng)度函數(shù),終止精度10-6。在IPSO算法中,取最大擾動(dòng)值dmax=0.85,最小擾動(dòng)值dmin=0.35。對(duì)于傳統(tǒng)LSSVM模型,根據(jù)參考文獻(xiàn)[20],γ,σ2參數(shù)分別取值 10,4。IPSO 和 PSO 算法分別優(yōu)化LSSVM的適應(yīng)度曲線如圖7所示。經(jīng)運(yùn)行IPSO-LSSVM算法得到的模型參數(shù)見(jiàn)表3。
圖7 PSO-LSSVM和IPSO-LSSVM算法適應(yīng)度曲線Fig.7 Fittness curve of PSO-LSSVM and IPSO-LSSVM
表3 LSSVM參數(shù)優(yōu)化結(jié)果Tab.3 Optimization results of LSSVM parameter
利用MATLAB分別運(yùn)行3種模型對(duì)出水COD進(jìn)行預(yù)測(cè),最終實(shí)際值與預(yù)測(cè)值的對(duì)比如圖8所示,不同模型相對(duì)誤差曲線如圖9所示。
表4所示為3種模型預(yù)測(cè)性能對(duì)比。
由表4可看出,在出水COD的預(yù)測(cè)中,IPSOLSSVM模型的平均相對(duì)誤差為2.815%,LSSVM和PSO-LSSVM模型則分別為5.973%和4.008%;IPSOLSSVM模型的均方根誤差為1.125 0,LSSVM和PSOLSSVM模型則分別為1.608 7和1.905 3;IPSO-LSSVM模型的決定系數(shù)系數(shù)為0.9467,LSSVM和PSO-LSSVM模型則分別為0.834 1和0.889 1;通過(guò)各項(xiàng)指標(biāo)比較可知,IPSO-LSSVM模型效果均優(yōu)于其他2個(gè)模型。
圖8 3種模型預(yù)測(cè)結(jié)果對(duì)比Fig.8 Comparison of prediction results of three models
圖9 3種模型預(yù)測(cè)結(jié)果相對(duì)誤差對(duì)比Fig.9 Comparison of prediction relative error of three models
表4 3種模型預(yù)測(cè)性能對(duì)比Tab.4 Comparison of predictive precision of three models
(1)本文針對(duì)長(zhǎng)沙臨空某綜合污水處理中心2019年日運(yùn)行數(shù)據(jù)建立了基于IPSO-LSSVM的出水COD預(yù)測(cè)模型,與PSO-LSSVM和LSSVM模型相比,IPSOLSSVM模型預(yù)測(cè)結(jié)果的均方根誤差分別降低了40.9%和30.5%;相關(guān)系數(shù)分別提高了13.0%和6.6%,IPSO-LSSVM模型應(yīng)用于工業(yè)污水處理出水水質(zhì)參數(shù)預(yù)測(cè)可取得更好的預(yù)測(cè)效果。
(2)改進(jìn)粒子群算法具有全局優(yōu)化和收斂速度快等特點(diǎn),將其與LSSVM相結(jié)合,可獲取更優(yōu)的LSSVM模型參數(shù),使其訓(xùn)練效果更佳,提高算法的預(yù)測(cè)精度和抗干擾能力。
(3)本文構(gòu)建的污水出水COD預(yù)測(cè)模型,尤其適合小樣本數(shù)據(jù)的新建污水處理廠。