王龍洋,蒙西,喬俊飛
(1北京工業(yè)大學信息學部,北京100124;2計算智能與智能系統(tǒng)北京市重點實驗室,北京100124)
城市污水處理過程是一個復雜的生化反應過程,具有隨機性、強耦合性、高度非線性等一系列特征,其關鍵水質參數(shù)的有效預測是保證污水處理廠高效、穩(wěn)定運行的先決條件。出水總磷是衡量城市污水處理過程出水水質的一種重要參數(shù),當水體中總磷含量超過一定限度時,會導致水體營養(yǎng)物質富集,造成水生植物異常繁殖。因此,嚴格限制出水總磷排放濃度尤為重要[1]。研究表明,加強對出水總磷濃度的預測是有效預防并減輕水體富營養(yǎng)化問題的重要舉措。然而,由于城市污水處理過程是一個復雜的動態(tài)過程,城市污水處理過程出水總磷的預測主要通過基于機理建模的軟測量技術實現(xiàn)。而現(xiàn)有的機理模型無法很好地體現(xiàn)出污水處理過程的全部特性,預測的精度往往不夠理想。因此,如何建立精準、可靠的城市污水處理過程出水總磷預測模型是污水處理過程領域亟待解決的問題。
受上述問題驅動,基于智能算法的預測方法在城市污水處理過程水質參數(shù)預測領域得到了廣泛關注和應用[2]。人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)作為一種非常成熟的智能算法,由于具備較理想的非線性逼近能力和抗干擾能力,被廣泛應用于污水處理過程建模領域。例如,楊琴等[3]設計了一種基于BP神經(jīng)網(wǎng)絡的水質參數(shù)預測模型,該模型采用水溫、pH等參數(shù)作為模型輸入變量,對水質參數(shù)進行預測,取得了較好的預測結果。Hong等[4]提出了一種前饋神經(jīng)網(wǎng)絡預測方法,該方法將pH、氧化還原電位和溶解氧濃度的參數(shù)作為變量輸入,并采用前饋神經(jīng)網(wǎng)絡建立模型進行預測,取得了比較理想的預測結果。另外,Bagheri等[5]設計了徑向基函數(shù)網(wǎng)絡水質參數(shù)預測模型,并將其用于水質預測,實驗表明,該預測方法具有較理想的預測效果。Han等[6]用一種改進的粒子群算法對RBF神經(jīng)網(wǎng)絡結構和網(wǎng)絡參數(shù)進行同步優(yōu)化,構建了基于自組織RBF神經(jīng)網(wǎng)絡的水質預測模型。上述基于神經(jīng)網(wǎng)絡的預測方法雖然在一定程度上取得了比較理想的預測結果,但所采用的神經(jīng)網(wǎng)絡均是淺層結構,當網(wǎng)絡學習對象變量較多時,淺層結構常常不能滿足水質預測精度的要求[7]。
針對以上問題,專家學者研究了深度學習模型預測方法。王功明等[8]將深度信念網(wǎng)絡和偏最小二乘回歸算法相結合對水質參數(shù)進行預測,結果表明,該方法取得了比較滿意的預測結果。Wang等[9]提出了基于信息相關的深度信念網(wǎng)絡方法,并將其用于水質的預測,提高了水質預測精度。雖然以上方法在一定程度上解決了淺層網(wǎng)絡水質預測所存在的不足,但是在水質參數(shù)預測過程中采用的輔助輸入變量過多,變量間復雜的關系會相互影響,導致了模型預測精度的降低。為此,Zou等[10]設計了基于長短時間記憶神經(jīng)網(wǎng)絡的預測模型,并將其應用于水質參數(shù)預測。該方法雖然解決了水質參數(shù)預測過程中輸入變量過多的問題,但是忽略了水質序列數(shù)據(jù)之間存在自相關性問題,致使神經(jīng)網(wǎng)絡沒有學習到水質參數(shù)預測模型,而是學習到了自相關性,從而極大地降低了網(wǎng)絡的預測精度。因此,建立一種理想的水質預測模型,消除水質數(shù)據(jù)自相關,提高預測精度迫在眉睫。
由于模型的預測性能極大地依賴于網(wǎng)絡的結構,為了進一步提高模型的預測精度,Srivastava等[11]采用隨機dropout算法來隨機修剪DBN的神經(jīng)元和它們之間的權值連接,從而獲得一個精簡結構的DBN。Shen等[12]通過采用連續(xù)dropout算法來提取DBN隱含層神經(jīng)元獨立信息特征,獲得了較為理想的網(wǎng)絡結構。然而在上述一系列方法中,由于存在冗余神經(jīng)元,在一定程度上增加了計算復雜度。為了解決上述問題,一些進化算法被引進了神經(jīng)網(wǎng)絡。Hayashida等[13]提出了一個基于遺傳算法的DBN結構優(yōu)化方法,仿真結果表明,GA-DBN能獲得合適的結構,具有較高的預測性能。然而遺傳算法實現(xiàn)較為復雜,而且很難收斂到全局最優(yōu),因此遺傳算法的廣泛使用受到了限制。文獻[14]中設計了一個GPSO-DFNN算法,在GPSO-DFNN中,利用基于高斯函數(shù)的混沌映射平衡粒子群算法中粒子的檢測和利用能力。并在此基礎上,進一步實現(xiàn)了DFNN結構優(yōu)化,提高了模型計算效率。然而該研究僅針對的是淺層神經(jīng)網(wǎng)絡,而對于深度神經(jīng)網(wǎng)絡的研究還是個開放的課題。
因此,受上述研究所啟發(fā),本文提出了一種基于MEEMD-DBN-SA的城市污水處理過程出水總磷預測方法。
DBN是一種應用非常廣泛的深度學習模型,其由多個受限Boltzmann機(restricted Boltzmann machines,RBM)順序堆疊而成。而RBM[15-17]作為DBN的核心組成部分,它由一個可視層和一個隱含層構成。通常前一個RBM的激活輸出作為后一個堆疊RBM的輸入數(shù)據(jù),并采用快速貪婪搜索方法進行學習[18-19],其模型結構圖如圖1所示。
圖1 深度信念網(wǎng)絡模型結構圖Fig.1 Structure diagramof deep belief network model
RBM是一種特殊的基于能量的統(tǒng)計模型。其能量函數(shù)表達式如式(1)所示:
其中,ωij表示對稱權值;v=(v1,v2,…,vm)表示可視層,h=(h1,h2,…,hn)表示隱含層。vi,hj分別表示可視單元和隱含單元的二值狀態(tài);bi,cj表示對應的可視層與隱含層偏置。
RBM通過能量函數(shù)來分配可視狀態(tài)和隱含狀態(tài)向量的聯(lián)合概率,其表達式如式(2)所示:
其中,<vihj>data和<vihj>model分別表示數(shù)據(jù)分布與模型分布的期望。
采用對比散度算法來粗略逼近梯度[20],表達式如式(6)所示:
其中,<vihj>recon代表由輸入數(shù)據(jù)初始化得到的重構狀態(tài)的期望;η代表學習率。
MEEMD算法是在集合經(jīng)驗模態(tài)分解(ensemble empirical mode decomposition,EEMD)的基礎上進行改進而得到的,改進后的MEEMD算法不僅能夠解決經(jīng)驗模態(tài)分解(empirical mode decomposition,EMD)[21-22]存在的模態(tài)混淆問題,而且可以解決EEMD[23]、互補集合經(jīng)驗模態(tài)分解等算法所存在的計算量大、重構誤差和偽分量問題。城市污水處理過程的出水總磷數(shù)據(jù)由于數(shù)據(jù)之間存在自相關性,因此可以采用MEEMD方法對其進行信號分解,來消除這種自相關性。MEEMD算法分解總磷數(shù)據(jù)的步驟如下。
(1)首先,基于互補集合經(jīng)驗模態(tài)分解算法對將要研究的總磷數(shù)據(jù)信號按照瞬時頻率的高低依次進行分解。
(2)其次,對步驟(1)分解后得到的分量進行排列熵[24]值計算,借助于排列熵來檢測分量是否存在異常,如果排列熵數(shù)值大于所設定的閾值,就認為該分量是異常分量,則可以將異常分量直接去除。反之則認為是近似平穩(wěn)的分量,則可以保留下來。排列熵是一種時間序列的隨機檢測方法,熵值越大說明序列越隨機,熵值越小說明序列越規(guī)則,且排列熵取值在[0,1]區(qū)間,便于控制。
(3)最后,對剩余的分量進行EMD分解,并對所得到的所有固有模態(tài)分量按照頻率從高到低的順序依次進行排列。
模擬退火算法是一種非線性反演方法[25-26],模擬退火的實質是現(xiàn)代Monte Carlo法,該算法的求解過程是一個不斷尋優(yōu)的過程,在尋優(yōu)過程中,擬合度隨著迭代次數(shù)的增加而不斷變化,呈現(xiàn)出高低起伏的態(tài)勢,但總體是朝著變大或變小的方向。得益于模擬退火容許擬合度變小以及擬合誤差變大,這樣就利于模型從局部最優(yōu)值中跳出,得到最終所期望的全局優(yōu)化模型。
水體中總磷元素超標,會引起水生藻類植物大量繁殖,從而導致水體富營養(yǎng)化、生態(tài)失衡等嚴重后果。因此,加強對水體中總磷濃度的預測,并實現(xiàn)城市污水處理過程出水總磷的精準預測具有非常積極的意義。為了實現(xiàn)上述目標,文中設計了一種基于MEEMD-DBN-SA的城市污水處理過程出水總磷預測模型?;窘K悸肥牵菏紫龋瑥谋本┦谐枀^(qū)某污水處理廠獲得污水處理過程出水總磷實際數(shù)據(jù),并進行數(shù)據(jù)的預處理,得到較為理想的樣本數(shù)據(jù)集;其次,將歷史時刻的出水總磷樣本數(shù)據(jù)作為輸入變量,進行下一時刻的出水總磷預測,來有效避免輸入變量過多造成模型預測精度下降的問題;然后,基于MEEMD算法對出水總磷數(shù)據(jù)進行信號分解,獲得若干個IMF分量,并計算每個IMF分量的排列熵;通過設置合適的閾值,將大于閾值的異常分量剔除,可以有效消除分解過程中所產(chǎn)生的偽IMF分量和數(shù)據(jù)之間的自相關性,從而進一步提高模型預測精度;最后,將剩余的IMF分量作為最終建模的輸入,分別建立DBN預測模型;同時,為進一步提高模型預測精度,采用模擬退火算法對DBN進行結構優(yōu)化,并將優(yōu)化結構后獲得的各個DBN預測值進行重構相加,得到最終的出水總磷預測結果。
污水處理過程中的出水總磷預測作為一種廣義上的時間序列模型,本文采用歷史時刻的污水處理過程出水總磷數(shù)據(jù)作為輸入,并把第n+1時刻的數(shù)據(jù)作為輸出,進行滾動建模,一般情況下,這樣的建模預測結果都較為理想。但是總磷序列數(shù)據(jù)之間所存在的嚴重滯后和預測精度不高問題卻不容忽視,主要原因是出水總磷時間序列存在自相關,事實上DBN并沒有學習到出水總磷預測模型,而是學到了這種自相關性。因此,本文首先基于MEEMD算法對復雜的出水總磷序列信號進行分解,消除序列的自相關性,并剔除分解后存在的偽IMF分量;然后,對剩余的每個IMF分量分別建立DBN預測模型,為了進一步提高模型的總磷預測精度,采用模擬退火算法對DBN的結構模型進行優(yōu)化,從而得到最優(yōu)的IMF分量預測結果;最后將各IMF對應的DBN的預測值重構相加。其模型結構框圖如圖2所示。
采用MEEMD-DBN-SA模型進行出水總磷預測的詳細步驟如下。
圖2 MEEMD-DBN-SA模型結構框圖Fig.2 Block diagram of MEEMD-DBN-SA model
(1)從北京某污水處理廠采集到污水處理過程出水總磷數(shù)據(jù),然后經(jīng)過數(shù)據(jù)預處理,得到樣本數(shù)據(jù)。
(2)采用MEEMD算法對輸入的總磷序列數(shù)據(jù)非平穩(wěn)信號進行分解,分解過程如下。
①在原始信號H(t)中,分別添加均值為0的白噪聲信號sj(t)和-sj(t),其代數(shù)表達式如式(7)和式(8)所示:
③計算集成后分量?p(t)的排列熵,并設置閾值θ,如果分量的熵值大于θ,則被視為是異常分量,并剔除異常分量;小于θ值,則被視為近似平穩(wěn)分量,保留下來。
④將已分解的前p個分量從原始信號中分離出來,即
再對剩余信號r(t)進行EMD分解,將得到的所有IMF分量按高頻到低頻順序排列。
(3)將步驟(2)分解后得到的各個IMF分量分別輸入DBN中進行預測。其詳細步驟如下。
①創(chuàng)建一個初始的DBN結構,并且用無監(jiān)督學習初始化DBN所有的連接權重。
②將IMF輸入分量輸入DBN可視層v以后,采用對比散度算法進行訓練,對于所有的隱含層單元j計算p(hj=1/v)用給定的計算式(4)。然后通過p(hj=1/v)采樣得到h∈[0,1],其計算表達式如式(11)所示:
其中,δ是常數(shù),其變化范圍為0.5~1。
③對于所有的可視層單元i,計算p(vi=1/h)用采樣h,其計算表達式如式(3)所示。然后通過p(vi=1/h)采樣得到v^∈[0,1],計算表達式如式(12)所示。
④然后對所有的隱含層單元j,計算p(hj=1/v)通過采樣v,其計算表達式如式(4)所示,然后通過p(hj=1/v)采樣得到h^∈[0,1],其計算表達式如式(11)所示。
⑤采用Gibbs采樣法確定模型中抽樣數(shù)據(jù)的期望。
⑥用Gibbs采樣法來計算訓練集中觀測數(shù)據(jù)的期望與模型中抽樣數(shù)據(jù)的期望之間的誤差,其計算表達式如式(5)所示。
⑦在有監(jiān)督微調階段利用BP算法對整個網(wǎng)絡進行逐步微調即可。
(4)考慮到在預測過程中DBN的網(wǎng)絡結構難以確定,于是采用模擬退火算法對DBN的結構進行優(yōu)化。
(5)將最終優(yōu)化結構后DBN的各IMF分量預測結果相加重構,從而得到最終的預測結果。
水質數(shù)據(jù)輸入MEEMD算法中進行經(jīng)驗模態(tài)分解,假如,經(jīng)過l次分解得到l個分量,然后計算排列熵需要計算l2次,然后判斷是否存在異常分量需要l次判斷,則最終計算復雜度大致為O(l2)。對于深度信念網(wǎng)絡,一般兩個隱含層即可解決絕大部分的問題,假設輸入層神經(jīng)元個數(shù)為n1,第一個隱含層神經(jīng)元個數(shù)為n2,第二個隱含層神經(jīng)元個數(shù)為n3,第三個隱含層神經(jīng)元個數(shù)為n4,設輸入樣本個數(shù)為m,則在前向傳播過程中計算復雜度為O(m(n1n2+n2n3+n3n4)),由于n1和n4均為定值,都是常數(shù),則前向傳播的計算復雜度為O(m(n2+n2n3+n3))。同理,反向傳播的計算復雜度也為O(m(n2+n2n3+n3)),則深度信念網(wǎng)絡的計算復雜度為O(m(n2+n2n3+n3))。采用模擬退火算法優(yōu)化結構過程中其目標函數(shù)的計算復雜度是O(s),假定溫度控制外循環(huán)次數(shù)為a,在每個特定溫度下內循環(huán)次數(shù)為b,那么整個算法的計算復雜度就是O(abs)。則最終模型的計算復雜度為O(l2+m(n2+n2n3+n3)+abs)。
為了驗證所提出的MEEMD-DBN-SA出水總磷預測模型的有效性,本文將所提出的MEEMDDBN-SA在CO2濃度以及出水總磷數(shù)據(jù)集上進行了實驗。此外,為了消除其他不相關因素對實驗結果的影響,所有仿真實驗的編譯軟件和計算機運行環(huán)境設置如下:編譯軟件為matlab2017b版,計算機處理器是Core i77770,并且CPU頻率是3.6 GHz。
衡量預測誤差的指標有很多種,一般情況下,對于不同的任務需要采用的衡量指標也各不相同,出水總磷預測本質上屬于回歸任務,預測值通常為連續(xù)值,而對于預測任務常用的誤差衡量指標有平均絕對誤差(mean absolute error,MAE)[27]、均方誤差(mean square error,MSE)[28-29]、均方根誤差(root mean square error,RMSE)[30-31]、平均百分比誤差(absolute percentage error,APE)。文中采用RMSE和APE兩個性能指標來評估所設計模型的性能。RMSE和APE的表達式如式(13)和式(14)所示:
其中,n代表樣本總數(shù);c(f)代表真實值;b(f)代表預測值。
環(huán)境問題一直以來都是世界上各國非常關注的問題之一,而CO2濃度的高低對環(huán)境的好壞起著至關重要的作用,如果大氣中CO2濃度過高,會導致全球氣候變暖,這一變化會產(chǎn)生災難性的后果,而大氣中CO2濃度過低就會導致植物的光合作用無法進行,從而使人們賴以生存的農(nóng)作物無法存活。因此對某一地區(qū)CO2濃度變化進行預測,除了具有較好的科學研究意義,也能夠在一定程度上為制定地區(qū)和企業(yè)CO2排放提供指導,具有一定的社會研究價值。由于受大氣中眾多不確定因素綜合影響,CO2濃度變化序列數(shù)據(jù)具有隨機性、高度非線性、非平穩(wěn)性等特征。由于深度信念網(wǎng)絡具有非線性逼近能力和抗噪聲干擾能力,非常適用于非線性系統(tǒng)建模,同時由于CO2濃度序列數(shù)據(jù)存在著較強的自相關性,會顯著影響模型的預測精度。采用MEEMD算法可以很好地去除CO2濃度序列數(shù)據(jù)的自相關性,提高模型預測精度。因此MEEMDDBN-SA模型對其有很好的適用性。采用夏威夷島1965—1980年的總共192組數(shù)據(jù)進行實驗,隨機選取前100組數(shù)據(jù)作為訓練樣本進行訓練,剩下的92組作為測試數(shù)據(jù)對網(wǎng)絡進行測試。本實驗結構參數(shù)設置如下:RBM訓練次數(shù)為100次,網(wǎng)絡最大迭代次數(shù)為1000次,學習率為0.1。實驗采用歷史時刻t-1時刻、t時刻的CO2數(shù)據(jù)來預測t+1時刻的CO2濃度,仿真結果如圖3和圖4所示。
圖3 CO2濃度預測誤差Fig.3 Prediction error of CO2 concentration
圖3為CO2濃度的預測誤差曲線圖,圖像的橫軸代表測試樣本個數(shù),縱軸代表的預測誤差隨著樣本個數(shù)的變化而變化,從圖中可以看出,誤差曲線隨著迭代次數(shù)的不斷增加,一直在零值附近上下起伏,說明有較小的預測誤差,所設計的模型有很好的擬合效果。圖4為測試樣本預測結果曲線,圖像的橫軸代表測試樣本個數(shù),縱軸代表出水CO2濃度,從圖中可以看出,CO2濃度的預測值曲線緊緊跟隨CO2濃度的實際值曲線,并隨著測試樣本的增加而變化,具有優(yōu)良的跟蹤性能和擬合效果。
圖4 測試樣本預測結果曲線Fig.4 Prediction result curve of test sample
為了比較不同算法的預測性能,將本文所設計的MEEMD-DBN-SA算法與當前最新算法進行了比較,比較結果如表1所示。從表1可以看出,其他算法如BP神經(jīng)網(wǎng)絡算法在不同的文獻中預測精度有較大差異,總地來說RMSE值處于1.3000~6.6000之間,而ALRDBN和CDBN的RMSE分別為1.1671和1.1507,相比BP算法均有一定程度的下降。采用DBN算法后,相比ALRDBN和CDBN卻有所上升,經(jīng)過MEEMD算法分解后的MEEMD-DBN的RMSE值和APE值下降較為明顯,說明MEEMD分解取得了較好的作用。優(yōu)化結構后的MEEMD-DBN-SA的RMSE值和APE值下降到0.3725和0.0008,在所有結果中RMSE值和APE值不僅是最小的,而且和其他算法明顯拉開了差距,說明本文所設計的MEEMD-DBN-SA具有優(yōu)異的預測性能。
表1 不同算法性能比較Table 1 Performance comparison of different algorithms
本文算法的主要目的是提高模型的預測精度,但是為了了解算法的計算復雜度,并且考慮到一般情況下算法運行時間越長,計算復雜度越高,在表1中增加了算法的運行時間對比。從表1中可以看出,本文所設計的MEEMD-DBN-SA在所有算法中預測精度最高,運行時間為10.56 s,計算復雜度略有提升,但計算復雜度仍低于大部分算法。由于預測精度和計算復雜度在一定程度上是相互矛盾的,在保證預測精度的情況下,必然會增加計算復雜度。作為算法的折中,本文的MEEMD-DBN-SA算法仍具有良好的預測性能。
總磷是水體質量的一個很重要的評估標準,水體中若總磷含量過高,就會引起水體富營養(yǎng)化,藻類植物異常繁殖,因此預測水體中總磷含量至關重要,而總磷測量儀器測量總磷濃度不僅費時費力,而且難以進行有效測量,因此可以建立預測模型,通過歷史時刻的數(shù)據(jù)來預測未來時刻的總磷含量,本研究建立了MEEMD-DBN-SA模型來實時預測水體中的總磷含量。從北京某污水處理廠采集到492組總磷數(shù)據(jù),用400組數(shù)據(jù)作為訓練數(shù)據(jù),92組數(shù)據(jù)作為測試數(shù)據(jù),本實驗參數(shù)設置如下:RBM訓練次數(shù)為100次,網(wǎng)絡最大迭代次數(shù)為10000次,學習率為0.04。由歷史時刻t-1時刻、t時刻的總磷數(shù)據(jù)來預測t+1時刻的總磷含量。其仿真結果如圖5、圖6所示。
圖5 出水總磷濃度預測誤差Fig.5 Prediction error of total phosphorus concentration in effluent
圖5為出水總磷濃度預測誤差曲線圖,圖像的橫軸代表測試樣本的個數(shù),縱軸代表的預測誤差隨著樣本個數(shù)的變化而變化,從圖中可以看出,誤差曲線剛開始波動較劇烈,隨著迭代次數(shù)的不斷增加,誤差越來越小,并逐漸向零值附近靠近,說明預測誤差越來越小,所設計模型有很好的擬合效果。圖6為測試樣本預測結果曲線,圖像的橫軸代表測試樣本的個數(shù),縱軸代表出水總磷的濃度,從圖中可以看出,出水總磷的預測值曲線緊緊跟隨出水總磷的實際值曲線,并隨著測試樣本的增加而變化,具有優(yōu)良的跟蹤性能和擬合效果。
圖6 測試樣本預測結果曲線Fig.6 Prediction result curve of test sample
為了比較所設計的MEEMD-DBN-SA算法的有效性,將所設計的MEEMD-DBN-SA算法與其他算法進行了比較,比較結果如表2所示,從表中可以看出ILM-SVDFNN算法的RMSE值和APE值為0.1061和0.1161,LM-SVDFNN算法的RMSE值和APE值為0.1078和0.1167,ILM-FNN算法的RMSE值和APE值為0.1296和0.1412。而相比前幾種算法,算法EBP-SVDFNN、EBP-FNN、GDFNN、MPCANN的RMSE值均在0.15以上,APE值也明顯超過前述三種算法,甚至MPCA-NN的RMSE值超過了0.2,在所有算法中RMSE值最大,RBF、IELM和APSORBF算法的RMSE值和APE值與表中前8種算法相比都出現(xiàn)了小幅下降。而采用DBN算法后,RMSE值和APE值與部分算法相比優(yōu)勢不大。當采用MEEMD算法分解后,MEEMD-DBN的RMSE值得到了大幅度的下降,說明MEEMD分解起到了很好的效果,為進一步提高預測精度,采用模擬退火算法優(yōu)化結構后,MEEMD-DBN-SA算法的RMSE值為0.0269,算法的RMSE值在所有算法中是最小的,且明顯低于其他算法,APE值也幾乎優(yōu)于表中所有算法,從而很好地反映了MEEMD-DBN-SA算法的有效性。
本文算法的主要目的是提高出水總磷濃度的預測精度,從而避免水質超標排放,但為了明確算法的計算復雜度,在表2中增加了算法的運行時間對比,一般情況下,運行時間越長,則算法復雜度越高。由于預測精度和運行時間是兩個相互矛盾的指標,當模型在迭代過程中,為獲得更高的預測精度,就需要不斷迭代,從而會造成運行時間延長,計算復雜度增加。相反,為了節(jié)省時間,減少迭代次數(shù),雖然運行時間減少,算法計算復雜度降低,但預測精度則會大大降低。從表2中可以看出,本文設計的MEEMD-DBN-SA相比其他所有算法,預測精度得到非常顯著的提升,由于引入了優(yōu)化算法來優(yōu)化模型的結構,計算時間為68.11 s,計算復雜度上升。相比其他算法,兼顧預測精度和計算復雜度,本文算法復雜度處于中等水平,但是預測精度卻是所有方法中最高的,說明了所設計算法的有效性。
表2 不同算法性能比較Table 2 Performance comparison of different algorithms
文中針對污水處理過程中出水總磷難以預測的問題,提出了一種基于改進的集合經(jīng)驗模態(tài)分解和深度信念網(wǎng)絡的出水總磷預測方法。首先,文中將t-1、t時刻的總磷數(shù)據(jù)作為網(wǎng)絡輸入,來預測t+1時刻的出水總磷濃度,不僅有效地避免了輔助輸入變量過多造成的模型預測精度下降問題,而且對t+1時刻出水總磷進行預測,可以提前了解水質狀況并對水體合理加藥,從而實現(xiàn)對超標水質的超前干預。其次,考慮到DBN在進行污水處理過程出水總磷數(shù)據(jù)預測時,由于出水總磷數(shù)據(jù)序列之間存在的自相關性,致使DBN不能學習到出水總磷之間真正的關系,而是學習到了數(shù)據(jù)之間的自相關性,于是基于MEEMD算法對出水總磷數(shù)據(jù)進行分解,獲得若干個IMF分量,并計算每個IMF分量的排列熵。通過設置合適的閾值,將大于閾值的異常分量剔除,有效消除了分解過程中所產(chǎn)生的偽IMF分量和數(shù)據(jù)之間存在的自相關性,從而進一步提高模型預測精度。然后,將剩余的IMF分量作為最終建模的輸入,分別建立深度信念網(wǎng)絡預測模型。同時,采用模擬退火算法對DBN進行結構優(yōu)化,以進一步解決預測模型中的網(wǎng)絡結構問題,將優(yōu)化結構后獲得的各個DBN預測值進行重構相加,得到最終的預測結果。最后,模型構建完以后為驗證MEEMDDBN-SA模型的有效性,將所設計的模型在CO2濃度以及現(xiàn)實污水處理過程出水總磷數(shù)據(jù)上進行了測試,仿真結果顯示了MEEMD-DBN-SA模型的有效性。