閔佳峰, 彭 鑫, 李 智, 鐘偉民, 潘紅光
(1. 華東理工大學 化工過程先進控制與優(yōu)化技術教育部重點實驗室, 上海 200237;2. 西安科技大學 電氣與控制工程學院, 陜西 西安 710054)
活性污泥過程作為城市污水處理的核心,通過將廢水與活性污泥混合攪拌并曝氣,使有機污染物在微生物作用下絮凝吸附、氧化分解,然后廢水經(jīng)過二沉池固液分離后排出[1-3]。然而,在用水量、天氣及工業(yè)毒水侵入等原因導致的進水水質和水量波動的影響下,活性污泥過程容易引發(fā)污泥膨脹、污泥泡沫和污泥上浮等微生物相關的沉降問題,從而導致系統(tǒng)偏離正常工作狀態(tài)甚至崩潰[4-6]。因此,通過優(yōu)化控制[7]、預防校正[8]等控制策略,降低污泥沉降問題的發(fā)生率,減輕嚴重程度,提高污水處理系統(tǒng)的安全性能迫在眉睫。
近年來,基于數(shù)據(jù)驅動的優(yōu)化控制方法因充分利用歷史和實時數(shù)據(jù)進行自主學習、對經(jīng)驗依賴程度低等優(yōu)點而被廣泛運用[9-15]。韓紅桂等[9]采用自適應回歸核函數(shù)建立能耗成本(energy consumption,EC)和出水水質(effluent quality,EQ)的模型,使得能耗成本明顯降低;Sadeghassadi 等[10]通過神經(jīng)網(wǎng)絡離線建立溶解氧和氨氮的一步預測模型,實驗結果表明該方法可以有效降低運行成本和改善出水水質。然而,以上方法僅優(yōu)化運行成本和出水水質,忽略了微生物相關的沉降問題,容易引起微生物生長異常。
為了彌補上述方法在過程安全性上的不足,可以通過監(jiān)控運行過程中的食微比(feed/microorganism,F(xiàn)M)、污泥齡(sludge retention time,SRT)、碳氮比(carbon/nitrogen,C/N 或BOD5/N)等性能指標,實施針對性的控制策略[16-19]。Comas 等[18]提出了一個風險評估模型,采用模糊推理系統(tǒng)和決策樹評估活性污泥過程中發(fā)生絲狀菌污泥膨脹、污泥泡沫和污泥上浮的風險。Guerrero 等[19]用蒙特卡洛算法離線優(yōu)化運行成本、出水水質和微生物風險(microbiological risk,MR)[18],實現(xiàn)更全面的污水處理過程的性能評估和優(yōu)化控制,然而此方法不適用于污水處理過程的在線應用。
針對活性污泥過程機理復雜、建模困難的問題,本文利用支持向量回歸機非線性映射能力和泛化性能強的優(yōu)點,建立能耗成本、出水水質和微生物風險[18]支持向量回歸機模型;針對污泥沉降問題,在考慮能耗成本和出水水質基礎上,將微生物風險作為優(yōu)化目標,并基于風險優(yōu)化對溶解氧和污泥齡的優(yōu)化設定值篩選決策,最后利用抗積分飽和PI 控制對優(yōu)化設定值實時跟蹤,實現(xiàn)城市污水處理多目標優(yōu)化控制。
基準仿真模型1 號(benchmark simulation model no.1, BSM1)[20]是國際水質協(xié)會與歐盟科學技術合作組織合作開發(fā)的污水處理基準仿真模型,模擬活性污泥工藝的改進型——缺氧好氧工藝,總體布局如圖1 所示。BSM1 包括5 個完全混合式生化反應池和一個10 層的二沉池,生化反應池和二沉池分別依據(jù)活性污泥1 號模型[21]和雙指數(shù)沉降模型[22]建模。R1~R2 為缺氧池,通過異養(yǎng)菌的反硝化作用脫氮,R3~R5為好氧池,通過自養(yǎng)菌和異養(yǎng)菌的硝化作用除碳。qV表示體積流量,i、a、r、w 和e 分別表示進水、內回流、污泥回流、剩余污泥和出水中的組分。進水來自一級處理后的廢水,內回流從R5 回流至R1,為缺氧池補充氮源,污泥回流從二沉池底部回流至生化反應池,剩余污泥及時排出,使得活性污泥系統(tǒng)中微生物總量基本恒定,出水從二沉池的上層澄清液排出。
圖1 BSM1 總體布局圖Fig.1 BSM1 general layout
BSM1 的評價指標包括運行成本、出水水質和微生物風險,分別反映污水處理過程的經(jīng)濟效益、產(chǎn)品質量和安全性能。運行成本中考慮能耗成本,包括曝氣能耗(aeration energy,AE)和泵送能耗(pumping energy,PE),單位 kW?h?d-1,相關表達式由式(1)~(3)給出。
式中:ρTSS、ρCOD、ρNKj、ρNO和ρBOD5分別為懸浮固體濃度、化學需氧量濃度、凱氏氮濃度、硝態(tài)氮濃度和5 日生化需氧量濃度,qV,e為出水流量。
微生物風險表征微生物相關的沉降問題發(fā)生的概率,其表達式由式(5)給出。
式中:SBR 為絲狀菌污泥膨脹風險,SFR 為污泥泡沫風險,SRR 為污泥上浮風險。
為了在優(yōu)化經(jīng)濟效益和產(chǎn)品質量的同時,盡可能保證安全性能,提出了考慮微生物風險的城市污水處理多目標優(yōu)化控制,總體框架如圖2 所示。首先,選擇對污泥沉降影響大的變量作為被控變量,并通過支持向量回歸機建立能耗成本、出水水質和微生物風險的穩(wěn)態(tài)預測模型;其次,以能耗成本、出水水質和微生物風險為優(yōu)化目標構建多目標優(yōu)化問題,采用多目標差分進化算法在線優(yōu)化,尋找Pareto 最優(yōu)曲面;然后,從Pareto 最優(yōu)解集中篩選微生物風險較低,能耗成本和出水水質均衡的解作為ρO,3和SRT 的優(yōu)化設定值;最后利用抗積分飽和PI 控制對優(yōu)化設定值實時跟蹤。
圖2 污水處理過程多目標優(yōu)化控制流程圖Fig.2 Flowchart of multi-objective optimal control of wastewater treatment process
微生物相關的污泥沉降問題主要與 FM、SRT、BOD5/N、ρO,3、ρNO,5有關[18],F(xiàn)M、SRT、BOD5/N由式(6)~(8)給出。
式中:ρBA,k、ρBH,k分別為第k 個反應池自養(yǎng)菌和異養(yǎng)菌的濃度,ρTN為總氮濃度。
由于FM 和BOD5/N 包含進水成分,無法直接控制,而自養(yǎng)菌和異養(yǎng)菌的有氧呼吸會直接影響ρNO,5,因此選擇ρO,3和SRT 作為被控變量,并假定SRT 可以由傳感器或分析儀直接測量獲得。
活性污泥過程的結構、微生物的生長規(guī)律以及污泥的沉降規(guī)律使得活性污泥過程具有非線性、時變性和耦合性的特點。為了擬合復雜的輸入輸出關系,常用的非線性回歸模型包括多項式、神經(jīng)網(wǎng)絡和支持向量回歸機。多項式回歸在數(shù)據(jù)特征較多時很難確定各項的指數(shù),需要數(shù)據(jù)的先驗知識;神經(jīng)網(wǎng)絡基于經(jīng)驗風險最小化原則,模型可能因為過擬合而泛化性能下降,而且神經(jīng)網(wǎng)絡的可解釋性弱;支持向量回歸機具有非線性映射能力強、泛化性能強、可解釋性強、計算復雜度低等優(yōu)點。因而,本文采用 ε-支持向量回歸機(support vector regression, SVR)離線建立能耗成本、出水水質和微生物風險的穩(wěn)態(tài)預測模型。
如圖3 所示為BSM1 開環(huán)系統(tǒng)的靈敏度曲線圖,從圖中可以發(fā)現(xiàn)ρO,3和SRT 關于進水流量qV,i的靈敏度都很高。如圖4 所示為進水流量的運行軌跡圖和箱型圖,表明進水流量變化快且范圍廣,因此將ρO,3、SRT 的設定值和qV,i作為EC、EQ 和MR 穩(wěn)態(tài)預測模型的共同輸入。本文建立的支持向量回歸機模型如圖 5 所示,其中,κ 為徑向基核函數(shù),ρO,3,sp和 SRTsp分別為溶解氧和污泥齡的設定值,yEC、yEQ和 yMR分別為能耗成本、出水水質和微生物風險的穩(wěn)態(tài)預測值,滿足:
式中:m 為訓練樣本容量,xj為訓練樣本,αj、βj、b、σ 等參數(shù)通過訓練能耗成本、出水水質和微生物風險的支持向量回歸機模型獲得。
圖3 ρO,3 和 SRT 隨 qV,i 的變化Fig.3 Variation of ρO,3 and SRT with qV,i
圖4 qV,i 的運行軌跡圖和箱型圖Fig.4 Track and box plots of qV,i
由于懲罰系數(shù) c、核參數(shù)γ 對支持向量回歸機的誤差寬容度和支持向量數(shù)目影響很大,因此本文基于均方誤差準則,對原始數(shù)據(jù)進行K 折交叉驗證,然后通過網(wǎng)格搜索找出均方誤差最小值對應的c 和γ,以權衡模型的預測性能和復雜度。
本文以能耗成本、出水水質和微生物風險為優(yōu)化目標,建立如下優(yōu)化問題:
圖5 支持向量回歸機結構圖Fig.5 Structure diagram of support vector regression machine
式中:J 為EC、EQ 和MR 穩(wěn)態(tài)預測值的組合,u 為決策變量,即ρO,3和SRT 的設定值,d 為qV,I, uL和uU分別為設定值的下界和上界,fEC、fEQ和fMR分別為EC、EQ 和MR 穩(wěn)態(tài)預測模型對應的映射函數(shù)。
求解多目標優(yōu)化問題的常用算法包括非支配排序遺傳算法-II(NSGA-II)、多目標粒子群、多目標差分進化、蒙特卡洛等。然而,NSGA-II 在處理高維多目標優(yōu)化問題時性能不足;多目標粒子群因參數(shù)較多而調試困難,蒙特卡洛在搜索空間大時效率較低;多目標差分進化算法(multi-objective differential evolution,MODE)具有結構簡單、收斂速度快、搜索能力強、魯棒性強等優(yōu)點,可以更高效地求解式(9)中的優(yōu)化問題,因而本文采用多目標差分進化算法,求解過程如下:
Step1:初始化父代種群,設定種群規(guī)模為N,最大進化代數(shù)為M。
Step2:依據(jù)式(9)計算父代種群中每個個體的適應度值。
Step3:對父代種群執(zhí)行變異、交叉操作,得到子代種群。
Step4:從父代種群和子代種群中篩選適應度值較高的個體組成臨時種群。
Step5:計算臨時種群中每個個體的適應度值,找出非支配解集。
Step6:根據(jù)個體的擁擠距離指標,從非支配解集中篩選個體作為新的父代。
Step7:依次重復步驟3、4、5、6,直至迭代次數(shù)達到M。
Step8:計算末代種群中個體的適應度值并找出Pareto 前沿后輸出。
Pareto 前沿代表能耗成本、出水水質和微生物風險的最優(yōu)曲面,改進其中一個指標必然會削弱其他至少一個指標??紤]到高微生物風險的危害,根據(jù)式(10)從 Pareto 前沿中篩選微生物風險低于高風險閾值的解,構成滿意解集Xk。
式中:Xp為Pareto 前沿,R 為高風險閾值。
定義滿意解的代價函數(shù)為
式中:ωEC、ωEQ和ωMR分別為由決策偏好確定的EC、EQ 和MR 的權重值。
滿意解集中損失函數(shù)最小的解為最優(yōu)滿意解,記為xt。
將多目標優(yōu)化和篩選決策獲得的最優(yōu)滿意解作為控制器的設定值,然后通過KLa3和qV,w分別對ρO,3和SRT 進行PI 控制,并在控制器輸出超過最大值或小于最小值時,限制積分器的累積作用,避免控制量長時間停留在飽和區(qū)。本文采用位置式離散PI 控制,其表達式如下
式中:Kp為比例系數(shù),Ki為積分系數(shù),T 為采樣周期,u(k)為k 時刻的控制量,e(k)為k 時刻的偏差量。
本文的仿真環(huán)境:操作系統(tǒng)Windows 10,處理器i7-6700HQ,顯卡GTX 950M,內存16GB,軟件matlab R2019b。支持向量回歸模型通過libsvm[23]工具箱建立,仿真研究以BSM1 為基準仿真平臺,以開環(huán)模型在定常進水數(shù)據(jù)下仿真200 d 后的穩(wěn)態(tài)作為初始狀態(tài),進水數(shù)據(jù)采用晴朗天氣文件,仿真時間7 d,采樣間隔15 min,優(yōu)化周期2 h,BSM1 的具體參數(shù)見文獻[20]。
本文的主要建模優(yōu)化控制參數(shù)如表1 所示,ρO,3和SRT 設定值的范圍分別取0~3 mg?L-1、3~9 d,KLa3和 qV,w的操作范圍分別取 0~360 d-1和 0~1 844.6 m3?d-1,然后分別執(zhí)行如下 3 組仿真,其中 CQ-OC 和CQR-OC 方案除優(yōu)化目標不同外,其余都相同。
表1 主要建模優(yōu)化控制參數(shù)Table 1 Main parameters of modelling and optimal control
① OLC:開環(huán)控制,KLa3和 qV,w分別固定為 240 d-1和 385 m3?d-1。
② CQ-OC:僅以EC 和EQ 為目標的優(yōu)化控制,ωEC、ωEQ分別為0.2 和0.8。
③ CQR-OC:以 EC、EQ 和 MR 為目標的優(yōu)化控制,ωEC、ωEQ和 ωMR分別為 0.2×10-4,0.8×10-4和 1。
數(shù)據(jù)歸一化后,EC、EQ、MR 穩(wěn)態(tài)預測模型的均方誤差MSE 和決定系數(shù)R2如表2 所示,3 個模型的MSE 很低且R2均接近1,表明建立的模型精度很高。如圖6 所示為EC 穩(wěn)態(tài)預測模型在網(wǎng)格搜索和3折交叉驗證下的均方誤差等高線圖,隨著懲罰系數(shù) c的增大,模型關于訓練集的均方誤差降低,但是模型復雜度增加,容易引起過擬合;隨著核參數(shù)γ 的增大,模型的均方誤差先降低后升高,表明支持向量數(shù)目過多或過少都會導致模型泛化性能降低。
表2 EC,EQ 和MR 模型的擬合精度Table 2 Fitting accuracy of EC, EQ and MR model
圖6 EC 穩(wěn)態(tài)預測模型的均方誤差等高線圖Fig.6 Mean square error contour map of EC steady-state prediction model
圖7 CQR-OC 方案在運行過程中形成的Pareto 曲面Fig.7 Pareto surface formed during the operation of the CQR-OC strategy
如圖7 所示為CQR-OC 方案在運行過程中形成的Pareto 曲面,從圖中可以看出,能耗成本、出水水質和微生物風險間相互約束、相互制衡。當能耗成本低于2 500 kW?h?d-1時,曝氣量不足,反應池溶解氧濃度較低,使得微生物的硝化過程不充分,導致有機物和氨氮的降解率較低,因而出水水質超過16 000 kg?d-1。此外,低氧條件下,絲狀菌憑借巨大的比表面積在生長競爭中處于優(yōu)勢地位,導致微生物風險高于0.8;當出水水質低于5 000 kg?d-1時,曝氣量大,能耗成本達到3 800 kW?h?d-1。同時,污染物的降解和微生物的大量繁殖使得食微比下降,微生物風險上升至0.6;當微生物風險低于0.4 時,溶解氧濃度較高而污泥齡較低,部分微生物來不及生長繁殖就被排出污水處理系統(tǒng),因而出水水質超過9 000 kg?d-1。
如圖8、9 所示分別為ρO,3和SRT 的跟蹤控制軌跡,從圖中可以發(fā)現(xiàn),抗積分飽和PI 控制器響應速度很快,即便過程存在遲滯,實際值依然能夠迅速達到設定值。然而,控制器仍然存在輸出超調和跟蹤誤差較大等問題,一方面在于活性污泥過程非線性、時變性、時滯性和耦合性的特點,另一方面由于進水水質,如氨氮濃度、懸浮顆粒濃度的周期性劇烈變化。
圖8 ρO,3 跟蹤控制Fig.8 ρO,3 tracking control for CQR-OC strategy
圖9 SRT 跟蹤控制Fig.9 SRT tracking control for CQR-OC strategy
圖10、11 所示為ρO,3、SRT 優(yōu)化設定值和qV,i的趨勢對比圖,從圖中可知,當qV,i較高時,出水水質惡劣,使得ρO,3和SRT 優(yōu)化設定值同時提高,以提供適合微生物生長的環(huán)境,從而提高有機污染物的降解率;當qV,i正常時,ρO,3優(yōu)化設定值降低而SRT 優(yōu)化設定值提高,以減少二沉池中的硝態(tài)氮濃度,進而降低因反硝化脫氮導致污泥上浮的風險;當 qV,i較低時,出水水質轉好,SRT 優(yōu)化設定值降低而 ρO,3優(yōu)化設定值提高,以抑制絲狀菌、放線菌等生長周期較長的微生物的生長。
圖10 ρO,3,sp 與 qV,i 的趨勢對比Fig.10 Comparison of tracks between ρO,3,sp and qV,i
圖11 SRTsp 與 qV,i 的趨勢對比Fig.11 Comparison of tracks between SRTsp and qV,i
分析縮放因子F 和交叉因子CR 對能耗成本、出水水質和微生物風險的影響,結果如表3 所示,其中高微生物風險比例(high microbiological risk ratio,HMRR)指微生物風險大于高風險閾值的樣本比例,各性能指標取10 次仿真的平均值。從表3 中可以得出,能耗成本、出水水質和高微生物風險比例對 F 和 CR不敏感,而且其變化無明顯規(guī)律,當F 和CR 均取0.5時微生物風險最低。此外,經(jīng)測試,繼續(xù)增大種群規(guī)模N 和進化代數(shù)M 對性能指標無明顯改進作用。
性能指標的權重值可以反映決策偏好,對優(yōu)化性能影響較大,權重ωMR對能耗成本、出水水質和高微生物風險比例的影響如圖12 所示,其中 ωEC和ωEQ分別固定為0.2×10-4和0.8×10-4。隨著ωMR的增大,能耗成本逐漸上升,出水水質先下降后上升,高微生物風險比例大致呈下降趨勢,表明低運行成本和出水水質容易引起微生物生長異常,而提高ωMR可以有效降低高微生物風險的比例。
表3 不同縮放因子和交叉因子下的性能指標Table 3 Performance indicators under different F and CR
圖12 EC、EQ 和 HMRR 隨 ωMR 的變化Fig.12 Changes of EC, EQ and HMRR with wMR
如圖13 所示為能耗成本、出水水質和微生物風險在CQR-OC 方案下的運行軌跡,從圖中可以看出,出水水質和微生物風險受進水流量的影響很大,以至于微生物風險頻繁超過高風險閾值。如圖14 所示為OLC、CQ-OC、CQR-OC 方案下的性能指標對比圖,從圖中可以發(fā)現(xiàn),相比OLC 方案,CQ-OC 方案通過優(yōu)化控制使能耗成本和出水水質分別降低 5.07%和 0.83%,表明多目標優(yōu)化控制方法的有效性,但是高微生物風險比例因此上升1.55%。而CQR-OC 方案綜合考慮能耗成本、出水水質和微生物風險,相比CQ-OC 方案,雖然能耗成本和出水水質分別上升5.54%和3.22%,但是高微生物風險比例下降了25.35%,有效地提升了污水處理過程的安全性能。
圖13 CQR-OC 方案的性能指標運行軌跡圖Fig.13 Performance indicator tracks under CQR-OC strategy
圖14 OLC、CQ-OC、CQR-OC 方案的性能指標對比圖Fig.14 Performance indicator comparison of OLC, CQ-OC, CQR-OC strategy
利用支持向量回歸機建立性能指標的穩(wěn)態(tài)模型,然后采用多目標差分進化算法和篩選決策確定優(yōu)化設定值,最后通過PI 控制器實時跟蹤。在污水處理基準仿真平臺benchmark simulation model no.1 的實驗結果表明:
(1) 支持向量回歸機可以逼近ρO,3設定值、SRT 設定值、進水流量與能耗成本、出水水質、微生物風險穩(wěn)態(tài)值的數(shù)學關系。
(2) 多目標差分進化算法和篩選決策能夠剔除高風險解,提供合理的ρO,3、SRT 優(yōu)化設定值,抗積分飽和PI 控制器可以快速跟蹤設定值。
(3) 相比僅優(yōu)化能耗成本和出水水質,該方法使得高微生物風險比例下降了25.35%,從而為污水處理過程控制提供更安全可靠的解決方案。
然而,本文所提出的控制方案還有改進的空間,例如并未考慮進水水質波動的影響,而且控制器仍存在輸出超調和跟蹤誤差較大等問題。