李中美 ,黃夢哲 ,桂衛(wèi)華
(1.華東理工大學(xué)信息科學(xué)與工程學(xué)院,上海 200237;2.紐約大學(xué)工學(xué)院,美國紐約11201; 3.中南大學(xué)自動化學(xué)院,湖南長沙 410083)
隨著制造業(yè)的飛速發(fā)展,尤其在建設(shè)“一帶一路”,建立全球礦業(yè)命運(yùn)共同體的新背景下,我國新興產(chǎn)業(yè)對銻、稀土、鎢、石墨等戰(zhàn)略性礦產(chǎn)原材料的需求越來越大,也越來越重視以上礦物資源的分選技術(shù)研究[1].浮選法作為應(yīng)用最廣泛的一種選礦方法,通過在礦漿中添加化學(xué)藥劑來達(dá)到有用礦物和脈石礦物分離的目的[2-3].目前國內(nèi)大部分選礦廠還是主要依賴操作工人根據(jù)經(jīng)驗(yàn)對藥劑量進(jìn)行調(diào)整.這種以人工添加方法帶來的弊端就是工況波動頻繁,難以使浮選過程處于最佳運(yùn)行狀態(tài),易導(dǎo)致藥劑量消耗大、人工勞動強(qiáng)度大、礦物回收率低、企業(yè)經(jīng)濟(jì)效益低.因此,開展先進(jìn)的浮選過程藥劑量優(yōu)化控制方法的研究對于減少資源浪費(fèi)、減輕工人勞動強(qiáng)度、提高生產(chǎn)效率顯得尤為重要.
近年來,國內(nèi)外學(xué)者對浮選過程藥劑量控制做了不少研究,并取得了一定成效.如基于模型的浮選過程藥劑量控制方法[4-6],基于神經(jīng)網(wǎng)絡(luò)的藥劑量控制方法[7-8],基于專家系統(tǒng)的藥劑量控制方法[9-10]和基于計算機(jī)視覺的藥劑量控制方法[11-14].盡管以上浮選過程藥劑量控制方法在一些情況下是有效的,但是在實(shí)際應(yīng)用中,存在以下問題有待進(jìn)一步研究:1)對于具有動態(tài)不確定性的浮選過程,內(nèi)部機(jī)理復(fù)雜、缺乏準(zhǔn)確的在線測量工具,對浮選過程動態(tài)模型的識別具有一定難度,且以上基于模型的控制方法均未考慮外界擾動對系統(tǒng)的影響;2)基于人工神經(jīng)網(wǎng)絡(luò)的藥劑量控制方法需要大量的可調(diào)參數(shù)(網(wǎng)絡(luò)權(quán)值).當(dāng)訓(xùn)練樣本較多時,會出現(xiàn)計算量大和過擬合的情況,當(dāng)可用于訓(xùn)練的數(shù)據(jù)數(shù)量減少(自由度減少)時,泛化能力就會喪失,理論和學(xué)習(xí)算法還有待于進(jìn)一步完善和提高;3)基于模糊或基于規(guī)則的專家系統(tǒng)控制方法存在當(dāng)知識集不完備,或?qū)τ谖纯紤]到的情形,系統(tǒng)容易陷入困境,且對診斷結(jié)果的解釋能力弱等缺點(diǎn),同時又存在人工干預(yù)多、推理速度慢、精度較低等缺點(diǎn),很難實(shí)現(xiàn)自適應(yīng)學(xué)習(xí)的功能.尤其是隨著時間的變化,基于專家系統(tǒng)的控制方法會使控制行為飽和,如何應(yīng)對計算復(fù)雜度也是一個棘手的問題;4)基于計算機(jī)視覺的藥劑量控制方法對人工特征提取算法的依賴度高,且在特征提取過程中易受噪聲或外界光源擾動影響,容易出現(xiàn)收斂性和穩(wěn)定性問題.
隨著信息科學(xué)技術(shù)的發(fā)展和工廠自動化程度的提高,蘊(yùn)含工業(yè)過程運(yùn)行信息的數(shù)據(jù)被實(shí)時獲取和存儲,現(xiàn)代工業(yè)已經(jīng)迎來了數(shù)據(jù)驅(qū)動時代的曙光.基于數(shù)據(jù)的控制方法在化工、高分子材料、鋼鐵、制藥、配電網(wǎng)等工業(yè)生產(chǎn)過程中有著廣泛的應(yīng)用.與傳統(tǒng)優(yōu)化控制方法不同的是,自適應(yīng)動態(tài)規(guī)劃(adaptive dynamic pro-gramming,ADP)技術(shù)是最優(yōu)控制領(lǐng)域新近興起的一種基于數(shù)據(jù)的近似最優(yōu)方法,是當(dāng)前國際最優(yōu)化領(lǐng)域的研究熱點(diǎn)[15-21].近年來,ADP算法在理論研究和實(shí)際應(yīng)用中已取得豐碩的成果,且展現(xiàn)出巨大的發(fā)展?jié)摿?其應(yīng)用范圍深入到工業(yè)生產(chǎn)過程、電力系統(tǒng)、航空航天和自動駕駛汽車等各個領(lǐng)域[22-27].然而在有色冶金領(lǐng)域,特別是ADP技術(shù)在浮選過程中的應(yīng)用卻鮮有涉及.
因此,本文針對浮選過程的動態(tài)不確定性,傳統(tǒng)基于模型/專家系統(tǒng)/神經(jīng)網(wǎng)絡(luò)/計算機(jī)視覺的藥劑量控制方法在模型獲取難、知識集不完備、解釋能力弱、穩(wěn)定性差等方面的問題,從浮選過程中大量在線和離線運(yùn)行數(shù)據(jù)出發(fā),深入發(fā)掘數(shù)據(jù)中隱含的系統(tǒng)信息,基于現(xiàn)代控制理論、前饋控制原理、強(qiáng)化學(xué)習(xí)和自適應(yīng)動態(tài)規(guī)劃技術(shù),研究和設(shè)計數(shù)據(jù)驅(qū)動的浮選過程加藥量自適應(yīng)優(yōu)化控制方法,以提高礦產(chǎn)資源利用率、減輕對操作人員人工調(diào)整藥劑量的依賴性具有重要現(xiàn)實(shí)意義.
本文的研究框架如下:第2節(jié)對浮選槽工作機(jī)理進(jìn)行描述,并建立銻浮選過程機(jī)理模型,為驗(yàn)證后續(xù)數(shù)據(jù)驅(qū)動的藥劑量優(yōu)化控制方法奠定基礎(chǔ);第3節(jié)給出浮選過程藥劑量優(yōu)化控制問題;第4部分詳細(xì)介紹一種基于值迭代的藥劑量自適應(yīng)最優(yōu)控制算法,并對所提出算法的收斂性和閉環(huán)系統(tǒng)的穩(wěn)定性進(jìn)行嚴(yán)格分析;第5部分給出仿真結(jié)果和已有方法的對比,以說明數(shù)據(jù)驅(qū)動控制方法的優(yōu)越性;最后是本文結(jié)論和未來工作安排.
針對傳統(tǒng)針對浮選槽機(jī)理模型的研究,大都是建立在假設(shè)浮選槽內(nèi)礦物顆粒與氣泡均勻混合的理想情況下,本文根據(jù)礦物顆粒-氣泡在浮選槽內(nèi)的分布不均勻性,將浮選槽分為泡沫相和礦漿相進(jìn)行研究,并在兩相結(jié)構(gòu)基礎(chǔ)上,根據(jù)物料守恒原理和兩相之間的物料傳輸特性,建立浮選槽雙相機(jī)理模型,為后續(xù)的藥劑量優(yōu)化控制研究工作奠定基礎(chǔ).
浮選槽的工作機(jī)理如圖1所示.浮選槽內(nèi)配有一個葉輪和輸氣管,用于攪拌礦漿和向礦漿內(nèi)充氣.浮選藥劑和礦物原料被添加到浮選槽,疏水性礦物隨著葉輪的攪拌與氣泡發(fā)生碰撞并附著在氣泡表面上,向上移動形成泡沫層,經(jīng)刮板從浮選槽中刮出,成為精礦產(chǎn)品.與此同時,親水性礦物滯留在礦漿中,從浮選槽底部流出,形成尾礦產(chǎn)品.浮選過程的實(shí)質(zhì)是利用礦物顆粒表面的疏水性和親水性來收集目標(biāo)礦物顆粒,使有用礦物的回收率最大化.為達(dá)到理想的浮選性能,可通過浮選藥劑選擇性地改變礦物顆粒表面的物理化學(xué)性質(zhì),以達(dá)到有用礦物和脈石礦物分離的目的.因此,可以通過調(diào)節(jié)藥劑的添加量來控制浮選性能.
圖1 浮選槽結(jié)構(gòu)圖Fig.1 Structure of a flotation tank
由于浮選過程的復(fù)雜性和動態(tài)不確定性,建立嚴(yán)格且精確的數(shù)學(xué)模型有一定的困難.但是,工業(yè)生產(chǎn)過程中存在大量數(shù)據(jù),這些生產(chǎn)數(shù)據(jù)在一定程度上可以反映過程機(jī)理,對浮選過程建模具有很好的參考價值.可以看出,泡沫相和礦漿相顆粒-氣泡之間的微觀結(jié)構(gòu)使浮選動力學(xué)模型的建立變得復(fù)雜.鑒于以往的單相模型都是把浮選槽內(nèi)的物料看作一個整體,忽略了其中泡沫相與礦漿相之間的差異.本文從浮選過程機(jī)理出發(fā)(至少在定性意義上),在保持浮選過程模型結(jié)構(gòu)足夠簡單的同時,用現(xiàn)場數(shù)據(jù)對其進(jìn)行驗(yàn)證.首先,在文獻(xiàn)[28]的基礎(chǔ)上,對礦物顆粒與氣泡在浮選槽內(nèi)部存在的4種狀態(tài)進(jìn)行分析,并根據(jù)質(zhì)量平衡模型,建立礦物顆粒-氣泡在浮選槽內(nèi)每種狀態(tài)下的動態(tài)關(guān)系式,結(jié)構(gòu)如圖2所示.
圖2 浮選槽內(nèi)礦物顆粒的4種狀態(tài)Fig.2 Four states of mineral particles in a flotation tank
其中:ψLP表示礦漿相的礦漿中單位體積內(nèi)有用礦物顆粒的個數(shù),VLP為礦漿相中礦漿體積(m3),kPAT為礦漿相中礦物顆粒與氣泡的附著速率常數(shù),kPDT為礦漿相中礦物顆粒與氣泡的分離速率常數(shù),QFeed為入礦流速(ml/min),QT為礦物顆粒向底流槽的傳輸速度(ml/min),QR為礦物顆粒從泡沫相向礦漿相的回落流速(ml/min),kR是礦物顆粒從泡沫相向礦漿相的回落速率常數(shù),QE為夾帶礦物顆粒從礦漿相向泡沫相的流速(ml/min),ψBP表示礦漿相的氣體中單位體積內(nèi)有用礦物顆粒的個數(shù),VBP為礦漿相中氣體體積(m3),QA為空氣流速(m3/(槽·min)),QAT為從礦漿相到尾礦底流槽的空氣流速(m3/(槽·min)),ψLF表示泡沫相的礦漿中單位體積內(nèi)有用礦物顆粒的個數(shù),VLF為泡沫相中礦漿體積(m3),kFAT為泡沫相中礦物顆粒與氣泡的附著速率常數(shù),kFDT為泡沫相中礦物顆粒與氣泡的分離速率常數(shù),ψBF表示泡沫相的氣體中單位體積內(nèi)有用礦物顆粒的個數(shù),VBF為泡沫相中氣體體積(m3),QC為礦物顆粒向溢流槽的傳輸速度(ml/min),QAC為從泡沫相到溢流槽的空氣流速(m3/(槽·min)),V為浮選槽體積(m3),VTF為泡沫相體積(m3),VTP為礦漿相體積(m3).
然后,將方程(1)-(4)中泡沫相和礦漿相的礦物顆粒(自由、附著在氣泡上的顆粒)分別相加,可以得到
假設(shè)礦漿相和泡沫相中附著在氣泡上的礦物顆粒與自由顆粒之間存在某種物理平衡:
式中αP和αF分別為礦漿相中礦物顆粒與氣泡的附著分離速率常數(shù)以及泡沫相中礦物顆粒與氣泡的附著分離速率常數(shù).式(7)和(8)可寫為
因此,礦漿相中每單位體積的粒子數(shù)可表示為
將式(7)代入,可得
同樣地,泡沫相中每單位體積的粒子數(shù)可以表示為
將式(7)-(8)(12)-(13)代入到式(5)-(6)中,可得
為簡化模型,做出以下假設(shè):
假設(shè)1礦漿相的礦物顆粒與氣泡完全混合;
假設(shè)2泡沫相的礦物顆粒與氣泡完全混合;
假設(shè)3礦物顆粒的大小和形狀均勻;
假設(shè)4在穩(wěn)態(tài)條件下,QA=QAC+QAT;
假設(shè)5QC/QAC=VLF/VBF,QT/QAT=VLP/VBP.
基于泡沫相和礦漿相分別完全混合的假設(shè),可建立一組礦漿相與泡沫相的液態(tài)和氣態(tài)物料平衡方程對浮選動態(tài)過程進(jìn)行描述,式(14)-(15)可寫成
式(16)-(17)分別表示礦漿相和泡沫相中的礦物質(zhì)量平衡,式(18)和式(19)分別表示礦漿相和泡沫相的液態(tài)平衡,其中:
式中:S為浮選槽面積,h為浮選槽高度,hp為液位高度.
為建立加藥量與浮選指標(biāo)之間的關(guān)系模型,定義尾礦品位R1和精礦品位R2:
將式(23)與式(24)代入式(16)和式(17)中,可轉(zhuǎn)化為與尾礦品位、精礦品位有關(guān)的表達(dá)式:
為從最優(yōu)控制問題分析入手,對模型進(jìn)行了修正,以研究操作變量對浮選性能的影響.根據(jù)文獻(xiàn)[29]可知
其中:δ是氣泡周圍的薄膜厚度,dBP是礦漿相平均氣泡直徑,μF為泡沫相平均含氣量,r1和r2是隨工況變化的變量.
式(25)與式(26)仍然保留了模型(1)-(4)的基本特征,區(qū)分了礦物顆粒-氣泡在礦漿相和氣泡相的附著/分離機(jī)理以及兩相之間的傳輸機(jī)理.由于在浮選現(xiàn)場,空氣流速Q(mào)A、礦物顆粒向底流槽的傳輸速度QT和向溢流槽的傳輸速度QC通常首先調(diào)整到一個合理的值,并在生產(chǎn)期間保持不變.因此,模型中未知量是泡沫相中礦物顆粒與氣泡的附著分離速率常數(shù)αF、礦漿相中礦物顆粒與氣泡的附著分離速率常數(shù)αP及泡沫相向礦漿相的回落速率常數(shù)kR,這3個參數(shù)均受浮選藥劑(PH 值、捕收劑、活化劑和起泡劑)影響.
從經(jīng)驗(yàn)來看,PH值O1通過在礦漿相改變礦物表面性質(zhì),從而影響礦物的可浮性.在文獻(xiàn)[30]和[31]的基礎(chǔ)上,可知礦漿相中礦物顆粒-氣泡的附著分離常數(shù)αP與O1成比例關(guān)系.此外,αP還受捕收劑O2的影響,因?yàn)椴妒談┛梢源龠M(jìn)有用礦物呈現(xiàn)出疏水特性,從而有利于礦物顆粒與氣泡之間的附著.隨著O2的增加,αP也在一定范圍內(nèi)增長[32].所以,可假設(shè)
而泡沫相中的礦物顆粒-氣泡的附著分離常數(shù)αF以及礦物顆粒從泡沫相向礦漿相的回落速率常數(shù)kR主要受泡沫停留時間的影響,泡沫停留時間與活化劑O3和起泡劑O4有關(guān).因?yàn)殡S著活化劑和起泡劑的增加,氣泡粘度增加,氣泡在礦漿相的停留時間增長.因此,有用礦物回落將會變得困難,從而影響最終的精礦品位和尾礦品位[33-34].可假設(shè)αF和kR與O3,O4之間的關(guān)系為
式中:R1和R2分別表示尾礦品位和精礦品位,m1,m2,m3,m4,m5以及r1,r2為待辨識參數(shù).
綜上,加藥量是通過影響礦漿相的附著分離速率常數(shù)、泡沫相的附著分離速率常數(shù)以及泡沫相向礦漿相的回落速率常數(shù)對最終的精礦品位和尾礦品位產(chǎn)生影響.根據(jù)生產(chǎn)數(shù)據(jù)分析,空氣流速Q(mào)A以及礦漿液位hp會在一定范圍內(nèi)較小的波動,但其平均值基本穩(wěn)定在一定的數(shù)值.所以,可將礦漿相體積以及泡沫相體積看作是常數(shù).PH值O1、捕收劑流量O2(ml/min)、活化劑流量O3(ml/min)和起泡劑流量O4(ml/min)作為動態(tài)模型的控制量,通過對藥劑量進(jìn)行優(yōu)化調(diào)整,對礦漿相和泡沫相的顆粒-氣泡運(yùn)動行為產(chǎn)生影響,以提高有用礦物回收率.
為簡化控制器的設(shè)計任務(wù),將浮選過程的非線性動態(tài)模型在穩(wěn)定運(yùn)行狀態(tài)下近似線性化,即將式(35)和式(36)在平衡點(diǎn)(R1eq,R2eq,O1eq,O2eq,O3eq,O4eq)附近進(jìn)行線性化處理.令
則系統(tǒng)(35)和(36)在平衡點(diǎn)附近的線性化狀態(tài)方程為
式中:x表示要跟蹤的系統(tǒng)狀態(tài)向量,u表示控制輸入向量,Ac與Bc為系數(shù)矩陣,Dc表示外界擾動,具體參數(shù)見文獻(xiàn)[35].根據(jù)輸入信號在每個采樣時刻的運(yùn)動軌跡,采用零階保持器方法可將連續(xù)時間系統(tǒng)(37)離散化為[36]
h是采樣周期.因式(38)可控性矩陣和可觀性矩陣均滿秩,可知該線性離散系統(tǒng)是可控和可觀的.
本文的主要目標(biāo)是設(shè)計一個控制器
使得跟蹤誤差xk隨時間k趨于無窮而趨于零.其中:K ∈R4×2是反饋增益矩陣,U ∈R是前饋增益矩陣.
定理1如果Ad-BdK的所有特征值都嚴(yán)格位于單位圓內(nèi),則
式(40)為線性調(diào)節(jié)器方程(linear regulation equation,LRE).基于最優(yōu)控制理論和前饋控制原理[37],可將浮選過程的藥劑量控制問題轉(zhuǎn)化為兩級優(yōu)化問題(問題1和問題2):通過求解問題1可知式(40)的最優(yōu)前饋分量U?,求解問題2得出最優(yōu)反饋增益K?,從而得到最優(yōu)控制器=-K?xk+U?,以實(shí)現(xiàn)抑制外部干擾和跟蹤誤差為零的控制目標(biāo),即:=0[38].
問題1
問題2
對于初始狀態(tài)x0∈Rn,其中:Q=QT≥0,R=RT>0.根據(jù)線性最優(yōu)控制理論,對于離散時間系統(tǒng)(38),最優(yōu)反饋增益K?可由P?計算得到.其中P?=P?T>0 是以下離散時間代數(shù)Riccati 方程(discretetime algebraic riccati equation,DARE)的唯一解:
因此,可知最優(yōu)反饋增益K?
但是P在DARE(42)中是非線性的,很難直接求解.在常規(guī)基于模型的控制器設(shè)計方法中,通常采用文獻(xiàn)[39]提出的值迭代(VI)算法尋找式(42)-(43)中的近似解P?-K?,方程如下:
由式(44)-(45)可以看出,上述基于模型的方法建立在狀態(tài)模型的參數(shù)Ad,Bd和Dd已知的情況下.然而,在實(shí)際的浮選過程中,輸入和狀態(tài)數(shù)據(jù)的實(shí)時變化,浮選過程的動態(tài)不確定性、內(nèi)部參數(shù)間互相耦合互相影響,建立精確的數(shù)學(xué)模型是一件非常復(fù)雜的工作.
鑒于此,接下來將提出數(shù)據(jù)驅(qū)動的方法解決浮選過程中藥劑量的最優(yōu)控制問題,控制目標(biāo)是設(shè)計一個ADP控制器和自適應(yīng)控制策略,以保證在藥劑量消耗最少的情況下,系統(tǒng)狀態(tài)xk能夠跟蹤給定值,且跟蹤誤差較小,具體控制結(jié)構(gòu)如圖3所示.在線X-Ray熒光分析儀提供元素濃度,實(shí)時計算精礦品位R1和尾礦品位R2,根據(jù)測量值R=[R1R2]T與參考狀態(tài)Req=[R1,eqR2,eq]T之間的誤差,采用基于VI 的ADP 算法計算反饋控制增益K.同時,在ADP控制器中加入一個前饋補(bǔ)償器U用于抑制干擾,以此實(shí)現(xiàn)浮選過程藥劑量的優(yōu)化控制.
圖3 基于ADP控制器的浮選過程藥劑量優(yōu)化控制框圖Fig.3 The reagents optimal control diagram in flotation process based on ADP controller
為設(shè)計數(shù)據(jù)驅(qū)動的加藥量自適應(yīng)迭代學(xué)習(xí)控制方法,將系統(tǒng)(38)寫為
基于以上定義,將給出基于VI的ADP控制器設(shè)計方法,在VI迭代算法中,是從一個隨機(jī)值函數(shù)開始,然后在迭代過程中找到一個新的(改進(jìn)的)值函數(shù),直到得到最優(yōu)值函數(shù).通過式(44)和式(46),值迭代方程可以寫為
為驗(yàn)證所提出數(shù)據(jù)驅(qū)動控制方法的有效性和穩(wěn)定性,收集了浮選廠4000組藥劑量添加數(shù)據(jù),以及相應(yīng)的4000組精礦品位和尾礦品位數(shù)據(jù)對浮選過程藥劑量控制問題進(jìn)行建模.采用龍格-庫塔-費(fèi)爾博格法和1stOpt 提出的通用全局優(yōu)化算法,最小化如下的目標(biāo)函數(shù):
對第2節(jié)建立的動態(tài)模型(35)-(36)中的未知參數(shù)m1,m2,m3,m4,m5以 及r1,r2進(jìn) 行 辨 識.式 中R1和R2分別表示實(shí)際采樣點(diǎn)現(xiàn)場收集到的尾礦品位和精礦品位,可通過X 熒光分析儀在線檢測得到,和表示在每個采樣點(diǎn)上尾礦品位和精礦品位的模型計算值.系統(tǒng)模型(38)可寫為
權(quán)重矩陣設(shè)為Q=,R是單位矩陣,采樣周期為1 s.為驗(yàn)證所提出數(shù)據(jù)驅(qū)動方法的有效性,通過狀態(tài)空間模型(54)的矩陣系數(shù)Ad,Bd,Dd求解DARE(42)計算最優(yōu)控制增益H?和K?.
在式(54)基礎(chǔ)上,建立仿真環(huán)境,仿真中添加的噪聲e=是由隨機(jī)發(fā)生器產(chǎn)生.其中,wi為[0,100]里的隨機(jī)數(shù),i=1,2.
根據(jù)浮選生產(chǎn)過程中采集的狀態(tài)和輸入數(shù)據(jù),使用基于VI的ADP算法迭代學(xué)習(xí)最優(yōu)控制器的反饋增益Kj.從圖4可以看出,11次迭代后,使用基于VI的ADP算法迭代學(xué)習(xí)到的Hj和Kj已經(jīng)收斂到經(jīng)模型系數(shù)矩陣計算得到的最優(yōu)值H?和K?,從而可得自適應(yīng)最優(yōu)控制器uk=-Kxk+U.
圖4 Hj和Kj及其最優(yōu)值比較Fig.4 CompareHj andKj with optimal values
在k=30時,將本文提出的基于VI的ADP算法迭代學(xué)習(xí)到的最優(yōu)控制策略應(yīng)用于閉環(huán)系統(tǒng)中,得到以下結(jié)果:尾礦品位R1和精礦品位R2的跟蹤誤差x1與x2以極小的跟蹤誤差收斂到0,如圖5 所示.同時,圖6給出了ADP控制器所建議的藥劑添加量u=[u1u2u3u4].
圖5 基于ADP控制器的系統(tǒng)狀態(tài)Fig.5 System states under ADP controller
圖6 基于ADP控制器的控制輸入Fig.6 Control inputs under ADP controller
為評估所提出基于VI的ADP算法的有效性,應(yīng)用模型預(yù)測控制(model predictive control,MPC)方法,與數(shù)據(jù)驅(qū)動的ADP控制方法進(jìn)行了比較.目標(biāo)函數(shù)定義為
其中:r(k+j)=0為跟蹤誤差xk的目標(biāo)值,uk為藥劑消耗量.MPC 控制策略采用二次規(guī)劃(quadratic programming,QP)結(jié)構(gòu)來求解[40],預(yù)測時域N和控制時域Nc分別設(shè)為20和2.圖7和圖8分別給出了基于MPC控制方法的系統(tǒng)狀態(tài)跟蹤誤差和控制輸入.
圖7 基于MPC控制器的系統(tǒng)狀態(tài)Fig.7 System states under MPC controller
圖8 基于MPC控制器的控制輸入Fig.8 Control inputs under MPC controller
從圖8仿真結(jié)果可知,MPC控制器下浮選藥劑u1,u2,u3和u4比ADP控制器下所建議的藥劑量消耗分別高了4.9%,11.3%,0.8%和6.8%,藥劑量消耗高會增加選礦成本,不利于浮選廠的經(jīng)濟(jì)效益.此外,從圖7可以看出,尾礦品位的跟蹤誤差x1不能完全按照期望的軌跡運(yùn)行,使得控制精度難以滿足生產(chǎn)要求.
表1分別給出了ADP和MPC兩種控制器下,系統(tǒng)狀態(tài)收斂性能和控制輸入.通過結(jié)果對比可以看出,本文提出的數(shù)據(jù)驅(qū)動的ADP控制方法,系統(tǒng)狀態(tài)的跟蹤誤差較小、藥劑消耗量較小,并且能很好地解決基于MPC控制方法依賴模型的缺點(diǎn).由此可知,基于VI的ADP算法在不了解浮選過程數(shù)學(xué)模型的情況下,僅依靠輸入和測量狀態(tài)數(shù)據(jù)即可對浮選過程藥劑量進(jìn)行優(yōu)化控制,且能夠有效抑制外界擾動.
為進(jìn)一步說明本方法的有效性,對銻浮選現(xiàn)場的人工加藥量調(diào)節(jié)情況進(jìn)行記錄.該銻浮選廠采用三班倒8小時工作制,圖9-12分別為2019年4月186條人工對PH值、捕收劑流量、活化劑流量和起泡劑流量的調(diào)節(jié)情況.其中:PH值的波動范圍在6.1~7.96之間,捕收劑流量的波動范圍在204.46~471.26 ml/min之間,活化劑流量的波動范圍在510.83~696.8 ml/min之間,起泡劑流量的波動范圍在44.13~129.64 ml/min之間.
綜上,本文提出數(shù)據(jù)驅(qū)動的ADP控制方法利用生產(chǎn)數(shù)據(jù)信息進(jìn)行仿真驗(yàn)證的結(jié)果,與實(shí)際浮選過程真實(shí)藥劑量調(diào)節(jié)具有較好的一致性,可解決實(shí)際浮選現(xiàn)場采用人工調(diào)節(jié)方式藥劑量波動大,易導(dǎo)致生產(chǎn)過程不穩(wěn)定的問題.
表1 ADP控制器與MPC控制器性能比較Table 1 The performance comparison between ADP controller and MPC controller
圖9 人工調(diào)節(jié)PH值Fig.9 Manually adjustment of PH value
圖10 人工調(diào)節(jié)捕收劑流量Fig.10 Manually adjustment of collector flow rate
圖11 人工調(diào)節(jié)活化劑流量Fig.11 Manually adjustment of activator flow rate
圖12 人工調(diào)節(jié)起泡劑流量Fig.12 Manually adjustment of frother flow rate
考慮到浮選過程的動態(tài)不確定性和外界擾動,本文采用基于VI的ADP控制方法,解決了浮選過程加藥量優(yōu)化控制問題.通過將浮選藥劑控制問題轉(zhuǎn)化為兩級優(yōu)化問題,以最小化跟蹤誤差和藥劑消耗量組成的二次型代價函數(shù)為目標(biāo),借助數(shù)據(jù)驅(qū)動的自適應(yīng)動態(tài)規(guī)劃方法,利用值迭代算法設(shè)計一種基于學(xué)習(xí)的自適應(yīng)最優(yōu)控制策略.同時,引入前饋補(bǔ)償分量以抑制外界擾動.與傳統(tǒng)的控制器設(shè)計不同,基于VI的ADP控制算法可以在不需要知道浮選過程模型和初始控制策略的情況下,僅通過實(shí)時采集浮選過程生產(chǎn)數(shù)據(jù)便可自適應(yīng)的學(xué)習(xí)最優(yōu)控制策略,從而跟蹤期望的精礦品位和尾礦品位.這種數(shù)據(jù)驅(qū)動的自適應(yīng)迭代學(xué)習(xí)控制方法具有較強(qiáng)的抗干擾能力,保證了浮選過程的穩(wěn)定性.
隨著分布式控制策略的集成,數(shù)據(jù)驅(qū)動的控制方法不僅可用于控制整個浮選廠的礦漿液位、通風(fēng)量等其它控制變量,也可用于磨礦分級過程控制,今后將以不同控制器之間的協(xié)調(diào)優(yōu)化控制為目標(biāo),為選礦過程全流程自動控制提供部分關(guān)鍵技術(shù).