池榮虎 侯忠生 黃彪
化學(xué)工業(yè)是世界經(jīng)濟(jì)的重要部分,可將原材料轉(zhuǎn)換成70000多種當(dāng)今高質(zhì)量生活不可缺少的產(chǎn)品[1].化學(xué)工業(yè)過(guò)程包括連續(xù)操作和非連續(xù)操作.間歇過(guò)程是非連續(xù)操作的主要方式,適于小批量生產(chǎn),更具有靈活性,成為精細(xì)化產(chǎn)品生產(chǎn)的理想方式[2],已廣泛用于城市污水處理[3]、紙漿造紙[4]、半導(dǎo)體工業(yè)[5]、醫(yī)藥生物發(fā)酵[6]、工業(yè)結(jié)晶過(guò)程[7]等.
間歇過(guò)程的控制與連續(xù)過(guò)程不同,主要在于兩方面:1)間歇過(guò)程沒(méi)有穩(wěn)態(tài)操作點(diǎn),設(shè)定點(diǎn)和控制信號(hào)是時(shí)變的;2)間歇過(guò)程是在有限時(shí)間上重復(fù)運(yùn)行的,具有兩個(gè)相互獨(dú)立的變量,運(yùn)行時(shí)間t和運(yùn)行次數(shù)k.獨(dú)立變量k提供了實(shí)現(xiàn)控制目標(biāo)的額外自由度.因此,間歇過(guò)程的控制策略可分為兩大類(lèi):一類(lèi)是在線控制策略,例如基于PID或更復(fù)雜控制技術(shù)的反饋控制[8],以及用于產(chǎn)品終端控制的模型預(yù)測(cè)控制(Model prediction control,MPC)方法[9].另外一類(lèi)是基于重復(fù)學(xué)習(xí)的迭代學(xué)習(xí)控制[10?12]和用于產(chǎn)品終端輸出控制Run-to-run控制[13?15].近年來(lái),也有文獻(xiàn)[16?18]采用終端迭代學(xué)習(xí)控制策略處理間歇過(guò)程產(chǎn)品終端質(zhì)量控制問(wèn)題.
迭代學(xué)習(xí)控制(Iterative learning control,ILC)最早是由Arimoto等[19]提出的,針對(duì)重復(fù)運(yùn)行的被控系統(tǒng),不斷重復(fù)一個(gè)相同軌跡的控制嘗試,利用前一次或前幾次操作時(shí)測(cè)得的誤差信息和控制輸入信息修正當(dāng)前操作的控制輸入,使該重復(fù)任務(wù)在該次操作中做得更好,最終實(shí)現(xiàn)在整個(gè)時(shí)間區(qū)間上,系統(tǒng)的輸出完全跟蹤上期望軌跡.近年來(lái),間歇過(guò)程的迭代學(xué)習(xí)控制逐漸成為研究熱點(diǎn).Lee等[20?21]提出了基于反饋的學(xué)習(xí)控制策略,并考慮了濾波技術(shù)來(lái)增強(qiáng)對(duì)建模誤差和隨機(jī)擾動(dòng)的魯棒性.Liu等[22]基于間歇過(guò)程的2D模型提出了一種魯棒閉環(huán)ILC方法,在線性矩陣不等式約束下建立了保證閉環(huán)ILC系統(tǒng)魯棒穩(wěn)定性的充分條件.文獻(xiàn)[23?25]提出了基于設(shè)定點(diǎn)迭代學(xué)習(xí)的PID控制策略,得到了魯棒漸近收斂的充分條件.文獻(xiàn)[26]提出了一種PD-型迭代學(xué)習(xí)控制用于生物反應(yīng)器,并采用了模糊方法計(jì)算控制增益.文獻(xiàn)[27?30]為間歇過(guò)程設(shè)計(jì)了多種魯棒ILC控制策略.時(shí)滯問(wèn)題廣泛存在于工業(yè)間歇過(guò)程中,對(duì)許多控制系統(tǒng)的穩(wěn)定性和控制性能都造成了破壞.因此,時(shí)滯系統(tǒng)的ILC設(shè)計(jì)問(wèn)題引起了學(xué)者的關(guān)注[31?32],如文獻(xiàn)[31]提出了輸入時(shí)滯的時(shí)變不確定間歇過(guò)程的魯棒迭代學(xué)習(xí)控制方法,給出了2D狀態(tài)預(yù)測(cè)器對(duì)系統(tǒng)狀態(tài)進(jìn)行預(yù)測(cè),以此補(bǔ)償輸入延遲的影響.
需要說(shuō)明的是,傳統(tǒng)的PID-型迭代學(xué)習(xí)控制方法的優(yōu)點(diǎn)在于需要模型信息少,結(jié)構(gòu)簡(jiǎn)單,易于實(shí)現(xiàn).然而,問(wèn)題在于學(xué)習(xí)增益固定不變,在適應(yīng)被控系統(tǒng)變化和外界擾動(dòng)等不確定性方面的能力相對(duì)較弱,并且在實(shí)際應(yīng)用中很難選取合適的學(xué)習(xí)增益.盡管[26]討論了利用模糊規(guī)則計(jì)算學(xué)習(xí)增益的方法,但模糊規(guī)則的選擇本身就是非常困難的.
迭代學(xué)習(xí)控制很容易與其他控制方法相結(jié)合,產(chǎn)生新的控制策略.例如,文獻(xiàn)[33]在迭代學(xué)習(xí)控制任務(wù)中引入了自適應(yīng)機(jī)制,提出了基于能量函數(shù)設(shè)計(jì)的連續(xù)時(shí)間系統(tǒng)的自適應(yīng)迭代學(xué)習(xí)控制方法.進(jìn)一步,文獻(xiàn)[34?35]將關(guān)鍵引理技術(shù)推廣到迭代域中,提出了離散時(shí)間系統(tǒng)的自適應(yīng)迭代學(xué)習(xí)控制策略以及時(shí)變參數(shù)的迭代辨識(shí)方法.迄今,自適應(yīng)ILC及自適應(yīng)迭代學(xué)習(xí)辨識(shí)方面的研究已獲得很多成功的應(yīng)用[36?40].限于篇幅,關(guān)于這方面的內(nèi)容和結(jié)果不再一一列舉.
另一方面,文獻(xiàn)[41]基于Lifted技術(shù)將被控對(duì)象用超向量形式重新描述為關(guān)于迭代次數(shù)的演變形式,從而可很容易地將最優(yōu)技術(shù)引入到迭代學(xué)習(xí)控制任務(wù),提出了模最優(yōu)的迭代學(xué)習(xí)控制方法.如文獻(xiàn)[42]所指出的,在基于二次性能指標(biāo)的迭代學(xué)習(xí)控制的研究框架下,各種實(shí)際問(wèn)題,例如受限約束、干擾、量測(cè)噪聲及模型誤差等,都可很容易地作為最優(yōu)問(wèn)題的約束條件而被嚴(yán)謹(jǐn)?shù)鼐C合到最優(yōu)ILC控制器的設(shè)計(jì)中.另外,最優(yōu)迭代學(xué)習(xí)控制具有沿迭代方向的嚴(yán)格單調(diào)收斂性,是實(shí)際工程應(yīng)用中最為期望的性質(zhì)之一.
因此,最優(yōu)迭代學(xué)習(xí)控制方法在間歇過(guò)程為主的重復(fù)運(yùn)行系統(tǒng)中得到了廣泛應(yīng)用,其理論研究經(jīng)歷了從線性到非線性,從基于模型到數(shù)據(jù)驅(qū)動(dòng)的發(fā)展歷程.Moore等[43]提出了一種L1最優(yōu)魯棒迭代學(xué)習(xí)控制方法,處理系統(tǒng)的未知有界擾動(dòng)問(wèn)題.Xu等[44]以時(shí)間最優(yōu)和魯棒性為綜合目標(biāo),提出了一種新的魯棒ILC最優(yōu)設(shè)計(jì)和收斂性分析方法,給出了收斂速度的理論分析和評(píng)估,研究了系統(tǒng)動(dòng)態(tài)如何影響學(xué)習(xí)性能的問(wèn)題.文獻(xiàn)[45]基于線性時(shí)變攝動(dòng)模型,提出了一種分層ILC方法,用于晶體冷卻過(guò)程.當(dāng)控制變量不可測(cè)時(shí),文獻(xiàn)[46]提出了一種基于遞歸貝葉斯估計(jì)的最優(yōu)迭代學(xué)習(xí)控制方法,并將其推廣到基于線性化的非線性離散時(shí)間系統(tǒng)中.針對(duì)系統(tǒng)約束問(wèn)題,文獻(xiàn)[47]提出了基于二次性能指標(biāo)的魯棒ILC的線性矩陣不等式方法.文獻(xiàn)[48]提出了Pareto迭代學(xué)習(xí)控制方法,討論多性能目標(biāo)的優(yōu)化問(wèn)題.文獻(xiàn)[49]提出了加速預(yù)測(cè)最優(yōu)ILC收斂的方法,給出了兩個(gè)加速算法和相應(yīng)的收斂性分析.結(jié)果表明該方法可提高預(yù)測(cè)最優(yōu)ILC的控制性能.文獻(xiàn)[50]基于內(nèi)模原理,提出了最優(yōu)ILC控制增益的多目標(biāo)設(shè)計(jì)方法.Liu等[51]提出了一種改進(jìn)的基于最優(yōu)化指標(biāo)的迭代學(xué)習(xí)算法,保證控制信號(hào)收斂于系統(tǒng)的線性二次型最優(yōu)控制解.
由于間歇過(guò)程的非線性和有限性特點(diǎn),很多學(xué)者嘗試結(jié)合模型預(yù)測(cè)控制方法.文獻(xiàn)[52?57]提出了一些基于模型預(yù)測(cè)控制的迭代學(xué)習(xí)控制方法.文獻(xiàn)[58]結(jié)合二次型ILC和間歇模型預(yù)測(cè)控制技術(shù),提出了一種兩階段算法.
隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,現(xiàn)在工業(yè)過(guò)程變得越來(lái)越復(fù)雜,規(guī)模越來(lái)越大,一些所謂的“硬非線性特性”包括摩擦非線性、飽和非線性、死區(qū)非線性、間隙非線性、時(shí)滯非線性等,大量存在于實(shí)際控制工程中,經(jīng)常會(huì)引起控制系統(tǒng)不期望的性態(tài)[59].因此,非線性系統(tǒng)的最優(yōu)迭代學(xué)習(xí)控制引起了人們的重視.
非線性系統(tǒng)的最優(yōu)ILC的設(shè)計(jì),首先要對(duì)原非線性被控系統(tǒng)進(jìn)行線性化,得到線性估計(jì)模型,在此基礎(chǔ)上進(jìn)行最優(yōu)ILC的設(shè)計(jì)和分析.因此,線性化方法是處理非線性控制系統(tǒng)的關(guān)鍵.
在常用的線性化方法中,泰勒展開(kāi)[60]和分段線性化[61]忽略了高階項(xiàng),至多是對(duì)原非線性系統(tǒng)的近似;反饋線性化[62]需要精確已知被控系統(tǒng)的非線性結(jié)構(gòu)和參數(shù);正交函數(shù)線性化[63]依賴(lài)于正交基空間的選取,所得到的線性化模型含有大量不確定參數(shù).因此,盡管文獻(xiàn)[64?66]基于非線性系統(tǒng)的線性名義近似模型,討論了非線性系統(tǒng)的最優(yōu)迭代學(xué)習(xí)控制,但所設(shè)計(jì)的控制器在實(shí)際應(yīng)用中會(huì)由于模型失配和系統(tǒng)復(fù)雜等問(wèn)題而遇到困難.
神經(jīng)網(wǎng)絡(luò)和模糊規(guī)則在近年來(lái)的非線性控制系統(tǒng)的研究中非常流行.文獻(xiàn)[67]提出了非線性系統(tǒng)的動(dòng)態(tài)模糊推理邊界線性化方法.文獻(xiàn)[68]提出了基于遞歸神經(jīng)網(wǎng)絡(luò)模型的批ILC策略,用神經(jīng)網(wǎng)絡(luò)模擬間歇過(guò)程.文獻(xiàn)[69]研究了滾筒鍋爐汽輪機(jī)的非線性模糊模型預(yù)測(cè)ILC.需要說(shuō)明的是,在被控系統(tǒng)未知的情況下,如何選擇合適的神經(jīng)網(wǎng)絡(luò)模型和模糊隸屬度函數(shù)一直是實(shí)際工程應(yīng)用中的難題.
本質(zhì)上,上述線性化方法是基于模型的[60?69],顯然對(duì)應(yīng)的最優(yōu)ILC控制器的設(shè)計(jì)和分析也是基于模型的.所依賴(lài)的模型越精確就使得模型本身越復(fù)雜,依此所設(shè)計(jì)的控制器也會(huì)更加復(fù)雜,從而會(huì)使閉環(huán)系統(tǒng)的魯棒性和可靠性降低,使控制系統(tǒng)的實(shí)現(xiàn)及應(yīng)用變得更加困難.并且,控制性能很大程度上依賴(lài)于被控系統(tǒng)線性模型的精確程度.如果存在較大模型失配和建模誤差,沿迭代軸的單調(diào)收斂性將不再保證.另外,為了減小計(jì)算負(fù)擔(dān),大多數(shù)最優(yōu)ILC的學(xué)習(xí)增益是離線計(jì)算的,一旦確定后在后續(xù)的迭代過(guò)程中將保持不變,從而對(duì)被控系統(tǒng)的變化和外界擾動(dòng)的魯棒性相對(duì)較差.
另一方面,工業(yè)過(guò)程中每時(shí)每刻都產(chǎn)生并儲(chǔ)存了大量的數(shù)據(jù),蘊(yùn)含了關(guān)于過(guò)程運(yùn)行和設(shè)備狀態(tài)的全部有用信息.因此,在無(wú)法獲得過(guò)程精確模型的情況下,如何利用這些離線或在線的過(guò)程數(shù)據(jù)直接進(jìn)行控制器設(shè)計(jì),提出基于數(shù)據(jù)驅(qū)動(dòng)的控制方法,具有重要的理論和實(shí)際意義[70?75].數(shù)據(jù)驅(qū)動(dòng)控制[71]指的是控制器的設(shè)計(jì)和分析中并不顯含或隱含地利用被控對(duì)象的任何模型信息,如系統(tǒng)矩陣、結(jié)構(gòu)、狀態(tài)等,而是僅利用系統(tǒng)過(guò)程產(chǎn)生的I/O數(shù)據(jù).數(shù)據(jù)驅(qū)動(dòng)控制的目標(biāo)是在精確數(shù)學(xué)模型或系統(tǒng)不確定性描述不可獲取情況下,充分利用系統(tǒng)的運(yùn)行數(shù)據(jù)進(jìn)行基于數(shù)據(jù)的控制系統(tǒng)的設(shè)計(jì).它與基于模型的控制理論一起成為完整的控制理論不可缺少的兩個(gè)部分.關(guān)于數(shù)據(jù)驅(qū)動(dòng)控制理論與基于模型的控制理論之間的辯證關(guān)系詳見(jiàn)文獻(xiàn)[70?73].
數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)ILC方法的設(shè)計(jì)和分析的前提也是線性化.與傳統(tǒng)的線性化方法[60?69]不同的是,文獻(xiàn)[76?78]針對(duì)重復(fù)運(yùn)行的非線性生產(chǎn)過(guò)程,提出了一種新的迭代動(dòng)態(tài)線性化方法(Iterative dynamic linearization,IDL),這是一種沿迭代批次在有限時(shí)間區(qū)間上逐點(diǎn)展開(kāi)的批量線性化方法,建立了原非線性系統(tǒng)完全等價(jià)的迭代線性化模型.其優(yōu)點(diǎn)在于:1)該線性化方法是數(shù)據(jù)驅(qū)動(dòng)的,是針對(duì)未知的非線性系統(tǒng)提出的,不需要原非線性系統(tǒng)的任何模型信息;2)所得到的線性化形式結(jié)構(gòu)簡(jiǎn)單、參數(shù)少,只有原非線性系統(tǒng)的復(fù)合函數(shù)關(guān)于控制輸入信號(hào)的偏導(dǎo)數(shù)需要根據(jù)系統(tǒng)的I/O數(shù)據(jù)進(jìn)行迭代估計(jì).因此,文獻(xiàn)[76?78]所提出的迭代動(dòng)態(tài)線性化方法是數(shù)據(jù)驅(qū)動(dòng)的、面向控制器設(shè)計(jì)的,可直接借鑒線性系統(tǒng)的工具和方法進(jìn)行控制器的設(shè)計(jì)和分析.
隨后,文獻(xiàn)[76?78]借鑒線性系統(tǒng)的最優(yōu)迭代學(xué)習(xí)控制理論的已有成果,基于上述迭代動(dòng)態(tài)線性化模型,分別提出了數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)迭代學(xué)習(xí)控制(Data-driven optimal ILC,DDOILC)、數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)點(diǎn)到點(diǎn)迭代學(xué)習(xí)控制(Data-driven optimal point-to-point ILC,DDOPTPILC)和數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)終端迭代學(xué)習(xí)控制(Data-driven optimal terminal ILC,DDOTILC)方法.這些方法的設(shè)計(jì)和分析直接面向未知的非線性系統(tǒng),利用系統(tǒng)運(yùn)行所得到的I/O數(shù)據(jù),而不需要被控系統(tǒng)的任何建模過(guò)程.
需要說(shuō)明的是,數(shù)據(jù)驅(qū)動(dòng)的控制方法并不排斥基于模型的控制方法;相反,二者是相輔相成、優(yōu)勢(shì)互補(bǔ)的關(guān)系.如文獻(xiàn)[70?73]所述,現(xiàn)實(shí)世界中的實(shí)際系統(tǒng)按照對(duì)象模型的可獲取性可分為:1)機(jī)理模型或辨識(shí)模型可精確獲取;2)機(jī)理模型或辨識(shí)模型可獲取但不精確,含有有限程度的不確定性;3)機(jī)理模型或辨識(shí)模型可獲取,但非常復(fù)雜、階數(shù)高、非線性強(qiáng)、時(shí)變性強(qiáng);4)機(jī)理模型或辨識(shí)模型很難建立,或不可獲取.在上述四類(lèi)被控對(duì)象中,已有的基于模型的控制方法只能很好地處理1)和部分2)等的實(shí)際對(duì)象,另一大半的被控對(duì)象則需要采用數(shù)據(jù)驅(qū)動(dòng)的控制策略.換言之,數(shù)據(jù)驅(qū)動(dòng)的控制方法可以處理上述所有四類(lèi)被控對(duì)象,但是對(duì)于機(jī)理清楚的被控過(guò)程,基于模型的控制方法會(huì)更加可靠并具有更好的控制性能;對(duì)難以建立精確數(shù)學(xué)模型或模型較為復(fù)雜的被控過(guò)程,數(shù)據(jù)驅(qū)動(dòng)的控制方法則會(huì)更有優(yōu)勢(shì).因此,如何將基于模型的控制方法和數(shù)據(jù)驅(qū)動(dòng)的控制方法進(jìn)行有機(jī)融合和模塊化設(shè)計(jì)是一個(gè)非常重要的研究課題.數(shù)據(jù)驅(qū)動(dòng)控制方法與基于模型控制方法之間的互補(bǔ)型控制系統(tǒng)設(shè)計(jì)的部分研究成果可參見(jiàn)文獻(xiàn)[79?82].
本文主要以間歇過(guò)程作為重復(fù)運(yùn)行系統(tǒng)的控制背景,引出迭代學(xué)習(xí)控制理論和方法,對(duì)其最優(yōu)迭代學(xué)習(xí)控制的研究分支的提出和發(fā)展歷程進(jìn)行較為詳細(xì)的綜述和分析.目的在于分析和借鑒基于模型的最優(yōu)ILC方法的現(xiàn)有成果,包括系統(tǒng)的設(shè)計(jì)和分析工具,嘗試在迭代動(dòng)態(tài)線性化的前提下,提出更多適合實(shí)際生產(chǎn)需求的數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)ILC方法,解決越來(lái)越復(fù)雜的間歇過(guò)程的控制中遇到的建模困難、魯棒性差等根本難題.在數(shù)據(jù)驅(qū)動(dòng)的廣義最優(yōu)ILC的綜述中,主要以迭代動(dòng)態(tài)線性化為主線,分別回顧和分析了完整軌跡跟蹤的最優(yōu)ILC方法、多中間點(diǎn)跟蹤的最優(yōu)點(diǎn)對(duì)點(diǎn)ILC方法以及單個(gè)終點(diǎn)跟蹤的最優(yōu)終端ILC方法.論文同時(shí)回顧了其他數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)控制的最新進(jìn)展,提出了需要進(jìn)一步研究的問(wèn)題前景和方向.
本文結(jié)構(gòu)安排如下:第1節(jié)是基于模型的最優(yōu)ILC的回顧,目的在于明確最優(yōu)ILC的概念、定義和設(shè)計(jì)過(guò)程,并分析和研究最優(yōu)ILC的最新進(jìn)展.第2節(jié)主要回顧了非線性重復(fù)運(yùn)行系統(tǒng)的迭代動(dòng)態(tài)線性化方法,作為后面數(shù)據(jù)驅(qū)動(dòng)最優(yōu)ILC設(shè)計(jì)的依據(jù)和基礎(chǔ).詳細(xì)說(shuō)明和分析了迭代動(dòng)態(tài)線性化方法的特點(diǎn)和用途.第3節(jié)是數(shù)據(jù)驅(qū)動(dòng)廣義最優(yōu)ILC的設(shè)計(jì)和分析的回顧,包括完整軌跡跟蹤、多點(diǎn)跟蹤和單個(gè)終點(diǎn)跟蹤等三種不同的控制任務(wù),分析了數(shù)據(jù)驅(qū)動(dòng)廣義最優(yōu)ILC的最新發(fā)展.第4節(jié)是結(jié)論和展望,分析了數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)ILC的發(fā)展方向,提出了一些開(kāi)放的具有挑戰(zhàn)性的研究問(wèn)題.
為了保證實(shí)際應(yīng)用中的控制精度和可靠性,最優(yōu)迭代學(xué)習(xí)控制受到越來(lái)越多的關(guān)注.最早Togai等[83]、Tao等[84]、Gorinevsky等[85]分別提出了利用梯度法、牛頓拉爾遜法和高斯法等最優(yōu)方法尋找最優(yōu)學(xué)習(xí)控制律.Amann等[41]首先基于范數(shù)優(yōu)化原理對(duì)迭代學(xué)習(xí)控制進(jìn)行了研究.利用超向量技術(shù),對(duì)如下有限時(shí)間區(qū)間上重復(fù)運(yùn)行的線性離散時(shí)間系統(tǒng)進(jìn)行了重新描述.
簡(jiǎn)單起見(jiàn),狀態(tài)空間矩陣A,B,C假設(shè)為時(shí)不變.通過(guò)定義如下兩個(gè)超向量:
將空間方程寫(xiě)成如下形式:
Amann等[41]提出了如下目標(biāo)函數(shù):
其中加入了輸入變化的懲罰項(xiàng),使算法沿批次軸具有積分行為.在無(wú)其他約束和確定條件下,Amann等得出了非因果的輸入更新律
1996年,Lee等[86]根據(jù)有限時(shí)間上二次最優(yōu)跟蹤問(wèn)題的求解思想,將上述非因果控制律(4)改寫(xiě)為如下因果形式:
Barton等[87]將基于范數(shù)優(yōu)化的迭代學(xué)習(xí)控制方法用于多軸機(jī)器人,提高了運(yùn)動(dòng)軌跡的跟蹤性能和魯棒性.van de Wijdeven等[88]提出了基于線性二次型的最優(yōu)迭代學(xué)習(xí)控制在有限時(shí)間內(nèi)的魯棒單調(diào)收斂分析方法.Chu等[49]利用逐次投影方法提高了非最小相位系統(tǒng)的范數(shù)優(yōu)化迭代學(xué)習(xí)控制算法的跟蹤性能和收斂速度.文獻(xiàn)[89]證明了上述二次型迭代學(xué)習(xí)控制可作為輸出反饋來(lái)實(shí)現(xiàn),以增強(qiáng)系統(tǒng)的魯棒性.根據(jù)這一思想,文獻(xiàn)[89?90]提出了模型預(yù)測(cè)控制(MPC)與迭代學(xué)習(xí)控制的組合,成為間歇過(guò)程研究中的主要方向之一,吸引了很多學(xué)者的關(guān)注[52?58,91].
當(dāng)間歇過(guò)程的批次擾動(dòng)和噪聲較大時(shí),文獻(xiàn)[42]提出了基于觀測(cè)器的最優(yōu)學(xué)習(xí)控制律
其中?uk=uk?uk?1,K是個(gè)濾波增益矩陣.
最近,文獻(xiàn)[92]提出一種離散時(shí)間迭代學(xué)習(xí)Kalman濾波方法,將Kalman濾波與迭代學(xué)習(xí)控制相結(jié)合,對(duì)系統(tǒng)狀態(tài)進(jìn)行估計(jì),為基于觀測(cè)器的最優(yōu)迭代學(xué)習(xí)控制的設(shè)計(jì)提供了新的思路.
在很多工業(yè)過(guò)程控制應(yīng)用中,為了保證安全性,平滑操作等,總需要對(duì)過(guò)程變量施加以限制.通常,對(duì)輸入和輸出的約束比較普遍,有如下幾種形式:
1)對(duì)輸入值的約束
2)對(duì)輸入關(guān)于時(shí)間變化率的限制
3)對(duì)輸入關(guān)于批次變化率的限制
當(dāng)用連續(xù)的線性近似來(lái)描述非線性間歇過(guò)程時(shí),上述約束條件能夠有效地將輸入信號(hào)限制在線性范圍內(nèi).
4)對(duì)于系統(tǒng)輸出,通常增加如下軟約束:
文獻(xiàn)[42]將這些約束條件轉(zhuǎn)化成如下線性矩陣不等式:
從而,輸入輸出受限的線性系統(tǒng)的最優(yōu)迭代學(xué)習(xí)控制律即為如下性能指標(biāo)函數(shù)在上述約束不等式條件下的可行解
最近,很多學(xué)者提出了基于模型預(yù)測(cè)控制的迭代學(xué)習(xí)控制[52?57],在最優(yōu)問(wèn)題中充分考慮并結(jié)合了系統(tǒng)的輸入輸出約束.進(jìn)一步,文獻(xiàn)[91]提出了多變量約束的間歇過(guò)程的迭代學(xué)習(xí)模型預(yù)測(cè)控制方法,綜合考慮了系統(tǒng)的約束問(wèn)題、時(shí)變問(wèn)題、外界擾動(dòng)和隨機(jī)特征等因素.文獻(xiàn)[93]基于間歇過(guò)程的二維分段線性化描述,通過(guò)線性矩陣不等式求解,提出了一種受限迭代學(xué)習(xí)控制方法,提高了控制性能.
近年來(lái),多中間關(guān)鍵點(diǎn)跟蹤控制和以間歇過(guò)程產(chǎn)品質(zhì)量控制為主的終端跟蹤控制的研究成為迭代學(xué)習(xí)控制的另一個(gè)熱點(diǎn)問(wèn)題.文獻(xiàn)[94]將基于范數(shù)優(yōu)化的迭代學(xué)習(xí)控制策略引入到終端跟蹤控制任務(wù),提出了最優(yōu)終端迭代學(xué)習(xí)控制(Optimal terminal iterative learning control,OTILC)方法.文獻(xiàn)[95?97]提出了基于優(yōu)化的點(diǎn)到點(diǎn)迭代學(xué)習(xí)控制(Point-to-point iterative learning control,PTPILC)方法,僅跟蹤指定的參考點(diǎn)而不是參考軌跡上的所有點(diǎn).另外,文獻(xiàn)[90]討論了輸入輸出約束的問(wèn)題.文獻(xiàn)[98]針對(duì)線性連續(xù)時(shí)間系統(tǒng)的多中間關(guān)鍵點(diǎn)的跟蹤問(wèn)題,提出了范數(shù)最優(yōu)迭代學(xué)習(xí)方法.
最優(yōu)迭代學(xué)習(xí)控制的研究中,還有一類(lèi)基于參數(shù)優(yōu)化的迭代學(xué)習(xí)控制(Parameter optimal iterative learning control,POILC)方法,由Owens等[99]首先提出,主要目的是為了在保證算法具有單調(diào)收斂性的前提下,減少每次迭代時(shí)的計(jì)算量.文獻(xiàn)[100]研究了系統(tǒng)輸入輸出矩陣的正定性與跟蹤誤差單調(diào)收斂的關(guān)系.文獻(xiàn)[101]提出了基于逆模型的魯棒POILC算法.文獻(xiàn)[102]研究了梯度下降的魯棒POILC算法.Owens[103]以多輸入多輸出線性系統(tǒng)為研究對(duì)象,將范數(shù)最優(yōu)和參數(shù)最優(yōu)迭代學(xué)習(xí)控制算法進(jìn)行了統(tǒng)一描述,提出了一種新的最優(yōu)迭代學(xué)習(xí)控制方法.
近年來(lái),高階迭代學(xué)習(xí)控制算法[104?106]也吸引了學(xué)者們的廣泛關(guān)注,可以利用更多以前操作的控制知識(shí),提高系統(tǒng)的控制性能.文獻(xiàn)[106]是文獻(xiàn)[99]參數(shù)優(yōu)化迭代學(xué)習(xí)控制的擴(kuò)展.如果系統(tǒng)是非正定的,可通過(guò)在算法中增加合適的基函數(shù),保證跟蹤誤差單調(diào)收斂為零.
由式(5)可以看出,基于超向量技術(shù)的范數(shù)最優(yōu)迭代學(xué)習(xí)控制的輸入輸出矩陣G的維數(shù)不僅跟間歇過(guò)程的變量相關(guān),還會(huì)隨著操作/批次長(zhǎng)度而急劇增長(zhǎng),因此控制算法(5)在長(zhǎng)時(shí)間區(qū)間內(nèi)的執(zhí)行和計(jì)算是非常耗時(shí)的,并且需要更多的存儲(chǔ)單元.因此,近年來(lái)一些學(xué)者[107?111]開(kāi)始研究基于Lifted描述的最優(yōu)迭代學(xué)習(xí)控制的高效計(jì)算問(wèn)題.文獻(xiàn)[112]提出了一種基于非Lifted描述的最優(yōu)迭代學(xué)習(xí)控制方法,在系統(tǒng)輸入輸出描述中不再使用超向量技術(shù),很大程度上降低了算法的計(jì)算復(fù)雜度.
如前所述,非線性系統(tǒng)的最優(yōu)迭代學(xué)習(xí)控制本質(zhì)上依賴(lài)于對(duì)非線性系統(tǒng)的線性化估計(jì)的顯性表達(dá).例如,賈立等[113]利用神經(jīng)模糊模型提出了間歇過(guò)程無(wú)約束迭代學(xué)習(xí)控制方法.李恒杰等[114]提出基于克隆選擇算法的非線性?xún)?yōu)化迭代學(xué)習(xí)控制.逄勃等[115]將擬Broyden法和參數(shù)優(yōu)化迭代學(xué)習(xí)控制方法結(jié)合,提出了單調(diào)收斂的迭代學(xué)習(xí)控制算法.
在實(shí)際控制應(yīng)用中,許多非線性系統(tǒng)模型,例如Hammerstein模型、雙線性模型等,都可以表示為如下輸入輸出的一般非線性遞歸形式:
其中yk(t)和uk(t)是系統(tǒng)的輸出和輸入;f(·)是未知的非線性函數(shù)且連續(xù)可微;ny和nu是兩個(gè)正整數(shù),分別表示系統(tǒng)輸出和輸入的階數(shù),不失一般性,假設(shè)nu<ny;t∈{0,···,N}表示離散時(shí)間,N是個(gè)正整數(shù)表示有限時(shí)間區(qū)間的終點(diǎn);k∈{0,1,···,∞}表示迭代次數(shù).
非線性系統(tǒng)的控制器設(shè)計(jì)和分析本質(zhì)上都是顯式或隱式地利用各種數(shù)學(xué)技巧,將非線性問(wèn)題轉(zhuǎn)化為線性或類(lèi)似線性的問(wèn)題來(lái)處理,數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)ILC的研究也不例外.因此,本節(jié)主要回顧非線性系統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)的迭代動(dòng)態(tài)線性化方法,以方便讀者閱讀,并為后續(xù)的數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)ILC的分析奠定基礎(chǔ).
在后面討論中,嚴(yán)格起見(jiàn),設(shè)對(duì)所有t<0,uk(t)=0且yk(t)=0.另外,系統(tǒng)(1)滿(mǎn)足如下兩個(gè)假設(shè).
假設(shè)1.系統(tǒng)的初始狀態(tài)yk(0)在所有迭代中固定不變,即yk(0)=c,?k∈Z+,其中c是個(gè)常數(shù).
假設(shè) 2.非線性函數(shù)f(·)滿(mǎn)足全局Lipschitz條件,即,
注1.假設(shè)1是迭代學(xué)習(xí)控制分析中常用的條件,意味著被控系統(tǒng)在每次運(yùn)行時(shí)都必須從相同位置開(kāi)始.
因?yàn)閠∈{0,···,N}是有限的離散時(shí)間區(qū)間,根據(jù)式(9),可以將非線性系統(tǒng)的輸出序列重新用初始狀態(tài)和系統(tǒng)輸入逐點(diǎn)描述如下[70?72]:
其中g(shù)i(·),i=0,···,N? 1是f(·)的復(fù)合函數(shù).
注 2.這里僅需要已知gi(·),i=0,···,N?1的存在性而不需要知道其精確表達(dá).只要f(·)存在,作為其對(duì)應(yīng)的復(fù)合函數(shù),gi(·)也一定存在.根據(jù)高等數(shù)學(xué)基礎(chǔ)知識(shí),可以知道gi(·)具有和非線性函數(shù)f(·)相同的性質(zhì),例如連續(xù)性、可微性、有界性等.
為描述簡(jiǎn)單,定義三個(gè)向量如下:
那么,考慮所有i=0,···,N?1的情況,由方程(10)可得如下輸入輸出的向量表達(dá)形式
根據(jù)注2,可將假設(shè)2稍微修改如下.
假設(shè)2′.非線性向量值函數(shù)g(·) 滿(mǎn)足全局 Lipschitz,即,
其中Lx<∞和Lu<∞是兩個(gè)正李普希茲常數(shù).
定理1.對(duì)一般非線性離散時(shí)間系統(tǒng)(1),在滿(mǎn)足假設(shè)1和2的條件下,一定存在一個(gè)系統(tǒng)非線性關(guān)于控制輸入的偏導(dǎo)數(shù)矩陣Φk,使得非線性系統(tǒng)(1)可轉(zhuǎn)化為如下迭代動(dòng)態(tài)線性形式,
定理1的證明參見(jiàn)文獻(xiàn)[76?78].
注3.迭代動(dòng)態(tài)線性化數(shù)據(jù)模型(12)與原未知非線性系統(tǒng)(9)在輸入輸出數(shù)據(jù)行為上是等價(jià)的、精確的,沒(méi)有省略任何高階項(xiàng).該迭代動(dòng)態(tài)線性化數(shù)據(jù)模型是隨工作點(diǎn)批次變化而變化的動(dòng)態(tài)模型而非靜態(tài)近似模型.該數(shù)據(jù)模型中不包含受控系統(tǒng)的數(shù)學(xué)模型、階數(shù)、時(shí)滯等先驗(yàn)知識(shí).由于系統(tǒng)的所有動(dòng)力學(xué)行為信息都隱含在系統(tǒng)的輸入輸出數(shù)據(jù)中,因此該數(shù)據(jù)模型中沒(méi)有傳統(tǒng)意義下的未建模動(dòng)態(tài).
注4.迭代動(dòng)態(tài)線性化模型(12)建立了重復(fù)動(dòng)態(tài)系統(tǒng)沿迭代軸方向的系統(tǒng)輸出變化和輸入變化之間的關(guān)系,而不是沿時(shí)間軸方向的變化關(guān)系.形式上,被控系統(tǒng)的時(shí)間動(dòng)態(tài)特性似乎是被忽略了,但其實(shí)質(zhì)上是包含在未知梯度信息Φk中.系統(tǒng)本身仍舊是沿時(shí)間軸運(yùn)行,時(shí)間動(dòng)態(tài)特性可很容易地由系統(tǒng)的實(shí)時(shí)狀態(tài)而反應(yīng).未知梯度參數(shù)Φk具有迭代-時(shí)間二維動(dòng)態(tài)特性,可利用測(cè)量的I/O數(shù)據(jù)進(jìn)行估計(jì).
注 5.迭代動(dòng)態(tài)線性化方法是數(shù)據(jù)驅(qū)動(dòng)的,不需要任何關(guān)于系統(tǒng)的模型信息,是直接面向控制系統(tǒng)設(shè)計(jì)的線性化方法.該動(dòng)態(tài)線性化方法獲得的數(shù)據(jù)模型具有模型簡(jiǎn)單、不丟失任何信息、包含參數(shù)少、具有增量形式等特點(diǎn),是目的于控制系統(tǒng)設(shè)計(jì)的數(shù)據(jù)模型,或稱(chēng)為控制器設(shè)計(jì)模型,而非機(jī)理模型.
注6.迭代動(dòng)態(tài)線性化數(shù)據(jù)模型形式簡(jiǎn)單,是一種梯度參數(shù)線性結(jié)構(gòu),因此很多基于模型的迭代學(xué)習(xí)控制的設(shè)計(jì)技術(shù)和分析工具都可以借鑒而提出各種新的數(shù)據(jù)驅(qū)動(dòng)迭代學(xué)習(xí)控制方法,例如可以采用自適應(yīng)技術(shù)或最優(yōu)技術(shù).
注7. 迭代動(dòng)態(tài)線性化是研究數(shù)據(jù)驅(qū)動(dòng)迭代學(xué)習(xí)控制理論的最重要工具之一.它提供了基于控制目的而研究系統(tǒng)閉環(huán)和開(kāi)環(huán)數(shù)據(jù)的一種新方法,可認(rèn)為是系統(tǒng)開(kāi)環(huán)和閉環(huán)中數(shù)據(jù)關(guān)系的一種建模,這對(duì)未來(lái)信息豐富的復(fù)雜系統(tǒng)的控制理論是至關(guān)重要的.
在工業(yè)實(shí)際應(yīng)用中,通常有三類(lèi)不同的控制任務(wù).第一類(lèi)控制任務(wù)是最普遍的跟蹤完整的參考軌跡的任務(wù),要求系統(tǒng)輸出必須跟蹤整個(gè)軌跡上的所有點(diǎn).第二類(lèi)任務(wù)是跟蹤多個(gè)中間參考點(diǎn),僅對(duì)指定時(shí)刻參考點(diǎn)處的跟蹤誤差有精度要求,而不是構(gòu)成完整參考軌跡的所有點(diǎn).第三類(lèi)任務(wù)的控制目標(biāo)僅僅是系統(tǒng)運(yùn)行終端的狀態(tài)或輸出,使其調(diào)節(jié)以達(dá)到期望值.在第二類(lèi)和第三類(lèi)控制任務(wù)中,有些控制背景中,非指定點(diǎn)處的系統(tǒng)狀態(tài)和輸出可能是不可測(cè)的.
對(duì)于第二類(lèi)控制任務(wù),有些學(xué)者專(zhuān)門(mén)提出了點(diǎn)到點(diǎn)迭代學(xué)習(xí)控制(PTPILC)方法[94?98],僅利用指定點(diǎn)處的輸出誤差信息對(duì)控制行為進(jìn)行迭代修正.文獻(xiàn)[16?18,94]則針對(duì)第三類(lèi)控制任務(wù)提出了終端迭代學(xué)習(xí)控制(TILC)策略,僅利用了系統(tǒng)運(yùn)行終點(diǎn)的終端輸出誤差.
需要注意的是,如果系統(tǒng)狀態(tài)和輸出在所有時(shí)刻點(diǎn)均可測(cè),則可以通過(guò)設(shè)計(jì)一條通過(guò)指定期望參考點(diǎn)的最優(yōu)軌跡,以此可將標(biāo)準(zhǔn)的迭代學(xué)習(xí)控制用于第二和第三類(lèi)控制任務(wù)中,使系統(tǒng)輸出跟蹤所設(shè)計(jì)的最優(yōu)參考軌跡.然而,問(wèn)題在于通過(guò)指定參考點(diǎn)的參考軌跡的設(shè)計(jì)非常困難,并且當(dāng)被控系統(tǒng)本身有所變化時(shí),很難保障所設(shè)計(jì)的參考軌跡仍舊是最優(yōu)的.
另外,PTPILC和TILC去除了不必要的參考點(diǎn)上的跟蹤性能約束限制,可獲得額外自由度提高控制性能,例如降低控制能量、加快收斂速度和減少存儲(chǔ)單元等.因此,PTPILC和TILC方法是面向?qū)嶋H應(yīng)用問(wèn)題提出的,具有重要的意義而不是傳統(tǒng)ILC方法的簡(jiǎn)單推廣.
文獻(xiàn)[77]針對(duì)一類(lèi)未知的非線性離散時(shí)間系統(tǒng),提出了數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)迭代學(xué)習(xí)控制(DDOILC)以及相應(yīng)的數(shù)據(jù)驅(qū)動(dòng)最優(yōu)點(diǎn)對(duì)點(diǎn)迭代學(xué)習(xí)控制(DDOPTPILC)和數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)終端迭代學(xué)習(xí)控制(DDOTILC)方法,具有完整的設(shè)計(jì)框架和分析方法,包括迭代動(dòng)態(tài)線性化、壓縮映射分析方法、梯度參數(shù)估計(jì)方法等.
本節(jié)主要以數(shù)據(jù)驅(qū)動(dòng)的迭代動(dòng)態(tài)線性化方法為基礎(chǔ),回顧了數(shù)據(jù)驅(qū)動(dòng)的廣義最優(yōu)迭代學(xué)習(xí)控制方法,包括軌跡跟蹤任務(wù)、多中間點(diǎn)跟蹤任務(wù)、單終端點(diǎn)跟蹤任務(wù),以方便讀者較為全面地理解這類(lèi)具有較完整理論基礎(chǔ)的學(xué)習(xí)控制系統(tǒng)的設(shè)計(jì)和分析過(guò)程.
針對(duì)完整軌跡跟蹤的控制任務(wù),文獻(xiàn)[77]利用最優(yōu)控制原理提出了一種數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)迭代學(xué)習(xí)控制(DDOILC)方法,由式(13)~(15)構(gòu)成,
其中λ>0,μ>0表示權(quán)重因子;ρ >0,η∈(0,2)表示步長(zhǎng)因子,其加入是為了使算法(13)和(15)更具有一般性且方便收斂性分析;0(t)表示(t)的初值;k(i)表示向量k(t)的第i個(gè)元素,i=0,1,···,t;ε是個(gè)非常小的正數(shù).
DDOILC方法的收斂性和穩(wěn)定性定理及證明參見(jiàn)文獻(xiàn)[77],并且該方法可很容易地推廣到多輸入多輸出系統(tǒng).
注8.重置算法(14)是用來(lái)增強(qiáng)參數(shù)估計(jì)算法(16)跟蹤迭代變化參數(shù)的能力.在選擇初值時(shí),要使與?k(t)所有元素的符號(hào)保持相同.
注9.學(xué)習(xí)控制律(15)的學(xué)習(xí)增益是迭代-時(shí)間變化的,只需要量測(cè)的I/O數(shù)據(jù)利用估計(jì)算法(13)和重置算法(14)獲得.
注10.與傳統(tǒng)的最優(yōu)ILC方法相比,DDOILC(13)~(15)稱(chēng)作是數(shù)據(jù)驅(qū)動(dòng)或基于數(shù)據(jù)的控制策略.控制器的設(shè)計(jì)和分析僅依賴(lài)于系統(tǒng)的I/O數(shù)據(jù),不需要已知任何被控對(duì)象的模型信息.但是,數(shù)據(jù)驅(qū)動(dòng)控制并不意味著要排斥基于模型的控制方法,二者應(yīng)該是相互補(bǔ)充和輔助的關(guān)系.如果已知被控系統(tǒng)的精確線性模型,基于模型的控制方法應(yīng)該是首選,可充分利用已知的模型信息而實(shí)現(xiàn)更好的控制效果.相反,數(shù)據(jù)驅(qū)動(dòng)的方法則不能利用已知的系統(tǒng)模型信息.文獻(xiàn)[77]用精確已知的線性模型作為仿真實(shí)例,證明了基于模型的NOILC控制性能要優(yōu)于DDOILC.
注11.盡管DDOILC方法不論是在學(xué)習(xí)控制器的形式上還是在基于壓縮映射方法的收斂性分析上,都與傳統(tǒng)的PID-型迭代學(xué)習(xí)控制極為相似,但是DDOILC的學(xué)習(xí)增益是迭代變化的且能利用所測(cè)量的實(shí)時(shí)I/O數(shù)據(jù)進(jìn)行迭代整定.因此,DDOILC在處理不確定性方面要優(yōu)于傳統(tǒng)的PID型ILC.
注12.DDOILC與傳統(tǒng)的最優(yōu)ILC也非常相似.二者都是基于最優(yōu)二次性能指標(biāo)而設(shè)計(jì)的,都可實(shí)現(xiàn)沿迭代方向的單調(diào)收斂性.然而,DDOILC是針對(duì)未知非線性系統(tǒng)提出的,而不是精確已知的線性系統(tǒng).因此,DDOILC是數(shù)據(jù)驅(qū)動(dòng)的方法,傳統(tǒng)的最優(yōu)ILC是基于模型的方法.
注13.由注11和注12中的分析可知,基于壓縮映射的PID型ILC和基于目標(biāo)函數(shù)的最優(yōu)ILC都可以被看作是DDOILC的特例,并且DDOILC在處理強(qiáng)非線性、高不確定性、迭代變化擾動(dòng)等問(wèn)題時(shí),可實(shí)現(xiàn)更好的控制性能.文獻(xiàn)[116]已通過(guò)仿真結(jié)果證實(shí),當(dāng)系統(tǒng)的模型擾動(dòng)較大時(shí),應(yīng)用基于模型的OILC方法,跟蹤誤差的收斂性將不再保證,甚至發(fā)散.而DDOILC方法在系統(tǒng)模型出現(xiàn)大的變化時(shí),仍能保障跟蹤誤差的收斂性.
對(duì)點(diǎn)到點(diǎn)跟蹤任務(wù),假設(shè)在系統(tǒng)運(yùn)行的有限時(shí)間區(qū)間{1,2,···,N}上,僅在指定點(diǎn){t1,t2,···,tM}處,要求系統(tǒng)輸出跟蹤期望值yd(t1),yd(t2),···,yd(tM).
在指定點(diǎn){t1,t2,···,tM}處,系統(tǒng)的輸出可重新表述為[77]:
其中m=1,···,M.
其中λ>0,μ>0表示權(quán)重因子;ρ>0,η∈(0,2)表示步長(zhǎng)因子;m=1,···,M;ε是個(gè)很小的正數(shù);的估計(jì);的初值;表示的第i個(gè)元素.
注 14.與 DDOILC(13)~(15)相比,DDOPTPILC(18)~(20)僅利用在指定時(shí)刻點(diǎn)的誤差信息,從而可用于系統(tǒng)輸出僅在指定時(shí)刻點(diǎn)可測(cè)的控制背景,并且由于去除了不必要點(diǎn)上的跟蹤性能約束,可一定程度上加快收斂速度、降低控制能量、減少存儲(chǔ)單元.這在文獻(xiàn)[77]仿真中已經(jīng)得到驗(yàn)證.
終端迭代學(xué)習(xí)控制的目標(biāo)是系統(tǒng)運(yùn)行終端的狀態(tài)或終端輸出,而不是跟蹤整個(gè)軌跡.換句話說(shuō),尋找合適的控制輸入序列使得系統(tǒng)的終端輸出yk(N)在系統(tǒng)運(yùn)行終點(diǎn)跟蹤期望值yd,當(dāng)?shù)螖?shù)k趨于無(wú)窮時(shí),終端跟蹤誤差ek(N)=yd?yk(N)收斂于0.
系統(tǒng)運(yùn)行終點(diǎn)的終端輸出可重新表示為[76?77],
其中yk(N)表示系統(tǒng)在迭代運(yùn)行終點(diǎn)的輸出.
類(lèi)似地,終端迭代動(dòng)態(tài)線性化形式為[76?77]對(duì)于單個(gè)點(diǎn)的終端跟蹤任務(wù),文獻(xiàn)[77]給出了一種數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)終端迭代學(xué)習(xí)控制(DDOTILC)方法:
其中λ>0,μ>0表示權(quán)重因子;ρ>0,η∈(0,2)表示步長(zhǎng)因子;ε是個(gè)很小的正常數(shù);0(N?1)表示k(N?1)的初始估計(jì)值.
注15.DDOTILC(23)~(25)算法中僅利用了系統(tǒng)運(yùn)行終點(diǎn)的終端輸出跟蹤誤差,去掉了在其他點(diǎn)上不必要的限制,從而可提高控制性能.如文獻(xiàn)[77]所示,不論在收斂速度、控制能量和收斂精度上都優(yōu)于DDOILC方法.
DDOILC方法應(yīng)用中遇到的一些重要問(wèn)題,如隨機(jī)初始條件、高階控制律、控制性能的增強(qiáng)、迭代變化參考軌跡等,也在最近的一些文獻(xiàn)中進(jìn)行了充分研究.
在實(shí)際間歇過(guò)程的應(yīng)用中,產(chǎn)品的質(zhì)量要求會(huì)根據(jù)市場(chǎng)、用戶(hù)等需求而作調(diào)整,因此期望軌跡并不是在所有操作中都保持相同.文獻(xiàn)[117]首先考慮了隨迭代變化的期望參考點(diǎn),提出了數(shù)據(jù)驅(qū)動(dòng)的自適應(yīng)最優(yōu)終端ILC方法,但跟蹤誤差的收斂性分析仍舊依賴(lài)于相同初始條件的假設(shè).由于定位精度、量測(cè)精度以及狀態(tài)擾動(dòng)等原因,相同初始條件在實(shí)際中很難滿(mǎn)足,很大程度上阻礙了DDOILC的應(yīng)用.因此,文獻(xiàn)[118?119]和文獻(xiàn)[120]分別用神經(jīng)網(wǎng)絡(luò)和高階內(nèi)模來(lái)近似逼近隨機(jī)迭代變化的初始條件對(duì)系統(tǒng)運(yùn)行終端輸出的影響,并用于控制器設(shè)計(jì)作為補(bǔ)償,其中期望軌跡和初始狀態(tài)都是隨迭代次數(shù)變化的.文獻(xiàn)[121]則直接將隨機(jī)初始狀態(tài)作為未知參數(shù)進(jìn)行迭代估計(jì),得到了跟蹤誤差的有界收斂性.
文獻(xiàn)[78]針對(duì)終端迭代學(xué)習(xí)控制任務(wù),研究了當(dāng)系統(tǒng)狀態(tài)額輸出在終端點(diǎn)以外的時(shí)刻點(diǎn)均不可測(cè)時(shí),如何利用更多的控制信息來(lái)提高控制性能,提出了增強(qiáng)的數(shù)據(jù)驅(qū)動(dòng)終端迭代學(xué)習(xí)控制方法.高階迭代學(xué)習(xí)控制律因?yàn)槟軌蚶酶嘁郧安僮髦蝎@得的控制信息實(shí)現(xiàn)更好的控制性能也受到了重視.文獻(xiàn)[122?123]通過(guò)改進(jìn)控制性能指標(biāo)函數(shù),提出了高階的數(shù)據(jù)驅(qū)動(dòng)最優(yōu)迭代學(xué)習(xí)控制方法.
關(guān)于實(shí)際工程應(yīng)用中經(jīng)常遇到的輸入輸出受限問(wèn)題以及計(jì)算復(fù)雜度問(wèn)題,也已在最近的工作中進(jìn)行了研究,提出了相應(yīng)的解決方案[116].
DDOILC方法已進(jìn)行了廣泛的實(shí)驗(yàn)驗(yàn)證和仿真分析,說(shuō)明了這些方法的有效性,例如化學(xué)間歇過(guò)程[76?78,121?123]、快速路交通系統(tǒng)[124?126]、自動(dòng)列車(chē)停車(chē)控制[127]等.數(shù)據(jù)驅(qū)動(dòng)的迭代學(xué)習(xí)控制將成為以間歇過(guò)程為主的、越來(lái)越復(fù)雜、規(guī)模越來(lái)越大的執(zhí)行重復(fù)生產(chǎn)的工業(yè)控制的主要方法,有著廣泛的理論研究前景和潛在的應(yīng)用價(jià)值.
目前,數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)控制策略的設(shè)計(jì)和分析引起了國(guó)內(nèi)外學(xué)者的關(guān)注.文獻(xiàn)[128?129]針對(duì)線性時(shí)不變系統(tǒng),借助于有限脈沖響應(yīng)濾波技術(shù),提出了一種數(shù)據(jù)驅(qū)動(dòng)的迭代學(xué)習(xí)控制方法,系統(tǒng)的脈沖響應(yīng)模型可由以前迭代運(yùn)行獲得的輸入輸出數(shù)據(jù)進(jìn)行估計(jì).系統(tǒng)的控制性能主要依賴(lài)于脈沖響應(yīng)模型的估計(jì)精度.如果要嚴(yán)格地保證脈沖響應(yīng)模型的估計(jì)值等于系統(tǒng)輸出的真實(shí)值,要求被控系統(tǒng)是線性時(shí)不變的,且沒(méi)有量測(cè)噪聲和其他干擾存在.
文獻(xiàn)[130?131]利用迭代學(xué)習(xí)控制的優(yōu)點(diǎn),提出了基于實(shí)驗(yàn)隨機(jī)搜索算法的無(wú)模型數(shù)據(jù)驅(qū)動(dòng)迭代參考輸入整定方法,并且考慮了系統(tǒng)的輸入輸出受限情況,但是控制器的設(shè)計(jì)和分析也是基于線性時(shí)不變系統(tǒng)而提出的,所采用的也是迭代反饋整定的策略.
文獻(xiàn)[64]提出了受限非線性系統(tǒng)的模最優(yōu)ILC的一般形式,模型校正可顯性地估計(jì),性能指標(biāo)函數(shù)采用直接最優(yōu)控制方法進(jìn)行最小化,由此得到非線性規(guī)劃問(wèn)題并給出了該問(wèn)題的有效求解策略.需要說(shuō)明的是,控制器的設(shè)計(jì)和分析是基于非線性系統(tǒng)的線性估計(jì)模型進(jìn)行的.
文獻(xiàn)[132]研究了重復(fù)脈沖噪聲的主動(dòng)控制方法,基于快速傅里葉變換,提出了未知或時(shí)變次級(jí)路徑信號(hào)噪聲主動(dòng)抑制系統(tǒng)的無(wú)模型迭代學(xué)習(xí)控制算法.與基于模型的方法不同,控制器的設(shè)計(jì)僅依賴(lài)于輸入輸出數(shù)據(jù)而不需要系統(tǒng)模型的知識(shí).
文獻(xiàn)[133]提出了雙迭代Q-學(xué)習(xí)算法,其中內(nèi)部迭代可以最小化每個(gè)周期的總的功率負(fù)載指標(biāo);外部迭代可以使Q函數(shù)迭代地收斂到最優(yōu)值.
文獻(xiàn)[134]在研究混雜控制系統(tǒng)結(jié)構(gòu)時(shí),提出了多輸入多輸出系統(tǒng)的最優(yōu)行為預(yù)測(cè)機(jī)制,給出了一種數(shù)據(jù)驅(qū)動(dòng)無(wú)模型迭代學(xué)習(xí)控制方法,其中閉環(huán)反饋控制器采用虛擬參考整定(Virtual reference feedback tuning,VRFT)方法設(shè)計(jì),期望的新軌跡可被逼近且最優(yōu)參考輸入可被重置.
本文簡(jiǎn)要回顧了間歇過(guò)程的最優(yōu)迭代學(xué)習(xí)控制方法,包括基于模型的最優(yōu)迭代學(xué)習(xí)控制和數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)迭代學(xué)習(xí)控制,目的在于借鑒前者研究和分析中常用的方法,找到后者研究中可突破的途徑.數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)迭代學(xué)習(xí)控制的關(guān)鍵是迭代動(dòng)態(tài)線性化,因此詳細(xì)討論了迭代動(dòng)態(tài)線性化的特征和對(duì)應(yīng)控制器的設(shè)計(jì).
迭代動(dòng)態(tài)線性化方法僅依賴(lài)于被控系統(tǒng)的I/O數(shù)據(jù),因此,在迭代動(dòng)態(tài)線性化過(guò)程中,沒(méi)有建模誤差,也沒(méi)有未建模動(dòng)態(tài),所產(chǎn)生的迭代動(dòng)態(tài)線性化數(shù)據(jù)模型是完全等價(jià)于原非線性系統(tǒng)的,使得在基于模型的控制方法中廣泛存在的未建模動(dòng)態(tài)和系統(tǒng)魯棒性這一矛盾體不再存在.
傳統(tǒng)的近似線性化方法或精確線性化在實(shí)際中很難實(shí)現(xiàn).相反,迭代動(dòng)態(tài)線性化僅依賴(lài)系統(tǒng)的I/O數(shù)據(jù)即可得到,且數(shù)據(jù)模型本身是可根據(jù)實(shí)時(shí)I/O數(shù)據(jù)進(jìn)行估計(jì)和更新的.因此,等價(jià)的迭代動(dòng)態(tài)線性化是DDOILC方法的基礎(chǔ),將成為新的分析非線性重復(fù)系統(tǒng)的重要工具.
數(shù)據(jù)驅(qū)動(dòng)最優(yōu)迭代學(xué)習(xí)控制或者數(shù)據(jù)驅(qū)動(dòng)控制[135]方法的目標(biāo)是直接利用過(guò)程數(shù)據(jù)或由數(shù)據(jù)中獲取的知識(shí)來(lái)設(shè)計(jì)控制器,去除基于模型的最優(yōu)迭代學(xué)習(xí)控制或基于模型的控制方法中極具挑戰(zhàn)性的問(wèn)題,例如,建模困難性、未建模動(dòng)態(tài)和魯棒性,最終減小或消除基于模型的控制方法與實(shí)際應(yīng)用之間存在的鴻溝.需要強(qiáng)調(diào)的是,數(shù)據(jù)驅(qū)動(dòng)控制方法并不意味著要排除基于模型的控制方法.相反,如果存在被控對(duì)象的可靠的精確線性模型,基于模型的方法則是首選.
基于模型的最優(yōu)迭代學(xué)習(xí)控制的研究已經(jīng)非常成熟,具有系統(tǒng)的理論分析方法.相反,數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)迭代學(xué)習(xí)控制主要是針對(duì)不能或難以獲得被控系統(tǒng)模型的控制系統(tǒng)的設(shè)計(jì)方法,其研究還處于起始階段.為了數(shù)據(jù)驅(qū)動(dòng)最優(yōu)迭代學(xué)習(xí)控制的健康發(fā)展,還需要大量的研究工作和努力,并且這些工作也將是極具挑戰(zhàn)性的.
從典型控制系統(tǒng)設(shè)計(jì)方法的本質(zhì)上講,非線性系統(tǒng)的最優(yōu)迭代學(xué)習(xí)控制設(shè)計(jì)也是利用某些數(shù)學(xué)分析的技巧千方百計(jì)地利用系統(tǒng)數(shù)學(xué)模型結(jié)構(gòu)和形式將其受控系統(tǒng)的控制輸入變量顯式地表述出來(lái),這個(gè)過(guò)程本質(zhì)上就是對(duì)控制輸入的線性化,即,基于模型的最優(yōu)迭代學(xué)習(xí)控制方法本質(zhì)上也是某種線性化的方法.從這個(gè)觀點(diǎn)上看,數(shù)據(jù)驅(qū)動(dòng)的與基于模型的最優(yōu)迭代學(xué)習(xí)控制的研究和設(shè)計(jì)思路在本質(zhì)上是一樣的,只是數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)迭代學(xué)習(xí)控制的研究起始于未知非線性重復(fù)系統(tǒng)的迭代動(dòng)態(tài)線性化方法.因此,在今后工作中可借鑒更多基于模型的最優(yōu)迭代學(xué)習(xí)控制的設(shè)計(jì)方法和分析工具,以處理工業(yè)應(yīng)用中遇到的更多實(shí)際問(wèn)題,如隨機(jī)不確定性、分布式系統(tǒng)、協(xié)同問(wèn)題等.
因?yàn)閿?shù)據(jù)驅(qū)動(dòng)的最優(yōu)迭代學(xué)習(xí)控制理論是直接從I/O數(shù)據(jù)到控制器的,沒(méi)有基于機(jī)理或系統(tǒng)辨識(shí)的建模過(guò)程,因此,與基于模型的方法不同,其穩(wěn)定性、收斂性和魯棒性分析應(yīng)該也是直接基于I/O數(shù)據(jù)的.實(shí)質(zhì)上,數(shù)據(jù)驅(qū)動(dòng)框架下的魯棒性就是研究系統(tǒng)采樣、系統(tǒng)數(shù)據(jù)測(cè)量噪聲、數(shù)據(jù)處理以及數(shù)據(jù)在傳輸過(guò)程中的丟包、亂碼、延時(shí)等對(duì)已設(shè)計(jì)的數(shù)據(jù)驅(qū)動(dòng)控制系統(tǒng)所具有性質(zhì)的保持程度和影響.大數(shù)據(jù)環(huán)境下,比較有前景的系統(tǒng)穩(wěn)定性、收斂性、魯棒性的分析方法可能是基于數(shù)據(jù)能量有界及壓縮映射的方法.
在線和離線數(shù)據(jù)都包含了大量有價(jià)值的系統(tǒng)動(dòng)力學(xué)知識(shí)以及系統(tǒng)運(yùn)行規(guī)律和模式.因此,探討如何利用系統(tǒng)的I/O數(shù)據(jù)和系統(tǒng)規(guī)律進(jìn)行數(shù)據(jù)驅(qū)動(dòng)最優(yōu)迭代學(xué)習(xí)控制的設(shè)計(jì)具有重要意義.所以,面向控制的有效數(shù)據(jù)處理方法將是非常有前景和重要的研究方向之一.
每個(gè)控制方法,不管是基于模型的還是數(shù)據(jù)驅(qū)動(dòng)的,都具有他們各自的優(yōu)勢(shì)和劣勢(shì),不能被其他方法完全取代.最直接有效的方法就是讓不同的控制方法按照互補(bǔ)的方式一起工作,取長(zhǎng)補(bǔ)短.當(dāng)被控對(duì)象機(jī)理模型模型較為清楚,且適合于設(shè)計(jì)控制器時(shí),顯然基于模型的最優(yōu)ILC方法的控制性能、可靠性等性質(zhì)都是占優(yōu)的.相反,如果被控對(duì)象的機(jī)理模型存在很大不確定性,且對(duì)外界的擾動(dòng)等因素變化較為敏感,那么基于數(shù)據(jù)驅(qū)動(dòng)的最優(yōu)ILC方法則更為適合.因此,如何定量地描述基于模型的控制策略對(duì)系統(tǒng)外界不確定性的抑制程度,如何確定基于模型的控制策略和數(shù)據(jù)驅(qū)動(dòng)的控制策略之間相互切換的有效機(jī)制,實(shí)現(xiàn)控制系統(tǒng)的可靠性和控制精度等全方面的改進(jìn),也將是今后研究的熱點(diǎn)方向和挑戰(zhàn)性問(wèn)題.
1 Bonvin D.Control and optimization of batch processes.IEEE Control Systems,2006,26(6):34?45
2 Tomazi K,Linninger A A,Daniel J R.Batch processing industries.Batch Processes.Boca Raton,FL:CRC Press,2006.7?39
3 Tchobanoglous G,Burton F G,Stensel H D.Wastewater Engineering:Treatment and Reuse.New York:McGraw-Hill,2003.
4 Young R A,Akhtar M.Environmentally Friendly Technologies for the Pulp and Paper Industry.New York:Wiley,1998.
5 Mazurek J,Ashford N A.Making Microchips:Policy,Globalization,and Economic Restructuring in the Semiconductor Industry.Cambridge,MA:MIT Press,1998.
6 McCormick K.Manufacturing in Global Pharmaceutical Industry.London:Urch,2003.
7 Myerson A S.Handbook of Industrial Crystallization.London,UK:Butterworths-Heinemann,2001.
8 Seborg D E,Edgar T F,Mellichamp D A.Process Dynamics and Control.New York:Wiley,2004.
9 Nagy Z K,Braatz R D.Robust nonlinear model predictive control of batch processes.AIChE Journal,2003,49(7):1776?1786
10 Moore K L.Iterative Learning Control for Deterministic Systems.London,UK:Springer-Verlag,1993.
11 Sun Hai-Qiao.Research on robust iterative learning control applied to batch process[Master dissertation],Jiangnan University,China,2014.(孫海喬.間歇過(guò)程的魯棒迭代學(xué)習(xí)控制研究[碩士學(xué)位論文],江南大學(xué),中國(guó),2014.)
12 Wang Jing,Wang Yue,Wang Wei,Cao Liu-Lin,Jin Qi-Bing.Adaptive iterative learning control based on unfalsified strategy applied in batch process.Journal of Central South University(Science and Technology),2015,46(4):1318?1325(王晶,王玥,王偉,曹柳林,靳其兵.基于去偽策略的間歇過(guò)程自適應(yīng)迭代學(xué)習(xí).中南大學(xué)學(xué)報(bào) (自然科學(xué)版),2015,46(4):1318?1325)
13 Fran?cois G,Srinivasan B,Bonvin D.Use of measurements for enforcing the necessary conditions of optimality in the presence of constraints and uncertainty.Journal of Process Control,2005,15(6):701?712
14 Del Castillo E,Hurwitz A M.Run-to-run process control:literature review and extensions.Journal of Quality Technology,1997,29(2):184?196
15 Sachs E,Guo R S,Ha S,Hu A.Process control system for VLSI fabrication.IEEE Transactions on Semiconductor Manufacturing,1991,4(2):134?144
16 Xu J X,Chen Y Q,Lee T H,Yamamoto S.Terminal iterative learning control with an application to RTPCVD thickness control.Automatica,1999,35(9):1535?1542
17 Flores-Cerrillo J,MacGregor J F.Iterative learning control for final batch product quality using partial least squares models.Industrial&Engineering Chemistry Research,2005,44(24):9146?9155
18 Gauthier G,Boulet B.Terminal iterative learning control design with singular value decomposition decoupling for thermoforming ovens.In:Proceedings of the 2009 American Control Conference.St.Louis,MO,USA:IEEE,2009.1640?1645
19 Arimoto S,Kawamura S,Miyazaki F.Bettering operation of robots by learning.Journal of Robotic Systems,1984,1(2):123?140
20 Lee K S,Bang S H,Chang K S.Feedback-assisted iterative learning control based on an inverse process model.Journal of Process Control,1994,4(2):77?89
21 Lee K S,Bang S H,Yi S,Son J S,Yoon S C.Iterative learning control of heat-up phase for a batch polymerization reactor.Journal of Process Control,1996,6(4):255?262
22 Liu T,Gao F R.Robust two-dimensional iterative learning control for batch processes with state delay and time-varying uncertainties.Chemical Engineering Science,2010,65(23):6134?6144
23 Wang Y Q,Liu T,Zhao Z.Advanced PI control with simple learning set-point design:application on batch processes and robust stability analysis.Chemical Engineering Science,2012,71:153?165
24 Wang Y Q,Zisser H,Dassau E,Jovanovic L,Doyle III F J.Model predictive control with learning-type set-point:application to arti ficial pancreaticβ-cell.AIChE Journal,2010,56(6):1510?1518
25 Liu T,Wang X Z,Chen J H.Robust PID based indirecttype iterative learning control for batch processes with timevarying uncertainties.Journal of Process Control,2014,24(12):95?106
26 Márquez-Vera M A,Ramos-Velasco L E,Suárez-Cansino,Márquez-Vera C A.Fuzzy iterative learning control applied in a biological reactor using a reduced number of measures.Applied Mathematics and Computation,2014,246:608?618
27 Gao F R,Yang Y,Shao C.Robust iterative learning control with applications to injection molding process.Chemical Engineering Science,2001,56(24):7025?7034
28 Shi J,Gao F R,Wu T J.Robust design of integrated feedback and iterative learning control of a batch process based on a 2D Roesser system.Journal of Process Control,2005,15(8):907?924
29 Shi J,Gao F R,Wu T J.Integrated design and structure analysis of robust iterative learning control system based on a two-dimensional model.Industrial&Engineering Chemistry Research,2005,44(21):8095?8105
30 Shi J,Gao F R,Wu T J.A robust iterative learning control design for batch processes with uncertain perturbation and initialization.AIChE Journal,2006,52(6):2171?2187
31 Hao S L,Liu T,Paszke W,Galkowski K.Robust iterative learning control for batch processes with input delay subject to time-varying uncertainties.IET Control Theory&Applications,2016,10(15):1904?1915
32 Tan K K,Zhao S,Huang S N,Lee T H,Tay A.A new repetitive control for LTI systems with input delay.Journal of Process Control,2009,19(4):711?716
33 Xu J X,Xu J.On iterative learning from different tracking tasks in the presence of time-varying uncertainties.IEEE Transactions on Systems,Man,and Cybernetics,Part B,Cybernetics,2004,34(1):589?597
34 Sun M X,He X X.Iterative learning identi fication and control of discrete time-varying systems.In:Proceedings of the 2017 Chinese Control Conference.Zhangjiajie,Hunan,China:IEEE,2017.520?524
35 Chi R H,Hou Z S,Xu J X.Adaptive ILC for a class of discrete-time systems with iteration-varying trajectory and random initial condition.Automatica,2008,44(8):2207?2213
36 Tayebi A.Adaptive iterative learning control for robot manipulators.Automatica,2004,40(7):1195?1203
37 Sun M X,Ge S S.Adaptive repetitive control for a class of nonlinearly parametrized systems.IEEE Transactions on Automatic Control,2006,51(10):1684?1688
38 Li X D,Xiao T F,Zheng H X.Adaptive discrete-time iterative learning control for non-linear multiple input multiple output systems with iteration-varying initial error and reference trajectory.IET Control Theory&Applications,2011,5(9):1131?1139
39 Yan W L,Sun M X.adaptive iterative learning control of discrete-time varying systems with unknown control directions.International Journal of Adaptive Control and Signal Processing,2013,27(4):340?348
40 Chi R H,Hou Z S,Jin S T.A data-driven adaptive ILC for a class of nonlinear discrete-time systems with random initial states and iteration-varying target trajectory.Journal of the Franklin Institute,2015,352(6):2407?2424
41 Amann N,Owens D H,Rogers E.Iterative learning control for discrete-time systems with exponential rate of convergence.IEE Proceedings-Control Theory and Applications,1996,143(2):217?224
42 Lee J H,Lee K S,Kim W C.Model-based iterative learning control with a quadratic criterion for time-varying linear systems.Automatica,2000,36(5):641?657
43 Moore K L,Verwoerd M H A.l1-optimal robust iterative learning controller design.In:Proceedings of the 2008 American Control Conference.Seattle,WA,USA:IEEE,2008.3881?3886
44 Xu J X,Tan Y.Robust optimal design and convergence properties analysis of iterative learning control approaches.Automatica,2002,38(11):1867?1880
45 Sanzida N,Nagy Z K.Iterative learning control for the systematic design of supersaturation controlled batch cooling crystallisation processes.Computers&Chemical Engineering,2013,59:111?121
46 Axelsson P,Karlsson R,Norrlf M.Estimation-based normoptimal iterative learning control.Systems&Control Letters,2014,73:76?80
47 Nguyen D H,Banjerdpongchai D.An LMI approach for robust iterative learning control with quadratic performance criterion.Journal of Process Control,2009,19(6):1054?1060
48 Lim I,Barton K L.Pareto iterative learning control:optimized control for multiple performance objectives.Control Engineering Practice,2014,26(1):125?135
49 Chu B,Owens D H.Accelerated norm-optimal iterative learning control algorithms using successive projection.International Journal of Control,2009,82(8):1469?1484
50 Tousain R,van der Meche E,Bosgra O.Design strategy for iterative learning control based on optimal control.In:Proceedings of the 40th IEEE Conference on Decision and Control.Orlando,FL,USA:IEEE,2001,5:4463?4468
51 Liu Shan,Wu Tie-Jun.Iterative learning control based on optimization criterion.In:Proceedings of the 4th World Congress on Intelligent Control and Automation.Shanghai,China,2002.621?625(劉山,吳鐵軍.基于最優(yōu)化指標(biāo)的迭代學(xué)習(xí)控制.第四屆全球智能控制與自動(dòng)化大會(huì)(WCICA002).上海,2002.621?625)
52 Chen C,Xiong Z H,Zhong Y S.Design and analysis of integrated predictive iterative learning control for batch process based on two-dimensional system theory.Chinese Journal of Chemical Engineering,2014,22(7):762?768
53 Mishra S,Topcu U,Tomizuka M.Optimization-based constrained iterative learning control.IEEE Transactions on Control Systems Technology,2011,19(6):1613?1621
54 Amann N,Owens D H,Rogers E.Predictive optimal iterative learning control.International Journal of Control,1998,69(2):203?226
55 Lee K S,Chin I S,Lee H J,Lee J H.Model predictive control technique combined with iterative learning for batch processes.AIChE Journal,1999,45(10):2175?2187
56 Wang L P,Freeman C T,Chai S,Rogers E.Predictiverepetitive control with constraints: from design to implementation.Journal of Process Control,2013,23(7):956?967
57 Jin S T,Hou Z S,Chi R H.A novel data-driven terminal iterative learning control with iteration prediction algorithm for a class of discrete-time nonlinear systems.Journal of Applied Mathematics,2014,2014:Article No.307809
58 Chin I,Qin S J,Lee K S,Cho M.A two-stage iterative learning control technique combined with real-time feedback for independent disturbance rejection.Automatica,2004,40(11):1913?1922
59 Slotine J J E,Li W P.Applied Nonlinear Control.Englewood Cliffs,NJ,USA:Prentice Hall,1991.
60 Chen L J,Narendra K S.Identi fication and control of a nonlinear discrete-time system based on its linearization:a uni fied framework.IEEE Transactions on Neural Networks,2004,15(3):663?673
61 Xi Yu-Geng,Wang Fan.Nonlinear multi-model predictive control.Acta Automatica Sinica,1996,22(4):456?461(席裕庚,王凡,非線性系統(tǒng)預(yù)測(cè)控制的多模型方法,自動(dòng)化學(xué)報(bào),1996,22(4):456?461)
62 Deng H,Li H X,Wu Y H.Feedback-linearization-based neural adaptive control for unknown nonaffine nonlinear discrete-time systems.IEEE Transactions on Neural Networks,2008,19(9):1615?1625
63 Dumont G A,Fu Y.Non-linear adaptive control via laguerre expansion of volterra kernels.International Journal of Adaptive Control and Signal Processing,1993,7(5):367?382
64 Volckaert M,Diehl M,Swevers J.Generalization of norm optimal ILC for nonlinear systems with constraints.Mechanical Systems and Signal Processing,2013,39(1?2):280?296
65 Yan Qiu-Zhen,Sun Ming-Xuan.Suboptimal learning control for nonlinear systems with both parametric and nonparametric uncertainties.Acta Automatica Sinica,2015,41(9):1659?1668(嚴(yán)求真,孫明軒.非線性不確定系統(tǒng)準(zhǔn)最優(yōu)學(xué)習(xí)控制.自動(dòng)化學(xué)報(bào),2015,41(9):1659?1668)
66 Endelt B.Design strategy for optimal iterative learning control applied on a deep drawing process.The International Journal of Advanced Manufacturing Technology,2017,88(1):3?18
67 Wang D G,Song W Y,Shi P,Li H X.Approximation to a class of non-autonomous systems by dynamic fuzzy inference marginal linearization method.Information Sciences,2013,245:197?217
68 Xiong Z H,Zhang J.A batch-to-batch iterative optimal control strategy based on recurrent neural network models.Journal of Process Control,2005,15(1):11?21
69 Liu X J,Kong X B.Nonlinear fuzzy model predictive iterative learning control for drum-type boiler-turbine system.Journal of Process Control,2013,23(8):1023?1040
70 Hou Zhong-Sheng,Xu Jian-Xin.On data-driven control theory:the state of the art and perspective.Acta Automatica Sinica,2009,35(6):650?667(侯忠生,許建新.數(shù)據(jù)驅(qū)動(dòng)控制理論及方法的回顧和展望.自動(dòng)化學(xué)報(bào),2009,35(6):650?667)
71 Hou Z S,Jin S T.Model Free Adaptive Control:Theory and Applications.New York:CRC Press,2013.
72 Hou Zhong-Sheng.Highlight and perspective on model free adaptive control.Journal of Systems Science and Mathematical Sciences,2014,34(10):1182?1191(侯忠生.再論無(wú)模型自適應(yīng)控制.系統(tǒng)科學(xué)與數(shù)學(xué),2014,34(10):1182?1191)
73 Hou Z S,Wang Z.From model-based control to data-driven control:survey,classi fication and perspective.Information Sciences,2013,235:3?35
74 Yin S,Li X W,Gao H J,Kaynak O.Data-based techniques focused on modern industry:an overview.IEEE Transactions on Industrial Electronics,2015,62(1):657?667
75 Xu J X,Hou Z S.Notes on data-driven system approaches.Acta Automatica Sinica,2009,35(6):668?675
76 Chi R H,Wang D W,Hou Z S,Jin S T.Data-driven optimal terminal iterative learning control.Journal of Process Control,2012,22(10):2026?2037
77 Chi R H,Hou Z S,Huang B,Jin S T.A uni fied data-driven design framework of optimality-based generalized iterative learning control.Computers&Chemical Engineering,2015,77:10?23
78 Chi R H,Hou Z S,Jin S T,Wang D W,Chien C J.Enhanced data-driven optimal terminal ILC using current iteration control knowledge.IEEE Transactions on Neural Networks and Learning Systems,2015,26(11):2939?2948
79 Roman R C,Radac M B,Precup R E,Petriu E M.Datadriven model-free adaptive control tuned by virtual reference feedback tuning.Acta Polytechnica Hungarica,2016,13(1):83?96
80 Hou Z S,Liu S D,Tian T T.Lazy-learning-based datadriven model-free adaptive predictive control for a class ofdiscrete-timenonlinearsystems.IEEETransactions on Neural Networks and Learning Systems,2016,doi:10.1109/TNNLS.2016.2561702,to be published.
81 Hou Z S,Xu J X,Yan J W.An iterative learning approach for density control of freeway traffic flow via ramp metering.Transportation Research,Part C:Emerging Technologies,2008,16(1):71?97
82 Hou Z S,Xu J X,Zhong H W.Freeway traffic control using iterative learning control-based ramp metering and speed signaling.IEEE Transactions on Vehicular Technology,2007,56(2):466?477
83 Togai M,Yamano O.Analysis and design of an optimal learning control scheme for industrial robots:a discrete system approach.In:Proceedings of the 24th IEEE Conference on Decision and Control.Fort Lauderdale,FL,USA:IEEE,1985.1399?1404
84 Tao K M,Kosut R L,Aral G.Learning feedforward control.In:Proceedings of the 1994 American Control Conference.Baltimore,MD,USA:IEEE,1994,3:2575?2579
85 Gorinevsky D M.Direct learning of feedforward control for manipulator path tracking.In:Proceedings of the 1992 IEEE International Symposium on Intelligent Control.Glasgow,UK:IEEE,1992.42?47
86 Lee K S,Kim W C,Lee J H.Model-based iterative learning control with quadratic criterion for linear batch processes.Journal of Control Automation Systems Engineering,1996,2(3):148?157
87 Barton K L,Alleyne A G.A norm optimal approach to time-varying ILC with application to a multi-axis robotic testbed.IEEE Transactions on Control Systems Technology,2011,19(1):166?180
88 van de Wijdeven J,Donkers T,Bosgra O.Iterative learning control for uncertain systems:robust monotonic convergence analysis.Automatica,2009,45(10):2383?2391
89 Lee K S,Lee J H.Constrained model-based predictive control combined with iterative learning for batch or repetitive processes.In:Proceedings of the 2nd Asian Control Conference.Seoul,Korea:1997.33?36
90 Lee J H,Morari M,Garcia C E.State space interpretation of model predictive control.Automatica,1994,30(4):707?717
91 Oh S K,Lee J M.Iterative learning model predictive control for constrained multivariable control of batch processes.Computers&Chemical Engineering,2016,93:284?292
92 Cao Z X,Lu J Y,Zhang R D,Gao F R.Iterative learning Kalman filter for repetitive processes.Journal of Process Control,2016,46:92?104
93 Liu T,Wang Y Q.A synthetic approach for robust constrained iterative learning control of piecewise affine batch processes.Automatica,2012,48(11):2762?2775
94 Son T D,Ahn H S.Terminal iterative learning control with multiple intermediate pass points.In:Proceedings of the 2011 American Control Conference.San Francisco,CA,USA:IEEE,2011.3651?3656
95 Freeman C T,Cai Z L,Rogers E,Lewin P L.Iterative learning control for multiple point-to-point tracking application.IEEE Transactions on Control Systems Technology,2011,19(3):590?600
96 Freeman C T.Constrained point-to-point iterative learning control with experimental veri fication.Control Engineering Practice,2012,20(5):489?498
97 Son T D,Ahn H S,Moore K L.Iterative learning control in optimal tracking problems with speci fied data points.Automatica,2013,49(5):1465?1472
98 Owens D H,Freeman C T,Van Dinh T.Norm-optimal iterative learning control with intermediate point weighting:theory,algorithms,and experimental evaluation.IEEE Transactions on Control Systems Technology,2013,21(3):999?1007
99 Owens D H,Feng K.Parameter optimization in iterative learning control.International Journal of Control,2003,76(11):1059?1069
101 Harte T J,Htnen J,Owens D H.Discrete-time inverse model-based iterative learning control:stability,monotonicity and robustness.International Journal of Control,2005,78(8):577?586
102 Owens D H,Htnen J J,Daley S.Robust monotone gradient-based discrete-time iterative learning control.International Journal of Robust and Nonlinear Control,2009,19(6):634?661
103 Owens D H.Multivariable norm optimal and parameter optimal iterative learning control:a uni fied formulation.International Journal of Control,2012,85(8):1010?1025
104 Chen Y Q,Gong Z M,Wen C Y.Analysis of a high-order iterative learning control algorithm for uncertain nonlinear systems with state delays.Automatica,1998,34(3):345?353
105 Gunnarsson S,Norrlf M.On the disturbance properties of high order iterative learning control algorithms.Automatica,2006,42(11):2031?2034
107 Hakvoort W B J,Aarts R G K M,van Dijk J,Jonker J B.Lifted system iterative learning control applied to an industrial robot.Control Engineering Practice,2008,16(4):377?391
108 Rice J K,Verhaegen M.A structured matrix approach to efficient calculation of LQG repetitive learning controllers in the lifted setting.International Journal of Control,2010,83(6):1265?1276
109 Hakvoort W B J,Aarts R G K M,van Dijk J,Jonker J B.A computationally efficient algorithm of iterative learning control for discrete-time linear time-varying systems.Automatica,2009,45(12):2925?2929
110 Barton K L,Bristow D A,Alleyne A G.A numerical method for determining monotonicity and convergence rate in iterative learning control.International Journal of Control,2010,83(2):219?226
111 Haber A,Fraanje R,Verhaegen M.Linear computational complexity robust ILC for lifted systems.Automatica,2012,48(6):1102?1110
112 Sun H Q,Alleyne A G.A computationally efficient norm optimal iterative learning control approach for LTV systems.Automatica,2014,50(1):141?148
113 Jia Li, ShiJi-Ping, Qiu Ming-Sen, Yu Jin-Shou.Nonrestraint-iterative learning-based optimal control for batch processes.CIESR Journal,2010,61(8):1889?1894(賈立,施繼平,邱銘森,俞金壽.基于無(wú)約束迭代學(xué)習(xí)的間歇生產(chǎn)過(guò)程優(yōu)化控制.化工學(xué)報(bào),2010,61(8):1889?1894)
114 Li Heng-Jie,Hao Xiao-Hong,Zeng Xian-Qiang.Clonal selection algorithm based nonlinear optimal iterative learning control.Journal of Jilin University(Engineering and Technology Edition),2010,40(4):1054?1058(李恒杰,郝曉弘,曾賢強(qiáng).基于克隆選擇算法的非線性?xún)?yōu)化迭代學(xué)習(xí)控制.吉林大學(xué)學(xué)報(bào)(工學(xué)版),2010,40(4):1054?1058)
115 Peng Bo,Shao Cheng.A robust iterative learning control with parameter-optimization for discrete nonlinear systems.Control and Decision,2014,29(3):449?454(逄勃,邵誠(chéng).一種參數(shù)優(yōu)化的非線性離散系統(tǒng)魯棒迭代學(xué)習(xí)控制方法.控制與決策,2014,29(3):449?454)
116 Chi R H,Liu X H,Zhang R K,Hou Z S,Huang B.Constrained data-driven optimal iterative learning control.Journal of Process Control,2017,55:10?29
117 Chi R H,Wang D W,Lewis F L,Hou Z S,Jin S T.Adaptive terminal ILC for iteration-varying target points.Asian Journal of Control,2015,17(3):952?962
118 Liu T Q,Wang D W,Chi R H.Neural network based terminal iterative learning control for uncertain nonlinear nonaffine systems.International Journal of Adaptive Control and Signal Processing,2015,29(10):1274?1286
119 Liu Y,Chi R H,Hou Z S.Neural network state learning based adaptive terminal ILC for tracking iterationvarying target points.International Journal of Automation and Computing,2015,12(3):266?272
120 Chi R H,Lin N,Zhang R K,Huang B,Feng Y J.Stochastic high-order internal model-based adaptive TILC with random uncertainties in initial states and desired reference points.International Journal of Adaptive Control and Signal Processing,2017,31(5):726?741
121 Chi R H,Huang B,Wang D W,Zhang R K,Feng Y J.Data-driven optimal terminal iterative learning control with initial value dynamic compensation.IET Control Theory&Applications,2016,10(12):1357?1364
122 Chi R H,Liu Y,Hou Z S,Jin S T.Data-driven terminal iterative learning control with high-order learning law for a class of non-linear discrete-time multiple-input-multiple output systems.IET Control Theory&Applications,2015,9(7):1075?1082
123 Chi R H,Liu Y,Hou Z S,Jin S T.High-order datadriven optimal TILC approach for fed-batch processes.The Canadian Journal of Chemical Engineering,2015,93(8):1455?1461
124 Chi R H,Hou Z S.Dual-stage optimal iterative learning control for nonlinear non-affine discrete-time systems.Acta Automatica Sinica,2007,33(10):1061?1065
125 ChiRong-Hu,HouZhong-Sneng,SuiShu-Lin.Nonparameter adaptive iterative learning control for the freeway traffic ramp metering.Control Theory&Applications,2008,25(6):1011?1015(池榮虎,侯忠生,隋樹(shù)林.快速路入口匝道的非參數(shù)自適應(yīng)學(xué)習(xí)控制.控制理論與應(yīng)用,2008,25(6):1011?1015)
126 Jin S T,Hou Z S,Chi R H,Liu X B.Data-driven model-free adaptive iterative learning control for a class of discrete-time nonlinear systems.Control Theory&Applications,2012,29(8):1001?1009
127 Jin S T,Hou Z S,Chi R H.Optimal terminal iterative learning control for the automatic train stop system.Asian Journal of Control,2015,17(5):1992?1999
128 Janssens P,Pipeleers G,Swevers J.Model-free iterative learning control for LTI systems and experimental validation on a linear motor test setup.In:Proceedings of the 2011 American Control Conference(ACC).San Francisco,CA,USA:IEEE,2011.4287?4292
129 Janssens P,Pipeleers G,Swevers J.A data-driven constrained norm-optimal iterative learning control framework for LTI systems.IEEE Transactions on Control Systems Technology,2013,21(2):546?551
130 Rǎdac M B,Precup R E,Petriu E M,Preitl S,Drago?s C A.Data-driven reference trajectory tracking algorithm and experimental validation.IEEE Transactions on Industrial Informatics,2013,9(4):2327?2336
131 Radac M B,Precup R E.Model-free constrained datadriven iterative reference input tuning algorithm with experimental validation.International Journal of General Systems,2016,45(4):455?476
132 Zhou Y L,Yin Y X,Zhang Q Z,Gan W S.Model-free iterative learning control for repetitive impulsive noise using FFT.In:Proceedings of the 2012 Intentatinal symposium on Neural Networks:Advances in Neural Networks.Berlin,Heidelberg:Springer-Verlag,2012.461?467
133 Wei Q L,Liu D R,Shi G.A novel dual iterativeQ-learning method for optimal battery management in smart residential environments.IEEE Transactions on Industrial Electronics,2015,62(4):2509?2518
134 Radac M B,Precup R E.Optimal behaviour prediction using a primitive-based data-driven model-free iterative learning control approach.Computers in Industry,2015,74:95?109
135 Hou Z S,Chi R H,Gao H J.An overview of dynamiclinearization-based data-driven control and applications.IEEE Transactions on Industrial Electronics,2017,64(5):4076?4090 control,learning control,intelligent traffic systems.Corresponding author of this paper.)