趙峙堯,張念東,魏 偉
(1. 北京工商大學人工智能學院,北京 100048;2. 北京郵電大學自動化學院,北京 100876)
納米定位技術(shù)是對100nm甚至更小量級的認知和操控的技術(shù)[1],納米定位技術(shù)作為納米制造技術(shù)的重要組成部分,是納米測量、納米加工的核心技術(shù)之一。壓電陶瓷驅(qū)動器驅(qū)動力大、剛度高、重復性好, 適合作為納米定位平臺的驅(qū)動器[2]。這種機構(gòu)已廣泛應用于微操縱器,半導體制造行業(yè)[3,4],超精密機床[5]。然而,壓電陶瓷存在蠕變、遲滯非線性和微阻尼共振特性,對環(huán)境溫度變化敏感[2],使得此類系統(tǒng)的建模和控制具有挑戰(zhàn)性。遲滯作為壓電陶瓷固有的一種復雜非線性,對精度控制的影響最大。前饋控制技術(shù)是抑制遲滯的常用方法,通過串聯(lián)遲滯補償器降低遲滯的影響?;赑randtl-Ishlinskii模型[6]、改進的Bouc-Wen模型[7],建立遲滯逆模型,設(shè)計前饋控制,如基于改進的Bouc-Wen模型的前饋補償方法[7]以及基于自適應的逆模型前饋補償[8]。這些方法對遲滯模型有一定的依賴。不依賴遲滯模型的閉環(huán)控制將遲滯視為一種擾動,消除其影響?;跀_動觀測的PID 控制[9],重復控制[10,11],time-delay control[12],模型參考自適應控制[13]實現(xiàn)了具有一定魯棒性的定位控制。更進一步,采用遲滯補償?shù)拈]環(huán)復合控制也得到了應用。如:基于直接逆遲滯補償?shù)牡鷮W習控制[14],基于逆補償?shù)哪P蛥⒖甲赃m應控制[15]。無論是基于遲滯模型前饋控制還是基于遲滯模型的閉環(huán)控制,都需要精確的遲滯模型。而不依賴遲滯模型的閉環(huán)控制則更為實用。
基于主動抗擾的控制思路,文獻[16]將非線性特性視為總擾動的一部分,設(shè)計線性自抗擾控制(Linear active disturbance rejection control, LADRC)實現(xiàn)了具有較強魯棒性的定位。LADRC只依賴于模型的相對階和控制增益,這是該方法的優(yōu)點,也是缺點。減小總擾動觀測負擔或提高觀測能力可提升LADRC的控制性能。文獻[17]提出了基于被控對象模型信息的廣義自抗擾控制(Generalized Active Disturbance Rejection Control,GADRC)。將微位移臺線性動力學模型用于控制器設(shè)計,是提高定位性能的常用方法[10-12]。在線性動力學模型的基礎(chǔ)上設(shè)計GADRC控制器,廣義擴張狀態(tài)觀測器(Generalized Extended State Observer, GESO)只需要觀測未準確建模的線性部分和非線性部分,大大減輕了擾動估計負擔。在提高觀測器的性能方面,文獻[18]提出相位優(yōu)化的線性自抗擾控制(Phase Optimized LADRC,POLADRC),利用微分信號的相位超前性,優(yōu)化觀測器,在壓電納米定位臺上測試取得了比LADRC更好的定位性能。應用相位優(yōu)化的思路進一步提高GADRC的控制能力,從而實現(xiàn)在減輕擾動估計負擔的同時,提高擾動估計能力。
LADRC與PID控制有著內(nèi)在的聯(lián)系,文獻[19]將二階LADRC等效為反饋補償器結(jié)合濾波器的結(jié)構(gòu)。在此基礎(chǔ)上,文獻[20]將二階LADRC等效為二階低通濾波器串聯(lián)理想PID控制器的結(jié)構(gòu)。同時,無論LADRC還是GADRC,在等效為內(nèi)??刂苹芈窌r,等效的內(nèi)部模型都是構(gòu)建擴張狀態(tài)觀測器的基準模型,通過內(nèi)??刂瓶梢宰C明GADRC的穩(wěn)定性[21,22]。本文從參考模型的角度解釋擴張狀態(tài)觀測器,不同于模型參考控制以一個參考模型的輸出為樣板讓實際控制對象向其接近,直至一致。擴張狀態(tài)觀測器是通過一個理想PID使得參考模型跟隨實際對象輸出,理想PID控制量的一部分作為總擾動的估計結(jié)果,兩者在工作原理上有根本不同。通過模型參考的解釋思路,進一步理解POLADRC的同時,也獲得相位優(yōu)化規(guī)律在GADRC中應用的參數(shù)整定方法,提出相位優(yōu)化的廣義自抗擾控制(Phase Optimized GADRC,POGADRC)
圖1顯示了不同頻率電壓輸入時的遲滯回線。理想情況下,沒有遲滯特性的回線為45°的直線。
表1 納米定位實驗系統(tǒng)參數(shù)表
圖1 不同頻率的遲滯回線
文獻[11]通過施加1 Hz至 250Hz的低振幅正弦電壓掃描信號,辨識壓電納米定位平臺的線性動力學模型。較低振幅電壓激勵,避免了遲滯非線性引起的失真。采用正弦掃描信號0.1sin(50πt2),0≤t≤10,建立線性模型Pm1(s)和Pm2(s)。已建立模型和納米定位臺實際的頻率響應如圖2所示,Pm1(s)和Pm2(s)準確地描述了系統(tǒng)較低頻率范圍內(nèi)的動力學特性,Pm2(s)在較高頻率部分也具有較高的準確性。Pm2(s)顯示實驗臺的實際諧振頻率約為225Hz。
(1)
Pm2(s)=
(2)
圖2 識別模型和測量值的頻率響應
不同于LADRC只需要關(guān)鍵參數(shù):被控對象的階次和控制量增益b0,GADRC可以利用更多的模型信息??紤]到控制器的復雜程度,選擇階次較低的模型Pm1(s)作為基準模型,二階模型Pm1(s)在較低頻率范圍內(nèi)與實驗臺實際模型符合度較高,能夠滿足在較低頻率范圍內(nèi)定位控制的要求。
參考文獻[23]設(shè)計二階LADRC控制器,如圖3所示。其核心部分線性擴張狀態(tài)觀測器(Linear Extended State Observer, LESO)為
(3)
z1,z2為狀態(tài)觀測,z3為總擾動估計,y為被控對象輸出。LADRC控制律
(4)
采用帶寬整定參數(shù)法[23]
(5)
zG1,zG2,zG3為GESO的輸出,y為被控對象輸出。GADRC控制律
(6)
采用帶寬整定參數(shù)法[17]
(7)
ωo,ωc為GESO觀測帶寬和控制器帶寬。
(8)
POLADRC控制律
(9)
z1,z2為狀態(tài)觀測,zpo3為相位優(yōu)化之后得總擾動估計??烧{(diào)參數(shù)c=β2/β3。
zpo3=z3+β2(yp-z1)
(10)
由式(3)和(10),相對于LESO,在總擾動估計中,增加的一項是(y-z1)β2。
在相位優(yōu)化律的作用下,POESO的估計相位總是超前于LESO。相位超前使得觀測器估計速度更快、估計誤差更小。文獻[9]分析結(jié)果顯示,當總擾動是階躍形式時,POESO和LESO對總擾動估計的穩(wěn)態(tài)誤差都為0,當總擾動是斜坡形式時,POESO對總擾動估計的穩(wěn)態(tài)誤差都為0,而LESO對總擾動估計存在穩(wěn)態(tài)誤差。本文將應用POLADRC的改進思路提高GADRC控制效果。
在二階LADRC中,LESO以b0/s2為基準模型,理想情況下, LESO通過總擾動補償,將被控對象轉(zhuǎn)換為串聯(lián)積分的形式。
圖3 二階LADRC控制框圖
結(jié)合圖3,式(3)可以整理為:
(10)
其中:
(11)
z1是參考模型b0/s2的輸出,通過一個理想的PID控制器,實現(xiàn)參考模型輸出z1對被控對象輸出y的跟蹤。結(jié)合圖3和式(4),(11),總擾動補償回路中的補償項為z3/b0,是LESO中等效理想PID中的積分項。
同理,結(jié)合圖4和式(6),GESO以Pm(s)為基準模型,理想情況下,在補償項zG3/b0作用下,補償回路的輸入輸出之間的動態(tài)特性與基準模型Pm(s) 動態(tài)特性相同。
圖4 二階GADRC控制框圖
式(5)可整理為:
(12)
其中
(13)
zG1是參考模型Pm(s)的輸出。通過一個理想的PID控制器,zG1實現(xiàn)對被控對象輸出y跟蹤。由圖4和式(6),(13)可知,補償項zG3/b0是GESO中等效理想PID中的積分項。
從參考模型的角度出發(fā),LESO和GESO的內(nèi)部工作原理是通過一個理想的PID控制器,實現(xiàn)參考模型對實際對象的跟蹤。
圖5 LESO和實際對象的等效框圖
圖6 GESO和實際對象的等效框圖
將相位優(yōu)化規(guī)律應用到GADRC中,控制律中的擾動補償項為積分加比例的形式。由式(5)和(13),相位優(yōu)化的GESO為
(14)
POGADRC控制律
(15)
圖7 POGADRC控制框圖
實驗在P-561.3CD上進行,壓電驅(qū)動器與電壓放大器E-727.3CDA連接。采樣間隔設(shè)置為0.05 ms。實驗平臺如圖9。以階躍信號和正弦信號作為參考信號,進行多項實驗。POGADRC,GADRC和 LADRC控制器參數(shù)見表2。
圖8 納米定位實驗平臺
表2 POGADRC,GADRC和 LADRC控制器參數(shù)
圖9 階躍跟蹤實驗
響應結(jié)果如圖9, POGADRC階躍設(shè)定值的響應曲線更加平滑,收斂更快。當定位臺受到階躍或正弦外部電壓擾動時,POGADRC受到的影響更小。
本節(jié)中,POGADRC的優(yōu)勢通過跟蹤時變參考信號的響應來證明,實驗中1Hz、5Hz、10Hz和50Hz正弦信號作為設(shè)定值。 其中,5Hz正弦跟蹤實驗Ⅰ中,r(t)=sin(10πt)+3,不施加外部擾動。5Hz正弦跟蹤實驗Ⅱ中,r(t)=sin(10πt)+3,施加外部電壓擾動:d2(t)=-0.1ε(t-1)-0.1ε(t-4)sin(2πt)。實驗結(jié)果如圖10,11,12,13所示。
圖10 5Hz正弦跟蹤實驗Ⅰ
圖11 5Hz正弦跟蹤實驗Ⅰ跟隨偏差
圖12 5Hz正弦跟蹤實驗Ⅰ控制量
圖13 5Hz正弦跟蹤實驗Ⅱ
以跟蹤誤差的均方根誤差(Root Mean Square of Error, RMSE)和控制信號u的均方根誤差(Root Mean Square of u, RMSU)作為定量比較的對比項,RMSU表征控制量的能量。相對變化量表示POGADRC相對GADRC, RMSE或RMSE的相對變化量。對于RMSE而言,相對變化量為負值時,表示跟蹤誤差相對變小,控制效果提高,反之則控制能力未提高或降低。對于RMSE而言,相對變化量為負值時,表示跟蹤消耗的能量減少,反之消耗的能量不變或增加。表3反應了不同頻率下,無外部電壓擾動跟隨實驗在三個正弦周期內(nèi)的RMSE和RMSU數(shù)據(jù)。在RMSU幾乎相同的情況下,POGADRC控制偏差更小。
表3 未施加外部電壓擾動的正弦跟隨響應結(jié)果RMSE和RMSU定量比較
圖14顯示了在GADRC和POGADRC閉環(huán)控制下和開環(huán)條件下實驗臺的遲滯回線。GADRC和POGADRC都表現(xiàn)出了較好的遲滯非線性抑制能力。跟隨頻率為50Hz時,兩者抑制效果相近,跟隨頻率較低時,1 Hz、5 Hz、10 Hz條件下,POGADRC表現(xiàn)出優(yōu)于GADRC的非線性抑制能力。
圖14 開環(huán)和閉環(huán)控制下遲滯回線對比
為實現(xiàn)對具由遲滯非線性特性壓電驅(qū)動的納米定位臺良好的定位控制,在建立的實驗臺線性模型的基礎(chǔ)上,設(shè)計了POGADRC。實驗結(jié)果表明,POGADRC具有更優(yōu)的動態(tài)響應特性和擾動、遲滯非線性抑制能力,實現(xiàn)了壓電驅(qū)動的納米定位臺的良好定位控制,這為自抗擾控制在壓電驅(qū)動的納米定位領(lǐng)域的應用提供了一種實用控制方案。