楊毅,王湘江,曾慶生
(南華大學 機械工程學院,湖南 衡陽,421001)
導電聚合物是一種新興的電致聚合物(也叫人工肌肉),可用作驅(qū)動器和傳感器的智能材料,它在生物機器人和生物醫(yī)學設(shè)備中有廣闊的應(yīng)用前景[1-6]。聚吡咯(PPy)和聚苯胺是2 種最常用的導電聚合物。導電聚合物與電解液接觸,在正電壓作用下會發(fā)生氧化反應(yīng)。在氧化過程中,負離子進入或正離子離開導電聚合物,以保持電勢平衡,在負電壓作用下會發(fā)生與氧化反應(yīng)相反的還原反應(yīng)。負離子遷移的導電聚合物在氧化反應(yīng)作用下會發(fā)生體積膨脹,在還原反應(yīng)作用下會發(fā)生體積收縮。正離子遷移的導電聚合物則完全相反。不同配置的導電聚合物驅(qū)動器有雙層彎曲型、多層彎曲型、直動型。多層聚吡咯彎曲型驅(qū)動器的中間層為非晶、多孔隙的聚偏二氟乙烯(PVDF)層,它不僅是聚吡咯聚合物的基體材料,而且是電解液的容器。驅(qū)動器的兩邊為聚吡咯層。當驅(qū)動器兩側(cè)加上電壓時,正極被氧化負極被還原。被氧化的聚吡咯層吸收負離子而膨脹,被還原的聚吡咯層釋放負離子而收縮,最終導致驅(qū)動器彎曲。導電聚合物驅(qū)動器只需要很低的驅(qū)動電壓(2 V 以下),就可產(chǎn)生相當大的應(yīng)力和應(yīng)變輸出,并且同時具有質(zhì)量小和生物相容性好等優(yōu)點,可廣泛應(yīng)用于機器人和生物醫(yī)學領(lǐng)域,例如生物微操作系統(tǒng)、仿生系統(tǒng)和生物醫(yī)學設(shè)備[7-9]。根據(jù)驅(qū)動器的靜態(tài)和動態(tài)行為建立精確的數(shù)學模型對驅(qū)動器的可行性研究、優(yōu)化設(shè)計和控制都是十分有用的[10-12],但模型的精度、適應(yīng)性和基于有效數(shù)學模型控制其彎曲運動的控制方法還有待進一步研究[13-15]。在此,本文作者通過制作3 層膜聚吡咯驅(qū)動器的實驗裝置,采用離線和在線辨識方法建立新的系統(tǒng)模型來實現(xiàn)對驅(qū)動器控制,再通過離線和在線辨識方法證明模型辨識的有效性。設(shè)計包括基于逆模前饋控制、PID 控制和逆模前饋PID控制等多種方法對辨識模型進行控制,實驗結(jié)果證明逆模前饋PID 控制器能提供準確的運動控制精度。
圖1 所示為彎曲型聚合物驅(qū)動器的結(jié)構(gòu)。它由3個主要層組成:2 個聚吡咯(PPy)層和1 個可儲存電解液的PVDF 夾層。PPy 層可以在液體電解質(zhì)中進行電解,PVDF 層兩面鍍很薄的金層,以提高導電性。彎曲驅(qū)動器所需的長度和寬度從大塊的結(jié)構(gòu)中剪切得到,這種復合結(jié)構(gòu)呈現(xiàn)出像雙層懸臂那樣的簡單彎曲運動。當電位差或電流通過夾緊的聚合物(PPy)兩電極時,聚合物驅(qū)動器產(chǎn)生電化學反應(yīng)將在其頂端輸出彎曲機械運動。
圖1 導電聚合物驅(qū)動器的幾何形狀Fig.1 Geometry of conducting polymer actuator
圖2 實驗裝置示意圖Fig.2 Schematic representation of experimental setup
圖2 所示為模型辨識和系統(tǒng)控制的實驗裝置。利用MATLAB 的實時工具箱RTW 對硬件在回路中進行實時控制,選用的工作方式為單機型 Real-time windows target 方案,通過目標鏈接的方式和Simulink聯(lián)系在一起,按照單獨的實時內(nèi)核方式驅(qū)動外部硬件設(shè)備,完成系統(tǒng)實時控制。
為了建立驅(qū)動器的辨識模型,通過實驗得到系統(tǒng)模型參數(shù)。實驗中用于模型辨識和系統(tǒng)控制的是1 個長約5 mm、寬約2 mm 的PPy 驅(qū)動器,輸入電壓信號u(t),u(t)=2sin(πt),輸出結(jié)果y(t)由激光傳感器測量。系統(tǒng)被視為1 個黑箱,系統(tǒng)模型參數(shù)通過輸入電壓u(t)和輸出y(t)確定。
驅(qū)動器離散系統(tǒng)的動力學方程可由多項式表示:
其中:A( z)= 1+a1z-1+…+anz-n;B (z )=b0z-1+…+bmz-(m-1);ai和bi分別為線性系統(tǒng)參數(shù);z-1為向后移位運算符號,z-1y(t)=y(t-1)。
由文獻[9]可知驅(qū)動器可近似為二階系統(tǒng),采用最小二乘法來確定模型參數(shù)。待估參數(shù)向量θ 為
數(shù)據(jù)向量為
式(1)可以改寫成
其中:
系統(tǒng)參數(shù)的最小二乘估計θ 為
在圖2 所示的系統(tǒng)中,輸入u(t)=2sin(πt),由激光位移傳感器測量得到輸出y(t),由Simulink 對輸入輸出結(jié)果進行記錄,其采樣時間設(shè)定為0.002 s。將測量結(jié)果代入由式(5)編寫的程序中,得到離散傳遞函數(shù)的二階模型為
圖3 所示為辨識過程示意圖,其中P 表示驅(qū)動器,v(t)為干擾信號。圖4 所示為驅(qū)動器實際輸出和模型預測輸出以及輸出誤差比較。從圖4 可以看出:驅(qū)動器輸出信號y(t)和辨識系統(tǒng)輸出信號yG(t)之間誤差e(t)非常小,說明式(6)所表示的二階模型有效。
圖3 模型辨識過程示意圖Fig.3 Schematic of model validation procedure
圖4 驅(qū)動器實際輸出和模型預測輸出以及輸出誤差比較Fig.4 Comparison of real actuator output and output predicted by model and associated modeling error
為了進一步驗證式(6)的準確性,采用神經(jīng)網(wǎng)絡(luò)辨識,辨識方法如圖5 所示。式(1)可以寫成
圖5 神經(jīng)網(wǎng)絡(luò)在線辨識方法示意圖Fig.5 Schematic of neural network identification method
式(4)可以表示為
神經(jīng)網(wǎng)絡(luò)的訓練規(guī)則為
其中:
ci為權(quán)重因子,0<ci<1,ci=μi;0<μ<1。
使用上述離線辨識二階模型估計參數(shù)作為神經(jīng)網(wǎng)絡(luò)在線辨識加權(quán)系數(shù)的初始值,可減少在線辨識的計算時間。根據(jù)式(9)和(10),得到驅(qū)動器的神經(jīng)網(wǎng)絡(luò)辨識模型。在圖2 所示系統(tǒng)中,輸入u(t)=2sin(πt),由激光位移傳感器測量得到位移輸出y(t),在Simulink 中構(gòu)建神經(jīng)網(wǎng)絡(luò)辨識模型,可在線實現(xiàn)參數(shù)辨識。
圖6 所示為二階收斂模型參數(shù)的收斂結(jié)果,各參數(shù)逐漸趨近于常數(shù),說明系統(tǒng)神經(jīng)網(wǎng)絡(luò)算法正確,且系統(tǒng)的二階性質(zhì)明顯。另外,各參數(shù)最后圍繞著1 個固定常數(shù)上下波動,說明在線調(diào)整是不斷進行的,同時也說明系統(tǒng)不完全是一個二階定常系統(tǒng),存在著非線性和隨機干擾。但是,當要求精度不是特別高時,完全可以將系統(tǒng)視為二階定常系統(tǒng)。圖7 所示為在線辨識模型輸出y1(t)和驅(qū)動器實際產(chǎn)出的輸出y(t)以及輸出誤差e(t)。因為參數(shù)的在線調(diào)整使得誤差很小,所以,曲線y(t)和y1(t)幾乎重疊。
圖6 模型參數(shù)的收斂性Fig.6 Convergence of model parameters
圖7 驅(qū)動器實際輸出和在線辨識模型預測輸出以及輸出誤差比較Fig.7 Comparison of real actuator output and output predicted by model and associated modeling error from on-line identification
運用在線辨識方法得到的模型,采用3 個控制方法:逆模型控制、逆模前饋PID 控制和PID 控制。逆模型控制是一種完全的開環(huán)控制系統(tǒng),不需要任何反饋數(shù)據(jù)的控制器。式(5)所示離散傳遞函數(shù)不是最小相位系統(tǒng),其零點不在z 平面的單位圓里面,因此,傳遞函數(shù)的倒數(shù)是不穩(wěn)定的,故式(5)不能直接用作建立逆模型控制系統(tǒng),需要構(gòu)建逆模型G-1(z)。逆模型滯后于驅(qū)動器,可通過函數(shù)模型G1(z)和最優(yōu)函數(shù)模型G2(z)來設(shè)計逆模型。函數(shù)模型為
最優(yōu)函數(shù)模型為
其中:Δ 為大于等于1 的整數(shù)。最優(yōu)函數(shù)模型是不穩(wěn)定的,因為它的極點不在z 平面單位圓里面,G2(z)可以擴展為
由于|b0|≈|b1|,可知式(16)中多項式系數(shù)ri非常小,可忽略不計,因此,得到的彎曲驅(qū)動器的近似逆模型為
圖8 所示為逆模型控制系統(tǒng)示意圖,輸出為
在圖2 所示系統(tǒng)中,輸入yd(t)=0.5sin(πt)的期望輸出,在Simulink 中構(gòu)建逆模型G-1(z)作為驅(qū)動器的前饋控制器。圖9 所示為驅(qū)動器的實際輸出、期望輸出和跟蹤誤差e(t)。
為了便于比較,式(19)給出了離散PID 控制器,如圖10 所示。
其中:
在圖2 所示系統(tǒng)中,由Simulink 中現(xiàn)有模塊構(gòu)建離散PID 控制器,通過反復試驗,PID 控制器參數(shù)比例系數(shù)、積分系數(shù)和微分系數(shù)分別選定為kp=250,ki=30,kd=30。圖11 所示為PID 控制輸出與期望輸出的比較結(jié)果。盡管PID 控制器是魯棒控制方法,但軌跡跟蹤誤差還是比較大。
圖8 逆模型控制器示意圖Fig.8 Schematic of inversion-based feedforward controller
圖9 驅(qū)動器實際輸出和逆模型控制系統(tǒng)期望輸出比較以及跟蹤誤差Fig.9 Comparison of real actuator output and desired output under inversion-based feedforward controller and associated tracking error
圖10 PID 控制方法示意圖Fig.10 Schematic of PID control strategy
圖11 驅(qū)動器實際輸出和PID 控制系統(tǒng)期望輸出比較以及跟蹤誤差Fig.11 Comparison of real actuator output and desired output under PID controller and associated tracking error
設(shè)計一種逆模前饋PID 控制方法來提高系統(tǒng)的魯棒性,以便更好地適應(yīng)驅(qū)動器參數(shù)變化和操作參數(shù)變化。其原理如圖12 所示。
其輸出可描述為
圖12 逆模前饋PID 控制器示意圖Fig.12 Schematic of feedforward controller with PID controller
在圖2 所示系統(tǒng)中,由Simulink 構(gòu)建如圖12 所示的RTW 系統(tǒng)進行控制實驗。圖13 所示為逆模前饋PID 控制的實驗結(jié)果。必須指出的是,跟蹤誤差e(t)遠比逆模型控制和經(jīng)典的PID 控制的小。這是因為系統(tǒng)中逆模前饋控制起關(guān)鍵作用, PID 控制是在出現(xiàn)誤差時再進行調(diào)整,經(jīng)典的PID 所需要調(diào)整的誤差較大,而逆模前饋PID 控制由于只需要調(diào)整逆模前饋控制后的誤差,所需要調(diào)整的誤差要小得多,所以,控制效果要比經(jīng)典PID 控制的效果好。為定量反映3 種控制方法的效果,由式(22)可得表1 所示的3 種控制方法均方根誤差SRM。
表1 3 種控制方法的均方根(RMS)誤差Table 1 RMS of tracking errors under three control strategies
圖13 驅(qū)動器實際輸出和前饋PID 控制系統(tǒng)期望輸出比較以及跟蹤誤差Fig.13 Comparison of real actuator output and desired output under feedforward PID controller and associated tracking error
本研究用3 種不同的控制方法對系統(tǒng)進行運動控制,其中PID 控制為傳統(tǒng)的控制方法,將圖9 和圖11與圖13 進行比較發(fā)現(xiàn):本文所提出的開環(huán)逆模控制方法比PID 控制有更高的控制精度,輸出均方根誤差減小近50%,而開環(huán)逆??刂频挠布Y(jié)構(gòu)更加簡單,若在實際系統(tǒng)中采用,將大幅度降低控制系統(tǒng)成本。從圖13 可以看出:采用帶逆模前饋的PID 控制方法,最大位移輸出大幅度減小,信號跟蹤精度較前2 種提高了1 個數(shù)量級,并且其主要誤差是由傳感器帶來的高頻誤差。綜合來看,在工作環(huán)境穩(wěn)定且要求不太高時可采用開環(huán)逆??刂?;當工作要求較高時,采用加前饋逆模的PID 控制。此2 種方法都比傳統(tǒng)的PID 控制方法有明顯優(yōu)勢。需要指出的是:當采用加逆模前饋的PID 控制方法時,要注意PID 參數(shù)的選取,避免出現(xiàn)飽和、振蕩等情況發(fā)生。
(1) 運用離線和在線辨識方法建立了導電聚合物驅(qū)動器中典型3 層共軛PPy 驅(qū)動器的二階離散傳遞函數(shù)。通過神經(jīng)網(wǎng)絡(luò)在線辨識,進一步驗證了模型的準確性。
(2) 針對高度敏感的智能驅(qū)動器出現(xiàn)的系統(tǒng)參數(shù)不穩(wěn)定性和受干擾性,逆模前饋PID 控制系統(tǒng)是最優(yōu)的控制方法。但必須注意的是,它的執(zhí)行是基于反饋控制器(需要1 個外部傳感器)。當不方便安傳感器時,可以使用基于準確傳遞函數(shù)的逆模型,這樣的模型可以通過在線辨識方法確定。
[1] Vidal F, Plesse C, Palaprat G, et al. Conducting IPN actuators:From polymer chemistry to actuator with linear actuation[J].Synthetic Metals, 2006, 156: 1299-1304.
[2] 賀曦敏. 以導電聚合物構(gòu)建的驅(qū)動器的制備與性能研究[D].北京: 清華大學化學系, 2006: 4-20.HE Ximin. Fabrication and properties research of actuators based on conducting polymer[D]. Beijing: Tsinghua University.Department of Chemistry, 2006: 4-20.
[3] 徐巖, 趙剛, 楊立明, 等. IPMC 人工肌肉的制備工藝研究[J].功能材料, 2013, 44(11): 1646-1650.XU Yan, ZHAO Gang, YANG Liming, et al. Research on preparation technique of IPMC artificial muscle[J]. Journal of Functional Materials, 2013, 44(11): 1646-1650.
[4] Han G, Shi G. Conducting polymer electrochemical actuator made of high-strength three-layered composite films of polythiophene and polypyrrole[J]. Sensors and Actuators B,2004, 99: 525-531.
[5] Gaihre B, Alici G, Spinks G M, et al. Synthesis and performance evaluation of thin film PPy-PVDF multilayer electroactive polymer actuators[J]. Sensors and Actuators A, 2011, 165:321-328.
[6] Hiraoka M, Fiorini P, O’Callaghan J, et al. Miniature conductive polymer actuators for high pressure generation in lab onchip systems[J]. Sensors and Actuators A, 2012, 177: 23-29.
[7] Fuchiwaki M, Tanaka K, Kaneto K. Planate conducting polymer actuator based on polypyrrole and its application[J]. Sensors and Actuators A, 2009, 150: 272-276.
[8] Alici G, Devaud V, Renaud P, et al. Conducting polymer microactuators operating in air[J]. Journal of Micromechanics and Microengineering, 2009, 19: 1-9.
[9] Nguyen C H, Alici G, Wallace G G. Modelling trilayer conjugated polymer actuators for their sensorless position control[J]. Sensors and Actuators A, 2012, 185: 82-91.
[10] Shoa T, Yoo D S, Walus K, et al. A dynamic electromechanical model for electrochemically driven conducting polymer actuators[J]. IEEE/ASME Transactions on Mechatronics, 2011,16(1): 42-49.
[11] Alici G. An effective modelling approach to estimate nonlinear bending behaviour of cantilever type conducting polymer actuators[J]. Sensors and Actuators B, 2009, 141: 284-292.
[12] Du P, Lin X, Zhang X. A multilayer bending model for conducting polymer actuators[J]. Sensors and Actuators A, 2010,163: 240-246.
[13] John S W, Alici G, Cook C D. Inversion-based feedforward control of polypyrrole trilayer bender actuators[J]. IEEE/ASME Transactions on Mechatronics, 2010, 15(1): 149-156.
[14] Yao Q, Alici G, Spinks G M. Feedback control of tri-layer polymer actuators to improve their positioning ability and speed of response[J]. Sensors and Actuators A, 2008, 144: 176-184.
[15] Fang Y, Tan X, Alici G. Robust adaptive control of conjugated polymer actuators[J]. IEEE Transactions on Control Systems Technology, 2008, 16(4): 600-612.