馮嚴(yán)冰
江蘇城市職業(yè)學(xué)院,江蘇常州 232001
在過去幾十年里,基于自然和生物學(xué)概念的種群優(yōu)化算法被廣泛地應(yīng)用于科學(xué)領(lǐng)域的搜索和優(yōu)化問題。常用的種群優(yōu)化算法有粒子群優(yōu)化算法(particle swarm optimization algorithm,PSO)[1]、布谷鳥搜索算法(cuckoo search,CS)[2]、螢火蟲群優(yōu)化算法(glowworm swarm optimization,GSO)[3]、引力搜索算法(gravity search algorithm,GSA)[4]和灰狼優(yōu)化算法(gray wolf optimization algorithm,GWO)等[5-7]。其中,GWO算法的靈感主要是基于狼群的結(jié)構(gòu)和內(nèi)部的層次組織,組織使用4個(gè)層次,α代表最高級(jí)別,其次是β和δ,而ω代表種群的最低級(jí)別。PID控制器設(shè)計(jì)所涉及主要問題是對(duì)與比例、積分和微分分量相關(guān)的最優(yōu)增益因子的選擇[8]。本文提出了基于GWO算法進(jìn)行比例、積分和微分(PID)控制器的設(shè)計(jì),并與GSA和PSO算法進(jìn)行了性能比較。
灰狼優(yōu)化算法于2013年提出,該算法模擬了野生環(huán)境中灰狼的社會(huì)等級(jí)分層和狩獵機(jī)制。GWO算法使用了4個(gè)層次:
(1)α狼作為領(lǐng)導(dǎo)者是占主導(dǎo)地位的狼,是主要的決策者;
(2)β狼在社會(huì)等級(jí)中排名第二,在決策過程中幫助α狼,并在α狼和較低層次狼之間建立橋梁;
(3)δ狼在社會(huì)等級(jí)中排名第三,被α狼和β狼領(lǐng)導(dǎo),同時(shí)也領(lǐng)導(dǎo)著最低等級(jí)的ω狼;
(4)ω狼是這個(gè)群體中排名最低的狼,它必須服從于其他3個(gè)等級(jí)的狼。
該算法中,灰狼社會(huì)等級(jí)的數(shù)學(xué)模型及其包圍、狩獵和攻擊獵物的具體策略如下:GWO根據(jù)適應(yīng)度確定了3個(gè)最佳的種群解決方案,第一適者的是α狼,第二適者是β狼,第三適者是δ狼,所有其余的種群成員都被認(rèn)為是ω狼。3個(gè)等級(jí)較高的狼對(duì)獵物的包圍由公式(1)來模擬[9]:
從式(3)、式(4)中可知,獵物的位置代表了對(duì)α、β和δ狼所獲得的最佳適應(yīng)度函數(shù)。所有狼的位置都使用以下平均公式進(jìn)行更新:
為了便于對(duì)比,GWO算法、GSA[10]算法和PSO算法的流程如表1所示。
經(jīng)典的單輸入單輸出反饋PID控制系統(tǒng)框圖如圖1所示。其中,r表示參考輸入(設(shè)定值),u表示控制器輸出,y表示系統(tǒng)輸出,d表示負(fù)載擾動(dòng),Gc表示控制器,Gp表示控制系統(tǒng)或進(jìn)程。控制設(shè)計(jì)2個(gè)主要目標(biāo)是設(shè)定值跟蹤SPT和負(fù)載干擾抑制LDR。SPT即找到最佳的PID控制器增益因子,使系統(tǒng)輸出盡可能接近參考輸入信號(hào)的變化,使控制系統(tǒng)的時(shí)間加權(quán)絕對(duì)誤差積分(ITAE)最小。LDR在本研究中沒有涉及。
本研究中考慮的控制器傳遞函數(shù)表示為:
其中,Kp、Ki和Kd分別表示比例、積分和微分增益;Tf表示濾波器的時(shí)間常數(shù)。
為了便于對(duì)GWO、GSA和PSO三種算法進(jìn)行比較,需要說明在一些文獻(xiàn)中被忽視的關(guān)鍵問題:
(1)種群初始化通常使用隨機(jī)生成的PID控制器增益因子,這樣會(huì)導(dǎo)致控制系統(tǒng)的不穩(wěn)定。為了克服這一問題,本研究中先從穩(wěn)定性的角度來檢驗(yàn)解決方案,如果得到的控制系統(tǒng)是穩(wěn)定的,才允許它們?cè)诔跏挤N群中使用。在本文中,初始化時(shí),3種算法GWO、GSA和PSO都使用相同的初始群體,每運(yùn)行10次后將使用不同的個(gè)體補(bǔ)充。
(2)在表1中,GWO算法中的 在迭代過程中隨著迭代次數(shù)由2線性減小至0;PSO中的ω隨著迭代次數(shù)增加,從0.9線性減少到0.2;通過實(shí)驗(yàn)發(fā)現(xiàn),GSA算法中最初提出的用來更新G的[11]表達(dá)式在 這個(gè)設(shè)計(jì)中不起作用,易導(dǎo)致過早收斂。因此,本研究中用式(8)中所示的線性衰減表達(dá)式來更新G:
其中,G0表示初始值,考慮到迭代次數(shù)較少,這里G0取0.9。
本研究使用了3種相關(guān)的工廠數(shù)學(xué)模型[11]來測試PID控制器,具有時(shí)滯的雙滯后極點(diǎn)系統(tǒng)Gp1、非最小相位系統(tǒng)Gp2和具有多等極點(diǎn)的四階系統(tǒng)Gp3,分別表示為:
在MATLAB/Simulink環(huán)境中進(jìn)行仿真,3種算法的種群大小均取為m=15,步長間隔為0.1 s,每個(gè)算法運(yùn)行10次,每次運(yùn)行時(shí)迭代150次。PID控制器的增益因子Kp、Ki和Kd在時(shí)間間隔[0.1, 5]中發(fā)生變化。濾波器的時(shí)間常數(shù)Tf取決于系統(tǒng)噪聲、過程時(shí)間常數(shù)和控制器采樣時(shí)間,但是在實(shí)踐中,它應(yīng)取不會(huì)顯著降低控制性能的最高值。本研究中,濾波器的時(shí)間常數(shù)Tf都設(shè)置為0.1 s。
每個(gè)仿真系統(tǒng)獲得的結(jié)果如表2所示,其中粗體值表示所獲得的最佳值。對(duì)于每個(gè)被測試算法(GWO、GSA和PSO)均給出了ITAE最優(yōu)結(jié)果對(duì)應(yīng)的PID增益因子。
表2還給出了10次運(yùn)行中最終獲得的ITAE的平均值,以及所有最佳結(jié)果的相應(yīng)標(biāo)準(zhǔn)差。仿真結(jié)果表明,3個(gè)算法收斂于相同的控制器增益因子,每個(gè)系統(tǒng)均獲得相同的ITAE值。這些結(jié)果顯示其平均值與所獲得的最佳值相同,所以可知,通過150次迭代足以使所有算法收斂。同時(shí),表2的結(jié)果顯示,對(duì)于PID控制器設(shè)計(jì),雖然3種算法的收斂結(jié)果增益相同,性能相似,但3種算法在收斂速度方面有很大的不同。通過分析圖2、3和4中所示的仿真結(jié)果可以看出收斂速度的差異。其中,圖(a)表示10次運(yùn)行中最佳值的平均值變化,圖(b)表示10次運(yùn)行中平均值的平均值變化圖。在最佳值方面,這3種算法的仿真結(jié)果非常接近,但就平均值而言,仿真結(jié)果表明,收斂速度最快的算法是GWO,其次是GSA,最慢的是PSO算法。
表2 PID控制器增益因子和ITAE仿真結(jié)果
本文提出了針對(duì)設(shè)定點(diǎn)跟蹤設(shè)計(jì)目標(biāo)的基于GWO算法的PID控制器設(shè)計(jì)方法。將該方法應(yīng)用于一組基準(zhǔn)線性數(shù)學(xué)模型,并與粒子群優(yōu)化和引力搜索算法得到的仿真結(jié)果進(jìn)行了比較。在小種群規(guī)模和低迭代次數(shù)的測試條件下,這3種算法得到了結(jié)果相近的ITAE。因此,GWO的性能和PSO、GSA算法一樣好。然而,在收斂性方面,3種測試算法仿真結(jié)果不同,GWO算法的最佳值總體略優(yōu)于GSA和PSO;GWO算法是平均值收斂最快的,其次是GSA,最后是PSO。仿真結(jié)果表明,GWO算法的總體性能最優(yōu),但在其他PID控制器設(shè)計(jì)標(biāo)準(zhǔn)下,灰狼優(yōu)化算法還需進(jìn)一步探索。