劉晨暉 張為民 薛 峰
(同濟(jì)大學(xué)機(jī)械與能源工程學(xué)院,上海 201804)
近年來,隨著生產(chǎn)模式的演進(jìn),自動(dòng)化、智能化和精細(xì)化模式已經(jīng)成為了工業(yè)生產(chǎn)中的發(fā)展方向。機(jī)械臂以其自由度高,工作空間大等特性,廣泛用于特征異構(gòu)的個(gè)性化產(chǎn)品裝配和物流等生產(chǎn)過程中,為了生產(chǎn)效率的提高發(fā)揮著越來越重要的作用。
在不同產(chǎn)品導(dǎo)入試生產(chǎn)的調(diào)試階段,除了應(yīng)對(duì)機(jī)械臂運(yùn)動(dòng)軌跡進(jìn)行適用性評(píng)估及可能的重新規(guī)劃外,還需要對(duì)現(xiàn)有或重新規(guī)劃完成的軌跡運(yùn)動(dòng)參數(shù)進(jìn)行最優(yōu)化的微調(diào)、配置或整定,使機(jī)械臂以更少調(diào)優(yōu)成本和更優(yōu)的性能去適應(yīng)新的生產(chǎn)任務(wù)。因此,在不更改機(jī)械臂結(jié)構(gòu)設(shè)計(jì)參數(shù)的條件下,對(duì)其運(yùn)動(dòng)參數(shù)進(jìn)行調(diào)優(yōu),以快速完成生產(chǎn)場(chǎng)景切換,仍是解決生產(chǎn)優(yōu)化問題的重點(diǎn)有效手段。
目前對(duì)機(jī)械臂軌跡運(yùn)動(dòng)參數(shù)優(yōu)化研究主要有黑盒優(yōu)化與白盒優(yōu)化兩個(gè)方面?,F(xiàn)有白盒優(yōu)化可以通過數(shù)學(xué)建模,構(gòu)建出因素—指標(biāo)的近似數(shù)理變化關(guān)系,從而解決優(yōu)化的機(jī)理性問題;但每次場(chǎng)景切換都需要重新完成建模,優(yōu)化實(shí)驗(yàn)成本和門檻較高。因而通常將機(jī)械臂運(yùn)動(dòng)參數(shù)優(yōu)化問題視作黑盒優(yōu)化模型,以多組因素—指標(biāo)對(duì)為訓(xùn)練樣本,得到數(shù)據(jù)驅(qū)動(dòng)的因素—指標(biāo)映射模型,進(jìn)而通過極值化得到最優(yōu)解。
貝葉斯優(yōu)化算法(Bayesian optimization, BO)作為一種強(qiáng)大、靈活和求解快速的參數(shù)優(yōu)化工具,廣泛地用于黑盒函數(shù)的高效全局優(yōu)化[1],不少學(xué)者已將這種方法用于工業(yè)場(chǎng)景的優(yōu)化研究中。 Calandra R等[2]針對(duì)仿生雙足步行機(jī)器人優(yōu)化問題,通過仿真和實(shí)際實(shí)驗(yàn),評(píng)估、驗(yàn)證了貝葉斯優(yōu)化在步態(tài)優(yōu)化中的效果。Roveda L等[3]以執(zhí)行器末端配備有視覺系統(tǒng)的機(jī)器人為研究對(duì)象,基于貝葉斯優(yōu)化方法,提出了一種在有限的實(shí)驗(yàn)次數(shù)下優(yōu)化機(jī)器人末端執(zhí)行器位姿的方法,以使其在工業(yè)任務(wù)中靈活工作。在其他領(lǐng)域,王子涵等[4]將貝葉斯模型引入機(jī)床熱變形的神經(jīng)網(wǎng)絡(luò)模型中,通過快速求解超參數(shù),提高了神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性能。
上述研究中的貝葉斯優(yōu)化均使用了高斯過程概率代理模型,盡管體現(xiàn)出了較好的靈活性和優(yōu)化效果,但其只能處理數(shù)據(jù)類型為連續(xù)或數(shù)值型的待優(yōu)化參數(shù),不能適用于實(shí)際生產(chǎn)中廣泛存在的離散型或其他難以數(shù)值化的參數(shù)優(yōu)化問題。為解決這一問題,大多數(shù)研究通過巧妙地改造高斯過程的核函數(shù)或者將離散的變量映射到連續(xù)空間[5],從而使得該方法能夠支持更多優(yōu)化問題的解決。因此,關(guān)于代理模型替換的研究就不斷涌現(xiàn)。以隨機(jī)森林為代表的基于序列模型的算法配置優(yōu)化算法(sequential model-based algorithm configuration, SMAC)[6]的提出,解決了貝葉斯模型在高斯回歸過程代理下,待優(yōu)化的參數(shù)類型不能為離散型的情況,并在神經(jīng)網(wǎng)絡(luò)模型非連續(xù)型結(jié)構(gòu)參數(shù)優(yōu)化中得到了成功應(yīng)用;在工業(yè)場(chǎng)景中尚未見文獻(xiàn)報(bào)道。
綜上所述,本研究以ABB IRB 1410機(jī)械臂為實(shí)驗(yàn)對(duì)象,選取了難以連續(xù)化、宜給定離散值的機(jī)械臂路徑行走方案編號(hào)作為離散變量,設(shè)計(jì)了3條有代表性的路徑方案;并聯(lián)合ABB IRB 1410機(jī)械臂中開放可調(diào)權(quán)限的速度、加速度和加加速度等3個(gè)連續(xù)變量參與優(yōu)化實(shí)驗(yàn);選擇了若干指標(biāo)并對(duì)其進(jìn)行歸一化,通過實(shí)驗(yàn)驗(yàn)證了隨機(jī)森林貝葉斯優(yōu)化方法在機(jī)械臂運(yùn)動(dòng)參數(shù)優(yōu)化場(chǎng)景的有效性;與經(jīng)典的基于高斯過程的貝葉斯優(yōu)化進(jìn)行了對(duì)比,證明了隨機(jī)森林貝葉斯優(yōu)化方法的經(jīng)濟(jì)性。
貝葉斯定理可以通過某一現(xiàn)象的先驗(yàn)分布與似然概率(觀測(cè)樣本的概率分布)來推測(cè)后驗(yàn)分布,形式上:設(shè)P(A)是沒有數(shù)據(jù)支持下,A事件發(fā)生的概率,即先驗(yàn)概率;P(A|B)在事件B發(fā)生下,A事件發(fā)生的概率,即后驗(yàn)概率;P(B|A)是A事件發(fā)生后B事件發(fā)生的概率分布,即似然函數(shù);P(B)是邊際似然概率,有
利用貝葉斯原理,在解決黑盒全局參數(shù)優(yōu)化問題上,可以基于已有的實(shí)驗(yàn)結(jié)果,依次進(jìn)行迭代,不斷提高黑盒函數(shù)的置信度,得到下一組具有較高事件概率的參數(shù)組合。因此式(1)可以改寫為[7]
式中:f表示為未知的黑盒函數(shù);D1:t={(x1,y1),(x2,y2),···,(xt,yt)}表 示 已 有 的 實(shí) 驗(yàn) 結(jié) 果 ,xt=(x1,t,x2,t,···,xn,t)T表 示 第t次 實(shí) 驗(yàn) 下 的n維 參 數(shù) 組 合 ,yt=f(xt)+εt表示在xt參數(shù)組合下,得到的實(shí)驗(yàn)結(jié)果,εt為觀測(cè)誤差;P(D1:t|f)表示在f下的y的似然分布;P(f)表示f的先驗(yàn)概率分布,即對(duì)黑盒函數(shù)的假設(shè);P(D1:t)表示f的邊際似然分布;P(f|D1:t)表示f的后驗(yàn)概率分布,描述已有實(shí)驗(yàn)的數(shù)據(jù)對(duì)先驗(yàn)進(jìn)行修正后的黑盒函數(shù)的置信度。
貝葉斯優(yōu)化的難點(diǎn)就在于如何選取合適的概率代理函數(shù)和采集函數(shù),以提高優(yōu)化的速度,減少不必要的參數(shù)組合選取。
概率代理模型是貝葉斯優(yōu)化框架的一個(gè)核心部分,用于處理優(yōu)化變量與優(yōu)化目標(biāo)之間復(fù)雜的映射關(guān)系。不同的概率代理模型在貝葉斯優(yōu)化的應(yīng)用中往往發(fā)揮著不同的效果,這里常用的代理模型有高斯過程、隨機(jī)森林等。
1.1.1 高斯過程
高斯過程是多元高斯分布向無窮維度的擴(kuò)展,是一系列服從正態(tài)分布的隨機(jī)變量在一定數(shù)據(jù)集z內(nèi)的組合,由均值函數(shù)m(z)和協(xié)方差函數(shù)k(z,z′)確定為
實(shí)驗(yàn)數(shù)據(jù) D1:t中xt=(x1,t,x2,t,···,xn,t)T可以看作定義在樣本空間上的實(shí)值函數(shù),為n維隨機(jī)變量。在貝葉斯優(yōu)化中,需要假設(shè)優(yōu)化函數(shù)的先驗(yàn)為高斯過程為[8]
基于式(4),f1:t(x)的高斯分布參數(shù)為
對(duì)于下一個(gè)點(diǎn)xt+1,滿足正態(tài)分布N(μt+1,Σt+1),x1:t與xt+1的聯(lián)合分布參數(shù)為
因此ft+1(x)的概率密度函數(shù)為
ft+1(x)與f1:t(x)的聯(lián)合概率密度為
進(jìn)一步得到條件概率密度函數(shù)為
將f1:t,t+1(x)、f1:t(x)代入求解,得到
式(15)中: ︿x1:t=x1:t-μ1:t,方差 Σt+1|1:t可以通過計(jì)算xi之 間協(xié) 方差 得到 ,均 值 μt+1|1:t中 的 μt+1可以 使用μ1:t近似計(jì)算。
因此,之后每個(gè)未知點(diǎn)的95%置信區(qū)間均可以通過公式(17)求解得到為
1.1.2 隨機(jī)森林
隨機(jī)森林本質(zhì)是多個(gè)分類與回歸樹。樹的內(nèi)部結(jié)點(diǎn)的右分支是取值為“是”,左分支是取值為“否”。遞歸地二分每個(gè)特征,將輸入空間(特征空間)劃分為有限個(gè)單元,并在這些單元上確定預(yù)測(cè)的概率分布,即在輸入給定的條件下輸出條件概率分布。
回歸樹主要用于處理數(shù)值類或者連續(xù)型變量;分類樹易于處理一些非數(shù)值類或者離散型變量。
針對(duì)回歸樹生成,給定數(shù)據(jù)集 D1:t,將第i個(gè)特征輸入空間 (xi,1,xi,2,···,xi,t)T,以及對(duì)應(yīng)的輸出空間(y1,y2,···,yt)T,劃分為M個(gè)單元 (R1,R2,···,RM)。每個(gè)單元Rm上的固定輸出為Cm;I為0-1函數(shù);回歸樹模型可表示為[9]
針對(duì)固定輸出為Cm,使用平方誤差(mean square error, MSE)表征回歸樹對(duì)于訓(xùn)練數(shù)據(jù)的預(yù)測(cè)誤差,基于MSE最小原則求解模型損失函數(shù)式(19)的極小值為
MSE直接對(duì)Cm求導(dǎo)并讓導(dǎo)數(shù)為0,Rm空間上樣本數(shù)為Nm,有
對(duì)于特征輸入空間的劃分,采用最小二乘法,遞歸地將每個(gè)區(qū)域劃分兩個(gè)子域與,為
通過求解式(24)得
在數(shù)據(jù)集 D1:t第i個(gè)特征組中,遍歷所有的xi,j,求解出全局最小值的解集。之后對(duì)R1與R2繼續(xù)劃分,直到滿足迭代終止條件。
分類樹生成原理與回歸樹相似,但一般采用基尼指數(shù)最小原則進(jìn)行空間劃分。假設(shè)有K個(gè)類別,樣本點(diǎn)屬于第k類的概率pk,基尼指數(shù)定義為[9]
當(dāng)樣本集合 D1:t根據(jù)C特征劃分為 D1與 D2兩部分時(shí),得
基尼指數(shù)越大,則表示樣本集合不確定性越大。因此在分類樹劃分空間時(shí)候,需要遵循基尼指數(shù)最小原則。
在隨機(jī)森林算法中,需要根據(jù)具體數(shù)據(jù)類型,確定回歸樹與分類樹數(shù)目與最大迭代次數(shù),對(duì)每個(gè)特征進(jìn)行訓(xùn)練,去擬合黑盒函數(shù)f,該過程可以類比高斯回歸過程中n個(gè)點(diǎn)所構(gòu)成的多維正態(tài)分布。對(duì)于新加入的點(diǎn),在隨機(jī)森林的每棵樹上有一個(gè)預(yù)測(cè)結(jié)果,即條件概率分布。每棵樹相互獨(dú)立,預(yù)測(cè)結(jié)果均值與方差為
95%置信區(qū)間為
采集函數(shù)是根據(jù)后驗(yàn)概率分布構(gòu)造的,由于原始函數(shù)f(x)的計(jì)算成本較高,因此構(gòu)建一個(gè)更便宜的函數(shù),稱為采集函數(shù) α (x),由代理模型確定下一個(gè)待評(píng)價(jià)點(diǎn)。在參數(shù)空間X中選擇下一個(gè)點(diǎn)xt+1將滿足
這能同時(shí)能夠平衡“探索”以及“精進(jìn)”兩種機(jī)制,通過采集函數(shù)最值化,來選擇下一個(gè)最具潛力的評(píng)估點(diǎn),并避免不必要的采樣。
常用的采集函數(shù)有置信邊界策略等。置信邊界策略包括置信下界(lower confidence bound, LCB)和置信上界(upper confidence bound, UCB)兩種,都為均值函數(shù)和協(xié)方差函數(shù)組成,UCB 多應(yīng)用于望大優(yōu)化,LCB 多應(yīng)用于望小優(yōu)化。
本文針對(duì)機(jī)械臂的調(diào)優(yōu)實(shí)驗(yàn)指標(biāo)均為望小指標(biāo),采用LCB策略,得
式中: μ (x)與 σ (x)分別為均值函數(shù)與方差函數(shù),k為迭代遞減步長(zhǎng),用于平衡“探索”與“精進(jìn)”機(jī)制,保證調(diào)優(yōu)前期盡可能進(jìn)行寬度搜索,調(diào)優(yōu)后期進(jìn)行深度搜索。
第1步,先根據(jù)初始化數(shù)據(jù):D1:t={(x1,y1),(x2,y2),···,(xt,yt)},xt為初始化實(shí)驗(yàn)中,輸入?yún)?shù)組合,yt為在對(duì)應(yīng)參數(shù)組合下的歸一化指標(biāo),獲得一個(gè)概率代理模型的先驗(yàn)分布;
第2步,選擇LCB作為采集函數(shù),計(jì)算 α (x);
第3步,得到使采集函數(shù)最大的xt+1值;
第4步,以xt+1為下一次實(shí)驗(yàn)參數(shù)組合,得到該組實(shí)驗(yàn)下的歸一指標(biāo)yt+1;
第5步,將{xt+1,yt+1}作為下一次迭代的訓(xùn)練值,根據(jù)1.1節(jié)所述各公式,計(jì)算、更新概率代理模型的先驗(yàn)分布;
重復(fù)第2步到第5步,直到達(dá)到迭代次數(shù)預(yù)設(shè)值,或者出現(xiàn)重復(fù)推薦數(shù)據(jù)xt+a=xt+b。
流程圖如圖1所示。
圖1 調(diào)優(yōu)流程圖
為簡(jiǎn)化子指標(biāo)數(shù)據(jù)的輸入,需要對(duì)數(shù)據(jù)歸一化處理,本次研究選擇層次分析法。計(jì)算步驟如下[10]:
(1)建立層次結(jié)構(gòu)模型,將決策目標(biāo)、決策準(zhǔn)則和決策對(duì)象按它們之間的相互關(guān)系分為最高層、中間層和最低層,繪出層次結(jié)構(gòu)圖。
(2)構(gòu)造判斷矩陣,不把所有因素放在一起比較,而是兩兩相互比較,并按表1對(duì)其重要性程度評(píng)定等級(jí)。其中判斷矩陣具有如下性質(zhì)
表1 因素重要性程度評(píng)定等級(jí)表
(3)求解判斷矩陣最大特征根的特征向量,進(jìn)行層次單排序,并進(jìn)行一致性檢驗(yàn)。
(4)層次總排序及其一致性檢驗(yàn),將最后因素層加權(quán)求解到最高層。
本研究以ABB IRB 1410機(jī)械臂為調(diào)優(yōu)對(duì)象,機(jī)械臂基坐標(biāo)系遵循右手系原則,Y軸正方向與Z軸正方向如圖2所示。選擇機(jī)械臂安裝燃料電池極板為工作場(chǎng)景,該場(chǎng)景要求電池極板在X-Y平面安裝的位置精度有著較高要求,極板中心點(diǎn)位置度應(yīng)處于0.05 mm公差帶內(nèi),以保證后續(xù)極板點(diǎn)膠工藝順利進(jìn)行;同時(shí)希望保證安裝過程平穩(wěn),沖擊較小。
圖2 ABB IRB 1 410
2.2.1 調(diào)優(yōu)參數(shù)介紹
機(jī)械臂的調(diào)優(yōu)參數(shù)從量化角度可以分為連續(xù)型變量與離散型變量,連續(xù)型調(diào)優(yōu)變量為以下3個(gè):
(1)機(jī)械臂工具中心點(diǎn)(tool center point, TCP)線性速度(記作:速度v),為機(jī)械臂末端工具坐標(biāo)系原點(diǎn)相對(duì)于機(jī)械臂的基坐標(biāo)系原點(diǎn)的線性運(yùn)動(dòng)速率,單位為 m m/s。可以通過機(jī)械臂的示教器,在程序數(shù)據(jù)模塊進(jìn)行設(shè)置,更改范圍為0~2 100 m m/s。
(2)機(jī)械臂加速度百分率(記作:加速度a),對(duì)機(jī)械臂TCP線性速度進(jìn)行調(diào)節(jié),實(shí)現(xiàn)機(jī)械臂末端的加減速過程,是機(jī)械臂系統(tǒng)內(nèi)部額定值的百分比,單位為%。可以通過機(jī)械臂示教器,在運(yùn)動(dòng)指令-AccSet中進(jìn)行設(shè)置,更改范圍為20%~100%。
(3)機(jī)械臂加速度坡度(記作:加加速度a’),用于調(diào)節(jié)機(jī)械臂加速度曲線,改善機(jī)械臂末端加減速過程的平滑性,是機(jī)械臂系統(tǒng)內(nèi)部額定值的百分比,單位為%??梢酝ㄟ^機(jī)械臂示教器,在運(yùn)動(dòng)指令-AccSet中進(jìn)行設(shè)置,更改范圍為20%~100%。
因?yàn)槿剂想姵貥O板在被吸取時(shí)即位于機(jī)械臂末端,因而選擇調(diào)整工具坐標(biāo)系本身的運(yùn)動(dòng)學(xué)參數(shù)可以更直觀地對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行采集和反饋。
離散型調(diào)優(yōu)變量為機(jī)械臂末端空間路徑方案p。機(jī)械臂末端空間路徑是指機(jī)械臂末端工具坐標(biāo)系原點(diǎn)在空間的線性運(yùn)動(dòng)軌跡。如表2所示,3條路徑選取相同的起點(diǎn)終點(diǎn),各自選取一個(gè)不同空間位置點(diǎn)作為中間插值點(diǎn)用以區(qū)分路徑。
表2 路徑點(diǎn)空間信息表 mm
路徑的起點(diǎn)、終點(diǎn)和中間插值點(diǎn)3點(diǎn)構(gòu)成了2條路徑線段,計(jì)算路徑線段長(zhǎng)度如表3所示。
表3 路徑線段長(zhǎng)度信息 mm
對(duì)于插值點(diǎn)—終點(diǎn)這段路徑,必然存在著機(jī)械臂減速階段,不可避免地會(huì)引起振動(dòng)。對(duì)減速過程的慣性力以機(jī)械臂基坐標(biāo)系按式(33)進(jìn)行正交分解:
式中:L為插值點(diǎn)—終點(diǎn)路徑長(zhǎng)度;i為某一正交方向;li為L(zhǎng)的在i上正交投影長(zhǎng)度; θi為慣性力在i正交方向上分量。并著重關(guān)注在X-Y平面的慣性力分量。得到的詳細(xì)信息如表4所示。
表4 路徑的正交分解
路徑耗時(shí)上,路徑2最短、路徑1次之、路徑3耗時(shí)最長(zhǎng);但相應(yīng)的,從平穩(wěn)性角度出發(fā),路徑3的TCP坐標(biāo)X-Y平面下的慣性力分量小于路徑1、小于路徑2,即路徑3最平穩(wěn)、路徑1次之、路徑2的振動(dòng)最大。換言之,路徑2耗時(shí)短但不平穩(wěn)、路徑3平穩(wěn)但耗時(shí)長(zhǎng),路徑1的兩方面都較折中。這3條路徑實(shí)際上對(duì)應(yīng)了運(yùn)動(dòng)特點(diǎn)的3種不同程度,因而設(shè)計(jì)此3條路徑并將之作為備選路徑方案參與優(yōu)化過程是具代表性及合理性的。
2.2.2 采樣空間劃分
貝葉斯調(diào)優(yōu)來需要給定調(diào)優(yōu)參數(shù)的采樣空間以及采樣間隔,采樣空間由實(shí)驗(yàn)設(shè)備的參數(shù)上下界或者待研究的參數(shù)范圍確定。采樣間隔應(yīng)該設(shè)置合理,避免出現(xiàn)過大過小情況。
對(duì)于高斯過程來說,需要將路徑方案p進(jìn)行映射。規(guī)定路徑1的方案編號(hào)為1,路徑2的方案編號(hào)為2,路徑3的方案編號(hào)為3。
因此設(shè)置如表5調(diào)優(yōu)參數(shù)信息,前述數(shù)據(jù)集D1:t中xt=(v,a,a′,p)T。
表5 優(yōu)化參數(shù)信息
機(jī)械臂在燃料電池極板安裝過程中,需要考慮裝配效率與精度。
機(jī)械臂的運(yùn)動(dòng)總時(shí)間會(huì)直接影響生產(chǎn)效率。在實(shí)驗(yàn)中,通過機(jī)械臂自帶的計(jì)時(shí)器得到單次運(yùn)行時(shí)間T,其分辨率為0.001 s。
機(jī)械臂末端殘余振動(dòng)是由于運(yùn)輸過程中的快速定位運(yùn)動(dòng)會(huì)激發(fā)機(jī)器人的結(jié)構(gòu)模態(tài),引起末端執(zhí)行器的慣性振動(dòng)[11]。在實(shí)驗(yàn)中,通過在機(jī)械臂末端布置加速度傳感器,采集運(yùn)動(dòng)結(jié)束前后0.4 s的時(shí)間段內(nèi)振動(dòng)信號(hào),計(jì)算振動(dòng)脈沖指數(shù)A,公式為
式中:A表示時(shí)間段內(nèi)信號(hào)絕對(duì)值最大值與絕對(duì)平均值之商,振動(dòng)沖擊越大,A越大。單位為無量綱數(shù),計(jì)算后小數(shù)位數(shù)保持為3位。
機(jī)械臂的絕對(duì)定位精度是用來衡量機(jī)械臂末端工具坐標(biāo)系原點(diǎn)到達(dá)空間目標(biāo)點(diǎn)準(zhǔn)確度的能力,分為位置精度與方向精度,其通常由靜態(tài)因素和動(dòng)態(tài)因素等共同作用;其中,動(dòng)態(tài)因素包括機(jī)械臂在運(yùn)動(dòng)過程中受慣性力等因素造成關(guān)節(jié)微變形與機(jī)械抖動(dòng)等情況。根據(jù)前述實(shí)驗(yàn)場(chǎng)景,電池極板在X-Y平面安裝的位置精度有著較高要求。在實(shí)驗(yàn)中,以30 mm×30 mm白色方片紙為定位基準(zhǔn),通過1 200 W像素?cái)z像頭采集每次運(yùn)動(dòng)結(jié)束后白色方片紙中心與參考位置中心的像素偏差,并計(jì)算轉(zhuǎn)化為長(zhǎng)度單位,計(jì)為機(jī)械臂的位置精度 μ,計(jì)算公式為
單方向上采集分辨率為0.01 mm。傳感器設(shè)備圖3所示。
圖3 振動(dòng)傳感器(左)攝像頭傳感器(右)
選擇單次運(yùn)動(dòng)的總時(shí)間T,振動(dòng)脈沖指數(shù)A以及其末端的位置精度 μ當(dāng)作判別指標(biāo)。三者皆為負(fù)向指標(biāo),即在實(shí)驗(yàn)過程中越小越好。層次分析法的判斷矩陣賦權(quán)原則:相同指標(biāo)同樣重要(量化值為1);時(shí)間較于振動(dòng)脈沖因子同樣重要(量化值為1);時(shí)間較于絕對(duì)定位偏差介于稍微重要和明顯重要之間(量化值為2);振動(dòng)脈沖因子較于絕對(duì)定位偏差介于稍微重要和明顯重要之間(量化值為2)。按照1.4節(jié)所述,計(jì)算得到3個(gè)子指標(biāo)的判斷矩陣如表6。計(jì)算特征向量與一致性,得到時(shí)間權(quán)重為0.4;振動(dòng)脈沖因子權(quán)重為0.4;絕對(duì)定位偏差權(quán)重為0.2,如表7所示。最后,總歸一指標(biāo)為各歸一化后的子指標(biāo)加權(quán)之和。
表6 判斷矩陣
表7 子指標(biāo)信息
實(shí)驗(yàn)結(jié)果的歸一指標(biāo)yt的有效位數(shù)與子指標(biāo)保持一致,計(jì)算公式如下。
按照前述流程,隨機(jī)森林與高斯過程的貝葉斯優(yōu)化各選擇3組相同的初始化參數(shù)開始調(diào)優(yōu),其中隨機(jī)森林的樹個(gè)數(shù)為20,貝葉斯優(yōu)化的采集函數(shù)為L(zhǎng)CB(保證95%的置信率);將得到的第一次運(yùn)動(dòng)參數(shù)x3+1當(dāng)作第一輪實(shí)驗(yàn)數(shù)據(jù),計(jì)算第一次歸一指標(biāo)y3+1,并將該組數(shù)據(jù)插入初始化數(shù)據(jù)集返回計(jì)算第二次運(yùn)動(dòng)參數(shù);依次迭代計(jì)算。得到高斯過程實(shí)驗(yàn)結(jié)果如表8所示,隨機(jī)森林實(shí)驗(yàn)結(jié)果如表9所示。
表8 高斯過程貝葉斯實(shí)驗(yàn)結(jié)果
表9 隨機(jī)森林貝葉斯實(shí)驗(yàn)結(jié)果
如表10所示,將二者調(diào)優(yōu)結(jié)果的歸一指標(biāo)與實(shí)驗(yàn)次數(shù)進(jìn)行對(duì)比分析,規(guī)定歸一指標(biāo)下降幅度除以實(shí)驗(yàn)次數(shù)為單位收益,用于衡量調(diào)優(yōu)算法綜合性能??梢缘玫剑憾呔諗康铰窂?,印證了路徑1長(zhǎng)度較短,X-Y平面慣性力分量較小的性質(zhì),表明了在處理離散參數(shù)二者均有著較好性能;隨機(jī)森林算法的綜合調(diào)優(yōu)性能較高斯過程提高了15%。證明了隨機(jī)森林作為概率代理模型在貝葉斯算法中有著較好的調(diào)優(yōu)性能,之后也可以推廣到存在離散與連續(xù)參數(shù)的工業(yè)調(diào)優(yōu)場(chǎng)景中。
表10 隨機(jī)森林與高斯過程對(duì)比實(shí)驗(yàn)結(jié)果
筆者從理論上分析了貝葉斯優(yōu)化方法概率代理模型與采集函數(shù),闡述了貝葉斯優(yōu)化方法在ABB IRB 1410機(jī)械臂運(yùn)動(dòng)參數(shù)優(yōu)化中的可行性。選擇了隨機(jī)森林與高斯過程兩種概率代理模型進(jìn)行實(shí)驗(yàn)對(duì)比:在選擇的調(diào)優(yōu)參數(shù)個(gè)數(shù)較少情況下,隨機(jī)森林貝葉斯的優(yōu)化效果比高斯貝葉斯高15%。
考慮到貝葉斯優(yōu)化的概率代理模型還有很多種,因此對(duì)其他概率模型代理下的貝葉斯優(yōu)算法在機(jī)械臂運(yùn)動(dòng)參數(shù)中的性能是下一步研究的重點(diǎn)。