楊世強(qiáng),喬 丹,弓逯琦,李小莉,李德信
基于Laplace逼近Gaussian過程的指節(jié)圖像中層偏移測度特征學(xué)習(xí)
楊世強(qiáng),喬 丹,弓逯琦,李小莉,李德信
(西安理工大學(xué)機(jī)械與精密儀器工程學(xué)院,陜西 西安 710048)
在人機(jī)協(xié)調(diào)裝配中,為了準(zhǔn)確描述手部位姿,需要精確的指節(jié)圖像特征提取與識(shí)別。為了豐富手部信息,提出了基于Laplace逼近Gaussian過程的多分類算法,以實(shí)現(xiàn)基于手部圖像的指節(jié)識(shí)別。在類別信息無關(guān)聯(lián)的假設(shè)基礎(chǔ)上,將中層偏移測度特征的學(xué)習(xí)轉(zhuǎn)化為對(duì)隨機(jī)量的學(xué)習(xí);然后通過分析二值多分類高斯場上的后驗(yàn)計(jì)算,給出了基于Laplace逼近Gaussian過程的多分類高斯過程學(xué)習(xí)算法;通過構(gòu)造中層隨機(jī)信息的正定核函數(shù),給出了基于Laplace的多分類高斯過程預(yù)測算法。最后,利用中層數(shù)據(jù)的分布學(xué)習(xí)與預(yù)測算法進(jìn)行了指節(jié)圖像訓(xùn)練學(xué)習(xí)和固定閾值的圖像識(shí)別。識(shí)別結(jié)果顯示,該方法具有一定的指節(jié)識(shí)別能力。
高斯過程;圖像識(shí)別;指節(jié)圖像;特征學(xué)習(xí)
隨著復(fù)雜機(jī)電裝備集成化、精密化與智能化程度的不斷提升,生產(chǎn)過程中的制造系統(tǒng)需進(jìn)一步提高其敏捷性、適應(yīng)性與可重復(fù)性,高柔性裝配技術(shù)對(duì)高效研發(fā)與精密制造有著重要意義[1-2]。在智能機(jī)器人技術(shù)的快速發(fā)展及其在制造系統(tǒng)中日益廣泛地應(yīng)用這一背景下,智能化的人機(jī)協(xié)調(diào)裝配技術(shù)被認(rèn)為是提高裝配系統(tǒng)柔性的有效方法[3]。基于機(jī)器視覺的人機(jī)交互協(xié)調(diào)裝配技術(shù),將圖像分析獲得的人體裝配姿態(tài)、動(dòng)作和意圖作為裝配機(jī)器人任務(wù)規(guī)劃的輸入信息,通過協(xié)作實(shí)現(xiàn)高效高柔性的裝配。手部圖像及其關(guān)聯(lián)包含手部裝配姿態(tài)的總體信息,因此圖像特征檢測手部生物結(jié)構(gòu)是裝配操作意圖推斷的基礎(chǔ)[4]。
手勢識(shí)別主要有2個(gè)研究方向,①使用傳感器和探測器等外設(shè)工具實(shí)現(xiàn)手勢識(shí)別,該方法通過傳感器進(jìn)行精確的手部位姿提取,實(shí)現(xiàn)較為精準(zhǔn)的手勢識(shí)別,但不夠便捷,需要外部設(shè)備的支持。②使用拍攝圖像進(jìn)行無標(biāo)記的手勢識(shí)別,精確度不夠高,魯棒性與穩(wěn)定性依然不足,需要進(jìn)一步研究手部圖像特征檢測技術(shù)以提高其精確度與準(zhǔn)確提取手部位姿的能力。
目前在圖像特征檢測領(lǐng)域涌現(xiàn)出許多新的識(shí)別技術(shù),不同領(lǐng)域所使用的方法與其側(cè)重點(diǎn)各有不同,有些側(cè)重于特征提取技術(shù),如DING等[5]利用雙重局部二值模式(double local binary pattern, DLBP)檢測視頻中的幀峰值;YAO等[6]給出了一種基于LLE的基于過濾器的特征選擇方法;在模型建立方面,文獻(xiàn)[7]將一個(gè)動(dòng)作類別作為靈活的身體部分的空間配置數(shù)目進(jìn)行建模,開發(fā)了一種層次化的空間SPN方法,模擬子圖像內(nèi)各部分之間的空間關(guān)系,并通過SPN的附加層對(duì)子圖像的相關(guān)性進(jìn)行建模;PANDA等[8]提出了特征驅(qū)動(dòng)選擇分類算法(feature driven selective classification, FALCON),優(yōu)化了機(jī)器學(xué)習(xí)分類器的能量效率;對(duì)于特征聚類的研究有助于圖像特征分類,LI等[9]在解決監(jiān)控應(yīng)用中的自動(dòng)異常檢測問題中使用以無監(jiān)督主成分分析(unsupervised principal component analysis, UPCA)為基礎(chǔ)的特征聚類算法實(shí)現(xiàn)自動(dòng)選擇最優(yōu)數(shù)目的聚類;JIANG等[10]提出了一種基于模糊相似度的自組織特征聚類算法用以提取文本特征,該方法運(yùn)行速度快,可以比其他方法更好地提取特征;RAHMANI和AKBARIZADEH[11]提出了一種使用無監(jiān)督特征學(xué)習(xí)(unsupervised feature learning, UFL)的譜聚類方法。
高斯過程(Gaussian process, GP)學(xué)習(xí)作為一種被普遍使用的特征識(shí)別方法,近幾年來眾多學(xué)者對(duì)其進(jìn)行了廣泛研究。由于GP模型易于實(shí)現(xiàn)的特點(diǎn),可以用來優(yōu)化識(shí)別效果,SHIN等[12]提出了一個(gè)三維點(diǎn)云的實(shí)時(shí)分割算法,采用高斯過程提高了分割準(zhǔn)確性,以減少過分割效應(yīng)。GP同樣被用來排除異常與模糊的數(shù)據(jù)[13-14]。XILOYANNI等[15]運(yùn)用了新穎的高斯過程自回歸框架,以學(xué)習(xí)手關(guān)節(jié)和肌肉活動(dòng)的連續(xù)映射來計(jì)算預(yù)期的手部運(yùn)動(dòng)。JIANG等[16]將監(jiān)督潛在線性高斯過程潛變量模型(supervised latent linear Gaussian process latent variable model, SLLGPLVM)用于特征提取,對(duì)高光譜圖像(hyperspectral image, HSI)分類。
基于膚色模型的圖像分割可初步解決手部的圖像定位問題,而如指形姿態(tài)、指節(jié)位置等表征手部生物結(jié)構(gòu)的重要圖像特征仍需進(jìn)一步識(shí)別。在手部半握及全握姿態(tài)下,對(duì)應(yīng)于手部關(guān)節(jié)位置處的骨節(jié)結(jié)構(gòu),指節(jié)圖像的灰度分布在手指局部位置附近呈現(xiàn)不規(guī)則凸包結(jié)構(gòu),可將該非確定性不規(guī)則凸包作為指節(jié)圖像的一種隨機(jī)隱結(jié)構(gòu)。文獻(xiàn)[17]以手指關(guān)節(jié)圖像為例,針對(duì)上述灰度結(jié)構(gòu)模糊、特征隱含且抽取困難的一類隨機(jī)圖像,通過灰度分布的密度估計(jì)獲得圖像隱特征,利用該觀測建立圖像隱特征模式的學(xué)習(xí)與估計(jì)算法框架,給出了隨機(jī)圖像上偏移特征的提取與分析方法。鑒于隨機(jī)偏移集自身的分布復(fù)雜性,不同偏移參數(shù)區(qū)間所對(duì)應(yīng)偏移特征間的差異比較大,且偏移參數(shù)越遠(yuǎn)離標(biāo)準(zhǔn)值,其對(duì)應(yīng)特征就越復(fù)雜,所以在對(duì)隨機(jī)圖像雙側(cè)偏移測度的學(xué)習(xí)過程中,特別針對(duì)偏移參數(shù)在區(qū)間[0.50,0.85]內(nèi)的中層數(shù)據(jù)[17],需深入分析訓(xùn)練圖像庫中實(shí)際偏移觀測的隨機(jī)分布特點(diǎn),選用恰當(dāng)?shù)哪P瓦M(jìn)行學(xué)習(xí)。本文通過對(duì)中層密度位置多標(biāo)簽分布隨機(jī)場模型的學(xué)習(xí),獲得條件偏移概率的等價(jià)密度估計(jì)。首先對(duì)中層偏移測度的分布進(jìn)行訓(xùn)練,并將其特征的學(xué)習(xí)轉(zhuǎn)化為了對(duì)隨機(jī)量的學(xué)習(xí)。然后,通過對(duì)二值多分類高斯場上的后驗(yàn)計(jì)算,給出了基于整體訓(xùn)練數(shù)據(jù)集的隱函數(shù)后驗(yàn)更新,通過中層隨機(jī)信息的正定核函數(shù)構(gòu)造,給出了基于訓(xùn)練集的隱向量預(yù)測,通過對(duì)樣本進(jìn)行試驗(yàn),驗(yàn)證了算法的可行性。
(a) 第1類(b) 第2類(c) 第3類
針對(duì)隨機(jī)場上的多分類問題,考慮到不同的標(biāo)簽值對(duì)應(yīng)不同的水平參數(shù)區(qū)間,且標(biāo)記類別值在有限離散空間為進(jìn)行取值,同時(shí)圖像位置處對(duì)應(yīng)多類別標(biāo)簽間的關(guān)系并不是完全確定的,因此對(duì)所有類別標(biāo)簽的隨機(jī)分布需進(jìn)行統(tǒng)一建模與表示,才能較好地恢復(fù)中層數(shù)據(jù)分布的整體特征。本文利用GP模型[18],以觀測數(shù)據(jù)作為訓(xùn)練樣本集,選用Bernoulli分布表示圖像固定位置處對(duì)單類別標(biāo)簽的概率,以隨機(jī)場上類別標(biāo)簽的概率結(jié)果作為訓(xùn)練輸出。而3類標(biāo)簽間的分布模式進(jìn)一步包含有2類信息,其一為同一位置處狀態(tài)標(biāo)簽的激活與轉(zhuǎn)換,其二是不同位置多狀態(tài)間的分布關(guān)系。針對(duì)前者,利用Gibbs形式表示標(biāo)簽對(duì)應(yīng)多項(xiàng)式分布中的參數(shù)關(guān)聯(lián);考慮到學(xué)習(xí)過程復(fù)雜性的限制,假設(shè)不同圖像位置間的不同標(biāo)記類無關(guān),而同類標(biāo)簽的聯(lián)合分布具有Gaussian特點(diǎn),并利用Gaussian場函數(shù)表示同類別間的標(biāo)記關(guān)聯(lián),即