羅國(guó)強(qiáng) 李家華 左文濤 方斌
摘? ?要:計(jì)算機(jī)視覺(jué)技術(shù)在現(xiàn)代社會(huì)中獲得了非常廣泛的應(yīng)用,加強(qiáng)對(duì)手勢(shì)識(shí)別技術(shù)的研究有助于促進(jìn)社會(huì)智能化的快速發(fā)展。目前,手勢(shì)識(shí)別技術(shù)的實(shí)現(xiàn)需要完成圖形預(yù)處理、手勢(shì)檢測(cè)以及場(chǎng)景劃分以及手勢(shì)識(shí)別3個(gè)步驟。此外,手勢(shì)特征可以分為動(dòng)態(tài)手勢(shì)以及靜態(tài)手勢(shì),在選用手勢(shì)識(shí)別方法時(shí)要明確兩者之間的區(qū)別,通常情況下選用的主要手勢(shì)識(shí)別技術(shù)有運(yùn)用模板匹配的方法、運(yùn)用SVM的動(dòng)態(tài)手勢(shì)識(shí)別方法以及運(yùn)用DTW的動(dòng)態(tài)手勢(shì)識(shí)別方法等。文章對(duì)此展開(kāi)研究。
關(guān)鍵詞:計(jì)算機(jī)視覺(jué);手勢(shì)識(shí)別;方法
隨著現(xiàn)代科學(xué)技術(shù)水平的不斷發(fā)展,計(jì)算機(jī)硬件與軟件部分都獲得了較大的突破,由此促進(jìn)了以計(jì)算機(jī)軟硬件為載體的計(jì)算機(jī)視覺(jué)技術(shù)的進(jìn)步,使得計(jì)算機(jī)視覺(jué)技術(shù)廣泛地應(yīng)用到多個(gè)行業(yè)領(lǐng)域中。手勢(shì)識(shí)別技術(shù)就是其中非常典型的一項(xiàng)應(yīng)用,該技術(shù)建立在計(jì)算機(jī)視覺(jué)技術(shù)基礎(chǔ)上來(lái)實(shí)現(xiàn)人類(lèi)與機(jī)器的信息交互,具有良好的應(yīng)用前景和市場(chǎng)價(jià)值,吸引了越來(lái)越多的專(zhuān)家與學(xué)者加入到手勢(shì)識(shí)別技術(shù)的研發(fā)中。手勢(shì)識(shí)別技術(shù)是以計(jì)算機(jī)為載體,利用計(jì)算機(jī)外接檢測(cè)部件(如傳感器、攝像頭等)對(duì)用戶(hù)某些特定手勢(shì)進(jìn)行精準(zhǔn)檢測(cè)及識(shí)別,同時(shí)將獲取的信息進(jìn)行整合并將分析結(jié)果輸出的檢測(cè)技術(shù)[1]。這樣的人機(jī)交互方法與傳統(tǒng)通過(guò)文字輸入進(jìn)行信息交互相比較具有非常多的優(yōu)點(diǎn),通過(guò)特定的手勢(shì)就可以控制機(jī)器作出相應(yīng)的反饋。
1? ? 基于計(jì)算機(jī)視覺(jué)技術(shù)的手勢(shì)識(shí)別主要步驟
通常情況下,要順利的實(shí)現(xiàn)手勢(shì)識(shí)別需要經(jīng)過(guò)以下幾個(gè)步驟:
第一,圖形預(yù)處理。該環(huán)節(jié)首先需要將連續(xù)的視頻資源分割成許多靜態(tài)的圖片,方便系統(tǒng)對(duì)內(nèi)容的分析和提取;其次,分析手勢(shì)識(shí)別對(duì)圖片的具體要求,并以此為根據(jù)將分割完成的圖片中的冗余信息排除掉,最后,利用平滑以及濾波等手段對(duì)圖片進(jìn)行處理[2]。
第二,手勢(shì)檢測(cè)以及場(chǎng)景劃分。計(jì)算機(jī)系統(tǒng)對(duì)待檢測(cè)區(qū)域進(jìn)行掃描,查看其中有無(wú)手勢(shì)信息,當(dāng)檢測(cè)到手勢(shì)后需要將手勢(shì)圖像和周?chē)谋尘胺蛛x開(kāi)來(lái),并鎖定需要進(jìn)行手勢(shì)識(shí)別的確切區(qū)域,為接下來(lái)的手勢(shì)識(shí)別做好準(zhǔn)備[3]。
第三,手勢(shì)識(shí)別。在將手勢(shì)圖像與周?chē)h(huán)境分離開(kāi)來(lái)后,需要對(duì)手勢(shì)特征進(jìn)行分析和收集,并且依照系統(tǒng)中設(shè)定的手勢(shì)信息識(shí)別出手勢(shì)指令。
2? ? 基于計(jì)算機(jī)視覺(jué)的手勢(shì)識(shí)別基本方法
在進(jìn)行手勢(shì)識(shí)別之前必須要完成手勢(shì)檢測(cè)工作,手勢(shì)檢測(cè)的主要任務(wù)是查看目標(biāo)區(qū)域中是否存在手勢(shì)、手勢(shì)的數(shù)量以及各個(gè)手勢(shì)的方位,并將檢測(cè)到的手勢(shì)與周?chē)h(huán)境分離開(kāi)來(lái)?,F(xiàn)階段實(shí)現(xiàn)手勢(shì)檢測(cè)的算法種類(lèi)相對(duì)較多,而將手勢(shì)與周?chē)h(huán)境進(jìn)行分離通常運(yùn)用圖像二值化的辦法,換言之,就是將檢測(cè)到手勢(shì)的區(qū)域標(biāo)記為黑色,而周邊其余區(qū)域標(biāo)記為白色,以灰度圖的方式將手勢(shì)圖形顯現(xiàn)出來(lái)[4],圖像二值法分離出的常見(jiàn)手勢(shì)圖形如圖1所示。
在完成手勢(shì)與周?chē)h(huán)境的分割后,就需要進(jìn)行手勢(shì)識(shí)別,該環(huán)節(jié)對(duì)處理好的手勢(shì)特征進(jìn)行提取和分析,并將獲得的信息資源代入到不同的算法中進(jìn)行計(jì)算,同時(shí)將處理后的信息與系統(tǒng)認(rèn)證的手勢(shì)特征進(jìn)行比對(duì),從而將目標(biāo)轉(zhuǎn)化為系統(tǒng)已知的手勢(shì)。目前,對(duì)手勢(shì)進(jìn)行識(shí)別主要通過(guò)以下幾種方法進(jìn)行。
2.1? 運(yùn)用模板匹配的方法
眾所周知,被檢測(cè)的手勢(shì)不會(huì)一直處于靜止?fàn)顟B(tài),也會(huì)存在非靜止?fàn)顟B(tài)下的手勢(shì)檢測(cè),相對(duì)來(lái)說(shuō)動(dòng)態(tài)手勢(shì)檢測(cè)難度較大,與靜態(tài)手勢(shì)檢測(cè)的方式也有一定的區(qū)別,而模板匹配的方法通常運(yùn)用在靜止?fàn)顟B(tài)下的手勢(shì)檢測(cè)。這種辦法需要將常用的手勢(shì)收錄到系統(tǒng)中,然后對(duì)目標(biāo)手勢(shì)進(jìn)行檢測(cè),將檢測(cè)信息進(jìn)行處理后得到檢測(cè)的結(jié)果,最后將檢測(cè)結(jié)果與數(shù)據(jù)庫(kù)中的手勢(shì)進(jìn)行比對(duì),匹配到相似度最高的手勢(shì),從而識(shí)別出目標(biāo)手勢(shì)指令[5]。常見(jiàn)的輪廓邊緣匹配以及距離匹配等都是基于這個(gè)方法進(jìn)行的。這些辦法都是模板匹配的細(xì)分,具有處理速度快、操作方式簡(jiǎn)單的優(yōu)點(diǎn),然而在分類(lèi)精確性上比較欠缺,在進(jìn)行不同類(lèi)型手勢(shì)進(jìn)行區(qū)分時(shí)往往受限于手勢(shì)特征,并且能夠識(shí)別出的手勢(shì)數(shù)量也比較有限。
2.2? 運(yùn)用SVM的動(dòng)態(tài)手勢(shì)識(shí)別方法
在21世紀(jì)初期,支持向量機(jī)(Support Vector Machine,SVM)方法被發(fā)明出來(lái)并獲得了較好的發(fā)展與應(yīng)用,在學(xué)習(xí)以及分類(lèi)功能上都十分優(yōu)秀。支持向量機(jī)方法是將被檢測(cè)的物體投影到高維空間,同時(shí)在此區(qū)域內(nèi)設(shè)定最大間隔超平面,以此來(lái)實(shí)現(xiàn)對(duì)目標(biāo)特征的精確區(qū)分。在運(yùn)用支持向量機(jī)的方法來(lái)進(jìn)行動(dòng)態(tài)手勢(shì)識(shí)別時(shí),其關(guān)鍵點(diǎn)是選取適宜的特征向量。為了逐步解決這樣的問(wèn)題,相關(guān)研發(fā)人員提出了利用尺度恒定特征為基礎(chǔ)來(lái)獲得待檢測(cè)目標(biāo)樣本的特征點(diǎn),再將獲得的信息數(shù)據(jù)進(jìn)行向量化,最后,利用支持向量機(jī)方法來(lái)完成對(duì)動(dòng)態(tài)手勢(shì)的識(shí)別。
2.3? 運(yùn)用DTW的動(dòng)態(tài)手勢(shì)識(shí)別方法
動(dòng)態(tài)時(shí)間歸整(Dynamic Time Warping,DTW)方法,最開(kāi)始是運(yùn)用在智能語(yǔ)音識(shí)別領(lǐng)域,并獲得了較好的應(yīng)用效果,具有非常高的市場(chǎng)應(yīng)用價(jià)值。動(dòng)態(tài)時(shí)間歸整方法的工作原理是以建立可以進(jìn)行調(diào)整的非線(xiàn)性歸一函數(shù)或者選用多種形式不同的彎曲時(shí)間軸來(lái)處理各個(gè)時(shí)間節(jié)點(diǎn)上產(chǎn)生的非線(xiàn)性變化。在使用動(dòng)態(tài)時(shí)間歸整方法進(jìn)行目標(biāo)信息區(qū)分時(shí),通常是創(chuàng)建各種類(lèi)型的時(shí)間軸,并利用各個(gè)時(shí)間軸的最大程度重疊來(lái)完成區(qū)分工作。為了保證動(dòng)態(tài)時(shí)間歸整方法能夠在手勢(shì)識(shí)別中取得較好的效果,研究人員已經(jīng)開(kāi)展的大量的研發(fā)工作,并實(shí)現(xiàn)了5種手勢(shì)的成功識(shí)別,且準(zhǔn)確率達(dá)到了89.1%左右。
3? ? 結(jié)語(yǔ)
通常情況下許多手勢(shì)檢測(cè)方法都借鑒人們?nèi)粘I钪杏^察目標(biāo)與識(shí)別目標(biāo)的思路,人類(lèi)在確認(rèn)目標(biāo)事物時(shí)是依據(jù)物體色彩、外形以及運(yùn)動(dòng)情況等進(jìn)行區(qū)分,計(jì)算機(jī)視覺(jué)技術(shù)也是基于此,所以在進(jìn)行手勢(shì)識(shí)別時(shí)也要加強(qiáng)人類(lèi)識(shí)別方法的應(yīng)用,促使基于計(jì)算機(jī)視覺(jué)技術(shù)的手勢(shì)識(shí)別能夠更快速、更精準(zhǔn)。
[參考文獻(xiàn)]
[1]童欣.一種基于OpenCV的手勢(shì)輪廓識(shí)別與指尖定位跟蹤方法[J].福建電腦,2018(12):96-97,109.
[2]張忠軍.基于膚色橢圓邊界模型和改進(jìn)幀差分算法的手勢(shì)分割方法[J].福建電腦,2018(5):8-10.
[3]張春燕.基于計(jì)算機(jī)視覺(jué)的可變形手勢(shì)跟蹤算法改進(jìn)研究[J].計(jì)算機(jī)測(cè)量與控制,2016(11):219-221,225.
[4]季越.基于計(jì)算機(jī)視覺(jué)的手勢(shì)識(shí)別人機(jī)交互技術(shù)探討[J].電腦迷,2016(9):39.
[5]張毅,劉鈺然,羅元.基于視覺(jué)的手勢(shì)識(shí)別方法及其在數(shù)字信號(hào)處理器上的實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用,2014(3):833-836,856.