李翠 王小妮 劉園園
摘要:為了增強(qiáng)人機(jī)交互的人性化和多樣化,設(shè)計了一種基于SIFT算法的手勢實(shí)時控制系統(tǒng)。本系統(tǒng)只需普通PC機(jī)與攝像頭就能對手勢進(jìn)行準(zhǔn)確的識別。并且還可以進(jìn)一步對采集到的圖像進(jìn)行選擇,這一選擇主要是依據(jù)膚色檢測得來的,另外我們還可以采用SIFT算法找到與待測圖像相應(yīng)的圖像,充分發(fā)揮手勢識別技術(shù)的優(yōu)勢,利用輸出信息完成實(shí)踐應(yīng)用的控制工作。該系統(tǒng)不需要建立大容量的樣本庫,運(yùn)行速度較快,對手勢的識別具有較高的準(zhǔn)確性。
關(guān)鍵詞:手勢識別;SIFT算法;膚色檢測;特征點(diǎn)
中圖分類號:TP391.4 文獻(xiàn)識別碼:A 文章編號:1001-828X(2016)015-000-01
引言
伴隨著全球信息技術(shù)的飛躍式發(fā)展,人們對計算機(jī)的使用提出了更高的要求,手勢交互方式具有較多的推廣優(yōu)勢,如生動形象、具體等,因此手勢交互方法被普遍應(yīng)用在人機(jī)交互工作中。
一般情況下,手勢控制系統(tǒng)可以被分為兩大類,主要依據(jù)就是輸入設(shè)備的差異,第一類是針對數(shù)據(jù)手套的手勢控制體系,第二類是針對視覺的徒手手勢控制體系。后者的控制體系通常需要較大容量的樣本庫為后續(xù)工作奠定基礎(chǔ),還應(yīng)該確切的描繪出不同手勢的具體范圍,對周圍環(huán)境的要求非常高[3]。
在上述問題的基礎(chǔ)上,下面文章中創(chuàng)建了一種SIFT算法的手勢控制體系。
一、針對手勢控制系統(tǒng)的相關(guān)設(shè)計
文章中的相關(guān)研究都是通過Windows操作系統(tǒng)平臺來完成的,利用Matlab開發(fā)工具設(shè)計和開發(fā)了手勢控制系統(tǒng),借助普通攝像頭和家用PC機(jī),對手勢進(jìn)行識別,并成功控制了具體應(yīng)用。我們可以大致把使用體系粉塵兩大類:第一類是針對手部膚色的檢測,第二類是針對SIFT算法的手勢識別技術(shù)。
1.基于膚色的手部區(qū)域檢測
不同的手勢不會改變皮膚自身的顏色,在所有的圖像中,手部膚色圖像是比較穩(wěn)定的。不僅如此,人們的手部在太陽光的照射下色彩幾乎相同,并且色彩不會受到被檢測者的年齡、性別、種族的影響,可以通過手部膚色收集手部區(qū)域的基礎(chǔ)信息。
因?yàn)槠胀〝z像頭收集到的圖片是RGB彩色空間的,因此無法對其直接處理,一定要把其轉(zhuǎn)換成YCbCr彩色空間,才能提升處理效果。
文章中把收集到的圖片進(jìn)行圖像銳化處理,然后在YcbCr空間中提取膚色區(qū)域,最后對處理得到的二值圖像進(jìn)行形態(tài)學(xué)運(yùn)算,只有這樣才能得到較為滿意的手部區(qū)域圖像。
2.基于SIFT算法的手勢識別
經(jīng)上一步的判斷后,若攝像頭采集到的圖像中包含有足夠面積的手部區(qū)域,則對其進(jìn)行識別。本文采用SIFT算法對無背景干擾的手勢進(jìn)行識別。
這種新型的算法的雛形是在上個世紀(jì)被人們發(fā)現(xiàn)的,隨后人們又對其進(jìn)行了總結(jié)創(chuàng)新。運(yùn)用這種算法收集到的SIFT特征向量屬于圖像的一種普遍特征,如果我們可以確保其亮度保持不變、尺度縮放比例不變,就能夠確保其噪聲、視角變化比例等的穩(wěn)定性[1]。
SIFT算法主要有以下幾點(diǎn):
首先,我們需要認(rèn)真落實(shí)尺度空間的極值點(diǎn)。要想準(zhǔn)確得到圖像尺度空間,我們需要利用高斯函數(shù)來獲取。
其次,我們需要科學(xué)選擇穩(wěn)定的關(guān)鍵點(diǎn)。通過認(rèn)真選擇那些計算出的極值點(diǎn),去掉其中的不穩(wěn)定因素,進(jìn)而提升關(guān)鍵點(diǎn)的穩(wěn)定性能極其自身抵抗噪聲的能力,為此我們可以參考文相關(guān)文獻(xiàn)[2]。
第三,我們應(yīng)該把選好的關(guān)鍵點(diǎn)搭配相應(yīng)的方向。要想確保SIFT自身的旋轉(zhuǎn)不變特征,就應(yīng)該準(zhǔn)確找到特征點(diǎn)的主方向。然后結(jié)合不同的特征尺度選擇相近的高斯平滑圖像L,準(zhǔn)確計算L上每一個點(diǎn)的梯度和方向,隨后進(jìn)行相鄰窗口的采樣分析,選用直方圖直觀呈現(xiàn)給人們所有點(diǎn)的梯度方向。
二、實(shí)驗(yàn)結(jié)果與分析
為了驗(yàn)證系統(tǒng)的有效性和準(zhǔn)確度,本文選用了2種簡單手勢進(jìn)行實(shí)驗(yàn),對2種手勢各采集1張,作為樣本圖像。兩種手勢對應(yīng)的命令分別為開始、前進(jìn)。
經(jīng)過相應(yīng)的研究我們不難看出,手勢控制體系的樣本圖像識別結(jié)果不會受到手指不同動作、手勢缺失以及光照差異的影響。
使用Matlab編寫了簡單的圖像播放器、音頻播放器,通過手勢控制系統(tǒng)對兩播放器進(jìn)行操作。對每個播放器每種手勢各使用50次,統(tǒng)計兩播放器被正確控制的次數(shù)。
三、結(jié)束語
本文提出的方法對少量的手勢識別效果較佳,如要求識別大量手勢,則隨著各手勢間SIFT特征差異變小,識別結(jié)果容易出現(xiàn)錯誤。如果想取得比較好的效果,必須對現(xiàn)在采用的特征點(diǎn)匹配方法加以改進(jìn),提高特征點(diǎn)匹配準(zhǔn)確率。同時,識別大量手勢需增加樣本圖像的數(shù)量,將增加計算量和識別耗時,為解決這一問題需要對手勢進(jìn)行歸類,識別時對待測圖像進(jìn)行粗分類,然后將待測圖像與其對應(yīng)類別中的樣本圖像進(jìn)行匹配。下一步將研究上述兩個問題的具體解決方案。
參考文獻(xiàn):
[1]Darid G. Lowe. Object recognition from local scale-invariant features [C].International Conference on Computer Vision, 1999: 1150-1157.
[2]Darid G. Lowe. Distinctive Image Features from Scale-invariant Keypoints [J].International Journal of Computer Vision, 2004, 60(2):91-110.
[3]劉寅,滕曉龍,劉重慶. 復(fù)雜背景下基于傅立葉描述子的手勢識別[J].計算機(jī)仿真;2005,22(12):158-161.
現(xiàn)代經(jīng)濟(jì)信息2016年15期