徐倩倩,陳平平
(廣州中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程學(xué)院,廣州 510006)
基于深度技術(shù)手勢的圖像分類方法研究
徐倩倩,陳平平
(廣州中醫(yī)藥大學(xué)醫(yī)學(xué)信息工程學(xué)院,廣州510006)
規(guī)定6種常見的手勢,如圖1所示。
圖1 6種規(guī)定手勢圖像
利用Kinect傳感器硬件和上述的程序獲取規(guī)定6種規(guī)定手勢的深度圖像如圖2所示。
圖2 深度手勢圖像
3.1閾值分割
所謂閾值分割方法就是確定某個(gè)閾值Th,根據(jù)圖像中每個(gè)像素的灰度值大于或小于該閾值Th,來進(jìn)行圖像分割。閾值方法的數(shù)學(xué)模型如下[3]:
根據(jù)上式可知,閾值方法的核心就是閾值Th的確定方法。
3.2實(shí)驗(yàn)結(jié)果
以手勢1深度圖像進(jìn)行直方圖分析為例,其他手勢圖像以此類推。對圖3進(jìn)行灰度值分析,可獲得如圖4的灰度直方圖,通過觀察圖3可知,深度手勢圖像中手勢的顏色幾乎接近白色,即灰度值在255附近,由圖4分析可得,在灰度值255存在一波峰波谷并且區(qū)間范圍較小,這個(gè)區(qū)間就是深度手勢圖像區(qū)域,故只要找到第一個(gè)波峰,這個(gè)波峰的灰度值就是深度手勢圖像的分割閾值。按照此辦法,尋找圖3的分割閾值為灰度值222,對圖3進(jìn)行閾值分割后如圖5所示,由此可見閾值分割算法對于深度手勢圖像具有較好的分割效果。
傅里葉描述符的主要思想是利用表示形狀整體頻率分量的一組數(shù)字來描述輪廓特征。傅里葉描述主要包括兩個(gè)方面:首先,需要定義一個(gè)曲線表達(dá)式。其次利用傅里葉理論將其展開。傅里葉描述分為累加角函數(shù)和橢圓傅里葉描述等,由于橢圓描述符能保持曲線在二維空間的描述,所以本文采用橢圓傅里葉描述符對手勢圖像進(jìn)行描述。橢圓傅里葉描述符可定義為:
其中:
分別取規(guī)定手勢的深度圖像各10幅,并使用MATLAB求其橢圓傅里葉描述符,然后取手勢橢圓傅里葉描述符的前25數(shù)值,并求每種手勢10幅圖像的平均值,數(shù)據(jù)如表1所示。
圖3 深度手勢1圖像
圖4 深度手勢1圖像的直方圖
圖5 深度手勢1圖像的分割效果
以表1橢圓傅里葉描述符作為標(biāo)準(zhǔn)樣品,每種手勢再取5幅深度圖像作為測試樣品,利用歐幾里得距離公式計(jì)算其相異度,作為手勢分類的依據(jù)。不同手勢的相異度如表2所示,相同手勢的相異度如表3所示。
由結(jié)果可知,測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)之間的相異度越小,說明手勢即可分類為那一種,例如,表3中,手勢1與測試1的相異度為1.523,小于規(guī)定的量值(本文規(guī)定為2.5),即可接受為手勢1,而測試5中手勢1的相異度為3.689,大于2.5,不可接受,所以拒絕,即不是手勢1,以此類推。
表1 6種橢圓傅里葉描述符平均后數(shù)據(jù)
表2 不同手勢的相異度
表3 相同手勢的相異度
Kinect傳感器是基于視覺手勢識(shí)別系統(tǒng)的較好的圖像采集工具。而采用橢圓傅里葉描述符對處理后的深度手勢圖像進(jìn)行描述,橢圓傅里葉描述符可以保持曲線在二維空間的描述[4]。通過計(jì)算橢圓描述符相異度的計(jì)算,橢圓描述符對于手勢具有較好的分類效果。通過分析可得,不同手勢圖像的橢圓傅里葉描述符的差異性基本超過2.5,具有較大的差異性。而相同手勢的不同圖像的差異性較小。
[1]王輝.基于視覺的實(shí)時(shí)手勢跟蹤與識(shí)別及其在人機(jī)交互的應(yīng)用:[浙江大學(xué)碩士學(xué)位論文].杭州:浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)工程學(xué)院,2008,3-4.
[2]Pavlovic V I,Sharma R,Huang T S.Visual interpretation of hand gestures for human-computer interaction:a review.IEEE Transactions on Pattern Analysis and Machine Intelligence,1997,19(7):677-695.
[3]江立.基于CAS-GLOVE數(shù)據(jù)手套的手勢識(shí)別技術(shù)研究:[北京交通大學(xué)碩士學(xué)位論文].北京:計(jì)算機(jī)與信息技術(shù)學(xué)院,2006,12-14.
[4]莫舒.基于視覺的手勢分割算法的研究:[華南理工大學(xué)碩士學(xué)位論文].廣州:華南理工大學(xué)電子與信息學(xué)院,2012,5-6.
Kinect Sensor;Depth of the Images;threshold Segmentation;Elliptical Fourier Descriptors
Research on the Classification Method of Gesture Image Based on the Depth Technical
XU Qian-qian,CHEN Ping-ping
(College of Information Engineering,Guangzhou University of Chinese Medicine,510006)
1007-1423(2015)19-0020-04
10.3969/j.issn.1007-1423.2015.19.005
徐倩倩(1992-),女,安徽安慶人,碩士研究生,學(xué)生,研究方向?yàn)閳D形圖像學(xué)、多媒體信息處理
2015-04-29
2015-06-20
利用微軟的Kinect傳感器采集手勢圖像,通過微軟提供的軟件開發(fā)工具包接口,將采集的手勢圖像轉(zhuǎn)換為深度手勢圖像,并加強(qiáng)目標(biāo)區(qū)域的灰度級,即手勢區(qū)域的灰度值[1]。由于深度圖像包含距離信息,同時(shí)又因?yàn)槿嗽谟檬謩菔疽庑畔r(shí),往往會(huì)將手向前伸展,這樣,手勢距離Kinect傳感器的攝像頭更近,和人體的絕大部分不在一個(gè)平面上,也就是說手勢部分灰度值將異于身體的其他部分,這樣只要采用閾值分割算法就可以將手勢從背景中分離出來。
Kinect傳感器;深度圖像;閾值分割;橢圓傅里葉描述符
國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(No.201310572016)
陳平平(1980-),女,廣東梅州人,碩士,副教授,研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)
Uses Microsoft's Kinect sensor to capture gesture image.Through the software development tools packet interface which provided by Microsoft,changes the gesture image into depth gesture image acquisition,and strengthens the gray level value of the target area.Since the depth image contains distance information,and when people express information gestures,often will stretched forward the hands,so the gesture is closer to the camera Kinect sensor,and the vast majority of the human body is not in a plane on,that gesture is different from other parts of the gray values of the body,so long as the use of threshold segmentation algorithm can be separated from the background gesture.