隨著計(jì)算機(jī)技術(shù)戶互聯(lián)網(wǎng)技術(shù)的發(fā)展,以及人工智能技術(shù)研究的不斷深入,人們對(duì)于計(jì)算機(jī)的使用要求越來越高。為滿足用戶不斷增加的需求,研究人員在人機(jī)交互軟件設(shè)計(jì)、開發(fā)方面投入了大量精力,其中,手勢(shì)識(shí)別技術(shù)就是目前使用較為廣泛的智能交互技術(shù)。本文以手勢(shì)識(shí)別技術(shù)在軟件中的應(yīng)用為研究?jī)?nèi)容,對(duì)該技術(shù)進(jìn)行分類闡述,并對(duì)其應(yīng)用進(jìn)行簡(jiǎn)單介紹。
【關(guān)鍵詞】視覺 手勢(shì)識(shí)別 軟件 人機(jī)交互
為實(shí)現(xiàn)更加友好的人機(jī)交互功能,研究人員利用機(jī)器視覺技術(shù),結(jié)合計(jì)算機(jī)軟件算法設(shè)計(jì),實(shí)現(xiàn)了通過識(shí)別用戶手勢(shì),對(duì)計(jì)算機(jī)進(jìn)行操作的功能。手勢(shì)識(shí)別功能的實(shí)現(xiàn),為計(jì)算機(jī)智能化應(yīng)用提供了借鑒,同時(shí)也開啟了計(jì)算機(jī)軟件技術(shù)發(fā)展的新篇章。
1 手勢(shì)識(shí)別技術(shù)的原理
手勢(shì)識(shí)別技術(shù)的實(shí)現(xiàn),需要完整的視覺手勢(shì)識(shí)別系統(tǒng)進(jìn)行圖像信息的采集、處理、特征點(diǎn)計(jì)算、分類器設(shè)計(jì)、手勢(shì)識(shí)別五個(gè)過程。在圖像采集方面,盡管手勢(shì)識(shí)別系統(tǒng)所記錄的是動(dòng)態(tài)過程,卻僅僅選取特征點(diǎn)較為明顯的幾幀畫面作為進(jìn)行識(shí)別,結(jié)合手勢(shì)輸入的交互模型進(jìn)行手勢(shì)特征點(diǎn)的檢測(cè),并根據(jù)特征點(diǎn)的判斷結(jié)果,完成對(duì)應(yīng)的手勢(shì)操作。其中,手勢(shì)識(shí)別技術(shù)最為關(guān)鍵的三個(gè)步驟是手勢(shì)分割、特征點(diǎn)識(shí)別、軟件算法。
1.1 手勢(shì)分割
所謂手勢(shì)分割,是指采用圖像處理技術(shù),直接選取有用的圖像信息,對(duì)局部區(qū)域信息進(jìn)行有效分割,提高信息數(shù)據(jù)的有效性,降低計(jì)算機(jī)圖像處理的壓力,具體方法有閾值法、區(qū)域信息分割法、物理特征分割法。
1.2 特征點(diǎn)識(shí)別
基于手勢(shì)變化的多樣性,為準(zhǔn)確完成手勢(shì)識(shí)別過程,多采用動(dòng)態(tài)圖像采集,后期對(duì)圖像中每一幀中的手勢(shì)進(jìn)行紋理特征識(shí)別,對(duì)于滿足手勢(shì)輪廓、手勢(shì)邊緣、圖像矩等特征要求的圖片,則由手勢(shì)識(shí)別軟件進(jìn)行對(duì)應(yīng)特征點(diǎn)的計(jì)算,并完成操作動(dòng)作。
1.3 軟件算法
手勢(shì)識(shí)別的關(guān)鍵在于軟件算法的使用,目前,基于靜態(tài)的手勢(shì)識(shí)別算法有著較為廣泛的應(yīng)用,這也是為何將原始動(dòng)態(tài)錄像進(jìn)行幀檢測(cè)的原因。對(duì)于滿足特征點(diǎn)的圖像,由計(jì)算機(jī)軟件對(duì)相應(yīng)特征點(diǎn)進(jìn)行計(jì)算,并按照?qǐng)D片順序進(jìn)行特征點(diǎn)關(guān)聯(lián)。
在軟件算法中,多采用模版匹配技術(shù),將滿足特征點(diǎn)要求的圖像與數(shù)據(jù)庫中的圖像進(jìn)行匹配,對(duì)滿足閾值要求的手勢(shì)特征參數(shù)進(jìn)行識(shí)別,根據(jù)手勢(shì)參數(shù)的變化,設(shè)置與之相對(duì)應(yīng)的運(yùn)動(dòng)參量,實(shí)現(xiàn)對(duì)應(yīng)的運(yùn)動(dòng)過程。
2 手勢(shì)識(shí)別技術(shù)的分類
隨著計(jì)算機(jī)人機(jī)智能交互軟件種類的增加,手勢(shì)識(shí)別技術(shù)也出現(xiàn)了不同的類別,其中,以二維手型識(shí)別技術(shù)、二維手勢(shì)識(shí)別技術(shù)、三維手勢(shì)識(shí)別技術(shù)的應(yīng)用最為常見。
2.1 二維手型識(shí)別技術(shù)
在眾多手勢(shì)識(shí)別技術(shù)中,二維手勢(shì)識(shí)別技術(shù)的實(shí)現(xiàn)難度最低,也就是通過獲取帶有特征點(diǎn)的二維圖像信息(靜態(tài)),并對(duì)比數(shù)據(jù)庫中的特征點(diǎn)參數(shù),實(shí)現(xiàn)感知功能。然而,二維手型識(shí)別技術(shù)僅能夠?qū)?jiǎn)單的靜態(tài)圖像進(jìn)行識(shí)別,對(duì)于連續(xù)性動(dòng)作則無法起到作用,并且,由于數(shù)據(jù)庫的特征點(diǎn)參數(shù)較少,導(dǎo)致其無法識(shí)別更多手勢(shì)。
因此,對(duì)于二維手型識(shí)別技術(shù),研究人員也將其成為模式匹配技術(shù),該技術(shù)雖然簡(jiǎn)單,卻為手勢(shì)識(shí)別技術(shù)的進(jìn)一步發(fā)展奠定了基礎(chǔ)。
2.2 二維手勢(shì)識(shí)別技術(shù)
二維手勢(shì)識(shí)別技術(shù)是在二維手型識(shí)別技術(shù)的基礎(chǔ)上發(fā)展起來的,盡管,二維手勢(shì)識(shí)別技術(shù)依然停留在平面坐標(biāo)系中,但是,利用軟件的自動(dòng)圖像匹配技術(shù),以及動(dòng)態(tài)數(shù)據(jù)庫,可以對(duì)簡(jiǎn)單的動(dòng)作進(jìn)行錄取、特征點(diǎn)捕捉、特征點(diǎn)匹配、動(dòng)作響應(yīng)等一系列操作。例如,對(duì)計(jì)算機(jī)播放器進(jìn)行暫停、播放、下一曲控制,或者是在教學(xué)過程中對(duì)幻燈片的翻頁操作,都可以通過不同的手勢(shì)動(dòng)作完成。
二維手勢(shì)識(shí)別技術(shù)的出現(xiàn),極大的豐富了數(shù)據(jù)庫的特征點(diǎn)參數(shù),擴(kuò)大了計(jì)算機(jī)軟件的識(shí)別范圍,也促進(jìn)了這一技術(shù)在多領(lǐng)域的應(yīng)用。
2.3 三維手勢(shì)識(shí)別技術(shù)
從實(shí)際使用效果來看,三維手勢(shì)識(shí)別技術(shù)的準(zhǔn)確度更高,盡管實(shí)現(xiàn)難度較大,卻可以完成二維手勢(shì)識(shí)別不可能完成的動(dòng)作。由于動(dòng)態(tài)圖像處理是基于空間坐標(biāo)系,因此,在圖像錄取時(shí)需要使用多個(gè)攝像頭,對(duì)手勢(shì)進(jìn)行全方位補(bǔ)做,以獲取更為全面的特征點(diǎn)參數(shù)。
三維手勢(shì)識(shí)別技術(shù)的實(shí)現(xiàn)主要包括結(jié)構(gòu)光、光飛時(shí)間、多角成像三大方式,結(jié)合先進(jìn)的視覺手勢(shì)識(shí)別算法,以及強(qiáng)大的數(shù)據(jù)庫支持,就可以準(zhǔn)確響應(yīng)每一個(gè)手勢(shì),完成相關(guān)動(dòng)作。
3 手勢(shì)識(shí)別技術(shù)在軟件應(yīng)用中的趨勢(shì)
對(duì)于手勢(shì)識(shí)別技術(shù)在軟件中的應(yīng)用,三種不同類型的手勢(shì)識(shí)別技術(shù)都有著不同的領(lǐng)域,基于多種技術(shù)的共同發(fā)展,以及手勢(shì)識(shí)別技術(shù)的應(yīng)用范圍不斷擴(kuò)大,手勢(shì)識(shí)別技術(shù)在軟件應(yīng)用中的趨勢(shì)將向著人工智能的方向發(fā)展。
隨著生物技術(shù)的發(fā)展,人們已經(jīng)能夠在一定程度上破解有大腦所發(fā)出的生物電信號(hào)。對(duì)于手勢(shì)識(shí)別技術(shù)的研究,也將由真實(shí)的動(dòng)作信號(hào)捕捉,向著無法看到的生物電信號(hào)檢測(cè)進(jìn)行變化。
例如,醫(yī)學(xué)研究人員通過對(duì)正常人在做出手勢(shì)動(dòng)作時(shí)的腦電波進(jìn)行檢測(cè)、比對(duì),以數(shù)據(jù)庫的形式進(jìn)行存儲(chǔ)于智能仿生機(jī)械臂的中央處理芯片中。對(duì)于安裝此類仿生機(jī)械臂的殘疾人,則可以通過腦電波對(duì)應(yīng)的手勢(shì),操控機(jī)械臂進(jìn)行運(yùn)動(dòng)。如此一來,人們將不再通過真實(shí)的手勢(shì)動(dòng)作來實(shí)現(xiàn)操作,而是通過大腦所發(fā)出的手勢(shì)生物電信號(hào)來完成操作,不僅響應(yīng)速度有所提高,同時(shí)也提高了手勢(shì)動(dòng)作的精準(zhǔn)度。
參考文獻(xiàn)
[1]江鐵成.基于視覺手勢(shì)識(shí)別技術(shù)的實(shí)踐研究[J].合肥師范學(xué)院學(xué)報(bào),2016(03).
[2]郭雷.動(dòng)態(tài)手勢(shì)識(shí)別技術(shù)綜述[J].軟件導(dǎo)刊,2015(07).
[3]劉俊梅.一種復(fù)雜背景下的手勢(shì)分割新方法[J].北京電子科技學(xué)院學(xué)報(bào),2006(02).
作者簡(jiǎn)介
于珈盛(2000-),男,內(nèi)蒙古通遼市奈曼旗人。內(nèi)蒙古通遼市奈曼旗實(shí)驗(yàn)中學(xué)學(xué)生。
作者單位
內(nèi)蒙古通遼市奈曼旗實(shí)驗(yàn)中學(xué) 內(nèi)蒙古自治區(qū)通遼市 028300