(廣東工業(yè)大學(xué)華立學(xué)院,廣東 廣州 511325)
當(dāng)今社會(huì)計(jì)算機(jī)信息技術(shù)的高速發(fā)展使得人們對(duì)生活品質(zhì)的要求越來越高,在家具體驗(yàn)中智能化的需求也不斷增加,即希望創(chuàng)造出更加舒適、安全和智能的家居環(huán)境。近些年來,終端設(shè)備快速普及使得移動(dòng)互聯(lián)網(wǎng)技術(shù)無時(shí)無刻不改變著人們的傳統(tǒng)生活習(xí)慣,借此希望一旦有需求,即可憑借自身攜帶的終端設(shè)備控制家用設(shè)備,例如熱水器的開關(guān)、監(jiān)控煤氣管道的密封性等。而這兩年來,智能家居不斷上升的需求也吸引了大批房地產(chǎn)公司積極尋求解決方案,希望以此開發(fā)出大規(guī)模的具有示范效應(yīng)的智能家居群。目前,能夠擁有良好用戶體驗(yàn)、節(jié)能、環(huán)保及健康功能的智能家居系統(tǒng)研究迅猛發(fā)展。在智能家居系統(tǒng)中手勢作為一個(gè)直觀的交互體驗(yàn)媒介起著至關(guān)重要的作用,它不僅能夠和設(shè)備交流信息,而且在高質(zhì)量示范學(xué)習(xí)中必不可少。本文探討了家居系統(tǒng)中的各種手勢識(shí)別技術(shù),分析手勢識(shí)別技術(shù)的優(yōu)缺點(diǎn),通過對(duì)比研究發(fā)現(xiàn)家居系統(tǒng)中手勢識(shí)別能提升用戶體驗(yàn)效果。
智能家居的概念最早源于1996 年日本東京大學(xué)HASHIMOTO 實(shí)驗(yàn)室提出的“智能空間”一詞,智能空間是融入了信息設(shè)備、計(jì)算機(jī)設(shè)備和傳感器的工作空間,其目的是使用者能通過通信信息技術(shù)訪問信息獲得計(jì)算機(jī)的服務(wù),進(jìn)而高效地實(shí)現(xiàn)個(gè)人目標(biāo)和協(xié)同工作。而智能空間在家居環(huán)境中的實(shí)現(xiàn)與運(yùn)用衍生出了智能家居。
智能家居融合了現(xiàn)代科學(xué)技術(shù)和居住環(huán)境特征,以家用住宅為平臺(tái),規(guī)劃安裝具有實(shí)時(shí)操作性能的家居控制系統(tǒng),可以根據(jù)不同用戶的不同需求提供個(gè)性化空間,讓家居生活更加舒適。與普通的家居空間相比既保留了家居原始傳統(tǒng)的居住功能,還能夠通過設(shè)計(jì)和自身需求增加智能化設(shè)備,來提高家居環(huán)境的安全度和舒適度,使家居生活不再單一,它將原來靜止的建筑物變?yōu)榫哂猩Φ纳姝h(huán)境,讓人們?cè)诩依镆材軌蝮w會(huì)到信息技術(shù)帶來的便捷。智能家居系統(tǒng)中擁有強(qiáng)大的人與智能機(jī)器的信息交互功能,可以保證內(nèi)部間、家庭與外部間信息暢通,以最有效、最節(jié)能的方式改善用戶的生活,節(jié)約各種能源消耗,打造節(jié)能環(huán)保的家居空間。
智能家居的商業(yè)化發(fā)展程度依賴于智能家居設(shè)備的人機(jī)交互程度。手勢識(shí)別技術(shù)在家居系統(tǒng)中是增強(qiáng)人與機(jī)器相互溝通的有效途徑,手勢識(shí)別主要包括手勢設(shè)計(jì)、手勢分析和手勢匹配三個(gè)過程。手勢設(shè)計(jì)的過程是建立模型的過程,在這個(gè)過程中選取什么樣的模型來描述手勢尤其重要,這個(gè)數(shù)學(xué)模型可能只是一個(gè)基于表象的平面圖,也可能同時(shí)包含手勢的空間屬性和時(shí)間特征。目前用于實(shí)現(xiàn)手勢識(shí)別的有效方法主要有基于二維圖像的手勢識(shí)別技術(shù)和基于三維加速度的手勢識(shí)別技術(shù)。
早期手勢識(shí)別技術(shù)多數(shù)指二維靜態(tài)圖像識(shí)別技術(shù),一般分為兩種方式,即二維的手型識(shí)別和二維的手勢識(shí)別。這種識(shí)別是采集圖像后通過計(jì)算機(jī)對(duì)圖像信息進(jìn)行加工,一般采集圖像信息的方法通過攝像機(jī)來完成,得到的圖像輸入計(jì)算機(jī)進(jìn)行預(yù)處理再加入各種圖形算法,最終達(dá)到識(shí)別的目的。家居系統(tǒng)初建時(shí),多數(shù)采用的就是這種識(shí)別方法,效率較高,效果明顯。
2.1.1 二維手型識(shí)別
二維手型識(shí)別技術(shù)能夠識(shí)別計(jì)算機(jī)提前預(yù)設(shè)好的靜態(tài)動(dòng)作,主要完成手勢在某一時(shí)刻靜態(tài)表現(xiàn)的識(shí)別,不能完成連續(xù)變化手勢的識(shí)別,本質(zhì)來講這種技術(shù)就是一種圖像匹配技術(shù),是手勢識(shí)別技術(shù)中最基礎(chǔ)也最簡單的方法。
2.1.2 二維手勢識(shí)別
二維手勢識(shí)別是在識(shí)別靜態(tài)手型圖像的基礎(chǔ)上加入簡單手勢動(dòng)作的一種識(shí)別方法。它使圖像識(shí)別技術(shù)擁有了動(dòng)態(tài)的特性,捕捉追蹤運(yùn)動(dòng)的手勢經(jīng)過計(jì)算機(jī)算法處理,把手勢識(shí)別的范圍真正拓展到了二維平面。這種技術(shù)能夠快速發(fā)展得益于計(jì)算機(jī)視覺算法,它通過優(yōu)化算法整合靜態(tài)動(dòng)作,形成較為復(fù)雜的連續(xù)動(dòng)態(tài)手勢,從而獲得更加豐富的人機(jī)交互內(nèi)容。
總的來說,目前基于圖像的手勢識(shí)別技術(shù)起步比較早而且研究比較成熟,多種多樣計(jì)算機(jī)算法研究很大程度上為這種識(shí)別技術(shù)的廣泛應(yīng)用產(chǎn)生了影響,但是這種手勢識(shí)別技術(shù)有一個(gè)明顯的缺陷是在圖像獲取過程中數(shù)據(jù)采集要求信息完整且無失真。目前而言,多數(shù)采用攝像機(jī)采集數(shù)據(jù)信息,由于硬件設(shè)備的影響使采樣結(jié)果不可能無失真,而且重要的是外部環(huán)境的變化也會(huì)帶來信息的失真,從而導(dǎo)致原始的信息采集結(jié)果出現(xiàn)缺陷,所以在采集信息過程中盡量避免環(huán)境失真帶來的影響,比如圖像獲取時(shí)要有充足的光線和環(huán)境條件等支持。而三維加速度的識(shí)別技術(shù)就解決了這個(gè)問題,它在獲取信息的過程中不容易受到外部條件的限制。因此在變換交互模型下,加入傳感器技術(shù)的識(shí)別方法能有效地避免這種缺陷,能夠較好完成信息采集,然后通過采集的信息建立手勢識(shí)別模型,加入計(jì)算機(jī)算法研究手勢動(dòng)作,最終完成人與機(jī)器之間的交流。
三維的手勢識(shí)別從表面來看,是把坐標(biāo)從XY二維坐標(biāo)變成了XYZ三維坐標(biāo),但實(shí)際上是通過加入Z軸信息使這種技術(shù)能夠識(shí)別各種各樣的連續(xù)手勢動(dòng)作。它不僅僅包含手型狀態(tài)的識(shí)別,而且對(duì)復(fù)雜手勢動(dòng)作的研究更有深度意義。三維手勢識(shí)別成為現(xiàn)在手勢識(shí)別發(fā)展的主流方向,目前多數(shù)家居系統(tǒng)的識(shí)別技術(shù),增加的那部分信息量主要依靠特殊的硬件來完成,三維手勢識(shí)別中最關(guān)鍵的是連續(xù)手勢動(dòng)作捕捉跟蹤的同時(shí)加入動(dòng)作的持續(xù)性深入研究,因此計(jì)算機(jī)處理過程不再是單一的圖像識(shí)別,是有深度的可持續(xù)的連續(xù)性研究,通過建立手勢模型為后續(xù)手勢識(shí)別做準(zhǔn)備。
2.2.1 手勢建模
手勢建模是根據(jù)手勢的動(dòng)作建立模型。根據(jù)有無運(yùn)動(dòng)可將手勢分為靜態(tài)和動(dòng)態(tài)兩種,這種方法將人的手部形態(tài)和運(yùn)動(dòng)時(shí)的狀態(tài)分別建立一個(gè)有效集合,采集相同狀態(tài)下大量樣本供識(shí)別應(yīng)用;根據(jù)動(dòng)作連貫與否將手勢分為離散和連續(xù)兩種,以手勢軌跡建立動(dòng)態(tài)運(yùn)動(dòng)原語系統(tǒng)(DMP),對(duì)連續(xù)的手勢在時(shí)間上進(jìn)行分割然后分別進(jìn)行識(shí)別。該模型計(jì)算量較大,應(yīng)用過程中允許使用樣本對(duì)分類器進(jìn)行訓(xùn)練,并且提供反饋結(jié)構(gòu)來提高交互的性能;根據(jù)動(dòng)作的復(fù)雜程度將手勢分為單元原子手勢和復(fù)合手勢兩種,這種方法考慮到了手勢和應(yīng)用程序相互獨(dú)立性,通過建立手勢庫Glib 形成規(guī)則,由子手勢復(fù)合形成復(fù)合手勢,應(yīng)用這種方法最大的特點(diǎn)是復(fù)雜的計(jì)算機(jī)算法能完整地建立手勢模型,準(zhǔn)確地完成識(shí)別匹配。
2.2.2 三維加速度傳感器的手勢識(shí)別
手勢識(shí)別已經(jīng)廣泛應(yīng)用到手機(jī)、Pad 等各種手持移動(dòng)設(shè)備中,尤其是現(xiàn)在智能家居系統(tǒng)中注重交互方式的自然性和靈活性,在終端上的操作工具不應(yīng)局限于一種設(shè)備,而是需要再此基礎(chǔ)上為系統(tǒng)體驗(yàn)提供新的方式。手勢識(shí)別的本質(zhì)是根據(jù)手勢模型將手勢動(dòng)作分類,基于三維加速度傳感器的手勢識(shí)別方法提高捕獲手勢動(dòng)作的加速度來識(shí)別手勢,由于其不斷變化,必須采用專門的設(shè)備——加速度傳感器來完成。手勢在執(zhí)行過程中XYZ三個(gè)方向軸都會(huì)產(chǎn)生不同加速度信息,且會(huì)隨著頻率不同和幅度不同而產(chǎn)生變化,因此需要研究手勢的每一個(gè)動(dòng)作特點(diǎn),將動(dòng)作分成若干單元,每個(gè)單元對(duì)應(yīng)加速度中的一段曲線,整合這些手勢單元即可得到不同的手勢動(dòng)作,經(jīng)過預(yù)處理記錄下來,然后根據(jù)這些量為每個(gè)單元手勢建立模型,利用模型識(shí)別手勢,被識(shí)別的手勢又可組合成連續(xù)且復(fù)雜的手勢動(dòng)作。
結(jié)果證明,基于三維加速度的識(shí)別方法,能夠借助硬件的條件采集動(dòng)作信息。相對(duì)于圖像識(shí)別技術(shù),雖然增加了建立模型的難度,但是信息采集更加接近原始數(shù)據(jù),再加之計(jì)算機(jī)算法整合動(dòng)作信息對(duì)比識(shí)別,能夠很好完成人與機(jī)器之間的信息交流。
在家居系統(tǒng)設(shè)計(jì)中,識(shí)別是家居系統(tǒng)能否廣泛應(yīng)用的關(guān)鍵,好的系統(tǒng)識(shí)別方法能給用戶帶來更加便利的體驗(yàn)。本文通過對(duì)常用識(shí)別方法的探討,得出現(xiàn)在家居系統(tǒng)的識(shí)別方法基本上分為基于二維圖像的手勢識(shí)別方法和基于三維加速度的識(shí)別方法,目前前者技術(shù)相對(duì)比較成熟,識(shí)別成功率也比較高,同時(shí)算法的復(fù)雜度也比較理想,應(yīng)用較為廣泛,主要原理是對(duì)采集圖像進(jìn)行計(jì)算機(jī)視覺處理,但是此方法的缺陷是對(duì)外部環(huán)境的依賴性比較大;后一種方法不受外部條件的限制,并且這種方法在應(yīng)用中可以用已有的原子單元手勢建立較為復(fù)雜的手勢模型,拓展了手勢動(dòng)作的可持續(xù)性,總體研究更有普遍意義,具有廣泛的應(yīng)用前景。