李 靜
(唐山市人力資源和社會保障局勞動能力鑒定服務(wù)中心,河北 唐山 063000)
隨著經(jīng)濟(jì)進(jìn)入新常態(tài),我國工業(yè)進(jìn)入了空前的發(fā)展階段,信息化、人工智能、識別技術(shù)發(fā)展突飛猛進(jìn),為企業(yè)檔案信息化的建設(shè)提供了可靠的支持。手勢識別系統(tǒng)在企業(yè)檔案信息安全管理系統(tǒng)體系成為研究的熱點(diǎn)[1-3]。在檔案安全管理中心利用相應(yīng)的網(wǎng)絡(luò)模型將所得特征值進(jìn)行處理,得到相應(yīng)的手勢[4-8]。為了提高手勢識別系統(tǒng)的準(zhǔn)確率,本文利用人工智能技術(shù)建立檔案信息安全管理系統(tǒng)交互識別模型實(shí)現(xiàn)對手勢的識別,在人機(jī)交互原理的基礎(chǔ)上建立信息安全的整合平臺和反饋模塊。通過建立顏色分布模型,對所得圖像進(jìn)行二值化處理,實(shí)現(xiàn)對手勢姿態(tài)的判別,通過對圖像的歸一化處理得到最終的手勢動作。
在企業(yè)檔案管理信息安全體系中,人機(jī)交互系統(tǒng)是重要發(fā)展方向。該系統(tǒng)主要由使用者、系統(tǒng)、輸入和輸出等組成,在對手勢進(jìn)行識別時需要懸停以實(shí)現(xiàn)用戶對命令的選擇,當(dāng)靜止時間大于設(shè)定時間則表示選中,反之則重新開始計(jì)時。本文所開發(fā)的檔案管理系統(tǒng)隔空手勢識別以多通道的信息交互技術(shù)為基礎(chǔ),通過引入信息安全整合平臺和反饋模塊,實(shí)現(xiàn)了整個系統(tǒng)的搭建,其具體結(jié)構(gòu)如圖1 所示。
該模型主要由用戶、交互、表現(xiàn)、控制以及應(yīng)用程序等多個模塊組成,其中檔案系統(tǒng)使用者模塊主要通過對象庫中的工具實(shí)現(xiàn)信息的輸入,人機(jī)交互模塊主要包括對輸入信息的管理及輸出設(shè)備的控制,將所采集的手勢動作轉(zhuǎn)換為交互的原語信號,并將結(jié)果輸出。通過手勢姿態(tài)信息可得到交互的原語,所有的原語均與設(shè)備相關(guān),同時可通過該模塊接收反饋信息并傳輸給用戶。應(yīng)用程序模塊主要是將處理后的任務(wù)發(fā)送到控制模塊,該模塊包括多個信息的處理計(jì)算部分,可將處理后的信息傳輸給用戶。
本文對模型進(jìn)行處理時以MCG-Skin 數(shù)據(jù)庫為基礎(chǔ),在YCrCb的空間內(nèi)利用分量Cr和Cb建立如下顏色分布的表達(dá)式:
式中:μ 為顏色的均量化系數(shù);α 和g 分別為顏色的分量系數(shù)和過濾值。
根據(jù)上文公式在對手勢進(jìn)行識別時,通過去除手勢背景并對高斯模型進(jìn)行混合處理,利用下式進(jìn)行描述:
式中:α、μ、σ 分別表示對應(yīng)概率密度函數(shù)的相關(guān)參數(shù),其中αh+αf=1。
所采集的手勢一直位于身體前側(cè),上式中的μh、μf分別表示手勢和身體的深度,那么深度的閾值可表達(dá)為:
將經(jīng)閾值處理后的像素點(diǎn)帶入上文Pc(x)的表達(dá)式中,經(jīng)過處理后可得到圖像對應(yīng)顏色的概率分布,然后將其與灰度值[0,255]進(jìn)行映射,即可完成對手勢圖像的重建,當(dāng)對應(yīng)的灰度值增加時相似度也隨之上升。利用最大類間方差法對圖像進(jìn)行處理后,可通過灰度值表達(dá)膚色點(diǎn),除去膚色的其它點(diǎn)都處理為黑色,這樣即可得到具體的手勢姿態(tài)。
在對手勢進(jìn)行跟蹤時,首先應(yīng)確定深度的直方圖,將灰度值在[0,L-1]范圍內(nèi)直方圖轉(zhuǎn)換為以下離散函數(shù):
式中:rk表示灰度等級為k 的相對深度;nk表示為圖像rk級別的像素總數(shù)。
通過下式對圖像進(jìn)行歸一化處理,使其成為統(tǒng)一的標(biāo)準(zhǔn)形式。
式中:P(rk)表示為某級別灰度值所出現(xiàn)概率的估值。
根據(jù)像素點(diǎn)的絕對深度值可計(jì)算得到其相對深度最小值的絕對值,所以相對深度的范圍為[0,D-1]。由上文可知rk表示第k 級灰度值的相對深度,該級別所對應(yīng)的像素?cái)?shù)量為nk,其中k=0,1,…,D-1。
利用評價(jià)概率分布相似性方法對相對深度直方圖的相似性進(jìn)行分析,利用下式對其巴氏距離的定義域進(jìn)行判斷。
式中:Bs(p,q)為巴氏系數(shù)。通過下式對手勢進(jìn)行跟蹤:
式中:x 表示手的運(yùn)動速度。通過上述模型及對應(yīng)公式即可實(shí)現(xiàn)對手勢的跟蹤。
在對企業(yè)檔案信息安全管理系統(tǒng)手勢進(jìn)行識別時,首先需引入一組級聯(lián)學(xué)習(xí)器,通過學(xué)習(xí)器對手勢的運(yùn)動模式進(jìn)行不斷的學(xué)習(xí)實(shí)現(xiàn)對手勢的識別,可讓前兩級學(xué)習(xí)器學(xué)習(xí)姿勢較簡單的非控制姿勢,而讓級別較高的學(xué)習(xí)器學(xué)習(xí)較難的控制姿勢,進(jìn)而提高手勢識別的效率,如圖2 所示。
在通過級聯(lián)結(jié)構(gòu)對手勢進(jìn)行識別時,級數(shù)越高時越能降低控制姿態(tài)和非控制姿態(tài)之間的不平衡性,在較高級別的學(xué)習(xí)器學(xué)習(xí)時應(yīng)將重點(diǎn)放在兩種姿態(tài)的差別上,降低二者的不平衡性對整體效果的影響。手勢動作可由以下集合進(jìn)行表示(手勢種類的總數(shù)為n):
當(dāng)對手勢G1進(jìn)行識別時,需使非控制動作滿足下式:
在所有姿勢中選擇一組樣本作為訓(xùn)練數(shù)據(jù),可表示為:
上式中第i 種姿勢的樣本總數(shù)為m。
任意選擇一組級聯(lián)分類器,可由下式表達(dá):
上式中Mi表示第i 級分類器,其所對應(yīng)的特征為Fi,進(jìn)而可得到下式:
手勢識別的具體流程包括以下步驟:
步驟二,當(dāng)C={G1}時,提取兩個集合中差異較大的手勢動作,將所提取的手勢歸入到集合中,則C=G1-。
步驟三,將集合F 中識別耗時最短的Fi與訓(xùn)練識別{G,}的分類器Mi進(jìn)行選取,同時令F1的值盡量接近1,將分類器Mi錯分的樣本歸入到集合G中。
步驟四,在分類器T 中加入(Mi,F(xiàn)i)。
步驟五,返回分類器T。
利用相關(guān)軟件結(jié)合企業(yè)檔案信息安全管理系統(tǒng)使用者手勢進(jìn)行圖像采集后,隨機(jī)選取100 幅圖像作為實(shí)驗(yàn)對象,實(shí)驗(yàn)所用計(jì)算機(jī)的運(yùn)行內(nèi)存為6 GB,處理器為雙核E5500。實(shí)驗(yàn)分別采用本文模型和自學(xué)習(xí)稀疏表示法[9]和Leap Motion 模型[10],分別對抓和放兩個動作進(jìn)行識別,采用F1對識別效果進(jìn)行評估,該值越高表示識別的準(zhǔn)確率越高。
式中:precision 和recall 分別表示準(zhǔn)確率和召回率,這兩個參數(shù)的計(jì)算公式見式(14)(15)。
式中:tp表示識別正確的樣本數(shù),fp表示識別錯誤的樣本數(shù),fn表示被識別為其它類別的樣本數(shù)。
下頁圖3 所示為不同方法對手勢識別的實(shí)驗(yàn)結(jié)果,觀察可發(fā)現(xiàn)本文所研究模型對手勢識別的準(zhǔn)確率最高,得到了較理想的識別效果,所得評估指標(biāo)F1的值高于96%,而自學(xué)習(xí)稀疏表示法和Leap Motion 模型的F1值低于93%,未達(dá)到想要的實(shí)驗(yàn)結(jié)果,無法滿足精度的要求。
隨著工業(yè)經(jīng)濟(jì)及信息安全管理技術(shù)的發(fā)展,企業(yè)檔案信息安全管理系統(tǒng)逐步與現(xiàn)代化技術(shù)接軌。為了提高企業(yè)檔案管理系統(tǒng)體系中使用者手勢交互識別的準(zhǔn)確率,本文提出了一種新的手勢識別模型。根據(jù)手勢識別的原理建立了信息安全整合平臺和反饋模塊。本文研究可為企業(yè)檔案管理體系安全防護(hù)系統(tǒng)的開發(fā)提供一定的參考。