吳一非,杜尚廣
(1. 江西科技學(xué)院,江西 南昌 330000;2. 南昌大學(xué)生命科學(xué)學(xué)院,江西 南昌 330000)
VR技術(shù)[1]即虛擬現(xiàn)實(shí)技術(shù),隨著該技術(shù)的不斷發(fā)展,目前VR技術(shù)已經(jīng)成熟地運(yùn)用到各個(gè)大型場景中,但VR系統(tǒng)在實(shí)際運(yùn)行過程中由于數(shù)據(jù)量過大會(huì)導(dǎo)致目標(biāo)移動(dòng)出現(xiàn)卡頓等現(xiàn)象,因此,提出在VR系統(tǒng)中對(duì)移動(dòng)目標(biāo)進(jìn)行特征提取[2],通過移動(dòng)目標(biāo)的特征對(duì)空間場景進(jìn)行加載,以此降低系統(tǒng)內(nèi)存含量[3],降低系統(tǒng)負(fù)荷。
鄧昊[4]等人提出了一種基于漲落分析的暗弱運(yùn)動(dòng)目標(biāo)關(guān)聯(lián)檢測方法,該方法在時(shí)域上設(shè)定一個(gè)時(shí)間窗口,采用漲落分析方法來提取暗弱運(yùn)動(dòng)目標(biāo)的關(guān)聯(lián)特征,獲取檢測目標(biāo)信號(hào),實(shí)現(xiàn)特征提取。韓豐宇[5]等人提出了一種運(yùn)動(dòng)目標(biāo)軌跡特征提取方法,基于Faster R-CNN原理,對(duì)特征進(jìn)行定位提取,根據(jù)定位結(jié)果獲取目標(biāo)區(qū)域,然后采用距離加閾值限制方法得到目標(biāo)之間的關(guān)聯(lián),由此實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)軌跡特征提取。
以上兩種方法均沒有對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,導(dǎo)致數(shù)據(jù)不規(guī)范,數(shù)據(jù)格式種類過多,特征提取時(shí)冗余數(shù)據(jù)以及不易辨識(shí)的數(shù)據(jù)過多,存在閾值對(duì)錯(cuò)誤率影響程度高、重復(fù)率高和特征點(diǎn)完整性低的問題。為了解決上述方法中存在的問題,提出基于VR的室內(nèi)空間視覺移動(dòng)目標(biāo)特征提取方法。
分散的數(shù)據(jù)不利于室內(nèi)空間視覺移動(dòng)目標(biāo)的特征提取[6,7],可能出現(xiàn)特征提取不完全,特征提取重復(fù)等情況,為避免不必要的錯(cuò)誤發(fā)生,可提前對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,其中最重要的一步就是對(duì)數(shù)據(jù)進(jìn)行歸一化處理。
由于VR系統(tǒng)內(nèi)數(shù)據(jù)量巨大,其中包含很多格式不一致的數(shù)據(jù),為降低系統(tǒng)負(fù)荷,對(duì)系統(tǒng)內(nèi)空間視覺移動(dòng)目標(biāo)進(jìn)行特征提取,保證特征提取的質(zhì)量,可提前將系統(tǒng)數(shù)據(jù)進(jìn)行歸一化處理[8]。
包圍球技術(shù)是數(shù)據(jù)歸一化方法之一,其核心就是在信息量不變的情況下將數(shù)據(jù)量范圍通過映射進(jìn)行縮小,從而完成數(shù)據(jù)歸一化處理,其中數(shù)據(jù)歸一公式為
(1)
式中,t代表VR系統(tǒng)中的原始數(shù)據(jù),c(x)代表虛擬數(shù)據(jù)經(jīng)過歸一化處理后的第x組數(shù)據(jù),Δm代表每組數(shù)據(jù)經(jīng)過歸一化處理后的數(shù)量。
根據(jù)式(1)推導(dǎo)出原始數(shù)據(jù)經(jīng)過歸一化處理后的結(jié)果,其表達(dá)式為
(2)
式中,c(Y)代表原始數(shù)據(jù)經(jīng)過歸一化處理后的數(shù)據(jù),Y代表虛擬數(shù)據(jù)的數(shù)量。
其中,數(shù)據(jù)量Δm的表達(dá)式為
Δm=|Ni/Y|
(3)
目標(biāo)數(shù)據(jù)的歸一化就是對(duì)數(shù)據(jù)進(jìn)行變形,得出其變換矩陣,假設(shè)原始數(shù)據(jù)矩陣為Y,將該數(shù)據(jù)矩陣進(jìn)行變換后得出的矩陣表達(dá)式為
(4)
經(jīng)分析得出室內(nèi)移動(dòng)目標(biāo)數(shù)據(jù)的協(xié)方差矩陣,其表達(dá)式為
(5)
式中,R代表協(xié)方差矩陣,n代表整體數(shù)據(jù)量,mi代表原始數(shù)據(jù)中第i個(gè)數(shù)據(jù),wi代表數(shù)據(jù)需要變換的權(quán)重。
進(jìn)而計(jì)算出數(shù)據(jù)變換的系數(shù),其公式為
Z=S/r
(6)
式中,Z代表數(shù)據(jù)歸一化的變換系數(shù),S代表數(shù)據(jù)歸一化的最大程度,r代表數(shù)據(jù)之間的距離。
在數(shù)據(jù)變換系數(shù)的基礎(chǔ)上,利用變換矩陣和數(shù)據(jù)歸一化公式即可完成室內(nèi)空間視覺移動(dòng)數(shù)據(jù)的歸一化。
基于VR技術(shù)的室內(nèi)目標(biāo)通常與背景數(shù)據(jù)混合一起,為加強(qiáng)目標(biāo)數(shù)據(jù)特征提取精度,需要將背景與室內(nèi)目標(biāo)數(shù)據(jù)進(jìn)行分割,分割出室內(nèi)移動(dòng)目標(biāo)后可有效地對(duì)移動(dòng)目標(biāo)進(jìn)行特征提取,最大程度地避免背景數(shù)據(jù)對(duì)特征提取的干擾。
分割就是將同一區(qū)域內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行標(biāo)記,得出目標(biāo)區(qū)域點(diǎn)和背景點(diǎn),通常情況下,背景區(qū)域與目標(biāo)區(qū)域的灰度值區(qū)別較大,根據(jù)此特性進(jìn)行背景分割[9-10]。
區(qū)域閾值法是圖像分割最常用的方法,該方法的主要思想就是在固定閾值的幫助下將灰度值不大于目標(biāo)數(shù)據(jù)點(diǎn)的數(shù)據(jù)視為移動(dòng)目標(biāo),否則將數(shù)據(jù)點(diǎn)視為背景。
在此過程中需要計(jì)算出背景與目標(biāo)的灰度均值紅外方差,其表達(dá)式為
(7)
數(shù)據(jù)點(diǎn)的方差計(jì)算公式為
(8)
式中,σ代表移動(dòng)目標(biāo)數(shù)據(jù)點(diǎn)的方差。
當(dāng)每一組數(shù)據(jù)的方差小于固定閾值時(shí),此時(shí)將該數(shù)據(jù)點(diǎn)確定為背景數(shù)據(jù),否則均為移動(dòng)目標(biāo)數(shù)據(jù)。
由于移動(dòng)目標(biāo)與背景往往是重疊出現(xiàn)的,為進(jìn)一步加強(qiáng)分割效果,初步完成分割后計(jì)算出數(shù)據(jù)點(diǎn)屬于移動(dòng)目標(biāo)的權(quán)重。
假設(shè)移動(dòng)目標(biāo)和背景權(quán)重分別標(biāo)記為w1和w2,兩權(quán)重之間的關(guān)系如下所示
w1+w2=1
(9)
根據(jù)分布密度函數(shù)原理得出移動(dòng)目標(biāo)分布的灰度級(jí)函數(shù)為
(10)
背景分布密度函數(shù)表達(dá)式為
(11)
進(jìn)而運(yùn)算出空間視覺中灰度級(jí)G的分布公式:
W(G)=W2w2(G)+W1w1(G)
(12)
為了降低分割難度,先對(duì)背景色彩和目標(biāo)色彩進(jìn)行加強(qiáng),在色彩R、G、B分量的幫助下計(jì)算出目標(biāo)圖像,首先設(shè)置出三種分量的相應(yīng)閾值,其中,R分量對(duì)應(yīng)閾值Tr,G分量對(duì)應(yīng)閾值Tg,B對(duì)應(yīng)閾值Tb。
將各個(gè)分量與相應(yīng)閾值進(jìn)行比較,分量大于閾值的即為背景,否則為移動(dòng)目標(biāo),其表達(dá)式分別為
(13)
通過將每組數(shù)據(jù)與固定閾值進(jìn)行比較,并計(jì)算出移動(dòng)目標(biāo)數(shù)據(jù)的權(quán)重,最終在色彩分量與閾值的比較下確定出移動(dòng)目標(biāo)。
特征提取[11]的目的是保證信息量不發(fā)生變化的同時(shí)將數(shù)據(jù)量范圍盡可能地縮小,通過這種處理方法處理后的數(shù)據(jù)可有效地加載VR系統(tǒng)內(nèi)負(fù)荷。
主成分分析[12-13]是特征提取中最常見的一種方法,該方法屬于統(tǒng)計(jì)學(xué)范疇,主要是提取出數(shù)據(jù)庫中所有數(shù)據(jù)的主成分,進(jìn)而降低數(shù)據(jù)冗余量,保證數(shù)據(jù)從高維空間降到低維空間中進(jìn)行操作,同時(shí)保留了數(shù)據(jù)的主要信息。主成分分析法將數(shù)據(jù)庫數(shù)據(jù)進(jìn)行處理后不僅降低計(jì)算難度,同時(shí)最大程度降低數(shù)據(jù)噪聲,提高數(shù)據(jù)的抗干擾能力,其中降低計(jì)算難度就是根據(jù)主成分分析法屬于統(tǒng)計(jì)學(xué)的特點(diǎn)在海量信息中解析出最重要的信息,將問題簡單化。
假設(shè)原始數(shù)據(jù)的維度為m,它的隨機(jī)向量為y,且隨機(jī)向量的均值為0,則有
E(y)=0
(14)
其中,E(y)代表向量y的均值。
當(dāng)向量y投影到m維空間后,該向量與單位向量之間的內(nèi)積為
(15)
式中,z代表m維空間中的單位向量,k代表主成分矩陣,T代表特征向量。
基于主成分分析提取出的移動(dòng)目標(biāo)特征就是計(jì)算出主成分E(X2)的權(quán)重最大化,其中E(X2)的計(jì)算公式以及權(quán)重最大化的計(jì)算公式分別為:
(16)
式中,w代表相應(yīng)成分的權(quán)重,Ciwj代表最大化權(quán)重,λi代表權(quán)重中非0的特征值。
實(shí)質(zhì)上主成分分析法是線性映射,為抵抗線性映射的缺點(diǎn),可在主成分分析法中添加KPCA思想[14-15],即利用變換的形式將樣本輸入到特征空間中,將原始數(shù)據(jù)變換成特征空間中的樣本數(shù)據(jù)后進(jìn)行主成分分析,以此解決因映射帶來的問題,得出目標(biāo)特征值的計(jì)算公式為
λi=Sui
(17)
式中,S代表特征空間內(nèi)的數(shù)據(jù)協(xié)方差矩陣,ui代表特征值的單位特征向量。
將特征向量根據(jù)協(xié)方差矩陣[16]進(jìn)行投影,得出樣本數(shù)據(jù)的特征量矩陣,該矩陣的成分就是樣本數(shù)據(jù)的特征值,其中特征值矩陣的計(jì)算公式為
Qi=Xi(μ1,…,μd)
(18)
式中,Qi代表特征值矩陣,Xi代表原始數(shù)據(jù)樣本,μ代表投影向量。
因此得出特征值與特征向量之間的聯(lián)系,其表達(dá)式為
(19)
式中,p代表特征值的數(shù)量,T代表該數(shù)據(jù)對(duì)應(yīng)的特征向量。
在提取移動(dòng)目標(biāo)特征的過程中為保證單位向量ui的穩(wěn)定性,需要將數(shù)據(jù)的特征向量進(jìn)行規(guī)劃化處理,并重建原始數(shù)據(jù),數(shù)據(jù)重建的表達(dá)式為
(20)
式中,X′代表將特征向量規(guī)范化處理后的移動(dòng)目標(biāo)數(shù)據(jù)。
將規(guī)范后的數(shù)據(jù)代入式(17)中,計(jì)算出移動(dòng)目標(biāo)的特征值,將特征值根據(jù)自大到小的順序進(jìn)行排列,并綜合權(quán)重大小得出特征子空間,在特征子空間中將較小的特征向量舍棄,僅僅保留特征值較高的特征向量,為明確特征向量的保留界限,將協(xié)方差矩陣[17]的特征值與所有目標(biāo)數(shù)據(jù)特征值之比與閾值進(jìn)行比較,當(dāng)兩特征值之比小于閾值,則舍棄,否則保留。
為了驗(yàn)證基于VR的室內(nèi)空間視覺移動(dòng)目標(biāo)特征提取方法的整體有效性,在Matlab仿真軟件環(huán)境下,對(duì)所提方法、文獻(xiàn)[4]方法和文獻(xiàn)[5]方法進(jìn)行閾值對(duì)錯(cuò)誤率影響程度、重復(fù)率和特征點(diǎn)完整性測試,測試結(jié)果如下所示。
大部分閾值的選取會(huì)對(duì)特征提取有較大的影響,即特征提取對(duì)閾值的依賴性較大,因?yàn)槟壳疤卣魈崛〉姆椒ň鶎?duì)閾值的依賴程度進(jìn)行削弱,就特征提取對(duì)閾值的影響展開研究,得出最優(yōu)特征提取方法。
為提高實(shí)驗(yàn)可信度,分別選取兩種不同的目標(biāo)特征進(jìn)行提取,判斷在不同閾值下三種方法的提取錯(cuò)誤率,結(jié)果如圖1和圖2所示。
圖1 編號(hào)1特征值下三種方法的提取錯(cuò)誤率
圖2 編號(hào)2特征值下三種方法的提取錯(cuò)誤率
經(jīng)過對(duì)圖1圖2的分析,最直觀的結(jié)果就是所提方法是三種特征提取方法中錯(cuò)誤率最低的,經(jīng)仔細(xì)分析發(fā)現(xiàn),所提方法是三種方法對(duì)閾值依賴度最低的,隨著閾值的增長,移動(dòng)目標(biāo)的提取錯(cuò)誤率會(huì)隨之增加,而所提方法因?yàn)樘崆皩?duì)數(shù)據(jù)進(jìn)行預(yù)處理,將其中冗余數(shù)據(jù)刪除,并進(jìn)行背景分割,可有效提取特征,從而降低提取錯(cuò)誤率,以此降低特征提取對(duì)閾值的依賴,但其它兩種方法的錯(cuò)誤率仍不斷上升,尤其是文獻(xiàn)[5]方法,因此驗(yàn)證所提方法為最優(yōu)特征提取方法。
特征提取的目的就是保證信息內(nèi)容不變的同時(shí)縮小數(shù)據(jù)范圍,因此特征提取中最忌諱含有重復(fù)內(nèi)容,進(jìn)而將信息重復(fù)率視為最優(yōu)特征提取方法的驗(yàn)證指標(biāo),即在同一環(huán)境下利用三種方法進(jìn)行移動(dòng)目標(biāo)特征提取,在結(jié)果中查找相同的特征,相同的特征越多,說明方法性能越差。
表1 三種方法特征點(diǎn)提取重復(fù)率
根據(jù)表1可知,三種方法在特征提取過程中均避免不了提取出相同特征點(diǎn)的情況,通過比較發(fā)現(xiàn),所提方法的特征提取結(jié)果重復(fù)率最低,均沒有超過整體的5%,其他兩種方法的重復(fù)率都過高,違背了特征提取的目的,從而證明所提方法的優(yōu)勢性。
特征提取在實(shí)際操作過程中因各種因素?zé)o法做到理論效果下的信息完整性,而能將信息完整性相對(duì)地提高到最高程度即為性能最好的特征提取方法。
在同一環(huán)境下利用三種方法對(duì)同一移動(dòng)目標(biāo)進(jìn)行特征提取,判斷其特征信息提取量與實(shí)際特征量之間的比值,實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 三種方法的特征量提取量百分比
根據(jù)實(shí)驗(yàn)結(jié)果可知,所提方法提取出的特征量與實(shí)際的特征量較為一致,其余兩種方法提取出的特征量與實(shí)際特征量之間具有一定的差距,說明文獻(xiàn)[4]方法和文獻(xiàn)[5]方法得出的結(jié)果中有部分重復(fù)出現(xiàn)的特征量,或部分實(shí)驗(yàn)中所提取的特征量不完整,因此證明了所提方法的有效性。
VR系統(tǒng)多數(shù)應(yīng)用于視頻等行業(yè)中,這種企業(yè)的特點(diǎn)是數(shù)據(jù)量過大,為方便后續(xù)操作和計(jì)算,提出基于VR的室內(nèi)空間視覺移動(dòng)目標(biāo)特征提取方法,該方法首先對(duì)數(shù)據(jù)進(jìn)行歸一和分割的預(yù)處理,其次在主成分分析法的幫助下完成移動(dòng)目標(biāo)的特征提取,實(shí)現(xiàn)室內(nèi)空間視覺移動(dòng)目標(biāo)特征提取,解決了閾值對(duì)錯(cuò)誤率影響程度高、重復(fù)率高和特征點(diǎn)完整性低的問題,有利于加強(qiáng)VR系統(tǒng)的運(yùn)行速度,提高企業(yè)質(zhì)量。