周 騰,林之喆
(1.華南理工大學(xué),廣東 廣州510006;2.廣州醫(yī)學(xué)院,廣東 廣州510182)
隨著生活水平的提高,人們對(duì)家居安防的要求日益提高。目前,市面的安防監(jiān)控系統(tǒng)主要有視頻監(jiān)控、門磁、窗磁和紅外越界報(bào)警等[1]。這些系統(tǒng)都是通過“機(jī)械式”捕獲某一個(gè)信號(hào),并進(jìn)行告警。這里所指的“機(jī)械式”是指這些系統(tǒng)并不能判定該信號(hào)是受到入侵還是一些環(huán)境的干擾。例如,門磁系統(tǒng)可以使用機(jī)械式的磁石開關(guān)的開閉狀態(tài)來判定窗戶是否被打開,但是這種系統(tǒng)無法判定窗戶是被風(fēng)吹開或是遭到入侵。典型的智能視頻監(jiān)控系統(tǒng)可以計(jì)算畫面的一些變化來判定是否受到入侵,但是其無法從語義上判定入侵物。
另外,目前市售的安防系統(tǒng),如視頻監(jiān)控、窗磁、門磁或紅外越界報(bào)警系統(tǒng)都需要對(duì)建筑進(jìn)行改造和安裝調(diào)試。紅外越界報(bào)警系統(tǒng)必須對(duì)原有的門窗進(jìn)行鉆孔,安裝發(fā)射裝置和接收裝置。安裝完成后還需要專業(yè)的技術(shù)人員進(jìn)行調(diào)試方可使用,安裝使用成本較高。
當(dāng)前市售的安防系統(tǒng)多數(shù)隱蔽性較差。例如視頻監(jiān)控系統(tǒng),由光直線傳播的原理,該系統(tǒng)的探頭必須安裝在監(jiān)控區(qū)域上方無遮擋的地方,極易被專業(yè)盜匪所破壞。
針對(duì)當(dāng)前市售安防系統(tǒng)的弱點(diǎn),提出基于稀疏表示、使用音頻特征進(jìn)行安防監(jiān)控的模型。本文的貢獻(xiàn)有:1)提出基于稀疏表示,使用音頻特征進(jìn)行安防監(jiān)控的模型;2)提出一種使用最大似然估計(jì)求解稀疏向量和訓(xùn)練矩陣的算法;3)設(shè)計(jì)了一個(gè)基于上述模型的安防系統(tǒng),詳細(xì)闡述了系統(tǒng)的關(guān)鍵技術(shù)實(shí)現(xiàn)。
本文討論的安防監(jiān)控模型通過機(jī)器學(xué)習(xí),使用稀疏表示[2]對(duì)模型進(jìn)行訓(xùn)練,到達(dá)準(zhǔn)確的入侵檢測(cè)的目的。本文提出基于聲音采集的安防模型。因?yàn)槁曇舻牟ㄩL(zhǎng)遠(yuǎn)遠(yuǎn)大于可見光的波長(zhǎng),所以聲音可以繞過障礙物到達(dá)聲音采集器。
本模型首先必須在家庭中設(shè)置一個(gè)或多個(gè)音頻采集的裝置,這些裝置可以隱藏在任意非可見的位置。如圖1所示,房間中共設(shè)置了4個(gè)音頻采集裝置。根據(jù)實(shí)驗(yàn)結(jié)果,將音頻采集裝置設(shè)置于房間的每個(gè)角落效果較佳。
通過設(shè)置音頻采集裝置,將音頻數(shù)據(jù)傳送至家庭安防服務(wù)器。使用家庭安防服務(wù)器,對(duì)采集的數(shù)據(jù)進(jìn)行計(jì)算。
為了方便討論該模型,令第n個(gè)音頻裝置第m個(gè)時(shí)間點(diǎn)采樣并量化得到的數(shù)據(jù)記為xm(n),μ為某事件的特征向量,那么采樣數(shù)據(jù)x(n)和μ之間的誤差可以表示為
式中:μ可以表示為μ=M(n)θ(n),M(n)為訓(xùn)練矩陣,θ(n)為m維稀疏向量,θi=0,1(i=1,2,…,m)。那么特征向量μ可以看成M的列向量的線性組合,因?yàn)楫?dāng)1時(shí)表示選擇訓(xùn)練矩陣M中的第i列的特征,反之,當(dāng)θi(n)=1時(shí)表示忽略訓(xùn)練矩陣M中的第i列的特征。
那么,當(dāng)安防撤銷時(shí),在該音頻采集的區(qū)域內(nèi)的人類活動(dòng)的音頻將被作為訓(xùn)練的樣本,令入侵的概率密度為
假設(shè)在第k次撤防做了mk個(gè)時(shí)間點(diǎn)的采集,在第k次撤防做了m'k個(gè)時(shí)間點(diǎn)的采集。直覺上,認(rèn)為布防時(shí),房間中沒有人類活動(dòng),而撤防時(shí),房間中可能有人類活動(dòng)。由是,其最大似然估計(jì)為
對(duì)公式(5)求解梯度方向,令梯度方向?yàn)?,可以求得λ,M,θ,τ,得到第n個(gè)采集裝置的訓(xùn)練矩陣和稀疏向量。其中,j=1,2,…,m,表示第j次采樣。
綜上所述,由式(3)、式(4)、式(5),通過訓(xùn)練樣本得到估計(jì)參數(shù)λ,M,θ,τ,代入公式(3),最后由式(4)可以由每一個(gè)測(cè)試音頻特征向量,求得該房間受到入侵的概率。
本節(jié)討論本文提出的安防系統(tǒng)設(shè)計(jì),如圖2所示,使用音頻采集裝置對(duì)音頻進(jìn)行采集,然后對(duì)音頻進(jìn)行采樣、量化,提取音頻特征,最后通過概率計(jì)算可得房間受到入侵的概率,當(dāng)概率高于某個(gè)閾值的時(shí)候,進(jìn)行安防告警。
聲音在時(shí)間和幅度上都是連續(xù)的,為了對(duì)聲音數(shù)據(jù)數(shù)字化,必須對(duì)聲音進(jìn)行采樣和量化。對(duì)音頻進(jìn)行量化必須考慮兩個(gè)重要的參數(shù),即頻率和幅度。頻率是指聲音的機(jī)械波每秒鐘振蕩的次數(shù),而幅度是指該機(jī)械波振蕩的強(qiáng)度[5]。本系統(tǒng)采用44 100 Hz采樣頻率,16位量化位數(shù)。那么通過采樣和量化,可以得到各個(gè)音頻采集裝置對(duì)應(yīng)的數(shù)字音頻流[5]。
對(duì)于各個(gè)音頻裝置采集得到的音頻數(shù)據(jù),以1 s為單位,可以得到44 100個(gè)16位的整數(shù),將其看成一個(gè)44 100維的向量,就是本文所指的特征。這些特征向量包含兩部分,一部分是撤防時(shí)采集的,另一部分是布防時(shí)采集的。每一次布防后,當(dāng)未出現(xiàn)警情的所采集的特征向量和撤防時(shí)所采集的特征向量都作為訓(xùn)練的樣本。當(dāng)每一次布防開始到布防結(jié)束所采集的特征向量,用于測(cè)試樣本。
當(dāng)某一個(gè)特征向量計(jì)算所得的入侵概率大于所設(shè)閾值,本系統(tǒng)的安防服務(wù)器通過網(wǎng)絡(luò)進(jìn)行告警,并將該時(shí)間段中所采集的音頻信號(hào)通過網(wǎng)絡(luò)發(fā)送至安防中心,由安防中心進(jìn)行進(jìn)一步處理。
本文提出基于稀疏表示、使用音頻特征進(jìn)行安防監(jiān)控的模型,推導(dǎo)一種使用最大似然估計(jì)求解稀疏向量和訓(xùn)練矩陣的算法,并設(shè)計(jì)了一個(gè)基于上述模型的安防系統(tǒng),詳細(xì)闡述了系統(tǒng)的關(guān)鍵技術(shù)實(shí)現(xiàn)。
但是,如何通過調(diào)整音頻采集裝置的擺放位置,以獲得更好的監(jiān)控效果,本文并未進(jìn)行詳細(xì)的探討和數(shù)學(xué)證明,在今后的工作中可以在該方面進(jìn)行更深入的研究。
[1]孫玉.數(shù)字家庭網(wǎng)絡(luò)總體技術(shù)[M].北京:電子工業(yè)出版社,2007.
[2]王天荊,鄭寶玉,楊震.基于自適應(yīng)冗余字典的語音信號(hào)稀疏表示算法[J].電子與信息學(xué)報(bào),2011,33(10)∶2372-2377.
[3]CHIANG C K,DUAN C H,LAI S H.Learning component-level sparse representation using histogram information for image classification[J].IEEE International Conference on Computer Vision,2011.[S.l.]:IEEE Press,2011:1519-1526.
[4]周偉鋒,熊金凱,李榕,等.視音頻硬盤采集壓縮系統(tǒng)設(shè)計(jì)、應(yīng)用及分析[J].電視技術(shù),2011,35(20):67-69.
[5]宋明超,林巖.TMS320C6727的音頻采集處理與回放系統(tǒng)設(shè)計(jì)[J].單片機(jī)與嵌入式系統(tǒng)應(yīng)用,2008(10):26-28.