郝文斌,王彬宇,茍瑞,朱佩佩,陳凱
(1.國網(wǎng)四川省電力公司成都供電公司,四川成都610041; 2.電子科技大學(xué)自動化工程學(xué)院,四川成都611731)
基于主成分分析與獨立成分分析的熱釋電紅外信號特征提取技術(shù)
郝文斌1,王彬宇1,茍瑞2,朱佩佩2,陳凱2
(1.國網(wǎng)四川省電力公司成都供電公司,四川成都610041; 2.電子科技大學(xué)自動化工程學(xué)院,四川成都611731)
提出一種基于主成分分析(PCA)和獨立成分分析(ICA)的人與老鼠熱釋電傳感器紅外信號特征提取的方法。首先對采集到傳感器數(shù)據(jù)進行去噪預(yù)處理,并使用FFT變換到頻域分析。然后用主成分分析法提取頻譜數(shù)據(jù)主要信息,降低數(shù)據(jù)冗余量,同時保留了99.95%以上原始信息。最后使用獨立成分分析法提取統(tǒng)計獨立的獨立成分,并用峰度系數(shù)來描述人和老鼠的獨立特征分量信息。實驗結(jié)果說明:提取的特征量都能充分描述人與老鼠的實際信息,且人與老鼠的特征差異足夠明顯,為提取人和老鼠熱釋電紅外信號的特征提供一個有效可行的方法。
熱釋電紅外傳感器;特征提取分類;FFT;峰度系數(shù)
在現(xiàn)如今社會中,熱釋電紅外傳感器(PIR)廣泛應(yīng)用于安防系統(tǒng),其對光線光照條件要求不高且紅外線穿透力強等特點,同時具有低功耗,低成本,隱蔽性好,體積小,對環(huán)境有較好的適應(yīng)性等顯著優(yōu)點。
國內(nèi)外眾多學(xué)者都對紅外傳感器識別技術(shù)進行了大量研究,2006年韓國釜山國立大學(xué)研發(fā)了基于PIR陣列實現(xiàn)檢測室內(nèi)人員活動情況[1]。波蘭的M.Kastek等設(shè)計了一種用于遠距離紅外輻射源檢測的PIR探測器系統(tǒng)[2]。J S Fang等[3]使用PIR探測器對固定路徑上來回行走的人體進行檢測和辨識。程衛(wèi)東等[4]采用PIR傳感器對人體行走運動特征進行研究。王林泓博士[5]采用小波熵對人與狗的識別分類進行了有效研究。
本文采用單只PIR作為探測器,采集檢測視角內(nèi)人與老鼠的自由運動信息,并提出一種基于主成分分析和獨立成分分析相結(jié)合,分析人與老鼠的釋電紅外信號特征的方法。
熱釋電探測器一般由熱釋電傳感器、菲涅爾透鏡與信號調(diào)理電路構(gòu)成,如圖1所示。熱釋電傳感器基于熱釋電效應(yīng),將接收到的變化的溫度信號轉(zhuǎn)換成變化的電信號輸出;菲涅爾透鏡,一般有兩個作用,一方面將視野范圍內(nèi)不同角度的紅外光線聚焦到熱釋晶體上,增強電信號的輸出;另一方面將探測器的視野范圍分成明暗交替的區(qū)間,使人體視場移動時,形成變化的紅外信號從而輸出變化的電信號。由于熱釋電傳感器輸出的極為微弱的電信號(mV級),必須經(jīng)過調(diào)理電路放大濾波去噪后,才方便對其處理。
圖1 熱釋電探測器檢測原理
圖1中,人通過一個明區(qū)和一個暗區(qū)時,根據(jù)光學(xué)成像的幾何性質(zhì),可以推出熱釋電輸出信號的頻率為
其中:v——人體的運動速度,m/s;
fb——菲涅耳透鏡的焦距,mm;
S——熱釋電晶體的寬度,mm,標(biāo)準(zhǔn)的雙元熱釋電晶體為1 mm;
L——人體至菲涅爾透鏡鏡面中心的距離,mm。
2.1 主成分分析原理
由于測得的時域波形信息不利于進行數(shù)據(jù)的深入挖掘,需要將采集到的數(shù)據(jù)進行去噪、標(biāo)準(zhǔn)化和FFT變換,將數(shù)據(jù)變換到頻域分析。人和老鼠在頻域上的特征直觀上差異不明顯,很難較好反映出人體和老鼠兩者的特征差異;另一方面由于FFT得到頻譜數(shù)據(jù)量較多,且冗余量較大,為了提高特征提取效率,頻譜數(shù)據(jù)需要使用主成分分析進一步處理。
主成分分析是一種常用的基于變量協(xié)方差矩陣對信息進行處理、壓縮和抽提的有效方法。主成分分析的目地是精簡變量個數(shù),去除冗余數(shù)據(jù),用盡可能少的變量去表示觀測到數(shù)據(jù)中的大部分信息,即將多個實際觀測到的變量轉(zhuǎn)換成盡可能少的互不相關(guān)的綜合指標(biāo)的統(tǒng)計分析方法。通過這種變換,可以有效解決觀測到的原始數(shù)據(jù)變量之間的共線性,解決由此帶來的運算數(shù)據(jù)量大且不穩(wěn)定、矩陣病態(tài)等問題。主成分分析是將主成分表示為原始觀測量的線性組合。
式中:Xj——原始數(shù)據(jù)矩陣標(biāo)準(zhǔn)化后得到的矩陣,方差為1;
fij——相關(guān)系數(shù)矩陣的特征值所對應(yīng)的特征向量矩陣中的元素,i=1,2,3…n,n為相關(guān)系數(shù)矩陣的維數(shù)。
在確定主成分個數(shù)時,可以根據(jù)相關(guān)矩陣特征值的累計貢獻率,選取適當(dāng)?shù)膫€數(shù)。
選取合適的主成分可以在降低數(shù)據(jù)維度的同時,將原始數(shù)據(jù)主要信息保留下來。但是由于主成分物理含義不明確,為進一步分析人和老鼠的特征信息帶來了挑戰(zhàn),所以本文利用獨立成分分析對原始數(shù)據(jù)信息進行進一步挖掘。
2.2 獨立成分分析原理
獨立成分分析(ICA)是盲源信號[6]分離的一種信號處理方法,其目的是把從多通道測量所得的混合信號分解為若干相互獨立的成分,因此被分解出的諸分量更容易具有實際的物理或生物意義[7-8]。設(shè)無噪聲的瞬時線性的混合源基本模型可表示為
式中:S——獨立成分向量矩陣;
A——混合矩陣;
Y——觀測混合信號源向量矩陣。
因為已知的僅有觀測的向量矩陣Y,源向量矩陣S和混合矩陣A都是未知,故A與S的解都是不唯一。由上分析,獨立成分分析法其實是尋找混矩陣W:
使得S的估計F盡可能獨立。
根據(jù)目標(biāo)函數(shù)的不同,實現(xiàn)ICA算法常用的有最大非高斯性法、極大似然估計法和最小互信息法等,Chein-I Chang以負熵作為衡量非高斯性的指標(biāo),提出了一種基于定點迭代的算法,稱為FastICA算法,這種算法具有簡單方便、收斂速度快和穩(wěn)定性好等優(yōu)點,它有并行計算和逐一計算兩種計算獨立成分的方式,后者容易產(chǎn)生誤差積累,本文采用前者并行計算的FastICA。
2.3 數(shù)據(jù)特征提取整體流程
數(shù)據(jù)處理流程如圖2所示。
圖2 數(shù)據(jù)處理流程
峰度系數(shù)(Kurtosis)是用來反映頻數(shù)分布曲線頂端尖峭或扁平程度的指標(biāo),用來度量數(shù)據(jù)在中心聚集程度,統(tǒng)計學(xué)中用四階中心矩測定,計算公式為
其中:x——樣本均值;
xi——樣本值;
n——樣本個數(shù);
s——樣本標(biāo)準(zhǔn)差。
峰度系數(shù)可以較好表征獨立成分所包含的數(shù)據(jù)特征。通過獨立分析法,人和老鼠的數(shù)據(jù)頻譜特征分量被獨立的分離出來,計算各個獨立成分的峰度系數(shù)并進行比較,可以有效區(qū)分人和老鼠的特征差異。
在完成PIR的信號特征提取后,便可以送入分類器對特征進行分類。提取的特征差異性直接影響到分類器的性能,因此本文重點考察特征提取。
3.1 實驗設(shè)置
實驗環(huán)境盡可能模擬實際應(yīng)用環(huán)境,實驗系統(tǒng)檢測裝置為1個壁掛式PIR探測器(RE200B),向下傾斜角為13°,安裝在離地面1 m高處,數(shù)據(jù)采集設(shè)備為一臺示波器。實驗時1人從探測器的視角內(nèi)(5 m之內(nèi))以正常行隨機速度和隨機路徑走過,采集數(shù)據(jù)75組,每組采集時間為24 s,采樣頻率250 Hz(6 000數(shù)據(jù)點),每組實驗采集相互不影響;在進行老鼠實驗時,由于野生老鼠行動難以控制,我們將老鼠圈在探測器前一個活動圈里,里面撒上一些食物,讓老鼠在活動圈內(nèi)自由活動覓食,同時盡量減少周圍環(huán)境對老鼠的驚擾,老鼠的活動圈選取范圍靠近PIR探測器,并且對PIR產(chǎn)生可觀輸出的最大范圍圈,為距離墻角0.4 m,大約長1.3 m寬1 m的矩形活動范圍(以充分研究老鼠的影響),采集數(shù)據(jù)75組,每組數(shù)據(jù)采集時間為24 s,每組實驗采集相互不影響。
本試驗中,去除一些因操作等其他原因造成的不合理數(shù)據(jù)后,采集到人體和老鼠各75組數(shù)據(jù),隨機抽取人體、老鼠各36組數(shù)據(jù)用于實驗數(shù)據(jù)分析。
3.2 實驗數(shù)據(jù)合理性分析
測得時域波形信息不夠直觀,分析過于復(fù)雜,無法準(zhǔn)確進行數(shù)據(jù)深入挖掘,因此將采集到數(shù)據(jù)去噪、標(biāo)準(zhǔn)化后進行FFT變換,變換到頻域分析,36組人體和36組老鼠頻譜數(shù)據(jù)中隨機抽取8組列出,如圖3、圖4所示(FFT變換后有6 000個點,頻譜圖中只畫出了幅度不為0的點)。
圖3 人體頻譜圖
圖4 老鼠頻譜圖
因路徑隨機速度隨機,人體和老鼠的頻譜段相對集中在0~2 Hz頻段,在實際試驗中,人體活動范圍最近時距離PIR探測器最近大約L=1 m,最快速度的大約為v=1.5 m/s(人正常速度約為1 m/s),假設(shè)在最近距離時速度也最大,菲涅爾透鏡焦距為fb=10 mm,熱釋電晶體的寬度S=1 mm,則最大頻率為:
頻率最低時是緩慢移動且距離最遠時,這時頻率接近0;因此人體頻率是分布在0~2 Hz是符合試驗的。
老鼠自由活動覓食時,走走停停,速度時快時慢,實驗觀察出現(xiàn)最快速度時比人體稍快大約1.7m/s,假設(shè)這時距離也在最近處,則老鼠頻率最大時為
實際中由于老鼠在圍欄邊緣時,圍欄有一定高度遮擋,PIR檢測到老鼠的Lr>1.08 m,同時在最近處速度也有可能不是最大,或者最大速度時距離也不是最近,故導(dǎo)致頻率并未達到計算的2.5 Hz。
上述頻譜圖對比,可以初步看出,老鼠的頻譜相對人體比較豐富,這也反映了移動熱源穿過明暗區(qū)域時的路徑和速度不同,由于老鼠走走停停,速度波動較大,而人在行走時,確定初速后一般速度不會波動太大,且行走路線相對老鼠而言也帶有較強的目的性,一般都是從視角的一邊穿越到另一邊,而不同于老鼠,在視角內(nèi)來回走動,因而老鼠相對人的頻率要豐富些。
綜上分析,將采集到的試驗數(shù)據(jù)進行FFT變換后分析,完全符合且能反映實際實驗情況,是合理有效的。但是在上圖中這種頻率幅值在豐富度上差距不太明顯,很難反映出人體和老鼠兩者特征差異,因此頻譜數(shù)據(jù)需要進一步處理。
3.3 數(shù)據(jù)特征提取
數(shù)組數(shù)據(jù)每行標(biāo)準(zhǔn)化后得到36行6000列的數(shù)據(jù)矩陣,F(xiàn)FT變換后仍然得到36行6000列的頻譜點數(shù)據(jù)矩陣,數(shù)據(jù)冗余量巨大,從上述頻譜圖中也可以得知,存在大量為0的頻譜點,為了方便運算,需要使用主成分分析法將頻譜點矩陣數(shù)據(jù)進行壓縮,本論文根據(jù)累計貢獻率選取了12個主成分,這樣就將36維的矩陣降低到12維,維數(shù)降低2/3,精簡大量的冗余數(shù)據(jù),人體保留了99.98%原始信息,老鼠保留了99.95%原始信息。這一步處理實際上是采用主成分對數(shù)據(jù)進行精簡處理,為獨立成分分析打下基礎(chǔ)。
采用主成分分析得到的12維新觀測矩陣,對其進行獨立成分分析,可以得到12個獨立成分,數(shù)據(jù)特征被依次分離出來,這些特征是相互獨立且具有物理意義的。人體和老鼠的獨立成分如圖5和圖6所示。
圖5 人體獨立成分
圖6 老鼠獨立成分
由上圖對比所示,獨立成分的作用是提取分離主要特征,在這些人體特征比較強的頻率點,會被提取分離出來,表現(xiàn)在提取的某個獨立成分則為:在獨立成分中,該頻譜點峰值極高,得到強化,周圍峰值較低,得到弱化,這個峰值差異越明顯表征該點特征越強。而人的頻譜成分沒有老鼠豐富,所以人的頻譜在某些頻率點上的特征比較弱,因而在某個獨立分量中,該頻率點峰值與周圍較低峰值相差不大,差異不夠明顯;另一方面老鼠比人的頻譜豐富,特征性較強的頻率點較多,分出的獨立成分就表現(xiàn)為峰值差異比人較明顯。
為了更好描述這些特征,即更好描述這些獨立成分峰值差異,本論文采用峰度系數(shù)來衡量各個獨立成分的特征差異。峰度系數(shù)是用來反映頻數(shù)分布曲線頂端尖峭或扁平程度的指標(biāo)。將人和老鼠的12個獨立成分,分別求峰度系數(shù),并與每個獨立成分的峰值點所在的頻率對應(yīng)起來,制作成表格如表1和表2。
表1 人體頻率峰度系數(shù)表
表2 老鼠頻率峰度系數(shù)表
因老鼠的獨立成分峰值分別對應(yīng)前12個頻率點,無法獲得老鼠在此頻率點之后其他頻率點的特征情況,為了不引入人為誤差,選取人和老鼠分別強化前12個頻譜點的獨立成分的峰度系數(shù)繪制峰度系數(shù)曲線。如圖7所示為人和老鼠的頻率峰度系數(shù)曲線,縱坐標(biāo)為獨立成分峰度系數(shù),橫坐標(biāo)為該獨立成分強化的頻率點,即獨立成分峰值所在的頻點;藍色曲線為人體峰度系數(shù)曲線,紅色曲線為老鼠峰度系數(shù).
圖7 頻率峰度系數(shù)曲線
老鼠的峰度系數(shù)(紅色)分布前端較平穩(wěn),每個頻率點峰度系數(shù)較大,明顯大于人體的峰度系數(shù)。這表明了該獨立分量最高峰值點與周圍峰值點差異明顯,表征著該頻率點的特征明顯。由于每個頻率點峰度系數(shù)都很大,表征著蘊含老鼠明顯特征信息的頻率較多,老鼠的頻譜分布比較豐富。這反映在老鼠的活動中走走停停,路徑來來回回,速度波動較大的活動特性上,即該曲線能完全充分表征老鼠活動信息,完全可以作為老鼠的有效特征信息。
人體的峰度曲線則波動較大,只有在某些特定頻點峰度系數(shù)較大即這點特征信息較為明顯,而在某些頻率點較小甚至為0,這表明在這點的特征信息不夠明顯或者沒有,反映在獨立分量中就是(該頻點)最大峰值與其他峰值差異不大,這符合人體頻譜分布比較單一的頻域特性,而這也與實際人活動特性相吻合,人在經(jīng)過菲涅耳透鏡劃分的明暗區(qū)域的方式?jīng)]有老鼠復(fù)雜,故頻譜分布沒有老鼠豐富。人的路徑一般是從視角一邊到另一邊,即使在視角內(nèi)迂回,也很少像老鼠行動來來回回的習(xí)慣,而且一旦行走,在PIR視區(qū)那段短距離范圍內(nèi),人的速度波動范圍較小,因此該(藍色)峰度曲線能完全表征人體的活動信息,完全可以作為人的特征信息。
綜上所述,人和老鼠的特征曲線走勢區(qū)別較大,峰度系數(shù)值也區(qū)別很大,兩者特征差異極為明顯,因而可以作為人和老鼠的良好的區(qū)分特征信息。
本文針對老鼠這一誤報源問題,提出了基于傅里葉變換、主成分分析和獨立成分結(jié)合使用的方法提取人體和老鼠的特征信息,不僅精簡了2/3的冗余數(shù)據(jù),還保留了99.95%以上的原始信息,并使用峰度系數(shù)這一指標(biāo)對特征信息進行了有效描述,分離出的特征都能有效充分反映各自的實際活動信息,且人與老鼠之間的特征區(qū)別明顯,可以作為有效分類識別的特征。
[1]HA K N,LEE K C,et al.Development of PIR sensor based indoor location detection system for smart home[C]// SICE-ICASE international Joint Conference,2006:2162-2167.
[2]KATEK M,PIATKOWSK S T.Passive infrared detector used for detection of very slowly moving or crawling people[J].Optoelectronics Review,2008,16(3):77-84.
[3]FANG J S,HAO Q,DAVID J B,et al.Path-dependent human identification using a Pyroelectric infrared sensor and Fresnel lens arrays[J].Optics Express,2006,14(2): 609-624.
[4]程衛(wèi)東,董永貴.利用熱釋電紅外傳感器探測人體運動特征[J].儀器儀表學(xué)報,2007,29(5):1020-1023.
[5]王林泓,龔衛(wèi)國.基于小波熵的低誤報率人體熱釋電紅外信號識別[J],儀器儀表學(xué)報,2009,30(12):2485-2487.
[6]趙青,胡波,凌燮亭.非理想信道多用戶數(shù)字信號的盲分離[J].電子學(xué)報,1999,27(1):41-44.
[7]鐘明軍,理學(xué)報,唐煥文,等.空間獨立成分分析實現(xiàn)你IRI信號的盲源分離[J].生物物理學(xué)報2003,19(1):7-983.
[8]武振華,史振威,唐煥文,等,新的獨立成分分析算法實現(xiàn)功能磁共振成像信號的盲分離[J].生物物理學(xué)報,2004,20(3):188-192.
(編輯:徐柳)
A new way of extracting the character of PIR signals by PCA and ICA
HAO Wenbin1,WANG Binyu1,GOU Rui2,ZHU Peipei2,CHEN Kai2
(1.State Grid Chengdu Power Supply Company,Chengdu 610041,China; 2.School of Automation Engineering,University of Electronic Science and Technology of China,Chengdu 611731,China)
In this paper,a new way has been presented to extract the character of pyroelectronic infrared sensor(PIR)signals from human and mice by principal component analysis(PCA)and independent component analysis(ICA).Firstly,the noses is removed from the original signals.Then the processed signals is translated from time domain to frequency domain by FFT.Next the signals are compressed by PCA in order to select the main useful information which remains the 99.95%of the original information.In the end,the principal typical components that is measured by kurtosis are picked up precisely from human and mice by the use of ICA.Experimental data show that the principal typical components can efficiently express the huge difference between the feature information about human and mice.In brief,this method provides an effective and feasible approach for obtaining the character of PIR signals from human and mice.
PIR;feature extraction and classification;FFT;kurtosis
A
1674-5124(2016)11-0113-06
10.11857/j.issn.1674-5124.2016.11.023
2016-02-04:
2016-03-25
郝文斌(1976-),男,遼寧本溪市人,高級工程師,博士,主要從事電力系統(tǒng)繼電保護及調(diào)度運行等研究。