臧媛媛 王守信 佟夢竹 王建興
摘? 要:基于非嵌入式傳感器數(shù)據(jù)的行為識別對家居設(shè)備控制、異常行為監(jiān)測非常重要,是智能空間環(huán)境下行為識別的研究熱點,不僅利于隱私保護(hù)而且能長期積累數(shù)據(jù)滿足個體行為偏好。針對傳感器數(shù)據(jù)序列中行為邊界標(biāo)識,并依次改善在線行為識別效果的問題,基于行為突變點檢測思想識別連續(xù)行為的相似度程度,使用KL散度實現(xiàn)突變點檢測,針對突變點檢測閾值的選擇問題,使用遺傳算法對其進(jìn)行自動設(shè)置。使用RF、QSVM、加權(quán)K近鄰(Weighted KNN,wKNN)、DT算法實驗驗證突變點時域特征能夠有效提高在線行為識別能力,證明了本文方法的有效性。
關(guān)鍵詞:智能空間;非侵入式傳感器;在線行為識別;突變點檢測;閾值自動設(shè)置
中圖分類號:TP391.4? ? ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:2096-4706(2020)05-0147-05
Intelligent Spatial Behavior Recognition Method Based on Mutation Detection
ZANG Yuanyuan1,WANG Shouxin1,TONG Meizhu2,WANG Jianxing3
(1.Aerospace ShenZhou Smart System Technology Co.,Ltd.,Beijing? 100029,China;
2.Beijing Jiaotong University Beijing? 100029,China;3.China National Aviation Fuel Group Limited Beijing? 100088,China)
Abstract:Behavior recognition based on non embedded sensor data is very important for home equipment control and abnormal behavior monitoring. It is a research hotspot of behavior recognition in intelligent space environment. It is not only conducive to privacy protection but also can accumulate data for a long time to meet individual behavior preferences. Aiming at the problem of identifying behavior boundary in sensor data sequence and improving the effect of online behavior recognition in turn,based on the idea of behavior mutation detection to identify the similarity degree of continuous behavior,KL diver-gence is used to realize mutation detection,and genetic algorithm is used to automatically set the threshold of mutation detection. Using RF,QSVM,weighted KNN (wKNN)and DT algorithm to verify the time-domain feature of mutation point can effectively improve the ability of online behavior recognition,which proves the effectiveness of this method.
Keywords:smart home;non-invasive sensor;online activity recognition;change point detection;threshold automation
0? 引? 言
近年來,智能空間等以提高生活、工作質(zhì)量的模式逐漸被接受并成為未來發(fā)展趨勢,具有安全舒適、高效便利、節(jié)能環(huán)保、信息通暢的特點[1]。智能空間人體行為識別研究得到越來越廣泛的重視,并取得較多研究成果[2]。根據(jù)用戶行為數(shù)據(jù)監(jiān)測的物理手段不同,可分為基于視頻、基于便攜傳感器和基于非侵入式傳感器三大類的人體行為識別。第一種方式較直觀,但存在隱私保護(hù)問題,用戶可能無法接受這種方式[3]。第二種方式利用佩戴在人體上的智能手環(huán)等傳感器采集人體運動信息,實現(xiàn)人體的進(jìn)、出、站立、坐下、停留、行走和奔跑等行為識別[4],不侵犯個人隱私,但存在影響舒適度、數(shù)據(jù)獲取不及時和不連續(xù)等問題。
非侵入傳感器行為識別將傳感器數(shù)據(jù)連續(xù)部分與預(yù)定義行為之一相關(guān)聯(lián)[5],成為當(dāng)前國內(nèi)外研究的熱點和趨勢之一。本文在航天神舟智慧系統(tǒng)技術(shù)有限公司物聯(lián)網(wǎng)智能感知與數(shù)據(jù)分析技術(shù)的基礎(chǔ)上,聯(lián)合北京交通大學(xué)和中國航空油料集團(tuán)有限公司共同開展基于突變點檢測的在線行為識別方法研究,驗證基于非侵入式傳感器數(shù)據(jù)的行為關(guān)聯(lián)性,提升在線行為識別能力的可行性和有效性,以期解決民航領(lǐng)域航油庫站生產(chǎn)、生活中基于智能人體行為識別的安全管理與規(guī)范作業(yè)行為的問題。針對如何利用行為邊界特征值改進(jìn)行為識別效果的問題,本文使用KL散度作為數(shù)據(jù)突變點檢測的方法,對傳感器事件序列的分割數(shù)據(jù)的行為邊界進(jìn)行識別,用以提供連續(xù)行為間的關(guān)聯(lián)信息。針對突變點檢測閾值自動設(shè)置問題,提出基于遺傳算法的突變點檢測,對閾值進(jìn)行自動設(shè)置。將突變點作為時域特征向量之一,采用隨機(jī)森林等算法對行為識別能力進(jìn)行試驗,驗證本文提出方法對智能空間環(huán)境下在線行為識別能力提升的有效性。
1? 相關(guān)研究
1.1? 離線行為識別
文獻(xiàn)[6]中針對傳感器序列提出了基于滑動窗口的行為分割方法,并采用SVM分類器和五折交叉驗證。文獻(xiàn)[7]中提出一種改進(jìn)的KNN聚類方法,對準(zhǔn)備食物這一行為進(jìn)行識別。文獻(xiàn)[8]中采用掃描路徑趨勢分析方法對獨居老人的日?;顒舆M(jìn)行識別,使用十倍交叉驗證的方法,對Aruba公寓內(nèi)11種行為進(jìn)行識別。文獻(xiàn)[9]使用馬爾可夫邏輯網(wǎng)絡(luò)(Markov Log-ic Network,MLN)對二值傳感器和電力監(jiān)測器的7天數(shù)據(jù)展開了行為識別。
以上研究關(guān)注點是利用歷史離線數(shù)據(jù)對人體行為進(jìn)行檢測,對發(fā)現(xiàn)人體行為規(guī)律和特點較為適宜,但實際應(yīng)用需對當(dāng)前行為或后續(xù)行為進(jìn)行識別和預(yù)測,這方面研究稱之為在線行為識別。
1.2? 在線行為識別
行為識別在實際應(yīng)用過程中往往希望對最新產(chǎn)生的傳感器數(shù)據(jù)進(jìn)行識別,這類似于行為預(yù)測,稱之為在線行為識別。文獻(xiàn)[10]提出一種在線行為預(yù)測的回歸樹(Regression Tree,RT)算法,由于事件的順序排序?qū)τ陬A(yù)測算法很重要,移動固定長度的滑動窗口以確定訓(xùn)練示例,然后在窗口之后的下一事件上進(jìn)行測試。文獻(xiàn)[11]提出一種基于頻繁序列提取的方法,并使用RF分類器進(jìn)行行為建模。
在線行為識別將歷史數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),然后對最新序列數(shù)據(jù)進(jìn)行測試,較為符合智能空間行為識別的實際應(yīng)用情境。本文的行為識別研究以此為主線展開研究。
2? 在線行為識別方法
2.1? 相關(guān)定義
定義1:傳感器事件。傳感器事件可以表示為e=
傳感器事件是非侵入傳感器的行為識別的最基本概念,傳感器信息的嚴(yán)格時間序列將作為行為識別的原始數(shù)據(jù)。通過對傳感器消息序列進(jìn)行分析,提取特征向量進(jìn)行人體行為識別。表1列出CASAS數(shù)據(jù)集中某一段時間內(nèi)記錄的傳感器事件序列。傳感器事件序列可映射到不同的日常行為,如表1中所示傳感器事件序列映射到Sleep行為標(biāo)簽。
定義2:傳感器事件序列。由一組傳感器事件按照嚴(yán)格時間序列組成的一組數(shù)據(jù),可以表示為es=
行為識別一般采用窗口的方式將連續(xù)傳感器事件序列分割成子序列,以便提取傳感器事件數(shù)據(jù)特征值??刹捎脮r間窗口和事件窗口兩種方式,既固定時間或固定事件長度。本文采用固定事件窗口方式實現(xiàn)傳感器事件序列的分割,為此給出傳感器事件窗口定義如下:
定義3:傳感器事件窗口數(shù)據(jù)。是傳感器事件序列的子序列,可表示為ew=
傳感器事件窗口所代表的傳感器事件序列片段間存在一定差異,相鄰片段間相似度越低,屬于不同行為的可能性越大,本文稱之為突變點,定義如下:
定義4:行為突變點。ewi和ewi+1是嚴(yán)格時間序列的兩個相鄰傳感器事件窗口,sim()為相似度函數(shù),threshold為相似度評估閾值,若sim(ewi,ewi+1) 2.2? 行為識別流程 構(gòu)建或訓(xùn)練行為識別一般遵循如下流程:首先對傳感器數(shù)據(jù)進(jìn)行預(yù)處理,一般為刪除冗余信息、對數(shù)據(jù)進(jìn)行歸一化操作等;然后采用窗口方式將數(shù)據(jù)切割成傳感器事件窗口數(shù)據(jù)。對傳感器事件窗口數(shù)據(jù)進(jìn)行變換處理,一般采用歸一化等方式將傳感器數(shù)據(jù)轉(zhuǎn)換為[0,1]區(qū)間,形成訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集;最后采用SVM、HMM、CRF、DT、RF等方法在訓(xùn)練集和測試集的基礎(chǔ)上進(jìn)行行為建模,用以實現(xiàn)行為識別。 近年來,對突變點檢測的研究集中在基于概率密度比的方法上,直接密度比估計的方法不需要實際估計窗口內(nèi)的概率密度分布,這種方法簡單得多。對于相似度評估閾值threshold的設(shè)置,考慮到個體行為特點的差異,在進(jìn)行突變點檢測時能根據(jù)個體日常行為特點自動設(shè)置相似度評估閾值,本文嘗試采用遺傳算法,對突變點檢測過程進(jìn)行優(yōu)化,實現(xiàn)相似度評估閾值threshold的自動設(shè)置。 2.3? 突變點檢測方法 2.3.1? 基于KL散度的突變點檢測 KL散度衡量的是兩個概率密度函數(shù)的接近程度,能精確真實地反映出事件隨著時間發(fā)生的概率分布變化。若P與Q分別是兩個相同事件空間里的兩個概率分布,則KL散度的定義為: DKL(P‖Q)= 其中,=1,=1。 對于離散概率密度分布的KL散度計算,可表示為如下: DKL(P‖Q)= 其中,=1,=1。 對于連續(xù)的概率密度分布的KL散度計算,可表示為式: DKL(P‖Q)= 其中,=1,=1。 KL散度的取值越小,說明P、Q分布越接近,反之,兩個概率分布之間的差別越大。當(dāng)KL散度大于設(shè)定的閾值時,即可認(rèn)為是突變點。本文通過概率密度比檢測兩個連續(xù)窗口是否存在突變點。為避免結(jié)果出現(xiàn)無窮,故在P和Q的基礎(chǔ)上,分別為其增加一個極小數(shù)值,例如2-52。 2.3.2? 突變點檢測評估方法 突變點檢測結(jié)果的四類分類結(jié)果如表2所示。 采用以下四種不同的性能指標(biāo)來評估KL散度突變點檢測算法的性能。 (1)查全率(Recall),表示在當(dāng)前所有真實的正樣本中,檢測到的真實正樣本所占的比例,表明突變點檢測方法對于真實狀態(tài)變化的指示。 Sensitivity=Recall=TPR= (2)假正例率(False Positive Rate,F(xiàn)PR),表示在所有真實的負(fù)樣本中,被錯誤分為正樣本的比率,表明檢測過程中會產(chǎn)生的誤警報的概率。 FPR= (3)特異度(Specificity),表示在所有真實的負(fù)樣本中,真正被預(yù)測為負(fù)樣本的概率。 Specificity=TNR= (4)G-Mean,用作突變點檢測性能的評價指標(biāo),該方法利用敏感性和特異度兩種指標(biāo)評估算法的性能,即正樣本的準(zhǔn)確率和負(fù)樣本的準(zhǔn)確率。 G-Mean= 2.3.3? 基于遺傳算法的突變點閾值設(shè)置 遺傳算法是目前效率較高的全局最優(yōu)搜索算法,具有適用范圍廣、穩(wěn)定性強(qiáng)、自適應(yīng)性強(qiáng)、收斂速度快等優(yōu)點,被廣泛應(yīng)用在機(jī)器學(xué)習(xí)、信號處理、自適應(yīng)控制等方面的優(yōu)化過程。本文采用遺傳算法對突變點檢測過程進(jìn)行優(yōu)化,通過選定一種評價指標(biāo),使之達(dá)到最優(yōu)解。 在突變點檢測的評價指標(biāo)中,G-Mean利用了敏感性和特異性兩種指標(biāo)評估算法的性能,能夠有效反映突變點類別不平衡的問題,所以使用G-Mean作為目標(biāo)函數(shù),將G-Mean到1的距離作為適應(yīng)度函數(shù)。將遺傳算法應(yīng)用于突變點檢測過程,能自動設(shè)置檢測閾值,無需多次進(jìn)行試驗來確定最佳閾值,易于擴(kuò)展,能夠為在真實的智能空間環(huán)境下的應(yīng)用提供基礎(chǔ)。 3? 實驗驗證與分析 通過對CASAS項目中H110公寓中的傳感器數(shù)據(jù),開展突變點檢測驗證和在線行為識別試驗兩方面工作,使用事件長度為5的固定窗口方法對原始傳感器數(shù)據(jù)進(jìn)行分割,從時域、窗口和傳感器三方面進(jìn)行特征提取,特征值及其具體的含義如表3所示。其中,突變點檢測結(jié)果屬于時域特征中的一個。 3.1? 在線行為識別度量 在對在線識別結(jié)果進(jìn)行度量時,采用總體分類精度(Accuracy,ACC)、宏查準(zhǔn)率(macro-P)、宏查全率(macro- R)、宏F1(macro-F1)來度量多分類任務(wù)的結(jié)果,其計算方法如下式所示,其中,k為測試數(shù)據(jù)量、yi′為第i個預(yù)測類別,yi為實際類別,n為類別個數(shù),Pi、Ri分別為每一類別的查準(zhǔn)率、查全率。 ACC==yi; macro-P=,其中,Pi=; macro-R=,其中,Ri=; macro-F1=。 3.2? 突變點檢測驗證結(jié)果與分析 采用遺傳算法對突變點檢測過程中的閾值進(jìn)行自動設(shè)置,實驗結(jié)果如圖1所示。 “×”為初始種群分布下G-Mean的分布情況,在區(qū)間(0,1.5)之間處于快速上升階段?!癌枴睒?biāo)出了遺傳算法檢測出的最佳閾值及最大的G-Mean,此時閾值α為5.39,G-Mean為72.56%,在最優(yōu)閾值下。 3.3? 在線行為識別試驗 3.3.1? 嚴(yán)格時間序列驗證實驗與分析 本節(jié)使用嚴(yán)格時間順序的傳感器序列數(shù)據(jù)對新行為識別進(jìn)行試驗分析,將數(shù)據(jù)劃分為包含訓(xùn)練和測試數(shù)據(jù)的多個以天為單位的時間段,用以維護(hù)數(shù)據(jù)的時間順序:每6天作為一段,使用這一段中的前4天數(shù)據(jù)進(jìn)行訓(xùn)練,后2天用于測試。實驗數(shù)據(jù)包含27天的數(shù)據(jù),為保證對比實驗結(jié)果更具說服力,將數(shù)據(jù)分為前24天和后24天。表4列出了采用時間順序測試與交叉檢驗方法進(jìn)行的行為識別結(jié)果,其中Time代表分段的嚴(yán)格時間順序測試,P24d代表前24天,A24d代表后24天。 采用基于時間順序訓(xùn)練數(shù)據(jù)測試的驗證方法,RF分類器的結(jié)果最好,其總體分類精度達(dá)到60.86%和57.7%,識別準(zhǔn)確度有限,宏查準(zhǔn)率、宏查全率和宏F1在前24天數(shù)據(jù)測試中分別為47.72%、46.66%、46.98%。 3.3.2? 突變點特征實驗結(jié)果與分析 將突變點作為特征值,其結(jié)果如表5所示,Time+CPD為添加突變點特征后的模型。 突變點使得基于RF的在線行為識別在前24天數(shù)據(jù)中的提升并不明顯,但在后24天的測試中,其將宏查準(zhǔn)率、宏查全率和宏F1分別提高了2.35%、9.69%和6.95%。在wKNN方法中,突變點在前24天的數(shù)據(jù)中,將宏查全率和宏F1分別提高了6.51%、6.24%;在DT分類器中,突變點在后24天的數(shù)據(jù)中,將宏查全率和宏F1分別提高了7.29%、3.67%。這表明,提供連續(xù)行為間的關(guān)聯(lián)信息,即突變點檢測特征,對當(dāng)前行為實際分配到哪一類別中產(chǎn)生了有益提升。 4? 結(jié)? 論 本文針對智能空間應(yīng)用行為邊界的時域特征改善在線行為識別的問題,使用KL散度實現(xiàn)突變點檢測,實現(xiàn)行為邊界識別。針對突變點檢測閾值的自動選擇問題,使用遺傳算法對其進(jìn)行自動設(shè)置。使用RF、QSVM、加權(quán)K近鄰(Weighted KNN,wKNN)、DT等算法實驗驗證突變點時域特征能夠有效改進(jìn)在線行為識別能力,證明了本文方法的有效性。在下一步研究中,可在以下幾個方面開展工作:首先,針對突變點檢測探索多樣化相似度函數(shù)和閾值自動設(shè)置方法,并通過對比分析找到較為合適的檢測方法;其次,從理論和實驗兩個方面對手動閾值設(shè)置、自動閾值設(shè)置的閾值間關(guān)系進(jìn)行分析,提升閾值自動設(shè)置的普適性;最后,嘗試用RNN神經(jīng)網(wǎng)絡(luò)等時序數(shù)據(jù)處理模型開展在線行為識別,進(jìn)一步提升行為識別準(zhǔn)確度等。 參考文獻(xiàn): [1] ALAM MR,REAZ MBI,ALI MAM. A Review of Smart Homes-Past,Present,and Future [J]. Systems,Man,and Cybernetics,Part C:Applications and Reviews,IEEE Transactions on,2012,42(6):1190-1203. [2] FINDEISEN M,MEINEL L,RICHTER J,et al. An omnidirectional stereo sen-sor for human behavior analysis in complex indoor environments [C].2015 IEEE International Conference on Consumer Electronics (ICCE),Las Vegas,NV,USA,2015:17-19. [3] GEORGE D,BRIAN K. H,MARJORIE S,et al. Senior residents perceived need of and preferences for “smart home” sensor technologies [J]. Interna-tional Journal of Technology Assessment in Health Care,2008,24(1):120-124. [4] CHO M,KIM Y,LEE Y H. Contextual Relationship-based Activity Segmenta-tion on an Event Stream in the IoT Environment with Multi-user Activities [C]. Proceedings of the 3rd Workshop on Middleware for Context-Aware Applications in the IoTDecember,2016:7-12. [5] AMINIKHANGHAHI S,COOK D J. Using Change Point Detection to Automate Daily Activity Segmentation [C].13th Workshop on Context and Activity Modeling and Recognition. IEEE,2017. [6] KRISHNAN N C,COOK D J. Activity recognition on streaming sensor data [J]. Pervasive and Mobile Computing,2014(10)Part B:138-154. [7] ZHANG Q,KARUNANITHI M,BRADFORD D,et al. Activity of Daily Living as-sessment through wireless sensor data [C].Engineering in Medicine and Biology Society (EMBC),2014 36th Annual International Conference of the IEEE. S.l.:s.n.,2014:1752-1755. [8] YATBAZ H Y,ERASLAN S,YESILADA Y,et al. Activity Recognition Using Binary Sensors for Elderly People Living Alone:Scanpath Trend Analysis Ap-proach [J].IEEE Sensors Journa,2019,19(17):7575-7582. [9] HONDA Y,YAMAGUCHI H,HIGASHINO T. Daily Activity Recognition based on Markov Logic Network for Elderly Monitoring [C].2019 16th IEEE Annual Consumer Communications & Networking Conference(CCNC),Las Vegas,NV,USA,2019:1-6. [10] MINOR B,COOK D J. Regression tree classification for activity predic-tion in smarthomes [C].2014 ACM International Joint Conference on Pervasive and Ubiquitous Computing,New York,USA ,2014:441-450. [11] RAEISZADEH M,TAHAYORI H. A novel method for detecting and predicting residents behavior in smart home [C].IEEE 2018 6th Iranian Joint Congress on Fuzzy and Intelligent Systems(CFIS),Kerman,2018:71-74. 作者簡介:臧媛媛(1986-),女,漢族,山東煙臺人,工程師,碩士,研究方向:物聯(lián)網(wǎng)技術(shù)及應(yīng)用、人工智能技術(shù)應(yīng)用。