馮先成 ,李 寒 ,周 密 ,郭耀飛
1.智能機器人湖北省重點實驗室(武漢工程大學),湖北 武漢 430205 2.北京漢通達科技有限公司,北京 100081
至2012年底,我國60歲及以上老年人口已達1.94 億,占總人口的 14.3%,在 2014 年已突破 2億,并以每年3.2%的速度增加.根據國際標準,我國已經進入老年型社會.隨著社會老齡化程度的不斷加深,孤單老人數呈上升趨勢,現(xiàn)如今成為一個不可忽視的社會問題.目前,我國中西部地區(qū)的城鄉(xiāng)空巢家庭超過50%,社會老齡化直接導致社會養(yǎng)老等難題,特別是空巢老人、家庭的健康和安全生活,是智慧城市評價指標體系建設的一個重要指標,需要整個社會、家庭、社區(qū)、政府及個人的共同努力,因此,建設智慧城市的體系架構,有利于社會和諧.
建立空巢老人識別模型,需要包含空巢老人的用戶信息數據,主要有:
用戶信息:記錄本地區(qū)用戶(通信運營網對應的手機個人)基本情況、終端信息、計費等數據;
通話清單:記錄本城市用戶(手機號碼)在某月每天的通話(主/叫、市/話)情況;
短信清單:記錄了上述用戶在某月每天的短信發(fā)送/接收情況.
根據空巢老人的用戶信息數據,建立空巢老人的數據模型,識別本地區(qū)的空巢老人手機號碼、所在區(qū)域、子女手機號碼等信息[1-2].
對于大量的多特征的數據的識別問題,構造識別函數,運用神經網絡進行識別.對于信息充分且正常的用戶,構造識別函數具有識別準確,原理簡單易行的優(yōu)點.識別模型符號說明如表1所示.
表1 符號說明Table 1 Symbol description
通過分析其區(qū)號差別,年齡差距,通話的類型,通話的時間段等指標,實現(xiàn)了對空巢老人較為精準的識別,并通過區(qū)號將其所得空巢老人集合分為與子女同城的空巢老人與非同城的空巢老人兩類.首先進行對通話信息的預處理,篩選出能進行識別的數據,在此基礎上先判別主叫與被叫是否為父母與子女的關系,接著判別主叫與被叫是否在同一個城市,得出與子女同城的空巢老人與非同城的空巢老人集合.
在對用戶信息進行合理分析后,構造了一個評判空巢老人用戶的識別函數,該函數是一個多變量的函數,對各個變量進行分開評判,最后以乘積的形式得到結果[1-2].
選取主叫被叫年齡差距,通話時間,通話時長,通話次數為函數自變量,構造綜合識別函數Gi(x),其函數關系如下:
其中用戶特征矩陣 X=[Xa1,Xa2,T1,T2,N]
用戶年齡識別函數
通話時間識別函數為:
年齡差距識別函數為:
通話起始時間識別函數為:
一周內的通話次數識別函數為:
考慮到對于一個用戶,由于通話對象不同,識別函數的結果也不同,對于Gi(x)同時取1和0的用戶,定義函數 G(x):
當 G(x)=0,表示該用戶不是空巢老人,G(x)=1,表示該用戶是空巢老人.這樣,就識別出空巢老人的集合.部分結果如表2所示.
表2 空巢老人集合Table 2 Empty-nestelders collection
在所識別出的空巢老人集合中,以與子女是否同城為依據,進一步劃分:
空巢老人識別流程如圖1所示.在通話清單中被叫號碼有異網非本運營商的用戶,在用戶資料中不能找出其個人信息,因此,在通話信息預處理過程中去除被叫為y和g開頭的號碼.
圖1 空巢老人識別流程Fig.1 R ecognition process of empty-nestelders
通過合理分析空巢老人識別系統(tǒng)的數據,在對特征進行粗略的篩選后,選出手機價格,套餐檔次等7個特征,如圖2所示.
為了選擇出對用戶識別最有效的特征,利用識別函數識別的結果,將空巢老人集合與非空巢老人集合在不同的特征組合下進行線性可分性判斷(其中圓圈表示非空巢老人用戶,正方形表示空巢老人集合).
給出兩類集合樣本各50個,7個特征兩兩組合共有21種組合,幾種特征組合的線性可分性如圖3所示.
圖2 識別系統(tǒng)的數據分析Fig.2 Data analysis of identification system
圖3 特征組合的線性可分性Fig.3 Linear separability of feature combination
前饋網絡主要實現(xiàn)函數逼近、模式識別、分類、數據壓縮.前饋神經網絡模型如圖4所示.本模型中運用前饋神經網絡的模式識別功能,搭建2層前饋神經網絡,隱層激活函數為sigmoid函數,softmax 為輸出層函數,訓練算法為共軛梯度法[3-5].
圖4 前饋神經網絡模型Fig.4 Networksmodel of feed forward neural
采用前饋神經網絡,采集足夠多的典型性好和精度高的樣本數據,必須將收集到的樣本數據隨機分成訓練樣本、檢驗樣本(10%以上)和測試樣本(10%以上)三部分[3-5].因此,在前饋神經網絡模型的輸出結果樣本中,隨機選取100個空巢老人與100個非空巢老人樣本,選取其中75%的訓練樣本,15%用于檢驗,15%用于測試.
為了選擇出對用戶識別最有效的特征,將這些特征進行組合,7種特征總組合數為個,只選取2個特征的組合與3個特征的組合作為輸入,運用MATLAB神經網絡模式識別工具箱對樣本進行識別,神經網絡的結構如圖5所示.
圖5 神經網絡結構Fig.5 Neural network structure
兩個特征的組合:(長途費,市話費),(市話費,流量費),(短信費,長途費),(市話費,短信費),(短信費,流量費),(流量費,長途費),(套餐檔次,消費金額).三個特征的組合:(短信費,市話費,長途費),(市話費,長途費,流量費),(手機價格,套餐檔次,消費金額).
識別效果圖的各字段含義:
Training confusionmatrix (訓練樣本效果圖)
Validation confusionmatrix(檢驗樣本效果圖)
test confusionmatrix (測試樣本效果圖)
all confusionmatrix (總效果圖)
Training ROC (訓練樣本ROC曲線)
Validation ROC (檢驗樣本ROC曲線)
Test ROC (測試樣本ROC曲線)
ROC (receiver operator characteristic curve)曲線:接收特性曲線,曲線下面積越大,識別準確性越高.在每個效果圖中,位于第三行第三列的數值為網絡對該樣本的識別準確率,該項指標數值越接近于1,表示網絡識別效果越好.幾種組合的識別效果如圖6所示.
圖6 各組合的識別效果Fig.6 Recognition effects of each combination
通過對比,發(fā)現(xiàn)選?。ㄊ謾C價格,套餐檔次,消費金額)這一組特征作為網絡的輸入時,能得到最好的識別效果,無論從識別的準確率(訓練樣本68.6%,檢驗樣本 73.3%,測試樣本 73.3%),還是從ROC曲線顯示的診斷準確性來看,以該組特征為判據識別空巢老人都具有良好的效果.
神經網絡算法以其強大的非線性處理能力,自組織和自適應的學習性能等特點,廣泛應用于模式識別、優(yōu)化組合、機器人控制、信號處理等領域.神經網絡中使用最為廣泛的就是前饋神經網絡算法[6-7].
上述模型通過對用戶資料信息、通話與短信信息的多級判別,能篩選出比較符合條件的空巢老人,原理簡單,易于實現(xiàn).
但是模型的篩選條件不夠完善,對短信表沒有進行充分的利用,對于子女在外地,家庭條件不富裕的用戶來說,發(fā)短信往往比打電話流行.因此,對于經常發(fā)短信而打電話較少的用戶,僅僅通過用戶資料表和通話清單難以將其識別出來[8].
通過前饋神經網絡算法建立的數學模型,在所給的通話清單數據中,識別出空巢老人及其子女的電話號碼,給老年人送去別樣的關懷.比如,在節(jié)假日給老人發(fā)送祝福的短信,并且通過短信方式提醒他們的子女給老人送去祝福.根據空巢老人的通話特點,給空巢老人以最低的通信話費來與自己的子女聯(lián)系.通信運營商也可以在平時向空巢老人發(fā)送有利心理健康、溫暖的短信,讓他們感受到社會對他們的關愛.
通過上述模型,將所確定的空巢老人名單及信息交給社會福利組織、志愿者組織以及社區(qū)養(yǎng)老機構,便于他們舉辦一些例如登門探望等送愛心活動,為老年人提供集體生活照料、醫(yī)療保健、精神慰藉等綜合服務.還可以每年更新空巢老人的數據,為統(tǒng)計局等統(tǒng)計機構提供了簡單有效的途徑來更新數據,構建和諧社會.
[1]沈斌,漆奮平,江維,等.基于BP網絡的超濾膜分離中藥成分的分析與實現(xiàn)[J].武漢工程大學學報,2009,31(9):55-58.SHEN Bin,QI Fen-ping,JIANG Wei.Analysis and implement of separatte chinese medicine based on BP network[J].Journal of Wuhan Institute of Technology,2009,36 (9):55-58.(in C hinese)
[2]黃登斌,夏學知.基于用戶分類信息的空巢老人挖掘模型[J].計算機與數字工程,2013(3):440-441.HUANG Deng-bin,XIA Xue-zhi.Mining model of empty nester based on the classification of the users information [J].Computer& Digital Engineering, 2013(3):440-441.(in C hinese)
[3]李翔,蘇成,王韶君,等.基于模糊神經網絡的綜合評判方法[J].計算機工程,2009,35(6):200-203.LI Xiang,SU Cheng,W ANG Shao-jun.Comprehensive evaluation method based on fuzzy neural network [J].ComputerEngineering,2009,35(6):200-203.(in C hinese)
[4]王勇,付志紅,張淮清.基于前饋神經網絡的電網基波高精度檢測[J].電網技術,2011(8):124-128.WANG Yong,F(xiàn)U Zhi-h(huán)ong,ZHANG Huai-qing.High precision detection of fundamental of power grid based on back propagation neural network [J].Power System Technology,2011(8):124-128.(in C hinese)
[5]劉瑞葉,黃磊.基于動態(tài)神經網絡的風電場輸出功率預測[J].電力系統(tǒng)自動化,2012(11):19-22.LIU Rui-ye,HUANG Lei.Wind power forecasting based on dynamic neural networks [J].Automation of electric Power Systems,2012(11):19-22.(in C hinese)
[6]蔡信,李波,汪宏華.基于神經網絡模型的動力電池SOC 估計研究[J].機電工程,2015(1):128-132.CAIXin,LIBo,WANG Hong-h(huán)ua.Estimation of stateof-charge for electric vehicle power battery with neural network method [J].Journal of Mechanical& Electrical Engineering,2015(01):128-132.(in C hinese)
[7]楊帆,姜勇,楊元君.信息融合技術在礦井安全監(jiān)測系統(tǒng)中的應用[J].武漢工程大學學報,2014,36(5):64-67.YANG Fan,JIANG Yong,YANG Yuan-jun.Information fusion technology in application of mine safety monitoring system [J].Journal of Wuhan Institute of Technology,2014,36(5):64-67.(in C hinese)
[8]劉揚,張振海.小波神經網絡的無刷直流電機轉子位置檢測方法[J].武漢工程大學學報,2014(10):66-70.LIU Yang,ZHANG Zhen -h(huán)ai.Rotor position detection method of brushless motor based on wavelet neural Network [J].Journal ofWuhan Institute of Technology,2014(10):66-70.(in C hinese)