孟東霞 陳剛 許美玲
【摘要】 我國(guó)流動(dòng)人口呈現(xiàn)出規(guī)模持續(xù)擴(kuò)大,人口結(jié)構(gòu)日益復(fù)雜化的趨勢(shì),但是目前的流動(dòng)人口統(tǒng)計(jì)方法明顯滯后,不能滿(mǎn)足各級(jí)政府和社會(huì)各界對(duì)流動(dòng)人口數(shù)據(jù)的需求,亟待結(jié)合大數(shù)據(jù)分析方法進(jìn)行改進(jìn)。而隨著智能手機(jī)等移動(dòng)終端的普及,電信運(yùn)營(yíng)商獲取了用戶(hù)身份、通訊記錄、地理位置等海量客觀數(shù)據(jù),本文將結(jié)合電信運(yùn)營(yíng)商獲取的數(shù)據(jù)信息分析流動(dòng)人口所表現(xiàn)出的數(shù)據(jù)特征,為統(tǒng)計(jì)流動(dòng)人口提供判定思路。
【關(guān)鍵詞】 電信大數(shù)據(jù) 流動(dòng)人口 價(jià)值分析 判定
一、引言
流動(dòng)人口指離開(kāi)戶(hù)籍所在地的縣、市或者直轄區(qū),以工作、生活為目的異地居住的成年育齡人員,對(duì)某個(gè)城市而言,包括流入人口和流出人口,人口的流入和流出情況在一定程度上反映出當(dāng)?shù)氐慕?jīng)濟(jì)發(fā)展情況,也對(duì)當(dāng)?shù)卦斐梢幌盗械纳鐣?huì)經(jīng)濟(jì)影響,包括人力資源的分布變化、對(duì)公共設(shè)施配備的需求增加、對(duì)城市建設(shè)的影響等。目前常用的流動(dòng)人口統(tǒng)計(jì)方法主要包括人口普查、人口抽樣調(diào)查、構(gòu)建流動(dòng)人口信息平臺(tái)等方法,缺乏實(shí)現(xiàn)快速動(dòng)態(tài)監(jiān)測(cè)、短周期內(nèi)流動(dòng)人口規(guī)模測(cè)度統(tǒng)計(jì)的有效方法和策略。若要對(duì)某城市實(shí)現(xiàn)以上統(tǒng)計(jì)目標(biāo),需實(shí)時(shí)獲取城市范圍內(nèi)所有人員有關(guān)原戶(hù)籍、現(xiàn)所在地等個(gè)人信息,傳統(tǒng)方法很難在短時(shí)間內(nèi)獲取相關(guān)數(shù)據(jù),而這對(duì)電信運(yùn)營(yíng)商來(lái)說(shuō)卻是易于反掌,原因在于移動(dòng)的基站系統(tǒng)和實(shí)名制注冊(cè)要求。據(jù)工業(yè)和信息化部統(tǒng)計(jì),截止2015年4月,我國(guó)移動(dòng)用戶(hù)數(shù)總規(guī)模接近12.93億戶(hù),而全國(guó)總?cè)丝跒?3.6億人,移動(dòng)電話(huà)普及率已達(dá)95.07部/百人,接近人手一部手機(jī)。對(duì)于流動(dòng)人口而言,無(wú)論其流動(dòng)方向而言,總會(huì)通過(guò)移動(dòng)通信與家里留守的親人保持聯(lián)系,這使得流動(dòng)人口的統(tǒng)計(jì)特征與移動(dòng)通信數(shù)據(jù)保持基本一致,為應(yīng)用電信大數(shù)據(jù)統(tǒng)計(jì)流動(dòng)人口提供了較強(qiáng)的理論和數(shù)據(jù)支持。
二、電信大數(shù)據(jù)的類(lèi)型分析
電信運(yùn)營(yíng)商的數(shù)據(jù)具有十分寶貴的研究?jī)r(jià)值,包括用戶(hù)身份信息、設(shè)備終端數(shù)據(jù),出于對(duì)在網(wǎng)客戶(hù)進(jìn)行服務(wù)計(jì)費(fèi)的需要,運(yùn)營(yíng)商實(shí)時(shí)記錄用戶(hù)上網(wǎng)數(shù)據(jù)、所在位置數(shù)據(jù)、通信數(shù)據(jù)等內(nèi)容。
(1)用戶(hù)身份信息:包括用戶(hù)姓名、年齡等個(gè)人信息,業(yè)務(wù)訂購(gòu),積分獲取等數(shù)據(jù)。在逐步實(shí)施用戶(hù)實(shí)名制之后,運(yùn)營(yíng)商擁有了較為準(zhǔn)確全面的用戶(hù)個(gè)人資料,身份證號(hào)信息提供了用戶(hù)的出生地信息,是進(jìn)行流動(dòng)人口統(tǒng)計(jì)的主要數(shù)據(jù)基礎(chǔ)。(2)設(shè)備終端信息:主要記錄用戶(hù)終端的數(shù)據(jù)信息,包括品牌、型號(hào)以及手機(jī)終端的性能信息。(3)用戶(hù)行為數(shù)據(jù):記錄用戶(hù)的通話(huà)、數(shù)據(jù)上網(wǎng)、收發(fā)短信等行為,以通話(huà)為例,記錄是否主被叫,通話(huà)時(shí)間、時(shí)長(zhǎng),是否漫游,對(duì)方號(hào)碼歸屬地等信息。由于流動(dòng)人群大多數(shù)存在頻繁與戶(hù)口所在地進(jìn)行通信的現(xiàn)象,因此通話(huà)行為數(shù)據(jù)可被用來(lái)作為統(tǒng)計(jì)流動(dòng)人口的依據(jù)。(4)用戶(hù)位置數(shù)據(jù):為保證用戶(hù)能接打電話(huà),手機(jī)終端需要與移動(dòng)基站不停地進(jìn)行呼叫通信,運(yùn)營(yíng)商可根據(jù)通信基站確定用戶(hù)所處的大致范圍,而隨著用戶(hù)位置的改變,網(wǎng)絡(luò)會(huì)進(jìn)行基站切換和位置更新,這就形成了特定時(shí)間內(nèi)用戶(hù)位置的移動(dòng)軌跡。研究檢測(cè)用戶(hù)在某個(gè)時(shí)間范圍內(nèi)的位置變化也是流動(dòng)人口研究的統(tǒng)計(jì)依據(jù)。綜上所述,電信用戶(hù)入網(wǎng)登記的身份信息,在網(wǎng)期間所產(chǎn)生的行為數(shù)據(jù)和位置數(shù)據(jù)對(duì)統(tǒng)計(jì)流動(dòng)人口有重要的應(yīng)用價(jià)值。
三、流動(dòng)人口電信數(shù)據(jù)的表現(xiàn)特征
對(duì)某一特定區(qū)域而言流入人口和流出人口,在身份信息、行為數(shù)據(jù)和位置數(shù)據(jù)方面表現(xiàn)出不同的數(shù)據(jù)特征,以下將分別進(jìn)行分析:(1)流入人口的數(shù)據(jù)特征分析。1、身份信息:實(shí)名認(rèn)證客戶(hù)的身份證信息中前六位所對(duì)應(yīng)的出生地區(qū)域代碼與電信運(yùn)營(yíng)商所在地不一致,可根據(jù)其統(tǒng)計(jì)流入人口的來(lái)源地區(qū)分布;2、位置信息:在春節(jié)、五一或國(guó)慶等節(jié)假日期間,出于與親友團(tuán)聚的目的,運(yùn)營(yíng)商檢測(cè)到的流入人群所處基站位置信息發(fā)生明顯變化,顯示區(qū)域與身份信息所在地一致;3、用戶(hù)行為數(shù)據(jù):流入人群與其身份證記錄的外地區(qū)域客戶(hù)有頻繁的長(zhǎng)途通話(huà)、收發(fā)短信等行為。節(jié)假日期間,流入人群在身份證顯示區(qū)域有漫游通話(huà)的情況。(2)流出人口的數(shù)據(jù)特征分析。1、位置信息:流出人口的身份證出生地信息顯示為本地;2、位置信息:在春節(jié)等節(jié)假日期間,流出人口有回流情況,即所在基站位置與出生地一致;3、用戶(hù)行為數(shù)據(jù):流出人口與本地區(qū)域客戶(hù)有較高頻率的長(zhǎng)途通話(huà);節(jié)假日期間,客戶(hù)漫游地區(qū)與本區(qū)域一致。
總結(jié):電信運(yùn)營(yíng)商在提供移動(dòng)通信業(yè)務(wù)的過(guò)程中, 獲取了海量真實(shí)的客戶(hù)歷史數(shù)據(jù), 客觀反映了用戶(hù)的真實(shí)身份信息、位置信息和消費(fèi)行為,結(jié)合流動(dòng)人口的消費(fèi)、移動(dòng)等行為特征,本文研究分析了流入、流出人口電信數(shù)據(jù)的特定表現(xiàn)特征,為進(jìn)一步應(yīng)用電信大數(shù)據(jù)統(tǒng)計(jì)流動(dòng)人口數(shù)量提供了參考依據(jù)。
參 考 文 獻(xiàn)
[1] 智勇,盛昭翰. 基于移動(dòng)通信信息資源的人口流動(dòng)趨勢(shì)研究[J]. 山東社會(huì)科學(xué), 2009(11).
[2] Liu P. 電信行業(yè)中的大數(shù)據(jù). 電信網(wǎng)技術(shù)[J], 2013(8).
[3] 趙時(shí)亮, 高楊. 基于移動(dòng)通信的人口流動(dòng)信息大數(shù)據(jù)分析方法與應(yīng)用[J].人口與社會(huì),2014(3).