鄭松奕
摘要:隨著越來(lái)越多的校園用戶(hù)使用校園無(wú)線(xiàn)網(wǎng)上網(wǎng),對(duì)于用戶(hù)相關(guān)行為的分析研究就顯得尤為重要。該文基于校園無(wú)線(xiàn)網(wǎng)數(shù)據(jù)設(shè)計(jì)并實(shí)現(xiàn)一個(gè)能夠進(jìn)行用戶(hù)行為分析的系統(tǒng),該系統(tǒng)能夠評(píng)估校園無(wú)線(xiàn)網(wǎng)的運(yùn)行狀態(tài)并分析用戶(hù)的移動(dòng)軌跡。系統(tǒng)以華南師范大學(xué)校園無(wú)線(xiàn)網(wǎng)絡(luò)數(shù)據(jù)為例進(jìn)行測(cè)試,并以地圖、表格等在線(xiàn)方式顯示了用戶(hù)移動(dòng)軌跡、用戶(hù)設(shè)備區(qū)分等用戶(hù)行為分析結(jié)果。
關(guān)鍵詞:無(wú)線(xiàn)局域網(wǎng);用戶(hù)行為;用戶(hù)移動(dòng)軌跡;行為分析
中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)03-0025-03
1 研究背景
校園無(wú)線(xiàn)網(wǎng)的快速發(fā)展,移動(dòng)終端、App的大量豐富與普通應(yīng)用,使得用戶(hù)越來(lái)越多地使用并依賴(lài)于無(wú)線(xiàn)網(wǎng)絡(luò),產(chǎn)生了大量的無(wú)線(xiàn)數(shù)據(jù),這些數(shù)據(jù)包括校園師生主動(dòng)產(chǎn)生和各種終端設(shè)備自動(dòng)搜集的數(shù)據(jù),如:通過(guò)各種即時(shí)通信軟件(QQ、微信等)分享自己的想法與興趣、用戶(hù)接入使用無(wú)線(xiàn)網(wǎng)絡(luò)的連接信息、無(wú)線(xiàn)位置信息等。隨著這些無(wú)線(xiàn)數(shù)據(jù)的大量產(chǎn)生及數(shù)據(jù)類(lèi)型的不斷豐富,如何利用這些數(shù)據(jù)更好地為廣大師生提供服務(wù),以及為學(xué)校管理提供更好的決策依據(jù),是校園無(wú)線(xiàn)網(wǎng)未來(lái)發(fā)展的重點(diǎn)方向。
校園用戶(hù)是校園無(wú)線(xiàn)網(wǎng)中的行動(dòng)主體,分析研究無(wú)線(xiàn)網(wǎng)絡(luò)中的用戶(hù)行為數(shù)據(jù)有助于挖掘校園用戶(hù)的行為特點(diǎn)及其行為表現(xiàn)出來(lái)的規(guī)律。不僅如此,對(duì)無(wú)線(xiàn)網(wǎng)絡(luò)的用戶(hù)行為進(jìn)行分析研究還能為無(wú)線(xiàn)網(wǎng)絡(luò)管理提供優(yōu)化調(diào)整網(wǎng)絡(luò)的科學(xué)數(shù)據(jù)、為用戶(hù)提供更有針對(duì)性的網(wǎng)絡(luò)服務(wù)、為教學(xué)活動(dòng)提供技術(shù)支持及描述用戶(hù)的移動(dòng)軌跡和社會(huì)關(guān)系等。為了更好的建設(shè)校園無(wú)線(xiàn)網(wǎng)和為用戶(hù)提供更好的無(wú)線(xiàn)網(wǎng)絡(luò)服務(wù),對(duì)無(wú)線(xiàn)網(wǎng)絡(luò)用戶(hù)行為進(jìn)行系統(tǒng)化的分析研究十分必要。
2 校園無(wú)線(xiàn)網(wǎng)用戶(hù)行為分析的應(yīng)用
2.1 校園WLAN優(yōu)化
現(xiàn)在的校園無(wú)線(xiàn)局域網(wǎng)時(shí)常會(huì)面臨著如頻率干擾、負(fù)載不均衡、用戶(hù)無(wú)法接入網(wǎng)]、用戶(hù)吞吐率較低等問(wèn)題。面對(duì)些問(wèn)題,可以通過(guò)分析校園無(wú)線(xiàn)網(wǎng)絡(luò)的用戶(hù)行為數(shù)據(jù),從而優(yōu)化無(wú)線(xiàn)網(wǎng)絡(luò)來(lái)解決,能夠有效地提高校園無(wú)線(xiàn)網(wǎng)絡(luò)的信息服務(wù)質(zhì)量。例如,通過(guò)對(duì)校園無(wú)線(xiàn)網(wǎng)絡(luò)的用戶(hù)行為進(jìn)行分析研究,可以發(fā)現(xiàn)、預(yù)測(cè)用戶(hù)的網(wǎng)絡(luò)需求,有助于根據(jù)實(shí)際情況優(yōu)化信息服務(wù)種類(lèi)和服務(wù)水平。
2.2 學(xué)生管理
通過(guò)分析研究校園無(wú)線(xiàn)網(wǎng)的用戶(hù)行為數(shù)據(jù)可以挖掘出用戶(hù)的行為規(guī)律與生活習(xí)慣等,為學(xué)校管理提供更好的支持。
1) 學(xué)生失聯(lián)預(yù)警。通過(guò)學(xué)生用戶(hù)的上網(wǎng)行為規(guī)律與上網(wǎng)記錄來(lái)判斷學(xué)生的在校情況,甄別出非假期期間長(zhǎng)時(shí)間不在校學(xué)生,提供給學(xué)校相關(guān)部門(mén)檢查確認(rèn),及時(shí)發(fā)現(xiàn)學(xué)生失聯(lián)情況,以更好地保障學(xué)生安全。
2) 日常教學(xué)活動(dòng)管理。比如通過(guò)分析教學(xué)樓不同時(shí)間段的無(wú)線(xiàn)網(wǎng)絡(luò)在線(xiàn)用戶(hù)人數(shù)變化,結(jié)合學(xué)校的教學(xué)安排,可以統(tǒng)計(jì)出上課時(shí)間學(xué)生出勤人數(shù)及有多少學(xué)生在課余時(shí)間喜歡去教學(xué)樓自習(xí),學(xué)校可以根據(jù)這些數(shù)據(jù)加強(qiáng)學(xué)生考勤管理、或給自修的學(xué)生提供一些空余且相對(duì)安靜的教室。另外,可以將課表結(jié)合終端的位置時(shí)間進(jìn)行課程信息的推送等等。
2.3 用戶(hù)移動(dòng)軌跡分析
在校園環(huán)境中,校園用戶(hù)一般有較固定的活動(dòng)地點(diǎn),比如學(xué)生的日常行為包括在教學(xué)樓上課、在圖書(shū)館自習(xí)、在飯?zhí)贸燥?、在宿舍休息等,通過(guò)分析用戶(hù)每次上線(xiàn)下線(xiàn)時(shí)與AP(Wireless Access Point 無(wú)線(xiàn)訪(fǎng)問(wèn)接入點(diǎn))的關(guān)聯(lián)信息,結(jié)合AP的地理位置,可以挖掘出用戶(hù)的移動(dòng)軌跡,也就是用戶(hù)到了哪些地方,分別停留了多久,這有利于學(xué)校了解校園里教師與學(xué)生的行為習(xí)慣,可以為高校管理提供了一個(gè)便捷、可靠的方式,而且,對(duì)師生的工作、學(xué)習(xí)、生活都有很大的好處。
1) 基于群體用戶(hù)移動(dòng)性規(guī)律,發(fā)現(xiàn)熱點(diǎn)區(qū)域,進(jìn)而研究校園里不同熱點(diǎn)區(qū)域的用戶(hù)流動(dòng)性?;趥€(gè)人用戶(hù)軌跡數(shù)據(jù),可以提取個(gè)體用戶(hù)行為特征,進(jìn)行正常行為及可疑行為判別等。
2) 利用用戶(hù)移動(dòng)軌跡區(qū)分無(wú)線(xiàn)網(wǎng)絡(luò)中終端設(shè)備的擁有者,從而統(tǒng)計(jì)出使用無(wú)線(xiàn)網(wǎng)絡(luò)的真實(shí)用戶(hù)?,F(xiàn)在校園里有許多用戶(hù)擁有兩個(gè)及以上移動(dòng)終端,使用相同的賬號(hào)上網(wǎng),或者是同一臺(tái)移動(dòng)終端借用他人的賬號(hào)接入使用無(wú)線(xiàn)網(wǎng)絡(luò),如果僅是利用移動(dòng)終端的MAC(Medium Access Control媒體訪(fǎng)問(wèn)控制)地址來(lái)標(biāo)識(shí)用戶(hù),則統(tǒng)計(jì)出來(lái)用戶(hù)人數(shù)要遠(yuǎn)大于真實(shí)的用戶(hù)人數(shù),不能準(zhǔn)確的描述用戶(hù)的行為規(guī)律,因此需要區(qū)分不同移動(dòng)終端是否屬于同一個(gè)用戶(hù)所有。同一用戶(hù)使用所擁有的不同設(shè)備在上網(wǎng)行為、移動(dòng)性方面具有較高的相似性,甚至是一致的,因此可以通過(guò)對(duì)比不同移動(dòng)終端的移動(dòng)軌跡數(shù)據(jù)來(lái)區(qū)分使用同一個(gè)賬號(hào)上網(wǎng)的不同移動(dòng)終端是否屬于同一個(gè)用戶(hù)所有。
總的來(lái)說(shuō),校園無(wú)線(xiàn)網(wǎng)用戶(hù)行為分析在反映網(wǎng)絡(luò)性能的同時(shí),也可以反映出用戶(hù)的某些行為規(guī)律、偏好和生活習(xí)慣等等,不僅能指導(dǎo)將來(lái)的校園無(wú)線(xiàn)網(wǎng)建設(shè),提高校園信息服務(wù)質(zhì)量與用戶(hù)體驗(yàn),也能為學(xué)校了解師生及管理提供有力的幫助,具有很好的應(yīng)用前景和重要的實(shí)用意義。
3 系統(tǒng)方案設(shè)計(jì)
3.1 系統(tǒng)邏輯結(jié)構(gòu)
系統(tǒng)基于B/S架構(gòu)設(shè)計(jì),其系統(tǒng)結(jié)構(gòu)圖如圖1所示,其系統(tǒng)工作流程如下所述:首先是獲取校園無(wú)線(xiàn)網(wǎng)絡(luò)數(shù)據(jù),并通過(guò)預(yù)處理后,將得到的AC(Wireless Access Point Controller 無(wú)線(xiàn)控制器)、AP與其他的用戶(hù)數(shù)據(jù)存放到設(shè)計(jì)好的數(shù)據(jù)庫(kù)中,然后以WEB方式從數(shù)據(jù)庫(kù)中獲取相應(yīng)的數(shù)據(jù)并顯示出來(lái)。系統(tǒng)共分為三個(gè)主要部分:
第一層為數(shù)據(jù)采集與預(yù)處理部分。采集來(lái)自校園無(wú)線(xiàn)網(wǎng)絡(luò)相關(guān)數(shù)據(jù),并通過(guò)系統(tǒng)進(jìn)行預(yù)處理后,存儲(chǔ)在已設(shè)計(jì)好的系統(tǒng)數(shù)據(jù)庫(kù)中。采集的數(shù)據(jù)包括AC、AP等基本信息,同時(shí)包括用戶(hù)上線(xiàn)、下線(xiàn)等各種日志信息;數(shù)據(jù)預(yù)處理包括去除收集到的存在缺失值或不一到狀態(tài)的數(shù)據(jù)記錄等。
第二層為中間層。負(fù)責(zé)將采集的原始的數(shù)據(jù)進(jìn)行處理,通過(guò)統(tǒng)計(jì)分析后將得到的網(wǎng)絡(luò)性能數(shù)據(jù)、用戶(hù)軌跡數(shù)據(jù)存入數(shù)據(jù)庫(kù)中。
第三層是管理應(yīng)用層。實(shí)現(xiàn)用戶(hù)行為分析結(jié)果的顯示,WEB服務(wù)根據(jù)不同的查詢(xún)條件從數(shù)據(jù)庫(kù)中查詢(xún)數(shù)據(jù),并以圖形化界面顯示查詢(xún)結(jié)果,方便用戶(hù)查看。
3.2 系統(tǒng)功能模塊設(shè)計(jì)
系統(tǒng)的功能模塊包括WLAN運(yùn)行狀況顯示、用戶(hù)一般性統(tǒng)計(jì)、用戶(hù)移動(dòng)軌跡顯示、學(xué)生失聯(lián)預(yù)警及用戶(hù)設(shè)備區(qū)分5個(gè)部分。系統(tǒng)的功能模塊框架圖如圖2所示。
1) WALN運(yùn)行狀況。WALN運(yùn)行狀況功能模塊包括AC運(yùn)行狀況顯示模塊與AP顯示模塊。其中AC運(yùn)行狀況主要顯示了AC當(dāng)前所管理的AP、AC在線(xiàn)用戶(hù)人數(shù)隨時(shí)間變化情況;AP顯示模塊顯示了各個(gè)樓宇A(yù)P的分布情況和運(yùn)行情況。
2) 用戶(hù)一般性統(tǒng)計(jì)。用戶(hù)一般性統(tǒng)計(jì)包括用戶(hù)終端廠(chǎng)商統(tǒng)計(jì)與用戶(hù)在線(xiàn)情況顯示模塊。用戶(hù)終端廠(chǎng)商統(tǒng)計(jì)顯示了用戶(hù)所使用設(shè)備的品牌及所屬品牌設(shè)備的數(shù)量;用戶(hù)在線(xiàn)情況顯示了各樓宇在線(xiàn)用戶(hù)人數(shù)隨時(shí)間變化的情況。
3) 用戶(hù)移動(dòng)軌跡。用戶(hù)移動(dòng)軌跡用于顯示用戶(hù)日常的移動(dòng)范圍,挖掘用戶(hù)的行為規(guī)律。
4) 學(xué)生失聯(lián)預(yù)警。學(xué)生失聯(lián)預(yù)警通過(guò)分析學(xué)生用戶(hù)上網(wǎng)記錄對(duì)非假期期間長(zhǎng)時(shí)間不在校的學(xué)生用戶(hù)進(jìn)行歸類(lèi),并列出預(yù)警名單提交給學(xué)校的相關(guān)管理部門(mén)。
5) 用戶(hù)設(shè)備區(qū)分。用戶(hù)設(shè)備區(qū)分指的是同一用戶(hù)使用多個(gè)終端設(shè)備接入無(wú)線(xiàn)時(shí),對(duì)不同終端設(shè)備進(jìn)行對(duì)比識(shí)別,區(qū)分不同的終端設(shè)備是否屬于同一用戶(hù)所有。在早期的無(wú)線(xiàn)網(wǎng)絡(luò)用戶(hù)行為研究中單個(gè)用戶(hù)擁有的接入無(wú)線(xiàn)網(wǎng)絡(luò)的終端設(shè)備數(shù)量有限,研究者多以MAC地址來(lái)區(qū)分不同的用戶(hù),可以統(tǒng)計(jì)出比較真實(shí)的用戶(hù)情況,然而,近幾年來(lái),隨著智能手機(jī)、平板電腦等無(wú)線(xiàn)移動(dòng)智能終端的普及,多數(shù)校園用戶(hù)往往同時(shí)擁有多個(gè)無(wú)線(xiàn)移動(dòng)設(shè)備,這樣使得用戶(hù)可以通過(guò)多個(gè)設(shè)備接入與使用無(wú)線(xiàn)網(wǎng)絡(luò),如果我們依然釆用終端設(shè)備的MAC地址來(lái)區(qū)分不同的用戶(hù),則用戶(hù)行為分析結(jié)果可能會(huì)出現(xiàn)較大的偏差。因此,區(qū)分多個(gè)終端設(shè)備是否歸屬于同一個(gè)用戶(hù)就顯得很有意義,不僅能夠統(tǒng)計(jì)出真實(shí)的用戶(hù),也能更精確的刻畫(huà)用戶(hù)的移動(dòng)軌跡。
4 實(shí)驗(yàn)結(jié)果與分析
本文采集華南師范大學(xué)無(wú)線(xiàn)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行測(cè)試,主要測(cè)試了用戶(hù)終端廠(chǎng)商統(tǒng)計(jì)、用戶(hù)移動(dòng)軌跡、學(xué)生失聯(lián)預(yù)警、用戶(hù)設(shè)備區(qū)分功能。并通過(guò)WEB以地圖、表格等在線(xiàn)方式顯示了實(shí)驗(yàn)結(jié)果
1) 用戶(hù)終端廠(chǎng)商統(tǒng)計(jì)。用戶(hù)終端廠(chǎng)商統(tǒng)計(jì)基于終端的MAC地址進(jìn)行匹配。每個(gè)移動(dòng)終端都有一個(gè)固定的MAC地址,且每一個(gè)MAC地址都是全球唯一的。任何正規(guī)廠(chǎng)家生產(chǎn)的網(wǎng)卡上都直接標(biāo)明了MAC地址,所有MAC地址的長(zhǎng)度都是48位,通常表示為一組12位的16進(jìn)制數(shù),如0C-D6-BD-90-C4-97,其中前6位代表網(wǎng)卡的生產(chǎn)廠(chǎng)商(如0C-D6-BD表示了該網(wǎng)卡的制造商是華為),后6位由廠(chǎng)家自己分配,標(biāo)識(shí)了設(shè)備本身,因此MAC地址作為獨(dú)一無(wú)二的物理地址可以用于標(biāo)識(shí)一臺(tái)終端設(shè)備乃至一個(gè)用戶(hù)(這里指在不區(qū)分同一用戶(hù)同時(shí)擁有多個(gè)終端設(shè)備的情況下)。在用戶(hù)終端廠(chǎng)商統(tǒng)計(jì)模塊的實(shí)現(xiàn)中,我們采集了一周的終端設(shè)備數(shù)據(jù)集,并將其MAC地址與IEEE組織提供的廠(chǎng)商列表進(jìn)行匹配。
本文中用戶(hù)終端廠(chǎng)商統(tǒng)計(jì)模塊統(tǒng)計(jì)了華為、蘋(píng)果、小米、三星、酷派、魅族、中興、OPPO等品牌的終端數(shù)量,結(jié)果如圖3所示。
2) 用戶(hù)移動(dòng)軌跡。用戶(hù)移動(dòng)軌跡利用用戶(hù)與AP的連接情況來(lái)判斷用戶(hù)移動(dòng)性,描述了用戶(hù)一定時(shí)間內(nèi)所移動(dòng)的范圍,可以更好地了解用戶(hù)日?;顒?dòng)空間與用戶(hù)聚集的熱點(diǎn)區(qū)域。圖4及圖5顯示了用戶(hù)群體的移動(dòng)軌跡,可以看出,公共教學(xué)樓、圖書(shū)館、學(xué)生宿舍的用戶(hù)人數(shù)比較多,其次是飯?zhí)眉案鲗W(xué)院辦公樓。
3) 學(xué)生失聯(lián)預(yù)警。通過(guò)收集一個(gè)月以來(lái)接入使用無(wú)線(xiàn)網(wǎng)絡(luò)的用戶(hù),共有18344個(gè),然后統(tǒng)計(jì)了在數(shù)據(jù)收集截止日期前3天以來(lái)沒(méi)有再上線(xiàn)的用戶(hù),結(jié)合用戶(hù)的上線(xiàn)記錄進(jìn)行區(qū)分是否屬于有失聯(lián)情況的用戶(hù),最后的甄別出了23個(gè)異常用戶(hù)。
4) 用戶(hù)設(shè)備區(qū)分。以某一個(gè)用戶(hù)“方xx”為例,用戶(hù)“方xx”的上網(wǎng)賬號(hào)是201603xxxxx。區(qū)分前,有103個(gè)終端設(shè)備使用賬號(hào)201603xxxxx上網(wǎng),部分?jǐn)?shù)據(jù)記錄如圖6所示。但仔細(xì)觀(guān)察發(fā)現(xiàn),除了mac為f40f.241f.5913登錄次數(shù)為107,且長(zhǎng)期使用外,其他的登錄數(shù)據(jù)98%以上的終端都只登錄一次,偶爾有登錄2次或3次,但使用的時(shí)間短,而且每次在線(xiàn)時(shí)間較短,這部分?jǐn)?shù)據(jù)有可能是該用戶(hù)將上網(wǎng)賬戶(hù)借給他人使用而產(chǎn)生的,應(yīng)該將其去除。通過(guò)算法運(yùn)算后,系統(tǒng)分析推測(cè)出只有一個(gè)終端設(shè)備才是真正屬于用戶(hù)“方xx”的,該終端設(shè)備的mac為f40f.241f.5913,區(qū)分結(jié)果如圖7所示。
5 結(jié)束語(yǔ)
本文在校園無(wú)線(xiàn)網(wǎng)絡(luò)數(shù)據(jù)的基礎(chǔ)上,設(shè)計(jì)了用戶(hù)行為分析系統(tǒng),該系統(tǒng)能夠?qū)π@無(wú)線(xiàn)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,刻畫(huà)用戶(hù)的移動(dòng)軌跡,實(shí)現(xiàn)用戶(hù)設(shè)備區(qū)分、學(xué)生失聯(lián)預(yù)警等功能。對(duì)于校園無(wú)線(xiàn)網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計(jì)分析可以有效應(yīng)用于指導(dǎo)或改進(jìn)無(wú)線(xiàn)局域網(wǎng)的建設(shè),而分析研究用戶(hù)的移動(dòng)軌跡則可以應(yīng)用于個(gè)性化服務(wù)設(shè)計(jì)、對(duì)用戶(hù)進(jìn)行網(wǎng)絡(luò)畫(huà)像、尋找用戶(hù)熱點(diǎn)區(qū)域等多種領(lǐng)域。
參考文獻(xiàn):
[1] 鄭宇,謝幸.基于用戶(hù)軌跡挖掘的智能位置服務(wù)[J].中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊, 2010,6(6):23-30.
[2] 蘇孝強(qiáng),倪宏,馬永帥.移動(dòng)環(huán)境下基于用戶(hù)軌跡的社交親近度研究[J].微計(jì)算機(jī)信息,2011(5):7-9.
[3] 吳利兵.無(wú)線(xiàn)網(wǎng)絡(luò)環(huán)境下用戶(hù)行為的社會(huì)性分析[D].上海交通大學(xué),2012.
[4] MAC Address[EB/OL], http://standards-oui.ieee.org/oui/oui.txt. 2016.