【摘要】 隨著信息時(shí)代的到來(lái)與發(fā)展,特別是互聯(lián)網(wǎng)通訊技術(shù)的發(fā)展,人們從3G時(shí)代逐漸向著4G時(shí)代發(fā)展。大數(shù)據(jù)就是互聯(lián)網(wǎng)產(chǎn)業(yè)與信息技術(shù)發(fā)展的必然產(chǎn)物,本文就對(duì)4G時(shí)代數(shù)據(jù)的產(chǎn)生、采集、存儲(chǔ)、分析各個(gè)方面進(jìn)行闡述分析。
【關(guān)鍵詞】 4G時(shí)代 大數(shù)據(jù) 分析
一、4G時(shí)代數(shù)據(jù)的產(chǎn)生
電信運(yùn)營(yíng)商數(shù)據(jù)來(lái)源主要包括設(shè)備層、運(yùn)維層以及用戶(hù)層三方面,其中設(shè)備層面向維護(hù),運(yùn)維層面向管理,而用戶(hù)層面向市場(chǎng)。
其中設(shè)備層數(shù)據(jù)具有很強(qiáng)的結(jié)構(gòu)化,包括天線增益、CI、LAC、發(fā)射功率等配置參數(shù),還包括鄰區(qū)電平、主服電平、KPI等網(wǎng)絡(luò)測(cè)量信息。運(yùn)維層數(shù)據(jù)中既有結(jié)構(gòu)化數(shù)據(jù),也有非結(jié)構(gòu)化數(shù)據(jù),以結(jié)構(gòu)化為主。主要包括用戶(hù)數(shù)、附著成功率、數(shù)據(jù)堵塞率等性能指標(biāo),以及話務(wù)、流量、網(wǎng)元日志等業(yè)務(wù)統(tǒng)計(jì)。用戶(hù)層數(shù)據(jù)較為復(fù)雜,包括了結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)以及半結(jié)構(gòu)數(shù)據(jù)。數(shù)據(jù)內(nèi)容包括用戶(hù)職業(yè)、年齡、資費(fèi)、入網(wǎng)渠道等基本信息;用戶(hù)操作系統(tǒng)、品牌、屏幕尺寸等終端信息,以及詳單記錄、上網(wǎng)日志、社交網(wǎng)絡(luò)圈、行為足跡等業(yè)務(wù)使用行為。
二、4G時(shí)代數(shù)據(jù)采集
隨著移動(dòng)互聯(lián)網(wǎng)的普及,傳感器得到了極大的拓展。4G時(shí)代背景下,任何物體在理論上都可以作為采集數(shù)據(jù)的載體,并且一個(gè)載體還可以具有不同種功能。如在4G時(shí)代,人們可以利用手機(jī)等攝像設(shè)備完成數(shù)據(jù)信息的收集等等。電信運(yùn)營(yíng)商進(jìn)行數(shù)據(jù)采集的方式主要是DPI數(shù)據(jù)采集器,對(duì)指定IP網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行采集與拆包,提取有用的信息。隨著互聯(lián)網(wǎng)用戶(hù)數(shù)量的增多,數(shù)據(jù)采集的方式也不斷增多,還包括了網(wǎng)絡(luò)爬蟲(chóng)以及日志文件。
在4G時(shí)代,數(shù)據(jù)的采集變得越來(lái)越方便,數(shù)據(jù)采集的成本也越來(lái)越低。大數(shù)據(jù)采集在現(xiàn)代社會(huì)無(wú)處不在,與人們的生活息息相關(guān),現(xiàn)在很多設(shè)備都可以通過(guò)4G網(wǎng)絡(luò)上網(wǎng)或進(jìn)行信息通信。
從網(wǎng)絡(luò)中采集到的數(shù)據(jù)一般具有異構(gòu)多源的性質(zhì),具有冗余、噪聲、不一致性等特點(diǎn)。對(duì)于采集到的數(shù)據(jù),需要進(jìn)行預(yù)處理,包括數(shù)據(jù)集成、清洗以及冗余消除。其中數(shù)據(jù)清洗主要是為了將重復(fù)、錯(cuò)誤、不完整的數(shù)據(jù)消除;數(shù)據(jù)集成就是將不同源的數(shù)據(jù)碎片整合成一個(gè)統(tǒng)一格式;冗余消除主要是采用數(shù)據(jù)壓縮、冗余檢測(cè)、去重等過(guò)程,降低數(shù)據(jù)量,節(jié)約數(shù)據(jù)存儲(chǔ)的空間。
三、4G時(shí)代大數(shù)據(jù)存儲(chǔ)
電信運(yùn)營(yíng)商擁有豐富的數(shù)據(jù)資源,但是也只有將這些數(shù)據(jù)完善的保存,才能真正發(fā)揮其長(zhǎng)期運(yùn)營(yíng)的優(yōu)勢(shì),同時(shí)還能夠挖掘到其他有價(jià)值的信息。
4G時(shí)代的到來(lái),使得網(wǎng)絡(luò)數(shù)據(jù)量越來(lái)越龐大,采用傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)形式很難滿足具體要求。大數(shù)據(jù)的產(chǎn)生不僅增加了數(shù)據(jù)存儲(chǔ)的難度,也增加了數(shù)據(jù)存儲(chǔ)的成本。采用分布式文件保存的方式能夠?qū)崿F(xiàn)對(duì)大量數(shù)據(jù)的存儲(chǔ),但在數(shù)據(jù)實(shí)時(shí)性處理方面還有一定的局限性,所以需要對(duì)系統(tǒng)中大數(shù)據(jù)性能進(jìn)行分析并實(shí)行分類(lèi)存儲(chǔ)。
隨著科技進(jìn)步,數(shù)據(jù)存儲(chǔ)技術(shù)不斷更新,源于云計(jì)算的虛擬存儲(chǔ)為大數(shù)據(jù)存儲(chǔ)提供了寶貴的意見(jiàn),中國(guó)移動(dòng)、聯(lián)通、電信相繼推出云計(jì)劃、互聯(lián)云以及天翼云,大大緩解了數(shù)據(jù)中心存儲(chǔ)壓力。
四、4G時(shí)代大數(shù)據(jù)分析
數(shù)據(jù)分析是大數(shù)據(jù)價(jià)值體現(xiàn)的最后一個(gè)環(huán)節(jié),同時(shí)也是最重要的核心環(huán)節(jié)。電信網(wǎng)絡(luò)運(yùn)營(yíng)商利用自身平臺(tái)優(yōu)勢(shì),實(shí)現(xiàn)了大數(shù)據(jù)分析,對(duì)個(gè)人用戶(hù)以及運(yùn)營(yíng)企業(yè)具有較大的影響。
進(jìn)行大數(shù)據(jù)分析一般分為數(shù)據(jù)可視化、統(tǒng)計(jì)、挖掘這三個(gè)步驟。其中數(shù)據(jù)可視化指的是借助圖形化技術(shù),將龐大的數(shù)據(jù)表現(xiàn)出來(lái),直觀的看出數(shù)據(jù)的屬性相關(guān)性以及分布特點(diǎn);統(tǒng)計(jì)分析指的是將數(shù)據(jù)按照定量或定性的方式分析,包括推斷統(tǒng)計(jì)以及描述統(tǒng)計(jì)兩種;數(shù)據(jù)挖掘較為復(fù)雜,是一門(mén)復(fù)雜的學(xué)科,涉及到人工智能、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)、機(jī)器學(xué)等等,目的在于挖掘數(shù)據(jù)中隱藏的價(jià)值。
電信運(yùn)營(yíng)商通過(guò)將龐大數(shù)據(jù)資源的封裝,將其封裝為服務(wù)提供給用戶(hù),完成了向信息服務(wù)提供商的轉(zhuǎn)變。在進(jìn)行數(shù)據(jù)分析過(guò)程中,不可盲目,應(yīng)該逐層深入。電信級(jí)大數(shù)據(jù)應(yīng)用主要體現(xiàn)在客戶(hù)價(jià)值研究以及區(qū)域價(jià)值研究?jī)蓚€(gè)方面。其中區(qū)域價(jià)值研究的根本目的是增強(qiáng)運(yùn)營(yíng)管理的能力,為企業(yè)戰(zhàn)略管理提供依據(jù);客戶(hù)價(jià)值研究的主要目的在提高服務(wù)營(yíng)銷(xiāo)效率,增大客戶(hù)的占有率,是客戶(hù)獲得更好的體驗(yàn)。
五、總結(jié)
4G時(shí)代的到來(lái),標(biāo)志著人們進(jìn)入了信息快速發(fā)達(dá)的時(shí)代,同時(shí)這也是信息時(shí)代發(fā)展的必然產(chǎn)物。在這一背景下,網(wǎng)絡(luò)互聯(lián)網(wǎng)技術(shù)與信息技術(shù)得到了廣泛的應(yīng)用,產(chǎn)生的數(shù)據(jù)量也不斷的擴(kuò)大,大數(shù)據(jù)成為了現(xiàn)階段熱門(mén)的研究話題之一。對(duì)于4G時(shí)代的大數(shù)據(jù),只有完善大數(shù)據(jù)體系,做好數(shù)據(jù)采集、運(yùn)輸、存儲(chǔ)、分析等各個(gè)環(huán)節(jié)的工作,才能為電信業(yè)務(wù)創(chuàng)新以及規(guī)模的拓展提供有力條件。
參 考 文 獻(xiàn)
[1]薛文倩,彭木根,梁棟.移動(dòng)通信網(wǎng)絡(luò)中大數(shù)據(jù)的發(fā)展策略研究[J].通訊技術(shù).2012,15(5):225-226.
[2]楚落.4G時(shí)代的到來(lái)與大數(shù)據(jù)革命[J].通訊網(wǎng)絡(luò).2012,23(5):78-79.
[3]劉家輝,張鵬遠(yuǎn).4G大數(shù)據(jù)時(shí)代對(duì)網(wǎng)優(yōu)的挑戰(zhàn)及智慧化平臺(tái)研究[J].經(jīng)營(yíng)管理者.2014,31(15):138-139.