唐紹偉
摘 要:隨著信息技術(shù)與互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,移動(dòng)通信網(wǎng)絡(luò)中出現(xiàn)了大數(shù)據(jù)現(xiàn)象,其涵蓋了從數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)處理等多項(xiàng)技術(shù),在云計(jì)算的應(yīng)用領(lǐng)域中發(fā)揮著重要的作用。我國(guó)人口眾多,移動(dòng)通信網(wǎng)絡(luò)數(shù)據(jù)也很多,而且呈現(xiàn)出了逐年增長(zhǎng)的趨勢(shì),為了更好的利用這些數(shù)據(jù),相關(guān)運(yùn)營(yíng)商必須在大數(shù)據(jù)時(shí)代制定出發(fā)展策略,了解大數(shù)據(jù)與互聯(lián)網(wǎng)之間的關(guān)系,還要突破大數(shù)據(jù)發(fā)展的局限性,滿足用戶的需求,設(shè)計(jì)出更多功能強(qiáng)大的應(yīng)用軟件,從而促進(jìn)企業(yè)更好的發(fā)展。
關(guān)鍵詞:移動(dòng)通信;網(wǎng)絡(luò);大數(shù)據(jù);發(fā)展;策略
我國(guó)擁有全世界最大的移動(dòng)通信市場(chǎng),獨(dú)立的手機(jī)用戶達(dá)到了6.3億,而活躍的移動(dòng)連接達(dá)到了11.3億,這說明一個(gè)移動(dòng)用戶可能擁有多個(gè)SIM卡以及移動(dòng)設(shè)備,隨著移動(dòng)通信行業(yè)的不斷發(fā)展,我國(guó)進(jìn)入了大數(shù)據(jù)時(shí)代,在對(duì)海量的數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí),需要合理的利用這些數(shù)據(jù),制定出具有長(zhǎng)遠(yuǎn)意義的發(fā)展策略,這樣提高企業(yè)的競(jìng)爭(zhēng)力,可以占據(jù)用戶市場(chǎng)。我國(guó)三大運(yùn)營(yíng)商都存在網(wǎng)絡(luò)運(yùn)營(yíng)不足的恩特,這主要是因?yàn)榻K端掌控力不足,業(yè)務(wù)創(chuàng)新比較落后,工作的效率較低,這不利于提高企業(yè)的經(jīng)營(yíng)效益,需要采取有效的措施解決運(yùn)營(yíng)弊端。
1 大數(shù)據(jù)價(jià)值鏈
在對(duì)我國(guó)移動(dòng)通信網(wǎng)絡(luò)的大數(shù)據(jù)價(jià)值鏈進(jìn)行分析后了解到,大數(shù)據(jù)價(jià)值鏈共有4個(gè)階段,分別是數(shù)據(jù)產(chǎn)生、數(shù)據(jù)獲取、數(shù)據(jù)存儲(chǔ)于數(shù)據(jù)分析,第一個(gè)階段是數(shù)據(jù)的產(chǎn)生渠道,第二個(gè)階段是對(duì)數(shù)據(jù)進(jìn)行收集、傳輸與預(yù)處理,第三個(gè)階段是對(duì)數(shù)據(jù)的管理,最后一個(gè)階段是對(duì)具有潛在價(jià)值的數(shù)據(jù)進(jìn)行提取,并提供決策支持。下面筆者對(duì)大數(shù)據(jù)價(jià)值鏈的四個(gè)階段進(jìn)行分別介紹,并對(duì)發(fā)展策略進(jìn)行分析與研究,以供參考。
1.1 數(shù)據(jù)產(chǎn)生
移動(dòng)通信行業(yè)與人們的生活息息相關(guān),隨著科技的不斷進(jìn)步,移動(dòng)通信技術(shù)越來越先進(jìn),而且給人們的生活帶來了較大的便利,為用戶提供了較多的數(shù)據(jù)服務(wù),而且還可以利用移動(dòng)設(shè)備提供互聯(lián)網(wǎng)業(yè)務(wù),手機(jī)不單可以作為通信工具,還可以進(jìn)行交易支付,給人們的生活帶來了較大的便利。在對(duì)通信記錄進(jìn)行分析后,可以了解用戶的通信習(xí)慣,移動(dòng)通信數(shù)據(jù)的來源主要有3方面,一方面是設(shè)備層,一方面是運(yùn)維層,另一方面是用戶層,設(shè)備層主要是在對(duì)設(shè)備進(jìn)行維護(hù)時(shí)產(chǎn)生的數(shù)據(jù),運(yùn)維層是管理過程中產(chǎn)生的數(shù)據(jù),而用戶層主要是移動(dòng)市場(chǎng)中產(chǎn)生的數(shù)據(jù)。設(shè)備層的數(shù)據(jù)是以結(jié)構(gòu)化為主,還有網(wǎng)絡(luò)測(cè)量工作中產(chǎn)生的信息,運(yùn)維層同時(shí)存在結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)數(shù)據(jù),還包括網(wǎng)絡(luò)業(yè)務(wù)統(tǒng)計(jì)以及客戶的投訴單。用戶層不單包括結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù),還包括半結(jié)構(gòu)化數(shù)據(jù),用戶的基本信息以及終端產(chǎn)品的信息都記錄在案,在對(duì)這一層數(shù)據(jù)進(jìn)行分析后,可以了解到用戶的行為習(xí)慣。
1.2 數(shù)據(jù)獲取
移動(dòng)通信網(wǎng)絡(luò)數(shù)據(jù)分布在不同的載體中,具有碎片性、多樣性等特征,在獲取數(shù)據(jù)時(shí)會(huì)產(chǎn)生較大的成本,由于數(shù)據(jù)較為龐大,在分析時(shí)有著較大的難度,在獲取時(shí)有3項(xiàng)步驟,首先是數(shù)據(jù)采集,然后是數(shù)據(jù)預(yù)處理,最后是數(shù)據(jù)的傳輸。數(shù)據(jù)采集需要利用采集器,主要是對(duì)指定的設(shè)備或者IP地址進(jìn)行分析,然后對(duì)數(shù)據(jù)包進(jìn)行拆包,提取有用的信息。移動(dòng)用戶的數(shù)量在不斷增多,數(shù)據(jù)獲取的工作量不斷增大,為了簡(jiǎn)化工作,一般需要對(duì)網(wǎng)頁進(jìn)行分類,由于數(shù)據(jù)具有多樣性的特點(diǎn),為了保證數(shù)據(jù)的質(zhì)量,保證分析結(jié)果的準(zhǔn)確性,應(yīng)對(duì)不完整的信息進(jìn)行剔除,做好數(shù)據(jù)的轉(zhuǎn)化工作,還要將零碎的數(shù)據(jù)轉(zhuǎn)化成統(tǒng)一的格式,為了保證數(shù)據(jù)的準(zhǔn)確性,應(yīng)對(duì)錯(cuò)誤或者重復(fù)的數(shù)據(jù)進(jìn)行消除,這也可以節(jié)省出存儲(chǔ)的空間。
采集的大部分?jǐn)?shù)據(jù)往往需要經(jīng)由IP骨干網(wǎng)傳輸?shù)綌?shù)據(jù)中心,進(jìn)行存儲(chǔ)。隨著數(shù)據(jù)業(yè)務(wù)的蓬勃發(fā)展,IP骨干網(wǎng)流量帶寬需求越來越大。2013年,各運(yùn)營(yíng)商開始對(duì)骨干網(wǎng)進(jìn)行大規(guī)模擴(kuò)容,部署100G傳輸網(wǎng)絡(luò)。目前,超100G技術(shù)也日漸成熟,面對(duì)當(dāng)前流量和帶寬的發(fā)展趨勢(shì),超100G將是未來更合理的選擇。數(shù)據(jù)中心作為通信服務(wù)的支撐平臺(tái),其架構(gòu)和現(xiàn)狀已無法滿足大規(guī)模數(shù)據(jù)的增長(zhǎng)和計(jì)算要求。各運(yùn)營(yíng)商相繼發(fā)布云戰(zhàn)略,開始布局云計(jì)算數(shù)據(jù)中心。在云計(jì)算技術(shù)的驅(qū)動(dòng)下,未來數(shù)據(jù)中心將具備小型化、高性能、可靠性、可擴(kuò)展性及綠色節(jié)能等特點(diǎn)。
1.3 數(shù)據(jù)存儲(chǔ)
運(yùn)營(yíng)商擁有豐富的數(shù)據(jù)資源優(yōu)勢(shì),包括用戶資料、用戶上網(wǎng)數(shù)據(jù)、呼叫記錄數(shù)據(jù)、網(wǎng)絡(luò)監(jiān)控?cái)?shù)據(jù)等。這些數(shù)據(jù)只有妥善存儲(chǔ)和長(zhǎng)期運(yùn)營(yíng),才有可能進(jìn)一步挖掘其潛在的價(jià)值。傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)無法線性擴(kuò)容,日益增長(zhǎng)的存儲(chǔ)需求使得集中存儲(chǔ)管理難度加大,成本升高,擴(kuò)容壓力增加,存儲(chǔ)效率下降。更重要的是,傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)難以滿足非結(jié)構(gòu)化數(shù)據(jù)的處理要求。Google提出了GFS、BigTable、MapReduce三項(xiàng)關(guān)鍵技術(shù),推動(dòng)了云計(jì)算的發(fā)展和應(yīng)用。
1.4 數(shù)據(jù)分析
數(shù)據(jù)的核心是發(fā)現(xiàn)價(jià)值,而駕馭數(shù)據(jù)的核心是分析。分析是大數(shù)據(jù)研究最關(guān)鍵的環(huán)節(jié),尤其對(duì)于傳統(tǒng)難以應(yīng)對(duì)的非結(jié)構(gòu)化數(shù)據(jù)。運(yùn)營(yíng)商利用自身在運(yùn)營(yíng)網(wǎng)絡(luò)平臺(tái)的優(yōu)勢(shì),可突破傳統(tǒng)運(yùn)營(yíng)模式,發(fā)展大數(shù)據(jù)分析服務(wù),提高運(yùn)營(yíng)商在企業(yè)和個(gè)人用戶中的影響力。
電信運(yùn)營(yíng)商通過豐富的數(shù)據(jù)資源將數(shù)據(jù)封裝為服務(wù),實(shí)現(xiàn)從傳統(tǒng)的網(wǎng)絡(luò)服務(wù)提供商向信息服務(wù)提供商轉(zhuǎn)型。然而數(shù)據(jù)分析要逐層深入,切忌盲目分析。電信級(jí)的大數(shù)據(jù)應(yīng)用可分為2大類:區(qū)域價(jià)值研究和客戶價(jià)值研究。其中,區(qū)域價(jià)值研究旨在精細(xì)化運(yùn)營(yíng),增強(qiáng)網(wǎng)絡(luò)智能管理能力,提升企業(yè)戰(zhàn)略分析??蛻魞r(jià)值研究旨在精準(zhǔn)營(yíng)銷,提高客戶占有率,提升客戶體驗(yàn)。
2 Hadoop應(yīng)用現(xiàn)狀
Hadoop是Apache基金會(huì)資助的開源項(xiàng)目,基于Google的GFS和MapReduce思想,開發(fā)的一個(gè)可支持?jǐn)?shù)據(jù)存儲(chǔ)和分析的分布式系統(tǒng)基礎(chǔ)架構(gòu)。它可以在大量廉價(jià)的硬件設(shè)備組成的集群上運(yùn)行應(yīng)用程序,能夠?yàn)閼?yīng)用程序提供一組穩(wěn)定可靠的接口。
目前,Hadoop已發(fā)展為業(yè)界公認(rèn)的開發(fā)和處理大數(shù)據(jù)的軟件平臺(tái)。全球范圍內(nèi)80%的在線旅游網(wǎng)站都在使用Hadoop,美國(guó)70%的智能手機(jī)數(shù)據(jù)服務(wù)背后都由Hadoop來支撐。隨著大數(shù)據(jù)技術(shù)的成熟應(yīng)用和推廣,我國(guó)3大運(yùn)營(yíng)商業(yè)務(wù)系統(tǒng)也在加快布局大數(shù)據(jù)平臺(tái)。中國(guó)移動(dòng)在Hadoop上部署“大云2.5”大數(shù)據(jù)PaaS產(chǎn)品,用于業(yè)務(wù)分析查詢和業(yè)務(wù)挖掘。中國(guó)聯(lián)通將Hadoop技術(shù)成功引入用戶上網(wǎng)記錄集中查詢與分析支撐系統(tǒng)。中國(guó)電信結(jié)合大數(shù)據(jù)和云計(jì)算,在積極開展“智慧城市”的建設(shè)。
結(jié)束語
在大數(shù)據(jù)時(shí)代,電信、移動(dòng)、聯(lián)通運(yùn)營(yíng)商必須結(jié)合時(shí)代發(fā)展的要求,制定出具有長(zhǎng)遠(yuǎn)意義的發(fā)展戰(zhàn)略,利用大數(shù)據(jù)推動(dòng)戰(zhàn)略的轉(zhuǎn)型是提高企業(yè)市場(chǎng)競(jìng)爭(zhēng)力的有效措施,相關(guān)技術(shù)人員應(yīng)了解大數(shù)據(jù)的特點(diǎn),然后對(duì)數(shù)據(jù)的產(chǎn)生、獲取、存儲(chǔ)以及分析技術(shù)進(jìn)行優(yōu)化,制定出完善、高效的大數(shù)據(jù)發(fā)展體系,這樣才能實(shí)現(xiàn)業(yè)務(wù)的創(chuàng)新,才能為企業(yè)創(chuàng)造更大的經(jīng)營(yíng)效益與發(fā)展機(jī)會(huì)。
參考文獻(xiàn)
[1]黃勇軍,馮明,丁盛勇,等.電信運(yùn)營(yíng)商大數(shù)據(jù)發(fā)展策略探討[J].電信科學(xué),2013,29(3):7-11.
[2]張超.云計(jì)算和大數(shù)據(jù)給運(yùn)營(yíng)商帶來的機(jī)遇和挑戰(zhàn)[J].電信技術(shù), 2013(9):22-24.
[3]陳達(dá)忠.通信運(yùn)營(yíng)商大數(shù)據(jù)量系統(tǒng)數(shù)據(jù)存儲(chǔ)云化淺談[J].郵電設(shè)計(jì)技術(shù),2012(3):54-57.