楊 力
(廣東宜通世紀(jì)科技股份有限公司,廣州 510665)
大數(shù)據(jù)有四個(gè)主要特點(diǎn),概括為四個(gè)V,即更大的容量(Volune,從TB級(jí)躍升至PB級(jí),甚至EB級(jí))、更高的多樣性(Variety,包括結(jié)構(gòu)化[1]、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)),以及更快的生成速度(Velocity),這三個(gè)V的組合推動(dòng)了第四個(gè)因素ü價(jià)值(Value)。大數(shù)據(jù)是信息社會(huì)獨(dú)有的技術(shù)、方法、工具,它通過對(duì)海量數(shù)據(jù)進(jìn)行分析,獲得有巨大價(jià)值的產(chǎn)品和服務(wù),或深刻的洞見。
現(xiàn)在移動(dòng)終端,車輛的物聯(lián)網(wǎng)的不斷構(gòu)建完善,數(shù)據(jù)的種類越來越復(fù)雜,有價(jià)值的數(shù)據(jù)被埋沒在無數(shù)沒有使用價(jià)值的數(shù)據(jù)中,難以發(fā)現(xiàn)利用。
物聯(lián)網(wǎng)所產(chǎn)生的大數(shù)據(jù)與其他的有所不同,它主要的特點(diǎn)在于其數(shù)據(jù)的多樣、異形、無結(jié)構(gòu)以及特有噪聲[2],最大的不同是,這一數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng)速率,其數(shù)據(jù)不僅包含簡(jiǎn)單的二維數(shù)據(jù),還包括時(shí)間位置行為等信息,不僅是物與物的交互信息,更是物與人的交往數(shù)據(jù),現(xiàn)在物聯(lián)網(wǎng)終端種類的多樣性,更是將我們引向了數(shù)據(jù)科學(xué)化,帶來的決策高效。
去年,移動(dòng)網(wǎng)絡(luò)的使用量創(chuàng)下了一個(gè)里程碑üü超越了傳統(tǒng)PC的網(wǎng)絡(luò)使用量。谷歌也已證實(shí),移動(dòng)設(shè)備上的搜索量現(xiàn)在已超過了桌面端搜索量。虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)代表了互動(dòng)界面創(chuàng)新的下一個(gè)重大飛躍,將改變企業(yè)與客戶的互動(dòng)。計(jì)算能力的指數(shù)級(jí)增長(zhǎng)將推動(dòng)重大技術(shù)進(jìn)步的產(chǎn)生,如果沒有計(jì)算能力的巨大飛躍,無論是數(shù)據(jù)的超快增長(zhǎng)還是數(shù)十億部物聯(lián)網(wǎng)設(shè)備的誕生,都不可能實(shí)現(xiàn)。從1975年至2015年,計(jì)算性能以每?jī)赡暝黾右槐兜乃俣仍谠鲩L(zhǎng)。現(xiàn)在,計(jì)算性能的增速放緩到了每?jī)赡臧朐黾右槐丁?/p>
無線網(wǎng)絡(luò)優(yōu)化首先要明確需要優(yōu)化的網(wǎng)絡(luò)問題,網(wǎng)絡(luò)分析的基礎(chǔ)是建立在對(duì)于各種數(shù)據(jù)的收集與分析統(tǒng)計(jì)的基礎(chǔ)上的,通過各種文獻(xiàn)資料的研究,不難發(fā)現(xiàn),不同的網(wǎng)優(yōu)分析之間的差異,可以直觀反映實(shí)際數(shù)據(jù)分析統(tǒng)計(jì)工作中的不同方式,傳統(tǒng)的網(wǎng)優(yōu)分析基礎(chǔ)手段有路測(cè)(Drive Test,DT)[3]、撥打測(cè)試(Call Quality Test,CQT)、掃頻測(cè)試以及網(wǎng)管指標(biāo)分析,通過這些數(shù)據(jù)的拓展分析,為用戶提供更加高受益低投入的產(chǎn)品,不斷實(shí)現(xiàn)用戶利益最大化,需求最佳組合,是用戶黏著度顯著提升,為自身在激烈的市場(chǎng)競(jìng)爭(zhēng)環(huán)境中謀求不可取代的競(jìng)爭(zhēng)優(yōu)勢(shì)。
讀寫分離示圖
2.2.1 隨機(jī)采樣轉(zhuǎn)變?yōu)閺?fù)雜,全面采樣
大數(shù)據(jù)云計(jì)算等現(xiàn)代高技術(shù)水平的數(shù)據(jù)分析手段的不斷發(fā)展,使得現(xiàn)在的數(shù)據(jù)分析更加充分合理,數(shù)據(jù)分析中更多的將隨機(jī)取樣轉(zhuǎn)變?yōu)槿嫒樱蟪潭壬蠈?shí)現(xiàn)了數(shù)據(jù)分析結(jié)果的公正可靠,避免了少量數(shù)據(jù)參與分析可能存在的結(jié)果具有偶然性難以代表總體,實(shí)用于實(shí)際工作的短板。
2.2.2 單一采樣(手機(jī))轉(zhuǎn)變?yōu)槎嘟K端采樣
現(xiàn)在一談及信息終端,人們的第一反應(yīng)往往是手機(jī),這一特殊的終端設(shè)備,但是,隨著現(xiàn)在社會(huì)上各種科技設(shè)備的發(fā)展,更多種類的信息活動(dòng)、網(wǎng)絡(luò)活動(dòng)終端不斷投入市場(chǎng),在實(shí)際的數(shù)據(jù)分析工作中,應(yīng)該將眼光投向更多終端的采樣。這樣才能保證數(shù)據(jù)的多樣,從而確保對(duì)于不同領(lǐng)域用戶需求的洞察,滿足用戶的使用需求。
2.2.3 因果必然關(guān)系轉(zhuǎn)變?yōu)閿?shù)據(jù)相關(guān)性
傳統(tǒng)的數(shù)據(jù)分析,起準(zhǔn)度以及效率被極大限制,人們對(duì)于數(shù)據(jù)的信服度極速上升,數(shù)據(jù)相關(guān)性是指數(shù)據(jù)之間存有某種特殊關(guān)系。在當(dāng)下大數(shù)據(jù)時(shí)代,數(shù)據(jù)相關(guān)分析能夠最小投入最大最快收益相關(guān)重要信息,直觀體現(xiàn)某些事物間存在的在簡(jiǎn)單的邏輯分析中難以發(fā)現(xiàn)的相關(guān)聯(lián)系關(guān)系[4],在各種領(lǐng)域中有很強(qiáng)大的優(yōu)勢(shì),在無線網(wǎng)絡(luò)優(yōu)化中就有其難以取代的作用,可以進(jìn)行時(shí)序、空間分析,為實(shí)際工作大方向起引導(dǎo)把控作用。
目前眾多的大數(shù)據(jù)來源中最為重要也最有價(jià)值的兩類應(yīng)屬于:行為 與 內(nèi)容 ,這兩類基于用戶身份系統(tǒng)之上產(chǎn)生的數(shù)據(jù),互聯(lián)網(wǎng)用戶行為比較多種多樣,我們可以通過對(duì)這些行為的記錄和分析更好的在網(wǎng)絡(luò)優(yōu)化設(shè)計(jì)、運(yùn)營(yíng)、產(chǎn)品市場(chǎng)與盈利[5]、用戶體驗(yàn)、用戶需求等互聯(lián)網(wǎng)產(chǎn)品關(guān)鍵點(diǎn)之間進(jìn)行權(quán)衡。
大數(shù)據(jù)我們通常在全局把握中或者說面向應(yīng)用中較多,但這并不是說大數(shù)據(jù)的縱深度不強(qiáng),實(shí)際上大數(shù)據(jù)大應(yīng)用在專一方面的橫向縱向比較分析中最專業(yè),網(wǎng)絡(luò)優(yōu)化行業(yè),一般情況下,在關(guān)鍵的區(qū)域內(nèi)做好升級(jí)優(yōu)化,對(duì)特殊的人群進(jìn)行更加有深度的數(shù)據(jù)挖掘,能夠更加準(zhǔn)確的發(fā)現(xiàn)網(wǎng)絡(luò)優(yōu)化的方向,以及優(yōu)化應(yīng)該針對(duì)的主要方面。
現(xiàn)在移動(dòng)終端大量普及,無線網(wǎng)絡(luò)優(yōu)化可以在終端實(shí)現(xiàn)實(shí)時(shí)評(píng)估,現(xiàn)在能夠在市場(chǎng)中處于不敗地位的企業(yè),大部分能夠保證對(duì)于其用戶反映的問題的最快解決,不久前的海底撈餐飲衛(wèi)生環(huán)境問題的三小時(shí)內(nèi)最佳解決,就很好的說明了現(xiàn)在的實(shí)時(shí)關(guān)注用戶反映的問題對(duì)于企業(yè)發(fā)展的重要性,端對(duì)端的數(shù)據(jù)分析,能夠使網(wǎng)優(yōu)工作最快的接觸到用戶實(shí)際使用中的問題,這為網(wǎng)優(yōu)工作提供了極大的便利。
Hadoop是Apache Lucene的創(chuàng)始人道格·卡丁創(chuàng)建的,Lunch是一個(gè)應(yīng)用廣泛的文本搜索系統(tǒng)庫。Hadoop起源于開源的網(wǎng)絡(luò)搜索引擎Apache Lucene,它本身也是Lunch項(xiàng)目的一部分。Hadoop[6]是一個(gè)開發(fā)和運(yùn)行處理大規(guī)模數(shù)據(jù)的軟件平臺(tái),是Apache的一個(gè)用java語言實(shí)現(xiàn)的開源軟件框架,實(shí)現(xiàn)在大量計(jì)算機(jī)組成的集群中對(duì)海量數(shù)據(jù)進(jìn)行分布式計(jì)算。最核心的設(shè)計(jì)是HDFS和MapReduce。HDFS提供了海量數(shù)據(jù)的存儲(chǔ),MapReduce提供了對(duì)數(shù)據(jù)的計(jì)算。
Hadoop能夠?qū)嫶蟮臄?shù)據(jù)集進(jìn)行分析并迅速發(fā)現(xiàn)趨勢(shì)。Hadoop通過并行處理數(shù)據(jù)加快了數(shù)據(jù)的處理速度。并行處理是指將多種數(shù)據(jù)按照類型組成數(shù)據(jù)集存儲(chǔ)多個(gè)硬盤中,然后對(duì)數(shù)據(jù)進(jìn)行并行讀取,Hadoop一般的保存做法是復(fù)制:系統(tǒng)保存數(shù)據(jù)的副本,一旦系統(tǒng)發(fā)生故障,就可以使用另外保存的副本,保證了工作的正常運(yùn)轉(zhuǎn)。
我國(guó)網(wǎng)絡(luò)購物、移動(dòng)支付、共享經(jīng)濟(jì)等數(shù)字經(jīng)濟(jì)新業(yè)態(tài)新模式蓬勃發(fā)展,走在了世界前列。我們要瞄準(zhǔn)世界科技前沿,集中優(yōu)勢(shì)資源突破大數(shù)據(jù)核心技術(shù),加快構(gòu)建自主可控的大數(shù)據(jù)產(chǎn)業(yè)鏈[7]、價(jià)值鏈和生態(tài)系統(tǒng)。要加快構(gòu)建高速、移動(dòng)、安全、泛在的新一代信息基礎(chǔ)設(shè)施,統(tǒng)籌規(guī)劃政務(wù)數(shù)據(jù)資源和社會(huì)數(shù)據(jù)資源,完善基礎(chǔ)信息資源和重要領(lǐng)域信息資源建設(shè),形成萬物互聯(lián)、人機(jī)交互、天地一體的網(wǎng)絡(luò)空間。
大數(shù)據(jù)時(shí)代的到來,為各個(gè)行業(yè)都帶來了很大改變,有挑戰(zhàn)也有機(jī)遇,無線網(wǎng)絡(luò)使用范圍不斷擴(kuò)大,用戶的類型不斷增長(zhǎng),用戶行為多種多樣,同時(shí)也為網(wǎng)絡(luò)優(yōu)化工作提出了越來越高的要求,準(zhǔn)確的分析定位能夠?yàn)榫W(wǎng)絡(luò)優(yōu)化提供方向指導(dǎo),我們應(yīng)該最大化的利用現(xiàn)在不斷進(jìn)步的大數(shù)據(jù)分析技術(shù),通過海量數(shù)據(jù)的綜合全面分析,細(xì)化用戶行為偏好,為用戶提供更加個(gè)性化、更具舒適度的服務(wù),提高用戶好感度、黏著度,在市場(chǎng)環(huán)境中能夠保證極大的競(jìng)爭(zhēng)優(yōu)勢(shì)。
[1] 余海波.大數(shù)據(jù)在電信移動(dòng)通信網(wǎng)絡(luò)優(yōu)化中的應(yīng)用[J].廣西通信技術(shù),2014,(04):8-11.
[2] 莊巍.大數(shù)據(jù)在無線網(wǎng)絡(luò)優(yōu)化中的應(yīng)用研究[J].信息通信,2017,(05):141-142.
[3] 魏佳喜.探析大數(shù)據(jù)在無線網(wǎng)絡(luò)優(yōu)化中的運(yùn)用[J].中國(guó)新通信,2017,19(09):90.
[4] 張臻.大數(shù)據(jù)在移動(dòng)通信網(wǎng)絡(luò)優(yōu)化中的應(yīng)用研究[J].移動(dòng)通信,2017,41(05):27-30.
[5] 余征華.無線網(wǎng)絡(luò)大數(shù)據(jù)應(yīng)用系統(tǒng)研究[J].信息與電腦(理論版),2017,(15):159-160+165.
[6] 陳其銘,羅光容.大數(shù)據(jù)在無線網(wǎng)絡(luò)優(yōu)化中的應(yīng)用研究[J].現(xiàn)代電信科技,2016,46(01):20-24.
[7] 太星.基于端到端系統(tǒng)分析的WCDMA網(wǎng)絡(luò)優(yōu)化[D].吉林大學(xué),2016,35(15):25-30.