姚祖文,葉曉慧,張旭輝
(1.中國(guó)人民解放軍75831部隊(duì),廣州 510510;2.海軍工程大學(xué),武漢 430033)
什么是大數(shù)據(jù)?信息技術(shù)革命與人類經(jīng)濟(jì)社會(huì)活動(dòng)的交匯融合,引發(fā)了數(shù)據(jù)爆炸式增長(zhǎng),大數(shù)據(jù)的概念應(yīng)運(yùn)而生。“大數(shù)據(jù)”廣義上可以理解為信息化發(fā)展過程中伴隨產(chǎn)生的海量數(shù)據(jù)的集合,是在信息時(shí)代可以被利用的全部數(shù)據(jù)資源。按數(shù)據(jù)來源,大數(shù)據(jù)可以大致分為政府?dāng)?shù)據(jù)、行業(yè)數(shù)據(jù)以及互聯(lián)網(wǎng)數(shù)據(jù)等。鑒于大數(shù)據(jù)技術(shù)正處于高速發(fā)展階段,目前大部分人對(duì)于大數(shù)據(jù)的概念還是理解得不是很透徹,其實(shí),在我們的日常生活當(dāng)中,通過挖掘、收集、存儲(chǔ)、分析海量數(shù)據(jù),很多人利用這些大數(shù)據(jù)做了很多事情,大數(shù)據(jù)應(yīng)用案例真實(shí)的反映在各行各業(yè),大數(shù)據(jù)的身影無處不在。
海量數(shù)據(jù)對(duì)于得出正確的分析結(jié)論有著積極意義,而數(shù)據(jù)收集的目的則是為挖掘隱含在數(shù)據(jù)之外的信息資源。林彪司令員在解放戰(zhàn)爭(zhēng)期間高度重視數(shù)據(jù)收集。在指揮遼沈戰(zhàn)役期間,林彪要求隊(duì)伍進(jìn)行日常的“每日軍情匯報(bào)”。林彪要求值班參謀匯總電臺(tái)報(bào)道的下屬師團(tuán)的每日戰(zhàn)況及戰(zhàn)利品繳獲信息。這些軍情數(shù)據(jù)非?,嵈獠⑶铱菰餆o味,例如需要匯報(bào)每支隊(duì)伍的傷亡情況、殲敵及俘虜情況、繳獲戰(zhàn)利品的門類和數(shù)量等。其中某日值班參謀例行匯報(bào)當(dāng)日戰(zhàn)況,林彪突然打住并問在場(chǎng)是否聽清“胡家窩棚”的戰(zhàn)利品繳獲情況。眾人對(duì)于林彪司令員的問題非常疑惑,眾人面對(duì)每日的幾十起的枯燥數(shù)據(jù)都沒有引起足夠的重視。林彪見眾人無一應(yīng)答,便繼續(xù)指出“胡家窩棚”軍情的三點(diǎn)不同。其中“繳獲的短槍長(zhǎng)槍比例”、“繳獲或者炸毀的小車大車比例”以及“繳獲或者擊斃的軍官士兵比例”這三項(xiàng)都明顯高于其他區(qū)域。林彪據(jù)此非常篤定地?cái)喽〝橙说闹笓]所在“胡家窩棚”。林彪就是通過對(duì)大數(shù)據(jù)的比對(duì)分析,對(duì)軍事指揮做出了正確的判斷。果然,部隊(duì)根據(jù)林彪司令員對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)大數(shù)據(jù)的分析,很快就抓住了敵方的指揮官廖耀湘,并取得這場(chǎng)重要戰(zhàn)役的勝利。國(guó)際事件中也有此類的案例。例如在發(fā)生“911”事件前,美國(guó)的情報(bào)人員其實(shí)事先已經(jīng)獲取了可能預(yù)警恐怖事件的海量數(shù)據(jù),然而卻并沒有深入挖掘其中有價(jià)值的戰(zhàn)略情報(bào)。美國(guó)政府高度重視,并在“911”事件后的美國(guó)國(guó)防部項(xiàng)目年度研討會(huì)上,不少專家均建議利用數(shù)據(jù)挖掘技術(shù)對(duì)統(tǒng)一集成的數(shù)據(jù)庫(kù)進(jìn)行系統(tǒng)分析。其中“交易空間”概念是此觀點(diǎn)的重要論斷。所謂“交易空間”是指恐怖分子在進(jìn)行恐怖行為預(yù)謀時(shí),是需要通過“交易”行為在信息空間下留下蛛絲馬跡的所謂“數(shù)據(jù)痕跡”,即所謂的“交易空間”的概念?!敖灰卓臻g”涵蓋的數(shù)據(jù)非常廣泛,即可能通過旅行、住宿、出入境、交通方式或者通訊、醫(yī)療以及財(cái)務(wù)等方面。隨后,美國(guó)政府高度重視“交易空間”理論,并將數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用于“交易空間”,通過監(jiān)控恐怖分子的行為實(shí)現(xiàn)反恐。2013年美國(guó)波士頓連續(xù)爆炸案的偵破,是大數(shù)據(jù)技術(shù)應(yīng)用于反恐領(lǐng)域的成功案例。連續(xù)爆炸案的偵破過程中,充分體現(xiàn)了大數(shù)據(jù)技術(shù)具備的5V特征。
位于拉斯維加斯的哈拉斯賭場(chǎng)對(duì)于大數(shù)據(jù)的應(yīng)用非常在行,賭場(chǎng)內(nèi)實(shí)行所謂的“完全回饋”的會(huì)員卡制度。顧客在賭場(chǎng)內(nèi)停車、賭博、餐飲以及住宿均需要使用會(huì)員卡。例如在賭場(chǎng)內(nèi)的各種消費(fèi)可以產(chǎn)生一定的積分,而積分便可作為折扣繼續(xù)參與消費(fèi)。按照這種會(huì)員卡回饋制度,哈拉斯賭場(chǎng)累積了大量的會(huì)員數(shù)據(jù)庫(kù)信息,當(dāng)前會(huì)員人數(shù)高達(dá)5000萬,堪稱博彩界最珍貴的會(huì)員信息數(shù)據(jù)庫(kù)。賭場(chǎng)會(huì)對(duì)數(shù)據(jù)庫(kù)會(huì)員信息進(jìn)行追蹤,根據(jù)會(huì)員近一兩年的消費(fèi)信息,分析出用戶個(gè)人消費(fèi)喜好、消費(fèi)水平以及賭博習(xí)慣等相關(guān)信息。賭場(chǎng)按照數(shù)據(jù)庫(kù)為客戶提供最優(yōu)質(zhì)的個(gè)性化服務(wù)。很多客戶難以想象自其進(jìn)入賭場(chǎng)的一刻,享受到的服務(wù)質(zhì)量甚至小到每個(gè)服務(wù)人員的微笑都是按照大數(shù)據(jù)建模精心設(shè)計(jì)的。這種數(shù)據(jù)追蹤記錄服務(wù)還能結(jié)合客戶消費(fèi)習(xí)慣以及個(gè)人背景信息模擬出所謂的“痛點(diǎn)”。一旦顧客輸錢總數(shù)超過其 “痛點(diǎn)”,顧客將視今晚在哈拉斯的賭博為所謂的“痛點(diǎn)”,顧客將會(huì)永遠(yuǎn)的離開該賭場(chǎng),那么就不能有效率地賺錢。因此通過會(huì)員卡大數(shù)據(jù),對(duì)客人秘密了解得越詳細(xì),賭場(chǎng)就能有效的賺錢。早在上世紀(jì)90年代,很多賭場(chǎng)運(yùn)營(yíng)商便通過信用卡公司以及部分營(yíng)銷人員渠道獲取顧客信息,尋找賭博欲望極度強(qiáng)烈的名單。很多賭場(chǎng)都非常重視自身數(shù)據(jù)庫(kù)的建設(shè),并竭盡全力的獲取自身客戶的信息數(shù)據(jù)。
大數(shù)據(jù)時(shí)代的背景下,人們的日常生活無不例外中會(huì)與數(shù)據(jù)緊密相連。日常生活一切行為難免會(huì)留下數(shù)據(jù)信息痕跡,而呈現(xiàn)為不同的形態(tài)結(jié)構(gòu)各異的數(shù)據(jù)。而將多種不同形態(tài)的數(shù)據(jù)匯集則形成規(guī)模更為龐大的海量數(shù)據(jù),即所謂“大數(shù)據(jù)”。交通管理過程中的大數(shù)據(jù)分析,可以有效地獲取實(shí)時(shí)交通路況信息,能對(duì)于緩解交通壓力及突發(fā)事件的處理均能提供科學(xué)合理的決策。以2013年春運(yùn)為例,該年份春運(yùn)期間共計(jì)超過1400萬人次使用阿里集團(tuán)的支付寶進(jìn)行購(gòu)票,日均高達(dá)17萬。以1月9日為例,中國(guó)鐵路客服服務(wù)中心官網(wǎng)(12306網(wǎng)站)及手機(jī)端app的訪問量達(dá)到84億。鐵路部門及阿里集團(tuán)的數(shù)據(jù)中心是可以匯總獲得大量旅客的數(shù)據(jù)信息,例如個(gè)人身份信息、背景信息、旅行信息等。通過對(duì)上述大數(shù)據(jù)的分析,鐵路部門便可對(duì)熱點(diǎn)線路進(jìn)行針對(duì)性部署,高峰時(shí)段科學(xué)地調(diào)配鐵路運(yùn)力,從而確保春運(yùn)安全有序。2014年的春運(yùn)期間,央視與百度地圖合作收集春運(yùn)期間我國(guó)人口流動(dòng)的大數(shù)據(jù)項(xiàng)目?;谑占俣鹊貓D用戶的基于地理位置的LBS服務(wù)(location based service)的大數(shù)據(jù),通過大數(shù)據(jù)技術(shù)進(jìn)行分析,對(duì)我國(guó)春運(yùn)前后人口流動(dòng)實(shí)現(xiàn)全程、動(dòng)態(tài)以及可視化地展示,也是展現(xiàn)了大數(shù)據(jù)分析技術(shù)對(duì)于交通管理方面又一成功案例。
基于大數(shù)據(jù)分析做出正確商業(yè)決策而獲得盈利的企業(yè)不在少數(shù),的模式已經(jīng)為不少的企業(yè)帶來了盈利和聲譽(yù)。而擁有大數(shù)據(jù)思維的人,可以將大數(shù)據(jù)的潛在價(jià)值轉(zhuǎn)化為實(shí)際利益。Target超市是美國(guó)非常重視大數(shù)據(jù)應(yīng)用的零售業(yè)巨頭。Target超市以20多種備孕期間可能購(gòu)買的商品的全部購(gòu)買記錄作為大數(shù)據(jù)來源,通過相應(yīng)的數(shù)據(jù)模型分析孕婦購(gòu)買行為的關(guān)聯(lián)性,并據(jù)此推測(cè)孕婦的懷孕時(shí)間及分娩時(shí)間。并根據(jù)孕婦實(shí)際孕期狀態(tài),根據(jù)不同階段不同需求的特征向每個(gè)孕婦寄出富于個(gè)性化需求的產(chǎn)品優(yōu)惠券,能長(zhǎng)久的吸引孕婦到它的超市消費(fèi)。維克托·邁爾舍恩伯格認(rèn)為,尋找出相關(guān)性的事件并長(zhǎng)期監(jiān)控,是便于對(duì)未來行為的預(yù)測(cè)。而Target的市場(chǎng)營(yíng)銷案例很好地驗(yàn)證了該理論。Target超市通過分析顧客購(gòu)買商品的時(shí)間及品種對(duì)孕期進(jìn)行預(yù)測(cè)是非常典型的對(duì)大數(shù)據(jù)進(jìn)行二次利用案例。再者,廣告投放商可以充分利用司機(jī)手機(jī)的GPS大數(shù)據(jù)。不同司機(jī)的GPS匯總是可以實(shí)時(shí)反應(yīng)交通狀況,而通過分析GPS數(shù)據(jù)可以確定哪些區(qū)域的停車更多,活躍人群信息也便對(duì)廣告投放商有極大的商業(yè)價(jià)值。作為零售行業(yè)的領(lǐng)頭人,Wal-Mart超市對(duì)于每個(gè)階段的銷售記錄均會(huì)進(jìn)行系統(tǒng)的數(shù)據(jù)挖掘。Wal-Mart超市的數(shù)據(jù)分析人員偶然間發(fā)現(xiàn)蛋撻以及抵御颶風(fēng)的物品在颶風(fēng)爆發(fā)期間銷量大增。Wal-Mart便將蛋撻的銷售貨架轉(zhuǎn)移到颶風(fēng)物品銷售貨架相鄰。結(jié)果意外地發(fā)現(xiàn)蛋撻的銷售量得到了極大的提高。
從上面的大數(shù)據(jù)實(shí)例可以看出,大數(shù)據(jù)的價(jià)值不僅僅在于大數(shù)據(jù)本身的價(jià)值,更重要的是大數(shù)據(jù)的思維模式才是觸發(fā)價(jià)值增長(zhǎng)的關(guān)鍵,探求數(shù)據(jù)價(jià)值取決于把握數(shù)據(jù)的人。未來時(shí)代將是大數(shù)據(jù)的時(shí)代,會(huì)無時(shí)無處充斥著大數(shù)據(jù)的身影。盡管暫時(shí)無法斷定大數(shù)據(jù)對(duì)于人類社會(huì)的發(fā)展推動(dòng)到何種程度,但基本可以斷定大數(shù)據(jù)會(huì)在很長(zhǎng)一段時(shí)間內(nèi)伴隨著人類社會(huì)的發(fā)展腳步而出現(xiàn)了社會(huì)變革的各個(gè)方面。