摘 要:信息是推動(dòng)世界發(fā)展、科技進(jìn)步的不竭動(dòng)力。而作為信息時(shí)代的產(chǎn)物——大數(shù)據(jù),逐漸成為大家討論的話題。下面將對(duì)大數(shù)據(jù)時(shí)代進(jìn)行簡(jiǎn)單概述,介紹大數(shù)據(jù)前沿的公司以及大數(shù)據(jù)時(shí)代的利與弊。
關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)分析;認(rèn)知計(jì)算系統(tǒng)
中圖分類號(hào):TP181
1 大數(shù)據(jù)時(shí)代的概述
最早提出“大數(shù)據(jù)”時(shí)代到來的是全球知名咨詢公司麥肯錫,他稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來?!?“大數(shù)據(jù)”在物理學(xué)、生物學(xué)等領(lǐng)域以及軍事、金融、通訊等行業(yè)存在已有時(shí)日,卻因?yàn)榻陙砘ヂ?lián)網(wǎng)和信息行業(yè)的發(fā)展而引起人們關(guān)注。大數(shù)據(jù)作為云計(jì)算、物聯(lián)網(wǎng)之后IT行業(yè)又一大顛覆性的技術(shù)革命。云計(jì)算主要為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場(chǎng)所和渠道,而數(shù)據(jù)才是真正有價(jià)值的資產(chǎn)。企業(yè)內(nèi)部的經(jīng)營(yíng)交易信息、物聯(lián)網(wǎng)世界中的商品物流信息,互聯(lián)網(wǎng)世界中的人與人交互信息、位置信息等,其數(shù)量將遠(yuǎn)遠(yuǎn)超越現(xiàn)有企業(yè)IT架構(gòu)和基礎(chǔ)設(shè)施的承載能力,實(shí)時(shí)性要求也將大大超越現(xiàn)有的計(jì)算能力。
當(dāng)大數(shù)據(jù)還在眾說紛紜時(shí),維克托·邁爾-舍恩伯格就以對(duì)大數(shù)據(jù)進(jìn)行了深入而系統(tǒng)的研究,并與麥肯思·庫克耶編輯在《經(jīng)濟(jì)學(xué)人》發(fā)表了大數(shù)據(jù)專題論文,他曾說,世界的本質(zhì)就是數(shù)據(jù),大數(shù)據(jù)將開啟一次重大的時(shí)代變革。
2 大數(shù)據(jù)的引領(lǐng)者
Google,Microsoft,亞馬遜,IBM,蘋果,F(xiàn)acebook,twitter,VISA都是大數(shù)據(jù)時(shí)代的領(lǐng)軍企業(yè),他們都洞察到了大數(shù)據(jù)的發(fā)展,在其中他們“受益匪淺”。
IBM執(zhí)行總裁羅睿蘭認(rèn)為,“數(shù)據(jù)將成為一切行業(yè)當(dāng)中決定勝負(fù)的根本因素,最終數(shù)據(jù)將成為人類至關(guān)重要的自然資源。”未經(jīng)處理的數(shù)據(jù)就像源礦,毫無價(jià)值,只有經(jīng)過分析與處理的數(shù)據(jù)才有價(jià)值。大數(shù)據(jù)及分析最大的魅力就在于能夠?yàn)閲?guó)家、企業(yè)、醫(yī)療機(jī)構(gòu)等帶來分析洞察力,依托數(shù)據(jù)更加科學(xué)的來進(jìn)行決策,進(jìn)一步推動(dòng)生產(chǎn)力發(fā)展。對(duì)于大數(shù)據(jù)分析,IBM采用的是一種“人工智能”+“大數(shù)據(jù)”的方式來提供大數(shù)據(jù)分析和服務(wù),即“Watson Foundations”。
曾在《危險(xiǎn)邊緣》中一舉成名的沃森能夠戰(zhàn)勝人類的“秘技”主要有以下幾個(gè):能夠識(shí)別自然語言;從知識(shí)庫中搜索證據(jù)來支持假設(shè)的答案;具有學(xué)習(xí)能力。IBM認(rèn)為,隨著信息的增加,以學(xué)習(xí)的、交互的方式,隨著數(shù)據(jù)的進(jìn)一步增長(zhǎng)逐步提高認(rèn)知的分析行為,就是“認(rèn)知計(jì)算”。在IBM內(nèi)部,“沃森”所代表的就是“認(rèn)知計(jì)算”,IBM已經(jīng)將認(rèn)知計(jì)算作為未來大數(shù)據(jù)分析的戰(zhàn)略方向?!拔稚被贗BM Power硬件平臺(tái),實(shí)際上“沃森”的認(rèn)知計(jì)算能力并不僅限于Power,而是能移植到其他IBM系統(tǒng)上。IBM的Watson Foundations是一個(gè)開放式平臺(tái),傳統(tǒng)的大數(shù)據(jù)解決方案用戶也能獲得認(rèn)知計(jì)算帶來的好處。
現(xiàn)在,IBM已經(jīng)創(chuàng)建了三大類認(rèn)知計(jì)算系統(tǒng):新一代的對(duì)話系統(tǒng);新一代的探索系統(tǒng);新一代的決策系統(tǒng),這是認(rèn)知計(jì)算的最高應(yīng)用境界,能幫助客戶提供最佳的決策,如根據(jù)客戶過往購(gòu)物情況和實(shí)時(shí)購(gòu)物情況,預(yù)測(cè)接下來客戶要買什么。
“沃森”正變得越來越受歡迎,因?yàn)樗淼摹罢J(rèn)知計(jì)算”讓大數(shù)據(jù)及分析變得更加簡(jiǎn)單。
在國(guó)內(nèi),百度已經(jīng)致力于開發(fā)自己的大數(shù)據(jù)處理和存儲(chǔ)系統(tǒng);騰訊也提出目前已經(jīng)到了數(shù)據(jù)化運(yùn)營(yíng)的黃金時(shí)期,如何整合這些數(shù)據(jù)成為未來的關(guān)鍵任務(wù)。每一個(gè)商業(yè)巨頭都在緊緊把握這次機(jī)會(huì)。
3 大數(shù)據(jù)時(shí)代的利與弊
一分鐘內(nèi),微博推特上新發(fā)的數(shù)據(jù)量超過10萬;社交網(wǎng)絡(luò)“臉譜”的瀏覽量超過600萬……你把它們當(dāng)作抒情議論的工具,華爾街的斂財(cái)高手們卻正在挖掘這些互聯(lián)網(wǎng)的“數(shù)據(jù)財(cái)富”,先人一步用其預(yù)判市場(chǎng)走勢(shì),而且取得了不俗的收益。他們究竟是怎么利用這些數(shù)據(jù)的?這些數(shù)據(jù)具體有六大價(jià)值:
(1)華爾街根據(jù)民眾情緒拋售股票;(2)對(duì)沖基金依據(jù)購(gòu)物網(wǎng)站的顧客評(píng)論,分析企業(yè)產(chǎn)品銷售狀況;(3)銀行根據(jù)求職網(wǎng)站的崗位數(shù)量,推斷就業(yè)率;(4)投資機(jī)構(gòu)搜集并分析上市企業(yè)聲明,從中尋找破產(chǎn)的蛛絲馬跡;(5)美國(guó)疾病控制和預(yù)防中心依據(jù)網(wǎng)民搜索,分析全球范圍內(nèi)流感等病疫的傳播狀況;(6)美國(guó)總統(tǒng)奧巴馬的競(jìng)選團(tuán)隊(duì)依據(jù)選民的微博,實(shí)時(shí)分析選民對(duì)總統(tǒng)競(jìng)選人的喜好。
幾乎每一個(gè)成功的人,成功的企業(yè)都充分利用了大數(shù)據(jù)的絕妙優(yōu)勢(shì)。
蘋果公司的傳奇總裁史蒂夫·喬布斯在與癌癥斗爭(zhēng)的過程中采用了不同的方式,成為世界上第一個(gè)對(duì)自身所有DNA和腫瘤DNA進(jìn)行排序的人。他得到的不是只有一系列標(biāo)記的樣本,而是包括整個(gè)基因密碼的數(shù)據(jù)文檔。對(duì)于一個(gè)普通患者,醫(yī)生只能期望他的DNA排列同實(shí)驗(yàn)中使用的樣本足夠相似。但是,史蒂夫·喬布斯的醫(yī)生們能夠基于喬布斯的特定基因組成,按所需效果用藥。如果癌癥病變導(dǎo)致藥物失效,醫(yī)生可以及時(shí)更換另一種藥,也就是喬布斯所說的,“從一片睡蓮葉跳到另一片上?!眴滩妓归_玩笑說:“我要么是第一個(gè)通過這種方式戰(zhàn)勝癌癥的人,要么就是最后一個(gè)因?yàn)檫@種方式死于癌癥的人?!彪m然他的愿望沒有實(shí)現(xiàn),但是他獲得的所有數(shù)據(jù)還是將他的生命延長(zhǎng)了好幾年,也才有了iphone的一次次創(chuàng)新,帶給我們的一次次驚喜。[1]
采用所有數(shù)據(jù)而不是樣本數(shù)據(jù),增加了我們解決問題的方法和能力,降低了我們的直接和間接經(jīng)濟(jì)損失,甚至挽救或者延長(zhǎng)了人的生命,這就是大數(shù)據(jù)的魅力所在。
沃爾瑪是世界上最大的零售商,在網(wǎng)絡(luò)帶來的巨大數(shù)據(jù)之前,沃爾瑪在美國(guó)企業(yè)中擁有的數(shù)據(jù)資源是最多的。在20世紀(jì)90年代,通過把每一個(gè)產(chǎn)品記錄為數(shù)據(jù),沃爾瑪可以讓供應(yīng)商監(jiān)控銷售速率、數(shù)量以及存貨的情況,利用此沃爾瑪成為了世界上最大的“寄售店”。而且在2004年,沃爾瑪對(duì)歷史交易記錄這個(gè)龐大的數(shù)據(jù)庫進(jìn)行了觀察,這個(gè)數(shù)據(jù)庫記錄的不僅僅包括每一個(gè)顧客的購(gòu)物清單以及消費(fèi)額,還包括購(gòu)物籃中的物品,具體時(shí)間,甚至購(gòu)買當(dāng)日的天氣。他們注意到,每當(dāng)季節(jié)性颶風(fēng)來臨之前,不僅手電筒的銷售量增加了,而且POPTarts蛋撻的銷量也增加了。因此當(dāng)季節(jié)性颶風(fēng)來臨時(shí),沃爾瑪會(huì)把庫存的蛋撻放在靠近颶風(fēng)用品的位置,從而增加銷售量。[2]
當(dāng)數(shù)據(jù)點(diǎn)以數(shù)量級(jí)方式增長(zhǎng)時(shí),我們會(huì)觀察到許多似是而非的相關(guān)關(guān)系,大數(shù)據(jù)的相關(guān)關(guān)系分析法更準(zhǔn)確、更快,也更不易受到偏見的影響。[3]
任何事物都有兩面性,大數(shù)據(jù)難道帶給我們的只有好處而無弊端嗎?不,當(dāng)然不是。大數(shù)據(jù)的最大弊端就是隱私。
Google、Yahoo!、微軟搜索、Ask.com以及萬維網(wǎng)進(jìn)行邊路的其他許多搜索引擎,通過碎網(wǎng)頁的諸葛搜索,使得所有人僅在搜索框中鍵入一兩個(gè)關(guān)鍵字就能訪問這些網(wǎng)頁。然而在不經(jīng)意間,搜索引擎記住了許多,比網(wǎng)上發(fā)布的信息多得多。Google能識(shí)別出我們每個(gè)人在什么時(shí)候搜索了什么的,以及我們可能覺得足夠準(zhǔn)確并點(diǎn)擊進(jìn)去的搜索結(jié)果是什么。毫不夸張的說,Google對(duì)我們的了解比我們自己能夠記住的還要多。[4]
他們得到了我們?nèi)绱酥嗟碾[私(并非我們自愿給予的),我們完全處于赤裸的狀態(tài)(雖然Google等都對(duì)他們存儲(chǔ)的信息進(jìn)行定期的刪除)。我們的隱私不再隱私。
大數(shù)據(jù)為我們帶來便利的同時(shí),也為我們埋下了巨大隱患。但是我們不會(huì)因?yàn)樗牟蛔憔娃饤壦?,相反地我們要好好利用它,并?duì)它產(chǎn)生的弊端進(jìn)行研究,拿出合理的解決方案。
參考文獻(xiàn):
[1]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.盛楊燕,周濤譯.大數(shù)據(jù)時(shí)代[M].浙江人民出版社,2012(12):33-34.
[2]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.盛楊燕,周濤譯.大數(shù)據(jù)時(shí)代[M].浙江人民出版社,2012(12):50.
[3]維克托·邁爾-舍恩伯格,肯尼思·庫克耶. 盛楊燕,周濤譯.大數(shù)據(jù)時(shí)代[M].浙江人民出版社,2012(12):51.
[4]維克托·邁爾-舍恩伯格.刪除[M].袁杰譯.浙江人民出版社,2013(01):12-13.
作者單位:沈陽農(nóng)業(yè)大學(xué),沈陽 110866