詹國(guó)樞
一本名為《大數(shù)據(jù)時(shí)代》的書(shū)正風(fēng)靡全球,引起人們?cè)絹?lái)越強(qiáng)烈的關(guān)注。何為大數(shù)據(jù)?大數(shù)據(jù)英文名big data,又稱(chēng)巨量資料,是指其數(shù)據(jù)規(guī)模極其巨大,以致很難通過(guò)一般軟件工具加以擷取、管理、處理并整理成為有用資訊的海量數(shù)據(jù)。按目前業(yè)界公認(rèn)說(shuō)法,大數(shù)據(jù)特點(diǎn)有以下4個(gè)V:即,Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)。
先說(shuō)大量、高速。大量、高速到了什么程度?我們曉得,一個(gè)移動(dòng)硬盤(pán),容量大約為10個(gè)G。而2001年,全球互聯(lián)網(wǎng)總流量大約為1EB,即10億個(gè)G。到了2004年,一個(gè)月流量即可達(dá)到1EB,而到了2007年,達(dá)到此流量時(shí)間是一周,到2013年,達(dá)到1EB的流量?jī)H僅需要一天!換句話說(shuō),目前,全球互聯(lián)網(wǎng)一天產(chǎn)生的信息量,可以刻滿1.88億張DVD光盤(pán)!
再說(shuō)多樣、價(jià)值。如此大量、高速的數(shù)據(jù),其多樣性毋庸置疑,小到某人與某人的數(shù)分鐘通話,大到某公司與某公司的一筆巨額交易,雖然全是些風(fēng)馬牛不相及的數(shù)字,但是,經(jīng)過(guò)科學(xué)的收集、歸類(lèi)、整理,再加以分析、排列、組合,這些數(shù)字就會(huì)神奇地演變成全新的極其有用的各種資訊!原始數(shù)據(jù)越大,處理難度自然越大,但是,處理后其應(yīng)用價(jià)值亦越大。大數(shù)據(jù)這種無(wú)中生有、化腐朽為神奇的增值功能,既叫人稱(chēng)奇,更令人神往!
正因大數(shù)據(jù)的以上特性,世界經(jīng)濟(jì)論壇報(bào)告將它認(rèn)定為人類(lèi)新世紀(jì)的“新財(cái)富”,稱(chēng)其價(jià)值“堪比石油”。也正因此,發(fā)達(dá)國(guó)家紛紛將開(kāi)發(fā)利用大數(shù)據(jù)作為奪取新一輪競(jìng)爭(zhēng)制高點(diǎn)的重要目標(biāo)。美國(guó)政府于2012年3月發(fā)布了《大數(shù)據(jù)研究與發(fā)展倡議》報(bào)告,這是繼1993年宣布“信息高速公路”之后又一重大部署。歐盟及日本等國(guó),也紛紛在大數(shù)據(jù)研發(fā)方面投入巨資,竭盡全力拼搶這一制高點(diǎn)。
大數(shù)據(jù)這塊餑餑,雖然聞起來(lái)很香,但啃起來(lái)卻相當(dāng)硬,其難度主要有四,一是數(shù)據(jù)收集難,不但難在大,海量信息,而且難在雜,萬(wàn)千角度。二是數(shù)據(jù)存儲(chǔ)難,如此海量存儲(chǔ),既要低成本、低能耗,又要高質(zhì)量、高識(shí)別。三是數(shù)據(jù)處理難,信息如密網(wǎng)交織,錯(cuò)綜復(fù)雜,處理如剝繭抽絲,穿針引線,其難度可想而知。四是數(shù)據(jù)呈現(xiàn)難,數(shù)據(jù)最終是要拿來(lái)使用的,所以其呈現(xiàn)須簡(jiǎn)單、實(shí)用,無(wú)疑,這是又一個(gè)由繁入簡(jiǎn)的艱巨工程。
好在,大數(shù)據(jù)應(yīng)用已初見(jiàn)曙光,歐美各國(guó)均有成功先例,紛紛應(yīng)用于實(shí)踐并卓有成效。有人設(shè)想,倘若我們將大數(shù)據(jù)應(yīng)用于日常生活,那么,當(dāng)你在北京或者某一城市打算購(gòu)買(mǎi)某一產(chǎn)品時(shí),只消將名稱(chēng)輸入手機(jī),大數(shù)據(jù)立即就會(huì)告訴你,你所需要這些東西,在當(dāng)?shù)啬男┥虉?chǎng)有售,其價(jià)格此時(shí)分別是多少。于是你可以馬上作出決策……這將給人們帶來(lái)多么大的方便,又將給商業(yè)流通帶來(lái)多么大的改變!
萬(wàn)事雖然開(kāi)頭難,堅(jiān)持動(dòng)手就不難。所謂大數(shù)據(jù)之“大”,不過(guò)是相對(duì)而言,小可積大。目前,百度、阿里、騰訊等不少互聯(lián)網(wǎng)公司已著手成立大數(shù)據(jù)研發(fā)機(jī)構(gòu)??吹揭毁Y料,百度目前日處理數(shù)據(jù)量已達(dá)100PB,相當(dāng)于一個(gè)圖書(shū)館2700萬(wàn)冊(cè)藏書(shū)!而阿里則根據(jù)淘寶網(wǎng)上中小企業(yè)的交易狀況,利用先天掌握的大數(shù)據(jù)篩選出財(cái)務(wù)健康及講誠(chéng)信企業(yè),并對(duì)其發(fā)放無(wú)擔(dān)保貸款300多億元,其壞賬率僅0.3%,創(chuàng)造了金融業(yè)一個(gè)奇跡。這些都是大數(shù)據(jù)應(yīng)用的好例子。讓我們張開(kāi)雙臂,迎接大數(shù)據(jù)時(shí)代的來(lái)臨吧!endprint