∷陳德彰
當(dāng)前,全球已經(jīng)全面進(jìn)入信息時(shí)代,從20世紀(jì)80年代以來(lái),世界人均儲(chǔ)存信息的技術(shù)能力(the world’s technological per-capita capacity to store information)大約每過(guò)40個(gè)月就會(huì)翻一番(doubled roughly every 40 months)。到2012年,每天會(huì)產(chǎn)生2.5 百億億字節(jié)(exabytes,即2.5×1018)的信息。數(shù)據(jù)的深度分析和利用,對(duì)推動(dòng)經(jīng)濟(jì)持續(xù)增長(zhǎng)、提升企業(yè)的競(jìng)爭(zhēng)力將起到重要的作用。
隨著“云時(shí)代”(times of cloud computing)的到來(lái),“大數(shù)據(jù)”(big data,英文解釋為:the term for a collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications,即指一組非常龐大而復(fù)雜的數(shù)據(jù),很難用現(xiàn)成的數(shù)據(jù)庫(kù)或傳統(tǒng)處理方法進(jìn)行處理)?!按髷?shù)據(jù)”成了一個(gè) “高端大氣上檔次(high-ending, highfaulting and high-grade)”的時(shí)髦詞匯,吸引了越來(lái)越多的關(guān)注。“大數(shù)據(jù)”時(shí)代的挑戰(zhàn)包括數(shù)據(jù)的捕獲、綜合處理、儲(chǔ)存、尋找、分享、轉(zhuǎn)送、分析和視覺(jué)化(capture,curation, storage, search, sharing, transfer, analysis, and visualization)。
最早提出“大數(shù)據(jù)”時(shí)代已經(jīng)到來(lái)的是全球知名咨詢公司麥肯錫(McKinsey & Company)。麥肯錫在研究報(bào)告中指出,數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,逐漸成為重要的生產(chǎn)因素;而人們對(duì)于海量(magnanimous)數(shù)據(jù)的運(yùn)用預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮(a new wave of productivity growth and consuming surplus)的到來(lái)。該報(bào)告發(fā)布后,“大數(shù)據(jù)”迅速成為了計(jì)算機(jī)行業(yè)爭(zhēng)相傳誦的熱門概念,也引起了金融界的高度關(guān)注。數(shù)據(jù)本身也是資產(chǎn),這一點(diǎn)在業(yè)界已經(jīng)形成共識(shí)。
牛津大學(xué)網(wǎng)絡(luò)學(xué)院教授的維克托·邁爾-舍恩伯格(Viktor Mayer-Schonberger)所著的《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》(Big Data: a Revolution that Will Transform How We Live, Work, and Think)一書是開大數(shù)據(jù)系統(tǒng)研究的先河之作(pioneering work)。他在書中前瞻性地(with far sight)指出,大數(shù)據(jù)開啟了一次重大的時(shí)代轉(zhuǎn)型,帶來(lái)的信息風(fēng)暴正在變革我們的生活、工作和思維。他指出,大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是,放棄對(duì)因果關(guān)系(cause-result relation)的渴求,取而代之關(guān)注相關(guān)關(guān)系(correlation)。也就是說(shuō),只需要知道“是什么”,而不需要知道“為什么”。這就顛覆(subvert)了千百年來(lái)人類的思維慣例,對(duì)人類的認(rèn)知和與世界交流的方式提出了全新的挑戰(zhàn)。該書認(rèn)為,“大數(shù)據(jù)”的核心就是預(yù)測(cè)?!按髷?shù)據(jù)”將為人類的生活創(chuàng)造前所未有的可量化的維度(quantifiable dimension)?!按髷?shù)據(jù)”已經(jīng)成為新發(fā)明和新服務(wù)的源泉,而更多的改變正蓄勢(shì)待發(fā)(accumulate strength for a takeoff)。
“大數(shù)據(jù)”通常形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化(non-structural and semi-structural)數(shù)據(jù)。大數(shù)據(jù)分析常和云計(jì)算聯(lián)系到一起,因?yàn)閷?shí)時(shí)的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來(lái)向數(shù)十、數(shù)百或甚至數(shù)千的大規(guī)模的平行電腦的軟件分配工作(assign work to massively parallel software running on tens, hundreds,or even thousands of servers)。簡(jiǎn)言之,從各種各樣類型的數(shù)據(jù)中,快速獲得有價(jià)值信息的能力,就是“大數(shù)據(jù)”技術(shù)?!按髷?shù)據(jù)”到底有多大?一組名為“互聯(lián)網(wǎng)上的一天”的數(shù)據(jù)告訴我們,一天之中,互聯(lián)網(wǎng)產(chǎn)生的全部?jī)?nèi)容可以刻滿1.68億張DVD;發(fā)出的郵件有2,940億封之多(當(dāng)于美國(guó)兩年的紙質(zhì)信件數(shù)量);發(fā)出的社區(qū)帖子達(dá)200萬(wàn)個(gè) (相當(dāng)于《時(shí)代》雜志770年的文字量);賣出的手機(jī)為37.8萬(wàn)臺(tái),高于全球每天出生的嬰兒數(shù)量37.1萬(wàn)。據(jù)有關(guān)機(jī)構(gòu)監(jiān)測(cè)統(tǒng)計(jì),2011年全球數(shù)據(jù)總量已經(jīng)達(dá)到1.8ZB1ZB,等于1萬(wàn)億GB,相當(dāng)于18億個(gè)1TB移動(dòng)硬盤的存儲(chǔ)量,而這個(gè)數(shù)值還在以每?jī)赡攴环乃俣仍鲩L(zhǎng),預(yù)計(jì)到2020年全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量,增長(zhǎng)近20倍。2012年全球大數(shù)據(jù)企業(yè)營(yíng)收為50億美元,未來(lái)五年的市場(chǎng)復(fù)合年增長(zhǎng)率將達(dá)到58%,2017年將達(dá)到500億美元。
業(yè)界將“大數(shù)據(jù)”的特點(diǎn)歸納為4個(gè)“V”——Volume,Variety,Value,Velocity,即四個(gè)層面:第一,數(shù)據(jù)體量巨大;第二,數(shù)據(jù)類型繁多;第三,價(jià)值密度低;第四,速度快。
2013年,中國(guó)的互聯(lián)網(wǎng)用戶已經(jīng)超過(guò)五億人。海量的互聯(lián)網(wǎng)用戶創(chuàng)造了大規(guī)模的數(shù)據(jù)量。據(jù)預(yù)測(cè),到2015年,全球有超過(guò)85%的500強(qiáng)企業(yè)將在大數(shù)據(jù)競(jìng)爭(zhēng)中失去優(yōu)勢(shì)。這種發(fā)展趨勢(shì)在中國(guó)同樣不可避免,在未來(lái)的市場(chǎng)競(jìng)爭(zhēng)中,能在第一時(shí)間從大量互聯(lián)網(wǎng)數(shù)據(jù)中獲取最有價(jià)值信息的企業(yè)才最具有優(yōu)勢(shì)。當(dāng)前,大部分中國(guó)企業(yè)在數(shù)據(jù)基礎(chǔ)系統(tǒng)架構(gòu)和數(shù)據(jù)分析方面都面臨著諸多挑戰(zhàn)。根據(jù)產(chǎn)業(yè)信息網(wǎng)調(diào)查,目前國(guó)內(nèi)大部分企業(yè)的系統(tǒng)架構(gòu)在應(yīng)對(duì)大量數(shù)據(jù)時(shí)均有擴(kuò)展性差(with poor expansion capacity)、資源利用率低、應(yīng)用部署復(fù)雜、運(yùn)營(yíng)成本高和高能耗等問(wèn)題。國(guó)內(nèi)企業(yè)為適應(yīng)大數(shù)據(jù)時(shí)代而做出大規(guī)模調(diào)整是一種必然。中科院十多位院士向高層建議,我國(guó)應(yīng)制訂大數(shù)據(jù)國(guó)家戰(zhàn)略。同時(shí),國(guó)家發(fā)改委與中科院正在啟動(dòng)“基礎(chǔ)研究大數(shù)據(jù)服務(wù)平臺(tái)應(yīng)用示范項(xiàng)目”,大數(shù)據(jù)國(guó)家戰(zhàn)略或?qū)⑻嵘献h程。
這是一場(chǎng)革命,龐大的數(shù)據(jù)資源使得各個(gè)領(lǐng)域開始了量化進(jìn)程,無(wú)論學(xué)術(shù)界、商界,還是政府,所有領(lǐng)域都將開始這種進(jìn)程。有人把大數(shù)據(jù)稱為“最科技的跨界”(most significant cross-field science and technology)。2011年是中國(guó)大數(shù)據(jù)市場(chǎng)的元年,部分IT廠商已經(jīng)推出了相關(guān)產(chǎn)品,部分企業(yè)已經(jīng)開始實(shí)施了一些大數(shù)據(jù)解決方案,國(guó)內(nèi)一本名為《IT客》(ITer)的雜志每期卷首都有“大數(shù)據(jù)小姐的話”,還有“大數(shù)據(jù)專題”。2015年之后中國(guó)大數(shù)據(jù)市場(chǎng)將進(jìn)入成熟階段,據(jù)預(yù)計(jì)2016年交易量將接近100億元。
比特幣(Bitcoin,一譯“比特金”)的創(chuàng)始人是日本京都大學(xué)的數(shù)學(xué)教授望月真一(Shinichi Mochizuki,當(dāng)年化名中本聰Satoshi Nakamoto)。他于2009年提出了這種虛擬的數(shù)字貨幣(virtual digital currency)。與大多數(shù)貨幣不同的是,比特幣不依賴于特定的中央發(fā)行機(jī)構(gòu),而是使用遍布整個(gè)對(duì)等(peer to peer,一般簡(jiǎn)化為P2P)網(wǎng)絡(luò)節(jié)點(diǎn)(network node)的分布式數(shù)據(jù)庫(kù)(distributed database—DDB)來(lái)記錄貨幣的交易。比特幣既可以被以計(jì)算機(jī)文件的形式保存在個(gè)人電腦中,也可以儲(chǔ)存在第三方托管服務(wù)中,可以通過(guò)比特幣地址發(fā)送給互聯(lián)網(wǎng)上的任意一個(gè)人。不管身處何方,任何人都可以挖掘、購(gòu)買、出售或收取比特幣。作為一種便捷的支付手段(means/medium/instrument of payment),比特幣沒(méi)有繁瑣的額度與手續(xù)限制。只要知道對(duì)方的比特幣地址,即可進(jìn)行支付。比特幣的特點(diǎn)是分散化、匿名(anonymous),只能在數(shù)字世界使用,不屬于任何國(guó)家和金融機(jī)構(gòu),并且不受地域限制,可以在世界上的任何地方兌換。
比特幣也能套現(xiàn)(cash out),可以兌換成大多數(shù)國(guó)家的貨幣??梢杂糜谫?gòu)買一些虛擬的物品(virtual goods),比如網(wǎng)絡(luò)游戲當(dāng)中的衣服、帽子、裝備等。只要有人接受,也可以用來(lái)購(gòu)買現(xiàn)實(shí)生活中的物品(tangible goods)。一項(xiàng)調(diào)查顯示,全球有上千商家表示接受比特幣作為貨幣結(jié)算。目前,比特幣在中國(guó)也出現(xiàn)井噴(blow out)的勢(shì)頭。淘寶網(wǎng)上銷售這種比特幣及相關(guān)產(chǎn)品的賣家多達(dá)上百余家。
比特幣真正的價(jià)值來(lái)源于其規(guī)則的確定性、稀缺性、匿名性和不可封禁性。其好處包括不會(huì)被凍結(jié)(frozen)、無(wú)法跟蹤(trace)、不用納稅、交易成本極低,也因此被部分不法分子作為洗錢的工具。
2009年誕生之初,比特幣的身價(jià)極其低廉,僅為5美分左右,但之后隨著影響力提升而瘋狂上漲。2013年7月從200美元躥升至440多美元,比特幣交易數(shù)超過(guò)4.5萬(wàn)次。同年11月10日,比特幣行情為 1∶6989,即1個(gè)比特幣可以當(dāng)做6,989元人民幣使用。一些網(wǎng)站甚至接受比特幣兌換美元、歐元等服務(wù)。毫無(wú)疑問(wèn),比特幣已經(jīng)成為真正的流通貨幣。
在金融危機(jī)爆發(fā),美元不再是穩(wěn)定世界經(jīng)濟(jì)的基石后,比特幣悄然誕生。但這種“新貨幣”彈性太大,可能給經(jīng)濟(jì)注入更大的不穩(wěn)定性(instability)。而其神秘的、像“次級(jí)抵押貸款”(secondary mortgage loan)一樣復(fù)雜的產(chǎn)生方式,以及不受國(guó)家約束的“自生性”(emerge/come into being all by itself),都很難保證它不會(huì)消失。
比特幣進(jìn)入中國(guó),起初只是年輕人的時(shí)髦玩意兒。不過(guò)人們對(duì)其并不感到陌生。近十年來(lái)有一百多萬(wàn)人在社交平臺(tái)使用過(guò)Q幣(Q coin)。2013年4月,四川蘆山地震期間,公益組織“壹基金”(the One Foundation)收到百余枚比特幣捐款,成為比特幣在中國(guó)發(fā)展的一個(gè)標(biāo)志性事件。有報(bào)道說(shuō),中國(guó)對(duì)這一貨幣新貴具有濃厚興趣,每天約有四萬(wàn)名客戶下載。對(duì)比特幣的接受率迅速攀升。世界最大的比特幣交易中心就在中國(guó)。報(bào)道還說(shuō),百度公司正在其巨大的客戶網(wǎng)絡(luò)中融入比特幣支付,中國(guó)正迅速成為比特幣市場(chǎng)的重要玩家(game player)。根據(jù)美國(guó)虛擬貨幣研究中心(US virtual currency research center)Genesis Block(網(wǎng)站名,中文名是“創(chuàng)世記塊”),半數(shù)以上比特幣交易價(jià)值是以人民幣進(jìn)行的。最近,比特幣中國(guó)(Bitcoin China)已成為全球交易量最大的比特幣交易平臺(tái),日最高交易量約11萬(wàn)比特幣,最高日交易額已超過(guò)兩億人民幣。
2013年,美國(guó)政府承認(rèn)比特幣的合法地位,使得比特幣價(jià)格大漲,有專家認(rèn)為,目前比特幣更像紙黃金(paper gold),而不是一種嚴(yán)格意義上的貨幣,因此很難確定一個(gè)客觀而合理的價(jià)值(objective and reasonable value),只能隨市場(chǎng)波動(dòng),由于其匿名性,政府很難實(shí)行有效監(jiān)管,因此風(fēng)險(xiǎn)較高(with high risks)。面對(duì)比特幣近期暴漲暴跌,有投資者直呼看不懂。2013年11月19日,比特幣兌換人民幣最高成交價(jià)一度曾達(dá)8,000元人民幣,較年初時(shí)上漲近80倍。但很快成交價(jià)又回落至4,383元,其最高價(jià)在一個(gè)交易日就可能達(dá)到45%。許多人對(duì)比特幣感興趣,將其作為一種新的投資渠道。《北京晚報(bào)》11月22日就刊有“中國(guó)大媽現(xiàn)身比特江湖的”的報(bào)道。許多人沉溺于這個(gè)虛擬世界的瘋狂財(cái)富夢(mèng)(crazy dream in the virtual world to strike fortunes)??墒怯腥苏f(shuō),投資比特幣“玩的就是心跳(Play it for the thrill)!”更有人說(shuō):“這只是一個(gè)荒誕(absurd)的讓人無(wú)法了解的游戲。”想要投資比特幣的人一定要謹(jǐn)慎。