韓俊俊
【 人物簡(jiǎn)介 】
姜奇平,現(xiàn)任中國(guó)社會(huì)科學(xué)院信息化研究中心秘書(shū)長(zhǎng),《互聯(lián)網(wǎng)周刊》主編,同時(shí)擔(dān)任國(guó)務(wù)院國(guó)有資產(chǎn)監(jiān)督管理委員會(huì)第一屆國(guó)資監(jiān)管信息化專家組專家,中國(guó)信息經(jīng)濟(jì)學(xué)會(huì)常務(wù)理事,中國(guó)電子商務(wù)協(xié)會(huì)常務(wù)理事,數(shù)字論壇成員。
“大數(shù)據(jù)時(shí)代”是全球知名咨詢公司麥肯錫首先提出,進(jìn)入2012年后,“大數(shù)據(jù)”一詞被越來(lái)越多地提及。大家都在談?wù)摗按髷?shù)據(jù)”,對(duì)它的定義也越來(lái)越多,但對(duì)很多人來(lái)說(shuō),大數(shù)據(jù)并不是一個(gè)非常清晰的概念。為明晰大數(shù)據(jù)的內(nèi)涵,本刊有幸邀請(qǐng)到中國(guó)社會(huì)科學(xué)院信息化研究中心秘書(shū)長(zhǎng)姜奇平教授,他為我們帶來(lái)關(guān)于大數(shù)據(jù)方面的最新見(jiàn)解,以及對(duì)大數(shù)據(jù)是什么、大數(shù)據(jù)時(shí)代給我們生活帶來(lái)哪些改變的探索。
不可思議的大數(shù)據(jù)時(shí)代
英國(guó)維克托·邁爾-舍恩伯格及肯尼斯·庫(kù)克耶編寫(xiě)的《大數(shù)據(jù)時(shí)代》是國(guó)外大數(shù)據(jù)系統(tǒng)研究的先河之作,書(shū)中提出大數(shù)據(jù)指不用隨機(jī)分析法(抽樣調(diào)查)這樣的捷徑,而采用所有數(shù)據(jù)進(jìn)行分析處理。但作為特指的大數(shù)據(jù),按EMC的界定,其中的“大”是指大型數(shù)據(jù)集,一般在10TB規(guī)模左右;多用戶把多個(gè)數(shù)據(jù)集放在一起,形成PB級(jí)的數(shù)據(jù)量;同時(shí)這些數(shù)據(jù)來(lái)自多種數(shù)據(jù)源,以實(shí)時(shí)、迭代的方式來(lái)實(shí)現(xiàn)。IBM把大數(shù)據(jù)概括成了三個(gè)V,即大量化(Volume)、多樣化(Variety)和快速化(Velocity)。大數(shù)據(jù)通常與Hadoop、NoSQL、數(shù)據(jù)分析與挖掘、數(shù)據(jù)倉(cāng)庫(kù)、商業(yè)智能以及開(kāi)源云計(jì)算架構(gòu)等諸多熱點(diǎn)話題聯(lián)系在一起。作為泛指的大數(shù)據(jù),則指向了定制化、差異化、個(gè)性化方向的競(jìng)爭(zhēng)力。
姜奇平認(rèn)為,通俗地講,大數(shù)據(jù)就是對(duì)網(wǎng)上海量的文本、圖像、音頻和視頻數(shù)據(jù)進(jìn)行采集、分析、加工和利用。在這之前,有數(shù)據(jù)但達(dá)不到海量的規(guī)模,數(shù)據(jù)可以分析但主要是針對(duì)文本。他認(rèn)為,大數(shù)據(jù)并不像某些人說(shuō)的,是云計(jì)算之后的又一浪,而就是云計(jì)算本身。因?yàn)樗鼈兌际菙?shù)據(jù)的大規(guī)模集聚與定制化分布的結(jié)合。他認(rèn)為這是一個(gè)人類新的分水嶺,由此要把農(nóng)業(yè)文明的分散化,與工業(yè)文明的集中化,在大數(shù)據(jù)中融為一體,集天地之精華,釋放出無(wú)窮的能量,達(dá)到信息時(shí)代的“光明頂”。
其實(shí)真正的數(shù)據(jù)時(shí)代是從2012年開(kāi)始的,標(biāo)志性的區(qū)別就在于,以往的數(shù)據(jù)只是結(jié)構(gòu)化的數(shù)據(jù),是非個(gè)性化的數(shù)據(jù);而進(jìn)入2012年,非結(jié)構(gòu)化數(shù)據(jù)占有比例將達(dá)到互聯(lián)網(wǎng)整個(gè)數(shù)據(jù)量的75%以上,這意味著個(gè)性化數(shù)據(jù)時(shí)代的到來(lái)。
什么是大數(shù)據(jù)時(shí)代?為此,姜奇平形象的描述了未來(lái)大數(shù)據(jù)時(shí)代的一個(gè)場(chǎng)景,當(dāng)你走進(jìn)一家陌生的小咖啡館時(shí),耳邊響起了只有你才熟悉的音樂(lè)旋律。技術(shù)實(shí)現(xiàn)并不難,咖啡館只要讀出你手機(jī)音樂(lè)下載記錄,通過(guò)數(shù)據(jù)分析,就可以定制播放。這就是大數(shù)據(jù)時(shí)代。
在真正的數(shù)據(jù)時(shí)代,網(wǎng)商將不再奔向數(shù)據(jù)趨同的淘寶商城,而將涌向提供個(gè)性化競(jìng)爭(zhēng)力的AaaS(分析即服務(wù),analytics-as-a-service),撲向3V的懷抱。
淘寶目前每天活躍數(shù)據(jù)量已經(jīng)超過(guò)50TB,共有4億條產(chǎn)品訊息和2億多名注冊(cè)用戶在上面活動(dòng),每天超過(guò)4000萬(wàn)人次訪問(wèn)?!按髷?shù)據(jù)”的作用,就是把這些數(shù)據(jù)采集進(jìn)數(shù)據(jù)倉(cāng)庫(kù)中,然后用分布式的技術(shù)框架(Hadoop),對(duì)非關(guān)系型數(shù)據(jù)進(jìn)行異質(zhì)性處理(NoSQL),通過(guò)數(shù)據(jù)分析與挖掘,發(fā)展一對(duì)一的商業(yè)智能,從中產(chǎn)生讓網(wǎng)商因小而美、不再打價(jià)格戰(zhàn)的企業(yè)和個(gè)人競(jìng)爭(zhēng)力;讓中國(guó)產(chǎn)生不再依靠“中國(guó)制造”,而轉(zhuǎn)向“中國(guó)創(chuàng)造”的國(guó)家競(jìng)爭(zhēng)力。
大數(shù)據(jù)的時(shí)代特征
姜奇平認(rèn)為當(dāng)前人們談?wù)摯髷?shù)據(jù),多是從技術(shù)角度觀察。從這個(gè)角度觀察大數(shù)據(jù),對(duì)技術(shù)人員來(lái)說(shuō)是大數(shù)據(jù)的全部;但如果工商管理人員僅從技術(shù)角度看大數(shù)據(jù),就會(huì)把大數(shù)據(jù)看低,看成是工具性的東西。我們需要先從技術(shù)經(jīng)濟(jì)學(xué)角度,把大數(shù)據(jù)先從技術(shù)現(xiàn)象,轉(zhuǎn)化為經(jīng)濟(jì)現(xiàn)象,再理解它的經(jīng)濟(jì)社會(huì)意義。作為技術(shù)的大數(shù)據(jù),主要指對(duì)海量復(fù)雜數(shù)據(jù)進(jìn)行采集、加工和利用的技術(shù)。而作為生產(chǎn)力的大數(shù)據(jù),主要指智力工作者運(yùn)用數(shù)據(jù)技術(shù)處理數(shù)據(jù)以獲得智慧的能力,是一種高級(jí)信息生產(chǎn)力。為此,姜奇平從生產(chǎn)力、生產(chǎn)關(guān)系和生產(chǎn)方式的角度分析大數(shù)據(jù)的時(shí)代特征。
首先,大數(shù)據(jù)的時(shí)代特征表現(xiàn)在它的生產(chǎn)力特征上。而生產(chǎn)力包括勞動(dòng)者、勞動(dòng)對(duì)象、勞動(dòng)資源和勞動(dòng)目的四個(gè)要素。其中,掌握大數(shù)據(jù)的勞動(dòng)者是智力工作者,他集勞動(dòng)與資本于一身,是資本家;勞動(dòng)對(duì)象是數(shù)據(jù),這些數(shù)據(jù)不僅是資源,而且是財(cái)富;勞動(dòng)資源包括語(yǔ)義網(wǎng)等公共基礎(chǔ)設(shè)施上分享的開(kāi)源軟件、Hadoop、NoSQL、數(shù)據(jù)分析與挖掘、數(shù)據(jù)倉(cāng)庫(kù)、商業(yè)智能(BI)等技術(shù)條件;最后,從勞動(dòng)目的看,從事大數(shù)據(jù)是為了“從中獲得知識(shí)和洞見(jiàn)以提升能力”,進(jìn)一步說(shuō),要洞見(jiàn)的是意義,要獲得的能力是智慧,有意義的數(shù)據(jù)是智慧,沒(méi)有意義的數(shù)據(jù)是垃圾。大數(shù)據(jù)要完成從客體的數(shù)據(jù)向主體的智慧的轉(zhuǎn)換。忘記這一點(diǎn)就會(huì)陷入為數(shù)據(jù)而數(shù)據(jù)。
其次,大數(shù)據(jù)的時(shí)代特征體現(xiàn)在它的生產(chǎn)關(guān)系特征上,表現(xiàn)在生產(chǎn)、交換、分配和消費(fèi)四個(gè)環(huán)節(jié)上。在生產(chǎn)上,分布式計(jì)算的大數(shù)據(jù),推動(dòng)生產(chǎn)組織向去中心、扁平化轉(zhuǎn)變,向自組織、自協(xié)調(diào)方向演化,智能化的大數(shù)據(jù)將促進(jìn)勞動(dòng)與資本的一體化,推動(dòng)決策前移,并且可以提供平臺(tái)支持創(chuàng)造性的自主勞動(dòng)(如DIY+3D打印的“創(chuàng)客”);在交換中,具有語(yǔ)義功能的智能網(wǎng)絡(luò)成為與現(xiàn)有市場(chǎng)互補(bǔ)的新組織形式,商品交換與包括情感在內(nèi)的信息交流在新的市場(chǎng)結(jié)構(gòu)中相互融合,用戶體驗(yàn)和意義滿足成為定價(jià)的重要因素,情境定價(jià)成為可能,依托數(shù)據(jù)分析可以實(shí)現(xiàn)一對(duì)一精準(zhǔn)營(yíng)銷和“人單合一”;在分配上,在數(shù)據(jù)財(cái)富歸屬與利用的平衡中,形成以“使用所有權(quán)”(access over ownership)為特征的分享型經(jīng)濟(jì)(Sharing Economy),在物質(zhì)財(cái)富極大豐富基礎(chǔ)上,逐步實(shí)現(xiàn)以自由看待發(fā)展;在消費(fèi)上,在大數(shù)據(jù)引導(dǎo)下,出現(xiàn)產(chǎn)消逆轉(zhuǎn)(C2B)和產(chǎn)消合一趨勢(shì),人們?cè)跐M足生存發(fā)展需求基礎(chǔ)上,日益產(chǎn)生通過(guò)自主勞動(dòng)滿足的自我實(shí)現(xiàn)需求。
最后,大數(shù)據(jù)的時(shí)代特征特別體現(xiàn)在它的生產(chǎn)方式特征上。不同時(shí)代,人相對(duì)于勞動(dòng)對(duì)象的作用方式不同,生產(chǎn)的社會(huì)目的也不同,形成農(nóng)業(yè)生產(chǎn)方式、工業(yè)生產(chǎn)方式與信息生產(chǎn)方式。大數(shù)據(jù)推動(dòng)著信息生產(chǎn)方式的形成。endprint
簡(jiǎn)言之,農(nóng)業(yè)時(shí)代的生產(chǎn)力以土地為中介,分散地從對(duì)象中解析出有助于滿足人的溫飽需求的功能;工業(yè)時(shí)代的生產(chǎn)力以貨幣為中介,集中地從對(duì)象中解析出有助于滿足人的社會(huì)發(fā)展需求的價(jià)值;信息時(shí)代的生產(chǎn)力以數(shù)據(jù)為中介,集中與分散結(jié)合地從對(duì)象中解析出有助于實(shí)現(xiàn)生產(chǎn)目的的意義。功能、價(jià)值與意義的關(guān)系,在于前者為后者的基礎(chǔ),后者有條件地決定前者。
姜奇平認(rèn)為,對(duì)人均收入5000美元以上的社會(huì)來(lái)說(shuō),大數(shù)據(jù)有助于在全社會(huì)水平專業(yè)化地提高以意義滿足(所謂“滿意”)為核心的智慧水平,推動(dòng)發(fā)展方式轉(zhuǎn)變,實(shí)現(xiàn)經(jīng)濟(jì)和社會(huì)轉(zhuǎn)型,在提高GDP水平(功能與價(jià)值水平)的同時(shí),提高社會(huì)幸福水平(意義水平)。
發(fā)展大數(shù)據(jù)的戰(zhàn)略意義
姜奇平認(rèn)為,大數(shù)據(jù)的發(fā)展會(huì)深刻改變我國(guó)社會(huì)生產(chǎn)力狀況,在此基礎(chǔ)上對(duì)社會(huì)生產(chǎn)關(guān)系及其相聯(lián)系的經(jīng)濟(jì)運(yùn)行機(jī)制產(chǎn)生影響,對(duì)推進(jìn)中國(guó)新四化建設(shè),提高國(guó)家競(jìng)爭(zhēng)力具有戰(zhàn)略意義。
托夫勒在1980年《第三次浪潮》中的一個(gè)斷言,準(zhǔn)確刻畫(huà)到大數(shù)據(jù)的時(shí)代特征:“如果說(shuō)IBM的主機(jī)拉開(kāi)了信息化革命的大幕,那么‘大數(shù)據(jù)則是第三次浪潮的華彩樂(lè)章”。可以認(rèn)為,大數(shù)據(jù)是信息時(shí)代發(fā)展到“華彩樂(lè)章”階段上的先進(jìn)生產(chǎn)力和先進(jìn)生產(chǎn)方式的代表。
我們需要從社會(huì)生產(chǎn)力引起生產(chǎn)方式變革高度,充分認(rèn)識(shí)大數(shù)據(jù)對(duì)提高國(guó)家競(jìng)爭(zhēng)力的戰(zhàn)略價(jià)值。實(shí)物的積累、貨幣的積累,曾經(jīng)成為過(guò)去時(shí)代國(guó)力的標(biāo)志。在信息時(shí)代,數(shù)據(jù)的積累、加工和利用能力將成為國(guó)力的新標(biāo)志。對(duì)于一個(gè)國(guó)家來(lái)說(shuō),發(fā)展方式轉(zhuǎn)變只有跟上生產(chǎn)方式轉(zhuǎn)變的時(shí)代步伐,才能保證在更高水平的現(xiàn)代化競(jìng)爭(zhēng)中不落伍、不挨打。而對(duì)于處在第二次浪潮與第三次浪潮之間的中國(guó)來(lái)說(shuō),大數(shù)據(jù)發(fā)展具有戰(zhàn)略緊迫性。
從國(guó)際上看,發(fā)達(dá)國(guó)家已進(jìn)入信息時(shí)代,大數(shù)據(jù)的發(fā)展意味著社會(huì)生產(chǎn)力水平質(zhì)的提升。按照信息時(shí)代的現(xiàn)代化標(biāo)準(zhǔn),中國(guó)在社會(huì)生產(chǎn)力上存在與美國(guó)等發(fā)達(dá)國(guó)家拉大距離,陷入數(shù)據(jù)鴻溝的現(xiàn)實(shí)危險(xiǎn)。雖然中國(guó)的GDP將再次回到世界第一,但應(yīng)清醒認(rèn)識(shí)到,GDP與社會(huì)生產(chǎn)力水平不可混為一談。清朝一直到1820年,GDP仍是世界第一,但社會(huì)生產(chǎn)力水平卻與英國(guó)相差一代,主要就差在生產(chǎn)方式的時(shí)代落差上。如果中國(guó)不能在大數(shù)據(jù)時(shí)代拉近與各國(guó)社會(huì)生產(chǎn)力發(fā)展水平的距離,仍然有可能落后挨打。
從國(guó)內(nèi)看,中國(guó)新四化建設(shè)正處在從“工業(yè)化不斷加快”到“工業(yè)化基本實(shí)現(xiàn)”的轉(zhuǎn)變中,同時(shí)要完成全面提高信息化水平的歷史任務(wù)。與發(fā)達(dá)國(guó)家不同,中國(guó)存在要同時(shí)發(fā)展工業(yè)時(shí)代的生產(chǎn)力與信息時(shí)代生產(chǎn)力的雙重任務(wù)。上個(gè)世紀(jì)50年代,中國(guó)曾面對(duì)同樣的形勢(shì),要同時(shí)發(fā)展農(nóng)業(yè)時(shí)代和工業(yè)時(shí)代兩種生產(chǎn)力,那時(shí)提出“工業(yè)為主導(dǎo)、農(nóng)業(yè)為基礎(chǔ)”的正確方針,促進(jìn)了社會(huì)生產(chǎn)力的跨越式發(fā)展。歷史經(jīng)驗(yàn)具有啟示借鑒意義。中國(guó)的和平發(fā)展不可能建立在低水平社會(huì)生產(chǎn)力體系之上,要認(rèn)清發(fā)展以大數(shù)據(jù)為代表的信息生產(chǎn)力的緊迫形勢(shì),從頂層建立大數(shù)據(jù)的國(guó)家戰(zhàn)略,使我國(guó)社會(huì)生產(chǎn)力狀況適應(yīng)世界民族叢林競(jìng)爭(zhēng)所要求的新的現(xiàn)代化水平,在此基礎(chǔ)上對(duì)社會(huì)生產(chǎn)關(guān)系及其相聯(lián)系的經(jīng)濟(jì)運(yùn)行機(jī)制進(jìn)行改革。堅(jiān)持信息化帶動(dòng)工業(yè)化,工業(yè)化促進(jìn)信息化,實(shí)現(xiàn)高水平現(xiàn)代化,才能充分保證中國(guó)的國(guó)際競(jìng)爭(zhēng)力。
大數(shù)據(jù)給中國(guó)發(fā)展帶來(lái)新的機(jī)遇。抓住生產(chǎn)方式轉(zhuǎn)變這一關(guān)鍵,才能解決發(fā)展方式轉(zhuǎn)變的深層次矛盾。面向未來(lái),大數(shù)據(jù)將激發(fā)巨大的內(nèi)需增量,建設(shè)比城市現(xiàn)代化水平更高的智慧城鄉(xiāng),密切政府和民眾的聯(lián)系,促進(jìn)民主與社會(huì)進(jìn)步。大數(shù)據(jù)產(chǎn)業(yè)將形成新的增長(zhǎng)點(diǎn),數(shù)據(jù)業(yè)務(wù)主營(yíng)化帶來(lái)各行各業(yè)轉(zhuǎn)型升級(jí)。我們相信,借大數(shù)據(jù)的東風(fēng),用信息生產(chǎn)力與先進(jìn)生產(chǎn)方式帶動(dòng)發(fā)展方式和經(jīng)濟(jì)運(yùn)行機(jī)制的轉(zhuǎn)變,可以為中國(guó)帶來(lái)數(shù)字紅利,提高新四化建設(shè)的現(xiàn)代化水平。
姜奇平堅(jiān)信,大數(shù)據(jù)是未來(lái)引領(lǐng)性的先進(jìn)技術(shù),它在信息技術(shù)中的地位,好比兩彈一星在各種技術(shù)中的地位,是高科技的制高點(diǎn),關(guān)系到信息強(qiáng)國(guó)的位勢(shì),值得國(guó)家下大力氣推動(dòng)。在大數(shù)據(jù)上弱,制腦權(quán)就會(huì)全面受制于人,國(guó)將不國(guó)。斯諾登事件暴露出各國(guó)在信息安全上面臨的嚴(yán)峻形勢(shì),信息的全面收集、整理、分析和深度利用將成為未來(lái)國(guó)際競(jìng)爭(zhēng)的制高點(diǎn),關(guān)系到網(wǎng)絡(luò)安全和信息化的全局,關(guān)系綜合國(guó)力。沒(méi)有大數(shù)據(jù)就沒(méi)有信息化,沒(méi)有信息化就沒(méi)有現(xiàn)代化。萬(wàn)萬(wàn)不可掉以輕心,落后就會(huì)再次挨打。endprint