許銳
《孫子兵法·用間篇》說:“明君賢將,所以動而勝人,成功出于眾者,先知也?!薄跋戎边@一用兵之道,強調(diào)只有預(yù)先了解情況,掌握信息,進行科學(xué)分析,運籌計算,才能做出正確的情況判斷,勝負預(yù)測和定下決心,再通過主觀努力去爭取勝利。這也正符合了大數(shù)據(jù)的特性。
美國大數(shù)據(jù)研究學(xué)者表示,如今是大數(shù)據(jù)大行其道的世界,大數(shù)據(jù)可以帶來巨大的成就,在軍事、經(jīng)濟及其他領(lǐng)域中,決策將日益基于數(shù)據(jù)和分析而做出,而并非基于經(jīng)驗和直覺。正如《孫子兵法》所說:“知彼知己,百戰(zhàn)不殆”。所謂知者,乃數(shù)據(jù)也,數(shù)據(jù)要“未卜先知”。在大數(shù)據(jù)時代,“知彼知己”、“未卜先知”能夠更加容易地實現(xiàn)。
白宮里的大數(shù)據(jù)戰(zhàn)略
如今,美國已進入“大數(shù)據(jù)”時代。“大數(shù)據(jù)”對信息爆炸時代的嶄新描述,它的基本單位是“太”(TB),而1000個“太”則等于一“拍”(PB)。這個單位有多大?舉個例子,美國國會圖書館是世界上最大的圖書館之一,它所有印刷品的信息量加起來只有15太,而全美國僅在2010年一年的新增數(shù)據(jù)量就足足有3500拍,這比13億中國人人手一本1500頁的書加起來的信息量還要大。
奧巴馬政府意識到大數(shù)據(jù)技術(shù)的重要性,將其視為“未來的新石油”。2012年3月,奧巴馬政府在白宮網(wǎng)站發(fā)布了《大數(shù)據(jù)研究和發(fā)展倡議》。2012年5月,美國數(shù)字政府戰(zhàn)略發(fā)布,更是提出要通過協(xié)調(diào)化的方式,以信息和客戶為中心,改變聯(lián)邦政府工作方式,為美國民眾提供更優(yōu)的公共服務(wù)。其中關(guān)鍵,就是政府必須保證美國民眾可以隨時隨地通過任何平臺或設(shè)備獲取政府信息和公共服務(wù)。美國國家科學(xué)基金會、國家衛(wèi)生研究院、國防部、能源部、國防部高級研究局、地質(zhì)勘探局等六個聯(lián)邦部門和機構(gòu)承諾,將投入超過2億美元資金用于研發(fā)“從海量數(shù)據(jù)信息中獲取知識所必需的工具和技能”。
美國最重要的數(shù)據(jù)開放平臺就是奧巴馬政府在2009年推出的Data.gov,Data.gov也是美國“開放政府”承諾的關(guān)鍵部分。依照原始、地理數(shù)據(jù)和數(shù)據(jù)工具三個門類,涵蓋了農(nóng)業(yè)、 氣象、金融、就業(yè)、人口統(tǒng)計、教育、醫(yī)療、交通、能源等大約50個門類,匯集了“從家庭和企業(yè)能耗趨勢分析到全球?qū)崟r地震通知等,甚至還可以查詢從好奇號火星漫步者發(fā)回來的數(shù)據(jù)中得知火星的天氣情況”。
為了確保美國民眾能方便快捷地找到政府服務(wù)欄目,美國在各聯(lián)邦政府層面實施了“數(shù)字分析項目”,“這是政府IT部門第一次摸清公眾都在網(wǎng)站上尋找什么信息、在哪里尋找這些信息,以及他們是否能夠順利找到信息等情況?!闭甀T部門還對聯(lián)邦政府網(wǎng)站在移動設(shè)備上的使用進行了優(yōu)化,并開發(fā)了移動應(yīng)用程序,確保美國公民隨時、隨地,通過任何設(shè)備都能獲取政府信息。
大數(shù)據(jù)戰(zhàn)略在企業(yè)
除了政府,美國企業(yè)也同樣擁有對于數(shù)據(jù)重視和應(yīng)用的歷史傳統(tǒng)。
早在大數(shù)據(jù)概念火熱起來之前,美國信息技術(shù)產(chǎn)業(yè)在大數(shù)據(jù)產(chǎn)業(yè)已經(jīng)有了很多技術(shù)積累,這使得美國的大型信息技術(shù)企業(yè)可以迅速轉(zhuǎn)型為大數(shù)據(jù)企業(yè)。有的企業(yè)自身是大數(shù)據(jù)技術(shù)的推出者,谷歌就是典型代表。大數(shù)據(jù)核心技術(shù)Hadoop是雅虎員工Doug Cutting根據(jù)谷歌2003年發(fā)布的學(xué)術(shù)論文研究而來。有的企業(yè)則通過收購業(yè)內(nèi)已經(jīng)存在的大數(shù)據(jù)企業(yè)來建立大數(shù)據(jù)業(yè)務(wù),典型代表是IBM。自2005年以來,IBM出資160億美元收購了超過30家大數(shù)據(jù)企業(yè)。大數(shù)據(jù)不同于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),而是充斥了非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),美國在結(jié)構(gòu)化數(shù)據(jù)庫領(lǐng)域有數(shù)據(jù)庫行業(yè)的領(lǐng)頭羊甲骨文公司,但甲骨文公司也推出了大數(shù)據(jù)業(yè)務(wù)。甲骨文公司成為了業(yè)界首個以全面、軟硬件集成的產(chǎn)品滿足企業(yè)關(guān)鍵大數(shù)據(jù)需求的公司。它可幫助客戶進一步提高效率、簡化管理并洞察數(shù)據(jù)的內(nèi)在本質(zhì),從而最大限度地挖掘數(shù)據(jù)的商業(yè)價值。
不僅如此,全球最大的芯片企業(yè)英特爾也進入大數(shù)據(jù)產(chǎn)業(yè),而全球最大的PC廠商惠普也在精簡PC業(yè)務(wù),2011年斥資110億美元收購英國大數(shù)據(jù)企業(yè)Autonomy公司,進入大數(shù)據(jù)業(yè)務(wù)。美國信息技術(shù)產(chǎn)業(yè)的大企業(yè),從軟件企業(yè)到硬件企業(yè),從門戶網(wǎng)站企業(yè)到社交網(wǎng)絡(luò)企業(yè),紛紛介入大數(shù)據(jù)。因此,大型信息技術(shù)企業(yè)順應(yīng)時代潮流,轉(zhuǎn)型升級為大數(shù)據(jù)企業(yè),是美國發(fā)展大數(shù)據(jù)產(chǎn)業(yè)的重要推動力。美國一些大型公司已經(jīng)開始贊助大數(shù)據(jù)相關(guān)的競賽,并且在為高等院校的大數(shù)據(jù)研究提供資金。
如果說信息技術(shù)企業(yè)能迅速地走上大數(shù)據(jù)的發(fā)展道路屬于“理所應(yīng)當”,那么,制造業(yè)企業(yè)與零售企業(yè)也同樣注重大數(shù)據(jù),就足以令人驚訝了。美國通用汽車衛(wèi)星導(dǎo)航服務(wù),提供司機和遠程車輛診斷和響應(yīng)緊急情況管理,每年已經(jīng)開始處理多達3PB的數(shù)據(jù)。全球最大的零售商美國沃爾瑪公司建立了一個全新的數(shù)據(jù)中心,它的存儲能力竟然高達4PB以上,已經(jīng)超過了4096TB,是一個真正的天文數(shù)字。
美國著名政治評論家、大數(shù)據(jù)領(lǐng)域的超人Nate Silver作了一場有關(guān)大數(shù)據(jù)的演講,他告訴創(chuàng)業(yè)公司去尋找那些和大數(shù)據(jù)相關(guān)、容易出成果的領(lǐng)域?!皩ふ夷切┠阌袛?shù)據(jù)可用、但卻從沒有人拿這些數(shù)據(jù)進行過分析的領(lǐng)域,這樣競爭更小,你也更容易成功。”