大衛(wèi)·芬雷布(David Feinleib)是硅谷重要的風(fēng)險投資人,他的《大數(shù)據(jù)云圖》除了一般的價值外,對透視大數(shù)據(jù)有特別的價值,這種價值突出體現(xiàn)在芬雷布的這張聞名硅谷的“大數(shù)據(jù)云圖”上?!按髷?shù)據(jù)云圖”,把整個大數(shù)據(jù)產(chǎn)業(yè),按內(nèi)在脈絡(luò)組成一整張網(wǎng)。商業(yè)人士可以把它當(dāng)作“秘籍”,從中看出有價值的投資礦脈,看熱鬧的人也可以找到快速成為內(nèi)行的導(dǎo)游圖。
與許多空泛的書不同,《大數(shù)據(jù)云圖》作者的眼光很“獨”,是那種賭石人的眼光,這跟作者在行內(nèi)的“現(xiàn)役”身份有關(guān)。這本書談了大數(shù)據(jù)的方方面面,并非在所有方面都權(quán)威,它在硅谷真正權(quán)威的地方就是這張“大數(shù)據(jù)云圖”。所以我們就從這張圖講起。
看過《智取威虎山》的人,都聽說過“聯(lián)絡(luò)圖”。“聯(lián)絡(luò)圖”把控制一個地區(qū)所需要的關(guān)鍵資源、關(guān)鍵人交代得清清楚楚,搞定了它,才能搞定各個山頭,坐擁一方天下?!按髷?shù)據(jù)云圖”就好比這張“聯(lián)絡(luò)圖”,當(dāng)然不是要讓你去當(dāng)土匪,而是讓你具備像投資人那樣的火眼金睛,從“有錢沒錢”這個專業(yè)角度,一眼看出大數(shù)據(jù)這條山脈里,哪里有礦,價值幾何,該去搞定什么。
芬雷布來北京的時候,我還沒有太理解他的思路。后來我為了搞清楚這張“聯(lián)絡(luò)圖”的門道,專門跑了趟美國硅谷,與芬雷布當(dāng)面交流。現(xiàn)在根據(jù)他給我的解答,我來談?wù)剬@張神秘的“聯(lián)絡(luò)圖”的理解。大數(shù)據(jù)云圖在網(wǎng)上是隨時更新的,我們下面的介紹以2013年4月的版本為準(zhǔn)。
從“大數(shù)據(jù)云圖”這個視角看大數(shù)據(jù),首先對大數(shù)據(jù)背景的看法就有自己鮮明的特色,從院士、學(xué)者或?qū)嶒炇医嵌瓤?,Hadoop算什么東西?它不過是走向靈圖解的一個過客。但這種看法需要至少15年以上的視野。而作為投資人,芬雷布堅持把Hadoop當(dāng)作主脈這樣一種簡明的觀點。因為正如當(dāng)年溫世仁跟李嵐清說的,對商人來說,要改變世界,十年足夠了。十年還不能改變世界的東西,商人根本不會理會。人工智能也許要搞一千年以上,但VC必須得把握十年以內(nèi)改變世界的東西,Hadoop足夠了。為此,芬雷布把投資目光主要聚焦在為開源技術(shù)提供商業(yè)支持的公司(如Cloudera、DataStax、LucidWork之類)身上。以改變世界的尺度來認(rèn)識世界,這是實干家與理論家的不同。
其次,芬雷布建立了一個他稱之為“基礎(chǔ)設(shè)施”的基本板塊,來把握大數(shù)據(jù)產(chǎn)業(yè)的“資產(chǎn)”層面的諸要素,包括四個展開環(huán)節(jié)——數(shù)據(jù)分析(Cloudera、EMC等)、數(shù)據(jù)操作(couchbase、10gen等)、數(shù)據(jù)服務(wù)(亞馬遜、谷歌等)、結(jié)構(gòu)化數(shù)據(jù)庫(Oracle、IBM的DB2、SYBASE等)。在我看來,這是指為整個大數(shù)據(jù)產(chǎn)業(yè)分享固定成本的承重部分。
在這一部分,芬雷布的眼光非?!岸尽保c實驗室看法不同,非常早看出服務(wù)潮流的轉(zhuǎn)變,體現(xiàn)在對亞馬遜將坐大的預(yù)見上。事實證明了他的預(yù)見。據(jù)Synergy報告顯示,2013年第三季度,亞馬遜獲取了美國云計算市場總收入25億中的多數(shù)份額,本身收入提升55%。Synergy估計,亞馬遜第四季度云計算收入將達(dá)7億美元,比微軟、IBM、谷歌、Salesforce.com的總和還高出15%。芬雷布在幾年前就預(yù)見到,亞馬遜將主要贏在用WEB服務(wù)卡位(AWS)上,這與云的方向是一致的。中國搞大數(shù)據(jù),許多還是IP時代的眼光,而非WEB時代的眼光,這點需要注意。阿里在往安卓的結(jié)構(gòu)里面嵌入WEB框架,對谷歌搞“修正主義”,說明也看到了同樣方向的問題。
芬雷布第二個跟實驗室眼光不同的地方,表現(xiàn)在對商業(yè)的理解上。他很好解釋了Cloudera將走強(qiáng)的原因。在芬雷布看來,Cloudera只集中解決了一個問題,就是實時問題。對科學(xué)家來說,大數(shù)據(jù)用多長時間出分析結(jié)果,不是主要問題,但對客戶來說就不同,Cloudera Impala幫助其他公司運(yùn)行Hadoop,關(guān)鍵是把靈敏作為一種結(jié)果,提交給客戶。以Cloudera現(xiàn)在的規(guī)模,隨便一個中國上市公司都可以收購它,但有沒有這眼光是另一回事。
第三,“大數(shù)據(jù)云圖”最出彩的部分是基礎(chǔ)設(shè)施之上的“應(yīng)用程序”板塊。事實上,VC對基礎(chǔ)設(shè)施部分,只投了很少的錢(5億美元),而把重心全押在了應(yīng)用上。這與中國大數(shù)據(jù)的做法形成鮮明對照。如果拿芬雷布的“聯(lián)絡(luò)圖”對照中國,中國的大數(shù)據(jù)許多都在“不務(wù)正業(yè)”,將來可能騙到國家的錢、圈到國家的地,但長出什么來,不好說。讓我們來看看真搞市場經(jīng)濟(jì),讓大數(shù)據(jù)落地,應(yīng)該怎么搞。
芬雷布稱之為“應(yīng)用程序”的板塊是指“人類和計算機(jī)系統(tǒng)通過使用這些程序,從數(shù)據(jù)中獲知關(guān)鍵信息”。但實際上,它對應(yīng)的是整個大數(shù)據(jù)產(chǎn)業(yè)的相當(dāng)于邊際成本的部分,在云計算背景下,它是指面向云端輕資產(chǎn)運(yùn)作的部分,即按“使用”(“按需”是另一角度的說法)收費(fèi)的部分。
“應(yīng)用程序”板塊的框架結(jié)構(gòu),由六部分組成,分別是垂直業(yè)務(wù)(BloomReach等),運(yùn)營智能(New Relic、Splunk等),廣告/媒體(Collective、DataXu、Metamarkets等),數(shù)據(jù)即服務(wù),商業(yè)智能,數(shù)據(jù)分析和可視化。
讓我們來看,是一些什么樣的公司活躍在這些應(yīng)用領(lǐng)域。
在垂直業(yè)務(wù)應(yīng)用領(lǐng)域,像BloomReach這樣的公司,幫助電子商務(wù)企業(yè)優(yōu)化網(wǎng)站,進(jìn)行大數(shù)據(jù)營銷服務(wù),以提高轉(zhuǎn)化率。
在運(yùn)營智能應(yīng)用領(lǐng)域,New Relic將營銷自動化,幫助商家分析哪些客戶最有價值,特別是什么活動最有可能扭轉(zhuǎn)不利局面,Splunk公司幫助IT工程師分析設(shè)備生成的日志數(shù)據(jù)。
在廣告應(yīng)用領(lǐng)域,應(yīng)用服務(wù)企業(yè)幫助商家算出哪種廣告最適合顧客,產(chǎn)生特定的廣告印象需要花多少錢,近來為移動廣告進(jìn)行分析的公司,如Flurry,最具增長潛力。
在數(shù)據(jù)即服務(wù)應(yīng)用領(lǐng)域,鄧白氏公司在為各種數(shù)據(jù)提供網(wǎng)絡(luò)編程接口,值得注意的是,與原有做法(例如阿里的某些作法)不同,這樣的數(shù)據(jù)源允許他人在其基礎(chǔ)上建立APP程序。
在商業(yè)智能應(yīng)用領(lǐng)域,IBM的Watson是開拓和領(lǐng)導(dǎo)者(我們以前介紹過),MicroStregy和Domo的特點在把智能應(yīng)用引向新的領(lǐng)域,前者是在移動產(chǎn)品上,后者是在云計算上。需要注意的是,與傳統(tǒng)集中于企業(yè)首腦部門的BI不同,大數(shù)據(jù)的BI最終將武裝到企業(yè)的神經(jīng)末梢,特別是直接接觸客戶的部門。
在數(shù)據(jù)分析和可視化應(yīng)用領(lǐng)域,Tableau Software提供了互動性強(qiáng)且易于使用的大數(shù)據(jù)可視化軟件服務(wù),QlikTech推出了用26000家企業(yè)使用的QlikView可視化產(chǎn)品。這一領(lǐng)域目前非?;钴S,社交協(xié)作功能加入數(shù)據(jù)分析和可視化服務(wù)看來是一種趨勢。
總的來說,芬雷布對大數(shù)據(jù)產(chǎn)業(yè)前景的展望,特別強(qiáng)調(diào)應(yīng)用,“期待更多的大數(shù)據(jù)應(yīng)用程序涌現(xiàn),讓消費(fèi)者和企業(yè)將數(shù)據(jù)應(yīng)用到工作當(dāng)中”。而在基礎(chǔ)設(shè)施方面,則會籠罩在亞馬遜的陰影里,新手只能從不受它影響的領(lǐng)域中冒出。
與美國的情況相比,我認(rèn)為中國發(fā)展大數(shù)據(jù)產(chǎn)業(yè),有幾個問題需要從芬雷布的判斷中得到重要啟示:第一,要深入認(rèn)識大數(shù)據(jù)產(chǎn)業(yè)分工的規(guī)律。大數(shù)據(jù)的產(chǎn)業(yè)框架與云計算有內(nèi)在聯(lián)系,不能離開云計算發(fā)展大數(shù)據(jù)。中國當(dāng)前大數(shù)據(jù)發(fā)展遇到落地難,這是表象,深層問題是沒有理解基礎(chǔ)設(shè)施與應(yīng)用之間,是一種基于云計算的固定投入與邊際投入大分工的關(guān)系。第二,在基礎(chǔ)設(shè)施方面,中國一些主要企業(yè)數(shù)據(jù)不開放的做法,放在全球看,正在過時。之所以不開放,根子還在對第一個問題的理解上。適應(yīng)云計算的做法,要求大數(shù)據(jù)基礎(chǔ)設(shè)施的建設(shè)思路盡早從IP思路,轉(zhuǎn)向WEB思路。WEB只能是開放的。亞馬遜雖然強(qiáng),但在移動大數(shù)據(jù)方向上,中國有充分的創(chuàng)新空間。第三,在應(yīng)用服務(wù)方面,要特別向美國企業(yè)學(xué)習(xí)。適應(yīng)云計算的做法,是使大數(shù)據(jù)應(yīng)用面向輕資產(chǎn)服務(wù)?,F(xiàn)在國內(nèi)大數(shù)據(jù)應(yīng)用有一個不好的苗頭,就是企業(yè)做著做著,變成傳統(tǒng)BI的大數(shù)據(jù),進(jìn)而走向封閉、集中,這沒有把大數(shù)據(jù)應(yīng)用的真正優(yōu)勢發(fā)揮出來。大數(shù)據(jù)應(yīng)用一定要實現(xiàn)面向最終需求的全員智能,做不到都是假的。