在最熱的IT話題中,云和大數(shù)據(jù)的簡化IT趨勢和一體化理念,早在1996年美國CommVault(康孚)公司成立之初,就被其CEO 羅伯特·漢姆(N.Robert Hammer)確定為發(fā)展方向,并在多年后的今天得到市場和業(yè)界認(rèn)可?,F(xiàn)在,CommVault常被華爾街分析師們看作惠普、戴爾等IT巨頭在軟件業(yè)務(wù)上的收購目標(biāo)。不過羅伯特·漢姆否認(rèn)了收購一說:CommVault目前市值29億美元,單股股價(jià)從最初3美分漲到65美元,漢姆認(rèn)為已經(jīng)沒有公司“買得起” CommVault了。今年年初,這家公司登上《福布斯》公布的2012年美國增長最快的25家科技公司排行榜,以3.82億美元的年銷售額和28%的年增長率位列第23。近日,羅伯特·漢姆接受《環(huán)球企業(yè)家》采訪,暢談了自己對大數(shù)據(jù)時(shí)代的思考,以及對一家系統(tǒng)軟件公司來說,如何與IBM等強(qiáng)大的競爭對手抗衡。
關(guān)于大數(shù)據(jù)
我們首先來定義一下什么是大數(shù)據(jù)。 現(xiàn)在數(shù)據(jù)從絕對量來說正在迅猛增長,每年的增速是50%;數(shù)據(jù)變化速度也非??欤鼈儊碜杂诓煌脑?。過去數(shù)據(jù)主要來自于一些應(yīng)用,但現(xiàn)在可能由機(jī)器產(chǎn)生,或者來自社交媒體,它們存在于不同的位置,比如移動設(shè)備、筆記本電腦,或者在數(shù)據(jù)中心,甚至存在云端。
從企業(yè)用戶的角度來看,如此眾多的數(shù)據(jù)分別被存儲在不同的地方,人們再去根據(jù)這些信息做出決策變得更加困難了。傳統(tǒng)的數(shù)據(jù)搜索、存儲和保護(hù)方式已經(jīng)無法應(yīng)對大數(shù)據(jù)的增長,因此這也是很多大公司、政府型組織以及電信公司在做的事情,他們必須再造這方面的引擎以滿足新需求。實(shí)際上從數(shù)據(jù)存儲、數(shù)據(jù)安全性、甚至打造更大的商業(yè)價(jià)值方面,都有這方面的需求。此外從消費(fèi)者的角度上,他們也有個人的期望值,比如以自己喜歡的方式通過智能設(shè)備去安全地訪問數(shù)據(jù)。
如果從企業(yè)的競爭力角度看待大數(shù)據(jù),他們一定要有獲取大量數(shù)據(jù)的能力。比如說從數(shù)據(jù)被創(chuàng)造的時(shí)候起,就能以實(shí)時(shí)的方式訪問這些數(shù)據(jù),并且在此之上搭建一個數(shù)據(jù)分析層。同時(shí),對已有的數(shù)據(jù)我們有時(shí)要做一個比對,從而發(fā)現(xiàn)一些趨勢;還可以綜合分析來自于不同源的數(shù)據(jù),比如有些從現(xiàn)有的數(shù)據(jù)庫中抓取,有的要從Facebook這樣的社交網(wǎng)絡(luò)上調(diào)用。舉例來說,我們研究怎樣治療某種疾病,就要調(diào)用人類基因圖譜,這樣一方面我們要到某個大學(xué)調(diào)取數(shù)據(jù),還要分析這個基因來自哪些人、他們的年齡以及其他特性等。所以這種能力概括來說就是我們能夠去定義數(shù)據(jù)、給數(shù)據(jù)打上標(biāo)簽、對它分類,在需要的時(shí)候能夠很快搜索到。
這個問題聽起來似乎很簡單,實(shí)際上解決起來卻很復(fù)雜。假設(shè)北京有一個大型圖書館,如果你想搜索有關(guān)北京天氣的信息,這里跟天氣相關(guān)的書可能有一萬本,內(nèi)容、主題都不同。最快捷的方式當(dāng)然是做一次性的搜索,把這一萬本書里相關(guān)的內(nèi)容找到。從這樣的角度來說,各種各樣的數(shù)據(jù),都要被打上合適的標(biāo)記,然后去分類,所以你可以想象一下,在世界上這樣的內(nèi)容數(shù)量是以幾十億甚至萬億來計(jì)算的。
一體化必要性
為何我們可以做到大數(shù)據(jù)業(yè)務(wù)的一體化?這可能要追溯CommVault的歷史,CommVault最初是ATT風(fēng)險(xiǎn)投資的一個公司。當(dāng)這個項(xiàng)目的負(fù)責(zé)人來咨詢我的意見時(shí),我當(dāng)時(shí)的觀點(diǎn)是這家公司要成功的機(jī)會幾乎為零:人們當(dāng)時(shí)對數(shù)據(jù)備份的概念是—我有一個數(shù)據(jù),給它做它的一個拷貝,這就是對它的備份了。
當(dāng)時(shí)的存儲就是我們所說的直連存儲,一個電腦外接一個存儲設(shè)備即可完成。當(dāng)時(shí)我就想到問題并不在備份本身,而是在數(shù)據(jù)上。我當(dāng)時(shí)啟發(fā)他們,假設(shè)數(shù)據(jù)增長100萬倍,我們擁有無限的計(jì)算資源、無限的網(wǎng)絡(luò),假設(shè)存儲是免費(fèi)的,你會怎么做呢?而當(dāng)時(shí)的一些大公司并沒有認(rèn)識到這是數(shù)據(jù)的問題,他們只是看到表面的數(shù)據(jù)的備份或者存儲技術(shù)本身。
在1998年的時(shí)候,我指導(dǎo)CommVault做了兩件事:一是打造一個架構(gòu),這個架構(gòu)能夠處理大規(guī)模的數(shù)據(jù),覆蓋幾百個數(shù)據(jù)節(jié)點(diǎn),就是我們所說的地理數(shù)據(jù)站點(diǎn);第二就是如果客戶想做數(shù)據(jù)備份、歸檔、搜索的話,無須用很多個產(chǎn)品分別做,所以我們要打造一個平臺,實(shí)現(xiàn)以上所有這些數(shù)據(jù)的功能。
這個問題理解起來并不難,但是當(dāng)著手去解決問題的時(shí)候,就有很多要考慮的因素,比如其他公司忽略的是什么?要做數(shù)據(jù),就必須對應(yīng)用有深刻了解。舉個例子,我把這個數(shù)據(jù)存在這里,當(dāng)這個數(shù)據(jù)出了問題我要恢復(fù)它的時(shí)候,如果我不知道這個數(shù)據(jù)跟應(yīng)用是什么樣的情況,計(jì)算也不清楚,網(wǎng)絡(luò)情況又不夠了解,要做數(shù)據(jù)恢復(fù)就會很難,所以實(shí)際上做數(shù)據(jù)管理的一家軟件公司必須對應(yīng)用、存儲、網(wǎng)絡(luò)、計(jì)算,以及整個的IT基礎(chǔ)設(shè)施都有非常透徹的了解。
還有一件事情,完成這些工作,還要做到所有的數(shù)據(jù)管理工作應(yīng)該是自動化的、智能化的,即把人從數(shù)據(jù)管理的業(yè)務(wù)流程中分開。所以,我們必須要明白自己到底要幫助客戶解決什么問題:保護(hù)他們的數(shù)據(jù),幫他們節(jié)約成本,節(jié)約人工。
還有一個非常關(guān)鍵的要素,我們有一個統(tǒng)一的數(shù)據(jù)管理平臺,所以能夠確保數(shù)據(jù)的安全性。不管客戶通過什么樣的位置去訪問這個數(shù)據(jù),它都是加密的,我們有統(tǒng)一數(shù)據(jù)密鑰的管理,因此,不管是云上還是本地,甚至設(shè)備端的數(shù)據(jù),我們都能做到數(shù)據(jù)的保護(hù)。很多公司的方案是,數(shù)據(jù)做一個備份,它有一個同樣數(shù)據(jù)拷貝1,同時(shí)還要做一個長期的歸檔拷貝2,同一個數(shù)據(jù)不同用途有很多拷貝,但是CommVault的思路是,我們只需要客戶把數(shù)據(jù)復(fù)制一次,同樣的副本可以用作不同的用處。
要持續(xù)的成功和創(chuàng)新不易。對CommVault來說,創(chuàng)新反映在兩個方面:第一,能夠?yàn)榭蛻魩韮r(jià)值的才叫創(chuàng)新,要么你為客戶節(jié)約成本,要么是為客戶提供更好的服務(wù)來保護(hù)他們的數(shù)據(jù),提高他們的效率;第二,就是我們通過令客戶滿意的咨詢服務(wù)不斷提升客戶與我們之間的合作粘性,同時(shí)保持我們的核心競爭力。這是我們眼中創(chuàng)新的兩個表現(xiàn)形式。此外,我們制定策略也不是只看眼下,而是看到未來的發(fā)展趨勢。我們會設(shè)定一個目標(biāo),針對目標(biāo)有一個具體的執(zhí)行方案,我們要做什么產(chǎn)品?針對哪個市場?整個結(jié)構(gòu)是如何的?我們設(shè)定的業(yè)務(wù)流程是什么?頭腦必須是非常清楚的,明白自己要做什么,以及如何去做。
CommVault1996年上市,當(dāng)時(shí)每股價(jià)格3美分,現(xiàn)在是每股65美元,公司總值29億美金,現(xiàn)在我們可以與任何一家公司去競爭,所以對我們來說,為什么要把它賣給惠普這樣的公司呢?從我們股價(jià)的增長速度來看,已經(jīng)沒有公司“買得起”了。