作為信息領域商業(yè)巨頭,英特爾已經在大數(shù)據(jù)領域做了很多嘗試。Hadoop是英特爾現(xiàn)在的關注重點,但最終目的是提供一個大數(shù)據(jù)平臺,在平臺上提供更多的服務,最后達到“讓計算改變生活”這個愿景。
本刊記者專訪了英特爾亞太研發(fā)有限公司總經理何京翔,他認為,英特爾有著非常良好的傳統(tǒng),就是把技術 變成一種生態(tài)環(huán)境、變成一種解決方案,變成真正能夠產生出商業(yè)價值的商業(yè)模式。因此,在大數(shù)據(jù)領域,英特爾扮演的角色不僅是硬件提供商,而是致力于提供包含Hadoop等大數(shù)據(jù)分析軟件在內的、端到端大數(shù)據(jù)方案供應商。
大數(shù)據(jù)不是靈丹妙藥
《新理財》:您能否給我們暢想一下,大數(shù)據(jù)在未來幾年真正大范圍應用起來以后,將是一個什么樣的藍圖?
何京翔:其實大數(shù)據(jù)本是通過計算機技術、智能技術來改變人們生活的大的愿景的一個技術。傳統(tǒng)的數(shù)據(jù)往往是結構化,其數(shù)量往往有限。其實企業(yè)也有很多數(shù)據(jù),我們一直在說,我們是在一個信息爆炸的時代,隨著信息技術的發(fā)展,數(shù)據(jù)肯定是越來越多。
那為什么說傳統(tǒng)的數(shù)據(jù)和大數(shù)據(jù)有些不一樣的地方?第一,現(xiàn)在大量數(shù)據(jù)是非結構化的,譬如現(xiàn)在手機上微博、圖片、視頻都是非結構化的,和過去的很多關系數(shù)據(jù)庫的傳統(tǒng)數(shù)據(jù)結構是不一樣的,所以在管理上技術也不一樣;第二,是量的區(qū)別。我們曾經做過一個統(tǒng)計,在一個直轄市級別的城市,視頻監(jiān)控的數(shù)據(jù)一個季度大概在一兩百個P左右。像現(xiàn)在大多數(shù)情況下是冷數(shù)據(jù),采集完就擱在那里了,沒有去實時地去分析處理,然后過一段時間就抹掉了。這里面本身的價值就沒有被發(fā)掘出來。譬如在未來如果有實時分析的話,像恐怖分子、異常的意外事故,可能可以通過這個監(jiān)控察覺。譬如現(xiàn)在有一些算法可以分析發(fā)現(xiàn)人包分離,可以預警,當然也不是說這人一定是壞人。還有像銀行交易數(shù)據(jù)也可以分析出很多東西。
還有一些應用,可以讓人民的生活更便捷。譬如你在網(wǎng)上、手機的消費數(shù)據(jù)可以分析出你的消費習慣,然后你走在哪里,可能手機就會提醒你可能附近有你感興趣的商店。當然目前還存在一些困惑,比如隱私啊,這些數(shù)據(jù)會不會被人賣了啊之類的。新技術都是這樣,用好了可能會社會更和諧便利,用不好也可能會帶來很多問題。這就回到了一個數(shù)據(jù)安全、公信的問題。所以在今后部署這個技術的時候就應該引起注意,如何去揚長避短。
其實大數(shù)據(jù),并不是什么靈丹妙藥,就像前兩年的“云”一樣,它只是利用計算使我們的生活更現(xiàn)代化便利的過程中的一環(huán)。而且我們現(xiàn)在正好處在這個階段上,隨著我們移動互聯(lián)網(wǎng)、隨著物聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)確實是越來越多。數(shù)據(jù)的含金量確實是越來稀疏了,真正你要的信息難度越來越高了,所以需要新的手段。實時的對無結構化的數(shù)據(jù)進行安全有效的分析,這就是我們大數(shù)據(jù)面臨的一些主要問題和挑戰(zhàn)。
《新理財》:從英特爾公司來看,在大數(shù)據(jù)方面做了很多工作,具體體現(xiàn)在哪些方面?
何京翔:芯片技術是計算的基礎,但是隨著現(xiàn)在時代的不斷發(fā)展,我們本身也認識到,我們從2010年就開始重新定位我們的公司,要用計算去改變人們的生活,讓世界更美好的愿景。在這個基礎之上,我們不再是一個芯片公司而是一個計算公司。無論是從手機還是嵌入式設備到后臺的高性能計算,任何涉及到計算的,我們都應該感興趣。我們看到了物聯(lián)網(wǎng)和移動計算的發(fā)展,大數(shù)據(jù)確實是一個大家都必須關注的東西。首先涉及到數(shù)據(jù)的采集、存儲、傳輸、網(wǎng)絡,數(shù)據(jù)處理涉及到了技術問題。恰恰在這些方面,因特爾是有自己專長的。當然在這之上要有軟件。所以要看一個硬件、軟件上綜合的解決方案,優(yōu)化和打包是因特爾在這方面的優(yōu)勢?,F(xiàn)在有一些東西是開源的,但是開源的軟件估計財政部門不敢用,因為穩(wěn)定性、可靠性、可維護性都是問題。
我們已經在幾個行業(yè)做了相應的優(yōu)化。比如說電信公司的賬單分析,我們做了一些行業(yè)的獨特的優(yōu)化、像智能交通對視頻圖像分析我們做了相應的優(yōu)化,還有醫(yī)療、銀行系統(tǒng)的一些優(yōu)化,這些東西都不在開源社區(qū)里頭。所以說開源是一個基礎,但最后的優(yōu)化、打包工作是非常重要的。
談到大數(shù)據(jù)技術的應用,以電信公司為例,電信公司的客戶通訊數(shù)據(jù)產生的時候是結構化的數(shù)據(jù),但是數(shù)量太龐大了使得傳統(tǒng)的結構化數(shù)據(jù)分析方式做起來比較吃力,所以現(xiàn)在我們先把它轉成非結構化的,然后平行分析處理再寫回結構化數(shù)據(jù),最后電信公司看到的還是結構化的分析數(shù)據(jù)。通過這樣的辦法提高了很大的效率。還有像交通視頻監(jiān)控數(shù)據(jù)的實時性、即時性、批量處理等問題未來都需要更好的去解決。
我們提供一把“鏟子”
《新理財》:您覺得在大數(shù)據(jù)領域在以后會出現(xiàn)哪些商業(yè)模式?
何京翔:我覺得會有只做軟件的、也有從硬件一直做到軟件的,也有集中在某一個行業(yè)里等公司突圍出來。作為因特爾,希望形成供應鏈的關系。當然沒有不變的商業(yè)模式。
《新理財》:現(xiàn)在大家都在熱炒大數(shù)據(jù),您覺得是否存在泡沫?
何京翔:我覺得大數(shù)據(jù)跟其他技術一樣,在剛一開始炒概念的時候都有類似的現(xiàn)象,好像又是下一個改變世界的靈丹妙藥。然后再逐漸的發(fā)現(xiàn)它的局限和其間的一些問題,然后不斷去完善漸漸地成熟。很多成功的技術都走過類似的路線。
還有一個公信力的問題需要去解決,如果公信力的問題不解決,那么我們絕大多數(shù)的大數(shù)據(jù)應用愿景都不能付諸實踐。還有像政府部門不同部門之間的數(shù)據(jù)想要共享、去協(xié)同分析解決也存在類似的問題。很多問題不是大數(shù)據(jù)能解決的,大數(shù)據(jù)只是一個技術手段,當然技術的進步在某種程度上也會對非技術層面的問題形成反饋促進,它將是一個漫長的過程。
《新理財》:剛才咱們也談到政府部門的數(shù)據(jù),這應該是一個很大的金礦,但感覺目前開發(fā)利用的還是不夠充分。您怎么看待這個問題?
何京翔:這個我也不是特別了解。打個比方,我們只是提供了一把鏟子,具體在哪兒挖礦,需要很多方面的努力。像智能交通、電信行業(yè)、醫(yī)療、金融領域的可以簡單理解成露天礦,大數(shù)據(jù)在這需要分析,這個是一個相對明顯直觀的問題。但其它方面,像找石油、一些深層煤礦,是否需要和如何使用這種技術手段,這個有待進一步探討。
《新理財》:你們與各地政府部門經常有合作,在大數(shù)據(jù)領域,從公司角度考慮最希望政府部門提供什么方面的支撐?
何京翔:有幾方面吧,首先,一開始大家都本著開放和解決問題的心態(tài),我覺得這方面目前中國政府做得蠻好的,保持著很好的開放、相互學習的態(tài)度。另外一個,希望能給我們行業(yè)專業(yè)上的一些指導,能夠把我們引導到在行業(yè)里有影響力的企業(yè)去做一些合作。比如現(xiàn)在在財政系統(tǒng)里面在哪一范圍怎么去用這些技術,哪塊是金礦我們不知道,但是我們愿意去探索。還有一點,一旦有了相應的探索成果,政府如何去引導推廣、建立標準。如果在這幾方面能夠得到政府的指導和幫助,大家都是雙贏的結果。還有一點,就是安全性、公信問題如何去溝通、規(guī)范。