邢帆
進(jìn)入大數(shù)據(jù)時代,數(shù)據(jù)信息的作用遠(yuǎn)不止步于銀行與電信業(yè)的業(yè)務(wù)發(fā)展中,政府行業(yè)對于數(shù)據(jù)的使用與價值的開發(fā)正逐漸實(shí)現(xiàn)著數(shù)據(jù)的更深層次價值。從人口普查到總統(tǒng)選舉,數(shù)據(jù)的大作為正以迅猛的速度滲透到各個行業(yè)。
數(shù)據(jù)的正能量
大數(shù)據(jù)被用來描述信息爆炸所產(chǎn)生的海量數(shù)據(jù)。Jim Gray的新摩爾定理認(rèn)為,每18個月全球新增的信息量是計(jì)算機(jī)有史以來全部信息量的總和。截至2010年,人類擁有的信息總量大約是1.2ZB(1ZB等于1萬億GB)。IDC預(yù)計(jì),到2020年,世界上的數(shù)據(jù)存儲總量將達(dá)35ZB。數(shù)據(jù)之所以增長如此之快,源于各類傳感器、智能終端的劇增。而高清晰圖像和視頻,更使得數(shù)據(jù)呈指數(shù)級增長。如何收集、管理和分析數(shù)據(jù)日益成為信息通信技術(shù)創(chuàng)新的重中之重。
對此,工信部信息化推進(jìn)司副司長董寶青曾表示,要積極看待大數(shù)據(jù)熱潮。大數(shù)據(jù)的興起,不完全源于信息技術(shù)變革到了一個多么了不起的高度,而源于一國政府、企業(yè)、國民的信息化應(yīng)用和創(chuàng)新思維到了一個嶄新的高度。大數(shù)據(jù)的本質(zhì)是對信息資源、知識資源、智慧資源開發(fā)利用的高度重視與創(chuàng)新。而我國在中辦、國辦34號文件里已經(jīng)深刻闡述過這一理念,現(xiàn)在需要更加積極地去推動。
有資料顯示,在發(fā)達(dá)國家,制造業(yè)、銀行業(yè)、消費(fèi)營銷行業(yè)等較早進(jìn)入大數(shù)據(jù)時代,各類顧客點(diǎn)擊、瀏覽、反饋和交易記錄,都構(gòu)成了大數(shù)據(jù)的基礎(chǔ)。百度目前數(shù)據(jù)總量接近1000PB,存儲的網(wǎng)頁數(shù)量接近10000億,每天還會對這些數(shù)據(jù)進(jìn)行更新,響應(yīng)用戶的請求也是幾十億次。通用電氣正投資15億美元建設(shè)全球軟件和分析中心,擬雇傭400名數(shù)據(jù)科學(xué)家,協(xié)調(diào)全球1萬名軟件工程師通過共同的平臺工作。IBM商業(yè)價值研究院和牛津大學(xué)商學(xué)院對全球數(shù)千名企業(yè)高管的調(diào)查顯示,有63%的企業(yè)管理者希望大數(shù)據(jù)技術(shù)能與企業(yè)運(yùn)營管理實(shí)踐相結(jié)合,形成企業(yè)新的核心優(yōu)勢,28%的受訪者所在企業(yè)已經(jīng)開始試點(diǎn)部署大數(shù)據(jù)。
正如我們所看到的,數(shù)據(jù)的力量已經(jīng)不再止步于金融和電信這些傳統(tǒng)的“數(shù)據(jù)大戶”,政府行業(yè)正逐漸向著服務(wù)的標(biāo)準(zhǔn)靠近,數(shù)據(jù)對政府部門的作用正在逐漸擴(kuò)大。
2008年,奧巴馬利用網(wǎng)絡(luò)力量當(dāng)選美國總統(tǒng),被譽(yù)為首位“網(wǎng)絡(luò)總統(tǒng)”。而就在不久前,奧巴馬再次借助超強(qiáng)的“大數(shù)據(jù)”能力成功連任,其背后幾十人的數(shù)據(jù)分析與挖掘團(tuán)隊(duì)也浮出水面。它幫助奧巴馬在獲取有效選民、投放廣告、募集資金方面起到了不可忽視的作用。
中國聯(lián)通研究院副院長童曉渝認(rèn)為,無論從獲取、存儲、處理和服務(wù)哪個環(huán)節(jié)看,大數(shù)據(jù)產(chǎn)業(yè)都正在快速形成。要推動其發(fā)展,應(yīng)從戰(zhàn)略的高度去做好頂層設(shè)計(jì)和行業(yè)的發(fā)展規(guī)劃,標(biāo)準(zhǔn)規(guī)范,示范工程,還要前瞻性地完善制度建設(shè),用法律法規(guī)來保證大數(shù)據(jù)的公共性、真實(shí)性、安全性和隱私保護(hù)等。
從挑戰(zhàn)到機(jī)遇
為了從數(shù)據(jù)中獲得有價值的信息,做出更快更好的決策,企業(yè)對信息解決方案、服務(wù)和資源的投資所產(chǎn)生的價值成為信息回報。由結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、以及半結(jié)構(gòu)化數(shù)據(jù)組成的大數(shù)據(jù),是企業(yè)當(dāng)前面臨的挑戰(zhàn)。同時非結(jié)構(gòu)化數(shù)據(jù)在未來的增速將是結(jié)構(gòu)化數(shù)據(jù)的3倍。社交媒體、移動互聯(lián)網(wǎng)將構(gòu)成大數(shù)據(jù)重要的部分。
面對數(shù)據(jù),想讓其從挑戰(zhàn)變成機(jī)遇,首先在不同的行業(yè)里要了解如何在產(chǎn)生大數(shù)據(jù)的時候去分析用戶的商業(yè)價值,我們要了解它管理信息的戰(zhàn)略。當(dāng)然也要了解整體數(shù)據(jù),到底是從什么系統(tǒng)來,做什么用,最后和哪些客戶有關(guān)系,目前處理的,大部分還是跟內(nèi)部的系統(tǒng)有關(guān)系。另一方面,這些數(shù)據(jù)即使幾個PB、幾十個PB也都是小部分,這些數(shù)據(jù)的質(zhì)量到底如何?如何讓幾天獲得的信息在幾秒鐘之內(nèi)達(dá)到更高的質(zhì)量?數(shù)據(jù)從哪里來?意味著什么?以及通過績效管理和在不同的行業(yè)里去分析數(shù)據(jù)產(chǎn)生的同時,做財(cái)務(wù)相關(guān)的分析、人力相關(guān)的分析,供應(yīng)量相關(guān)的分析,比如核心銀行的客戶系統(tǒng)的分析,電信網(wǎng)絡(luò)的分析,BSS系統(tǒng)的分析等。
其次,企業(yè)需要面對的最大的挑戰(zhàn)就是數(shù)據(jù)的競爭。數(shù)據(jù)已經(jīng)成為了現(xiàn)在生產(chǎn)過程中的基本要素和資產(chǎn)。數(shù)據(jù)如何競爭?投資回報率如何建立?數(shù)據(jù)投資回報是數(shù)據(jù)價值除以數(shù)據(jù)成本,第一,需要降低數(shù)據(jù)成本,提升數(shù)據(jù)價值。而降低數(shù)據(jù)成本有很多做法,其中最重要的就是把低活躍度的數(shù)據(jù)轉(zhuǎn)移到低成本的存貯器上去。怎樣增加數(shù)據(jù)的價值呢?要收集更多、更全面的數(shù)據(jù),比如說社交化ERP。第二,要針對數(shù)據(jù)質(zhì)量有一個數(shù)據(jù)治理的隊(duì)伍和流程。第三,要有很好的數(shù)據(jù)分析的能力,“數(shù)據(jù)可視化”是當(dāng)前的大趨勢,通過圖形、圖像、動畫等等一同展示數(shù)據(jù),讓數(shù)據(jù)淺層的關(guān)系得到更好的理解和發(fā)現(xiàn)。
農(nóng)夫山泉首席信息官胡健說:“運(yùn)用內(nèi)存數(shù)據(jù)庫平臺進(jìn)行實(shí)時海量數(shù)據(jù)處理,運(yùn)費(fèi)報表從原來的24小時縮短到只需3.6秒即可生成,速度提升了兩萬多倍,促進(jìn)業(yè)務(wù)優(yōu)化,擺脫了傳統(tǒng)的IT維護(hù)和數(shù)據(jù)滯后的問題,整個生產(chǎn)環(huán)境呈現(xiàn)出更順暢的運(yùn)營、更準(zhǔn)確的數(shù)據(jù)和更高效的性能,大幅提升我們應(yīng)對市場變化的能力。消費(fèi)品行業(yè)競爭激烈,但只要我們比人家快一步,我們就可以占得先機(jī),就可以占領(lǐng)市場?!比毡救閳笾晔綍?,生物信息和基因組分析方面的專家建立了一個實(shí)時的分析數(shù)據(jù)庫平臺,通過采用復(fù)雜的、迭代算法,并使用Hadoop進(jìn)行基因組序列預(yù)處理,成功地把基因組分析的時間從以數(shù)天縮短到幾分鐘。
諸如此類,大數(shù)據(jù)對于企業(yè)能夠創(chuàng)造出多大的價值是不能夠給出定論的。數(shù)據(jù)的價值也并不在于挖掘與分析,而是從收集和存儲就已開始。運(yùn)營商想要從中獲益就必須高度重視大數(shù)據(jù)時代的網(wǎng)絡(luò)建設(shè),還要對寬帶網(wǎng)絡(luò)進(jìn)行智慧管理。金融行業(yè)則需盡快完善其在安全領(lǐng)域受到的注目,利用能多信息實(shí)現(xiàn)信息增值。而在政治領(lǐng)域,服務(wù)型社會中,數(shù)據(jù)將“大”有作為。