□劉潔
(1.天津財(cái)經(jīng)大學(xué)天津3002222.中國建設(shè)銀行股份有限公司唐山分公司)
當(dāng)今環(huán)境下對(duì)大數(shù)據(jù)的引導(dǎo)與管理
□劉潔
(1.天津財(cái)經(jīng)大學(xué)天津3002222.中國建設(shè)銀行股份有限公司唐山分公司)
大數(shù)據(jù)如同顯微鏡一樣凸顯出經(jīng)濟(jì)運(yùn)行中極其微小的細(xì)節(jié),特別是社交網(wǎng)絡(luò)和互聯(lián)網(wǎng)公司收集的數(shù)據(jù)呈現(xiàn)出很強(qiáng)的身份特征,通過將這些數(shù)據(jù)與客戶個(gè)人信息相結(jié)合,可以生成一系列關(guān)于客戶可能需求的“推測數(shù)據(jù)”。
大數(shù)據(jù)曰引導(dǎo)曰管理
我們正在經(jīng)歷一場由大數(shù)據(jù)引發(fā)的社會(huì)革命。人類生活中的一切活動(dòng),每次購買,每次對(duì)話,每次社交,每次移動(dòng),甚至我們的身份和身體的變化都成為信息收集、存儲(chǔ)、分析和使用的對(duì)象。多樣化的數(shù)據(jù)、巨大的數(shù)據(jù)量以及它們潛在的商業(yè)價(jià)值已經(jīng)開始對(duì)社會(huì)經(jīng)濟(jì)和公民隱私產(chǎn)生深遠(yuǎn)的影響。
當(dāng)大數(shù)據(jù)快速向社會(huì)的各個(gè)方面滲透時(shí),政府與公民、政府與企業(yè)、政府與政府之間的關(guān)系正在發(fā)生變化。如同任何一種新科學(xué)(如核物理)出現(xiàn)一樣,政策會(huì)對(duì)這門科學(xué)的應(yīng)用產(chǎn)生深遠(yuǎn)的影響??茖W(xué)既能造福人類也可能危害人類,大數(shù)據(jù)也不例外。有遠(yuǎn)見的國家戰(zhàn)略和政策一定是在保護(hù)公民隱私權(quán)的前提下,加速數(shù)據(jù)信息的自由流動(dòng),鼓勵(lì)創(chuàng)新,催生新產(chǎn)業(yè),創(chuàng)造新就業(yè),進(jìn)而促進(jìn)國家的經(jīng)濟(jì)繁榮。
1出臺(tái)推動(dòng)大數(shù)據(jù)產(chǎn)業(yè)鏈的導(dǎo)向性政策
今天數(shù)據(jù)積累的速度遠(yuǎn)遠(yuǎn)超過數(shù)據(jù)能被處理和被利用的速度。2013年全球產(chǎn)生的數(shù)據(jù)中約22%有可能被用作分析,但結(jié)果只有5%實(shí)際被分析利用。預(yù)計(jì)到2017年,全球又會(huì)積累超過4倍于今天的數(shù)據(jù)量。這必然導(dǎo)致存儲(chǔ)設(shè)備、數(shù)據(jù)中心和電力消耗的快速膨脹。絕大部分?jǐn)?shù)據(jù)在分立分治的系統(tǒng)中快速堆積,這些數(shù)據(jù)互不相識(shí)互不來往,除了消耗資源,尚未產(chǎn)生任何價(jià)值。
在我們剛剛步入大數(shù)據(jù)社會(huì)時(shí),不妨做一些前瞻性思考。從使用層面考慮引進(jìn)培養(yǎng)什么樣的人才和訓(xùn)練什么技能,以及在更廣義的范疇考慮如何形成大數(shù)據(jù)思維和文化,大數(shù)據(jù)將會(huì)對(duì)未來企業(yè)與人、政府與人的關(guān)系有何影響,等等。
2大數(shù)據(jù)社會(huì)要求人們學(xué)會(huì)用一種全新的方式打量這個(gè)世界,工具、技術(shù)、技能和人才缺一不可。要及早部署和投資在以下方面:
2.1數(shù)據(jù)分析工具和軟件平臺(tái):
人工智能(AI)技術(shù),自然語言處理、模式識(shí)別、機(jī)器學(xué)習(xí)、預(yù)測分析、數(shù)據(jù)熔煉、信號(hào)處理和元數(shù)據(jù)管理,等等;大數(shù)據(jù)要求同時(shí)在數(shù)十?dāng)?shù)百甚至數(shù)千臺(tái)服務(wù)器中進(jìn)行大規(guī)模并行運(yùn)算,目前使用的大多數(shù)關(guān)系數(shù)據(jù)庫管理系統(tǒng)、桌面數(shù)據(jù)庫和可視化軟件包已很難滿足需求,因此仍須關(guān)注MPP數(shù)據(jù)庫、分布式文件及分布式數(shù)據(jù)庫的發(fā)展。
2.2數(shù)據(jù)分析人才和算法模型:
培養(yǎng)訓(xùn)練會(huì)使用大數(shù)據(jù)分析語言工具的人才只是整個(gè)需求的表層。再深入一層,要讓大數(shù)據(jù)發(fā)揮作用,跨行業(yè)顧問、分析師和有行業(yè)經(jīng)驗(yàn)的編程人員缺一不可。融合技術(shù)和藝術(shù),能將“抽象”概念形象化的語言、工具及人才尚不多見。沒有數(shù)學(xué)模型很難想象數(shù)據(jù)如何“大”起來,數(shù)據(jù)只有通過算法模型才能被電腦解讀,但數(shù)學(xué)模型在政治、社會(huì)和金融等領(lǐng)域只能逼近現(xiàn)實(shí)而無法再現(xiàn)現(xiàn)實(shí)。所以如何建立能精準(zhǔn)模擬世間萬物的數(shù)學(xué)模型,是集理論研究與應(yīng)用開發(fā)為一體的重要地帶。
3把數(shù)據(jù)質(zhì)量的管控權(quán)交給使用端
當(dāng)人類讓數(shù)字講話、把決策權(quán)更多移交給“大數(shù)據(jù)”時(shí),第一個(gè)重要問題就是數(shù)據(jù)的質(zhì)量。“垃圾進(jìn)、垃圾出”這句話早在50年前就被用來描述自動(dòng)化處理數(shù)據(jù)時(shí)的質(zhì)量問題,此話今天依然有效。
進(jìn)入大數(shù)據(jù)時(shí)代,一個(gè)“大”字很容易掩蓋一切,我們可用的數(shù)據(jù)越來越多樣化,但其中大部分的數(shù)據(jù)是使用者在只知其來源不知其如何產(chǎn)生、質(zhì)量被如何管控的情況下被使用的。因此,要想讓人們信賴基于大數(shù)據(jù)的決策,對(duì)所有數(shù)據(jù)源提前測試和試驗(yàn)便必不可少。不管數(shù)據(jù)是大是小,真實(shí)可靠最重要。只有逼真的模型、精準(zhǔn)的分析,才能體現(xiàn)大數(shù)據(jù)的價(jià)值。過去沒有數(shù)據(jù)是瞎子摸象,現(xiàn)在數(shù)據(jù)太多是大海撈針。大數(shù)據(jù)分析的結(jié)果常常能幫助人們回答“是什么”而不是“為什么”。膚淺地使用大數(shù)據(jù),有可能引導(dǎo)人們止步于探究事件背后的深層原因,滿足于了解現(xiàn)象之間的聯(lián)系并利用這種聯(lián)系得出似對(duì)非對(duì)的解讀。
在可預(yù)見的未來,我們面臨諸多挑戰(zhàn):技術(shù)挑戰(zhàn)會(huì)出現(xiàn)在從信息搜索、數(shù)據(jù)捕捉、存儲(chǔ)、傳輸、共享、分析直到可視化全過程。法律層面,更開放的網(wǎng)絡(luò)會(huì)帶來更多的數(shù)據(jù)竊用、濫用和非法監(jiān)控。一旦強(qiáng)大的新型數(shù)學(xué)數(shù)據(jù)工具出現(xiàn),如何控制它不至于作惡?大數(shù)據(jù)技術(shù)日新月異,由大數(shù)據(jù)、深度學(xué)習(xí)引發(fā)的新一輪人工智能技術(shù)會(huì)對(duì)人類未來造成什么樣的沖擊,是擺在科學(xué)和社會(huì)學(xué)者面前的另一個(gè)重大課題。
1004-7026(2015)05-0109-02中國圖書分類號(hào):C36
A
劉潔天津財(cái)經(jīng)大學(xué),2013級(jí),MBA。