□黃先超
試論大數(shù)據(jù)價(jià)值特征及價(jià)值構(gòu)成
□黃先超
本文通過(guò)批判性地吸收其他學(xué)者對(duì)大數(shù)據(jù)價(jià)值的論述,創(chuàng)新性的提出了大數(shù)據(jù)價(jià)值的兩大特征以及大數(shù)據(jù)價(jià)值釋放所需的三大要素。筆者認(rèn)為大數(shù)據(jù)的價(jià)值具有“隱匿性”和“持續(xù)性”特征,同時(shí)大數(shù)據(jù)價(jià)值的充分釋放需要借由“數(shù)據(jù)、技術(shù)和大數(shù)據(jù)思維”三大要素的協(xié)同發(fā)力。筆者認(rèn)為在對(duì)大數(shù)據(jù)價(jià)值特征及構(gòu)成要素進(jìn)行認(rèn)真研讀之后,才能對(duì)大數(shù)據(jù)時(shí)代下的社會(huì)變革進(jìn)行有效解讀和預(yù)測(cè),進(jìn)而趨利避害,造福社會(huì)。
大數(shù)據(jù)價(jià)值特征云計(jì)算
當(dāng)前學(xué)界和業(yè)界對(duì)大數(shù)據(jù)的研究主要聚焦于大數(shù)據(jù)對(duì)政府服務(wù)、企業(yè)營(yíng)銷(xiāo)以及傳媒業(yè)的影響方面,這無(wú)疑有助于加強(qiáng)服務(wù)型、廉潔高效型政府的建設(shè),幫助企業(yè)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)和助推傳媒融合轉(zhuǎn)型。但是筆者認(rèn)為除了對(duì)大數(shù)據(jù)的影響進(jìn)行研究之外,還應(yīng)該思考為什么大數(shù)據(jù)能夠?qū)ι鐣?huì)帶來(lái)革命性變化,或者說(shuō)大數(shù)據(jù)價(jià)值釋放的驅(qū)動(dòng)因素是什么。
筆者認(rèn)為,“價(jià)值就是有用性”,即相對(duì)于價(jià)值評(píng)估主體而言客體所具有的有用性或積極意義。具體到本文,大數(shù)據(jù)的價(jià)值就是數(shù)據(jù)的升值效用,即有利于創(chuàng)建廉潔高效的服務(wù)型政府,有利于提升企業(yè)營(yíng)銷(xiāo)水平。
隱匿性。大數(shù)據(jù)的“隱匿性”是說(shuō)大數(shù)據(jù)的價(jià)值潛藏在線(xiàn)性和非線(xiàn)性多類(lèi)型數(shù)據(jù)之中,它需要“提純”技術(shù)的介入才能被挖掘出來(lái)。我們通常說(shuō)大數(shù)據(jù)價(jià)值密度低,其實(shí)就是大數(shù)據(jù)價(jià)值隱匿性的體現(xiàn)。大數(shù)據(jù)的價(jià)值并不是只要擁有了足夠多的數(shù)據(jù),價(jià)值就自然而然地顯現(xiàn)出來(lái),也不是說(shuō)數(shù)據(jù)越多價(jià)值就越大。它隱藏在數(shù)據(jù)堆中,需要經(jīng)歷高效的存儲(chǔ)、挖掘之后,再通過(guò)可視化技術(shù)才能加以呈現(xiàn)。如果不對(duì)數(shù)據(jù)進(jìn)行處理分析,不把隱藏的價(jià)值挖掘出來(lái),就會(huì)造成越來(lái)越多的“僵尸數(shù)據(jù)”或“數(shù)據(jù)墳?zāi)埂?。在大?shù)據(jù)時(shí)代之前的數(shù)字化時(shí)代,數(shù)據(jù)往往僅作為交易的對(duì)象,交易過(guò)程的結(jié)束也就意味著數(shù)據(jù)價(jià)值的轉(zhuǎn)移和分解。而在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的真正效用在于它未來(lái)的潛在價(jià)值,現(xiàn)在看似沒(méi)有價(jià)值的雜亂數(shù)據(jù),也許在不久的將來(lái)就會(huì)顯示出非凡的社會(huì)效益和商業(yè)用途。
持續(xù)性。大數(shù)據(jù)價(jià)值的持續(xù)性特征就是強(qiáng)調(diào)數(shù)據(jù)價(jià)值通過(guò)二次利用或多次利用仍不衰減,仍然具備指導(dǎo)現(xiàn)實(shí)和預(yù)測(cè)未來(lái)的效用。在筆者看來(lái),大數(shù)據(jù)這種能預(yù)測(cè)未來(lái)的能力儼然建立在大數(shù)據(jù)價(jià)值持續(xù)性的特征之上。也就是說(shuō),大數(shù)據(jù)的價(jià)值不像普通產(chǎn)品的價(jià)值,一次性消費(fèi)后就蕩然無(wú)存,大數(shù)據(jù)的價(jià)值是開(kāi)發(fā)不盡、用之不竭的,我們完全可以通過(guò)調(diào)取存儲(chǔ)設(shè)備中的數(shù)據(jù),對(duì)其加以重復(fù)利用、縱深挖掘,實(shí)現(xiàn)價(jià)值總量的疊加。對(duì)數(shù)據(jù)的挖掘越深入,價(jià)值呈現(xiàn)越明顯;對(duì)數(shù)據(jù)的重復(fù)利用越多,價(jià)值的持續(xù)效應(yīng)就會(huì)越強(qiáng),就會(huì)發(fā)現(xiàn)不同事物之間更多的相關(guān)性,對(duì)未來(lái)的預(yù)測(cè)也就更加準(zhǔn)確,這就是經(jīng)濟(jì)學(xué)家所言的“非競(jìng)爭(zhēng)性”的好處。
和君商學(xué)院趙國(guó)棟等人在《大數(shù)據(jù)時(shí)代的歷史機(jī)遇》中提出的一個(gè)核心的觀點(diǎn)就是:缺少數(shù)據(jù)資源,無(wú)以談產(chǎn)業(yè);缺少數(shù)據(jù)思維,無(wú)以言未來(lái)。這個(gè)觀點(diǎn)強(qiáng)調(diào)了“數(shù)據(jù)”以及數(shù)據(jù)“思維”的重要性。但筆者認(rèn)為,大數(shù)據(jù)價(jià)值的釋放還需要增加“技術(shù)”要義,三者缺一不可。其中數(shù)據(jù)是根本,技術(shù)是手段,大數(shù)據(jù)思維是催化劑。
數(shù)據(jù)。占有大量數(shù)據(jù)或者能夠收集到可觀的數(shù)據(jù)是大數(shù)據(jù)價(jià)值發(fā)揮的根本前提,沒(méi)有達(dá)到研究需要的數(shù)據(jù)資源,一切將無(wú)從談起。
首先,占有大量數(shù)據(jù)。數(shù)據(jù)的產(chǎn)生不是憑空的,而是在人類(lèi)計(jì)量和記錄的基礎(chǔ)之上逐步誕生的。從無(wú)數(shù)據(jù)到有數(shù)據(jù)、從小眾數(shù)據(jù)到今天的大數(shù)據(jù),數(shù)據(jù)價(jià)值才得到更進(jìn)一步顯現(xiàn)。大數(shù)據(jù)的典型特征之一就是數(shù)據(jù)量的無(wú)界性,小范圍的數(shù)據(jù)采樣已不合時(shí)宜,大數(shù)據(jù)價(jià)值的發(fā)揮要建立在大量數(shù)據(jù)之上,能不能占有大量數(shù)據(jù)可供專(zhuān)業(yè)人員挖掘是大數(shù)據(jù)價(jià)值發(fā)揮的首要前提。
其次,數(shù)據(jù)思維的變革。思維決定行動(dòng),大數(shù)據(jù)時(shí)代下思維的創(chuàng)新與變革和數(shù)據(jù)價(jià)值的釋放休戚相關(guān)。我們所追求的數(shù)據(jù)并不僅僅局限在數(shù)量之上,還應(yīng)該在數(shù)據(jù)質(zhì)量、數(shù)據(jù)相關(guān)性、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)模型等方面,因?yàn)槲覀儾辉賰H僅通過(guò)數(shù)據(jù)來(lái)獲得因果關(guān)系,而更傾向于相關(guān)性和關(guān)聯(lián)性;不僅追求隨機(jī)抽樣,而更想要達(dá)到樣本等于總體的效果;不僅追究結(jié)論的精確性而更注重混雜性,因?yàn)樵谟邢迺r(shí)間里獲得事物發(fā)展的方向和脈絡(luò)比追求嚴(yán)密的數(shù)據(jù)結(jié)構(gòu)和模型要重要得多。
第三,無(wú)所不在的數(shù)據(jù)?!皵?shù)據(jù)無(wú)處不在,一切皆可量化”是大數(shù)據(jù)時(shí)代的典型特征,文字、圖片、喜好、位置、溝通甚至意圖都可以量化。一切皆可量化才造就大數(shù)據(jù)時(shí)代,才能夠?qū)ι鐣?huì)、商業(yè)和人類(lèi)生活帶來(lái)根本性變革。占有或者能夠收集大量的數(shù)據(jù)在當(dāng)今的商業(yè)競(jìng)爭(zhēng)中有兩大優(yōu)勢(shì):第一就是通過(guò)大數(shù)據(jù)的分析可為企業(yè)戰(zhàn)略決策提供參考;第二就是對(duì)數(shù)據(jù)的“打包”出售,再次獲利。
技術(shù)。百度CEO李彥宏在2015年百度聯(lián)盟峰會(huì)上首次提出要收集“新數(shù)據(jù)”,“找到有價(jià)值的信息,而不是看收集了多少信息”,強(qiáng)調(diào)要通過(guò)企業(yè)級(jí)軟件和人工智能實(shí)現(xiàn)數(shù)據(jù)價(jià)值的最大化。而企業(yè)級(jí)軟件的設(shè)計(jì)和人工智能的實(shí)現(xiàn)都需要相關(guān)技術(shù)的突破,因此技術(shù)對(duì)于大數(shù)據(jù)的價(jià)值釋放舉足輕重。
首先,技術(shù)發(fā)展能減少“數(shù)據(jù)墳?zāi)埂?。隨著數(shù)據(jù)以PB級(jí)別的翻倍速增以及數(shù)據(jù)挖掘技術(shù)的滯后,“數(shù)據(jù)墳?zāi)埂焙汀敖┦瑪?shù)據(jù)”大量出現(xiàn)。同時(shí)受制于存儲(chǔ)器的效能,我們不得不刪除大量數(shù)據(jù)以釋放存儲(chǔ)空間。然而大數(shù)據(jù)的價(jià)值是潛在的、未來(lái)的,是隱匿的和持續(xù)的,我們刪除數(shù)據(jù)的過(guò)程也是數(shù)據(jù)價(jià)值的貶值和損耗過(guò)程。數(shù)據(jù)一旦被刪除,就會(huì)造成某個(gè)數(shù)據(jù)節(jié)點(diǎn)的斷裂,進(jìn)而導(dǎo)致數(shù)據(jù)價(jià)值鏈的殘缺。因此占有大量數(shù)據(jù)或者能收集到大量數(shù)據(jù)只是數(shù)據(jù)價(jià)值釋放的第一步,而通過(guò)相關(guān)技術(shù)手段挖掘有效信息,并通過(guò)可視化手段對(duì)數(shù)據(jù)加以呈現(xiàn)和利用才是關(guān)鍵。通過(guò)大數(shù)據(jù)的技術(shù)挖掘,讓潛藏在“墳?zāi)埂敝械臄?shù)據(jù)重見(jiàn)天日,也就為數(shù)據(jù)價(jià)值的釋放和利用提供了更多可能。
其次,數(shù)據(jù)價(jià)值釋放依賴(lài)技術(shù)的發(fā)展。對(duì)數(shù)據(jù)價(jià)值的提取主要涉及到存儲(chǔ)、挖掘和可視化技術(shù),大數(shù)據(jù)價(jià)值的提取也正是經(jīng)歷類(lèi)似三個(gè)步驟。隨著大數(shù)據(jù)產(chǎn)業(yè)對(duì)技術(shù)的依賴(lài)性增強(qiáng),新催生的大數(shù)據(jù)分析師、數(shù)據(jù)管理專(zhuān)家和數(shù)據(jù)科學(xué)家等專(zhuān)門(mén)數(shù)據(jù)人才的工作范圍和影響將會(huì)進(jìn)一步擴(kuò)大,大數(shù)據(jù)價(jià)值的釋放對(duì)技術(shù)的依賴(lài)也會(huì)越來(lái)越強(qiáng)。
分布式存儲(chǔ)技術(shù)與大數(shù)據(jù)價(jià)值:通過(guò)多個(gè)節(jié)點(diǎn)和多個(gè)CPU核數(shù)來(lái)分擔(dān)存儲(chǔ)負(fù)荷,利用位置服務(wù)器定位存儲(chǔ)信息,解決了傳統(tǒng)存儲(chǔ)方式中存儲(chǔ)性能和安全瓶頸問(wèn)題。存儲(chǔ)效能的提高和存儲(chǔ)空間的擴(kuò)展,減少我們刪除數(shù)據(jù)的概率,間接地增加了數(shù)據(jù)的潛在價(jià)值。同時(shí)依靠大量的數(shù)據(jù)存儲(chǔ),實(shí)現(xiàn)對(duì)多密度、多層次數(shù)據(jù)的占有,也就為進(jìn)一步的技術(shù)挖掘和可視化提供可能。
數(shù)據(jù)挖掘技術(shù)與大數(shù)據(jù)價(jià)值:通過(guò)先進(jìn)的云分析和處理平臺(tái)的運(yùn)用,大數(shù)據(jù)價(jià)值的提取和釋放機(jī)會(huì)將進(jìn)一步增加,大數(shù)據(jù)潛在的、持續(xù)的價(jià)值將會(huì)被機(jī)器更加智能和高效地挖掘出來(lái)。
可視化技術(shù)與大數(shù)據(jù)價(jià)值:關(guān)鍵是如何把挖掘到的稍顯復(fù)雜的數(shù)據(jù)信息通過(guò)可視化方式(信息圖、可視化視頻和互動(dòng)圖表)最終展現(xiàn)出來(lái),讓政府決策者、企業(yè)管理人員等在閱覽之后能夠?qū)κ挛镏g的關(guān)聯(lián)性有著較為明確的認(rèn)知,從而輔助科學(xué)決策,彰顯大數(shù)據(jù)的社會(huì)價(jià)值和商業(yè)價(jià)值。
大數(shù)據(jù)思維。根據(jù)舍恩伯格的定義,大數(shù)據(jù)思維就是指一種意識(shí),認(rèn)為公開(kāi)的數(shù)據(jù)一旦處理得當(dāng)就能為千百萬(wàn)人急需解決的問(wèn)題提供答案。通過(guò)占有大量數(shù)據(jù)和掌握關(guān)鍵技術(shù),大數(shù)據(jù)的價(jià)值在很大程度上已經(jīng)釋放出來(lái)。但筆者認(rèn)為,我們只看到了大數(shù)據(jù)價(jià)值的冰山一角,仍然有一部分甚至是大部分價(jià)值被雪藏。日益增多的“數(shù)據(jù)墳?zāi)埂闭侨鄙贁?shù)據(jù)思維的表現(xiàn),面對(duì)千方百計(jì)搜集來(lái)的寶貴數(shù)據(jù),要不就是因?yàn)槿鄙偌夹g(shù)手段無(wú)法提取數(shù)據(jù)價(jià)值而無(wú)可奈何,要不就是缺少創(chuàng)新思維而對(duì)數(shù)據(jù)無(wú)動(dòng)于衷。
首先,要先人一步。大數(shù)據(jù)挖掘和可視化技術(shù)通常掌握在咨詢(xún)公司、技術(shù)供應(yīng)商和分析公司手中,但是掌握了專(zhuān)業(yè)的數(shù)據(jù)技術(shù)并不意味著能提出創(chuàng)新性用途的方案,關(guān)鍵是要具備大數(shù)據(jù)思維。舍恩伯格強(qiáng)調(diào)了具備大數(shù)據(jù)思維的人或企業(yè)能夠先人一步的發(fā)現(xiàn)機(jī)遇,雖然自身并不占有大量數(shù)據(jù)或掌握專(zhuān)業(yè)技能。如布拉德福德·克羅斯的團(tuán)隊(duì)通過(guò)分析過(guò)去十年航班的情況來(lái)預(yù)測(cè)航班是否會(huì)晚點(diǎn),這讓掌握航班信息數(shù)據(jù)的美國(guó)運(yùn)輸局和美國(guó)聯(lián)邦航空局大驚失色。這是典型的用大數(shù)據(jù)思維“改造社會(huì)”的實(shí)例。
其次,要數(shù)據(jù)公開(kāi)。從舍恩伯格對(duì)大數(shù)據(jù)思維的定義中我們還能發(fā)現(xiàn)數(shù)據(jù)思維的另外一層屬性即“公開(kāi)”或“共享”。筆者認(rèn)為,通過(guò)開(kāi)放式思維,建立數(shù)據(jù)共享聯(lián)盟或?qū)iT(mén)的開(kāi)發(fā)平臺(tái)已成為未來(lái)大數(shù)據(jù)價(jià)值繼續(xù)釋放的關(guān)鍵。美國(guó)有data.gov網(wǎng)站和陽(yáng)光基金會(huì),英國(guó)有政府倡議的開(kāi)放式數(shù)據(jù)中心和開(kāi)放知識(shí)基金會(huì),澳大利亞、巴西和智利也相續(xù)出臺(tái)并實(shí)施了開(kāi)發(fā)數(shù)據(jù)策略。這些開(kāi)放數(shù)據(jù)的舉措定能促進(jìn)大數(shù)據(jù)相關(guān)研究的蓬勃發(fā)展,進(jìn)而繼續(xù)改造社會(huì),提高國(guó)家和企業(yè)競(jìng)爭(zhēng)力。
以上所講的數(shù)據(jù)、技術(shù)和大數(shù)據(jù)思維三要素既是大數(shù)據(jù)價(jià)值釋放的前提條件,也是未來(lái)企業(yè)競(jìng)爭(zhēng)的法寶,如世界科技巨頭谷歌公司就是三者兼?zhèn)涞牡湫停日加写罅康臄?shù)據(jù)(通過(guò)谷歌瀏覽器搜集到的數(shù)據(jù)),也掌握著尖端的數(shù)據(jù)挖掘技術(shù),同時(shí)還具備超前的大數(shù)據(jù)創(chuàng)新思維(如向公眾開(kāi)放免費(fèi)谷歌地圖為制造無(wú)人駕駛汽車(chē)做準(zhǔn)備),因此谷歌公司作為世界科技巨擘的位置不易撼動(dòng)。
因此從大數(shù)據(jù)價(jià)值釋放的影響因素來(lái)看,政府能否把大數(shù)據(jù)提升為國(guó)家戰(zhàn)略,能否開(kāi)放數(shù)據(jù)為社會(huì)所用直接關(guān)系到廉潔、高效、服務(wù)型政府的構(gòu)建;企業(yè)能否做到在有限時(shí)間內(nèi)搜集有效數(shù)據(jù),并分析和可視化數(shù)據(jù)直接關(guān)系到營(yíng)銷(xiāo)水平高低和藍(lán)海市場(chǎng)的開(kāi)辟;對(duì)于傳統(tǒng)媒體來(lái)說(shuō)能否跟上大數(shù)據(jù)時(shí)代的步伐,如轉(zhuǎn)變經(jīng)營(yíng)方式、人才培養(yǎng)模式、運(yùn)作流程,更是關(guān)乎生死存亡的大事。
(作者單位:河北大學(xué))
欄目責(zé)編:陳道生
①鄔賀銓?zhuān)骸洞髷?shù)據(jù)思維》[J],《科學(xué)與社會(huì)》,2014,01:1-13。
②維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶著,盛楊燕,周濤譯:《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》[M],杭州:浙江人民出版社,2013年。