王子迎 高樂田
[摘 要] 大數據時代的到來引發(fā)了一場信息數據現代化革命,它不僅改變了人們對世界的認知,也催生了大數據科學的誕生。尤其是近年來,大數據的數學計算模型和統(tǒng)計分析工具的發(fā)展,為利用大數據進行知識發(fā)現和科學有效決策提供了可能性。而大數據對于決策學的作用在于,通過大數據的海量性保證了決策信息數據的充分性,而大數據的關聯(lián)性研究又增強了決策的有效性,同時大數據定量分析的精準性也在逐漸改變著人類依賴直覺和經驗的主觀決策思維范式。因此,大數據作為新興的決策戰(zhàn)略資源,應在國家層面予以建設,建立以大數據為核心的決策模式,強化大數據決策科學理念;制定大數據國家發(fā)展戰(zhàn)略,構建決策工作科學化體制機制;推進大數據決策學研究和人才培養(yǎng),為決策現代化提供理論和智力支持。
[關鍵詞] 大數據;大數據科學;大數據國家發(fā)展戰(zhàn)略;決策學;大數據決策科學
[中圖分類號] C934 [文獻標識碼] A [文章編號] 1002-8129(2018)11-0029-08
大數據科學是數學科學與現代信息科學技術等相結合的產物,它在社會管理、公共決策、產業(yè)升級等國家治理體系現代化建設方面發(fā)揮著巨大作用。當前,社會數據呈現出幾何級數增長的發(fā)展態(tài)勢,大數據科學被廣泛運用于社會的各個領域和行業(yè)中,人類社會正在經歷由大數據科學引發(fā)的一場現代化革命,這場革命也必將給公共決策帶來深遠的影響。公共決策作為國家治理體系中社會公共管理的核心環(huán)節(jié),其決策的科學化能力和水平直接影響和決定著國家治理能力現代化的實現。充分認識大數據科學的基本特征和功能價值,科學分析大數據環(huán)境下公共決策過程面臨的機遇挑戰(zhàn),積極探索運用大數據科學提升社會公共決策科學化水平的路徑,對于實現國家治理能力現代化具有重要現實意義和價值。
一、時代之變:大數據時代已悄然來臨
自數學科學誕生以來,人類就開啟了用數據記錄時代發(fā)展,用數據計算、分析、預測、演繹未來的歷程。特別是自第二次工業(yè)革命以來,新技術、新發(fā)明層出不窮,以文字為載體的信息數據量大約每10年就翻倍增長。進入新世紀,數學科學和信息技術正以前所未有的發(fā)展方式,對經濟、社會、科技領域的變革發(fā)揮著決定性的作用,各類信息數據也呈現出爆炸式發(fā)展態(tài)勢,數據量以每3年翻倍的速度持續(xù)增長。尤其是近10年,隨著計算數學、計算機技術和互聯(lián)網的快速發(fā)展,以文字、視頻、音頻、圖像和以數字為載體的工業(yè)生產、企業(yè)經營、社會生活等數據大量呈現,物聯(lián)網、云計算、社交網絡等被廣泛運用于社會生產和人類生活的各行各業(yè),數據的存儲規(guī)模量、種類數、計算復雜性飛速增長。根據IBM公司和國際數據公司(International Data Corporation, IDC)提供的數據,人類每天都可以產生出2.5×1018(qui-
ntillion)的數據,預計到2020年,數據將以每2年翻一番的速度急劇增長,全球數據量將達到40ZB,中國擁有的全球數據量比例將由2012年的13%提升到21%[1]。正如美國《時代》周刊雜志所言:“在政治領域、商業(yè)領域、公共服務領域等,大數據的時代已經到來?!盵2]
大數據作為知識創(chuàng)新和科學發(fā)現的新引擎,正在改變著人類社會的生產生活方式以及人們對世界的深層理解。大數據科學已被廣泛運用于人類經濟社會生產生活的各行各業(yè),人們通過對大數據的分析,揭示和把握著國家經濟結構調整、產業(yè)布局、工農業(yè)生產、公共生活、社會治理、軍事活動、生命健康以及人的思想行為等方面的規(guī)律、特征和表象,為人類開展科學決策、實現科學發(fā)展提供了可能,為知識的發(fā)現尤其是跨學科研究提供了機遇和路徑。世界各國高度重視大數據科學時代的到來,如美國政府把大數據看作“未來的新石油”,把對大數據的研究提升為“國家意志”,先后于1993年、2012年投資數億美金啟動“信息高速公路”計劃和“大數據研究和發(fā)展”計劃,致力于提高從大型復雜數據中獲取信息和知識的能力,并服務于經濟社會發(fā)展;2013年,美國、英國、德國、芬蘭和澳大利亞5國學者聯(lián)合推出“世界大數據周”活動,倡導各國政府制定大數據發(fā)展戰(zhàn)略和措施;聯(lián)合國也于同年發(fā)布《大數據促發(fā)展:挑戰(zhàn)與機遇》白皮書,強調要運用豐富的數據資源進行前所未有的實時分析,進而幫助政府更好地適應經濟社會的發(fā)展與運行;中國政府部門發(fā)布的《“十二五”國家科技計劃信息技術領域2013年度備選項目征集指南》《中國云科技發(fā)展“十二五”專項規(guī)劃》《物聯(lián)網“十二五”發(fā)展規(guī)劃》等把發(fā)展大數據作為國家戰(zhàn)略予以重點支持;中國地方政府也借助大數據開展社會管理服務和創(chuàng)新,如南京市通過打造大數據云計算平臺建設智能化公眾服務平臺,創(chuàng)新城市管理模式,建成了“智慧南京”;世界上越來越多的政府、企業(yè)等機構部門都意識到數據本身就是一種重要資源和資產,增強數據的計算分析能力是提升組織競爭力的核心要素之一??梢哉f,大數據科學開啟了重大的時代轉型,為國家治理現代化提供了公共決策科學化的來源和依據。
二、科學之維:大數據的科學特性
大數據時代的來臨催生了數據科學的誕生。大數據科學是關于數據的科學或者研究數據的科學,是一門融合了數學、統(tǒng)計學、概率模型、信息與計算科學、計算機技術等多門學科的交叉科學,其核心就是對海量的數據進行挖掘分析,從中提取和發(fā)現新的知識和信息。
1. 大數據的概念。1980年著名未來學家阿爾文·托夫勒在其著作《第三次浪潮》中提出了“海量數據”這一概念,強調了數據在未來信息社會的重要作用。2008年9月出版的《自然》雜志推出了“大數據”特刊專題,隨后大數據一詞就成為熱門詞匯,高頻出現于各個行業(yè)領域和政府工作報告之中。對于大數據,人們至今尚未達成統(tǒng)一的概念共識。在學界,美國權威研究機構Gartner將大數據定義為“需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資源”[3] 6。英國大數據研究專家維克托在其著作《大數據時代》中認為,“大數據并不是一個確切概念。最初,大數據是指需要處理的信息量過大,已經超出了一般電腦在數據處理時的內存量。大數據是人們獲得新認知、創(chuàng)造新價值的源泉,是改變市場、組織機構及政府與公民關系的方法[4] 8”。中國學者鄔賀銓院士認為,“大數據泛指巨量的數據集”。李國杰院士認為,“大數據是指無法在一定時間內用常規(guī)軟件工具對其內容進行抓取、管理和處理的數據集合,它具有數據量大、種類多、速度快等特點[5] 17”??v觀國內外學者的觀點,我們可以將大數據理解為規(guī)模特別巨大且需要用新的數據挖掘工具進行處理的數據集合,其具有重要的科技、經濟、社會發(fā)展價值。
2. 大數據的本質及其科學特征。大數據的前提是數據,數據的本質也就是大數據所具有的本質。在數學中,我們可以把數據理解為x,x是作為不同于y的存在,且x和y是2個未知的、開放性的變量。由此看來,數據的含義是寬泛的,任何事物只要不是唯一的,它就可以成為另一個事物的數據或者尺度。也就是說數據本身就是為某一現象指派一種歸屬的數字、字符或者圖像。因此,數據的本質就是可計算元素的數量的積累,其特征就是表征著事物關系,量化和解釋著事物的信息變化。作為具有宏大規(guī)模和種類的大數據,其科學特征體現在5個方面:一是從數據內容來看,大數據表征著自然客觀對象和過程;二是從數據特點來看,大數據的體量規(guī)模巨大,不同學科和不同領域的數據存在類型多樣(如包括結構性數據、半結構性數據和非結構性數據等)、變化速率大、分析計算復雜的特點;三是從數據的來源類型和獲取方式看,數據主要是信息化過程中數據設備所搜集到的網絡數據、遙測數據、通信數據、GPS時間數據和位置數據、生產生活文本數據、圖像音視頻數據,還有通過觀測、實驗記錄及后期加工的科學數據等;四是從數據的應用場景和分析手段看,大數據是一種高度復雜的計算性數據模型,一般與科學原理模型相結合,形成知識發(fā)現的方法,其應用場景大多為非線性復雜系統(tǒng);五是從其功能價值看,大數據具有分析預測、知識發(fā)現與科學決策等功能和價值。
3. 大數據的數學計算模型和統(tǒng)計分析工具為其科學決策提供了可能性。大數據不同于傳統(tǒng)小規(guī)模數據,其在搜集、存儲、計算、分析數據等方面都有更高的要求。只有解決了大數據的存儲、計算方法、統(tǒng)計分析工具等問題,大數據才能為知識發(fā)現和科學決策提供可能性。當前,在大數據存儲方面,Google公司開發(fā)的NoSQL數據庫、Microsoft開發(fā)的Azure Tables和VMware公司開發(fā)的Redis等已成功解決了不同格式、類型的大數據存儲問題。在數據分析方面,Google公司發(fā)明了大數據分析的分布式編程模型MapReduce技術,Yahoo公司推出了開源項目Hadoop,此外還有HPCC、R語言、Storm、Apache Drill、Rapid M-
iner、Mahout等分析工具和平臺。在對大數據的數學計算與統(tǒng)計分析方面,人們通過對總量、平均數、中位數、百分比、比率等數值以及研究一個變量與其他多個變量之間關系的回歸分析,設立回歸方程等數學模型,可以有效地進行數據計算;采用假設檢驗、主成分分析等科學方法原理通過樣本(或少數變量)對總體(或多個綜合變量)所提出的假設,進行驗證和判斷是接受還是拒絕進行數據分析;通過數學統(tǒng)計語言模型給出了數學計算概率P(s)的公式為:
P(s)=P(w1 w2···w3)=P(w1)·P(w2丨w1) ·P(w3丨w2)·…·P(wn丨wn-1)
這一公式有效地解決了對自然語言的處理和數據變量判斷分析合理性的解釋性問題。特別是擁有強大計算能力的云計算平臺的出現,為快速處理大數據的豐富信息提供了技術和平臺支撐。這一切都為利用大數據進行知識發(fā)現和科學有效決策提供了可能性。
三、價值之思:大數據的決策學意義
人類歷來都重視對數據意義的認識和探討。古希臘哲學家畢達哥拉斯從音樂、圖形、數字的關系中提出了“數是萬物的本原”的思想;中國的《周易》提出“道生一,一生二,二生三,三生萬物”的思想,認為數據是世界生成的終極本質;大哲學家萊布尼茨、康德、馬克思等也都曾論述過數據的重要性。在大數據時代到來的今天,數據的意義更是得到了科學家、哲學家們的高度重視,他們大多認為數據全面刻畫和反映著世界的真實狀態(tài),數據本身就可以幫助我們分析和認識現象。英國大數據權威學者維克托·舍恩伯格甚至認為:“世界萬物皆由數據構成,數據是世界的本質?!盵4] 125更有人文學者一改人文思辨的路子,提出了“人文數據”的概念,認為“大數據可以用來測量和描述復雜的人類思想”,事實也是如此,如今人類已經將大數據廣泛運用于與人的思想行為相關的教育學、醫(yī)學、心理學等眾多領域。由此看來,大數據是真實世界的記錄載體,事物的狀態(tài)盡在數據之中。大數據既然有表征事物本質和事物關系的功能,那么對人類而言,人們不僅希望通過大數據來認識生活世界,更希望通過對大數據的把握和挖掘分析使未來世界透明化,進而通過決策來科學地改造世界。從這個意義上看,大數據的最大價值和意義就在于其決策學價值和意義。大數據對于決策學的意義和價值體現在以下方面:
1. 大數據的海量性存在保證了決策信息數據的充分性。大數據以其巨大的數據規(guī)模和多樣的數據類型使得決策所需信息的充分獲取成為可能。大數據用于決策的一個顯著優(yōu)勢就是可以提供海量的數據樣本。人們可以通過物聯(lián)網、互聯(lián)網、傳感器設備、移動通信終端等獲取所需決策的對象及其關聯(lián)事物的信息數據,進而建立起龐大的數據庫,以鏡像形式對其進行數字化處理,并在計算機構建的虛擬社會場景中呈現事物的真實狀態(tài),演繹其發(fā)展變化趨勢,為決策者提供決策依據。海量的事物及其關聯(lián)信息的數字鏡像化可以為決策者提供充分的決策信息,這在傳統(tǒng)思維下是無法想象的。盡管大數據也無法窮盡事物關聯(lián)的全部信息,因為事物在不斷發(fā)展變化,有了大數據也不一定能做出科學有效決策,但這也并不能否認決策信息獲取的充分性是科學決策的前提和基礎。我們可以通過漸進決策進行改進,以實現更有效的決策。
2. 大數據的關聯(lián)性研究增強了決策的有效性。大數據出現之前,人們對數據的分析大多采取因果關系方法,遇到的最大困難就是對關聯(lián)性信息數據強的事物在出現復雜信息數據時進行計算分析和處理的問題,因為傳統(tǒng)的分析工具根本無法應對數據規(guī)模的巨大性、數據關系的豐富性、數據結構的多樣性和數據計算的復雜性。大數據更多的是采用計算模型運行簡單算法,重點關注與結果相關聯(lián)的影響因素,而不太注重對因果關系的探究。決策者只需要對某些因素變量進行分組所導致的結果性差異予以重點關注,通過干預某些因素變量組去衡量干預效果,以此來進行輔助決策。由此可見,大數據輔助決策是根據關聯(lián)性研究進行的,更有利于找到影響事物發(fā)展變化的主要因素,它克服了傳統(tǒng)決策通過小樣本因果關系分析難以找到影響事物發(fā)展變化主要因素的缺陷,使得決策更具有效性和針對性。
3. 大數據定量分析的精準性改變了人類依賴直覺和經驗的主觀決策思維范式。大數據帶來了決策思維范式從依賴直覺、經驗的主觀定性決策到精準的數據分析的客觀定量決策的重要變革。由于大數據反映著事物生成的本質,表征著事物的關系,并且每一個數據都是真實存在的,數據的計算依賴擁有科學原理的計算模型,因此其結果必然是精準精確的。數據的這種客觀真實存在性和精確性決定了人們在應用大數據進行決策時,關注相關性,關注事物是什么,而不需要知道為什么,只需要看數據呈現的結果就可以直接做出判斷和決策。這顛覆了人類依賴直覺和經驗的傳統(tǒng)決策思維范式,使得憑借直覺、經驗的定性決策讓位于精準的數據分析定量決策,這也對人類認知世界和改造世界提出了挑戰(zhàn)。此外,在傳統(tǒng)的決策思維模式中,決策的主體大多是政治精英、業(yè)務專家、科學家,而在大數據時代,大數據及其計算模型、分析工具都是共享的,普通民眾也可以是決策的參與主體,這不僅有利于發(fā)揮人民大眾參與決策的積極性和創(chuàng)造性,也有利于推動決策向更全面、多元化的方向演進。
4. 大數據的高速性提高了決策的及時性。決策的及時性是決策發(fā)揮作用的必要條件,它直接影響決策的效果。大數據以其高速性特點滿足了決策的及時性需要。大數據的高速性體現在3個方面:一是大數據產生的速度快,人類每天每時每刻的生產生命活動都會產生PB級別的大量數據,且這些數據都是動態(tài)發(fā)展變化的。二是大數據獲取速度快。人們借助物聯(lián)網、互聯(lián)網、移動通信終端、傳感器設備以及遙測遙感監(jiān)測技術、計算機信息技術等,可以適時采集、抓取和搜集到決策所需的信息數據并進行聚類分組。三是大數據計算分析速度快。在傳統(tǒng)數據計算分析的過程中,人們大多采用分類聚類算法,然而聚類算法不是數曲線式(N log N)或線性(順序 N)的規(guī)模,而是典型的N立方規(guī)模,但在大數據中,當 N 變得很大時,一些傳統(tǒng)方法就會失效[6]。因此,在面對海量的大數據處理時,云算法以及數據統(tǒng)計模型工具以其良好的伸縮性,能夠在很短時間內應對PB級別的大數據,可以快速提供虛擬場景模擬并演繹出決策方案的效果,以便于人們適時優(yōu)化決策方案,及時做出科學有效的決策。
四、變革之道:大數據背景下決策科學現代化建設路徑
大數據作為一種新興的決策戰(zhàn)略資源,給國家治理能力建設帶來了全新的機遇和挑戰(zhàn)。利用大數據創(chuàng)新政府公共決策已經成為世界各國政府改革發(fā)展創(chuàng)新的重要內容。當前,隨著依法治國和國家治理能力現代化建設進程的加快推進,提高決策科學化現代化水平,就必須推進大數據科學與決策科學的融合發(fā)展。大數據在變革決策思維理念、革新決策手段方式、優(yōu)化決策過程和效果等方面有著廣泛的應用前景,也為決策科學化水平和決策現代化建設提供了路徑。
1. 建立以大數據為核心的決策模式,強化大數據決策科學理念。理念是行動的先導,如果決策理念和決策模式跟不上大數據時代發(fā)展的形勢,決策的過程和決策實際效果就會出現偏差。大數據對于決策的價值主要體現在決策過程中的事前預測、事中感知、事后反饋三個方面。以大數據為核心的決策模式,重點在于將大數據搜集處理、信息挖掘轉化應用到決策的過程和決策的實際效果之中。因此,在大數據時代,政府要通過政策引導和知識理論學習,以大數據為契機使決策者牢固樹立大數據決策思維方式,形成以大數據融入國家、地方治理決策的科學導向,切實遵循大數據科學決策規(guī)律,不斷增強大數據思維意識,優(yōu)化政府決策的思路和方式,強化對大數據的決策運用實踐,將以往基于有限數據分析決策轉為覆蓋人數更多、范圍更廣、領域更寬、類型更多的大數據分析,著力創(chuàng)新大數據參與決策的工作流程,引導和鼓勵地方社會多元主體共同參與并形成大數據決策應用的合力,從而以大數據決策科學理念和思維方式強化決策能力建設,推進決策科學化和決策體系現代化建設。
2. 制定大數據國家發(fā)展戰(zhàn)略,構建決策工作科學化體制機制。當前大數據的蓬勃發(fā)展浪潮席卷世界,滲透到各個行業(yè)和領域,成為最重要的決策資源和改革發(fā)展創(chuàng)新的動力源。只有將大數據上升至國家發(fā)展戰(zhàn)略,才能形成大數據決策科學發(fā)展應用的制度環(huán)境,構建起大數據決策工作體制機制,提升科學決策能力和水平。一是要制定推出大數據國家發(fā)展戰(zhàn)略計劃和項目,全面規(guī)劃好大數據的建設、管理和應用工作,形成大數據決策的政策導向和激勵制度;二是要建立大數據創(chuàng)新平臺和大數據共享機制,統(tǒng)一數據格式和數據標準,打破信息孤島現象、數據碎片化現象和數據條塊分割的現狀,整合政府、社會、企業(yè)多元資源,建立國家級大數據庫、數據分析工具資源庫和大數據決策方案仿真模擬場景中心等,確保大數據的規(guī)模、質量、綜合性和決策實踐運用的針對性與效果。三是加強大數據相關法律法規(guī)建設,建立數據安全保衛(wèi)機制,明確數據共享、使用責任主體,設立數據搜集和使用規(guī)范,推動數據使用的交流融合,防止數據資源浪費、數據泄密及流失現象的發(fā)生。
3. 推進大數據決策學研究和人才培養(yǎng),為決策現代化提供理論和智力支持。大數據決策學是一門交叉科學,它是研究大數據在決策過程中搜集分析、轉化應用和形成決策的科學。將大數據轉化為知識,將知識應用于決策實踐,這是大數據決策科學的邏輯和使命。加強大數據決策科學研究,就要以多學科理論為支撐,運用數學計算科學、統(tǒng)計學原理方法、計算機語言程序設計、多媒體信息技術以及經濟學、社會學、管理學、心理學等學科理論知識和工具模型,解釋大數據的信息,梳理出大數據所表征的事物動態(tài)關系,建立起數據模型,提供科學方法指導,通過虛擬場景模擬演繹決策方案的實際效果,形成可視化、科學化的有效決策方案,為決策科學現代化建設提供理論支撐。同時,要以大數據科學理論為基礎,積極強化大數據相關專業(yè)人才培養(yǎng)力度,推進校企、政企合作教育培訓,著力建設一支有較大規(guī)模數量的大數據科學家、大數據分析師、大數據關系架構師、大數據模型設計師、大數據計算工程師等專門人才隊伍,為決策科學現代化建設提供人才智力支持。推進大數據決策學研究和人才培養(yǎng)工作,必將開辟決策科學現代化建設的新篇章。
[參考文獻]
[1]Gantz J, Reinsel D. The Digital Universe IN 2020: Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East.Framingha-
m:IDC Analyze the Future,2012.
[2]張才明.大數據顛覆傳統(tǒng)決策模式[J].中國經貿,2013,(6).
[3]Michael Wessler. Big Data Analytics For Dummies[M].New Jersey: John Wiley & Sons, Inc,2013.
[4]維克托·邁爾·舍恩伯格,肯尼思·庫克耶.大數據時代[M].盛楊燕,周 濤,等,譯.杭州:浙江人民出版社,2013.
[5]李國杰.大數據成為信息科技新關注點[J].硅谷,2012,(13).
[6]Tony Hey,Stewart Tansley,Kristin Tolle.第四范式:數據密集型科學發(fā)現[M].潘教峰,張曉林,等,譯.北京:科學出版社,2012.
[責任編輯:汪智力]