王 晉 舒寶淇(云南大學(xué))
近年來(lái),在云計(jì)算、物聯(lián)網(wǎng)等信息技術(shù)的推動(dòng)下,互聯(lián)網(wǎng)已步入了“大數(shù)據(jù)”時(shí)代。大數(shù)據(jù)(Big data)是IT 界近年來(lái)最流行的詞匯。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)作為一種重要資源如何加以高效利用并開發(fā)出其中的價(jià)值,成為政府公共管理部門關(guān)注的問題。美國(guó)政府于2012年3月29日宣布推出“大數(shù)據(jù)的研究和發(fā)展計(jì)劃”,意在推進(jìn)和改善聯(lián)邦政府部門的數(shù)據(jù)收集、組織和分析工具技術(shù),以提高從大量的、復(fù)雜的數(shù)據(jù)集合中獲取知識(shí)和洞見的能力。大數(shù)據(jù)背景下,在電子政務(wù)領(lǐng)域,利用大數(shù)據(jù)技術(shù)去挖掘、識(shí)別、組織與分析隱含在用戶行為中的結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)信息,尋找他們的隱性訴求進(jìn)而改進(jìn)電子政務(wù)的公共服務(wù),達(dá)到政府信息資源、電子化公共服務(wù)與公眾需求的雙向理想控制已成為大數(shù)據(jù)時(shí)代電子政務(wù)領(lǐng)域亟需解決的問題。
目前對(duì)大數(shù)據(jù)還沒有標(biāo)準(zhǔn)的定義,一般認(rèn)為它是一種數(shù)據(jù)量很大、數(shù)據(jù)形式多樣化的非結(jié)構(gòu)化數(shù)據(jù)。維基百科定義為:大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。百度百科定義為:大數(shù)據(jù)通常用來(lái)形容一個(gè)公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫(kù)用于分析時(shí)會(huì)花費(fèi)過多時(shí)間和金錢。從各種各樣類型的數(shù)據(jù)中快速獲得有價(jià)值信息的能力,就是大數(shù)據(jù)技術(shù)。IBM 從三個(gè)基本特性角度來(lái)定義大數(shù)據(jù),即:“3V”:體量(Volume)、速度(Velocity)和多樣性(Variety)。也有人認(rèn)為大數(shù)據(jù)包括三個(gè)要素,即:大分析(Big Analytic)、大帶寬(Big Bandwidth)和大內(nèi)容(Big Content)。
(1)數(shù)據(jù)總量規(guī)模持續(xù)增長(zhǎng)。同一類型的數(shù)據(jù)在快速增長(zhǎng),目前在傳感器網(wǎng)絡(luò)、地理信息導(dǎo)航系統(tǒng)、即時(shí)通訊(如QQ)、社會(huì)網(wǎng)絡(luò)(如微博)、電子商務(wù)(如淘寶)、電子政務(wù)、移動(dòng)互聯(lián)、網(wǎng)絡(luò)日志等領(lǐng)域都產(chǎn)生了巨大的數(shù)據(jù)量,數(shù)據(jù)規(guī)模在不斷增加。
(2)數(shù)據(jù)增長(zhǎng)速度不斷提高。大數(shù)據(jù)的動(dòng)態(tài)性很強(qiáng),要求分析處理應(yīng)快速響應(yīng),在動(dòng)態(tài)變化的環(huán)境中快速完成分析過程,有些甚至必須要實(shí)時(shí)進(jìn)行分析,否則這些結(jié)果可能就會(huì)過時(shí)或無(wú)效。
(3)非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)明顯增多。目前產(chǎn)生大數(shù)據(jù)的數(shù)據(jù)來(lái)源在不斷拓展,數(shù)據(jù)類型除了包括文本、圖片、音頻和視頻外,還有位置信息、鏈接信息等新的數(shù)據(jù)類型。伴隨著社交網(wǎng)絡(luò)、移動(dòng)計(jì)算和傳感器等新技術(shù)的應(yīng)用,大數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù)不斷增加,這些數(shù)據(jù)沒有固定的描述模型,它們的數(shù)據(jù)結(jié)構(gòu)是不固定、不完全或不規(guī)則的。
(4)數(shù)據(jù)潛在價(jià)值有待挖掘。大數(shù)據(jù)雖然數(shù)據(jù)規(guī)模巨大,但通過海量數(shù)據(jù)挖掘、整合分析,可以發(fā)現(xiàn)新的知識(shí)、規(guī)律和聯(lián)系,從而創(chuàng)造新的更大的價(jià)值。大數(shù)據(jù)分析能從龐大的數(shù)據(jù)中發(fā)現(xiàn)潛在的具有較高價(jià)值的知識(shí)、規(guī)律和聯(lián)系,為預(yù)測(cè)和決策提供有力支持。
近年來(lái)國(guó)內(nèi)外電子政務(wù)獲得了長(zhǎng)足的發(fā)展,很多政府部門正在嘗試將云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)等新技術(shù)應(yīng)用到電子政務(wù)中來(lái),隨著電子政務(wù)信息公開、公眾參與、在線服務(wù)等功能的深入發(fā)展,用戶對(duì)政府電子化公共服務(wù)滿意度不斷提升,從而推進(jìn)了政府信息資源建設(shè)的步伐,電子政務(wù)在大數(shù)據(jù)時(shí)代已經(jīng)具備一定的大數(shù)據(jù)特征。首先,電子政務(wù)信息資源規(guī)??偭坎粩嘣黾?,隨著政府電子化公共服務(wù)水平的提高,用戶參與電子政務(wù)的積極性日益提高,這也導(dǎo)致電子政務(wù)信息資源總量的激增。其次,電子政務(wù)的數(shù)據(jù)種類繁多,有電子政務(wù)內(nèi)部公務(wù)處理的結(jié)構(gòu)化數(shù)據(jù),也有大量的來(lái)自于外部用戶反饋的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。最后,隨著電子政務(wù)個(gè)性化服務(wù)的深入開展,用戶的個(gè)性化需求日益增多,政府部門必須根據(jù)用戶的服務(wù)需求做出相應(yīng)的處理,對(duì)大數(shù)據(jù)量的分析與信息潛在價(jià)值的挖掘?qū)⒉豢杀苊狻?/p>
電子政務(wù)的大數(shù)據(jù)特征主要體現(xiàn)在數(shù)據(jù)處理和信息服務(wù)兩個(gè)方面,數(shù)據(jù)處理是電子政務(wù)信息服務(wù)的前提和基礎(chǔ),用戶信息服務(wù)是數(shù)據(jù)處理效率的具體體現(xiàn),以下將重點(diǎn)分析大數(shù)據(jù)時(shí)代電子政務(wù)的數(shù)據(jù)處理和信息服務(wù)的具體特征。
大數(shù)據(jù)時(shí)代的來(lái)臨對(duì)電子政務(wù)帶來(lái)了影響和挑戰(zhàn),數(shù)據(jù)處理是電子政務(wù)服務(wù)用戶的基礎(chǔ)和前提,為用戶提供個(gè)性化的電子化公共服務(wù)必須以快速髙效的數(shù)據(jù)處理為前提,在大數(shù)據(jù)時(shí)代用戶的信息需求日益?zhèn)€性化、復(fù)雜化、實(shí)時(shí)化,這必然要求電子政務(wù)的信息處理也必須適應(yīng)大數(shù)據(jù)的時(shí)代特征,創(chuàng)新電子政務(wù)數(shù)據(jù)處理方式。大數(shù)據(jù)時(shí)代的電子政務(wù)數(shù)據(jù)處理呈現(xiàn)出以下特征:
傳統(tǒng)的電子政務(wù)數(shù)據(jù)處理在政府內(nèi)網(wǎng)主要處理一些標(biāo)準(zhǔn)化的公文數(shù)據(jù),在電子政務(wù)外網(wǎng)中主要處理數(shù)據(jù)格式和XML 格式的數(shù)據(jù),很多政府部門通過一系列國(guó)家標(biāo)準(zhǔn)等規(guī)范使這些數(shù)據(jù)格式和XML 格式的數(shù)據(jù)實(shí)現(xiàn)了規(guī)范化和統(tǒng)一化,這使得傳統(tǒng)環(huán)境下電子政務(wù)數(shù)據(jù)處理基本以結(jié)構(gòu)化數(shù)據(jù)為主。隨著大數(shù)據(jù)時(shí)代的到來(lái),大數(shù)據(jù)的特性與優(yōu)勢(shì)在政府內(nèi)部日常工作和電子化公共服務(wù)中將顯現(xiàn)出其巨大的優(yōu)越性。用戶對(duì)的電子政務(wù)的需求也將呈現(xiàn)出個(gè)性化、多樣化等特點(diǎn),這必然使電子政務(wù)的信息資源呈現(xiàn)復(fù)雜化、多樣化的特點(diǎn),適應(yīng)社會(huì)的發(fā)展,滿足用戶的個(gè)性化需求,提供復(fù)雜多樣的數(shù)據(jù)處理將成為大數(shù)據(jù)時(shí)代電子政務(wù)數(shù)據(jù)處理的顯著特征。
信息環(huán)境下,信息產(chǎn)生的成本快速下降,產(chǎn)生的方式也多種多樣,存在于社會(huì)空間中的信息數(shù)據(jù)量迅猛增長(zhǎng),但大數(shù)據(jù)時(shí)代更會(huì)促使數(shù)據(jù)產(chǎn)生的范圍、方式、途徑發(fā)生翻天覆地的變化,人們的一舉一動(dòng)、一言一行、行為規(guī)律等都將產(chǎn)生出大量的半結(jié)構(gòu)化、非結(jié)構(gòu)化信息數(shù)據(jù),信息數(shù)據(jù)的組成結(jié)構(gòu)、類型格式、存在形態(tài)等都愈加復(fù)雜。電子政務(wù)信息處理對(duì)這些復(fù)雜的數(shù)據(jù)進(jìn)行的應(yīng)用、存儲(chǔ)將有著極強(qiáng)的挑戰(zhàn)性,其不僅有技術(shù)問題,也還包括社會(huì)問題。因此,大數(shù)據(jù)時(shí)代的電子政務(wù)信息處理首先要通過云計(jì)算技術(shù)解決海量數(shù)據(jù)的存儲(chǔ)技術(shù)問題,另外還需要全面收集用戶結(jié)構(gòu)化的個(gè)人信息數(shù)據(jù),同時(shí)大量的用戶存儲(chǔ)信息行為、搜索方式、行為痕跡等半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)也是必不可少的。
傳統(tǒng)的電子政務(wù)數(shù)據(jù)處理主要是通過結(jié)果化的公文處理、數(shù)據(jù)庫(kù)處理和網(wǎng)絡(luò)數(shù)據(jù)處理實(shí)現(xiàn)用戶對(duì)信息服務(wù)滿意的最大化。在大數(shù)據(jù)時(shí)代電子政務(wù)的數(shù)據(jù)處理范圍、方式、對(duì)象、目的將日趨個(gè)性化和智能化,比如根據(jù)用戶瀏覽政府門戶網(wǎng)站的痕跡和參與在線服務(wù)的偏好,通過智能化的數(shù)據(jù)分析,構(gòu)建出新的電子政務(wù)服務(wù)方案和策略。可見,在大數(shù)據(jù)時(shí)代,電子政務(wù)的數(shù)據(jù)處理將由結(jié)構(gòu)化數(shù)據(jù)處理轉(zhuǎn)向智能化的數(shù)據(jù)挖掘和數(shù)據(jù)分析,通過海量數(shù)據(jù)挖掘、整合分析,可以發(fā)現(xiàn)新的知識(shí)、規(guī)律和聯(lián)系,從而創(chuàng)造新的更大的價(jià)值,實(shí)現(xiàn)更高層次的用戶滿意最大化。
服務(wù)用戶是電子政務(wù)的最終目的,為用戶提供個(gè)性化的髙效的電子化公共服務(wù)是電子政務(wù)信息服務(wù)的根本目的。在大數(shù)據(jù)時(shí)代用戶的信息需求日益?zhèn)€性化、復(fù)雜化、實(shí)時(shí)化,這必然要求電子政務(wù)的信息服務(wù)也必須適應(yīng)大數(shù)據(jù)的時(shí)代特征,創(chuàng)新電子政務(wù)信息服務(wù)方式。電子政務(wù)的用戶服務(wù)一般包括信息公開、公眾參與和在線服務(wù)三個(gè)方面,大數(shù)據(jù)時(shí)代的電子政務(wù)的信息公開、公眾參與和在線服務(wù)呈現(xiàn)出以下特征:
目前,政府門戶網(wǎng)站已經(jīng)逐漸成為各政府部門發(fā)布政務(wù)信息的主要平臺(tái),政務(wù)信息公開是以網(wǎng)絡(luò)為工具進(jìn)行政務(wù)信息資源收集、傳播、貯存并將信息與公眾共享。政府部門應(yīng)按照《政府信息公開條例》要求,建立政務(wù)公開欄目,主動(dòng)發(fā)布各類政務(wù)信息。在大數(shù)據(jù)時(shí)代,信息公開的內(nèi)容依然應(yīng)按照《政府信息公開條例》要求,而信息公開內(nèi)容的頁(yè)面布局應(yīng)順應(yīng)大數(shù)據(jù)時(shí)代的特征發(fā)生改變,通過分析大量的用戶訪問和瀏覽的行為數(shù)據(jù),分析用戶對(duì)政務(wù)信息公開的內(nèi)容的偏好,重新組合頁(yè)面布局,實(shí)現(xiàn)個(gè)性化的政府信息公開服務(wù)。
目前,電子政務(wù)公眾參與的渠道日趨多樣化,主要的渠道有領(lǐng)導(dǎo)信箱、民意征集、留言板、網(wǎng)上信訪、網(wǎng)上直播、在線調(diào)查、網(wǎng)上咨詢投訴、在線訪談、公眾論壇、政務(wù)微博等,隨著信息技術(shù)的快速發(fā)展,一些新技術(shù)、新網(wǎng)絡(luò)形態(tài)還將應(yīng)用到電子政務(wù)公眾參與中來(lái),換句話說(shuō)通過電子政務(wù)公眾參與獲得的用戶反饋信息會(huì)越來(lái)越多樣化、復(fù)雜化和個(gè)性化,這表明電子政務(wù)的公眾參與具備了“大數(shù)據(jù)”的特征,因此,大數(shù)據(jù)時(shí)代的公眾參與應(yīng)按照大數(shù)據(jù)時(shí)代的數(shù)據(jù)處理要求,通過處理海量的結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),深入挖掘潛在價(jià)值,進(jìn)一步優(yōu)化電子政務(wù)的公眾參與服務(wù),從而提升用戶的滿意度和政府的公信力。
電子政務(wù)的在線服務(wù)功能是指通過政府網(wǎng)站整合政府各部門以及社會(huì)各種服務(wù)資源,完成或促進(jìn)社會(huì)公眾日常生活及企業(yè)經(jīng)營(yíng)決策活動(dòng)實(shí)際事項(xiàng)的能力。目前,電子政務(wù)的門戶網(wǎng)站要求能為用戶提供“一站式”的服務(wù)平臺(tái),即能夠?yàn)槊嫦虿煌愋偷挠脩羧禾峁┤芷趹?yīng)用主題的信息和服務(wù),最大范圍的整合服務(wù)資源。由于電子政務(wù)的在線服務(wù)的用戶類型多樣,需求各異,這必然要求電子政務(wù)在線服務(wù)能夠具備處理用戶個(gè)性化信息需求的能力,通過對(duì)海量個(gè)性化數(shù)據(jù)的處理,發(fā)掘出潛在的有價(jià)值的知識(shí)和規(guī)律,從而提升大數(shù)據(jù)時(shí)代的電子政務(wù)在線服務(wù)能力和服務(wù)質(zhì)量,獲得最大化的用戶滿意。
1 賽迪智庫(kù)軟件與信息服務(wù)研究所. 美國(guó)將發(fā)展大數(shù)據(jù)提升到戰(zhàn)略層面[J].中國(guó)電子報(bào),2012-07-17(003)
2 Big data[EB/OL].http://en.wikipedia.org/wiki/Big_data,2013-02-23.
3 大數(shù)據(jù)[EB/OL].http//baike.baidu.com/view/6954399.html,2013-02-23.
4 涂蘭敬.專家觀點(diǎn):“大數(shù)據(jù)”與“龐大數(shù)據(jù)”的區(qū)別[J].網(wǎng)絡(luò)與信息,2011(12):37~38
5 黃曉斌,鐘輝新.大數(shù)據(jù)時(shí)代企業(yè)競(jìng)爭(zhēng)情報(bào)研究的創(chuàng)新與發(fā)展[J].圖書與情報(bào),2012(6):9~14
6 韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報(bào),2012(5):37~40