郭晨晨
【摘要】 從大數(shù)據(jù)的提出到現(xiàn)在僅僅幾年時(shí)間,但已經(jīng)成為整個(gè)社會(huì)各個(gè)領(lǐng)域的熱門話題。從事大數(shù)據(jù)工作的人才更是受到了包括百度、騰訊、阿里巴巴等互聯(lián)網(wǎng)掌舵公司的追捧。但是需要注意的是任何技術(shù)或者科學(xué)成果都有的局限性,讓大數(shù)據(jù)更好的為人類服務(wù)需要我們更多的理性。
【關(guān)鍵詞】 大數(shù)據(jù) 局限性 理性
一、大數(shù)據(jù)時(shí)代的到來
提到“大數(shù)據(jù)”,需要對(duì)“數(shù)據(jù)”的重要性做簡單的分析。本質(zhì)上數(shù)據(jù)都是人創(chuàng)造的,它伴隨人類歷史的發(fā)展,從古至今一直影響著人類的思考、行為,改變著人類的世界觀、價(jià)值觀。
大數(shù)據(jù)時(shí)代的核心仍然是數(shù)據(jù)。傳統(tǒng)數(shù)據(jù)是一個(gè)個(gè)數(shù)字或者可以進(jìn)行編碼的簡單文本,是一種結(jié)構(gòu)化的信息量,分析起來要簡單很多。
而大數(shù)據(jù)卻包羅萬象,以文本、圖片、視頻、音頻等等眾多形式出現(xiàn)。它包含很多非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。
麥肯錫是研究大數(shù)據(jù)的先驅(qū),在其報(bào)告中給出的大數(shù)據(jù)定義是:大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫工具獲取、存儲(chǔ)、管理和分析能力的數(shù)據(jù)集。但它同時(shí)強(qiáng)調(diào),并不是說一定要超過特定TB 值的數(shù)據(jù)集才能算是大數(shù)據(jù)。
維基百科對(duì)于大數(shù)據(jù)的描述是在無法容許的時(shí)間里,用常規(guī)軟件對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合。
大數(shù)據(jù)時(shí)代的到來與其說是人類智慧的創(chuàng)造性成果,不如說是對(duì)于信息爆炸時(shí)代處理海量信息的一種無奈的解決方法。
二、大數(shù)據(jù)的技術(shù)特點(diǎn)
任何一種新技術(shù)的應(yīng)用都是水到渠成的結(jié)果,假如環(huán)境沒有準(zhǔn)備好,無論什么樣的技術(shù)想取得預(yù)期的效果都是極為困難的,大數(shù)據(jù)應(yīng)用對(duì)于環(huán)境的要求是極其苛刻的。
Volume、Velocity、Variety、Veracity是大數(shù)據(jù)的4V特點(diǎn),處理數(shù)量巨大、結(jié)構(gòu)復(fù)雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合自然不能僅僅使用單一簡單的技術(shù)來完成。
大數(shù)據(jù)是基于云計(jì)算的移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)、電子商務(wù)、智慧城市的跨界融合。云計(jì)算廣泛應(yīng)用了分布式技術(shù),它是一個(gè)體系架構(gòu),包含分布是數(shù)據(jù)處理技術(shù)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫等。
正是云技術(shù)給了人們廉價(jià)獲取海量計(jì)算和存儲(chǔ)的能力,使大數(shù)據(jù)處理技術(shù)成為可能。
三、大數(shù)據(jù)應(yīng)用的副作用
3.1大數(shù)據(jù)應(yīng)用需要更多理性思考
大數(shù)據(jù)的熱潮其提出之初就被人們所預(yù)料到。
麥肯錫稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長和消費(fèi)者盈余浪潮的到來?!?/p>
然而,在大數(shù)據(jù)熱一浪高過一浪之時(shí),很需要給大數(shù)據(jù)潑一盆涼水降降溫。
信息化宣傳言過其實(shí)已經(jīng)是“新常態(tài)”,人們宣傳數(shù)據(jù)庫、信息共享、物聯(lián)網(wǎng)、云計(jì)算,發(fā)布會(huì)和研討會(huì)上這些新事物、往往賦予了它超過現(xiàn)實(shí)本身的意義。
每次都會(huì)描述一個(gè)無限樂觀的前景,然而現(xiàn)實(shí)的發(fā)展和人們本來的預(yù)期并不是同樣的軌跡。信息化效益不是一個(gè)短期工程,技術(shù)亦不是最關(guān)鍵的因素,理性的思考才是長久之計(jì)。
3.2大數(shù)據(jù)熱產(chǎn)生的浮躁社會(huì)氛圍
縱觀人類歷史,人們對(duì)于預(yù)測未知的熱衷從未消失過。現(xiàn)實(shí)世界中,缺少實(shí)時(shí)記錄的工具,許多行為看起來是“人似秋鴻有來信,事如春夢了無痕”,互聯(lián)網(wǎng)“處處行跡處處痕”的特點(diǎn)確實(shí)為人們發(fā)現(xiàn)規(guī)律,預(yù)測未來提供可能。
非理性的宣傳夸張了大數(shù)據(jù)的成果,增大了大數(shù)據(jù)的迷惑性,大數(shù)據(jù)在這種影響下變得無所不能。我們不能盲目神化大數(shù)據(jù)。
3.3大數(shù)據(jù)應(yīng)用的局限性和危害
“大數(shù)據(jù)”,簡單來說就是無限規(guī)模的數(shù)據(jù)量。需要正確認(rèn)識(shí)的是接收海量的信息帶來的并不一定是可以高效利用的信息。
在這個(gè)信息爆炸的時(shí)代,整個(gè)互聯(lián)網(wǎng)充斥著大量負(fù)面、虛假的信息。在利用大數(shù)據(jù)技術(shù)分析數(shù)據(jù)時(shí),這些信息可能會(huì)使“規(guī)律”變得“非規(guī)律”。
例如在教育方式的選擇問題上,如果利用大數(shù)據(jù)分析,我們貌似從海量數(shù)據(jù)中把握出了多數(shù)人接收知識(shí)的“規(guī)律”,然而對(duì)于那些并不適合的孩子來說就應(yīng)該被所謂的“規(guī)律”所限定發(fā)展,被“規(guī)律”所拖垮嗎?
數(shù)據(jù)的增長并不意味著有用信息的增長,更不意味著人們放棄獨(dú)立思考、獨(dú)立決策的能力。過度膨脹的數(shù)據(jù)讓人們在遇到具體問題時(shí)過分依賴網(wǎng)絡(luò)搜索查詢,這在一定程度上限制了人們智慧的創(chuàng)造性。
大數(shù)據(jù)規(guī)律始于分析者的感覺和猜測,是一種人為創(chuàng)新和思想成果,分析結(jié)果除了技術(shù)層面還受分析者本身文化層次和悟性的影響,規(guī)律的主觀性不可避免,大數(shù)據(jù)的虛假規(guī)律也不可避免。
這在很大程度上構(gòu)成了大數(shù)據(jù)的局限性。大數(shù)據(jù)說到底僅僅是一種工具,走向成功,獨(dú)立思考,發(fā)揮思維的創(chuàng)造性是關(guān)鍵問題。