鄭磊
“Big Data”俗稱“大數(shù)據(jù)”,是繼云計算之后的一項重大技術變革,自2009年從互聯(lián)網和信息技術行業(yè)流行以來,已在零售、金融、醫(yī)療衛(wèi)生、科學研究等多個行業(yè)、領域得到了廣泛的應用。
大數(shù)據(jù)存在四個基本特征
數(shù)據(jù)量巨大。大數(shù)據(jù)通常指10TB規(guī)模以上的數(shù)據(jù)量。由于互聯(lián)網的快捷方便,許多終端產品都接入互聯(lián)網,如此多的聯(lián)網的終端產品每天都會產生巨大的數(shù)據(jù)量。例如,手機、平板電腦、PC終端的通話、瀏覽的網頁等都會產生數(shù)據(jù)并被一些部門或者公司加以利用、分析或存儲。當前,普通個人計算機硬盤容量就為TB級,一些大企業(yè)的數(shù)據(jù)量已經接近EB量級,可稱海量、巨量乃至超量,傳統(tǒng)數(shù)據(jù)管理技術已經無法處理。
數(shù)據(jù)類型多。數(shù)據(jù)分為結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù),相對以往便于存儲的以文本為主的結構化數(shù)據(jù)。隨著傳感器種類的增多以及智能設備、社交網絡等的流行,數(shù)據(jù)類型也變得更加多種多樣化,未加工的、半結構化、非結構化數(shù)據(jù)越來越多,包括微博、日志、音頻、圖片等多種類型的數(shù)據(jù),這對數(shù)據(jù)的處理能力提出了更高的要求。
流動速度快。以前我們的數(shù)據(jù)處理大多在自己的電腦上,或者機構的大型計算機上進行,受限制于互聯(lián)網發(fā)展的不夠發(fā)達,傳輸速度的不夠迅速,數(shù)據(jù)流量很小,速度慢?,F(xiàn)在網絡已經足夠發(fā)達,傳輸速度有了很大的提升,但是數(shù)據(jù)量也開始急劇增加。數(shù)據(jù)流往往為高速實時的數(shù)據(jù)流,而且往往需要快速、持續(xù)的實時處理,相應的處理工具亦在快速發(fā)展和演進。
價值密度低。在大數(shù)據(jù)來臨的今天,數(shù)據(jù)量呈指數(shù)增長,隱藏在數(shù)據(jù)中的有用信息的比例卻沒有增長,價值密度的高低與數(shù)據(jù)總量的大小成反比。大數(shù)據(jù)的價值密度很低。例如一段幾個小時連續(xù)監(jiān)控的視頻,可能有重大價值的數(shù)據(jù)只有一兩秒鐘;每天數(shù)十億的搜索申請中,只有少數(shù)固定詞條的搜索量對某些分析有用處。這無疑給我們在巨量數(shù)據(jù)中獲取有用的信息增加了巨大的難度,因此,如何迅速做到數(shù)據(jù)的價值挖掘是目前大數(shù)據(jù)背景下亟待解決的難題。
大數(shù)據(jù)改變生活
大數(shù)據(jù)的出現(xiàn),對生產力的發(fā)展有著直接的推動作用,催生了大數(shù)據(jù)時代。大數(shù)據(jù)時代下,數(shù)據(jù)成了真正有價值的資產。云計算、物聯(lián)網等技術手段都是為數(shù)據(jù)服務開辟道路的。企業(yè)交易經營的內部信息,網上商品的物流信息,網上人人交互、人機交互信息等,都成為了擺在明面處的資產,盤活這些數(shù)據(jù)資產,可直接作用于個人的生活選擇、企業(yè)的決策甚至國家治理。大數(shù)據(jù)時代人們的生活發(fā)生了巨大的改變,主要體現(xiàn)在購物、交通、醫(yī)療、教育四個方面:
購物方面。當前網絡購物在改變我們傳統(tǒng)購物方式的基礎上,為電商提供了大量的信息。通過大數(shù)據(jù)分析,電商可以挖掘單個消費者的喜好,包括消費者經常買什么商品,偏向買什么品牌等,從而進行相關產品的推送。同時針對公眾對某一商品的需求,為商品供應商的生產活動提供參考。
交通方面。隨著網約車的合法化,乘客的需求數(shù)據(jù)可以通過移動互聯(lián)網傳給每位網約車司機,實現(xiàn)了移動互聯(lián)網線上與線下的融合,乘客無需路邊打車即可以享受“接駕待遇”。同時,網約車平臺通過數(shù)據(jù)分析,規(guī)劃出適合乘客出行的交通路線,最大程度上方便了乘客出行,降低空駛率,最大化節(jié)省司乘雙方資源與時間。
醫(yī)療方面。通過大數(shù)據(jù)集成平臺,醫(yī)院、醫(yī)生可以清楚知道患者的病史、用藥史等信息,患者無需攜帶以往的病歷卡即可就診。同時,集成平臺可以根據(jù)各醫(yī)院的患者數(shù)量合理分配醫(yī)療資源,實現(xiàn)醫(yī)療資源的最大化利用,也為患者的及時就醫(yī)提供了便利。
教育方面?;ヂ?lián)網在線教育改變了傳統(tǒng)教育模式,學生可以隨時、隨地接受教育。老師也可以通過大數(shù)據(jù)監(jiān)測學生的學習行為,了解每一封發(fā)出的郵件帶來的學生們的反饋。知識的獲取變得以學生為中心,人們不再需要傳統(tǒng)意義上的老師,老師的職責從傳道授業(yè)變成解惑。
我們該如何應對大數(shù)據(jù)時代
首先我們應當接受大數(shù)據(jù)給我們帶來的思維變革。先進數(shù)據(jù)科技的應用帶來了新的生產生活方式,人的思維方式也受到了極大影響,這種影響不僅僅存在于方法上、工具上,還有人類的認知能力和準確性也會大幅提高。因此身處大數(shù)據(jù)時代的我們要努力接受大數(shù)據(jù)給我們帶來的思維方式的改變。
其次我們應當具備大數(shù)據(jù)思維。大數(shù)據(jù)思維是一種意識,更是一種觀察世界和審視現(xiàn)實的新視角,即將世界看成信息,看成數(shù)據(jù)的海洋。積極獲取、積累數(shù)據(jù)信息,客觀分析,探索零碎事物間的關系,利用大數(shù)據(jù)為我們日常生活服務,這樣才能獲得大數(shù)據(jù)思維給我們帶來的益處。
除此之外,在大數(shù)據(jù)時代,當我們開始擴大數(shù)據(jù)規(guī)模的時候,就必然地要學會擁抱混雜。我們應當改變小數(shù)據(jù)時代追求精確性的思維方式,從而選擇接受混雜的思維方式,放棄“板上釘釘”的確定無疑,學會用概率說話。這樣我們才能適應大數(shù)據(jù)科技給我們帶來的改變,才能更好地利用大數(shù)據(jù),發(fā)展大數(shù)據(jù)。
大數(shù)據(jù)時代的到來,可以將記憶永久保存,這解決了人類過去延長記憶的問題,也給人們帶來了新的困擾和難題。超強的記憶并不能代表我們將有超強的學習能力,在大量記憶下來的信息中,提取有效信息,將其整理分析出有效的結果才是我們最終需要的學習能力。因此,大數(shù)據(jù)時代,除了有效的信息外,我們應當將大量的、無效的,或者過時的信息刪除并遺忘,這樣,大數(shù)據(jù)才不會對我們產生困擾和阻礙。
然而,大數(shù)據(jù)也有兩面性,雖然它能給經濟和社會發(fā)展帶來積極的作用,但同時也帶來了不利的影響。
從個人層面上看,大數(shù)據(jù)可能威脅到個人的隱私。由于在社會活動中的參與度提高,使用個人信息的場合也就越多,相應的個人信息的暴露程度也越高,這就難免會對個人隱私造成影響。
另外,人們可能把大數(shù)據(jù)分析的相關結論當成因果關系來用(比如,經過大量交通事故數(shù)據(jù)分析,發(fā)現(xiàn)紅色汽車發(fā)生交通意外的情況非常少,于是大家都去買紅色汽車),從而做出不科學也不合理的決策。
因此,大數(shù)據(jù)時代我們應該注重保護個人的隱私,對于重要的個人信息盡量不公開使用。除此之外,我們也不能過度依靠大數(shù)據(jù)分析得出的結果。大數(shù)據(jù)分析的結果可以為我們的決策提供參考,但并不能取代我們的決策,我們應該用辯證的眼光去對待大數(shù)據(jù)分析得出的結論。
總之,處在大數(shù)據(jù)時代的我們既要接受大數(shù)據(jù)思維,運用大數(shù)據(jù)思維,也要看到大數(shù)據(jù)時代存在的一些缺陷,做到取其精華去其糟粕。
欄目主持人:鄭賓 393758162@qq.com