摘 ?要:隨著現(xiàn)代電子信息技術的發(fā)展,產生的數據日益增多,人們已經處于大數據時代中。同時,又因為受到數據數量大、種類多、結構化、半結構化或非結構化的影響,需要快速處理的情況,絕大部分的傳統(tǒng)大數據保護技術已經無法再適用于如今的大數據環(huán)境。因此,近年來提出了許多大數據的安全保護方法和技術。作者通過對大數據環(huán)境下數據的研究,從數據安全的角度深入分析了它的具體情況以及解決方法,并探討了它的未來發(fā)展趨勢。
關鍵詞:大數據;數據特性;時代分析;數據安全
中圖分類號:TP393.08 ? ? ? 文獻標識碼:A 文章編號:2096-4706(2019)18-0129-02
Abstract:With the modern electronic information technology exhibition,the data produced is growing day by day,people are already in the era of big data. At the same time,most of the traditional big data protection technologies can no longer be applied to the big data environment due to the large amount and variety of data,structured or semi-structured or unstructured,and the need for fast processing. Therefore,many security protection methods and technologies for big data have been proposed in recent years. Through the study of data in the big data environment,the author makes an in-depth analysis of its specific situation and solutions from the perspective of data security,and discusses its future development trend.
Keywords:big data;data characteristics;analysis of the times;data security
0 ?引 ?言
在信息社會高度發(fā)達的今天,大數據已經滲透進生活的方方面面、各行各業(yè),在衣食住行各方面,都可以做到未卜先知。然而,隨著數據價值的持續(xù)生長、規(guī)模的不斷壯大,利用大數據技術在改善社會生活生產的同時,也產生了棘手的安全問題,其中最為值得注意的便是數據自身的安全。所以,本文就數據安全這一問題產生的原因以及解決方法進行了分析。
1 ?大數據的概念及特性
大數據的定義較為寬泛抽象,不過也可以簡單地進行理解。什么是大數據[1],從字面理解的話可能是表述數量或者表述質量的數據,事實上并不只是如此。大數據是指無法在一定時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數據集合,它的數據量遠遠超過任何一臺計算機能夠處理的數據量。
相對于傳統(tǒng)數據而言,大數據具有明顯的5V特性,其中分別是數量大(volume)、速度快(velocity)、種類多(variety)、識別度低(varacity)、價值密度低(value)。另外,大數據規(guī)模仍將繼續(xù)增長,未來甚至預計能夠達到EB、ZB,這側面也反映出了利用技術手段處理大數據時的效率必須要高。
如果根據數據來源不同進行分類,大數據可以主要分為3類[2]:(1)人機交互活動。人們在使用互聯(lián)網(包括移動互聯(lián)網)過程中所產生的多種類型數據;(2)計算機(主要是電腦)。各種計算機系統(tǒng)或者與計算機有關的系統(tǒng)產生的數據,多以圖像音頻等文件、關系型非關系型等數據庫、聲音數據等信息載體形式存在;(3)物理世界。各類電子數字設備所采集的數據,比如水電網系統(tǒng)采集設備所收集的海量水電網數據、聲頻監(jiān)控系統(tǒng)產生的海量聲頻數據等。
2 ?大數據時代問題分析及解決建議
為了能夠較好地理解大數據以及大數據時代下的數據行為,就大數據環(huán)境下數據分析過程中存在的問題,作者提出以下兩點意見。[3]
2.1 ?培養(yǎng)萬維網時代下的大數據思維
目前,我國以大數據為產業(yè)的經濟得到了飛速發(fā)展,大數據幾乎與所有的互聯(lián)網公司都有所關聯(lián),甚至形成了一種共生關系。其中也包括一些我們耳熟能詳的互聯(lián)網公司。在美國,亞馬遜每天都要處理數以億萬計的數據,這些數據容量已經達到國家圖書館中所含數據的幾萬倍,如今甚至更多。在中國,淘寶光是每天的物品詳情圖片超過數億張、視頻大小超過上萬TB。從很大的程度上來說,大數據的來源就是互聯(lián)網應用。大數據技術的內在邏輯基礎或內在哲學基礎即為大數據思維[4]。從對數據的整理,就可以看出擁有大數據思維的重要性,甚至還有學者提出,在所謂的大數據時代下,最核心的不是大數據用途,也不是大數據技術,而是不常被人提及、甚至被人忽略的大數據思維。
2.2 ?構建大數據環(huán)境下的數據資源保障體系
一個國家或者地區(qū)可以通過多種技術手段進行數據整合,建立一個能滿足社會國家在各個方面的數據分析需求的系統(tǒng),即數據資源保障體系。經過數十年的大數據發(fā)展,我國的資源體系發(fā)生了一系列的改變,從文獻資源到數據資源,再到數據服務和消費資源,取得了明顯的進展。各個地區(qū),乃至全國,經過實踐形成了各個地區(qū)中心的服務體系。除此之外,也從不同方向研究數據保障系統(tǒng)體系的建設,發(fā)表了一系列的研究成果。不難發(fā)現(xiàn),數據資源保障體系的建立具有舉足輕重的意義,包括我們熟知的醫(yī)療體系、檔案體系、以及案卷體系等。
3 ?安全問題涉及的方面與由來分析
3.1 ?個人方面
在現(xiàn)實生活中,當用戶下載手機應用時,往往會彈出是否允許訪問信息和手機聯(lián)系人等的詢問框,這就意味著該用戶將面臨信息泄露的風險,原因在于大數據時代,用戶如果想使用大數據帶來的服務就無法阻止個人信息直接或間接地泄露。其實,國家層面也認識到這方面的問題,不僅出臺了相關政策整治這一現(xiàn)象,甚至下架了大數據APP或其他相關種類的軟件應用,不過效果甚微,因為我們平日里的生活就與數據息息相關,就連QQ、微信等常用軟件也需要獲得用戶信息。當然,不僅是手機,大部分情況下使用互聯(lián)網設備或者互聯(lián)網時包含著種種不確定的因素,數據安全存在著極大地隱患,也讓人們的信息安全和財產受到了巨大的威脅。
3.2 ?企業(yè)方面
在企業(yè)單位里,企業(yè)可以利用數據分析及采集技術處理各種數據以便獲取有效價值,黑客也可以通過同樣或者其他的方式向企業(yè)或個人發(fā)起攻擊,而這時候大數據技術無疑又為黑客進行更精確的攻擊提供了幫助,弊端也就顯示出來。黑客這一職業(yè)我們并不陌生,既然有了信息技術所帶來的便利,就會有信息漏洞所帶來的威脅,而黑客更加青睞的就是相對金錢而言不被人們或企業(yè)引起重視的各人數據信息了。事實上,有時候竊取的數據的價值遠比實體利益更加重要。同時,企業(yè)還包含著許多私人的信息,無論是普通企業(yè)或是對大數據技術利用已經成熟的互聯(lián)網企業(yè),不可否認的是它們對數據安全的保護措施并不是無懈可擊,就連中國電子巨頭阿里巴巴也曾被入侵過。
3.3 ?國家方面
在大數據時代,國家安全需直面數據信息戰(zhàn)與網絡恐怖主義,國家在軍事、文化、經濟、生態(tài)、資源、核等領域對網絡的依賴性不斷增加,通過網絡這一樞紐直接使得國家安全面臨巨大威脅。甚至大多學者提到過,通過分析近代世界戰(zhàn)爭,從水陸空作戰(zhàn)到太空作戰(zhàn),從機械化作戰(zhàn)到智能化作戰(zhàn),這些都不及網絡化作戰(zhàn)來的恐怖,而且,它造成的后果將不可估量。目前來看,國家的數據安全保護相對更為嚴密,雖然不曾聽聞過國家的數據被入侵、被泄露的消息,但是它的數據來源太廣,也很難做到各方面的保護。就比如,美軍曾使用一款叫做“斯特拉瓦”的健身運動軟件,結果幾乎是毫不保留地將美國太平洋地區(qū)的軍事基地的地理位置信息告知于眾。
4 ?大數據的數據安全
首先在大數據時代,來源眾多的多源數據信息被瀏覽器、萬維網相關設備、多數應用軟件等所收集,并且數據來源廣泛、種類多樣。那么,保證所收集的數據的真實性以及對數據前后輸入輸出進行前端和后端的完整性校驗,以主流數據庫Microsoft旗下的SQL Server和甲骨文公司旗下的Oracle為例,數據庫管理平臺在對數據進行存儲使用時,都會以保持數據的完整性為前提,可見保證數據真實性以及完整性是至關重要的。另外,大量數據在大數據平臺聚集時,來自多個用戶的數據可能存儲在同一個數據池中,然而這些數據可能會分別被非法或不同用戶盜取使用,這樣就會直接導致數據安全問題出現(xiàn),其危害性更是不言而喻。為了解決這類問題,就要求一種相應技術實施,即要實現(xiàn)數據的“不可見不可用”效應,在未得到他人的允許授權情況下不可以查看數據庫內容,在看不見數據庫內容的情況下不可以對數據進行使用,為此必須完善訪問控制權限,強化數據隔離操作,否則極有可能會引發(fā)數據泄露風險。其次,大數據技術[5]促使數據的生命周期由簡單的單鏈條逐漸演變成為復雜的多鏈條形態(tài),不僅增加了共享、交易等環(huán)節(jié),而且數據應用場景和參與角色愈加多樣化。此外,利用大數據對數據進行分析所得的結果可能包含涉及國家、社會穩(wěn)定等的敏感信息,因此必須對分析結果的使用加強管理,否則一經泄露,將威脅國家社會安全。
總之,隨著大數據的不斷發(fā)展,數據安全問題必將得到完整系統(tǒng)地解決,至于有什么方法、用什么技術、達到什么效果,在這個科技技術飛速發(fā)展的時代之中,未來我們一定會見證它的產生與成功。[6]
5 ?結 ?論
在大數據到來之前,我們接觸更多的是物聯(lián)網、互聯(lián)網、云計算等,到現(xiàn)在為止,從新興到成熟的大數據技術又是引起信息產業(yè)的又一顛覆性信息技術革命。與此同時,如何保護大數據的數據安全自然成為了研究大數據的重點、難點和熱點。本文先通過介紹大數據的概念以及特點,然后去分析大數據時代的形式,給出相應的建議之后,進一步引出文章主題——數據安全涉及的方面及由來情況,分別闡述了數據安全在個人、企業(yè)、國家層面面臨的挑戰(zhàn)和危險,最后得出數據安全的研究進展,并且探討其未來的發(fā)展趨勢。
參考文獻:
[1] 朱瀅穎.什么是大數據 [J].數字通信世界,2018(4):283-284.
[2] 魏凱敏,翁健,任奎.大數據安全保護技術綜述 [J].網絡與信息安全學報,2016,2(4):1-11.
[3] 王淞.大數據時代信息分析的關鍵問題、挑戰(zhàn)與對策 [J].計算機產品與流通,2019(6):131.
[4] 劉偉偉,何偉華.大數據思維的真理觀 [J].晉中學院學報,2019,36(2):22-26.
[5] 鄭宗煜.大數據技術及其在運營商經營分析中的運用 [J].現(xiàn)代工業(yè)經濟和信息化,2019,9(4):59-60.
[6] 姚鑫.大數據中若干安全和隱私保護問題研究 [D].長沙:湖南大學,2018.
作者簡介:劉家銘(1999-),男,漢族,江西南昌人,本科在讀,研究方向:軟件工程。