摘 要:隨著大數據的發(fā)展,如何保障數據安全是當前急需解決的課題。本文首先分析了各行業(yè)內大數據下的諸多信息安全威脅和安全需求,然后提出了應對策略。
關鍵詞:大數據;網絡信息;安全需求;安全對策
中圖分類號:TP393.08
2011年5月,麥肯錫咨詢公司發(fā)布了《大數據:創(chuàng)新、競爭和生產力的下一個前沿領域》報告[1],首次提出“大數據”的概念。大數據被認為是一種數據量很大、數據形式多樣化的非結構化數據。它所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業(yè)經營決策更積極目的的資訊[2]。大數據主要有體量大、多樣性、價值密度低、速度快4個特點[3]。
隨著無處不在的智能終端、互動頻繁的社交網絡和超大容量的數字化存儲等信息體的普及,全球數據量出現爆炸式增長。據《數據中心2013:硬件重構與軟件定義》年度技術報告中統(tǒng)計,2013年中國產生的數據總量超過0.8ZB,預計到2020年,中國產生的數據總量將是2013年的10倍,超過8.5ZB。面對大數據發(fā)展的特點和挑戰(zhàn),如何保障數據安全是當前急需要研究的課題。
1 各行業(yè)的大數據安全威脅和需求
現在對互聯(lián)網、銀行、保險、醫(yī)藥、電信、金融和國防等行業(yè)為主的企業(yè)數據進行分析,找出潛在的安全威脅和需求[4-5]。
1.1 互聯(lián)網行業(yè)
據公開信息,百度每天要響應來自全球138個國家和地區(qū)的數十億次請求,每日新增數據達10TB,要處理超過100PB數據,要從浩如煙海的信息中精確抓取約10億網頁,還有100個PB以上的日志;1TB的百度推廣,1PB的百度貼吧、百度知道、百度文庫。
擁有近5億注冊用戶的阿里集團,隨著業(yè)務的爆發(fā)式增長,交易數據、用戶瀏覽和點擊網頁數據、購物數據等成倍增加。擁有4億移動用戶的騰訊QQ,在數據倉庫存儲的數據量單機群數量已達4400臺,總存儲數據量經壓縮處理后在100PB左右,這一數據還在以日新增200TB到300TB,月增加10%的數據量增長。
這些企業(yè)在應用大數據時,常會涉及數據安全和用戶隱私問題。因此,防止數據被損壞、篡改、泄露或竊取成為它們的安全威脅。可靠的數據存儲;安全的挖掘分析;嚴格的運營監(jiān)管;針對用戶隱私的安全保護標準、法律法規(guī)和行業(yè)規(guī)范就成為互聯(lián)網企業(yè)的大數據安全需求。
1.2 電信、金融、保險行業(yè)
目前,中國聯(lián)通部署了4.5PB的存儲空間用于集中記錄移動通信用戶上網查詢與分析支撐系統(tǒng)。主要運營商還記錄了用戶通話、信息、地理位置等信息數據,這些數據量都在10PB以上,總年度用戶數據增長約數十個PB。
中國銀聯(lián)公開的數據顯示,每天有近600億交易通過銀聯(lián)卡進行,如果再加上開戶信息數據,銀行網點和在線交易的各種數據,以及金融系統(tǒng)自身運營數據,每年數據達數十PB。
從這些數據的產生、存儲和分析看出,運營商在數據對外應用和開放過程中面臨著數據保密、用戶隱私、商業(yè)合作等安全威脅。因此,電信、金融、保險行業(yè)的安全需求是:期望利用大數據安全技術加強金融機構、保險行業(yè)的內部控制,提高金融、保險行業(yè)的監(jiān)管和服務水平,防范和化解金融、保險行業(yè)的風險。
1.3 公共安全、醫(yī)療、交通領域
隨著平安城市、智慧城市等工程的推進,監(jiān)控攝像頭已遍布大街小巷。以1080P高清網絡攝像機為例,它速度能達到每秒60幀,一個月產生的視頻文件就達1.8T。若某城市有這樣的攝像頭50萬個,一年保存下來的數據量就在數百PB以上。
有統(tǒng)計表明,中國一個一千萬人口的城市50年所積累的醫(yī)療數據達10PB。如此推算,整個醫(yī)療衛(wèi)生行業(yè),一年能保存下來的數據可達數百PB。隨著醫(yī)療數據的幾何倍增長,數據存儲是否安全可靠將影響到醫(yī)院業(yè)務的連續(xù)性,因此,公共安全、醫(yī)療、交通領域的安全需求是:數據隱私性高于安全性和機密性,同時需要安全和可靠的數據存儲、完善的數據備份和管理。
1.4 電力、石化系統(tǒng)行業(yè)
截至2013年底,國家電網累計安裝智能表1.82億只,實現采集1.91億戶,采集覆蓋率56%,一年采集獲得和保存下來的數據總量達近10PB。石油化工、智能水表等領域每年產生和保存下來的數據量也達這個級別。
從電力、石化系統(tǒng)行業(yè)產生和存儲的大量數據分析來看,企業(yè)需要進行有效的數據收集與分析,保障數據的完整性和安全性。在對外合作時,需要能準確地將外部業(yè)務需求轉換成實際的數據需求,建立完善的數據對外開放訪問機制。因此,確保核心數據與資源的保密性、完整性和可用性成為這些行業(yè)的安全需求。
1.5 氣象、教育、地理、政務等政府組織
目前,中國氣象局所保存的數據在4~5PB左右,每年還要增加數百個TB左右。公安部建成了覆蓋13億人口的國家人口數據庫;國家工商總局建成了企業(yè)法人數據庫;民政部和中央編制辦公室建成了社會團體和事業(yè)單位信息庫;全國四級國土資源主管部門積累了近6000TB的數據;國家統(tǒng)計局建成了統(tǒng)計信息庫;國家發(fā)展和改革委牽頭的自然資源和空間地理基礎信息庫正在加緊建設。金融、稅務、質檢、社保、教育等領域也都建成了一批信息庫。
如此多的數據庫的建立,安全威脅很大。在確保數據安全性的同時,要求具備強大的數據分析能力,能利用海量數據挖掘高價值情報,提高快速響應能力,實現決策自動化。因此,隱私保護的安全監(jiān)管、網絡環(huán)境的安全感知、大數據安全標準的制定、安全管理機制的規(guī)范等內容成為氣象、教育、地理、政務等政府組織對大數據安全的需求。
1.6 商業(yè)銷售、制造業(yè)、農林牧漁業(yè)、物流和流通等領域
隨著產業(yè)互聯(lián)網的普及,商業(yè)銷售、制造業(yè)、農林牧漁業(yè)、物流運輸業(yè)等這些傳統(tǒng)行業(yè)的數據量將呈現迅速增長態(tài)勢。這類數據有非結構化數據(產品的設計數據)和結構化數據(企業(yè)生產環(huán)節(jié)的業(yè)務數據和生產監(jiān)控數據)。它們不僅表現了企業(yè)當前運行的狀況,而且還要為企業(yè)進一步的發(fā)展提供有價值的分析決策,因此,數據的安全性、機密性和可靠的數據存儲、完善的數據備份和管理成為商業(yè)銷售、制造業(yè)、農林牧漁業(yè)、物流和流通等這些領域的安全需求。
2 大數據下的安全威脅所應對的策略
從上述的安全需求看出,當前信息安全主要來自三方面的威脅:一是大數據集群數據庫的數據安全威脅;二是數據虛擬化帶來的數據泄密威脅;三是各種智能終端的數據安全威脅。因而可從三個方面應對:首先加強大數據的信息安全體系建設以及運用更高級的大數據技術來防范高級的可持續(xù)攻擊。這需要整合大數據處理資源,協(xié)調大數據處理和分析機制,推動重點數據庫之間的數據共享,加快對高級可持續(xù)攻擊的建模進程,消除和控制高級可持續(xù)攻擊的危害。另外還要從大數據技術的研發(fā)力度、相關人才的培養(yǎng)以及完善大數據信息安全的體系幾個方面入手,最終達到保護大數據安全的目標。其次加快大數據安全技術的研發(fā)。最后要加大對各種大數據的管理力度,有效防止大數據中的信息泄漏。
3 結束語
網絡安全的提高必須有嚴格的保密規(guī)范、完善、明晰的安全策略以及高素質的網絡管理人才,才能保證更好地為網絡提供強大的安全服務。
參考文獻:
[1]孟小峰,慈祥.大數據管理:概念?技術與挑戰(zhàn)[J].計算機研究與發(fā)展,2013(01).
[2]郭三強,郭燕錦.大數據環(huán)境下的數據安全研究[J].計算機軟件及計算機應用,2013(02).
[3]潘柱廷.高端信息安全與大數據[J].信息安全與通信保密,2012(12).
[4]維克托·邁爾·舍恩伯格,周濤.大數據時代:生活?工作與思維的大變革[J].人力資源管理,2013(03).
[5]張炳劍.海量數據正在顛覆傳統(tǒng)商業(yè)思維[N].文匯報,2013(03).
作者簡介:薛文(1968-),山東萊陽人,男,副教授,研究方向:網絡安全、數據挖掘、人工智能。
作者單位:西安政治學院信息管理中心,西安 710068