劉梅 梁倩
關(guān)鍵詞:大數(shù)據(jù);網(wǎng)絡(luò)信息安全;數(shù)據(jù)預(yù)測(cè);安全威脅;隱私保護(hù)
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2024)03-0075-03
0 引言
隨著信息爆炸式增長(zhǎng),繼網(wǎng)格計(jì)算、云計(jì)算和物聯(lián)網(wǎng)之后,大數(shù)據(jù)成為一項(xiàng)新興熱門技術(shù)。它給人們的生活和工作帶來(lái)便利的同時(shí),也帶來(lái)了新的安全威脅。網(wǎng)絡(luò)信息安全已經(jīng)成為一級(jí)學(xué)科網(wǎng)絡(luò)空間安全的核心[1]。黨的十八屆五中全會(huì)通過(guò)了“十三五”規(guī)劃建議,這份未來(lái)五年綱領(lǐng)性指導(dǎo)文件中6次提到了網(wǎng)絡(luò)信息安全。先前浙江烏鎮(zhèn)舉行的主題為“互聯(lián)互通·共享共治——共建網(wǎng)絡(luò)空間命運(yùn)共同體”的世界互聯(lián)網(wǎng)大會(huì),充分體現(xiàn)了信息安全問(wèn)題越來(lái)越受到國(guó)家層面的高度重視以及全社會(huì)的廣泛關(guān)注。然而,現(xiàn)有網(wǎng)絡(luò)信息安全中存在的國(guó)產(chǎn)替代的自主核心技術(shù)缺失;建立的審查制度不夠嚴(yán)密;相關(guān)法律、法規(guī)、管理尚有空白等情況都是制約我國(guó)網(wǎng)絡(luò)信息安全發(fā)展的“短板”。網(wǎng)絡(luò)信息安全又是大數(shù)據(jù)應(yīng)用和安全的支撐保障,從而引發(fā)一系列的大數(shù)據(jù)安全問(wèn)題,目前存在形式較為嚴(yán)峻的包括有隱私信息的保護(hù)、算法實(shí)現(xiàn)的信任和數(shù)據(jù)泛濫的處理等核心問(wèn)題,針對(duì)這些問(wèn)題采用現(xiàn)有的PKI/對(duì)稱密鑰機(jī)制、代碼簽名與審計(jì)機(jī)制、數(shù)據(jù)隱水印機(jī)制等傳統(tǒng)方法,卻并不能完全解決上述核心問(wèn)題。例如大數(shù)據(jù)復(fù)雜環(huán)境下,采用PKI/對(duì)稱密鑰機(jī)制不能應(yīng)對(duì)合法的數(shù)據(jù)的使用者泄露數(shù)據(jù);如何將代碼簽名與審計(jì)機(jī)制運(yùn)用在分布式的云編程模式,如何實(shí)現(xiàn)非數(shù)據(jù)塊的數(shù)據(jù)流隱水印技術(shù),這些都是值得思考與研究的問(wèn)題。現(xiàn)有面向大數(shù)據(jù)安全的研究[2-3,5]大多都聚焦于以上核心問(wèn)題,但并沒有從體系架構(gòu)的角度考慮。
本文在大數(shù)據(jù)的內(nèi)涵與特點(diǎn)基礎(chǔ)上,從體系架構(gòu)上分析了大數(shù)據(jù)面臨的完全威脅,重點(diǎn)從基礎(chǔ)平臺(tái)、業(yè)務(wù)處理、用戶終端和共享使用四方面總結(jié)了相應(yīng)解決方案,最后介紹了大數(shù)據(jù)在高校和網(wǎng)絡(luò)安全方面的應(yīng)用。
1 大數(shù)據(jù)內(nèi)涵與特點(diǎn)
大數(shù)據(jù),或稱巨量數(shù)據(jù)集合,是指無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合[4]。
大數(shù)據(jù)具有6V+1C特點(diǎn)[5]:Volume(大量)、Veloc?ity(高速)、Variety(多樣)、Value(價(jià)值)、Variability(易變)、Veracity(真實(shí))、Complexity(復(fù)雜)。
2 大數(shù)據(jù)安全威脅及應(yīng)對(duì)方案
基于大數(shù)據(jù)自身特性,在數(shù)據(jù)的整個(gè)生命周期中,從數(shù)據(jù)采集、存儲(chǔ)、分析與應(yīng)用等都面臨各式各樣的安全問(wèn)題。
大數(shù)據(jù)安全從分層角度考慮,可分為應(yīng)用層的安全、數(shù)據(jù)層的安全、系統(tǒng)層的安全和設(shè)備層的安全;從體系架構(gòu)上考慮,可具體到基礎(chǔ)平臺(tái)的安全、業(yè)務(wù)處理的安全、用戶終端的安全和共享使用的安全,可再進(jìn)一步細(xì)分到數(shù)據(jù)和系統(tǒng)兩方面。解決大數(shù)據(jù)安全問(wèn)題須從體系架構(gòu)上規(guī)劃、設(shè)計(jì)和實(shí)施。根據(jù)圖1,下面從系統(tǒng)架構(gòu)的角度分別論述各模塊所存在的安全威脅以及相應(yīng)解決方案。
2.1 基礎(chǔ)平臺(tái)的安全
隱私數(shù)據(jù)泄密,是采用分布式編程框架的系統(tǒng)普遍存在的安全問(wèn)題。大數(shù)據(jù)系統(tǒng)架構(gòu)中,Airavat模型[6]是一個(gè)基于MapReduce框架的安全模型,它利用強(qiáng)制訪問(wèn)控制和差分隱私保護(hù)技術(shù)對(duì)分布式計(jì)算環(huán)境下的敏感數(shù)據(jù)提供較好的訪問(wèn)控制和安全隱私保護(hù)。其基于SELinux安全子系統(tǒng)為安全計(jì)算模型提供強(qiáng)制訪問(wèn)控制策略;采用的差分隱私保護(hù)技術(shù)可對(duì)來(lái)自數(shù)據(jù)源中的每組輸入數(shù)據(jù)進(jìn)行差分隱私處理,使任何單個(gè)數(shù)據(jù)項(xiàng)都不會(huì)對(duì)總的計(jì)算輸出結(jié)果產(chǎn)生太大的影響。
常用的非關(guān)系型數(shù)據(jù)庫(kù)(NoSQL) [7]是一種分布式的且不保證遵循ACID原則(即原子性、一致性、隔離性、持久性)的輕量級(jí)關(guān)系型數(shù)據(jù)庫(kù),它只解決了性能與擴(kuò)展問(wèn)題,卻并沒有考慮安全問(wèn)題。針對(duì)非關(guān)系型數(shù)據(jù)庫(kù)所存在的問(wèn)題,針對(duì)性地進(jìn)行安全加固,可采取的途徑包括:通過(guò)為NoSQL定制高性能的原子操作來(lái)確保事務(wù)完整性;通過(guò)為NoSQL提供Cluster集群節(jié)點(diǎn)強(qiáng)制認(rèn)證等機(jī)制來(lái)完善認(rèn)證機(jī)制;通過(guò)將NoSQL與系統(tǒng)的基于角色的訪問(wèn)控制相結(jié)合來(lái)完善授權(quán)機(jī)制;針對(duì)NoSQL 領(lǐng)域中存在的json-注入、array-注入、view-注入、rest-注入、gql-注入等類型的注入攻擊進(jìn)行檢測(cè);通過(guò)NoSQL內(nèi)部操作日志系統(tǒng)和日志分析系統(tǒng)來(lái)排除安全隱患。
2.2 業(yè)務(wù)處理的安全
隨著網(wǎng)絡(luò)化制造業(yè)的迅猛發(fā)展,產(chǎn)品借助互聯(lián)網(wǎng)或CD-ROM被復(fù)制、傳播和公開,盜版侵權(quán)現(xiàn)象日益猖獗,對(duì)數(shù)據(jù)版權(quán)保護(hù)的需求愈發(fā)強(qiáng)烈[8-9],數(shù)字水印技術(shù)應(yīng)運(yùn)而生。該技術(shù)是對(duì)數(shù)字制品的版權(quán)和完整性進(jìn)行保護(hù)的有效手段,其核心思想是當(dāng)數(shù)字作品出現(xiàn)侵權(quán)時(shí),可通過(guò)嵌入在數(shù)字作品中的隱蔽標(biāo)記來(lái)鑒別真?zhèn)巍Ec此同時(shí),在數(shù)據(jù)采集、分析和推廣過(guò)程中也能加強(qiáng)對(duì)違法來(lái)源的追蹤。
為增強(qiáng)數(shù)據(jù)來(lái)源的可信度,還可采用數(shù)據(jù)標(biāo)簽技術(shù)進(jìn)一步對(duì)“數(shù)據(jù)體制”進(jìn)行規(guī)范,從而對(duì)于后續(xù)的數(shù)據(jù)來(lái)源、合法性、傳播渠道等環(huán)節(jié)分析帶來(lái)巨大的幫助;并可完善與升級(jí)授權(quán)使用體制,運(yùn)用代碼與數(shù)據(jù)混合應(yīng)用模式和聯(lián)網(wǎng)授權(quán)管理機(jī)制來(lái)提升數(shù)據(jù)源的可信度。
2.3 用戶終端的安全
攻擊者可以通過(guò)制造惡意設(shè)備;克隆ID身份,以虛擬身份提供非法數(shù)據(jù);修改采集端應(yīng)用軟件;對(duì)采集網(wǎng)絡(luò)進(jìn)行中間人攻擊;利用采集端漏洞注入非法數(shù)據(jù)等方式向數(shù)據(jù)中心提供非法輸入,造成數(shù)據(jù)中心重要數(shù)據(jù)庫(kù)污染、DOS攻擊等安全威脅。
用戶對(duì)網(wǎng)絡(luò)服務(wù)使用可能帶來(lái)非可信數(shù)據(jù)的流入,最終導(dǎo)致用戶終端系統(tǒng)的可信性受到威脅。TPM 安全芯片[10-11]是一個(gè)基于密碼學(xué)的安全芯片,被可信計(jì)算組織倡導(dǎo)作為可信計(jì)算環(huán)境的硬件信任根,負(fù)責(zé)加密解密相關(guān)的運(yùn)算和密鑰的存儲(chǔ),除了能保護(hù)敏感數(shù)據(jù)之外,還具有一定的防篡改保護(hù)能力,可從終端上提高系統(tǒng)的安全性。基于TPM 芯片的采集端可實(shí)現(xiàn)用戶終端系統(tǒng)的校驗(yàn)功能和防篡改功能,由于造價(jià)便宜,容易得到用戶認(rèn)可,可廣泛推廣使用。
大數(shù)據(jù)環(huán)境下的云服務(wù)多種多樣,要求系統(tǒng)提供給用戶相對(duì)清晰簡(jiǎn)潔的服務(wù)接口,但系統(tǒng)內(nèi)部復(fù)雜的運(yùn)行機(jī)制對(duì)用戶并不透明,因此當(dāng)終端系統(tǒng)出現(xiàn)異常時(shí),難以實(shí)時(shí)掌握系統(tǒng)運(yùn)行信息,亟需開發(fā)專用云服務(wù)過(guò)濾器,實(shí)現(xiàn)采集信息的異常檢測(cè)與分析。
另外,為解決程序開發(fā)與交付代碼的不可信問(wèn)題,引入基于King.J.C的符合執(zhí)行方法,應(yīng)用于平臺(tái)各類組件的缺陷測(cè)試與分析中,可幫助提升程序代碼的可信度,其核心思想是利用“符號(hào)表達(dá)與計(jì)算”的方式來(lái)對(duì)程序所有可能的狀態(tài)進(jìn)行窮舉搜索,并篩選出其中的缺陷狀態(tài)部分。
2.4 基礎(chǔ)平臺(tái)的安全
數(shù)據(jù)的共享使用解決了數(shù)據(jù)孤島問(wèn)題,但同時(shí)也帶來(lái)了數(shù)據(jù)安全問(wèn)題。如何在數(shù)據(jù)共享使用過(guò)程中保護(hù)隱私安全,是一個(gè)棘手問(wèn)題。以政務(wù)管理系統(tǒng)為例,其數(shù)據(jù)分級(jí)、分類公開應(yīng)用,都需要重點(diǎn)關(guān)注處理敏感信息等隱私保護(hù)問(wèn)題,避免因泄露而陷入不可控局面。
為應(yīng)對(duì)共享使用的隱私保護(hù)安全問(wèn)題,常見采用數(shù)據(jù)匿名化[12]、安全多方和密文計(jì)算數(shù)據(jù)等技術(shù)手段。典型的數(shù)據(jù)匿名化技術(shù)有群簽名、環(huán)簽名、零知識(shí)證明和不經(jīng)意傳輸,其中零知識(shí)證明是證明者能夠在不向驗(yàn)證者提供任何有用信息的情況下,使驗(yàn)證者相信某個(gè)論斷是正確的,解決當(dāng)前認(rèn)證需求下的數(shù)據(jù)泄露問(wèn)題;不經(jīng)意傳輸是在顧客購(gòu)買商品的時(shí)候,供貨商無(wú)法獲知顧客所購(gòu)買的是什么商品,進(jìn)一步擴(kuò)展到什么時(shí)候以及如何買。安全多方技術(shù)可通過(guò)數(shù)據(jù)可取回性證明來(lái)實(shí)現(xiàn)。密文計(jì)算數(shù)據(jù)技術(shù)分可搜索加密技術(shù)和全同態(tài)加密技術(shù),可搜索加密技術(shù)[13]主要應(yīng)對(duì)存儲(chǔ)到云端的個(gè)人數(shù)據(jù)可能存在泄密的威脅,它提供的加密和密文直接檢索功能使服務(wù)器無(wú)法竊聽用戶個(gè)人數(shù)據(jù),但可以根據(jù)查詢請(qǐng)求返回目標(biāo)密文文件,這樣既保證了用戶數(shù)據(jù)的安全和隱私,又不會(huì)過(guò)分降低查詢效率;全同態(tài)加密技術(shù)[14]是一種密文計(jì)算數(shù)據(jù)技術(shù),它允許將敏感的信息存儲(chǔ)在遠(yuǎn)程服務(wù)器里,既避免從當(dāng)?shù)氐闹鳈C(jī)端發(fā)送泄密,又保證了信息的使用和搜索。
以云計(jì)算環(huán)境為例,云用戶發(fā)布數(shù)據(jù)在云服務(wù)器上共享,可以采用從粗粒度訪問(wèn)控制過(guò)渡到細(xì)粒度的訪問(wèn)控制與審計(jì)的方式,將業(yè)務(wù)模型中的對(duì)象加以細(xì)分,依據(jù)用戶對(duì)數(shù)據(jù)訪問(wèn)權(quán)限訪問(wèn)數(shù)據(jù)對(duì)象,同時(shí)對(duì)數(shù)據(jù)對(duì)象進(jìn)行更細(xì)化的審計(jì)工作。
3 大數(shù)據(jù)的應(yīng)用
3.1 大數(shù)據(jù)在高校中的應(yīng)用
高校中匯聚著大量的學(xué)生信息、教職工信息、教學(xué)數(shù)據(jù)、科研數(shù)據(jù)、就業(yè)數(shù)據(jù)、一卡通消費(fèi)數(shù)據(jù)、資產(chǎn)數(shù)據(jù)等各類數(shù)據(jù),涉及教學(xué)、科研、管理等各方面。
1) 人事管理方面:綜合各教職工的教學(xué)、科研等業(yè)績(jī)、歷史考核成績(jī)、評(píng)價(jià)、性情等各方面信息進(jìn)行分析研判,為干部選拔、人事考核提供判斷依據(jù)。
2) 學(xué)生管理方面:根據(jù)學(xué)生一卡通消費(fèi)等數(shù)據(jù)提供勤工助學(xué)活動(dòng)的參考依據(jù),根據(jù)學(xué)生成績(jī)、獲獎(jiǎng)、協(xié)會(huì)、興趣、愛好、特長(zhǎng)各方面分析,提供就業(yè)推薦及指導(dǎo)。
3) 教學(xué)科研方面:對(duì)學(xué)生專業(yè)、選課、成績(jī)、圖書館借閱、獲獎(jiǎng)、協(xié)會(huì)等方面進(jìn)行數(shù)據(jù)分析,提供研究方向選擇、導(dǎo)師選擇、畢業(yè)論文方向方面的指導(dǎo)等。
圖2展示了現(xiàn)有高校大數(shù)據(jù)體系架構(gòu)及應(yīng)用。在高校的學(xué)科規(guī)劃、心理咨詢、專家推薦、校友聯(lián)絡(luò)等各個(gè)具體應(yīng)用上,均可借助大數(shù)據(jù)分析技術(shù)挖掘數(shù)據(jù)中潛在的價(jià)值[15]。目前,不少高校都已經(jīng)意識(shí)到大數(shù)據(jù)對(duì)于高校信息化建設(shè)和校園工作的重要意義,并已經(jīng)開始著手研究大數(shù)據(jù)如何更高效地為校園工作服務(wù)。
西南交大計(jì)劃推出“大數(shù)據(jù)校園”,為學(xué)校決策提供數(shù)據(jù)支撐,通過(guò)有線網(wǎng)絡(luò)、Wi-Fi、一卡通、門禁卡等相關(guān)系統(tǒng),繪制出學(xué)生在校園里的“行為軌跡”模型,預(yù)測(cè)學(xué)生未來(lái)的發(fā)展?fàn)顩r。華東師范大學(xué)也正在將一卡通消費(fèi)數(shù)據(jù)與勤工助學(xué)結(jié)合起來(lái)。越來(lái)越多的高校都希望啟動(dòng)大數(shù)據(jù)研究和建設(shè)工作,數(shù)據(jù)的安全也是其中的焦點(diǎn)。
3.2 大數(shù)據(jù)在網(wǎng)絡(luò)安全中的應(yīng)用
1) 利用大數(shù)據(jù)平臺(tái)發(fā)現(xiàn)威脅和預(yù)測(cè)復(fù)雜攻擊:傳統(tǒng)APT攻擊[16]防護(hù)體系在應(yīng)對(duì)現(xiàn)有網(wǎng)絡(luò)信息安全中的零日攻擊、社會(huì)工程學(xué)、逃逸攻擊已逐漸顯現(xiàn)出其不足,利用大數(shù)據(jù)技術(shù),構(gòu)建APT攻擊的數(shù)據(jù)模型,加入主動(dòng)檢測(cè)技術(shù)和響應(yīng)流程,形成一套完整的APT攻擊防護(hù)體系,可解決傳統(tǒng)信息安全中邊界防御、多層防御無(wú)法避免的“被動(dòng)響應(yīng)”問(wèn)題。
2) 利用大數(shù)據(jù)平臺(tái)分析缺陷,快速定位軟件漏洞:通過(guò)對(duì)程序變量、內(nèi)存分配和存儲(chǔ)方式進(jìn)行分析來(lái)實(shí)現(xiàn)相應(yīng)的內(nèi)存重組織方法,用于跟蹤符號(hào)傳播過(guò)程,同時(shí)采用基于并行計(jì)算模型和相應(yīng)編程模式的Spark集群計(jì)算框架可優(yōu)化內(nèi)存集群計(jì)算中的迭代次數(shù),從而達(dá)到快速定位軟件漏洞的目的。
3) 利用大數(shù)據(jù)平臺(tái)實(shí)現(xiàn)虛擬機(jī)逃逸驗(yàn)證,設(shè)計(jì)與研發(fā)基于蘋果系統(tǒng)的Hypervisor[17]防逃逸技術(shù)。
4 結(jié)束語(yǔ)
大數(shù)據(jù)作為新時(shí)代經(jīng)濟(jì)與社會(huì)發(fā)展的“動(dòng)力源”和“驅(qū)動(dòng)力”,其體系框架現(xiàn)在還存在各式各樣的安全威脅,因此我們需加大力度投入大數(shù)據(jù)安全與應(yīng)用,著重培養(yǎng)大數(shù)據(jù)安全專業(yè)人才,加快研發(fā)大數(shù)據(jù)安全技術(shù),規(guī)范大數(shù)據(jù)平臺(tái)的建設(shè),全面提升大數(shù)據(jù)安全響應(yīng)速度和保障能力,同時(shí)也應(yīng)注意盡力縮小理論研究與實(shí)際應(yīng)用之間的差距。
【通聯(lián)編輯:王力】