王 媛
(中國聯(lián)合網(wǎng)絡(luò)通信有限公司安順市分公司,安順 561000)
現(xiàn)階段,各個領(lǐng)域中開始大量運用數(shù)據(jù),在信息技術(shù)領(lǐng)域中,大數(shù)據(jù)是繼云計算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)之后又一顯著標志。因其數(shù)據(jù)系統(tǒng)的復(fù)雜性和龐大性,加大了人們深入分析和研究數(shù)據(jù)信息的難度。對于這種復(fù)雜的數(shù)據(jù)系統(tǒng),處理和管理起來更需要全面的安全以及隱私保護,然而現(xiàn)階段大數(shù)據(jù)的信息安全問題和隱私問題越來越突出,整個信息技術(shù)行業(yè)都應(yīng)該引起高度的重視,同時積極尋求有效的解決方案。
大數(shù)據(jù)指規(guī)模龐大而又復(fù)雜的數(shù)據(jù),而且必須用新型的處理模式進行處理,通常也被稱為巨量數(shù)據(jù)集合。高速性、多樣性記憶大規(guī)模性是大數(shù)據(jù)的主要特點[1]。大數(shù)據(jù)主要由人、物、機中得來:由人得來的數(shù)據(jù)主要是指人們在對互聯(lián)網(wǎng)的使用過程中留下的信息數(shù)據(jù),比如文字、圖像以及視頻等。由物得來的數(shù)據(jù)主要是指通過各類設(shè)備采集而來的數(shù)據(jù);由機得來的數(shù)據(jù)則指的是通過計算機系統(tǒng)產(chǎn)生的數(shù)據(jù)。目前在各個領(lǐng)域中,大數(shù)據(jù)的運用頗為廣泛,其主要意義不單是掌握大量數(shù)據(jù),更重要的是如何處理大量復(fù)雜的信息,讓大數(shù)據(jù)技術(shù)產(chǎn)生的效益實現(xiàn)最大化。
大數(shù)據(jù)比傳統(tǒng)的數(shù)據(jù)庫擁有更多的信息量,分析和查詢的難度也相對較大。大數(shù)據(jù)具有規(guī)模大、多樣性、高速性、較大價值性和雙面性等特點。第一是規(guī)模大,大數(shù)據(jù)的信息量非常巨大,在2015年就高達了8ZB;第二是多樣性,大數(shù)據(jù)中的數(shù)據(jù)信息類型豐富多樣,其中包含視頻、圖像、圖片、文字以及音頻等;第三是高速性,在新形勢下,人們都希望能快速的獲取信息,而大數(shù)據(jù)從大量信息中提取到人們想找的信息只需要一秒鐘;第四是價值性,只要人們對大數(shù)據(jù)進行合理應(yīng)用,將會收獲到許多有價值的回報;第五是雙面性,大數(shù)據(jù)的應(yīng)用有利也有弊,不僅可以獲得極大的效益,同時又有諸多不良影響和弊端存在。
主要分為結(jié)構(gòu)化和非結(jié)構(gòu)化兩種數(shù)據(jù)類型,對結(jié)構(gòu)化數(shù)據(jù)進行保護時應(yīng)該對用戶的數(shù)據(jù)發(fā)布狀態(tài)以及次數(shù)作出明確規(guī)定,這也是數(shù)據(jù)保護的重要前提,也就是一次靜態(tài)發(fā)布[2]。在此形勢下,對標識符進行屬性分組,將相同屬性分一組,以便于對匿名信息集中處理,其中有元祖泛化和抑制處理兩種分組處理方式。將匿名模式設(shè)置為K 匿名,這種匿名處理方式具有一定的普適性,但如果單一標識符屬性較為特殊,就不能將這種模式的作用充分發(fā)揮出來。站在理論的角度來看,這種數(shù)據(jù)匿名技術(shù)具有可行性,但在實際情況中,卻不能有效滿足前提條件,不能一次性完成用戶數(shù)據(jù)發(fā)布。進而為攻擊者提供了可乘之機,讓其可以從不同發(fā)布點對收集整理各用戶的信息。非結(jié)構(gòu)化數(shù)據(jù)指的是通過邊和點組成的圖結(jié)構(gòu)數(shù)據(jù),然而攻擊者的切入點正是點和邊的屬性,因此應(yīng)該嚴格把控點和邊是安全和保護技術(shù)。在進行用戶標識匿名以及用戶信息點屬性匿名處理過程中,運用措施主要讓其毫無可見性,針對邊屬性的匿名處理時,應(yīng)該將傳遞信息的雙方用戶間的連接關(guān)系設(shè)置成僅對方可見,這樣攻擊者就看不見隱藏的信息了。
水印技術(shù)也就是將可標識信息基于不對數(shù)據(jù)使用和數(shù)據(jù)信息產(chǎn)生影響上,用一些很難發(fā)現(xiàn)的方式在數(shù)據(jù)載體中嵌入,這種方法在多媒體數(shù)據(jù)版權(quán)保護中較為常見。在具體實施的過程中,可以借助集合的方式在某一固定的屬性中嵌入數(shù)據(jù),這種方式可以有效防止數(shù)據(jù)攻擊者破壞水印。此外,可借助在水印中錄入數(shù)據(jù)庫指紋,將信息的所有者和被分發(fā)的對象識別出來,這對在分布式環(huán)境下追蹤泄密者極為有利。除此之外,可以運用獨立分析技術(shù),這樣能夠?qū)o密鑰水印驗證順利實現(xiàn),使數(shù)據(jù)的安全性得到保證。同時,還可以運用數(shù)據(jù)溯源技術(shù),因為數(shù)據(jù)的來源多種多樣,因此應(yīng)把數(shù)據(jù)的來源和其計算、傳播的過程記錄好,確保之后的決策和挖掘有據(jù)可循。
就結(jié)構(gòu)化數(shù)據(jù)而言,想要對用戶數(shù)據(jù)隱私和和安全進行徹底保護,其中關(guān)鍵之處是對數(shù)據(jù)的匿名保護,這種技術(shù)應(yīng)該被不斷的挖掘和完善。目前數(shù)據(jù)發(fā)布匿名保護技術(shù)的基礎(chǔ)理論有很多,設(shè)動環(huán)境對于數(shù)據(jù)的發(fā)布應(yīng)該是靜態(tài)地、一次性的。比如在對標識符分組的過程中可以利用抑制處理以及元祖泛化,在匿名處理有共同屬性的集合時運用K 匿名模式,然而這樣很容易遺漏某種特殊屬性。但在一般情況下,現(xiàn)實有較強的變化性,一般數(shù)據(jù)都是多次、連續(xù)的發(fā)布。大數(shù)據(jù)的環(huán)境非常復(fù)雜,對于實現(xiàn)數(shù)據(jù)發(fā)布的匿名保護技術(shù)有較大的難度。攻擊者可以根據(jù)發(fā)布點的不同以及渠道的不同獲取各種信息,借此助力,確定好其中一個用戶的信息。信息科技的研究人員對于這一點還應(yīng)該花費更多的精力對其更深入的研究。
以角色為基礎(chǔ)的訪問控制是現(xiàn)階段使用最為普遍的訪問控制模型,角色訪問控制最初運用的是“由上而下”的模式,但是現(xiàn)階段人們發(fā)現(xiàn)在這種模式下,可以將算法的編制順利完成,可以更好地完成角色的優(yōu)化和自動提取,以對用戶角色進行整合和分配的方式,使用戶的相關(guān)權(quán)限得到有效控制,同時實現(xiàn)優(yōu)化植絨和角色提取[3]。角色挖掘技術(shù)除了可以為用戶提供更好地服務(wù),同時還可以對一些用戶行為進行監(jiān)控。使用此技術(shù),確保了大數(shù)據(jù)發(fā)展的安全性。但是現(xiàn)階段想要廣泛運用還需將數(shù)據(jù)集的動態(tài)變更等問題。
隨著大數(shù)據(jù)的迅猛發(fā)展,其在帶給我們諸多方便的同時,也出現(xiàn)了各種各樣不安全的因素。若是要有效保護但數(shù)據(jù)的隱私、確保大數(shù)據(jù)安全,就應(yīng)以大數(shù)據(jù)安全漏洞為切入點,積極發(fā)展,采用各種保護技術(shù),將安全問題有效解決,使個人隱私得到有效保護。相信在社會的不斷發(fā)展下,這些問題都可以被解決。