天津科技大學(xué)人工智能學(xué)院 劉耕睿
大數(shù)據(jù)時(shí)代為社會(huì)發(fā)展帶來了變革。飛速發(fā)展的信息技術(shù)和互聯(lián)網(wǎng)技術(shù)為科技發(fā)展注入了新的動(dòng)力?;诨ヂ?lián)網(wǎng)技術(shù)的大數(shù)據(jù)技術(shù)、物聯(lián)網(wǎng)技術(shù)、云計(jì)算技術(shù),為社會(huì)發(fā)展帶來了全新的多元化信息資產(chǎn)。文章以大數(shù)據(jù)時(shí)代為背景,分析了大數(shù)據(jù)技術(shù)對計(jì)算機(jī)信息安全產(chǎn)生的影響,研究了計(jì)算機(jī)信息處理技術(shù)和計(jì)算機(jī)信息安全防護(hù)策略。
大數(shù)據(jù)技術(shù)是傳統(tǒng)計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)應(yīng)用的產(chǎn)物,涵蓋了數(shù)據(jù)信息處理技術(shù)、傳輸技術(shù)、應(yīng)用技術(shù),不能簡單地將大數(shù)據(jù)理解為大量數(shù)據(jù)的集合。國際信息咨詢公司Gartner表示:“大數(shù)據(jù)在某些層面已經(jīng)超越了現(xiàn)有計(jì)算機(jī)信息技術(shù)處理能力范圍,它是一種極端信息資源?!贝髷?shù)據(jù)技術(shù)已經(jīng)全面進(jìn)入社會(huì)各個(gè)行業(yè),為計(jì)算機(jī)信息安全提供保障。企業(yè)計(jì)算機(jī)信息網(wǎng)絡(luò)是大數(shù)據(jù)技術(shù)最典型的應(yīng)用案例。企業(yè)使用大數(shù)據(jù)構(gòu)建網(wǎng)絡(luò)安全防護(hù)體系,為企業(yè)計(jì)算機(jī)信息網(wǎng)絡(luò)提供安全保障,并幫助企業(yè)應(yīng)對隨時(shí)可能出現(xiàn)的網(wǎng)絡(luò)安全威脅。
智能化生產(chǎn)、無線網(wǎng)絡(luò)、大數(shù)據(jù),是改變?nèi)祟惿鐣?huì)發(fā)展模式的三大技術(shù)。從廣義的角度來說,大數(shù)據(jù)是巨大規(guī)模數(shù)據(jù)的統(tǒng)稱,人們可以從大數(shù)據(jù)中挖掘出不可估量的信息價(jià)值??偭看?、種類多、處理速度快、價(jià)值密度低,是大數(shù)據(jù)的主要特征。為了滿足大數(shù)據(jù)的特殊要求,大數(shù)據(jù)技術(shù)應(yīng)運(yùn)而生。遺傳算法、分類分析、聚類分析、機(jī)器學(xué)習(xí),都是大數(shù)據(jù)的關(guān)鍵學(xué)習(xí)。
計(jì)算機(jī)信息處理技術(shù)的主要作用是,傳輸數(shù)據(jù)、獲取數(shù)據(jù)、分析數(shù)據(jù)和處理數(shù)據(jù)。計(jì)算機(jī)技術(shù)、通信技術(shù)、網(wǎng)絡(luò)技術(shù)、微電子技術(shù)共同構(gòu)成了計(jì)算機(jī)信息處理技術(shù)。信息系統(tǒng)技術(shù)、數(shù)據(jù)技術(shù)、檢索技術(shù),是計(jì)算機(jī)信息處理技術(shù)的關(guān)鍵技術(shù)。信息處理技術(shù)的核心是計(jì)算機(jī)技術(shù)。數(shù)據(jù)庫技術(shù)為信息處理技術(shù)提供信息整合、信息存儲的功能;檢索技術(shù)為信息處理技術(shù)提供信息搜索和精確定位的功能。
大數(shù)據(jù)已經(jīng)成為世界各國的重要戰(zhàn)略資源。國家信息安全的競爭力取決于國家對大數(shù)據(jù)的研究深度、對大數(shù)據(jù)的運(yùn)用能力和對大數(shù)據(jù)的解釋能力。大數(shù)據(jù)已經(jīng)成為影響國家穩(wěn)定和信息安全的關(guān)鍵因素。大數(shù)據(jù)為我國各類新興產(chǎn)業(yè)創(chuàng)造了新的發(fā)展環(huán)境,也為我國傳統(tǒng)行業(yè)營造了良好的改革環(huán)境。新興產(chǎn)業(yè)蓬勃發(fā)展,傳統(tǒng)產(chǎn)業(yè)逐漸升級,這些都離不開大數(shù)據(jù)。在大數(shù)據(jù)時(shí)代,信息和數(shù)據(jù)已經(jīng)成為各個(gè)產(chǎn)業(yè)的關(guān)注重點(diǎn)。物聯(lián)網(wǎng)技術(shù)提高了生產(chǎn)效率,云計(jì)算技術(shù)加快了科研速度。大數(shù)據(jù)技術(shù)推動(dòng)了我國產(chǎn)業(yè)信息化和產(chǎn)業(yè)科技化的進(jìn)程。大數(shù)據(jù)時(shí)代對科學(xué)思維產(chǎn)生了影響,甚至掀起了一場科學(xué)思維的革命。大數(shù)據(jù)以其獨(dú)特的復(fù)雜程度激發(fā)了科研人員的研究熱情,越來越多的科研人員投身大數(shù)據(jù)研究中,不斷尋找各種定理和定律,希望一窺大數(shù)據(jù)的“真容”。
大數(shù)據(jù)技術(shù)改變了數(shù)據(jù)發(fā)掘方式和數(shù)據(jù)應(yīng)用方式,很多新興產(chǎn)業(yè)的發(fā)展都依賴大數(shù)據(jù)技術(shù)。大數(shù)據(jù)時(shí)代為信息安全、云計(jì)算、物聯(lián)網(wǎng)等新興技術(shù)提供了發(fā)展環(huán)境。大數(shù)據(jù)技術(shù)對信息安全的高度要求,加快了信息安全產(chǎn)業(yè)的發(fā)展,計(jì)算機(jī)信息處理技術(shù)保障能力重新回到大眾的視野。
大數(shù)據(jù)時(shí)代提高了數(shù)據(jù)挖掘的要求。數(shù)據(jù)收集必須全面、可信;數(shù)據(jù)存儲必須廉價(jià)、可靠;數(shù)據(jù)處理必須準(zhǔn)確、快速。大數(shù)據(jù)已經(jīng)被各行各業(yè)視為寶貴財(cái)富,無數(shù)的企業(yè)持續(xù)關(guān)注著大數(shù)據(jù)的無限潛力,這種情況導(dǎo)致計(jì)算機(jī)信息安全時(shí)時(shí)刻刻受到威脅。部分黑客開始故意攻擊存儲了大量信息的數(shù)據(jù)庫,非法泄露用戶數(shù)據(jù)。由于我國尚未形成有關(guān)大數(shù)據(jù)的完備立法,數(shù)據(jù)信息的所有權(quán)和使用權(quán)界定不明,而且個(gè)人數(shù)據(jù)一般都涉及個(gè)人隱私,無法使用單一法律解決違法犯罪問題。大數(shù)據(jù)是海量、多種、復(fù)雜數(shù)據(jù)的集合,為大數(shù)據(jù)提供安全保護(hù)必須采取特殊的防護(hù)手段和預(yù)防措施。具有優(yōu)越性特點(diǎn)的數(shù)據(jù)技術(shù)逐漸成為黑客們爭相進(jìn)攻的目標(biāo),這顯著提高了信息安全防護(hù)的難度。大數(shù)據(jù)技術(shù)是一種新興技術(shù),發(fā)展大數(shù)據(jù)技術(shù)必須培養(yǎng)新的專業(yè)人才。任何行業(yè)培養(yǎng)人才都需要一定周期。大數(shù)據(jù)人才的培養(yǎng)速度已經(jīng)嚴(yán)重落后于大數(shù)據(jù)技術(shù)的發(fā)展速度。我國大數(shù)據(jù)應(yīng)用面臨巨大的創(chuàng)新人才缺口。
DEEP WEB技術(shù)主要用于構(gòu)建深層網(wǎng)絡(luò)空間,其特點(diǎn)是信息規(guī)模大、信息變化快、訪問方式特殊。DEEP WEB技術(shù)充分挖掘數(shù)據(jù)價(jià)值,對數(shù)據(jù)進(jìn)行抽取和整合,最終產(chǎn)出高質(zhì)量數(shù)據(jù)集合。
分布式數(shù)據(jù)存儲技術(shù)由谷歌公司的GFS技術(shù)實(shí)現(xiàn),在百度、IBM等公司廣泛應(yīng)用。分布式存儲技術(shù)使用列形式存儲數(shù)據(jù)。列存儲相比行存儲,數(shù)據(jù)壓縮程度更高,數(shù)據(jù)循環(huán)更快。行列混合式存儲是目前最流行的數(shù)據(jù)存儲技術(shù)。這種技術(shù)吸收了行存儲和列存儲的優(yōu)點(diǎn),既可以快速加載數(shù)據(jù)、快速查詢數(shù)據(jù),也可以提高磁盤空間利用率。提高數(shù)據(jù)存儲總量、提高數(shù)據(jù)處理效率、優(yōu)化數(shù)據(jù)分布布局,是數(shù)據(jù)存儲技術(shù)的未來發(fā)展方向。
目前,應(yīng)用最廣泛的主流索引技術(shù)是誕生于谷歌公司的BUGTABLE技術(shù)。聚簇索引、互補(bǔ)式聚簇索引,是當(dāng)前索引技術(shù)的研究熱點(diǎn)。聚簇索引的原理是根據(jù)索引順序?qū)⑷繑?shù)據(jù)結(jié)構(gòu)存入數(shù)據(jù)庫?;パa(bǔ)式聚簇索引的原理是根據(jù)索引創(chuàng)建和索引表互補(bǔ)的索引列,使用結(jié)果估算法,對數(shù)據(jù)進(jìn)行最優(yōu)查詢。
數(shù)據(jù)挖掘的核心技術(shù)是網(wǎng)絡(luò)搜索和實(shí)體關(guān)聯(lián)。排序?qū)W習(xí)算法是當(dāng)前互聯(lián)網(wǎng)信息搜索領(lǐng)域的熱點(diǎn),其作用是從海量社會(huì)媒體信息中根據(jù)數(shù)據(jù)特點(diǎn)篩選信息,并對信息進(jìn)行逐對和逐列搜索。
遺傳算法和神經(jīng)網(wǎng)絡(luò)是大數(shù)據(jù)技術(shù)和生物技術(shù)的融合產(chǎn)物。大數(shù)據(jù)技術(shù)模仿生物技術(shù)的進(jìn)化規(guī)律,進(jìn)行數(shù)據(jù)隨機(jī)搜索。遺傳辦法是基于尋優(yōu)原則,使用概率化處理數(shù)據(jù),保證數(shù)據(jù)可以自動(dòng)調(diào)整搜索方式。機(jī)器學(xué)習(xí)、信號處理、物流選址等,都是遺傳辦法的具體應(yīng)用。神經(jīng)網(wǎng)絡(luò)來源于生物領(lǐng)域的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)算法借鑒動(dòng)物運(yùn)動(dòng)神經(jīng),建立了和動(dòng)物運(yùn)動(dòng)神經(jīng)類似的網(wǎng)絡(luò)行為,可以進(jìn)行分布式并行信息處理。
分類分析的作用是以歸類數(shù)據(jù)點(diǎn)為前提重新確定新的數(shù)據(jù)點(diǎn)。明確假設(shè)、客觀結(jié)構(gòu),是分類分析的前提條件。預(yù)測是分類分析的主要作用。聚類分析是在無限制或未知限制的情況下,對數(shù)據(jù)進(jìn)行分組和分析。分類分析和聚類分析都是常用的數(shù)據(jù)挖掘方法。
關(guān)聯(lián)規(guī)則學(xué)習(xí)是以尋找數(shù)據(jù)關(guān)聯(lián)規(guī)則為目的的數(shù)據(jù)處理。機(jī)器學(xué)習(xí)的研究核心是計(jì)算機(jī)模擬人類,使用計(jì)算機(jī)模仿人類的學(xué)習(xí)行為,使機(jī)器自主學(xué)習(xí)并更新知識體系。機(jī)器學(xué)習(xí)是人工智能的基礎(chǔ)技術(shù),也是人工智能的核心技術(shù)。數(shù)據(jù)發(fā)掘是關(guān)聯(lián)規(guī)則學(xué)習(xí)和機(jī)器學(xué)習(xí)的主要目的。
情感分析、網(wǎng)絡(luò)分析、空間分析、回歸分析、時(shí)域序列分析,都是數(shù)據(jù)分析技術(shù)的重要分支。情感分析著重分析自然語言,網(wǎng)絡(luò)分析著重研究網(wǎng)絡(luò)特征,空間分析著重研究拓?fù)?、幾何和地理編碼統(tǒng)計(jì)。
可視化技術(shù)的研發(fā)目的是方便人們理解數(shù)據(jù)、溝通分析結(jié)果??梢暬夹g(shù)可以將復(fù)雜的數(shù)據(jù)結(jié)果轉(zhuǎn)換為圖片、圖標(biāo)或動(dòng)畫,顯著降低分析結(jié)果的理解難度。Clustergram是一種基于聚類分析的可視化技術(shù),可以顯示數(shù)據(jù)集成員的分配過程和分配結(jié)果。
操作系統(tǒng)是計(jì)算機(jī)的核心,是計(jì)算機(jī)各硬件、軟件兼容運(yùn)行的基礎(chǔ)。操作系統(tǒng)的安全保障不足是引發(fā)計(jì)算機(jī)信息安全問題的重要原因。由操作系統(tǒng)引發(fā)的計(jì)算機(jī)信息安全問題共以下幾種:第一,操作系統(tǒng)漏洞。操作系統(tǒng)出現(xiàn)漏洞的原因多出現(xiàn)于系統(tǒng)設(shè)計(jì)者的邏輯錯(cuò)誤或編碼缺陷。例如,WINDOWS操作系統(tǒng)常見的服務(wù)拒絕漏洞、賬號快速切換漏洞、UPNP服務(wù)漏洞等,都可以對計(jì)算機(jī)信息安全形成威脅。第二,操作系統(tǒng)組件問題。例如,Internet服務(wù)提供的IIS組件中整合了MSADC程序,該程序可以為攻擊者提供遠(yuǎn)程執(zhí)行指令的功能。第三,操作系統(tǒng)安全設(shè)置。這種問題的出現(xiàn)原因較多,用戶、管理員、開發(fā)者都可能是操作系統(tǒng)出現(xiàn)安全設(shè)置問題的“元兇”。操作系統(tǒng)管理著計(jì)算機(jī)的硬件資源和軟件資源,是引發(fā)計(jì)算機(jī)信息安全問題頻率最高的因素之一。
應(yīng)用軟件是安裝于計(jì)算機(jī)中,用于解決問題的特定軟件,包括辦公軟件、聊天軟件、視頻軟件、圖像軟件等。應(yīng)用軟件的設(shè)計(jì)初衷是為用戶提供工作便利,簡化用戶的操作流程,但應(yīng)用軟件也是引發(fā)計(jì)算機(jī)信息安全問題的因素之一。應(yīng)用軟件出現(xiàn)問題的主要原因是軟件設(shè)計(jì)缺陷。以辦公軟件OFFICE為例,OFFICE程序的MSI2-027漏洞,是一種可以影響操作系統(tǒng)的漏洞,影響范圍小但威脅性高,極易引發(fā)計(jì)算機(jī)信息安全問題。部分用戶為了低價(jià)和便宜,經(jīng)常去一些非正規(guī)網(wǎng)站下載來路不明的應(yīng)用程序。這些程序都可能被開發(fā)者植入病毒、木馬等惡意程序,盜取用戶數(shù)據(jù),破壞數(shù)據(jù)完整性。
計(jì)算機(jī)硬件是計(jì)算機(jī)軟件的運(yùn)行基礎(chǔ)。計(jì)算機(jī)硬件出現(xiàn)問題勢必影響計(jì)算機(jī)信息安全。物理環(huán)境安全問題和設(shè)備安全問題,是計(jì)算機(jī)硬件引發(fā)信息安全問題的兩種主要原因。物理環(huán)境安全問題是計(jì)算機(jī)硬件處于不穩(wěn)定的物理環(huán)境中,出現(xiàn)電磁干擾、靜電干擾、供電不穩(wěn)、設(shè)備被盜等一系列問題。設(shè)備安全問題是,用戶在無法保證安全的前提下,使用外接設(shè)備進(jìn)行數(shù)據(jù)轉(zhuǎn)移。這種行為很可能給黑客留下遠(yuǎn)程攻擊的機(jī)會(huì)。計(jì)算機(jī)硬件安全問題是引發(fā)計(jì)算機(jī)信息安全問題的重要原因,也是用戶最容易忽略的問題。木馬、病毒等代碼層面的破壞更容易受到人們關(guān)注,計(jì)算機(jī)硬件問題鮮有人重視。選擇質(zhì)量上乘、來路正規(guī)的硬件設(shè)備可以從根源解決計(jì)算機(jī)硬件問題。
任何計(jì)算機(jī)在沒有接受任何運(yùn)行指令時(shí),都必須依靠操作者進(jìn)行計(jì)算和運(yùn)行。操作者是主動(dòng)行為者,其操作水平和安全意識是影響計(jì)算機(jī)信息安全的主觀因素。如果操作者的操作水平不足或缺乏安全意識,極易受到流氓軟件的欺騙,將一些陌生的程序安裝至計(jì)算機(jī)中,威脅計(jì)算機(jī)信息安全。部分操作者具有一定的計(jì)算機(jī)操作水平,但安全意識不足,時(shí)常為了方便操作進(jìn)行一些高危操作,例如關(guān)閉防火墻、隨意連接公共網(wǎng)絡(luò)、忘記安全退出等。還有一部分操作者具有一定的操作水平和安全意識,但無法正確使用計(jì)算機(jī)應(yīng)用,使用過于簡單的密碼、隨意公開打印機(jī)設(shè)備、隨意共享本地文件,這些都是及其危險(xiǎn)的操作,可以對計(jì)算機(jī)信息安全形成巨大威脅。沒有任何限制的文件共享和設(shè)備共享,都給不法分子提供了可乘之機(jī)。為了保證計(jì)算機(jī)信息安全,操作者學(xué)習(xí)必要的安全知識和計(jì)算機(jī)知識是必須且必要的。
構(gòu)建計(jì)算機(jī)信息安全保障的首要環(huán)節(jié)是提升操作系統(tǒng)安全性。保證操作系統(tǒng)安全可以從三方面入手,第一,定期檢測并修補(bǔ)操作系統(tǒng)漏洞,降低系統(tǒng)漏洞對信息安全的威脅。第二,關(guān)閉不常用的服務(wù)組件,避免某些組件存在安全漏洞影響操作系統(tǒng)的整體安全。第三,及時(shí)更新升級操作系統(tǒng)。當(dāng)系統(tǒng)廠商發(fā)布新版本操作系統(tǒng)時(shí),我們可以及時(shí)更新操作系統(tǒng),從而降低安全風(fēng)險(xiǎn)。例如,微軟已經(jīng)停止了對WINDOWS XP的更新,仍在使用WINDOWS XP的用戶已經(jīng)無法從微軟獲得任何系統(tǒng)更新。為了保證信息安全,用戶可以選擇升級WINDOWS 7及以上版本的操作系統(tǒng)。
應(yīng)用軟件的作用是豐富計(jì)算機(jī)功能,支持計(jì)算機(jī)完成必要工作。解決應(yīng)用軟件安全問題可以從選擇、更新、使用三個(gè)角度入手。選擇是選擇正規(guī)、可靠、安全的軟件供應(yīng)商,拒絕下載來路不明的應(yīng)用程序,拒絕使用破解版、盜版應(yīng)用軟件。更新是及時(shí)更新應(yīng)用軟件,獲取軟件供應(yīng)商的最新更新內(nèi)容。一般情況下,應(yīng)用軟件更新都包含了已知錯(cuò)誤修復(fù)、已知漏洞修復(fù)等涉及信息安全的內(nèi)容。使用是合理使用應(yīng)用軟件,拒絕高風(fēng)險(xiǎn)操作和違規(guī)操作,保證計(jì)算機(jī)安全和服務(wù)器安全。用戶名和密碼必須妥善保管,避免被非法軟件遠(yuǎn)程盜取使用。
解決計(jì)算機(jī)硬件安全問題必須從外部環(huán)境入手,例如做好設(shè)備防盜工作、避免靜電干擾、避免電磁破壞、遠(yuǎn)離惡劣使用環(huán)境等。突然斷電是引發(fā)數(shù)據(jù)丟失的重要原因之一。為了避免受到斷電影響,機(jī)房可以配備UPS供電設(shè)備,消除突然斷電對計(jì)算機(jī)硬件的影響。我國已經(jīng)開始建設(shè)標(biāo)準(zhǔn)化機(jī)房,計(jì)算機(jī)硬件安全問題已經(jīng)逐漸解決。為了保護(hù)信息安全,機(jī)房可以配備安全軟件和安全硬件,包括內(nèi)網(wǎng)防火墻、外網(wǎng)防火墻、信息過濾器等,對計(jì)算機(jī)信息形成逐層保護(hù)。目前,很多企業(yè)都選擇而三層交換機(jī)進(jìn)行部門間的數(shù)據(jù)交換。無線網(wǎng)絡(luò)安全和路由器安全也納入了計(jì)算機(jī)信息安全體系中,受到了人們的廣泛關(guān)注。當(dāng)使用無線路由器時(shí),用戶必須設(shè)定MAC地址限制,并更改路由器訪問密碼,避免黑客直接駭入路由器,隨意調(diào)取信息數(shù)據(jù)。