沙之洲
(清華大學(xué),北京 100084)
網(wǎng)絡(luò)環(huán)境的開放性為信息的產(chǎn)生提供了條件和土壤,為信息的爆炸性生成加入了催化劑,而網(wǎng)絡(luò)所提倡的共享和免費(fèi)特性為信息的傳播增加了助推力。因此在網(wǎng)絡(luò)時(shí)代要考慮如何利用好大數(shù)據(jù)。大數(shù)據(jù)背景下,人工智能應(yīng)用到網(wǎng)絡(luò)技術(shù)中既可以促進(jìn)網(wǎng)絡(luò)技術(shù)的進(jìn)步,又能夠找到更好的提高數(shù)據(jù)利用的方法和手段,充分發(fā)揮人工智能的作用。
大數(shù)據(jù)的說法最早出現(xiàn)在20世紀(jì)80年代,正式地提出這一概念是在2008年的美國《自然》雜志。不同領(lǐng)域的專家或者機(jī)構(gòu)根據(jù)需要和實(shí)踐分別給出了很多關(guān)于大數(shù)據(jù)定義的描述,雖然描述內(nèi)容和重點(diǎn)不同,但是在這些定義中都強(qiáng)調(diào)了大數(shù)據(jù)在傳統(tǒng)常規(guī)軟件或方式下無法處理,但是可以被獲取和利用的特征[1]。
大數(shù)據(jù)的特點(diǎn)主要包括數(shù)據(jù)量大、數(shù)據(jù)產(chǎn)生和獲取速度快、數(shù)據(jù)具有可變性和多樣性、數(shù)據(jù)潛在和現(xiàn)實(shí)價(jià)值大、數(shù)據(jù)真實(shí)性、數(shù)據(jù)復(fù)雜性。
大數(shù)據(jù)的作用:做出趨勢(shì)分析與預(yù)測(cè);發(fā)現(xiàn)規(guī)律,找出辦法;可以實(shí)現(xiàn)精準(zhǔn)控制;提高競(jìng)爭(zhēng)力,找到新的發(fā)展方向。
人工智能是一個(gè)包含了多方面研究內(nèi)容的計(jì)算機(jī)的研究領(lǐng)域,它主要就是通過對(duì)人類思維、認(rèn)知活動(dòng)進(jìn)行充分的分析和提取,建立模型,然后通過計(jì)算機(jī)進(jìn)行模擬,從而能夠在人的控制下讓計(jì)算機(jī)具有自學(xué)習(xí)的能力和智能化運(yùn)行的功能,使得計(jì)算機(jī)能夠以類似人類智能的方式作出反應(yīng)。
利用計(jì)算機(jī)的超強(qiáng)計(jì)算能力,解放人類大腦;能夠處理復(fù)雜大量的數(shù)據(jù)信息,拓展人類思維的范圍;能夠豐富人們認(rèn)識(shí)世界、改造世界的手段;專業(yè)性強(qiáng),需要豐富的知識(shí)和多領(lǐng)域的配合。
人工智能是基于規(guī)則庫的系統(tǒng),在一般規(guī)則下,可用的數(shù)據(jù)或者樣本越多,其自學(xué)和智能化程度就會(huì)相應(yīng)地有所提高。可以說人工智能的實(shí)現(xiàn)有賴于大數(shù)據(jù)環(huán)境。有了大數(shù)據(jù)的支持,人工智能系統(tǒng)對(duì)于數(shù)據(jù)處理和判斷的效率會(huì)有大幅度的提升。有了更多的樣本就能實(shí)現(xiàn)對(duì)信息判定分析的準(zhǔn)確和高效[2]。
3.1.1 數(shù)據(jù)處理的智能化
在網(wǎng)絡(luò)環(huán)境中每天都會(huì)產(chǎn)生大量的數(shù)據(jù)信息,對(duì)于數(shù)據(jù)信息的篩選和利用就變得至關(guān)重要。為了保證數(shù)據(jù)信息的質(zhì)量和時(shí)間性要求,依靠人工或者計(jì)算機(jī)本身是不現(xiàn)實(shí)的。如果利用人工智能,發(fā)揮計(jì)算機(jī)的運(yùn)算長處的同時(shí)讓它能夠模擬人的思維,就能夠?qū)A繑?shù)據(jù)實(shí)現(xiàn)智能化的處理和分析。用它來對(duì)數(shù)據(jù)信息進(jìn)行處理不僅能夠保證速度還能保證質(zhì)量。
3.1.2 具有超強(qiáng)的模糊數(shù)據(jù)處理能力
當(dāng)前,網(wǎng)絡(luò)上產(chǎn)生的信息和數(shù)據(jù)具有一個(gè)突出的特點(diǎn)就是分散性比較強(qiáng),數(shù)據(jù)之間的聯(lián)系比較模糊。而人類思維的最大特長就是能從紛繁復(fù)雜、看似毫無頭緒的信息中獲取準(zhǔn)確的可靠的判斷。人工智能作為人類思維過程的模擬,也具備人類思維的很多特征,因此他對(duì)于模糊數(shù)據(jù)的處理也具有一定的優(yōu)勢(shì)。
3.1.3 能夠降低數(shù)據(jù)處理成本
對(duì)于數(shù)據(jù)處理成本,通??紤]的是時(shí)間成本和貨幣成本。在時(shí)間上,如果用傳統(tǒng)的數(shù)據(jù)處理方式或者是人工處理,顯然速度會(huì)很慢,效率會(huì)非常低。而采用人工智能方式的話,首先能夠?qū)崿F(xiàn)不需要對(duì)原始數(shù)據(jù)進(jìn)行深度轉(zhuǎn)換就可以進(jìn)行處理,其次是還能保持計(jì)算機(jī)運(yùn)算速度的充分發(fā)揮。因此人工智能不僅能夠快速處理大量數(shù)據(jù)還能保證避免人因?yàn)槔ХΧ鴰淼娜藶殄e(cuò)誤,讓數(shù)據(jù)處理兼具快速和準(zhǔn)確的特征。在整個(gè)處理過程中不需要太多的人為干預(yù),基本都由計(jì)算機(jī)自己完成,節(jié)省了大量的成本。
人工智能可以實(shí)現(xiàn)全程自動(dòng)完成相關(guān)任務(wù),自行進(jìn)行判斷和調(diào)整,而不需要過多的人工干預(yù)。因此在現(xiàn)實(shí)中,通過與網(wǎng)絡(luò)技術(shù)的結(jié)合,人工智能也確實(shí)在網(wǎng)絡(luò)技術(shù)中發(fā)揮了重要作用,在網(wǎng)絡(luò)信息安全、網(wǎng)絡(luò)日常管理、網(wǎng)絡(luò)評(píng)級(jí)體系建設(shè)、建設(shè)智慧化校園方面都有著很多很深入的應(yīng)用。在具體應(yīng)用上發(fā)揮作用比較明顯的是在信息安全方面,比如在入侵檢測(cè)、防火墻和網(wǎng)絡(luò)行為管理上,另外就是在智慧化校園建設(shè)方面[3]。
3.2.1 智能防火墻的實(shí)現(xiàn)
眾所周知的是,第一,網(wǎng)絡(luò)防火墻對(duì)于網(wǎng)絡(luò)安全運(yùn)行具有十分重要的意義;第二,現(xiàn)在的網(wǎng)絡(luò)防火墻大多是基于固定規(guī)則庫的防護(hù),將規(guī)則庫固化或者植入防火墻設(shè)備中,需要進(jìn)行定期升級(jí)規(guī)則庫,否則防護(hù)能力將隨著授權(quán)的到期規(guī)則庫無法更新而大大下降,起不到其應(yīng)有的作用。由于這樣的防火墻運(yùn)行模式導(dǎo)致防火墻即使在授權(quán)期內(nèi)其防護(hù)作用也存在不足。在網(wǎng)絡(luò)中攻擊和威脅無時(shí)無刻都存在著,而且新的攻擊和威脅也在不斷產(chǎn)生著。但是拋開其具體表現(xiàn)形式,在實(shí)際的實(shí)現(xiàn)手段上就變得非常有限了。如果把人工智能引入進(jìn)來,通過收集、記錄和整理以往的攻擊和威脅情況,并結(jié)合網(wǎng)絡(luò)上的相關(guān)信息,利用人工智能來進(jìn)行分析和判斷,能夠更好地預(yù)防攻擊,消除威脅,不斷加固網(wǎng)絡(luò)環(huán)境中的防火墻,自行來添加防火墻規(guī)則,豐富和完善規(guī)則庫,從而讓防火墻不再是被動(dòng)的防御,而是具有主動(dòng)性和能動(dòng)性。
3.2.2 入侵檢測(cè)的自動(dòng)化
在網(wǎng)絡(luò)中,各種入侵手段不斷翻新、不斷地增加,單純依靠固定的規(guī)則庫很難處理新出現(xiàn)的入侵手段和方法,讓網(wǎng)絡(luò)環(huán)境中部署的安全設(shè)備形同虛設(shè),不能充分發(fā)揮作用。人工智能可以對(duì)現(xiàn)存的規(guī)則庫進(jìn)行深入分析,同時(shí)還可以利用網(wǎng)絡(luò)大數(shù)據(jù)及時(shí)分析和發(fā)現(xiàn)最新出現(xiàn)的入侵威脅,防患于未然。而且人工智能可以從原理上出發(fā),來分析入侵的態(tài)勢(shì)。雖然病毒和攻擊千千萬萬,但是其最終的理論基礎(chǔ)只有很少的幾種。只要人工智能系統(tǒng)掌握了其基本理論和原理就可以以不變應(yīng)萬變,從根源上去分析和判斷任何入侵程序,讓現(xiàn)行規(guī)則庫里沒有的入侵也難以遁形。這樣一來能夠不斷實(shí)現(xiàn)入侵檢測(cè),還能夠建立彈性的入侵防線,讓網(wǎng)絡(luò)環(huán)境始終處在一個(gè)能夠?qū)崿F(xiàn)良性循環(huán)不斷完善的入侵系統(tǒng)保護(hù)之下[4]。特別是人工智能算法還可以與傳統(tǒng)算法結(jié)合起來,通過對(duì)數(shù)據(jù)源的分析來選擇算法構(gòu)成更加嚴(yán)密的檢測(cè)系統(tǒng),具體算法如表1。
表1 入侵檢測(cè)算法列表
3.2.3 人工免疫技術(shù)
免疫技術(shù)就是通過一定手段讓系統(tǒng)建立一個(gè)防御機(jī)制免于被侵犯。在網(wǎng)絡(luò)中無時(shí)無刻不存在著病毒威脅和攻擊威脅,從病毒傳播和感染的手段和攻擊的方式方法來說都是能夠通過學(xué)習(xí)而被了解和掌握的。在這方面人工智能具有相當(dāng)大的優(yōu)勢(shì),可以通過建立初始專家知識(shí)庫,在知識(shí)庫中建立基因庫,利用克隆理論建立防御體系和否定選擇等相關(guān)技術(shù),利用人工智能的自學(xué)能力來通過基因片段、不完整信息等來加強(qiáng)識(shí)別能力,從而彌補(bǔ)網(wǎng)絡(luò)系統(tǒng)中病毒監(jiān)測(cè)和入侵檢測(cè)的能力和靈活性不足問題。并且可以通過學(xué)習(xí)不斷地充實(shí)和完善已有的初始知識(shí)庫,經(jīng)過不斷學(xué)習(xí)讓網(wǎng)絡(luò)系統(tǒng)的防病毒能力和檢測(cè)能力得以有很大幅度的提升。這種技術(shù)發(fā)展到高級(jí)水平的話,是可以通過識(shí)別病毒基因來進(jìn)行自行重組,然后自動(dòng)生成殺毒程序的,這項(xiàng)技術(shù)目前實(shí)現(xiàn)起來還是很困難的。但是通過在知識(shí)庫中定義字符串,然后用字符串來替代病毒中的相應(yīng)字符串技術(shù)是可行的,它通過進(jìn)行識(shí)別然后用無害字符串替換病毒中的有害字符串,從而讓病毒失去感染性和危害性。
3.2.4 人工智能實(shí)現(xiàn)agent 技術(shù)
這項(xiàng)技術(shù)是在大數(shù)據(jù)環(huán)境下產(chǎn)生的技術(shù)。包括兩個(gè)方面,一個(gè)是通過agent技術(shù)實(shí)現(xiàn)網(wǎng)絡(luò)服務(wù)個(gè)性化和定制化,另外一個(gè)是通過自治agent技術(shù)實(shí)現(xiàn)網(wǎng)絡(luò)管理和網(wǎng)絡(luò)安全。
第一個(gè)方面的實(shí)現(xiàn)是依賴于知識(shí)庫及解釋推理器等機(jī)制來實(shí)現(xiàn)的。它通過將用戶網(wǎng)絡(luò)訪問所提交的數(shù)據(jù)進(jìn)行存儲(chǔ)、處理和分析,結(jié)合知識(shí)庫,利用解釋推理器來對(duì)用戶需求加以判斷,并自動(dòng)篩選出用戶可能需要的數(shù)據(jù)并根據(jù)用戶請(qǐng)求或者系統(tǒng)設(shè)置主動(dòng)地推送給用戶。
第二個(gè)方面是對(duì)底層數(shù)據(jù)進(jìn)行收集整理和分析,在此基礎(chǔ)上發(fā)揮人工智能所具有的學(xué)習(xí)能力、推理能力、自適應(yīng)能力和自主能力,對(duì)于外部程序進(jìn)行充分而迅速的分析和研判,從而最大限度地阻止或者降低病毒對(duì)于網(wǎng)絡(luò)系統(tǒng)及其內(nèi)部主機(jī)的影響。這種應(yīng)用一旦建立了相應(yīng)的知識(shí)庫和專家系統(tǒng)后就可以自行運(yùn)行,對(duì)于環(huán)境的依賴程度非常低,特別是在大數(shù)據(jù)環(huán)境下更能夠充分發(fā)揮其作用,為網(wǎng)絡(luò)整體的安全提供保障。
網(wǎng)絡(luò)技術(shù)的發(fā)展促進(jìn)了大數(shù)據(jù)時(shí)代的發(fā)展,大數(shù)據(jù)又給人工智能的發(fā)展帶來了新的機(jī)遇和條件準(zhǔn)備。在大數(shù)據(jù)背景下,在人工智能的加成和大數(shù)據(jù)的支持下,能夠通過自學(xué)實(shí)現(xiàn)智能化管理,可以大大提高網(wǎng)絡(luò)技術(shù)的應(yīng)用效率,能夠更好地發(fā)揮網(wǎng)絡(luò)設(shè)備的作用,保證網(wǎng)絡(luò)安全和管理效率的提高。