• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于增量學(xué)習(xí)算法的校園網(wǎng)垃圾郵件檢測(cè)模型

    2017-04-17 05:13:28東一舟毛明榮
    計(jì)算機(jī)應(yīng)用 2017年1期
    關(guān)鍵詞:宿主機(jī)鍵值垃圾郵件

    陳 斌,東一舟,毛明榮

    (南京師范大學(xué) 信息化建設(shè)管理處,南京 210023)

    (*通信作者電子郵箱njnuchenbin@njnu.edu.cn)

    基于增量學(xué)習(xí)算法的校園網(wǎng)垃圾郵件檢測(cè)模型

    陳 斌*,東一舟,毛明榮

    (南京師范大學(xué) 信息化建設(shè)管理處,南京 210023)

    (*通信作者電子郵箱njnuchenbin@njnu.edu.cn)

    針對(duì)大量垃圾郵件對(duì)用戶帶來(lái)困擾的問題,提出了一種增量被動(dòng)攻擊學(xué)習(xí)算法。該方法基于半年時(shí)間的對(duì)本校校園網(wǎng)內(nèi)郵件宿主機(jī)上所發(fā)起的簡(jiǎn)單郵件傳輸協(xié)議(SMTP)會(huì)話日志的采集,針對(duì)會(huì)話中記錄的投遞率狀態(tài)及多種類型的失敗消息進(jìn)行了宿主機(jī)行為分析,最終達(dá)到有效地適應(yīng)被檢測(cè)垃圾郵件源宿主機(jī)對(duì)最近郵件分類行為的目的。實(shí)驗(yàn)結(jié)果表明,在執(zhí)行了若干回合分類策略的調(diào)整后,該檢測(cè)的準(zhǔn)確度可以達(dá)到94.7%。該設(shè)計(jì)可以有效地檢測(cè)內(nèi)部垃圾郵件宿主機(jī)行為,繼而從根源上抑制了垃圾郵件的產(chǎn)生。

    垃圾郵件宿主機(jī);簡(jiǎn)單郵件傳輸協(xié)議會(huì)話;增量學(xué)習(xí);分類器;失敗信息

    0 引言

    如今,垃圾郵件越來(lái)越日常性地充斥著使用者的郵箱,這主要是由于電子郵件傳遞的零成本所致。按照Anti-Abuse消息工作組2011年度發(fā)布的調(diào)查報(bào)告顯示,互聯(lián)網(wǎng)電子郵件總量中超過90%的都是垃圾郵件[1],這不僅浪費(fèi)了互聯(lián)網(wǎng)帶寬及郵件服務(wù)提供商的存儲(chǔ)空間,同時(shí)干擾甚至傷害了部分用戶的正當(dāng)權(quán)益。雖然大多數(shù)用戶都會(huì)忽視垃圾郵件,但由于它的體量巨大,故其帶來(lái)的綜合利潤(rùn)還是足以使得該不端行為存在。更有甚者,垃圾郵件的發(fā)送者通過發(fā)送嵌入了惡意軟件的垃圾郵件,或含有驅(qū)動(dòng)下載攻擊類型的有害鏈接,使得缺乏免疫能力的宿主機(jī)成為被其控制的僵尸網(wǎng)絡(luò)中的一臺(tái)僵尸機(jī)[2],從而迫使它作為其有效垃圾郵件的分發(fā)者。有研究報(bào)告顯示,僵尸網(wǎng)絡(luò)產(chǎn)生了全球超過82%的垃圾郵件[3]。

    解決該問題最通常的策略是,最大限度地為終端用戶過濾來(lái)自于外部的垃圾郵件,它的實(shí)際效果取決于郵件服務(wù)商、郵件客戶端或郵件代理所提供的過濾器能力[4]。即便終端過濾器可以精準(zhǔn)隔離垃圾郵件,但其仍無(wú)法從源頭上遏制垃圾郵件的發(fā)出,故而大量網(wǎng)絡(luò)帶寬還是會(huì)被無(wú)端消耗,這無(wú)疑讓本已吃緊的校園網(wǎng)帶寬雪上加霜。因此,如何從源頭上制止垃圾郵件的產(chǎn)生,成為該領(lǐng)域緊急而重要的問題。如果垃圾郵件宿主機(jī)的行為可以盡早被抑制,其所造成的垃圾郵件隱患即可隨之被排除。對(duì)于如何有效檢測(cè)及認(rèn)定垃圾郵件宿主機(jī)存在兩個(gè)主要問題:1)對(duì)于企圖避開檢測(cè)的垃圾郵件宿主機(jī)而言,其有什么確定的特征可以作為鑒別的依據(jù);2)針對(duì)可能存在的海量數(shù)據(jù)集所產(chǎn)生的簡(jiǎn)單郵件傳輸協(xié)議(Simple Mail Transfer Protocol, SMTP)日志,檢測(cè)模型如何建立,其又如何與最新垃圾郵件的行為相適應(yīng)?

    本文從外部郵件服務(wù)器和消息分類器運(yùn)作細(xì)節(jié)的角度,描述了多種失敗消息相應(yīng)情況下垃圾郵件的行為特征,每一個(gè)垃圾郵件宿主機(jī)檢測(cè)的重要特征都是經(jīng)過了深度學(xué)習(xí)的,同時(shí)使用了一種增量被動(dòng)攻擊學(xué)習(xí)算法來(lái)從大量的SMTP日志中適應(yīng)性地檢測(cè)垃圾郵件宿主機(jī)。該設(shè)計(jì)可以幫助校園網(wǎng)絡(luò)的管理者檢測(cè)垃圾郵件宿主機(jī),從而抑制這些宿主機(jī)的行為,當(dāng)然該方法在其他機(jī)構(gòu)和場(chǎng)景下也是適用的。

    1 相關(guān)工作

    之所以將垃圾郵件宿主機(jī)檢測(cè)作為研究焦點(diǎn),是因?yàn)榻┦W(wǎng)絡(luò)類檢測(cè)與其相關(guān)性較低,下面介紹近些年對(duì)其的相關(guān)研究。垃圾郵件追蹤器是一款開發(fā)于2007年的基于行為黑名單算法的垃圾郵件宿主機(jī)識(shí)別系統(tǒng),它通過具有相似模式的目標(biāo)域宿主機(jī)聚類的收發(fā)郵件消息進(jìn)行分析,垃圾郵件可以較容易地分發(fā)至郵件地址的接收者,這些接收者在不同的垃圾郵件宿主機(jī)消息域中,這可能使得檢測(cè)結(jié)果變得混亂難以理解[5]。自2011年起,有學(xué)者開始研究采集的垃圾郵件消息與具有相似內(nèi)容的宿主機(jī)的識(shí)別工作。作者提取了業(yè)務(wù)日志對(duì)垃圾郵件宿主機(jī)進(jìn)行了分組,它們作為既定相似目標(biāo)的傳播源,并主動(dòng)發(fā)現(xiàn)其他的垃圾郵件宿主機(jī)的傳播行為[6]。相比較而言,該工作并不依賴于任何必須優(yōu)先建立的垃圾郵件內(nèi)容或行為觀測(cè)器,檢測(cè)可以通過增量學(xué)習(xí)方式,自動(dòng)適應(yīng)于最近的垃圾郵件的行為。2012年有研究人員專門針對(duì)大學(xué)校園垃圾郵件過濾器接收的輸出消息進(jìn)行嘗試性研究,實(shí)驗(yàn)使用了時(shí)序化測(cè)試來(lái)檢測(cè)內(nèi)部宿主機(jī)持續(xù)發(fā)送垃圾郵件的概率[7]。該工作不依賴于外部的垃圾郵件過濾器,這主要取決于以下兩點(diǎn)因素:1)一個(gè)SMTP會(huì)話可以因?yàn)閰f(xié)商過程存在問題而失敗,而若一個(gè)會(huì)話在交互階段持續(xù)保持失敗狀態(tài),服務(wù)器將會(huì)發(fā)送一封垃圾郵件消息,在該情況下不會(huì)針對(duì)內(nèi)容進(jìn)行過濾。2)一個(gè)用戶可以向郵件服務(wù)器自動(dòng)轉(zhuǎn)發(fā)配置,這也將導(dǎo)致轉(zhuǎn)發(fā)器收到包括垃圾郵件在內(nèi)的郵件,對(duì)于一個(gè)用戶的特定外部賬戶來(lái)說,垃圾郵件過濾器將察覺到來(lái)自于郵件服務(wù)器的垃圾郵件消息,繼而這種檢測(cè)可以得到更明確的判斷結(jié)果[8]。

    對(duì)于增量學(xué)習(xí)和在線學(xué)習(xí),周期性數(shù)據(jù)分析請(qǐng)求出現(xiàn)于部分應(yīng)用,其中包括了網(wǎng)絡(luò)交易分析、匿名檢測(cè)以及干擾檢測(cè)等,應(yīng)用需要周期性地適配近期數(shù)據(jù)的分類[9]。同樣地,垃圾郵件宿主機(jī)分類檢測(cè),對(duì)于從SMTP日志中識(shí)別最近的垃圾郵件行為來(lái)說是必須的[10]。大多數(shù)針對(duì)該目標(biāo)的增量學(xué)習(xí)方法是基于決策樹、神經(jīng)網(wǎng)絡(luò)以及向量機(jī)的,與之相關(guān)的典型設(shè)計(jì)用例有,將它用于建立靜態(tài)分類模式,該模式基于之前的實(shí)例,并可以從實(shí)例中糾錯(cuò),從而形成新的實(shí)例標(biāo)簽。虛擬機(jī)已經(jīng)被證實(shí)可以用來(lái)較好地分離不同標(biāo)簽的實(shí)例,它通過最大化標(biāo)簽實(shí)例邊緣從而產(chǎn)生不同的超平面,這里的邊緣是實(shí)例與分離超平面之間的距離,該方法可通過識(shí)別每一個(gè)新的實(shí)例的向量支持能力,進(jìn)而調(diào)節(jié)虛擬機(jī)增量分類,它的優(yōu)勢(shì)是可以保持之前有用的實(shí)例作為支持向量,并同步獲取有效的更新步驟信息作為知道依據(jù)[11]。然而,虛擬機(jī)超平面方法在分發(fā)出現(xiàn)錯(cuò)誤的情況下,未必能進(jìn)行有效的調(diào)節(jié),換句話說,當(dāng)監(jiān)控實(shí)例的分發(fā)與固有的支撐向量存在明顯的差異時(shí),監(jiān)控實(shí)例可能由于支撐向量概率的減小而導(dǎo)致分類錯(cuò)誤。出于對(duì)更新步驟效率的考慮,同樣可以用在線學(xué)習(xí)的方法來(lái)解決周期性調(diào)整分類的問題。在線學(xué)習(xí)過程中,每一個(gè)標(biāo)簽實(shí)例都會(huì)在被用于分類器更新處理后被丟棄。與增量學(xué)習(xí)的設(shè)置不同,其無(wú)需維護(hù)之前的標(biāo)簽實(shí)例,更新步驟只需要使用一個(gè)標(biāo)簽實(shí)例就可以完成基本的執(zhí)行動(dòng)作,更新分類器可以彈性地適配多種實(shí)例的分發(fā)。一些類似模擬人類視神經(jīng)控制系統(tǒng)的圖形識(shí)別感知器算法,以及基于邊界的算法已經(jīng)被證實(shí)在大范圍的應(yīng)用中都是非常有效的。分類器更新通常是基于各類特征表示的,相對(duì)支持向量機(jī)(Support Vector Machine, SVM)、提升方法(boosting)、最大熵方法等“淺層學(xué)習(xí)”方法而言,深度學(xué)習(xí)所學(xué)得的模型中,非線性操作的層級(jí)數(shù)更多。淺層學(xué)習(xí)依靠人工經(jīng)驗(yàn)抽取樣本特征,網(wǎng)絡(luò)模型學(xué)習(xí)后獲得的是沒有層次結(jié)構(gòu)的單層特征;而深度學(xué)習(xí)通過對(duì)原始信號(hào)進(jìn)行逐層特征變換,將樣本在原空間的特征表示變換到新的特征空間,自動(dòng)地學(xué)習(xí)得到層次化的特征表示[12]。為了與分類器的垃圾郵件分類任務(wù)相對(duì)抗,攻擊者通常都會(huì)嘗試通過誘騙的方式使得分類器產(chǎn)生錯(cuò)誤結(jié)果從而躲避檢測(cè)。在對(duì)抗性研究領(lǐng)域,已經(jīng)有一些專門針對(duì)精準(zhǔn)化分類器而建立的偽裝攻擊研究,這些研究的貢獻(xiàn)就在于,對(duì)惡意攻擊及正常分類實(shí)例的最小代價(jià)可以作出合理化區(qū)分及評(píng)估[13]。對(duì)于攻擊者而言,垃圾郵件制造者不能對(duì)外部服務(wù)器的回復(fù)消息進(jìn)行修改,這也就限制了其對(duì)郵件的控制權(quán),因此,使用攻擊學(xué)習(xí)的作用是微乎其微的。本文的主要工作將集中在對(duì)持續(xù)改變其行為的垃圾郵件的適應(yīng)性檢測(cè)上。

    2 垃圾郵件行為特征分析及檢測(cè)模型

    垃圾郵件行為失敗消息特征分析及檢測(cè)分為五個(gè)階段,即:1)通過干擾檢測(cè)系統(tǒng)對(duì)校園網(wǎng)絡(luò)與互聯(lián)網(wǎng)之間的SMTP交互日志進(jìn)行捕獲;2)從日志中提取出校園網(wǎng)內(nèi)部宿主機(jī)與外部宿主機(jī)初始會(huì)話中的SMTP報(bào)文;3)計(jì)算來(lái)自于每臺(tái)內(nèi)部宿主機(jī)個(gè)體的多種類型SMTP會(huì)話投遞成功及失敗消息的數(shù)量及類型;4)按照宿主機(jī)狀態(tài),通過行為檢測(cè)的方式,針對(duì)訓(xùn)練集中的內(nèi)部宿主機(jī)打上垃圾郵件源標(biāo)簽或正常宿主機(jī)標(biāo)簽;5)在此基礎(chǔ)上,可以通過增量學(xué)習(xí)算法持續(xù)檢測(cè)校園中的垃圾郵件宿主機(jī)。特征分析和檢測(cè)常用的兩種分類方法分別為基于規(guī)則的方法和基于機(jī)器學(xué)習(xí)的方法[14]。針對(duì)分類后的特征結(jié)果集合,淘汰歷史樣本集中的非支持向量,將支持向量同新增樣本一起訓(xùn)練,以達(dá)到增量學(xué)習(xí)的目的[15]。一旦通過檢測(cè)確認(rèn)當(dāng)前存在垃圾郵件行為,則會(huì)將發(fā)現(xiàn)的垃圾郵件宿主機(jī)列表發(fā)送給管理者從而對(duì)其加以限制。

    圖1描述了部署于計(jì)算中心的專門用于監(jiān)控SMTP會(huì)話的宿主機(jī)。該宿主機(jī)內(nèi)嵌了網(wǎng)絡(luò)監(jiān)控卡以進(jìn)行網(wǎng)絡(luò)交互的檢測(cè),其檢測(cè)對(duì)象是一臺(tái)位于校園網(wǎng)關(guān)的思科路由器。由于本文只關(guān)注于校園內(nèi)的垃圾郵件宿主機(jī),所以對(duì)來(lái)自于外部的SMTP會(huì)話進(jìn)行了忽略處理。值得注意的是,垃圾郵件僵尸網(wǎng)絡(luò)可能會(huì)通過基于網(wǎng)頁(yè)的郵件服務(wù)發(fā)送垃圾郵件,同樣也可能通過SMTP服務(wù)來(lái)發(fā)送,故而很難在沒有對(duì)SMTP會(huì)話進(jìn)行檢測(cè)的前提下來(lái)定義可靠的垃圾郵件特征。一種可行的解決方案是按照短會(huì)話模式來(lái)查找SMTP會(huì)話日志,該方法背后的基本原理是一個(gè)失敗會(huì)話的終結(jié)必然在失敗當(dāng)下立即發(fā)生,所以該會(huì)話將比正常情況下要短。換句話說,如果一個(gè)宿主機(jī)經(jīng)常在SMTP會(huì)話時(shí)發(fā)生短會(huì)話,則可以認(rèn)為該會(huì)話是容易失敗的,并且其容易被外部干擾所控制,從而成為一臺(tái)垃圾郵件宿主機(jī)。真正難于被可靠檢測(cè)到的垃圾郵件發(fā)送者,是基于安全超文本傳輸協(xié)議(Hyper Text Transfer Protocol over Secure socket layer, HTTPS)的頁(yè)面郵件會(huì)話,對(duì)于該種情況,干擾檢測(cè)系統(tǒng)可以檢測(cè)到垃圾郵件宿主機(jī),但發(fā)送者可以通過行為隨機(jī)化處理輕易地躲避檢測(cè),所以其需要檢測(cè)垃圾郵件的加密通道,這不在本文的研究范圍之內(nèi)。

    網(wǎng)絡(luò)干擾檢測(cè)系統(tǒng)通過宿主機(jī)監(jiān)控及關(guān)鍵日志信息進(jìn)行總結(jié),以此來(lái)進(jìn)行對(duì)SMTP會(huì)話的分析,這其中包括了郵件接收地址和回復(fù)碼。以下是采集自192.168.92.154設(shè)備的日志消息示例,由于其主機(jī)網(wǎng)絡(luò)互連協(xié)議(Internet Protocol, IP)地址被垃圾郵件檢測(cè)掃描并被列入黑名單后,接收到了一條來(lái)自于SMTP服務(wù)器223.1.106.1的拒絕消息,頭兩行是消息的時(shí)間戳以及會(huì)話標(biāo)識(shí)碼,對(duì)其解析后可知消息出現(xiàn)的時(shí)間,以及區(qū)分SMTP會(huì)話消息對(duì)[DENY,605]的意思,是SMTP響應(yīng)碼605與郵件命令在請(qǐng)求響應(yīng)中雖被拒絕但狀態(tài)是保持接續(xù)的。該日志不包含郵件體,否則日志內(nèi)容的體積將會(huì)非常龐大,并且這會(huì)導(dǎo)致嚴(yán)重的隱私泄露,日志中的消息包括了多種類型的成功分發(fā)和失敗情況,同時(shí)還有一些關(guān)鍵域信息。通過這些檢測(cè)細(xì)節(jié)信息,已經(jīng)足夠?qū)σ粋€(gè)宿主機(jī)是否進(jìn)行了垃圾郵件的分發(fā)行為作出判斷。

    圖1 計(jì)算中心宿主機(jī)SMTP會(huì)話監(jiān)控架構(gòu)

    一個(gè)來(lái)自于服務(wù)器的SMTP響應(yīng)消息,標(biāo)志著一個(gè)SMTP郵件分發(fā)會(huì)話的成功與失敗狀態(tài),如果失敗總是發(fā)生,意味著其異常等級(jí)較高。起初試圖通過SMTP響應(yīng)碼對(duì)日志中的失敗消息進(jìn)行分類,但事實(shí)上響應(yīng)碼和真正的失敗原因是多元的關(guān)系,無(wú)法做到一一對(duì)應(yīng)。表1中列出了一些實(shí)驗(yàn)過程中的實(shí)例,從中可以看出有很多比響應(yīng)碼更合理的鍵值選項(xiàng),這些鍵值選項(xiàng)都是從多種失敗消息中提取的。

    表1 相同SMTP響應(yīng)碼情況下不同響應(yīng)消息示例

    另外,郵件服務(wù)器可以針對(duì)同樣的失敗原因給出不同的響應(yīng)消息。例如由于黑名單而造成的郵件阻塞在表1中就給出了多種列舉,所以在實(shí)驗(yàn)過程中通過人工識(shí)別鍵值的方式,根據(jù)語(yǔ)義分析對(duì)垃圾郵件進(jìn)行了標(biāo)注,并基于失敗原因的鍵值域組織了響應(yīng)消息。作為一個(gè)檢測(cè)系統(tǒng),在默認(rèn)SMTP策略腳本中并沒有列出所謂的期望回復(fù)結(jié)果,只是在默認(rèn)腳本中添加了附加鍵值信息,以幫助其進(jìn)行垃圾郵件會(huì)話的識(shí)別。附加信息包括了日志是否成功轉(zhuǎn)發(fā)、郵件頭的格式、郵件回復(fù)路徑、發(fā)送者以及接收者的地址和主題等。

    在記錄了SMTP會(huì)話日志后,就可以開始針對(duì)SMTP會(huì)話進(jìn)行成功投遞及失敗消息的統(tǒng)計(jì)。按照SMTP的轉(zhuǎn)發(fā)實(shí)現(xiàn)規(guī)則,失敗消息存在多種不同的語(yǔ)義,按照實(shí)際情況可以進(jìn)行分類,主要分為6大類,實(shí)驗(yàn)步驟中的鍵值是通過人工設(shè)定的。表2中列出了典型的鍵值子集,這些鍵值在實(shí)驗(yàn)過程中的分類處理中都有用到,并且在失敗消息中以模糊匹配加正則表達(dá)式的方式進(jìn)行鍵值的查找,需要說明的是,在實(shí)驗(yàn)中的鍵值是不完備的,因?yàn)獒槍?duì)數(shù)百GB的日志中的潛在鍵值是無(wú)法窮舉的。

    表2 針對(duì)各種失敗原因的語(yǔ)義鍵值歸類

    類似拉丁語(yǔ)義檢索的自然語(yǔ)言處理技術(shù),可以對(duì)相似語(yǔ)義的上下文語(yǔ)句的檢索匹配有所幫助。針對(duì)郵件的不同區(qū)域,包括郵件標(biāo)題和正文,可以進(jìn)行概念分析、分類、標(biāo)引、描述和處理,形成具有語(yǔ)義關(guān)聯(lián)的資源元數(shù)據(jù)集合,并使用RDF(Resource Description Framework)和OWL(Web Ontology Language)語(yǔ)言進(jìn)行語(yǔ)義層面的表述和描述,通過適應(yīng)于郵件類型的自然語(yǔ)言關(guān)系模型學(xué)習(xí)處理,結(jié)合針對(duì)郵件上下文的語(yǔ)義分析,形成用以與分類器預(yù)定義分揀數(shù)據(jù)集較為匹配的語(yǔ)義關(guān)鍵詞或語(yǔ)句。回復(fù)消息通常只包含一兩個(gè)短句,示意失敗的鍵值通常只在消息中出現(xiàn)一次?;貜?fù)消息中隱含的失敗原因可以對(duì)垃圾郵件宿主機(jī)的行為產(chǎn)生影響,在這些原因中,由于發(fā)送域可能被篡改,所以必須針對(duì)失敗域進(jìn)行核查,因?yàn)檫@往往是垃圾郵件的征兆所在。在接收到的失敗消息中,標(biāo)識(shí)為郵件接收者未找到的類別通常有以下三種情況:目標(biāo)郵件地址已經(jīng)過期停用,但垃圾郵件制造源依然在持續(xù)向其發(fā)送郵件;目標(biāo)郵件地址由于解析錯(cuò)誤而造成拼寫問題,這種解析錯(cuò)誤是由于垃圾郵件制造源的惡意探測(cè)器在網(wǎng)絡(luò)上掃描目標(biāo)源后,對(duì)其地址試探性輪詢分析產(chǎn)生的過程結(jié)果;另外,垃圾郵件制造源也會(huì)隨機(jī)產(chǎn)生郵件地址作為目標(biāo)郵件地址,對(duì)于之前已經(jīng)發(fā)送過垃圾郵件的宿主機(jī)而言,對(duì)端服務(wù)器可能會(huì)將其列入IP黑名單,每次接收到郵件的檢索過程中,可能會(huì)對(duì)這些宿主機(jī)的郵件進(jìn)行退信處理。

    對(duì)于外部郵件服務(wù)器,由于其響應(yīng)消息中的一些情況及其狀態(tài)并不確定,所以實(shí)驗(yàn)中將其歸入單獨(dú)的類別。還有一類特別的不常用命令對(duì),例如SMTP會(huì)話數(shù)據(jù)無(wú)響應(yīng),這類錯(cuò)誤通常與響應(yīng)碼702相關(guān)聯(lián),所以將該響應(yīng)碼作為該分類的鍵值。對(duì)于校園里的每一個(gè)IP地址,均可按照相應(yīng)鍵值計(jì)算其回復(fù)消息數(shù)量,該統(tǒng)計(jì)結(jié)果對(duì)識(shí)別疑似垃圾郵件宿主機(jī)是有幫助的。實(shí)驗(yàn)中使用了8維特征向量對(duì)內(nèi)部宿主機(jī)的每一個(gè)實(shí)例的SMTP會(huì)話進(jìn)行了描繪,該特征向量中的八元組其中第1元記錄的是成功投遞情況,第2至第7元記錄的是失敗消息的6種分類(如表2),第8元標(biāo)識(shí)了宿主機(jī)是否是郵件服務(wù)器。需要說明的是,如表2所列舉的,域名系統(tǒng)(Domain Name System, DNS)過濾器或者IP黑名單的方法都只是導(dǎo)致失敗的一部分原因,也就是說,垃圾郵件會(huì)話的動(dòng)機(jī)檢測(cè)機(jī)制對(duì)象是多樣的,并且是隨著實(shí)際情況的演變而變化的,特別在針對(duì)外部郵件服務(wù)器的情況下,更是如此。

    實(shí)驗(yàn)通過使用內(nèi)部宿主機(jī)行為結(jié)果作為訓(xùn)練集,并且手工檢測(cè)以下郵件頭區(qū)域,以建立基本的垃圾郵件宿主機(jī)判斷機(jī)制。主要郵件頭區(qū)域?yàn)椋褐黝},通過檢查郵件消息的主題,判斷其是否疑似為垃圾郵件,例如其是否包含了攻擊性關(guān)鍵詞,該區(qū)域通常是非常有代表性的垃圾郵件識(shí)別信息源;發(fā)送者,垃圾郵件發(fā)送者通常都會(huì)對(duì)自己進(jìn)行偽裝,例如使用隨機(jī)產(chǎn)生的郵件地址或者域名,故對(duì)此域進(jìn)行檢查也是非常有必要的;接收者,該域可以在垃圾郵件中被隨機(jī)產(chǎn)生,所以一旦檢測(cè)到有序列化的隨機(jī)目標(biāo)的行為產(chǎn)生,則可以斷定其來(lái)源為垃圾郵件宿主機(jī)。通過掃描傳輸控制協(xié)議(Transmission Control Protocol, TCP)綁定的25號(hào)端口,并檢查宿主機(jī)域名稱,進(jìn)而判斷宿主機(jī)是否為SMTP服務(wù)器。

    當(dāng)一系列打著不同標(biāo)簽的報(bào)文到來(lái)時(shí),分類器需要不斷更新以保持與最新的垃圾郵件行為相適配,在此使用了被動(dòng)攻擊增量學(xué)習(xí)算法,用以對(duì)當(dāng)前分類器的郵件樣本分類工作進(jìn)行調(diào)整。對(duì)于每一個(gè)潛在的樣本實(shí)例,都需要做如下兩步更新操作,即糾正當(dāng)前分類器的預(yù)測(cè)錯(cuò)誤,并且通過主動(dòng)調(diào)整來(lái)更新當(dāng)前分類器。最終,當(dāng)前已經(jīng)被最小化錯(cuò)誤處理后的分類器將作為下一次數(shù)據(jù)集采集選擇的分類器而使用,進(jìn)而實(shí)現(xiàn)優(yōu)化分類的精確度提升。前述方法的具體標(biāo)記需要在對(duì)其建模進(jìn)行公式化之前進(jìn)行定義,打上了標(biāo)簽的周期化數(shù)據(jù)集Pt在周期t時(shí)被采集,|Pt|的實(shí)驗(yàn)標(biāo)簽都是成對(duì)的,在{(u1,v1),(u2,v2),…,(u|Pt|,v|Pt|)}實(shí)例數(shù)組中的un是宿主機(jī)在八元組周期觀測(cè)值條件下的SMTP行為,相應(yīng)的類標(biāo)簽vn是垃圾郵件或非垃圾郵件標(biāo)識(shí)符。設(shè)置kt為周期t下分類器組成向量的權(quán)重,當(dāng)每一個(gè)實(shí)例un∈Pt到達(dá)時(shí),被更新的分類器kt+1都會(huì)修正之前kt分類器的錯(cuò)誤,所以kt也只是進(jìn)行最小化的修正。如果un從kt獲得了不正確的預(yù)測(cè)值,則kt的調(diào)節(jié)將被un的自身邊界值所取代。設(shè)置Q為kt的基于(un,vn)鍵值對(duì)的更新模型,分類器優(yōu)化調(diào)整可以公式化描述如下:

    在按照上述公式對(duì)kt對(duì)應(yīng)的分類器進(jìn)行更新時(shí),{Q(kt,(uK,vK),Pt):1≤n≤|Pt|}是新分類器的備選鍵值組對(duì)。為防止新的分類器過多地被當(dāng)前分類器影響,選擇策略會(huì)按照最準(zhǔn)確的分類性能在Pt中挑選最合適的分類器,當(dāng)超過一個(gè)已經(jīng)更新過的分類器具有非常高的分類準(zhǔn)確性時(shí),則可以選擇該分類器中與kt差別最小的,因此新的分類器kt+1可以按照該策略從備選分類器中進(jìn)行選擇。按照上述對(duì)基礎(chǔ)過程的描述,垃圾郵件過濾器的更新所使用的增量學(xué)習(xí)算法流程如下所述。

    步驟1 初始化數(shù)據(jù)集Pt、分類器kt以及分類優(yōu)化調(diào)整內(nèi)核函數(shù)Q。

    步驟2 在每一個(gè)周期t,按照所采集數(shù)據(jù)的具體不同情況對(duì)數(shù)據(jù)集Pt進(jìn)行更新,以用于增量學(xué)習(xí)。

    算法1 增量學(xué)習(xí)算法形式語(yǔ)義建模。

    1)

    Initialize:k1=(0,0,…,0);

    2)

    fort=1,2,…do

    3)

    Recpt_Collect_data(Pt);

    4)

    5)

    6)

    foreachun∈Ptdo

    7)

    8)

    9)

    end

    10)

    choose

    11)

    12)

    end

    3 實(shí)驗(yàn)及分析

    通過實(shí)驗(yàn)證實(shí)增量學(xué)習(xí)算法對(duì)垃圾郵件分類檢測(cè)的準(zhǔn)確性及其性能優(yōu)劣的影響。實(shí)驗(yàn)在核心機(jī)房搭建的信息系統(tǒng)平臺(tái)上實(shí)施。實(shí)驗(yàn)環(huán)境基礎(chǔ)配置為:八核4.8GHz×4CPU、64GB內(nèi)存、16TB硬盤,雙200GB/s網(wǎng)卡的機(jī)架型服務(wù)器。虛擬機(jī)操作系統(tǒng)選擇了64位的Linux,虛擬機(jī)最大并發(fā)數(shù)為256臺(tái)。實(shí)驗(yàn)采用基于徑向基內(nèi)核(RadialBasisFunction,RBF)的支持向量機(jī)(SupportVectorMachine,SVM)以實(shí)現(xiàn)分類器的設(shè)計(jì),同時(shí)使用Matlab算法分析包對(duì)讀取參數(shù)與內(nèi)核參數(shù)進(jìn)行有效開采和識(shí)別。在實(shí)驗(yàn)中,分類器是定期增量更新的,這里更新周期為6h,更新對(duì)象是打了標(biāo)簽的數(shù)據(jù)集,分類器kt在周期t中由實(shí)例標(biāo)簽鍵值對(duì)Pt進(jìn)行更新。增量學(xué)習(xí)算法的性能在不同設(shè)置條件下,對(duì)分類器錯(cuò)誤修正的實(shí)際效果是不同的,同時(shí)在分類器更新后這種差別又可以被最大限度地減小,在選擇潛在分類器時(shí)起到了最小化評(píng)估錯(cuò)誤的作用。按照分類器性能進(jìn)行評(píng)估時(shí),需要同時(shí)強(qiáng)調(diào)垃圾郵件和非垃圾郵件宿主機(jī)的分類效果,所以測(cè)量平均分類準(zhǔn)確率也是由這兩大類別共同計(jì)算得出的。表3中列出了周期為月計(jì)的實(shí)驗(yàn)數(shù)據(jù)集,每行中的數(shù)字是具有郵件行為的宿主機(jī)數(shù)量,垃圾郵件宿主機(jī)數(shù)量以及非垃圾郵件宿主機(jī)數(shù)量。對(duì)于每一個(gè)實(shí)例來(lái)說,數(shù)據(jù)集中的un包含了第2章特征分析模型中介紹的八元組向量中的SMTP行為,每一個(gè)un的標(biāo)簽都被打上了垃圾郵件(vn=+1)或非垃圾郵件(vn=-1)。

    表3 2015-11至2016-04校園網(wǎng)內(nèi)垃圾郵件宿主機(jī)統(tǒng)計(jì)

    在不同E0和E(E代表E0的權(quán)衡結(jié)果,1代表校正,0表示不校正)調(diào)節(jié)系數(shù)背景下,針對(duì)混合郵件集的增量學(xué)習(xí)算法檢測(cè)結(jié)果如表4所示,實(shí)驗(yàn)中嘗試了多種E0和E值情況下的調(diào)節(jié)效果,在表4中只列出了部分有代表性結(jié)果。根據(jù)調(diào)節(jié)效果顯示,大多數(shù)分類精確度都是通過t=2或t=3情況下的增量學(xué)習(xí)分類調(diào)節(jié)后提升的,增量學(xué)習(xí)算法當(dāng)E=1時(shí)有著最優(yōu)的檢測(cè)能力,根據(jù)結(jié)果顯示,從第2個(gè)周期開始平均分揀準(zhǔn)確度在80%以上,并保持在穩(wěn)定水平。另外,當(dāng)E0=0,E=1以及E0=0.25,E=1時(shí),較E0=0.5,E=1時(shí)準(zhǔn)確性更穩(wěn)定。對(duì)于分類器產(chǎn)出者來(lái)說,當(dāng)一個(gè)新的分類器衍生出之后,產(chǎn)出者錯(cuò)誤檢測(cè)修正權(quán)重將會(huì)變小以避免過擬合問題的出現(xiàn),增量學(xué)習(xí)算法在本實(shí)驗(yàn)中保守地采取了最小化調(diào)節(jié)效果。

    表4 增量學(xué)習(xí)算法在不同參數(shù)情況下的檢測(cè)結(jié)果 %

    Tab.4Detectionresultofincrementallearningalgorithmwithdifferentparameters%

    增量參數(shù)(E0,E)P1P2P3P4P5P6(0,1)72.2782.2483.8783.7283.7282.37(0.25,1)72.2782.1182.7483.5182.1781.69(0.5,1)72.2782.2583.1883.4184.2878.10(0.25,0)72.2772.4276.2776.3176.3272.72(0,0)72.2772.2772.2772.2772.2772.27

    表5中顯示了在不同增量學(xué)習(xí)配置類條件下的分析細(xì)節(jié),主要為E0=0.25,E=1以及E0=0,E=1兩種情況。從表5中可以看到非垃圾郵件宿主機(jī)(NoneSpamHost,NSPH)的識(shí)別準(zhǔn)確度普遍低于80%,一些不確定的宿主機(jī)也由于其接收到了失敗響應(yīng)而被認(rèn)定為垃圾郵件宿主機(jī)。非垃圾郵件宿主機(jī)可以誤導(dǎo)預(yù)測(cè)結(jié)果并降低綜合檢測(cè)準(zhǔn)確度。在實(shí)踐中,類似錯(cuò)誤識(shí)別的情況已經(jīng)通過白名單的方式給予了糾正,所以綜合準(zhǔn)確度顯著提高,對(duì)垃圾郵件宿主機(jī)(SpamHost,SPH)的3到4個(gè)周期的平均檢測(cè)識(shí)別準(zhǔn)確度達(dá)到了90%以上。垃圾郵件宿主機(jī)與非垃圾郵件宿主機(jī)基于不同增量學(xué)習(xí)配置條件下的調(diào)節(jié)預(yù)測(cè)準(zhǔn)確度結(jié)果如圖2所示。

    表5 垃圾郵件宿主機(jī)與非垃圾郵件宿主機(jī)的檢測(cè)結(jié)果

    圖2 SPH與NSPH基于不同增量學(xué)習(xí)配置調(diào)節(jié)的預(yù)測(cè)準(zhǔn)確度

    除了討論特征權(quán)重的重要性,實(shí)驗(yàn)通過手工檢測(cè)SMTP日志的研究方法,對(duì)可能誤導(dǎo)檢測(cè)結(jié)果的因素進(jìn)行了分析,主要有以下幾類情況:1)“接收者未響應(yīng)”應(yīng)答,通常是由于接收者Email地址錯(cuò)誤或郵件格式出現(xiàn)了問題,特別是當(dāng)已經(jīng)超期停用的郵件地址添加在了接收列表中的情況下,很容易出現(xiàn)這種問題。出現(xiàn)類似錯(cuò)誤通常的主要原因是宿主機(jī)向郵件列表進(jìn)行了宣告,稱其可以持續(xù)接收響應(yīng),這種情況一般可以通過郵件列表或白名單列表更新并修正。在該情況中,還發(fā)現(xiàn)部分郵件地址為假造的情形,由于連續(xù)出現(xiàn)了多次雷同的郵件地址,其均投遞失敗,故確定歸類為該情況。2)郵件服務(wù)器“黑名單”應(yīng)答,該應(yīng)答意味著某些用戶賬號(hào)可能曾經(jīng)被盜取后用來(lái)發(fā)送垃圾郵件,這種情況下郵件服務(wù)器管理員可以通過解析郵件日志的方式對(duì)該賬號(hào)進(jìn)行確認(rèn)分析。3)垃圾郵件宿主機(jī)接收到新的失敗響應(yīng),通常這種情況并不多見,但在實(shí)驗(yàn)中仍然對(duì)其原因進(jìn)行了分析。當(dāng)一個(gè)實(shí)例看起來(lái)和過去的郵件賬戶中的命令相類似的話,其成功率相對(duì)較高。另外,一個(gè)新的宿主機(jī)在觀測(cè)周期內(nèi),只會(huì)初始化少量的SMTP會(huì)話,其觀測(cè)行為的缺乏可能是錯(cuò)分類中偶然的結(jié)果。

    垃圾郵件發(fā)送者往往都會(huì)企圖躲避檢測(cè),但躲避畢竟不可能總是成功的,因?yàn)槠錈o(wú)法控制外部郵件服務(wù)器,根據(jù)表2中的失敗原因鍵值歸類情況,垃圾郵件發(fā)送者需要通過域認(rèn)證,在垃圾郵件會(huì)話中避開非正常的命令,并且頻繁地拒絕傳遞垃圾郵件。郵件接收者地址列表需要很仔細(xì)地采集以確保列表中的每一項(xiàng)都是有效的,因?yàn)猷]件地址可能是非正確的,或者已經(jīng)過期。然而在網(wǎng)頁(yè)或磁盤組中檢索郵件地址往往是不精確的,垃圾郵件發(fā)送者也不可能在海量數(shù)據(jù)中手工認(rèn)證郵件地址的有效性,但任何非正確的轉(zhuǎn)發(fā)或向過期地址的轉(zhuǎn)發(fā)都將導(dǎo)致失敗的結(jié)果。另外,郵件服務(wù)器列出了一個(gè)黑名單以阻止垃圾郵件的進(jìn)入企圖,宿主機(jī)在控制了垃圾郵件轉(zhuǎn)發(fā)的同時(shí),也會(huì)不斷補(bǔ)充更新其黑名單內(nèi)容。

    本實(shí)驗(yàn)與同類垃圾郵件分揀實(shí)驗(yàn)相比,最本質(zhì)的不同是,本實(shí)驗(yàn)使用的是增量學(xué)習(xí)算法為基礎(chǔ)的分類器,而其他實(shí)驗(yàn)主要以堆疊器編碼機(jī)為主。相比較而言,使用堆疊器編碼機(jī)的分類器其優(yōu)點(diǎn)是分揀穩(wěn)定速度快,準(zhǔn)確度在有條件背景下能快速達(dá)到較高值;但其缺點(diǎn)在于通常與分揀對(duì)象數(shù)據(jù)集屬性強(qiáng)關(guān)聯(lián),針對(duì)著名的Enron數(shù)據(jù)集則效率很高(主要體現(xiàn)在1,2,3,5版本,4版本并不穩(wěn)定),但關(guān)聯(lián)其他類型數(shù)據(jù)集則效果并不明顯。而使用增量學(xué)習(xí)算法為基礎(chǔ)的分類器,則與數(shù)據(jù)集屬性沒有強(qiáng)關(guān)聯(lián)關(guān)系,對(duì)各種數(shù)據(jù)集效果差異并不明顯,但分揀準(zhǔn)確度提升和穩(wěn)定需要一定周期,且準(zhǔn)確度最高值低于堆疊編碼機(jī)方式。

    本實(shí)驗(yàn)的檢測(cè)工作依賴于對(duì)獨(dú)立宿主機(jī)的統(tǒng)計(jì),這些獨(dú)立宿主機(jī)以IP地址為識(shí)別符號(hào),所以對(duì)主機(jī)地址做過網(wǎng)絡(luò)地址轉(zhuǎn)換(NetworkAddressTranslation,NAT)映射的內(nèi)網(wǎng)地址,或者對(duì)使用了動(dòng)態(tài)主機(jī)配置協(xié)議(DynamicHostConfigurationProtocol,DHCP)獲取的地址而言,可能會(huì)存在不確定性。對(duì)于前者來(lái)說,網(wǎng)絡(luò)管理員仍可以識(shí)別近似源地址繼而分析其垃圾郵件行為,但需要對(duì)NAT所對(duì)應(yīng)的真實(shí)設(shè)備進(jìn)行處理;對(duì)于后者而言,垃圾郵件宿主機(jī)可能被認(rèn)為來(lái)自于多個(gè)源,同樣地,網(wǎng)絡(luò)管理員可以對(duì)實(shí)際分配IP地址的DHCP服務(wù)器進(jìn)行分析,以查找到真實(shí)的地址源。最難處理的情況是由移動(dòng)終端獲取到一個(gè)動(dòng)態(tài)IP地址,并且該地址又是做過NAT映射的。當(dāng)一個(gè)移動(dòng)終端在某一個(gè)點(diǎn)稍作停留,其垃圾郵件發(fā)送行為可能就會(huì)演變得非常嚴(yán)重,除非當(dāng)前垃圾郵件已經(jīng)造成了擁堵。因此,一個(gè)可能的解決方案是,通過灰名單的方式僅僅阻塞該IP地址接收擁堵失敗消息,如果該源是一個(gè)正常的郵件服務(wù)器,一段時(shí)間后它將會(huì)再次發(fā)起請(qǐng)求。該途徑至少阻止了垃圾郵件移動(dòng)終端對(duì)其停留區(qū)域其他終端的垃圾郵件的轉(zhuǎn)發(fā)。

    4 結(jié)語(yǔ)

    本文使用了增量學(xué)習(xí)算法用于垃圾郵件宿主機(jī)的檢測(cè)工作,該工作基于大量的SMTP會(huì)話中嵌套的成功及失敗轉(zhuǎn)發(fā)消息,以及其中嵌入的郵件服務(wù)器信息。增量學(xué)習(xí)算法可以有效地根據(jù)待檢測(cè)者情況調(diào)節(jié)分類器,以適配垃圾郵件宿主機(jī)的多變行為,故而垃圾郵件發(fā)送行為可以被識(shí)別甚至被弱化。實(shí)驗(yàn)結(jié)果顯示,增量學(xué)習(xí)算法可以對(duì)檢測(cè)者在很短的周期內(nèi)進(jìn)行調(diào)節(jié),并且檢測(cè)成功率可以大幅度提升。特征分析結(jié)果說明對(duì)于垃圾郵件宿主機(jī)檢測(cè)來(lái)說,IP黑名單是其中最重要的特征。對(duì)垃圾郵件行為的觀測(cè)是通過SMTP綁定的,然而研究中也發(fā)現(xiàn)有些宿主機(jī)可能通過基于SSL(SecureSocketLayer)安全協(xié)議之上的簡(jiǎn)單郵件傳輸協(xié)議(SimpleMailTransferProtocolOverSSL,SMTPS)或者純網(wǎng)頁(yè)郵件服務(wù)發(fā)送垃圾郵件,由于從加密會(huì)話中觀測(cè)純文本信息是不可能的,宿主機(jī)可以通過模仿正常郵件網(wǎng)絡(luò)行為,從而輕易躲避檢測(cè),所以找到一種健壯而徹底的解決方法是接下來(lái)的研究方向。

    )

    [1] 楊峰,曹麒麟,段海新,等.基于DNSBlocklist的反垃圾郵件系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2003,39(7):11-12.(YANGF,CAOQL,DUANHX,etal.Designandimplementationofananti-spamsystembasedonDNSBlocklist[J].ComputerEngineeringandApplications, 2003, 39(7): 11-12.)

    [2]LIUWY,WANGT.Onlineactivemulti-fieldlearningforefficientemailspamfiltering[J].KnowledgeandInformationSystems, 2012, 33(1): 117-136.

    [3]BERTINIJR,ZHAOL,LOPESAA.AnincrementallearningalgorithmbasedontheK-associated graph for non-stationary data classification [J].Information Sciences, 2013, 246: 52-68.

    [4] COSTA J, SILVA C, ANTUNES M, et al.Customized crowds and active learning to improve classification [J].Expert System with Application, 2013, 40(18): 7212-7219.

    [5] HU L S, LU S X, WANG X Z.A new and informative active learning approach for support vector machine [J].Information Sciences, 2013, 244: 142-160.

    [6] 王學(xué)軍,趙琳琳,王爽.基于主動(dòng)學(xué)習(xí)的視頻對(duì)象提取方法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2013,43(S1):51-54.(WANG X J, ZHAO L L, WANG S.Video object extraction method based on active learning SVM [J].Journal of Jilin University (Engineering and Technology Edition), 2013, 43(S1): 51-54.)

    [7] 丁文軍,薛安榮.基于SVM的Web文本快速增量分類算法[J].計(jì)算機(jī)應(yīng)用研究,2012,29(4):1275-1278.(DING W J, XUE A R.Fast incremental learning SVM for Web text classification[J].Application Research of Computers, 2012, 29(4): 1275-1278.)

    [8] LENG Y, XU X Y, QI G H.Combining active learning and semi-supervised learning to construct SVM classifier [J].Knowledge Based Systems, 2013, 44(5): 121-131.

    [9] 劉伍穎,王挺.集成學(xué)習(xí)和主動(dòng)學(xué)習(xí)相結(jié)合的個(gè)性化垃圾郵件過濾[J].計(jì)算機(jī)工程與科學(xué),2011,33(9):34-41.(LIU W Y, WANG T.Ensemble Learning and active learning based personal spam email filtering [J].Computer Engineering & Science, 2011, 33(9): 34-41.)

    [10] ALI HAJI N, IBRAHIM N S.Porter stemming algorithm for semantic checking [EB/OL].[2016-07-16].https://www.researchgate.net/profile/Noraida_Haji_Ali/publication/260385215_Porter_Stemming_Algorithm_for_Semantic_Checking/links/5584e9d708ae7bc2f448474f.pdf.

    [11] 吳偉寧,劉揚(yáng),郭茂祖.基于采樣策略的主動(dòng)學(xué)習(xí)算法研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2012,49(6):1162-1173.(WU W N, LIU Y, GUO M Z.Advances in active learning algorithms based on sampling strategy [J].Journal of Computer Research and Development, 2012,49(6): 1162-1173.)

    [12] 李艷濤,馮偉森.堆疊去噪自編碼器在垃圾郵件過濾中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2015,35(11):3256-3260.(LI Y T, FENG W S.Application of stacked denoising autoencoder in spamming filtering [J].Journal of Computer Applications, 2015, 35(11): 3256-3260.)

    [13] YANG J M, LIU Y N, ZHU X D, et al.A new feature selection based on comprehensive measurement both in inter-category and intra-category for text categorization [J].Information Processing & Management, 2012, 48(4): 741-754.

    [14] 沈承恩,何軍,鄧揚(yáng).基于改進(jìn)堆疊自動(dòng)編碼機(jī)的垃圾郵件分類[J].計(jì)算機(jī)應(yīng)用,2016,36(1):159-162.(SHEN C E, HE J, DENG Y.Spam filtering based on modified stack auto-encoder [J].Journal of Computer Applications, 2016, 36(1): 158-162.)[15] 張文興,樊捷杰.基于KKT和超球結(jié)構(gòu)的增量SVM算法的云架構(gòu)入侵檢測(cè)系統(tǒng)[J].計(jì)算機(jī)應(yīng)用,2015,35(10):2886-2890.(ZHANG W X, FAN J J.Cloud architecture intrusion detection system based on KKT condition and hyper-sphere incremental SVM algorithm [J].Journal of Computer Applications, 2015, 35(10): 2886-2890.)

    This work is supported by the Digital Campus Construction Project of Nanjing Normal University (2013JSJG069).

    CHEN Bin, born in 1978, Ph.D., engineer.His research interests include distributed computing, cloud computing.

    DONG Yizhou, born in 1978, experimentalist.His research interests include Internet of things application.

    MAO Mingrong, born in 1958, senior experimentalist.His research interests include network application.

    Spam detection model of campus network based on incremental learning algorithm

    CHEN Bin*, DONG Yizhou, MAO Mingrong

    (InformatizationOffice,NanjingNormalUniversity,NanjingJiangsu210023,China)

    Concerning the problem brought by a large number of spam, an incremental passive attack learning algorithm was proposed.The passive attack learning method was based on the Simple Mail Transfer Protocol (SMTP) session log initiated by the email host in the campus during half a year.Analysis on the status of delivery rate and many types of failure message of the host behavior in the session record was conducted, and the effective adaptation was ultimately achieved by detecting spam source host behavior on the recent email classification.The experimental results show that after implementing several rounds of classification strategy adjustment, the detection accuracy of the proposed model can reach 94.7%.The design is very useful to effectively detect internal spam host and control the spam from the source.

    spam host; Simple Mail Transfer Protocol (SMTP) session; incremental learning; classifier; failure information

    2016-08-04;

    2016-09-13。 基金項(xiàng)目:南京師范大學(xué)數(shù)字校園建設(shè)研究項(xiàng)目(2013JSJG069)。

    陳斌(1978—),男,江蘇南京人,工程師,博士,CCF會(huì)員,主要研究方向:分布式計(jì)算、云計(jì)算; 東一舟(1978—),男,江蘇海門人,實(shí)驗(yàn)師,主要研究方向:物聯(lián)網(wǎng)應(yīng)用; 毛明榮(1958—),男,江蘇靖江人,高級(jí)實(shí)驗(yàn)師,主要研究方向:網(wǎng)絡(luò)應(yīng)用。

    1001-9081(2017)01-0206-06

    10.11772/j.issn.1001-9081.2017.01.0206

    TP393.08

    A

    猜你喜歡
    宿主機(jī)鍵值垃圾郵件
    從“scientist(科學(xué)家)”到“spam(垃圾郵件)”,英語(yǔ)單詞的起源出人意料地有趣 精讀
    一種基于SMOTE和隨機(jī)森林的垃圾郵件檢測(cè)算法
    非請(qǐng)勿進(jìn) 為注冊(cè)表的重要鍵值上把“鎖”
    虛擬網(wǎng)絡(luò)實(shí)驗(yàn)室在農(nóng)村職校計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)教學(xué)中的應(yīng)用研究
    嵌入式計(jì)算機(jī)軟件測(cè)試關(guān)鍵技術(shù)的思考
    一鍵直達(dá) Windows 10注冊(cè)表編輯高招
    電腦愛好者(2017年9期)2017-06-01 21:38:08
    基于支持向量機(jī)與人工免疫系統(tǒng)的垃圾郵件過濾模型
    嵌入式計(jì)算機(jī)軟件測(cè)試關(guān)鍵技術(shù)研究
    石器部落
    在不連接網(wǎng)線的情況下Windows與VM之間如何ping通
    99视频精品全部免费 在线| 18禁动态无遮挡网站| 日韩av不卡免费在线播放| 纯流量卡能插随身wifi吗| 国产 精品1| 亚洲国产色片| 丰满迷人的少妇在线观看| 97超视频在线观看视频| 最近最新中文字幕免费大全7| 国产真实伦视频高清在线观看| av国产免费在线观看| 国产精品国产三级国产av玫瑰| 九色成人免费人妻av| 成人国产麻豆网| 在线观看免费视频网站a站| 国产成人一区二区在线| 国产探花极品一区二区| 寂寞人妻少妇视频99o| 亚洲天堂av无毛| 色吧在线观看| 亚洲色图综合在线观看| 久久久久国产精品人妻一区二区| 亚洲图色成人| 国产欧美日韩精品一区二区| 岛国毛片在线播放| .国产精品久久| 中文字幕av成人在线电影| 国产午夜精品久久久久久一区二区三区| 少妇人妻一区二区三区视频| 亚洲av欧美aⅴ国产| 日日啪夜夜撸| 少妇的逼好多水| 最后的刺客免费高清国语| 国产亚洲一区二区精品| 老熟女久久久| 亚洲国产精品999| 成人毛片60女人毛片免费| 久久久久精品久久久久真实原创| 精品一区在线观看国产| 国产在视频线精品| 亚洲av不卡在线观看| 午夜免费男女啪啪视频观看| 一级毛片黄色毛片免费观看视频| 看非洲黑人一级黄片| 国产一区亚洲一区在线观看| 91久久精品国产一区二区成人| 97精品久久久久久久久久精品| 亚洲国产精品国产精品| 亚洲久久久国产精品| 日韩一本色道免费dvd| 爱豆传媒免费全集在线观看| 国产av国产精品国产| 成年人午夜在线观看视频| 如何舔出高潮| 久久久a久久爽久久v久久| h日本视频在线播放| 日韩av在线免费看完整版不卡| 亚洲国产av新网站| 有码 亚洲区| 免费观看无遮挡的男女| 一级黄片播放器| 国产欧美日韩精品一区二区| 午夜福利在线观看免费完整高清在| 免费播放大片免费观看视频在线观看| 久久影院123| 在现免费观看毛片| 伊人久久国产一区二区| 免费看不卡的av| 国产有黄有色有爽视频| 亚洲精品日韩在线中文字幕| av免费在线看不卡| 久久国产亚洲av麻豆专区| 三级国产精品片| 国产乱人偷精品视频| 亚洲av成人精品一区久久| 不卡视频在线观看欧美| 免费观看av网站的网址| 日韩制服骚丝袜av| 日韩成人av中文字幕在线观看| 亚洲精品日本国产第一区| 免费看日本二区| 久久精品国产亚洲av天美| 亚洲成人一二三区av| 久热久热在线精品观看| 另类亚洲欧美激情| 夜夜看夜夜爽夜夜摸| 国产亚洲5aaaaa淫片| 中国三级夫妇交换| 我要看日韩黄色一级片| 简卡轻食公司| 黄色欧美视频在线观看| 久久久久久久久久成人| 免费大片黄手机在线观看| 在线观看人妻少妇| 看免费成人av毛片| 赤兔流量卡办理| 国产成人精品福利久久| 波野结衣二区三区在线| 久久久久久九九精品二区国产| av.在线天堂| 男的添女的下面高潮视频| 哪个播放器可以免费观看大片| 亚洲成人中文字幕在线播放| 亚洲国产av新网站| av国产免费在线观看| 男女下面进入的视频免费午夜| 国产精品av视频在线免费观看| 日本午夜av视频| 久久热精品热| 亚洲av欧美aⅴ国产| 国产精品无大码| 欧美日韩在线观看h| av又黄又爽大尺度在线免费看| 精品一区二区免费观看| 欧美亚洲 丝袜 人妻 在线| 伦精品一区二区三区| 在线播放无遮挡| 蜜桃在线观看..| 内地一区二区视频在线| 99热6这里只有精品| 在线免费十八禁| 麻豆成人午夜福利视频| 下体分泌物呈黄色| 国产精品一区www在线观看| 18禁在线无遮挡免费观看视频| 日韩成人av中文字幕在线观看| 一级二级三级毛片免费看| 少妇裸体淫交视频免费看高清| 久久人人爽av亚洲精品天堂 | 欧美一区二区亚洲| 欧美zozozo另类| 欧美日韩国产mv在线观看视频 | 国产av一区二区精品久久 | 老司机影院毛片| 十八禁网站网址无遮挡 | 伦理电影免费视频| 欧美xxxx黑人xx丫x性爽| 久久精品久久久久久久性| 欧美97在线视频| 国产男女超爽视频在线观看| 国产黄频视频在线观看| 免费久久久久久久精品成人欧美视频 | 免费人成在线观看视频色| 久久女婷五月综合色啪小说| 精华霜和精华液先用哪个| 久久久精品94久久精品| 美女cb高潮喷水在线观看| 免费黄网站久久成人精品| 亚洲性久久影院| 亚洲精品日韩在线中文字幕| 成人特级av手机在线观看| 在线免费十八禁| av在线老鸭窝| 国产精品一区二区性色av| 丰满乱子伦码专区| 女的被弄到高潮叫床怎么办| 永久网站在线| 亚洲av电影在线观看一区二区三区| 欧美成人精品欧美一级黄| 精品国产一区二区三区久久久樱花 | 日韩欧美精品免费久久| 欧美日本视频| 日韩制服骚丝袜av| 国产69精品久久久久777片| 看十八女毛片水多多多| 欧美另类一区| 亚洲精品国产av蜜桃| 日本免费在线观看一区| 久久ye,这里只有精品| 中文字幕免费在线视频6| 夜夜看夜夜爽夜夜摸| av一本久久久久| 特大巨黑吊av在线直播| 永久网站在线| 天堂8中文在线网| 亚洲国产精品国产精品| av播播在线观看一区| 嫩草影院入口| 午夜免费男女啪啪视频观看| 色吧在线观看| 欧美丝袜亚洲另类| 免费观看av网站的网址| 最近中文字幕高清免费大全6| av黄色大香蕉| 亚洲精品乱码久久久久久按摩| 久久青草综合色| 精品亚洲成国产av| 国产精品福利在线免费观看| 插阴视频在线观看视频| 欧美激情国产日韩精品一区| 各种免费的搞黄视频| 一级黄片播放器| 人人妻人人澡人人爽人人夜夜| 国产男人的电影天堂91| 狠狠精品人妻久久久久久综合| 高清黄色对白视频在线免费看 | 亚洲精品中文字幕在线视频 | 22中文网久久字幕| 欧美xxxx黑人xx丫x性爽| 小蜜桃在线观看免费完整版高清| 色婷婷av一区二区三区视频| 一级av片app| 夜夜看夜夜爽夜夜摸| 18禁在线播放成人免费| 久久婷婷青草| 久久久成人免费电影| 99热6这里只有精品| 国产精品一区二区在线观看99| 麻豆国产97在线/欧美| 美女视频免费永久观看网站| 亚洲精品自拍成人| 大香蕉97超碰在线| 欧美激情极品国产一区二区三区 | 亚洲最大成人中文| 国产精品爽爽va在线观看网站| 久久久久久久久久久丰满| 精品人妻偷拍中文字幕| 亚洲综合精品二区| 亚洲色图av天堂| 精品久久久久久久久av| 老师上课跳d突然被开到最大视频| 亚洲精品久久久久久婷婷小说| 亚洲婷婷狠狠爱综合网| 久久鲁丝午夜福利片| 高清av免费在线| 久久久久久人妻| 亚洲精品自拍成人| 夜夜骑夜夜射夜夜干| 国产精品99久久久久久久久| 欧美国产精品一级二级三级 | 美女脱内裤让男人舔精品视频| 国产精品一区二区在线不卡| 亚洲国产毛片av蜜桃av| 99热国产这里只有精品6| 丰满少妇做爰视频| 91狼人影院| 大码成人一级视频| 极品少妇高潮喷水抽搐| 3wmmmm亚洲av在线观看| 国产69精品久久久久777片| 成年美女黄网站色视频大全免费 | 久久ye,这里只有精品| videos熟女内射| 91aial.com中文字幕在线观看| 男人和女人高潮做爰伦理| www.av在线官网国产| 成人特级av手机在线观看| videos熟女内射| 亚洲欧美日韩无卡精品| 免费黄色在线免费观看| 大话2 男鬼变身卡| 一区二区三区免费毛片| 精品酒店卫生间| 欧美少妇被猛烈插入视频| 老熟女久久久| 日本午夜av视频| 国产黄色视频一区二区在线观看| 国产成人精品久久久久久| 久久 成人 亚洲| 国产又色又爽无遮挡免| 精品久久国产蜜桃| 久久久久久久亚洲中文字幕| 国产成人91sexporn| 亚洲精品中文字幕在线视频 | 国产精品.久久久| 国产一区二区三区av在线| 国产乱人视频| 超碰av人人做人人爽久久| 久久久久性生活片| 国产又色又爽无遮挡免| av国产免费在线观看| 能在线免费看毛片的网站| 亚洲av成人精品一区久久| 亚洲精品日韩av片在线观看| 舔av片在线| 国产精品嫩草影院av在线观看| 97超碰精品成人国产| 亚洲欧洲国产日韩| 最近2019中文字幕mv第一页| 人人妻人人澡人人爽人人夜夜| 大陆偷拍与自拍| 国产精品一区二区在线不卡| av线在线观看网站| 亚洲第一区二区三区不卡| 精品一区在线观看国产| 国产大屁股一区二区在线视频| 亚洲电影在线观看av| 久久人人爽人人爽人人片va| 成人二区视频| 欧美三级亚洲精品| 搡老乐熟女国产| videos熟女内射| 亚洲欧美精品专区久久| 毛片一级片免费看久久久久| 中文字幕久久专区| 看非洲黑人一级黄片| 熟女人妻精品中文字幕| 一个人看视频在线观看www免费| 18禁裸乳无遮挡动漫免费视频| 精品一区二区三区视频在线| 熟女av电影| 国产成人91sexporn| 毛片一级片免费看久久久久| 中文字幕久久专区| 男人添女人高潮全过程视频| 日本色播在线视频| 精品久久久久久久久av| 纯流量卡能插随身wifi吗| 男的添女的下面高潮视频| 中国国产av一级| 国产一级毛片在线| 国产熟女欧美一区二区| 中文精品一卡2卡3卡4更新| 亚洲精品第二区| 日韩欧美一区视频在线观看 | 色视频www国产| 日本黄色日本黄色录像| 亚洲国产av新网站| 国产人妻一区二区三区在| 欧美人与善性xxx| 美女国产视频在线观看| 人妻系列 视频| h日本视频在线播放| 色哟哟·www| 三级国产精品片| 男人狂女人下面高潮的视频| 精品亚洲成a人片在线观看 | 国产综合精华液| 少妇 在线观看| 成人亚洲精品一区在线观看 | 美女高潮的动态| 日本免费在线观看一区| 搡老乐熟女国产| 春色校园在线视频观看| 久久久久精品性色| 成人亚洲欧美一区二区av| 天堂8中文在线网| 精品一区二区三卡| av在线观看视频网站免费| av国产久精品久网站免费入址| 在线观看一区二区三区激情| 亚洲熟女精品中文字幕| 国产亚洲精品久久久com| 亚洲久久久国产精品| 黑人高潮一二区| 成年免费大片在线观看| 夜夜看夜夜爽夜夜摸| 国产精品女同一区二区软件| 精品亚洲成a人片在线观看 | 大香蕉97超碰在线| 99re6热这里在线精品视频| 一本色道久久久久久精品综合| 成年免费大片在线观看| 欧美三级亚洲精品| 日本爱情动作片www.在线观看| 国产成人a区在线观看| 日本色播在线视频| av女优亚洲男人天堂| 国产成人freesex在线| 自拍欧美九色日韩亚洲蝌蚪91 | 最近最新中文字幕大全电影3| 在线观看免费日韩欧美大片 | 亚洲欧洲国产日韩| 少妇 在线观看| 国产av精品麻豆| 成人漫画全彩无遮挡| 一个人免费看片子| 亚洲熟女精品中文字幕| 精品一区二区三区视频在线| 女人久久www免费人成看片| 一级毛片电影观看| 97在线人人人人妻| 欧美日韩在线观看h| 在线 av 中文字幕| 久久久久久久久久久免费av| 日韩强制内射视频| 一个人免费看片子| 五月伊人婷婷丁香| 最近的中文字幕免费完整| 成人亚洲欧美一区二区av| 久久人人爽av亚洲精品天堂 | 噜噜噜噜噜久久久久久91| 联通29元200g的流量卡| 国产伦精品一区二区三区视频9| 毛片女人毛片| 成人高潮视频无遮挡免费网站| av又黄又爽大尺度在线免费看| 日本黄色片子视频| 最近中文字幕2019免费版| 美女xxoo啪啪120秒动态图| tube8黄色片| 国产一区二区在线观看日韩| 99热6这里只有精品| 免费观看av网站的网址| 国精品久久久久久国模美| 午夜免费观看性视频| 少妇人妻 视频| 青春草国产在线视频| 国产精品久久久久久久电影| 久久精品久久精品一区二区三区| 日韩一区二区视频免费看| 亚洲综合色惰| 超碰97精品在线观看| 纵有疾风起免费观看全集完整版| 国产成人a∨麻豆精品| 欧美激情国产日韩精品一区| 国产亚洲午夜精品一区二区久久| 老女人水多毛片| 少妇丰满av| 99热这里只有是精品在线观看| 亚洲精品,欧美精品| 欧美3d第一页| 日本wwww免费看| av黄色大香蕉| 日韩中文字幕视频在线看片 | a级毛片免费高清观看在线播放| 国产深夜福利视频在线观看| 亚洲天堂av无毛| 免费黄网站久久成人精品| 亚洲熟女精品中文字幕| 国内精品宾馆在线| 亚洲中文av在线| 人人妻人人添人人爽欧美一区卜 | 哪个播放器可以免费观看大片| 少妇 在线观看| 欧美精品一区二区大全| 六月丁香七月| 国产成人freesex在线| 一级毛片久久久久久久久女| 小蜜桃在线观看免费完整版高清| 国产亚洲欧美精品永久| 丝袜喷水一区| 亚洲怡红院男人天堂| 亚洲精品国产av蜜桃| 欧美日韩精品成人综合77777| 韩国av在线不卡| 男的添女的下面高潮视频| 日本欧美国产在线视频| 欧美日韩一区二区视频在线观看视频在线| 校园人妻丝袜中文字幕| kizo精华| 91久久精品国产一区二区三区| 欧美老熟妇乱子伦牲交| 久久6这里有精品| 国产av精品麻豆| 男人爽女人下面视频在线观看| 亚洲精品日韩在线中文字幕| 亚洲av不卡在线观看| 国产成人免费观看mmmm| 日韩一区二区视频免费看| 99九九线精品视频在线观看视频| www.av在线官网国产| 亚洲va在线va天堂va国产| 高清黄色对白视频在线免费看 | 91狼人影院| 啦啦啦视频在线资源免费观看| 99视频精品全部免费 在线| 国产精品久久久久久精品电影小说 | 亚洲国产欧美人成| 亚州av有码| 国产色爽女视频免费观看| 各种免费的搞黄视频| 日本欧美视频一区| 亚洲精品乱久久久久久| 最近最新中文字幕大全电影3| 久久久久精品久久久久真实原创| 国产视频内射| 国产永久视频网站| 国产亚洲精品久久久com| 老司机影院毛片| 国产免费视频播放在线视频| 国产在线视频一区二区| 美女xxoo啪啪120秒动态图| 欧美高清成人免费视频www| 777米奇影视久久| av在线老鸭窝| 又大又黄又爽视频免费| 欧美成人精品欧美一级黄| 欧美日韩视频精品一区| 亚洲va在线va天堂va国产| 欧美日韩综合久久久久久| 国产v大片淫在线免费观看| 国产乱来视频区| 亚洲美女黄色视频免费看| 亚洲精品一区蜜桃| 国产亚洲欧美精品永久| 内射极品少妇av片p| 王馨瑶露胸无遮挡在线观看| 在线观看av片永久免费下载| 91精品国产九色| 精品国产三级普通话版| 男女无遮挡免费网站观看| 天堂8中文在线网| 99精国产麻豆久久婷婷| 久久久久国产精品人妻一区二区| 日韩精品有码人妻一区| 成人一区二区视频在线观看| 最近中文字幕高清免费大全6| 夜夜看夜夜爽夜夜摸| 久久人人爽人人片av| 日韩不卡一区二区三区视频在线| 久久婷婷青草| 日日摸夜夜添夜夜爱| 大话2 男鬼变身卡| 美女视频免费永久观看网站| 国产精品人妻久久久影院| 欧美日本视频| 欧美日韩国产mv在线观看视频 | 最近的中文字幕免费完整| 国产一区二区在线观看日韩| 青春草视频在线免费观看| 深爱激情五月婷婷| 熟女电影av网| 久久99热6这里只有精品| 亚洲av男天堂| 国产又色又爽无遮挡免| 王馨瑶露胸无遮挡在线观看| 亚洲精品视频女| 亚洲精品乱码久久久v下载方式| 麻豆国产97在线/欧美| 黄色配什么色好看| 国产人妻一区二区三区在| 看非洲黑人一级黄片| 青春草视频在线免费观看| 久久青草综合色| 国产精品一区二区性色av| 蜜桃亚洲精品一区二区三区| 精品午夜福利在线看| 欧美激情国产日韩精品一区| 国产精品熟女久久久久浪| 在线观看免费日韩欧美大片 | 熟妇人妻不卡中文字幕| 精品久久久久久久久av| 亚洲色图av天堂| 亚洲欧美一区二区三区国产| 亚洲美女视频黄频| 国产淫语在线视频| 久久国产亚洲av麻豆专区| 国产爱豆传媒在线观看| 亚洲精品乱码久久久v下载方式| 黑人猛操日本美女一级片| 亚洲成色77777| 日韩 亚洲 欧美在线| 少妇丰满av| 联通29元200g的流量卡| 91久久精品国产一区二区成人| av网站免费在线观看视频| 国产爽快片一区二区三区| 多毛熟女@视频| 黄色日韩在线| 国产中年淑女户外野战色| 日本vs欧美在线观看视频 | av在线观看视频网站免费| 国产亚洲av片在线观看秒播厂| 深爱激情五月婷婷| 国产免费福利视频在线观看| 亚洲精品中文字幕在线视频 | 久久久久久久精品精品| 欧美xxⅹ黑人| 纯流量卡能插随身wifi吗| 亚洲国产欧美人成| 亚洲成人av在线免费| 国产亚洲一区二区精品| 大码成人一级视频| 少妇高潮的动态图| 亚洲精品第二区| www.色视频.com| 我的老师免费观看完整版| 国产人妻一区二区三区在| 国产精品秋霞免费鲁丝片| 亚洲精品一二三| 国产精品久久久久成人av| 91aial.com中文字幕在线观看| 伊人久久国产一区二区| 亚洲国产欧美在线一区| 亚洲精品乱码久久久v下载方式| 99国产精品免费福利视频| 在线观看美女被高潮喷水网站| 久久久久国产网址| 王馨瑶露胸无遮挡在线观看| 成人毛片60女人毛片免费| 欧美3d第一页| 亚洲怡红院男人天堂| 乱码一卡2卡4卡精品| 2018国产大陆天天弄谢| 国产精品99久久久久久久久| 大片免费播放器 马上看| 日本-黄色视频高清免费观看| 少妇 在线观看| 26uuu在线亚洲综合色| 中文在线观看免费www的网站| 欧美另类一区| 久久鲁丝午夜福利片| 日本一二三区视频观看| 这个男人来自地球电影免费观看 | 亚洲三级黄色毛片| 伦理电影免费视频| 一个人看视频在线观看www免费| 美女福利国产在线 | 国产精品三级大全| 久久av网站| 超碰av人人做人人爽久久| 国产白丝娇喘喷水9色精品| 春色校园在线视频观看| av网站免费在线观看视频| 免费看日本二区| 十分钟在线观看高清视频www | 国产爽快片一区二区三区| 日韩中文字幕视频在线看片 | 18禁在线播放成人免费| 欧美最新免费一区二区三区| 女性被躁到高潮视频| 国产黄频视频在线观看| 伊人久久国产一区二区| 夫妻午夜视频|