• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于BERT_DPCNN文本分類(lèi)算法的垃圾郵件過(guò)濾系統(tǒng)

    2022-05-30 12:21:50彭毅姜昕宇
    電腦知識(shí)與技術(shù) 2022年22期
    關(guān)鍵詞:垃圾郵件分類(lèi)

    彭毅 姜昕宇

    摘要:近年來(lái),研究表明垃圾郵件已經(jīng)出現(xiàn)在私人郵箱中,嚴(yán)重?cái)_亂了用戶體驗(yàn)。這也已成為各大通信公司的優(yōu)先研究事項(xiàng)?;趥鹘y(tǒng)的機(jī)器學(xué)習(xí)算法垃圾郵件過(guò)濾模型已經(jīng)得到了充分的研究。隨著研究人員在自然語(yǔ)言處理方面的深入研究,深度學(xué)習(xí)算法及其構(gòu)建的模型表現(xiàn)效果遠(yuǎn)強(qiáng)于傳統(tǒng)機(jī)器學(xué)習(xí)模型。本文基于現(xiàn)有的各類(lèi)分類(lèi)模型進(jìn)行了研究及比較,討論了如何對(duì)垃圾郵件數(shù)據(jù)集進(jìn)行識(shí)別,并建立了BERT_DPCNN模型,以改進(jìn)對(duì)電子郵件這種具有獨(dú)特特征文本的識(shí)別方法。本文使用DPCNN作為垃圾郵件分類(lèi)器,使用BERT預(yù)訓(xùn)練模型得到的文本向量作為DPCNN模型的輸入,以此加強(qiáng)模型的分類(lèi)效果,有助于提取到更多的語(yǔ)義信息,以此避免出現(xiàn)深度神經(jīng)網(wǎng)絡(luò)梯度消失所帶來(lái)的問(wèn)題。根據(jù)模型的召回率、準(zhǔn)確率和F1指數(shù),BERT_DPCNN模型可以比其他模型更有效地識(shí)別垃圾郵件。此外,從實(shí)驗(yàn)數(shù)據(jù)中可以看出,一些涉及深度模型的特征提取方法,如本文中的BERT模型,比基于word2vec的特征提取方法具有更明顯的優(yōu)勢(shì)。本文構(gòu)建的BERT_DPCNN模型可以存儲(chǔ)更多的語(yǔ)義環(huán)境信息,為文本分類(lèi)提供更多的基礎(chǔ),并提取更深層次的文本特征。它是一個(gè)具有最佳整體性能的模型,對(duì)垃圾郵件過(guò)濾具有重要價(jià)值。

    關(guān)鍵詞:垃圾郵件;分類(lèi);BERT;DPCNN

    中圖分類(lèi)號(hào):TP311? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

    文章編號(hào):1009-3044(2022)22-0066-04

    1 引言

    電子郵件是一種通過(guò)電子方式提供信息交換的交流形式,用戶可以在世界上任何地方以非常低的成本聯(lián)系任何互聯(lián)網(wǎng)用戶。但是由于缺乏足夠的監(jiān)督,大量垃圾郵件的產(chǎn)生和大規(guī)模傳播,垃圾郵件攔截軟件的高速發(fā)展迫不及待[1]。因此本文基于最新的語(yǔ)言處理模型BERT提出更加高效的過(guò)濾方法。

    文本分類(lèi)是一項(xiàng)重要任務(wù)。拋開(kāi)傳統(tǒng)的機(jī)器學(xué)習(xí)算法K-近鄰算法、決策樹(shù)算法等來(lái)說(shuō),CNN最初是用于文本分類(lèi)的神經(jīng)網(wǎng)絡(luò)模型[2],它是前饋網(wǎng)絡(luò),卷積層將每個(gè)小數(shù)據(jù)塊轉(zhuǎn)換為向量[3],并且可以并行處理。RNN雖具有循環(huán)的連接,但對(duì)并行處理不友好。Johnson[4]基于 RNN提出了 LSTM算法,解決了長(zhǎng)文本序列中容易出現(xiàn)梯度消失的問(wèn)題。Merrienboer[5]提出了 Gated Recur-rent Unit (GRU),它是一個(gè)簡(jiǎn)化的 LSTM,但是既保持了LSTM的效果,又節(jié)省了訓(xùn)練時(shí)間。雖然CNN和RNN都可以使用詞序信息,但CNN因其簡(jiǎn)單性和并行性而更受歡迎,尤其是在訓(xùn)練集比較大時(shí),與字符級(jí)CNN相比,詞級(jí)CNN的層數(shù)更淺。雖然字符級(jí)CNN的優(yōu)點(diǎn)是不需要處理大量不同的詞,但詞級(jí)CNN往往更有效。這證實(shí)了“單詞”的知識(shí)可以產(chǎn)生更好的表示。Kalchbrenner[6]提出了一種稱為Deep Pyramid CNN的模型,整個(gè)模型的計(jì)算被限制在小于卷積塊范圍的兩倍。同時(shí),其金字塔的獨(dú)特結(jié)構(gòu)也讓模型能夠發(fā)現(xiàn)文本中的長(zhǎng)距離依賴,因此模型提取全局特征的能力得到了極大的提升。

    因此,本文圍繞垃圾郵件過(guò)濾問(wèn)題,在NLP中通用的文本分類(lèi)處理方法上提出了 BERT預(yù)訓(xùn)練與 DPCNN相連接來(lái)構(gòu)造效果更高、結(jié)果更好的分類(lèi)器。在詞向量方面,以往的神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型通常都使用word2vec生成詞向量。word2vec由詞義的分布式假設(shè)出發(fā),最終得到一個(gè)look-up table,每一個(gè)單詞被映射到一個(gè)唯一的稠密向量,因此也注定了它無(wú)法處理一詞多義的問(wèn)題。而 BERT使用的是 Transformer(中的編碼器)作為特征抽取器,這種方法對(duì)上下文有很好的利用,不需要像 BiLSTM那樣雙向堆疊。配合 MLM這樣的降噪目標(biāo)在大規(guī)模語(yǔ)料庫(kù)上進(jìn)行訓(xùn)練,它的詞表示更加動(dòng)態(tài)(相對(duì)于word2vec) ,對(duì)于一詞多義的問(wèn)題理解上升了一個(gè)新高度。

    隨著深度學(xué)習(xí)以及遷移學(xué)習(xí)的發(fā)展,研究者開(kāi)始更多地把深度學(xué)習(xí)模型應(yīng)用到自然語(yǔ)言處理領(lǐng)域上去解決實(shí)際問(wèn)題。通過(guò)大量查閱文獻(xiàn)可以發(fā)現(xiàn)構(gòu)造的模型除了在訓(xùn)練速度上大大縮短了時(shí)間,更在模型的準(zhǔn)確率上有很大的提升,但是,隨著垃圾郵件種類(lèi)的層出不窮,應(yīng)用于垃圾郵件的模型還有很大的創(chuàng)新空間。

    2 模型構(gòu)建

    本節(jié)主要介紹BERT_DPCNN垃圾郵件過(guò)濾模型的設(shè)計(jì)構(gòu)建。

    2.1 模型介紹

    首先,本報(bào)告中使用的BERT是在傳統(tǒng)Transformer模型基礎(chǔ)上的改進(jìn)版本。它采用多頭注意力機(jī)制,同時(shí)添加殘差連接;擴(kuò)展模型關(guān)注不同位置的能力,解決了隨著網(wǎng)絡(luò)加深而出現(xiàn)的梯度耗散問(wèn)題。其次,本文創(chuàng)新提出了用BERT模型代替了DPCNN中的 region embedding,以抓捕更遠(yuǎn)距離的依賴關(guān)系,實(shí)現(xiàn)模型質(zhì)的飛躍。

    2.2 BERT框架

    BERT模型的輸入是一個(gè)單一的句子或句子對(duì),每個(gè)詞都是由相應(yīng)的3個(gè)嵌入特征組成。這三個(gè)嵌入特征是:標(biāo)記嵌入、片段嵌入和位置嵌入。詞嵌入是指將一個(gè)句子劃分為有限的共同子詞單元;片段嵌入用于區(qū)分兩個(gè)句子,如兩個(gè)句子是否為上句和下句;位置嵌入是指將一個(gè)詞的位置信息編碼為一個(gè)向量。該模型用[CLS]標(biāo)記分類(lèi)模型,非分類(lèi)模型可以省略;用[SEP]作為句子符號(hào),斷開(kāi)輸入語(yǔ)料的前后句子的聯(lián)系。BERT模型將這3個(gè)嵌入式特征作為模型輸入。

    而它的網(wǎng)絡(luò)架構(gòu)使用的是多層 Transformer結(jié)構(gòu),其最大的特點(diǎn)是拋棄了傳統(tǒng)的RNN和CNN,通過(guò)Attention機(jī)制將任意位置的兩個(gè)單詞的距離轉(zhuǎn)換成1,有效地解決了NLP中棘手的長(zhǎng)期依賴問(wèn)題。Transformer由6個(gè)Encoder和6個(gè)Decoder堆疊而成,它接收序列數(shù)據(jù),同樣輸出處理后的序列數(shù)據(jù)。同時(shí)采用了多頭注意力機(jī)制,相較于自注意力機(jī)制,它能為 attention 層提供了多個(gè)表示子空間,拓展了模型關(guān)注不同位置的能力。每個(gè)注意力頭都分配一個(gè)Query、Key和 Value 權(quán)重矩陣;對(duì)于每個(gè)注意力頭,計(jì)算其相應(yīng)的關(guān)照程度向量,將得到的向量拼接之后乘以矩陣,就得到最終的注意力矩陣 Z;它的完整計(jì)算過(guò)程如圖1所示:

    與傳統(tǒng)的自然語(yǔ)言詞向量編碼不同,BERT模型是一個(gè)預(yù)訓(xùn)練模型,它采用上下文敏感的句子級(jí)向量編碼,可以更準(zhǔn)確地量化詞的含義和同一詞在文本中的不同語(yǔ)境。同時(shí),它還可以實(shí)現(xiàn)對(duì)長(zhǎng)文中句子之間的關(guān)系進(jìn)行編碼。在使用BERT模型時(shí),需要針對(duì)具體任務(wù)進(jìn)行微調(diào),以獲得更好的性能。為了實(shí)現(xiàn)這一目標(biāo),BERT模型通過(guò)聯(lián)合訓(xùn)練屏蔽式LM和下句預(yù)測(cè)任務(wù),可以獲得更全面的詞向量表示;這可以更準(zhǔn)確地描述輸入文本的語(yǔ)義信息。當(dāng)使用BERT時(shí),不需要改變其核心架構(gòu),只需要添加一個(gè)新的層即可將BERT模型用于特定任務(wù)。

    2.3 DPCNN 網(wǎng)絡(luò)結(jié)構(gòu)

    在深度金字塔卷積神經(jīng)網(wǎng)絡(luò)中,其結(jié)構(gòu)是卷積層和下采樣層的交替;減少了神經(jīng)網(wǎng)絡(luò)內(nèi)部的數(shù)據(jù)量和每層的計(jì)算量,并呈金字塔形狀減少,這就是DPCNN得名的原因。DPCNN使用兩層等長(zhǎng)卷積來(lái)提高詞匯嵌入表示的豐富性。在每次卷積之后,它將進(jìn)行最大限度地池化,以此將序列的長(zhǎng)度壓縮到原始序列的一半;以便于它所能感知的文本段比之前更長(zhǎng)。隨著網(wǎng)絡(luò)的深化,該模型可以在文本中發(fā)現(xiàn)更長(zhǎng)距離的關(guān)聯(lián)和全局語(yǔ)義信息。因此,DPCNN比使用短距離關(guān)聯(lián)的淺層卷積神經(jīng)網(wǎng)絡(luò)有更高的準(zhǔn)確性。其主要特點(diǎn)如下。

    1) 含有一個(gè)region嵌入層,即含有多尺寸卷積濾波器的卷積層。具體操作是對(duì)文本區(qū)域進(jìn)行卷積運(yùn)算,得到區(qū)域文本的特征圖作為嵌入向量。

    2) 使用固定數(shù)量的特征圖進(jìn)行下采樣,這樣在進(jìn)行池化操作時(shí)可以降低總的計(jì)算復(fù)雜性。

    3) 等長(zhǎng)卷積。這個(gè)特征可以壓縮每個(gè)詞組的上下文信息及其左右相鄰詞的上下文信息,使每個(gè)詞組的含義更加豐富。DPCNN通過(guò)適當(dāng)?shù)厥褂秒p層等長(zhǎng)卷積來(lái)提高詞嵌入的語(yǔ)義豐富性。

    4) 殘差連接。在DPCNN中,具體的操作是將區(qū)域嵌入直接連接到每個(gè)區(qū)塊上;也就是說(shuō),直接將區(qū)域嵌入連接到最終的池化層或輸出層。這使得梯度可以忽略卷積層權(quán)重的影響,并將其直接傳遞給每個(gè)區(qū)塊而沒(méi)有損失,大大緩解了梯度耗散的問(wèn)題。

    傳統(tǒng)的 DPCNN網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示:

    2.4? BERT_DPCNN模型

    在DPCNN的實(shí)際應(yīng)用中,一般使用region embedding作為模型的詞向量;它是TextCNN的包含多尺寸卷積濾波器卷積層的卷積結(jié)果,其本質(zhì)使用的也是N-gram,模型不能很好地理解語(yǔ)義。因此,本文選擇了將DPCNN中的region embedding進(jìn)行替換,正因?yàn)锽ERT使用了Transformer來(lái)提高模型效率以捕獲更遠(yuǎn)距離的依賴,因而可以捕獲真正雙向的基于上下文的信息。本論文使用基于PyTorch框架的BERT base uncase模型。該模型有 12 個(gè)Transformer層、768個(gè)隱藏單元、12個(gè)self-attention Header和1.1億個(gè)參數(shù)。

    BERT的預(yù)訓(xùn)練模型使用維基百科等數(shù)據(jù)進(jìn)行無(wú)監(jiān)督學(xué)習(xí)(Unsupervised Learning) ,以此提高學(xué)習(xí)能力。模型BERT_DPCNN首先使用BERT將文本中的每個(gè)詞在輸入層轉(zhuǎn)化為詞向量,該過(guò)程由語(yǔ)義提取層中的Transformer編碼器處理,然后對(duì)每個(gè)詞向量進(jìn)行拼接,得到向量矩陣X,公式如下:

    X1:n= x1⊕x2⊕...⊕xn

    卷積過(guò)程生成特征使用等長(zhǎng)的卷積。h是卷積核W的大小,特征Ci可用以下公式表示:

    Ci= f (W *Xi:i+h-1+ b)

    上述公式中,f :非線性變換函數(shù),它的過(guò)程是先進(jìn)行矩陣乘法,得到結(jié)果后使用激活函數(shù)“Relu”來(lái)進(jìn)行非線性變換,最后進(jìn)行最大池化操作。經(jīng)過(guò)以上步驟,模型獲得了電子郵件的高級(jí)特征,最終通過(guò)連接全連接網(wǎng)絡(luò)+Softmax層實(shí)現(xiàn)了對(duì)電子郵件的分類(lèi)。本模型的結(jié)構(gòu)如圖3所示:

    3 模型結(jié)果

    3.1 模型表現(xiàn)

    為了更好地觀察訓(xùn)練過(guò)程以及優(yōu)化模型參數(shù),本文以100個(gè)batch來(lái)觀察模型的擬合情況以及準(zhǔn)確率,通過(guò)對(duì)訓(xùn)練集以及驗(yàn)證集的圖形觀察評(píng)估,確定了最終的模型效果,如圖4所示,能達(dá)到準(zhǔn)確率為99%的郵件過(guò)濾效果。

    在整個(gè)訓(xùn)練過(guò)程中,通過(guò)跟蹤訓(xùn)練集和驗(yàn)證集的accuracy、recall、F1等參數(shù)[7]來(lái)監(jiān)控模型的學(xué)習(xí)進(jìn)度。性能評(píng)估依照分類(lèi)報(bào)告(見(jiàn)表1) 。從下面的分類(lèi)報(bào)告可以清楚地看出,正常郵件中的召回指數(shù)證明99.79% 的郵件可以準(zhǔn)確識(shí)別。此外,每個(gè)類(lèi)別的F1分?jǐn)?shù)非常相似。換句話說(shuō),本文提出的模型在大多數(shù)情況下幾乎完美地對(duì)電子郵件進(jìn)行了分類(lèi)。

    另一種方式是描述分類(lèi)器在測(cè)試集上的表現(xiàn)。筆者使用的是混淆矩陣(如表2 所示) 或也稱為誤差矩陣[8],它能計(jì)算正確和不正確的預(yù)測(cè)。在每個(gè)類(lèi)別中進(jìn)行匯總和分布,這是混淆矩陣的主要特征。通常情況下,混淆矩陣代表分類(lèi)模型在預(yù)測(cè)時(shí)的“混淆”程度。因此,它可以檢查分類(lèi)器的錯(cuò)誤。

    3.2 與其他先進(jìn)模型的比較

    眾所周知,分類(lèi)模型中使用的算法從早期的樸素貝葉斯、SVM、LR等經(jīng)歷了長(zhǎng)時(shí)間的研究和討論,再到當(dāng)前的神經(jīng)網(wǎng)絡(luò)算法。神經(jīng)網(wǎng)絡(luò)模型包括TextCNN、BiLSTM、BiLSTM-Attention和BERT_DPCNN模型。其中BiLSTM是雙向LSTM,包括前向LSTM和后向LSTM。

    由于時(shí)間原因,本文無(wú)法構(gòu)建所有算法的模型進(jìn)行比較,因此參考了其他學(xué)者基于其他算法構(gòu)建的模型的性能。該模型的性能可以通過(guò)該模型的準(zhǔn)確率等各項(xiàng)指標(biāo)進(jìn)行比較來(lái)粗略判斷,但是由于使用的數(shù)據(jù)集存在一定的差異,效果也略有不同。下面將介紹提出的垃圾郵件過(guò)濾算法的性能[9]。

    該模型結(jié)合了基于自注意力的 ALBERT 和 Bi-LSTM 網(wǎng)絡(luò)。同時(shí)他還對(duì)比了word2vec和bert詞向量,一眼就能看出BERT的優(yōu)秀表現(xiàn),表3是其模型結(jié)果表。

    綜上而言,BERT_DPCNN 模型的實(shí)驗(yàn)結(jié)果在上述各項(xiàng)指標(biāo)上都取得了較好的效果,BERT_DPCNN的垃圾郵件過(guò)濾模型與傳統(tǒng)的垃圾郵件過(guò)濾算法性能相比具有顯著的優(yōu)勢(shì)。從理論上分析,特別是與word2vec特征提取方法相比,本文的垃圾郵件過(guò)濾模型可以在詞向量環(huán)節(jié)提取到更多的語(yǔ)義環(huán)境信息,因此也可以提供更多的依據(jù)實(shí)現(xiàn)最大化的文本分類(lèi)。通過(guò)訓(xùn)練結(jié)果的對(duì)比也可以顯示出本文提出的模型具有明顯優(yōu)勢(shì),這也說(shuō)明了本文所提出的基于BERT_DPCNN的垃圾郵件過(guò)濾模型值得擴(kuò)展到實(shí)際的垃圾郵件過(guò)濾系統(tǒng)中。

    4 總結(jié)

    4.1 討論與未來(lái)工作

    盡管已經(jīng)有很多優(yōu)秀的垃圾郵件過(guò)濾算法,但在現(xiàn)實(shí)應(yīng)用中,垃圾郵件的識(shí)別和分類(lèi)方面還有諸多的問(wèn)題需要解決。雖然本文提出BERT_DPCNN算法能根據(jù)垃圾郵件數(shù)據(jù)集的特點(diǎn)有效分類(lèi)和過(guò)濾垃圾郵件。但也有一些不足:

    1) 本文使用中等規(guī)模的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),數(shù)據(jù)集中正負(fù)樣本的數(shù)量不是很均衡,會(huì)在一定程度上影響模型的訓(xùn)練和效果。未來(lái)應(yīng)該考慮使用更真實(shí)的大數(shù)據(jù)集進(jìn)行訓(xùn)練,實(shí)現(xiàn)精準(zhǔn)過(guò)濾。

    2) 本文的識(shí)別和分類(lèi)對(duì)象主要以英文字符內(nèi)容為主。與傳統(tǒng)算法比較,在識(shí)別的有效性上有一定的提升;未來(lái)為了提升模型的準(zhǔn)確率,降低分類(lèi)錯(cuò)誤的概率,可以增加郵件發(fā)件人、發(fā)送頻率等信息綜合考慮,進(jìn)一步增強(qiáng)信息的維度。

    此外,由于時(shí)間的限制,筆者不能探索所有的算法。因此,在未來(lái)的工作中,需要進(jìn)行更多的實(shí)驗(yàn),以與其他模型的性能進(jìn)行比較。另外,筆者還發(fā)現(xiàn)也有一些新的訓(xùn)練前模型,如LXnet可以有更好的性能,這些都值得在未來(lái)研究和討論。

    4.2 結(jié)論

    互聯(lián)網(wǎng)信息時(shí)代的到來(lái),人們身處異地就可以輕松地從用戶終端獲取信息,但是伴隨著出現(xiàn)的惡意信息也給人們帶來(lái)了巨大的困擾,誕生于這個(gè)互聯(lián)網(wǎng)時(shí)代的電子郵件也是如此。一方面,人們可以不受地域限制地隨時(shí)發(fā)送電子郵件進(jìn)行交流。另一方面,各式各樣的垃圾郵件也破壞了綠色健康的通信環(huán)境。由于垃圾郵件過(guò)濾模型的出現(xiàn),使這個(gè)問(wèn)題變得迎刃而解,垃圾郵件的識(shí)別和過(guò)濾將逐漸走向標(biāo)準(zhǔn)化。高效的垃圾郵件過(guò)濾系統(tǒng)可以幫助郵件服務(wù)提供商更準(zhǔn)確地?cái)r截一些騷擾用戶、危害用戶信息安全的郵件。然而,仍然清楚的是,即使對(duì)垃圾郵件識(shí)別進(jìn)行了大量研究,仍然需要優(yōu)化算法以不斷提高用戶滿意度。主流的垃圾郵件識(shí)別方法主要有關(guān)鍵字過(guò)濾和后臺(tái)人工審核,這帶來(lái)了識(shí)別效率低、維護(hù)成本高、效率低等諸多問(wèn)題。為了解決這個(gè)問(wèn)題,本文創(chuàng)新性地提出了一種新的模型識(shí)別方法,并通過(guò)使用特定數(shù)據(jù)集來(lái)訓(xùn)練提出的模型來(lái)進(jìn)行論證分析,證明該模型具有優(yōu)秀的垃圾郵件識(shí)別效果。

    綜合全文,本文主要完成了以下研究工作:

    1) 首先確定研究方向,查閱該方向的研究現(xiàn)狀以及不足,正式提出課題進(jìn)行可行性分析。通過(guò)對(duì)相關(guān)文獻(xiàn)的研究調(diào)查,詳細(xì)了解了電子郵件文本的特點(diǎn)以及垃圾郵件分類(lèi)技術(shù)的現(xiàn)狀問(wèn)題,郵件文字雜亂、特征復(fù)雜、語(yǔ)言具有相當(dāng)程度的獨(dú)特性。同時(shí),已有文章指出,對(duì)于郵件這種類(lèi)型的文本信息,可以利用BERT模型的詞向量來(lái)針對(duì)性地提取文本特征。

    2) 隨著遷移學(xué)習(xí)的發(fā)展,BERT模型逐漸流行起來(lái),其在文本分類(lèi)方面的優(yōu)越性能也備受關(guān)注。因此,為了解決這個(gè)問(wèn)題,本文創(chuàng)新性地提出了BERT_DPCNN垃圾郵件識(shí)別模型,在充分學(xué)習(xí)語(yǔ)義的基礎(chǔ)上,通過(guò)對(duì)有效郵件數(shù)據(jù)集的訓(xùn)練,得到的模型能夠準(zhǔn)確有效地提取郵件的特征,并實(shí)現(xiàn)垃圾郵件的有效過(guò)濾。

    3) 評(píng)估本文算法的性能。本文使用可信度極高的 kaggle 郵件數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練和評(píng)估。最后的結(jié)果表明,本文提出的創(chuàng)新算法在accuracy、recall和F1等方面都表現(xiàn)出色。

    參考文獻(xiàn):

    [1] Goodman J,Yih W.Online discriminative Spam filter training[C]//. InProceedings of the 3rd conference on email and anti-spam (CEAS),2006.

    [2] Konstas I,Keller F,Demberg V,et al.Convolutional Neural Networks for Sentence Classification[C]//Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), Doha, Qatar, October 2014: 1746-1751.

    [3] Sanghani G,Kotecha K.Incremental personalized E-mail Spam filter using novel TFDCR feature selection with dynamic feature update[J].Expert Systems With Applications,2019,115:287-299.

    [4] Johnson R,Zhang T.Effective use of word order for text categorization with convolutional neural networks[C]//Proceedings of the 2015 Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies.Denver,Colorado.Stroudsburg,PA,USA:Association for Computational Linguistics,2015: 103–112.

    [5] Cho K,van Merrienboer B,Gulcehre C,et al.Learning phrase representations using RNN encoder-decoder for statistical machine translation[EB/OL].2014:arXiv:1406.1078.https://arxiv.org/abs/1406.1078.

    [6] Kalchbrenner N,Grefenstette E,Blunsom P.A convolutional neural network for modelling sentences[EB/OL].2014:arXiv:1404.2188.https://arxiv.org/abs/1404.2188.

    [7] ANGUITA D, GHIO A, RIDELLA S, et al. Kfold cross validation for error rate estimate in support vector machines [C]// DMIN 2009: Proceedings of the 2009 International Conference on Data Mining. Las Vegas: CSREA Press, 2009: 291-297.

    [8] Vieira J P A,Moura R S.An analysis of convolutional neural networks for sentence classification[C]//2017 XLIII Latin American Computer Conference (CLEI).Cordoba,Argentina.IEEE,2017:1-5.

    [9] VISA S, RAMSAY B, RALESCU A L, et al. Confusion matrix-based feature selection (2011). [C]//Proceedings of The 22nd Midwest Artificial Intelligence and Cognitive Science Conference 2011, Cincinnati, Ohio, USA. April 16–17, 2011:120–127.

    【通聯(lián)編輯:唐一東】

    猜你喜歡
    垃圾郵件分類(lèi)
    從“scientist(科學(xué)家)”到“spam(垃圾郵件)”,英語(yǔ)單詞的起源出人意料地有趣 精讀
    分類(lèi)算一算
    垃圾分類(lèi)的困惑你有嗎
    大眾健康(2021年6期)2021-06-08 19:30:06
    一種基于SMOTE和隨機(jī)森林的垃圾郵件檢測(cè)算法
    分類(lèi)討論求坐標(biāo)
    數(shù)據(jù)分析中的分類(lèi)討論
    教你一招:數(shù)的分類(lèi)
    基于支持向量機(jī)與人工免疫系統(tǒng)的垃圾郵件過(guò)濾模型
    給塑料分分類(lèi)吧
    石器部落
    69av精品久久久久久 | 免费在线观看影片大全网站| av欧美777| 免费女性裸体啪啪无遮挡网站| 亚洲一卡2卡3卡4卡5卡精品中文| 日本av手机在线免费观看| 岛国在线观看网站| 韩国精品一区二区三区| 人人妻人人澡人人爽人人夜夜| 免费人妻精品一区二区三区视频| 淫妇啪啪啪对白视频| 欧美日韩av久久| 一个人免费看片子| 久久久国产精品麻豆| 91国产中文字幕| 久久久久精品国产欧美久久久| 在线十欧美十亚洲十日本专区| 日韩制服丝袜自拍偷拍| 亚洲av电影在线进入| 最黄视频免费看| 搡老乐熟女国产| 激情在线观看视频在线高清 | 日韩熟女老妇一区二区性免费视频| 大香蕉久久成人网| 黄色a级毛片大全视频| 亚洲中文字幕日韩| www.999成人在线观看| 中亚洲国语对白在线视频| 欧美一级毛片孕妇| 国产精品98久久久久久宅男小说| 亚洲,欧美精品.| 亚洲精华国产精华精| 亚洲国产欧美在线一区| 9热在线视频观看99| 在线观看一区二区三区激情| 国产伦人伦偷精品视频| 欧美日韩亚洲国产一区二区在线观看 | 亚洲一卡2卡3卡4卡5卡精品中文| 精品少妇内射三级| 人人妻,人人澡人人爽秒播| 久久精品人人爽人人爽视色| 一本—道久久a久久精品蜜桃钙片| 9191精品国产免费久久| 丁香欧美五月| 亚洲av日韩在线播放| 一本—道久久a久久精品蜜桃钙片| 女人爽到高潮嗷嗷叫在线视频| 不卡av一区二区三区| 国产一区二区三区在线臀色熟女 | av片东京热男人的天堂| 一区二区三区精品91| 高清黄色对白视频在线免费看| 亚洲av日韩在线播放| cao死你这个sao货| 国产高清视频在线播放一区| 国产一区有黄有色的免费视频| 80岁老熟妇乱子伦牲交| 日韩欧美三级三区| 国产亚洲欧美在线一区二区| 男女之事视频高清在线观看| 视频在线观看一区二区三区| 久久午夜亚洲精品久久| 日韩中文字幕视频在线看片| 最黄视频免费看| 97在线人人人人妻| 久久久久久免费高清国产稀缺| 亚洲中文字幕日韩| 18禁观看日本| 亚洲国产看品久久| 99re6热这里在线精品视频| 大陆偷拍与自拍| 在线看a的网站| 日本av免费视频播放| 久久精品国产99精品国产亚洲性色 | 欧美国产精品一级二级三级| 激情视频va一区二区三区| 国产精品免费一区二区三区在线 | 麻豆国产av国片精品| 人人妻人人澡人人看| 手机成人av网站| 日本黄色视频三级网站网址 | 亚洲国产毛片av蜜桃av| 欧美激情久久久久久爽电影 | 欧美变态另类bdsm刘玥| 十八禁网站网址无遮挡| 另类亚洲欧美激情| 午夜福利,免费看| 90打野战视频偷拍视频| 麻豆av在线久日| 国产成人一区二区三区免费视频网站| 一级片'在线观看视频| 国产成人av激情在线播放| 91九色精品人成在线观看| 亚洲欧美日韩另类电影网站| 男人舔女人的私密视频| 免费少妇av软件| 国产在线视频一区二区| cao死你这个sao货| 免费不卡黄色视频| 国产成人av激情在线播放| 欧美国产精品va在线观看不卡| 精品亚洲成国产av| 久久天躁狠狠躁夜夜2o2o| 最近最新中文字幕大全电影3 | 精品亚洲成国产av| 麻豆av在线久日| 天堂8中文在线网| 久久婷婷成人综合色麻豆| 国产欧美亚洲国产| 一本—道久久a久久精品蜜桃钙片| 在线十欧美十亚洲十日本专区| 精品人妻在线不人妻| 十八禁人妻一区二区| 久久人人爽av亚洲精品天堂| 亚洲伊人色综图| 少妇裸体淫交视频免费看高清 | 午夜福利在线观看吧| 最近最新中文字幕大全电影3 | 日本欧美视频一区| 91国产中文字幕| 日日夜夜操网爽| 日韩欧美国产一区二区入口| 电影成人av| 国产一区二区 视频在线| 动漫黄色视频在线观看| videosex国产| 久久久国产一区二区| 亚洲欧美激情在线| 亚洲av日韩精品久久久久久密| 桃花免费在线播放| 国产视频一区二区在线看| 亚洲精品美女久久av网站| 亚洲国产av新网站| 一级a爱视频在线免费观看| 亚洲,欧美精品.| 99热国产这里只有精品6| 亚洲欧美一区二区三区久久| av视频免费观看在线观看| 91国产中文字幕| 精品高清国产在线一区| 久久精品aⅴ一区二区三区四区| 青草久久国产| 又黄又粗又硬又大视频| 在线永久观看黄色视频| 99香蕉大伊视频| 久久精品国产综合久久久| 日本欧美视频一区| 日韩有码中文字幕| 曰老女人黄片| 国产午夜精品久久久久久| 精品一区二区三区四区五区乱码| 国产精品免费视频内射| 国产免费现黄频在线看| 一级毛片电影观看| 伊人久久大香线蕉亚洲五| 天堂中文最新版在线下载| 亚洲欧洲精品一区二区精品久久久| 国产成人欧美| 男女下面插进去视频免费观看| 91大片在线观看| 国产欧美日韩一区二区三区在线| 久久亚洲真实| 欧美一级毛片孕妇| 国产精品香港三级国产av潘金莲| 色尼玛亚洲综合影院| 看免费av毛片| 欧美国产精品一级二级三级| 亚洲情色 制服丝袜| 9191精品国产免费久久| 欧美成人午夜精品| av在线播放免费不卡| 免费观看人在逋| 女人久久www免费人成看片| 纵有疾风起免费观看全集完整版| av福利片在线| 久久午夜综合久久蜜桃| 亚洲午夜精品一区,二区,三区| 波多野结衣av一区二区av| 一个人免费在线观看的高清视频| 日韩大片免费观看网站| 久久久久网色| 国产又色又爽无遮挡免费看| 精品一区二区三区视频在线观看免费 | 这个男人来自地球电影免费观看| 免费久久久久久久精品成人欧美视频| netflix在线观看网站| 美女视频免费永久观看网站| 男女无遮挡免费网站观看| 国产欧美日韩精品亚洲av| 免费观看av网站的网址| 人妻久久中文字幕网| 在线观看免费高清a一片| 女同久久另类99精品国产91| 欧美+亚洲+日韩+国产| 欧美黄色片欧美黄色片| 99国产精品免费福利视频| 欧美乱妇无乱码| 最新美女视频免费是黄的| 黄网站色视频无遮挡免费观看| 日韩欧美一区视频在线观看| 狠狠婷婷综合久久久久久88av| 最近最新免费中文字幕在线| 午夜成年电影在线免费观看| 在线十欧美十亚洲十日本专区| 99国产极品粉嫩在线观看| 五月开心婷婷网| 国产成人av教育| 一级片'在线观看视频| 亚洲午夜精品一区,二区,三区| 国产日韩欧美在线精品| 一夜夜www| 极品人妻少妇av视频| 精品国内亚洲2022精品成人 | 国产成+人综合+亚洲专区| 亚洲国产成人一精品久久久| 男女午夜视频在线观看| 老汉色av国产亚洲站长工具| 捣出白浆h1v1| 久久久国产成人免费| 久久 成人 亚洲| 亚洲欧美色中文字幕在线| 国产在线免费精品| 国产成人一区二区三区免费视频网站| 91成年电影在线观看| 电影成人av| 精品亚洲成国产av| 18禁国产床啪视频网站| 高清黄色对白视频在线免费看| 日本av免费视频播放| 中文字幕色久视频| 老司机在亚洲福利影院| 国产一区有黄有色的免费视频| 国产男女超爽视频在线观看| 国产国语露脸激情在线看| 午夜福利视频精品| 涩涩av久久男人的天堂| 免费观看人在逋| 久久久国产欧美日韩av| 亚洲天堂av无毛| 老熟妇仑乱视频hdxx| 99精品在免费线老司机午夜| 国产精品亚洲av一区麻豆| 亚洲国产精品一区二区三区在线| 久久久久久免费高清国产稀缺| 一进一出抽搐动态| 女人久久www免费人成看片| 国产日韩欧美在线精品| 激情视频va一区二区三区| 色播在线永久视频| 午夜激情久久久久久久| 久久九九热精品免费| 男女床上黄色一级片免费看| 亚洲av成人不卡在线观看播放网| 久久精品国产综合久久久| 免费久久久久久久精品成人欧美视频| 最新的欧美精品一区二区| 免费在线观看完整版高清| 动漫黄色视频在线观看| 日日夜夜操网爽| aaaaa片日本免费| 90打野战视频偷拍视频| 国产片内射在线| 日韩欧美国产一区二区入口| 极品人妻少妇av视频| 女性被躁到高潮视频| 欧美激情 高清一区二区三区| 日本wwww免费看| 一边摸一边抽搐一进一出视频| e午夜精品久久久久久久| 亚洲情色 制服丝袜| 青青草视频在线视频观看| 亚洲中文字幕日韩| 亚洲第一av免费看| 香蕉丝袜av| 午夜精品久久久久久毛片777| 欧美成人免费av一区二区三区 | 中文字幕精品免费在线观看视频| 老汉色av国产亚洲站长工具| 成人影院久久| 久久久久国内视频| 天天躁日日躁夜夜躁夜夜| 久久av网站| 精品久久蜜臀av无| 午夜免费成人在线视频| 两性夫妻黄色片| 精品福利观看| 国产成人精品久久二区二区91| 一级毛片精品| 99精品欧美一区二区三区四区| 久久久国产一区二区| 91字幕亚洲| 又大又爽又粗| 欧美日韩av久久| 一个人免费在线观看的高清视频| 啦啦啦中文免费视频观看日本| 亚洲精品久久成人aⅴ小说| 日本wwww免费看| 超碰97精品在线观看| 久久亚洲真实| 欧美精品啪啪一区二区三区| 久久中文字幕人妻熟女| 99国产精品99久久久久| 日本黄色日本黄色录像| 久久热在线av| 亚洲成人国产一区在线观看| 欧美精品av麻豆av| 国产主播在线观看一区二区| 欧美成人免费av一区二区三区 | av片东京热男人的天堂| 国产有黄有色有爽视频| 久久精品国产亚洲av高清一级| 男女免费视频国产| 亚洲一卡2卡3卡4卡5卡精品中文| 高清在线国产一区| 国产精品久久久久成人av| 天天躁夜夜躁狠狠躁躁| 亚洲熟妇熟女久久| 又大又爽又粗| 最新在线观看一区二区三区| 黑人操中国人逼视频| 亚洲男人天堂网一区| 老司机福利观看| 黑人巨大精品欧美一区二区蜜桃| 成人黄色视频免费在线看| 午夜激情av网站| 亚洲人成77777在线视频| 两个人看的免费小视频| 精品一区二区三卡| 十分钟在线观看高清视频www| 12—13女人毛片做爰片一| 一级,二级,三级黄色视频| 一本久久精品| 日韩视频一区二区在线观看| 看免费av毛片| 高清视频免费观看一区二区| 欧美中文综合在线视频| 欧美av亚洲av综合av国产av| 性色av乱码一区二区三区2| 一区二区av电影网| 国产精品一区二区在线不卡| 超碰97精品在线观看| 日韩欧美免费精品| 老司机午夜十八禁免费视频| 青青草视频在线视频观看| 美国免费a级毛片| 久久婷婷成人综合色麻豆| 久久中文看片网| 国产精品偷伦视频观看了| 国产片内射在线| 婷婷成人精品国产| 国产欧美亚洲国产| av片东京热男人的天堂| www日本在线高清视频| 一区福利在线观看| 18在线观看网站| 国产在线精品亚洲第一网站| 女人被躁到高潮嗷嗷叫费观| 黄色视频不卡| 免费不卡黄色视频| 国产在视频线精品| 久久国产精品大桥未久av| 国产精品电影一区二区三区 | 国产精品二区激情视频| 搡老乐熟女国产| 国产精品久久久人人做人人爽| 91麻豆av在线| 国产高清激情床上av| 欧美成人免费av一区二区三区 | a级片在线免费高清观看视频| 午夜久久久在线观看| 丁香欧美五月| 自拍欧美九色日韩亚洲蝌蚪91| 搡老岳熟女国产| 成人国产av品久久久| 91av网站免费观看| 亚洲色图综合在线观看| av视频免费观看在线观看| 日韩一卡2卡3卡4卡2021年| 蜜桃国产av成人99| 亚洲五月婷婷丁香| 国产亚洲av高清不卡| 国产免费福利视频在线观看| 亚洲va日本ⅴa欧美va伊人久久| 久久精品人人爽人人爽视色| 国产av国产精品国产| 亚洲色图 男人天堂 中文字幕| 啦啦啦在线免费观看视频4| 18禁国产床啪视频网站| 91麻豆av在线| 亚洲国产毛片av蜜桃av| 精品久久蜜臀av无| 日韩视频在线欧美| 亚洲avbb在线观看| 在线观看人妻少妇| 亚洲国产av影院在线观看| 激情视频va一区二区三区| 电影成人av| 色婷婷久久久亚洲欧美| 男女下面插进去视频免费观看| 热re99久久国产66热| 精品乱码久久久久久99久播| 一级毛片女人18水好多| 99re6热这里在线精品视频| 精品第一国产精品| 午夜福利乱码中文字幕| 一级片'在线观看视频| 精品亚洲成国产av| 狂野欧美激情性xxxx| 亚洲美女黄片视频| 日韩大片免费观看网站| 黑人巨大精品欧美一区二区蜜桃| 极品人妻少妇av视频| 久久久久久久国产电影| 午夜老司机福利片| 欧美+亚洲+日韩+国产| 国产欧美日韩一区二区精品| 12—13女人毛片做爰片一| 一区二区三区精品91| 亚洲专区国产一区二区| 国产精品 国内视频| 欧美日韩av久久| 亚洲精品自拍成人| 免费在线观看视频国产中文字幕亚洲| 国产男女内射视频| 精品视频人人做人人爽| 高清av免费在线| 日本欧美视频一区| 首页视频小说图片口味搜索| 99国产极品粉嫩在线观看| 99热国产这里只有精品6| 久久久久久人人人人人| 国产av又大| 中文字幕制服av| 欧美乱妇无乱码| 不卡一级毛片| 麻豆国产av国片精品| 欧美日韩黄片免| 久久精品成人免费网站| 999精品在线视频| 久9热在线精品视频| 999久久久精品免费观看国产| 久久99一区二区三区| 国产99久久九九免费精品| 女同久久另类99精品国产91| 久久精品aⅴ一区二区三区四区| 欧美精品人与动牲交sv欧美| 久久精品国产综合久久久| 美女高潮喷水抽搐中文字幕| 成人三级做爰电影| 新久久久久国产一级毛片| 日韩有码中文字幕| 成人特级黄色片久久久久久久 | 国产激情久久老熟女| 色在线成人网| 操出白浆在线播放| 精品一区二区三区视频在线观看免费 | 午夜福利一区二区在线看| 婷婷成人精品国产| 午夜福利视频在线观看免费| 少妇裸体淫交视频免费看高清 | 精品人妻熟女毛片av久久网站| 亚洲国产中文字幕在线视频| 91九色精品人成在线观看| 日韩精品免费视频一区二区三区| 日本vs欧美在线观看视频| 天天躁夜夜躁狠狠躁躁| 波多野结衣一区麻豆| 欧美亚洲日本最大视频资源| 大陆偷拍与自拍| 人人澡人人妻人| 久久狼人影院| 久久久精品国产亚洲av高清涩受| 757午夜福利合集在线观看| 国产免费av片在线观看野外av| 黄色片一级片一级黄色片| a级毛片黄视频| 女性生殖器流出的白浆| 伦理电影免费视频| 国产成人系列免费观看| 午夜精品久久久久久毛片777| 熟女少妇亚洲综合色aaa.| 精品人妻在线不人妻| 亚洲成国产人片在线观看| 又黄又粗又硬又大视频| 黄片小视频在线播放| 中文字幕人妻熟女乱码| 在线 av 中文字幕| 丝袜美腿诱惑在线| 精品少妇内射三级| 深夜精品福利| 久久ye,这里只有精品| 日韩精品免费视频一区二区三区| 一进一出抽搐动态| 亚洲精品一卡2卡三卡4卡5卡| 国产伦理片在线播放av一区| 婷婷丁香在线五月| 男女午夜视频在线观看| 最新在线观看一区二区三区| 日韩成人在线观看一区二区三区| 中文字幕人妻熟女乱码| av电影中文网址| 亚洲成av片中文字幕在线观看| 久久久久国产一级毛片高清牌| 一二三四在线观看免费中文在| 欧美老熟妇乱子伦牲交| 午夜久久久在线观看| 天天影视国产精品| 国产区一区二久久| 一边摸一边抽搐一进一出视频| 五月开心婷婷网| 69av精品久久久久久 | 日韩欧美国产一区二区入口| 青草久久国产| 在线观看www视频免费| 大香蕉久久成人网| 少妇 在线观看| 精品福利永久在线观看| 午夜91福利影院| 亚洲av日韩精品久久久久久密| 大片电影免费在线观看免费| 亚洲精品中文字幕在线视频| 狠狠狠狠99中文字幕| 淫妇啪啪啪对白视频| 欧美变态另类bdsm刘玥| 亚洲国产欧美在线一区| 欧美日韩亚洲高清精品| 免费看十八禁软件| 日韩一区二区三区影片| 一级,二级,三级黄色视频| 五月天丁香电影| 精品国产一区二区三区久久久樱花| av天堂久久9| av在线播放免费不卡| av网站在线播放免费| 亚洲欧美色中文字幕在线| 国产成人免费观看mmmm| 国产男靠女视频免费网站| 80岁老熟妇乱子伦牲交| 人人妻人人澡人人看| av不卡在线播放| 中文字幕人妻丝袜制服| 人人妻人人添人人爽欧美一区卜| 午夜福利,免费看| 淫妇啪啪啪对白视频| 成人免费观看视频高清| 啦啦啦视频在线资源免费观看| 国产老妇伦熟女老妇高清| 国产精品国产av在线观看| 久久精品国产99精品国产亚洲性色 | 国产真人三级小视频在线观看| 久久香蕉激情| 亚洲三区欧美一区| 亚洲国产欧美一区二区综合| 色老头精品视频在线观看| 国内毛片毛片毛片毛片毛片| 99国产精品一区二区三区| 亚洲精品粉嫩美女一区| 我的亚洲天堂| 成年动漫av网址| 日本vs欧美在线观看视频| 亚洲专区中文字幕在线| 99久久精品国产亚洲精品| 午夜福利欧美成人| 熟女少妇亚洲综合色aaa.| 在线永久观看黄色视频| 国产高清videossex| av视频免费观看在线观看| 多毛熟女@视频| 黄片小视频在线播放| 国产片内射在线| 99国产精品免费福利视频| 亚洲国产欧美在线一区| 午夜福利一区二区在线看| 久久人妻av系列| 99在线人妻在线中文字幕 | 18禁裸乳无遮挡动漫免费视频| 免费黄频网站在线观看国产| 久久这里只有精品19| 亚洲精品国产区一区二| 18在线观看网站| 变态另类成人亚洲欧美熟女 | 亚洲国产精品一区二区三区在线| 午夜日韩欧美国产| 久久人妻福利社区极品人妻图片| 国产亚洲精品一区二区www | 国产黄频视频在线观看| 国产欧美日韩一区二区三区在线| 亚洲成a人片在线一区二区| 国产真人三级小视频在线观看| 亚洲精品国产色婷婷电影| 人人妻人人爽人人添夜夜欢视频| 丁香六月欧美| 日韩欧美免费精品| 97人妻天天添夜夜摸| 久久人妻熟女aⅴ| 免费日韩欧美在线观看| 国产伦人伦偷精品视频| 成人永久免费在线观看视频 | 国产av国产精品国产| 免费在线观看完整版高清| 怎么达到女性高潮| 国产三级黄色录像| 美女福利国产在线| 亚洲欧美一区二区三区黑人| 亚洲欧美精品综合一区二区三区| 国产精品偷伦视频观看了| 久久久久久久国产电影| 久久久久视频综合| 亚洲视频免费观看视频| 真人做人爱边吃奶动态| 性色av乱码一区二区三区2| 亚洲欧美日韩另类电影网站| 男人操女人黄网站| 男女午夜视频在线观看| 色尼玛亚洲综合影院|