• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于雙向時(shí)間卷積網(wǎng)絡(luò)的半監(jiān)督日志異常檢測(cè)

    2024-08-17 00:00:00尹春勇孔嫻

    摘 要:由于日志解析準(zhǔn)確率不高以及標(biāo)記樣本不足降低了異常檢測(cè)的準(zhǔn)確率,所以提出了一種新的基于日志的半監(jiān)督異常檢測(cè)方法。首先,通過(guò)改進(jìn)字典的日志解析方法,保留了日志事件中的部分參數(shù)信息,從而提高日志信息的利用率和日志解析的準(zhǔn)確率;然后,使用BERT對(duì)模板中的語(yǔ)義信息進(jìn)行編碼,獲得日志的語(yǔ)義向量;接著采用聚類的方法進(jìn)行標(biāo)簽估計(jì),緩解了數(shù)據(jù)標(biāo)注不足的問(wèn)題,有效提高了模型對(duì)不穩(wěn)定數(shù)據(jù)的檢測(cè);最后,使用帶有殘差塊的雙向時(shí)間卷積網(wǎng)絡(luò)(Bi-TCN)從兩個(gè)方向捕獲上下文信息,提高了異常檢測(cè)的精度和效率。為了評(píng)估該方法的性能,在兩個(gè)數(shù)據(jù)集上進(jìn)行了評(píng)估,最終實(shí)驗(yàn)結(jié)果表明,該方法與最新的三個(gè)基準(zhǔn)模型LogBERT、PLELog和LogEncoder相比,F(xiàn)1值平均提高了7%、14.1%和8.04%,能夠高效精準(zhǔn)地進(jìn)行日志解析和日志異常檢測(cè)。

    關(guān)鍵詞:日志解析; 異常檢測(cè); 半監(jiān)督學(xué)習(xí); 雙向時(shí)間卷積網(wǎng)絡(luò); 上下文相關(guān)性

    中圖分類號(hào):TP391.1 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-3695(2024)07-026-2110-08

    doi:10.19734/j.issn.1001-3695.2023.10.0507

    Semi-supervised log anomaly detection based onbidirectional temporal convolution network

    Abstract:Because the accuracy of log parsing is not high and the lack of tag samples reduces the accuracy of anomaly detection, this paper proposed a new semi-supervised anomaly detection method based on logs. Firstly, the method enhanced the log parsing method of the dictionary to retain parameter information in log events, improving the utilization and accuracy of log resolution. Next, the method utilized BERT to encode semantic information in the template, obtaining the semantic vector of the log. Then, the method employed the clustering method to estimate the tag, which effectively alleviated the problem of insufficient data labeling and enhanced the model’s ability of detecting unstable data. Finally, the method captured context information from two directions based on the bidirectional temporal convolution network(Bi-TCN) with residual blocks, which enhanced the accuracy and efficiency of anomaly detection. To evaluate the method’s performance, it conducted extensive experiments on two datasets. The results demonstrate that the proposed method achieves an average improvement of 7%,14.1% and 8.04% in F1 value compared to the latest three benchmark models, LogBERT,PLELog and LogEncoder, enabling efficient and accurate log parsing and log anomaly detection.

    Key words:log parsing; anomaly detection; semi-supervised learning; bidirectional temporal convolution network; contextual correlation

    0 引言

    隨著大型系統(tǒng)的規(guī)模和復(fù)雜性日益增加,一些外部故障或內(nèi)部錯(cuò)誤都可能引起系統(tǒng)崩潰,有必要及時(shí)并準(zhǔn)確地檢測(cè)出系統(tǒng)中的異常,以確保系統(tǒng)的可靠性和穩(wěn)定性,從而減輕不必要的損失[1]。系統(tǒng)日志是指現(xiàn)代網(wǎng)絡(luò)設(shè)備、系統(tǒng)及服務(wù)程序等在運(yùn)行過(guò)程中產(chǎn)生的具有記載系統(tǒng)狀態(tài)和事件信息的記錄。通過(guò)對(duì)日志的分析,可以識(shí)別偏離預(yù)期行為或模式的日志序列,進(jìn)行故障排除和問(wèn)題診斷。因此,日志文件在監(jiān)控網(wǎng)絡(luò)情況、維護(hù)系統(tǒng)穩(wěn)定、調(diào)試性能問(wèn)題和保護(hù)軟件安全等方面有重要的作用。

    日志數(shù)據(jù)通常是由源代碼中日志語(yǔ)句打印的半結(jié)構(gòu)化的文本字符串組成,詳細(xì)記錄了操作信息,包含應(yīng)用狀態(tài)、程序執(zhí)行邏輯、事件信息等。隨著系統(tǒng)的發(fā)展,日志事件和日志序列的更迭導(dǎo)致日志語(yǔ)句不斷演化。不同類型的設(shè)備包含多樣的數(shù)據(jù)元素和不同的日志語(yǔ)法,因此日志具有多樣性和非結(jié)構(gòu)化的特點(diǎn)。通常在日志數(shù)據(jù)的采集、檢索和預(yù)處理過(guò)程中,不可避免地會(huì)在原始日志數(shù)據(jù)中引入一定程度的噪聲,導(dǎo)致日志數(shù)據(jù)具有不穩(wěn)定性[2]。除此之外,分布式軟件系統(tǒng)會(huì)產(chǎn)生大量具有復(fù)雜依賴關(guān)系的日志信息。因此日志數(shù)據(jù)的非結(jié)構(gòu)性、不穩(wěn)定性以及龐大的數(shù)據(jù)量都會(huì)給異常日志檢測(cè)帶來(lái)巨大的挑戰(zhàn)。

    早期,系統(tǒng)日志的異常檢測(cè)依賴于運(yùn)維人員的個(gè)人知識(shí)、技術(shù)及經(jīng)驗(yàn),人工檢查分析大量日志信息,難以得出有效的分析和檢測(cè)。隨著人工智能技術(shù)的不斷發(fā)展,越來(lái)越多基于機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘與異常檢測(cè)方法應(yīng)運(yùn)而生,這些方法能夠自動(dòng)地從運(yùn)維數(shù)據(jù)中學(xué)習(xí)日志事件之間的內(nèi)在關(guān)系并總結(jié)規(guī)則,實(shí)現(xiàn)了日志異常檢測(cè)的自動(dòng)化,增加了異常檢測(cè)的效率和準(zhǔn)確率。

    現(xiàn)有采用深度學(xué)習(xí)技術(shù)的異常檢測(cè)方法分為監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)三大類。監(jiān)督學(xué)習(xí)方法SwissLog[3,4]、LightLog[5]依賴于大量已標(biāo)注的訓(xùn)練數(shù)據(jù),可以有效學(xué)習(xí)歷史日志信息,但基于日志數(shù)據(jù)異構(gòu)、大量且不穩(wěn)定的特性,需要大量人工標(biāo)記工作的監(jiān)督學(xué)習(xí)方法并不實(shí)用。無(wú)監(jiān)督異常檢測(cè)方法如DeepLog[6]、LogAnomaly[7],基于訓(xùn)練數(shù)據(jù)大部分是正常日志的先驗(yàn)條件,對(duì)噪聲敏感,在實(shí)際中遇到看不見(jiàn)的日志事件或序列有效性會(huì)降低。而半監(jiān)督學(xué)習(xí)使用部分標(biāo)記數(shù)據(jù)和大量未標(biāo)記的數(shù)據(jù)進(jìn)行模式識(shí)別工作,盡可能減少人工標(biāo)記成本,同時(shí)又能帶來(lái)比較高的準(zhǔn)確性。

    日志數(shù)據(jù)集作為時(shí)序數(shù)據(jù)的一種,大多深度學(xué)習(xí)的異常檢測(cè)方法DeepLog、LogRobust、SwissLog等使用循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN) 以及相關(guān)變體進(jìn)行日志序列特征學(xué)習(xí)。然而RNN每?jī)蓚€(gè)相鄰神經(jīng)元是相互連接的,計(jì)算當(dāng)前的隱藏狀態(tài)需要計(jì)算之前的隱藏狀態(tài),因此不支持并行計(jì)算,訓(xùn)練時(shí)間開(kāi)銷大,且處理長(zhǎng)序列時(shí)可能出現(xiàn)梯度消失或爆炸的問(wèn)題,雖然長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)和門控循環(huán)單元網(wǎng)絡(luò)(gate recurrent unit,GRU)可以減緩但也不能完全杜絕。此外,RNN在從日志序列獲取信息時(shí),由于每個(gè)隱藏狀態(tài)僅記住部分信息,會(huì)隨著時(shí)間的增長(zhǎng)被遺忘,所以穩(wěn)定性不佳。時(shí)間卷積網(wǎng)絡(luò)(temporal convolution network,TCN)[8]不僅可以通過(guò)一些層的堆疊來(lái)捕捉序列數(shù)據(jù)的時(shí)間屬性,而且可以并行化處理,解決了建模遠(yuǎn)程關(guān)系時(shí)的梯度爆炸和消失問(wèn)題,在內(nèi)存消耗和處理速度方面具有顯著優(yōu)勢(shì),能夠更快地獲得穩(wěn)定的模型。

    與此同時(shí),基于深度學(xué)習(xí)的日志異常檢測(cè)方法性能對(duì)日志解析的正確性依賴較高,然而現(xiàn)有的日志解析方法無(wú)法應(yīng)對(duì)頻繁變化的日志語(yǔ)句,普遍需要經(jīng)過(guò)預(yù)先調(diào)參,存在過(guò)度解析丟失日志事件中價(jià)值信息的問(wèn)題。基于頻繁項(xiàng)挖掘的方法FT-tree[9]、基于最長(zhǎng)公共子序列的方法Spell[10]、基于啟發(fā)式方法Drain[11]是日志異常檢測(cè)使用最頻繁的幾種解析方法。FT-tree方法在時(shí)間、空間上開(kāi)銷大;Spell僅基于最長(zhǎng)公共子序列的策略會(huì)導(dǎo)致分區(qū)不足,且沒(méi)有限制其前綴樹(shù)的深度,直接計(jì)算兩條日志事件之間的最長(zhǎng)公共子序列,比較耗時(shí);Drain在準(zhǔn)確性、健壯性和效率性方面具有優(yōu)勢(shì),但其將日志過(guò)度解析為可變部分,會(huì)丟失重要信息,容易導(dǎo)致誤報(bào)。在SwissLog中提出了一種基于字典且無(wú)須參數(shù)調(diào)整的日志解析方法,可以保留日志語(yǔ)義含義,并可以高效地正確解析日志。

    本文提出了一種新的基于日志的半監(jiān)督異常檢測(cè)方法,命名為BTCNLog(log anomaly detection based on Bi-TCN)。首先,通過(guò)改進(jìn)的基于字典的日志解析方法進(jìn)行日志解析;然后,使用BERT[12]對(duì)日志模板進(jìn)行編碼,充分表示日志語(yǔ)義信息;接著,受PLELog[13]方法的啟發(fā),采用層次聚類方法初步估計(jì)未標(biāo)記的日志序列的標(biāo)簽并賦予標(biāo)簽概率,可以學(xué)習(xí)歷史異常日志信息;最后,采用帶有殘差塊的雙向時(shí)間卷積網(wǎng)絡(luò)從兩個(gè)方向捕獲上下文信息,對(duì)日志數(shù)據(jù)進(jìn)行有效異常檢測(cè)。

    本文的主要貢獻(xiàn)有:a)提出了一種新的基于日志的半監(jiān)督異常檢測(cè)方法BTCNLog,引入帶有殘差塊的雙向時(shí)間卷積網(wǎng)絡(luò)從兩個(gè)方向捕獲上下文信息,從而更好地捕獲日志序列的特征,提高了異常檢測(cè)的精度和效率;b)結(jié)合日志數(shù)據(jù)的特性改進(jìn)了日志解析方法,保留了部分參數(shù)語(yǔ)義信息,提高了日志信息的利用率和日志解析的準(zhǔn)確率;c)為了緩解數(shù)據(jù)標(biāo)注不足問(wèn)題,采用聚類的方法進(jìn)行標(biāo)簽估計(jì),學(xué)習(xí)歷史異常日志信息;d)通過(guò)三個(gè)公共數(shù)據(jù)集上對(duì)模型進(jìn)行對(duì)比實(shí)驗(yàn)和消融實(shí)驗(yàn),證明了本文方法的有效性。

    1 相關(guān)工作

    1.1 日志解析

    日志解析是一個(gè)將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為結(jié)構(gòu)化數(shù)據(jù)的過(guò)程,具體而言,通過(guò)技術(shù)將已知日志事件中日志關(guān)鍵字和參數(shù)拆分并統(tǒng)一模板的過(guò)程。目前,日志解析是許多日志異常檢測(cè)方法的基本步驟,現(xiàn)有方法可以分為以下幾類:

    a)基于聚類的方法。主要假設(shè)是同類的日志事件或簽名之間具有相似性,通過(guò)計(jì)算它們之間的距離,根據(jù)相似性進(jìn)行聚類,在每個(gè)聚類中提取日志模板,代表方法有LKE[14]和LogMine[15]。

    b)基于頻繁模式挖掘的方法。通過(guò)挖掘日志事件中項(xiàng)的頻率,提取日志中頻繁出現(xiàn)的一組常量項(xiàng)形成日志模板,代表方法有LFA[16]和FT-tree。

    c)基于日志結(jié)構(gòu)啟發(fā)式方法。利用日志結(jié)構(gòu)中不同的屬性,使用機(jī)器學(xué)習(xí)等啟發(fā)式方法提取通用模板,代表方法有Drain、IPLoM[17],其中Drain是一種基于固定深度樹(shù)的在線日志解析方法,能夠以流的方式準(zhǔn)確、高效地從原始日志事件中自動(dòng)提取日志模板。

    d)基于字典的方法。通過(guò)現(xiàn)有日志模板來(lái)構(gòu)造字典,再用于日志解析的方法。Logparse[18]將模板生成問(wèn)題轉(zhuǎn)換為詞分類問(wèn)題,并學(xué)習(xí)模板詞和變量詞的特征。Logram[19]是利用n-gram字典實(shí)現(xiàn)自動(dòng)日志解析方法。

    e)其他方法。Spell使用最長(zhǎng)公共序列算法在線搜索日志組解析流中的日志。NuLog[20]是一種基于掩碼語(yǔ)言建模分析上下文中出現(xiàn)的標(biāo)記來(lái)學(xué)習(xí)日志數(shù)據(jù)的一般語(yǔ)義表示。

    1.2 日志異常檢測(cè)

    異常檢測(cè)過(guò)程是使用機(jī)器學(xué)習(xí)等方法對(duì)特征向量進(jìn)行學(xué)習(xí),從而生成異常檢測(cè)的模型,該模型可用于對(duì)新的日志進(jìn)行檢測(cè)[21]?,F(xiàn)有日志異常檢測(cè)方法可以分為數(shù)據(jù)挖掘和深度學(xué)習(xí)方法。

    數(shù)據(jù)挖掘的方法有邏輯回歸(logistic regression,LR)[22],其將日志序列構(gòu)造成事件計(jì)數(shù)向量,利用計(jì)數(shù)向量和標(biāo)簽訓(xùn)練邏輯回歸模型,計(jì)算測(cè)試用例的異??赡苄圆⒃O(shè)置閾值區(qū)分出異常日志。支持向量機(jī)[23]同樣將日志序列表示為事件計(jì)數(shù)向量,如果測(cè)試用例位于超平面之上則其為異常日志?;诰垲惖臒o(wú)監(jiān)督學(xué)習(xí)方法LogCluster[24]通過(guò)事件計(jì)數(shù)向量表示日志序列,對(duì)日志序列進(jìn)行聚類,每個(gè)簇的質(zhì)心為代表性向量。通過(guò)計(jì)算新日志序列向量與所有現(xiàn)有集群代表向量之間的距離來(lái)檢測(cè)異常。此類基于數(shù)據(jù)挖掘的日志異常檢測(cè)方法通常將日志表示為日志事件計(jì)數(shù)向量,無(wú)法捕獲日志事件的語(yǔ)義信息,異常檢測(cè)效果不穩(wěn)定。

    基于深度學(xué)習(xí)的日志異常檢測(cè)方法可以更好地學(xué)習(xí)日志序列中日志事件之間的內(nèi)在關(guān)系,對(duì)異常日志的檢測(cè)有較高的精確率和魯棒性。監(jiān)督方法中,LogRobust采用Drain方法進(jìn)行日志解析,通過(guò)預(yù)處理、詞向量化并結(jié)合詞頻-逆文檔頻率(term frequency-inverse document frequency,TF-IDF) [25]將日志事件轉(zhuǎn)變?yōu)檎Z(yǔ)義向量,使用基于注意力的雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(bidirectional long-short term memory,Bi-LSTM)學(xué)習(xí)不同日志事件的重要性,可以處理不穩(wěn)定的日志序列。SwissLog利用基于字典無(wú)須參數(shù)調(diào)整的日志解析方法進(jìn)行解析,并使用BERT編碼器對(duì)模板中的語(yǔ)義信息進(jìn)行編碼,最后基于注意力的BJ2Jx2DeswPIXWzW+DPWXqOdr3yrevS785yZfbAbjUVM=i-LSTM模型進(jìn)行日志異常檢測(cè)。LightLog方法基于word2vec[26]和后處理算法獲得低維語(yǔ)義向量,通過(guò)輕量級(jí)時(shí)間卷積網(wǎng)絡(luò)實(shí)現(xiàn)在邊緣設(shè)備上的日志異常檢測(cè)。上述監(jiān)督學(xué)習(xí)方法需要人工對(duì)大量日志進(jìn)行標(biāo)注,十分耗時(shí)。無(wú)監(jiān)督方法中,Logsy[27]方法使用輔助數(shù)據(jù)集的正常日志序列增強(qiáng)數(shù)據(jù)表示,將注意力機(jī)制與Transformer編碼器相結(jié)合來(lái)進(jìn)行異常檢測(cè)。OC4Seq[28]將一類分類器與GRU網(wǎng)絡(luò)相結(jié)合,在日志序列上分別進(jìn)行全局和局部的異常檢測(cè)。此類無(wú)監(jiān)督學(xué)習(xí)的方法只關(guān)注歷史正常日志序列的信息,忽略了歷史異常日志序列的信息。

    2 BTCNLog模型總體框架

    現(xiàn)有基于日志異常檢測(cè)的方法通常都包含日志收集與預(yù)處理、日志解析、特征提取和異常檢測(cè)四個(gè)步驟。本文BTCNLog日志異常檢測(cè)模型總體框架如圖1所示。在訓(xùn)練階段,首先對(duì)原始日志條目進(jìn)行預(yù)處理、日志解析提取模板,并將模板進(jìn)行向量化提取日志語(yǔ)義向量。然后,將日志條目分組成日志序列,對(duì)訓(xùn)練日志序列數(shù)據(jù)進(jìn)行聚類標(biāo)簽估計(jì),得到偽標(biāo)簽。最后將帶有偽標(biāo)簽的日志序列語(yǔ)義向量輸入Bi-TCN,進(jìn)行異常檢測(cè)模型訓(xùn)練。在測(cè)試階段,同樣對(duì)新的原始日志進(jìn)行處理獲得日志序列及對(duì)應(yīng)的日志序列語(yǔ)義向量,輸入訓(xùn)練好的模型進(jìn)行異常檢測(cè)。

    2.1 日志解析和向量化

    日志解析是將原始日志經(jīng)過(guò)預(yù)處理,提取日志模板的過(guò)程。日志的向量化是指將日志提取的模板語(yǔ)句嵌入語(yǔ)義向量,得到可以進(jìn)行模型訓(xùn)練的日志數(shù)據(jù),最后結(jié)合日志分組得到日志序列及對(duì)應(yīng)的日志序列向量。

    2.1.1 預(yù)處理

    預(yù)處理日志數(shù)據(jù)是日志處理的第一步。不同系統(tǒng)日志條目會(huì)包含時(shí)間戳、日志消息等級(jí)和日志事件等不同的日志數(shù)據(jù)項(xiàng),因此需要根據(jù)日志數(shù)據(jù)集的框架,使用正則表達(dá)式匹配各個(gè)數(shù)據(jù)項(xiàng),如圖2所示。

    其中顯示了一條BGL數(shù)據(jù)集日志條目,當(dāng)標(biāo)簽Label為“-”時(shí)表示正常日志,否則為異常日志。日志類型level可以粗略區(qū)分日志的等級(jí),但不足以將異常日志和正常日志完全區(qū)分,而日志事件event是描述事件具體發(fā)生的非結(jié)構(gòu)化文本,蘊(yùn)涵豐富的日志信息,因此是進(jìn)行日志分析和異常檢測(cè)的主要數(shù)據(jù)來(lái)源。如果將原始日志事件直接向量化,則會(huì)出現(xiàn)詞匯量過(guò)多、無(wú)效詞過(guò)多的問(wèn)題,給日志異常檢測(cè)帶來(lái)許多噪聲,影響訓(xùn)練效果。因此將事件中的日志公共變量,例如IP地址、八進(jìn)制數(shù)、日期等,利用正則表達(dá)式分別替換成對(duì)應(yīng)標(biāo)記,而不是被統(tǒng)一的變量通配符替換,這樣不僅可以保留部分變量的語(yǔ)義信息,還可以通過(guò)正則表達(dá)式篩選出不符合規(guī)則的變量。接下來(lái)對(duì)日志事件進(jìn)行日志解析,將描述系統(tǒng)事件的日志關(guān)鍵字部分和日志參數(shù)部分進(jìn)行分離。

    2.1.2 日志解析

    傳統(tǒng)日志解析方法例如使用最頻繁的Spell和Drain方法都需要對(duì)不同日志分別進(jìn)行預(yù)訓(xùn)練調(diào)參才能達(dá)到最佳解析結(jié)果。此外,還會(huì)因正常日志和異常日志存在過(guò)多相同內(nèi)容而導(dǎo)致日志關(guān)鍵字部分被過(guò)度解析成參數(shù)部分。目前日志事件大多都是基于英文單詞組成具有一定可讀性的語(yǔ)句,因此基于字典的日志解析方法,可以保留有效詞的語(yǔ)義信息,緩解過(guò)度解析的問(wèn)題。其中SwissLog使用了此類日志解析方法。

    首先,對(duì)每個(gè)日志事件進(jìn)行分隔并形成一組單詞標(biāo)記。由于日志事件中包含許多特殊符號(hào),所以采用空格及日志中常用的特殊分隔符來(lái)分割日志事件字符串。根據(jù)引入的字典,將所有的單詞標(biāo)記進(jìn)行字典化,有效單詞放入單詞集中。然后,將日志事件根據(jù)單詞集進(jìn)行集群,具有相同單詞集并且每個(gè)單詞詞頻相同的日志事件被歸為同一集群,每個(gè)集群使用最長(zhǎng)公共序列提取維護(hù)一個(gè)模板。接下來(lái),將所有不同集群獲得的粗略模板按照順序生成前綴樹(shù),用來(lái)整合最終的模板。

    然而SwissLog在依據(jù)有效詞的單詞集進(jìn)行集群時(shí),當(dāng)日志事件中無(wú)有效詞或有效詞單一較少時(shí),有被解析為0模板或其他模板的可能性,導(dǎo)致大量0模板或模板解析錯(cuò)誤,影響日志序列上下文依賴性的提取。因此本文在選擇日志事件單詞集時(shí),額外加入了由下畫線或其他連字符組成的有效單詞,并將其存入分詞緩存字典。此外,針對(duì)分詞器wordninja會(huì)產(chǎn)生錯(cuò)誤拆分單詞的問(wèn)題,本文對(duì)其拆分后的單詞作進(jìn)一步篩選,確保拆分的正確性,可以大大減少解析為0模板和其他模板的可能性。圖3(a)是SwissLog日志解析處理過(guò)程,其將單詞“ciod”錯(cuò)誤拆分為“cio”和“d”,并且將“LOGIN_MESSAGE”視為無(wú)效詞,而該單詞在一定程度上蘊(yùn)涵語(yǔ)義。圖3(b)是BTCNLog日志解析處理過(guò)程,可以看出本文的日志解析方法,結(jié)合日志事件中單詞的特性,保留了日志事件中的部分參數(shù)信息,從而減少了傳統(tǒng)日志解析中,因解析不準(zhǔn)確降低日志異常檢測(cè)方法的性能。

    2.1.3 BERT語(yǔ)義向量化

    下面對(duì)每個(gè)日志事件轉(zhuǎn)換的日志模板進(jìn)行向量化。傳統(tǒng)上,日志事件的單詞通過(guò)使用word2vec或GloVe[29]方法進(jìn)一步轉(zhuǎn)換為向量,然后根據(jù)單詞向量計(jì)算每個(gè)句子的表示向量。但是,此類方法生成的向量不包含上下語(yǔ)義信息,不能解決同義詞問(wèn)題。為了更好地捕捉單詞的上下語(yǔ)義信息和詞性差異,BTCNLog使用BERT作為詞嵌入的方法。BERT詞嵌入模型的核心是Transformer編碼器,使用雙向自注意力機(jī)制能夠?qū)W習(xí)到單詞上下文的相關(guān)性,能夠根據(jù)周圍的單詞動(dòng)態(tài)地產(chǎn)生單詞表示形式。

    在本模型中,利用預(yù)先訓(xùn)練好的BERT模型來(lái)獲取日志事件的語(yǔ)義信息,該模型在維基百科語(yǔ)料庫(kù)和圖書(shū)語(yǔ)料庫(kù)上進(jìn)行了訓(xùn)練,包含12層Transformer的編碼器,其中每個(gè)Transformer有768個(gè)隱藏單元。

    2.1.4 日志分組

    本文使用了滾動(dòng)窗口和會(huì)話窗口結(jié)合的分組策略對(duì)日志序列進(jìn)行分組,可以減少同一個(gè)事務(wù)的日志數(shù)據(jù)被分到不同日志序列中的情況,從而提高本模型的日志序列上下文依賴性的提取性能。

    常規(guī)的日志分組方法包括滾動(dòng)窗口、滑動(dòng)窗口和會(huì)話窗口。 滾動(dòng)窗口是基于日志時(shí)間戳數(shù)據(jù)取相同窗口大小的日志,互不重疊?;瑒?dòng)窗口也是基于日志時(shí)間戳數(shù)據(jù),依據(jù)窗口大小和步長(zhǎng)劃分,其前后窗口會(huì)重疊。會(huì)話窗口是基于日志的會(huì)話標(biāo)識(shí)符進(jìn)行分組。然而系統(tǒng)會(huì)多個(gè)任務(wù)并發(fā)執(zhí)行,導(dǎo)致日志的執(zhí)行順序可能會(huì)交錯(cuò),因此基于日志時(shí)間戳分組的滾動(dòng)窗口和滑動(dòng)窗口會(huì)導(dǎo)致同一個(gè)事務(wù)的日志數(shù)據(jù)被分到不同日志序列中,影響日志序列上下文依賴性的提取。會(huì)話窗口會(huì)導(dǎo)致日志序列長(zhǎng)度有較大差別。

    本文采取基于日志時(shí)間戳結(jié)合日志條目中某個(gè)特定數(shù)據(jù)項(xiàng)將日志重排并固定窗口大小w進(jìn)行日志分組。此日志分組方法基于數(shù)據(jù)項(xiàng)可以粗略劃分日志事務(wù)的前提來(lái)選取數(shù)據(jù)項(xiàng),例如node或user??梢砸欢ǔ潭壬媳WC相同日志事務(wù)被劃分到相同日志序列,并且不會(huì)產(chǎn)生日志序列長(zhǎng)度相差太大的情況。若日志序列包含異常日志事件,則該日志序列為異常日志序列,否則為正常日志序列。

    2.2 聚類估計(jì)標(biāo)簽

    在已知部分正常日志序列的基礎(chǔ)上,基于語(yǔ)義相似的日志序列更有可能共享相同標(biāo)簽的性質(zhì),通過(guò)聚類,進(jìn)一步估計(jì)訓(xùn)練集中未標(biāo)記日志序列的標(biāo)簽,從而融合監(jiān)督方法的優(yōu)點(diǎn),可以學(xué)習(xí)到歷史異常日志的信息。

    基于密度群集的HDBSCAN[30]聚類算法可以處理密度不同的聚類問(wèn)題,無(wú)須預(yù)定義聚類數(shù)量且參數(shù)量少。因此采用HDBSCAN算法將訓(xùn)練集中的所有日志序列聚類到不同的簇,使每個(gè)簇更可能包含語(yǔ)義相似的日志序列。由于日志序列語(yǔ)義向量維度較大影響聚類效率,所以采用了FastICA[31]算法降低日志語(yǔ)義向量的維度,保留下最重要的一些特征,去除噪聲和不重要的特征,從而實(shí)現(xiàn)提升數(shù)據(jù)處理速度的目的。

    本文的日志序列聚類過(guò)程如下:首先,將日志序列中每條日志語(yǔ)句語(yǔ)義向量求和作為圖的頂點(diǎn),日志序列之間的相互可達(dá)度量距離作為頂點(diǎn)之前邊的權(quán)重,構(gòu)建了一個(gè)帶權(quán)連通無(wú)向圖。 日志序列之前相互可達(dá)度量距離如式(1)所示。

    dmreach-m(a,b)=max{corem(a),corem(b),d(a,b)}(1)

    其中:dmreach-m(a,b)表示日志序列樣本a和b的相互可達(dá)度量距離;corem(a)表示日志序列樣本a與第m個(gè)最近鄰樣本點(diǎn)的核心距離;d(a,b)是兩個(gè)日志序列樣本點(diǎn)a和b之間的直接距離。

    其次,將該帶權(quán)圖通過(guò)Prim算法構(gòu)建其最小生成樹(shù)。根據(jù)最小生成樹(shù),通過(guò)按距離升序排列樹(shù)的邊,并為每條邊創(chuàng)建一個(gè)新的合并簇進(jìn)行迭代,將其轉(zhuǎn)換為連接組件的層次結(jié)構(gòu)。然后,根據(jù)設(shè)置的最小簇?cái)?shù)值,將大而復(fù)雜的簇層次結(jié)構(gòu)縮小成一個(gè)較小的樹(shù)。最后,根據(jù)每個(gè)簇的穩(wěn)定性值,從壓縮樹(shù)中提取出穩(wěn)定的簇。簇的穩(wěn)定性scluster公式如式(2)所示。

    其中:λ=1/distance;λbirth表示當(dāng)節(jié)點(diǎn)被分裂成兩個(gè)子節(jié)點(diǎn)時(shí),對(duì)應(yīng)斷開(kāi)邊的長(zhǎng)度的倒數(shù);λa表示日志序列樣本點(diǎn)a因?yàn)榉至央x開(kāi)該節(jié)點(diǎn)時(shí),對(duì)應(yīng)斷開(kāi)邊長(zhǎng)度的倒數(shù)。

    這樣,將訓(xùn)練集中的日志序列分成若干簇,語(yǔ)義相似的日志序列劃分到同一簇中,同簇的日志序列共享相同的標(biāo)簽。因此,如果一個(gè)簇包含已知的正常日志序列,則該簇中的其余未標(biāo)簽的日志序列更有可能也是正常日志序列,否則有可能是異常的。通過(guò)測(cè)量未標(biāo)記日志序列屬于每個(gè)標(biāo)簽的概率來(lái)為每個(gè)未標(biāo)記日志序列指定概率標(biāo)簽,以減少噪聲的影響。具體而言,HDBSCAN聚類結(jié)果會(huì)給每個(gè)日志序列樣本分配一個(gè)0~1的分?jǐn)?shù)score,用于表示每個(gè)日志序列屬于該簇的不確定性,score越小說(shuō)明該日志序列越接近該簇的中心。因此,可以將該分?jǐn)?shù)劃為屬于正?;虍惓5母怕?,若預(yù)測(cè)為正常日志序列,則偽標(biāo)簽如式(3)所示。

    2.3 異常檢測(cè)

    在日志異常檢測(cè)階段中,使用了殘差塊的雙向時(shí)間卷積網(wǎng)絡(luò)從兩個(gè)方向捕獲上下文信息,從而提高捕獲日志數(shù)據(jù)的特征性能。首先通過(guò)日志序列S={e1,e2,…,en}得到日志序列語(yǔ)義向量表示為V={v1,v2,…,vn},其中n為該日志序列長(zhǎng)度,et(1≤t≤n)是第t個(gè)日志事件,將其中每個(gè)日志事件et都對(duì)應(yīng)地表示為語(yǔ)義向量vt,從而將其放入到Bi-TCN中。

    Bi-TCN是由TCN擴(kuò)展而來(lái)的。TCN是一種基于CNN的新型神經(jīng)網(wǎng)絡(luò)模型,旨在處理時(shí)間序列預(yù)測(cè)任務(wù),其遵循一維全卷積網(wǎng)絡(luò)的架構(gòu),具有相同的輸入和輸出長(zhǎng)度。與普通卷積不同的是,TCN使用因果卷積來(lái)確保只捕獲過(guò)去的信息,利用膨脹卷積在卷積核中增加空洞來(lái)增加感受野,因此具有更靈活的感受野,有利于捕捉序列數(shù)據(jù)的短期和長(zhǎng)期時(shí)間依賴性。與RNN相比,其易于并行化處理,解決了建模遠(yuǎn)程關(guān)系時(shí)的梯度爆炸和消失問(wèn)題,在內(nèi)存消耗和處理速度方面具有顯著優(yōu)勢(shì)。

    然而原始的TCN只關(guān)注當(dāng)前日志序列的局部特征與其上文信息之間的相關(guān)性,完全忽略了日志序列與其下文信息之間的相關(guān)性。因此,將TCN擴(kuò)展為雙向網(wǎng)絡(luò)即Bi-TCN,它可以從日志序列上下文的信息中捕獲每個(gè)日志的長(zhǎng)期上下文依賴關(guān)系,從而有效地增強(qiáng)上下文表示。在TCN中,因果卷積操作保證只有當(dāng)前時(shí)間戳之前的輸入數(shù)據(jù)被用來(lái)進(jìn)行學(xué)習(xí),因此將因果卷積改為一維卷積以實(shí)現(xiàn)雙向的信息學(xué)習(xí)。

    將V輸入Bi-TCN,進(jìn)一步提取長(zhǎng)日志上下文的相關(guān)性。給定序列V={v1,v2,…,vn},Bi-TCN輸出一個(gè)相同長(zhǎng)度的輸出結(jié)果Y={y1,y2,…,yn}。其中,每個(gè)yt(1≤t≤n)不僅依賴于該時(shí)刻之前的輸入值,而且與未來(lái)的輸入值有關(guān),從而提取了日志序列的上下文相關(guān)性。Bi-TCN殘差塊如圖4(a)所示,一個(gè)殘差塊包含兩層膨脹卷積,以使模型可以獲得更大的感受野,在每層之后加入了WeightNorm層,并使用dropout層來(lái)防止模型過(guò)擬合。通過(guò)殘差塊可以實(shí)現(xiàn)跨層連接的恒等映射,解決了深層網(wǎng)絡(luò)的訓(xùn)練問(wèn)題可以大大增加網(wǎng)絡(luò)的層數(shù)。卷積過(guò)程如圖4(b)所示,Bi-TCN使用一維全卷積,并在每層加入0-padding實(shí)現(xiàn)輸入和輸出長(zhǎng)度相等,填充公式如式(4)所示,膨脹卷積計(jì)算公式如式(5)所示。

    其中:d表示膨脹率,以2的指數(shù)增長(zhǎng)(d=1,2,…,2n);k表示卷積核的大?。籪表示濾波器;t-d·i表示過(guò)去的時(shí)間方向;t+d·i表示未來(lái)的時(shí)間方向。

    提取特征后,使用全局平均池化代替全連接層來(lái)平均最后一個(gè)卷積層的輸出特征,進(jìn)一步減少全連接層中的參數(shù),從而實(shí)現(xiàn)緊湊和高效的特征表示。最后,經(jīng)過(guò)全連接層和softmax分類器判定異常。

    算法1 BTCNLog算法

    3 實(shí)驗(yàn)及分析

    3.1 數(shù)據(jù)集

    日志解析實(shí)驗(yàn)部分采用了Loghub[32]提供的真實(shí)世界日志數(shù)據(jù)集,其中包含從分布式系統(tǒng)、超級(jí)計(jì)算機(jī)、操作系統(tǒng)、移動(dòng)系統(tǒng)、服務(wù)應(yīng)用程序收集的16個(gè)數(shù)據(jù)集,每個(gè)數(shù)據(jù)集包含2 000個(gè)日志條目。

    日志異常檢測(cè)實(shí)驗(yàn)部分選擇了三個(gè)公共日志數(shù)據(jù)集(BGL、Thunderbird和Spirit)用于驗(yàn)證實(shí)驗(yàn)的有效性。BGL是從BlueGene/L超級(jí)計(jì)算機(jī)收集的日志數(shù)據(jù)集,部署在勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室,時(shí)間跨度251 d,包含4 747 963條日志記錄,其中348 460條是異常的。Thunderbird和Spirit都是在美國(guó)新墨西哥州阿爾伯克基的桑迪亞國(guó)家實(shí)驗(yàn)室的兩臺(tái)真實(shí)世界的超級(jí)計(jì)算機(jī)系統(tǒng)收集的大型日志數(shù)據(jù)集。選取Thunderbird原始數(shù)據(jù)集中前5 000 000條連續(xù)日志數(shù)據(jù)和Spirit數(shù)據(jù)集的1 GB日志數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。這三個(gè)數(shù)據(jù)集中的每條日志消息都被手動(dòng)標(biāo)記為異?;蛘?。

    3.2 評(píng)估指標(biāo)

    大部分日志異常檢測(cè)的研究只使用精確率(precision)、召回率(recall)和F1值作為評(píng)估指標(biāo)。由于日志數(shù)據(jù)集正負(fù)樣例不均衡的特性,使用特異性(specificity)即被正確識(shí)別為正常的日志序列在所有真實(shí)正常序列中的百分比,可以衡量誤報(bào)的概率,更全面地評(píng)估日志異常檢測(cè)模型。日志解析實(shí)驗(yàn)的度量標(biāo)準(zhǔn)是解析準(zhǔn)確率(parsing accuracy),正確解析的日志事件與日志事件總數(shù)之比,其中日志模板的部分匹配情況也被認(rèn)定為不正確。

    TP表示模型正確檢測(cè)出的異常日志序列數(shù)量;FP表示被模型錯(cuò)誤識(shí)別為異常的正常日志序列的數(shù)量;FN表示被模型判別為正常的異常日志序列數(shù)量,即未被檢測(cè)到的異常日志序列的數(shù)量;TN表示模型正確識(shí)別的正常日志序列數(shù)量。

    3.3 基準(zhǔn)模型

    日志解析實(shí)驗(yàn)部分將改進(jìn)的日志解析方法與使用頻率最高的兩個(gè)日志解析方法Spell和Drain以及SwissLog日志解析方法進(jìn)行比較。同時(shí),日志異常檢測(cè)實(shí)驗(yàn)部分將BTCNLog與七個(gè)基準(zhǔn)方法作比較,其中包括兩個(gè)基于數(shù)據(jù)挖掘的日志異常檢測(cè)方法,以及五種基于深度學(xué)習(xí)的日志異常檢測(cè)方法,詳情如表1所示。

    a)主成分分析(PCA)[33]。將日志序列矢量化為事件計(jì)數(shù)向量,利用PCA構(gòu)建對(duì)事件計(jì)數(shù)向量的正常空間和異??臻g,若測(cè)試用例遠(yuǎn)離正??臻g則為異常日志。

    b)不變量挖掘(invariant mining,IM)[34]。從日志計(jì)數(shù)向量中挖掘日志事件之間的不變量,不滿足這些不變量的日志序列被視為異常。

    c)DeepLog。將系統(tǒng)日志表示為日志模板的索引,通過(guò)LSTM網(wǎng)絡(luò)學(xué)習(xí)正常日志序列并預(yù)測(cè)下一個(gè)日志事件來(lái)判定異常。

    d)LogAnomaly。在template2vec的支持下提取隱藏在日志模板中的語(yǔ)義信息,使用LSTM網(wǎng)絡(luò)從正常日志序列中提取順序和定量特征并通過(guò)預(yù)測(cè)判定異常。

    e)LogBERT[35]。使用BERT來(lái)捕獲整個(gè)日志序列的信息,并通過(guò)屏蔽日志鍵預(yù)測(cè)和超球體最小化體積兩個(gè)新的自監(jiān)督訓(xùn)練任務(wù)學(xué)習(xí)正常日志序列。訓(xùn)練后,利用模型預(yù)測(cè)結(jié)果推導(dǎo)出日志序列的異常分?jǐn)?shù)用于區(qū)分出異常日志。

    f)PLELog。通過(guò)概率標(biāo)簽估計(jì)結(jié)合歷史異常日志信息,并使用word2vec語(yǔ)義嵌入處理不穩(wěn)定的數(shù)據(jù),最后使用基于注意力的GRU進(jìn)行異常檢測(cè)。

    g)LogEncoder[36]。一種半監(jiān)督異常檢測(cè)的日志序列編碼框架,利用預(yù)先訓(xùn)練的模型來(lái)獲得每個(gè)日志事件的模型,并將單類和對(duì)比目標(biāo)學(xué)習(xí)方法結(jié)合,使用基于注意力的模型來(lái)捕獲日志事件的信息。

    3.4 實(shí)驗(yàn)壞境和配置

    在配備Intel CoreTM i5-10400F 2.90 GHz CPU、128 GB內(nèi)存、具有6 GB GPU內(nèi)存的GTX1660Ti和Windows操作系統(tǒng)的服務(wù)器上,使用了Python 3.8.3、PyTorch 1.5.1等進(jìn)行日志解析、日志異常檢測(cè)和消融實(shí)驗(yàn)。

    本文設(shè)置日志序列窗口大小w為60,根據(jù)訓(xùn)練環(huán)境設(shè)置模型訓(xùn)練epochs為5,batch_size為100,測(cè)試batch_size為1 024。根據(jù)先驗(yàn)知識(shí),F(xiàn)astICA組件數(shù)量設(shè)置為100,HDBSCAN中參數(shù)min_cluster_size設(shè)置為100,min_samples為100。根據(jù)調(diào)參結(jié)果,使用4層Bi-TCN模型,每層的卷積核大小k為3,dropout設(shè)置為0.2。使用Adam優(yōu)化器和LambdaLR學(xué)習(xí)率調(diào)整方法,初始學(xué)習(xí)率設(shè)置為2E-3。根據(jù)以下比例拆分所有數(shù)據(jù)集:60%的數(shù)據(jù)用于訓(xùn)練,10%用于驗(yàn)證,30%用于測(cè)試。

    3.5 結(jié)果和分析

    3.5.1 日志解析實(shí)驗(yàn)

    日志解析部分使用與SwissLog方法所提供的相同字典進(jìn)行實(shí)驗(yàn),除此之外,為了與解析結(jié)果相匹配,在預(yù)處理時(shí)將正則表達(dá)式替換的參數(shù)部分改為統(tǒng)一標(biāo)記。表2顯示了BTCNLog模型日志檢測(cè)部分與其余三個(gè)基準(zhǔn)方法在16個(gè)日志數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果以及平均準(zhǔn)確率,其中加粗字體顯示每個(gè)數(shù)據(jù)集最優(yōu)結(jié)果。實(shí)驗(yàn)結(jié)果表明,在每個(gè)數(shù)據(jù)集上,BTCNLog模型都能取得優(yōu)于Spell和Drain方法的結(jié)果,因?yàn)榛谧值涞慕馕龇椒ú粫?huì)將日志關(guān)鍵字過(guò)度解析為日志參數(shù)。較SwissLog而言,結(jié)合日志單詞特點(diǎn)的改進(jìn)使得日志解析準(zhǔn)確率在Hadoop、Thunderbird、Mac、Linux、Android五個(gè)數(shù)據(jù)集上都提高了。值得一提的是,在SwissLog論文中提到Mac日志數(shù)據(jù)集上解析的效果較差,在經(jīng)過(guò)改進(jìn)后,Mac日志數(shù)據(jù)集中含有語(yǔ)義信息的合成詞被保留,準(zhǔn)確率提高了4.45%。

    3.5.2 日志異常檢測(cè)實(shí)驗(yàn)

    圖5(a)(b)分別顯示了BTCNLog與七個(gè)基準(zhǔn)在BGL和Thunderbird日志數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)結(jié)果。由于很多基準(zhǔn)實(shí)驗(yàn)未在Spirit日志數(shù)據(jù)集上進(jìn)行,并且使用Drain解析Spirit數(shù)據(jù)集準(zhǔn)確率低,所以只在消融實(shí)驗(yàn)中對(duì)該日志實(shí)驗(yàn)結(jié)果進(jìn)行分析。

    實(shí)驗(yàn)結(jié)果表明,基于數(shù)據(jù)挖掘的方法IM和PCA表現(xiàn)低于基于深度學(xué)習(xí)的方法,因?yàn)榇祟惙椒▽⑷罩拘蛄斜硎緸槿罩居?jì)數(shù)向量,即每個(gè)維度表示日志事件在日志序列中出現(xiàn)的次數(shù),忽略了日志事件中的語(yǔ)義信息,無(wú)法應(yīng)對(duì)不斷演化的日志語(yǔ)句?;谡H罩具M(jìn)行訓(xùn)練的無(wú)監(jiān)督方法DeepLog和LogAnomaly旨在預(yù)測(cè)日志序列中的下一個(gè)日志事件,所以它們只能預(yù)測(cè)其訓(xùn)練集中出現(xiàn)的日志事件,很容易將看不見(jiàn)的日志事件視為異常,降低了異常檢測(cè)的準(zhǔn)確率。此外,DeepLog基于日志模板索引進(jìn)行異常檢測(cè),忽略了模板語(yǔ)義信息,效果不如LogAnomaly。至于方法LogBERT,雖在BGL數(shù)據(jù)集上表現(xiàn)一般,但其使用BERT可以有效捕獲整個(gè)日志序列的信息,因此其有效性優(yōu)于Deeplog和LogAnomaly。PLELog由于其語(yǔ)義嵌入和整合歷史異常知識(shí)的能力,在BGL數(shù)據(jù)集上表現(xiàn)良好,但是在Thunderbird數(shù)據(jù)集上表現(xiàn)較差,與其采用的日志解析方法Drain解析效果不佳有關(guān)。半監(jiān)督模型LogEncoder同樣使用BERT提取模板中的語(yǔ)義信息,結(jié)合注意力機(jī)制和對(duì)比學(xué)習(xí)具有魯棒性,在兩個(gè)數(shù)據(jù)集上都能取得較好的檢測(cè)結(jié)果。而B(niǎo)TCNLog在日志解析方法上進(jìn)行了改進(jìn),結(jié)合BERT更能保留日志事件語(yǔ)義信息,使用Bi-TCN從日志序列上下文提取相關(guān)性,可以更好地捕獲異常,因此在兩個(gè)數(shù)據(jù)集上都取得了較高的F1分?jǐn)?shù),優(yōu)于其他基準(zhǔn)模型。

    為了進(jìn)一步評(píng)估不同日志序列窗口大小對(duì)日志異常檢測(cè)有效性的影響,窗口大小w分別選取60、120、180、240進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖6所示。結(jié)果表明,實(shí)驗(yàn)窗口對(duì)異常檢測(cè)有效性結(jié)果影響不大,各個(gè)評(píng)估指標(biāo)都能達(dá)到較高水平。因此,使用BTCNLog模型可以有效學(xué)習(xí)不同長(zhǎng)度日志序列中的依賴關(guān)系。

    3.5.3 消融實(shí)驗(yàn)

    消融實(shí)驗(yàn)可以驗(yàn)證模型各個(gè)部分的有效性,因此分別在BGL、Thunderbird和Spirit日志數(shù)據(jù)集上進(jìn)行消融實(shí)驗(yàn),驗(yàn)證日志解析、日志語(yǔ)義嵌入和日志異常檢測(cè)模型的有效性。表3顯示了在三個(gè)數(shù)據(jù)集上進(jìn)行三項(xiàng)消融實(shí)驗(yàn)的實(shí)驗(yàn)結(jié)果。

    1)日志解析的消融實(shí)驗(yàn)

    將日志解析部分改為SwissLog原始解析方法,實(shí)驗(yàn)效果如表3的模型Bi-TCN+SwissLog所示,在三個(gè)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果都略有下降。因?yàn)锽TCNLog模型的解析部分結(jié)合了日志單詞的特性,并保留了部分參數(shù)的語(yǔ)義信息,充分利用日志事件的語(yǔ)義信息。在Spirit數(shù)據(jù)集上,實(shí)驗(yàn)效果普遍較差,這與該數(shù)據(jù)集中包含較多專業(yè)領(lǐng)域縮寫、可讀性較差有關(guān)。

    2)異常檢測(cè)模型的消融實(shí)驗(yàn)

    表3的模型TCN+BERT顯示了將日志異常檢測(cè)模型部分改為TCN的實(shí)驗(yàn)結(jié)果,結(jié)果顯示,使用TCN進(jìn)行異常檢測(cè)仍然可以得到很好的效果,但與Bi-TCN相比,實(shí)驗(yàn)效果略微下降。此外,使用具有100層隱藏層的Bi-LSTM替換Bi-TCN,實(shí)驗(yàn)結(jié)果如表3的Bi-LSTM+BERT模型所示,雖召回率可以保持較好水平,但精確率有所下降,從而證實(shí)了Bi-TCN有效學(xué)習(xí)日志序列上下文信息,對(duì)日志異常檢測(cè)有改進(jìn)的效果。

    3)語(yǔ)義向量的消融實(shí)驗(yàn)

    在保持模型其余部分相同的情況下,將日志模板語(yǔ)義嵌入模塊改為GloVe和TF-IDF進(jìn)行實(shí)驗(yàn),其中語(yǔ)義向量維度為300。實(shí)驗(yàn)結(jié)果如表3的Bi-TCN+GloVe模型所示,雖然在召回率上BTCNLog模型結(jié)果略低些,但在精確度、F1分?jǐn)?shù)和特異性上比使用GloVe作為語(yǔ)義嵌入的效果好。這是因?yàn)槭褂肎loVe方法會(huì)有很多OOV(out of vocabulary)問(wèn)題,無(wú)法準(zhǔn)確表示日志序列語(yǔ)義信息。因此結(jié)果證實(shí)了BERT語(yǔ)義嵌入的有效性,可以有效保留日志的語(yǔ)義信息。

    4 結(jié)束語(yǔ)

    本文提出了一種新的基于日志的半監(jiān)督異常檢測(cè)方法BTCNLog。首先通過(guò)改進(jìn)的基于字典的日志解析方法進(jìn)行日志解析,使用BERT對(duì)模板中的語(yǔ)義信息進(jìn)行編碼獲得日志的語(yǔ)義向量;通過(guò)新的日志分組方式進(jìn)行分組;然后通過(guò)聚類進(jìn)行標(biāo)簽估計(jì);最后,基于雙向的時(shí)間卷積網(wǎng)絡(luò)進(jìn)行異常檢測(cè)。該模型能夠提高日志解析準(zhǔn)確性,充分利用日志事件的語(yǔ)義信息,并高效提取日志序列上下文信息,提高了日志異常檢測(cè)的效率和精度。同時(shí),半監(jiān)督學(xué)習(xí)方法減少人工標(biāo)注,可以學(xué)習(xí)到歷史異常日志的信息。

    今后工作的主要目標(biāo)在于在現(xiàn)實(shí)大型軟件系統(tǒng)中部署,測(cè)試其在更多日志數(shù)據(jù)集上的表現(xiàn)。同時(shí),將進(jìn)一步改進(jìn)模型,解決BTCNLog對(duì)于部分可讀性較差的系統(tǒng)日志事件異常檢測(cè)效果不佳的問(wèn)題。

    參考文獻(xiàn):

    [1]賈統(tǒng), 李影, 吳中海. 基于日志數(shù)據(jù)的分布式軟件系統(tǒng)故障診斷綜述[J]. 軟件學(xué)報(bào), 2020,31(7): 1997-2018. (Jia Tong, Li Ying, Wu Zhonghai. Review of fault diagnosis of distributed software system based on log data[J]. Journal of Software, 2020, 31(7): 1997-2018.)

    [2]Zhang Xu, Xu Yong, Lin Qingwei, et al. Robust log-based anomaly detection on unstable log data[C]//Proc of the 27th ACM Joint Mee-ting on European Software Engineering Conference and Symposium on the Foundations of Software Engineering. New York: ACM Press, 2019: 807-817.

    [3]Li Xiaoyun, Chen Pengfei, Jing Linxiao, et al. SwissLog: robust and unified deep learning based log anomaly detection for diverse faults[C]//Proc of the 31st International Symposium on Software Reliability Engineering. Piscataway,NJ: IEEE Press, 2020: 92-103.

    [4]Li Xiaoyun, Chen Pengfei, Jing Linxiao, et al. SwissLog: robust anomaly detection and localization for interleaved unstructured logs[J]. IEEE Trans on Dependable and Secure Computing, 2023, 20(4): 2762-2780.

    [5]Wang Zumin, Tian Jiyu, Fang Hui, et al. LightLog: a lightweight temporal convolutional network for log anomaly detection on the edge[J]. Computer Networks, 2022, 203: 108616.

    [6]Du Min, Li Feifei, Zheng Guineng, et al. DeepLog: anomaly detection and diagnosis from system logs through deep learning[C]//Proc of ACM SIGSAC Conference on Computer and Communications Secu-rity. New York: ACM Press, 2017: 1285-1298.

    [7]Meng Weibin, Liu Ying, Zhu Yichen, et al. LogAnomaly: unsupervised detection of sequential and quantitative anomalies in unstructured logs[C]//Proc of the 28th International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann Publishers, 2019: 4739-4745.

    [8]Bai Shaojie, Kolter J Z, Koltun V. An empirical evaluation of generic convolutional and recurrent networks for sequence modeling[EB/OL]. (2018-04-19). https://arxiv.org/abs/1803.01271.

    [9]Zhang Shenglin, Meng Weibin, Bu Jiahao, et al. Syslog processing for switch failure diagnosis and prediction in datacenter networks[C]//Proc of the 25th International Symposium on Quality of Ser-vice. Piscataway,NJ: IEEE Press, 2017: 1-10.

    [10]Du Min, Li Feifei. Spell: online streaming parsing of large unstructured system logs[J]. IEEE Trans on Knowledge and Data Engineering, 2018, 31(11): 2213-2227.

    [11]He Pinjia, Zhu Jieming, Zheng Zibin, et al. Drain: an online log parsing approach with fixed depth tree[C]//Proc of the 24th IEEE International Conference on Web Services. Piscataway,NJ: IEEE Press, 2017: 33-40.

    [12]Devlin J, Chang Mingwei, Lee K, et al. BERT: pre-training of deep bidirectional transformers for language understanding[EB/OL]. (2019-05-24). https://arxiv.org/abs/1810.04805.

    [13]Yang Lin, Chen Junjie, Wang Zan, et al. Semi-supervised log-based anomaly detection via probabilistic label estimation[C]//Proc of the 43rd International Conference on Software Engineering. Piscataway,NJ: IEEE Press, 2021: 1448-1460.

    [14]Fu Qiang, Lou Jianguang, Wang Yi, et al. Execution anomaly detection in distributed systems through unstructured log analysis[C]//Proc of the 9th IEEE International Conference on Data Mining, Piscataway,NJ: IEEE Press, 2009: 149-158.

    [15]Hossein H, Debnath B, Xu Jianwu, et al. LogMine: fast pattern re-cognition for log analytics[C]//Proc of the 25th ACM International on Conference on Information and Knowledge Management. New York: ACM Press, 2016: 1573-1582.

    [16]Nagappan M, Vouk M. Abstracting log lines to log event types for mining software system logs[C]//Proc of the 7th IEEE Working Conference on Mining Software Repositories. Piscataway,NJ: IEEE Press, 2010: 114-117.

    [17]Makanju A, Zincir-Heywood A N, Milios E. Clustering event logs using iterative partitioning[C]//Proc of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2009: 1255-1264.

    [18]Meng Weibin, Liu Ying, Zaiter F, et al. Logparse: making log parsing adaptive through word classification[C]//Proc of the 29th International Conference on Computer Communications and Networks. Piscataway,NJ: IEEE Press, 2020: 1-9.

    [19]Dai Hetong, Li Heng, Shang Weiyi, et al. Logram: efficient log parsing using n-gram dictionaries[J]. IEEE Trans on Software Engineering, 2022, 48(3): 879-892.

    [20]Nedelkoski S, Bogatinovski J, Acker A, et al. Self-supervised log parsing[C]//Proc of Joint European Conference on Machine Learning and Knowledge Discovery in Databases. Cham: Springer, 2020: 122-138.

    [21]張穎君, 劉尚奇, 楊牧, 等. 基于日志的異常檢測(cè)技術(shù)綜述[J]. 網(wǎng)絡(luò)與信息安全學(xué)報(bào), 2020,6(6): 1-12. (Zhang Yingjun, Liu Shangqi, Yang Mu, et al. Overview of log based anomaly detection technology[J]. Journal of Network and Information Security, 2020, 6(6): 1-12.)

    [22]Bodík P, Goldszmidt M, Fox A, et al. Fingerprinting the datacenter: automated classification of performance crises[C]//Proc of the 5th European Conference on Computer Systems. New York: ACM Press, 2010: 111-124.

    [23]Liang Yinglung, Zhang Yanyong, Xiong Hui, et al. Failure prediction in IBM BlueGene/L event logs[C]//Proc of the 7th IEEE International Conference on Data Mining Workshops. Piscataway,NJ: IEEE Press, 2007: 583-588.

    [24]Zhu Jieming, He Pinjia, Fu Qiang, et al. Learning to log: helping developers make informed logging decisions[C]//Proc of the 37th IEEE International Conference on Software Engineering. Piscataway,NJ: IEEE Press, 2015: 415-425.

    [25]Soucy P, Mineau G. Beyond TFIDF weighting for text categorization in the vector space model[C]//Proc of International Joint Conference on Artificial Intelligence. San Francisco: Morgan Kaufmann Publishers, 2005: 1130-1135.

    [26]Ling Wang, Dyer C, Black A, et al. Two/too simple adaptations of word2vec for syntax problems[C]//Proc of Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. Stroudsburg, PA: ACL Press, 2015: 1299-1304.

    [27]Nedelkoski S, Bogatinovski J, Acker A, et al. Self-attentive classification-based anomaly detection in unstructured logs[C]//Proc of IEEE International Conference on Data Mining. Piscataway,NJ: IEEE Press, 2020: 1196-1201.

    [28]Wang Zhiwei, Chen Zhengzhang, Ni Jingchao, et al. Multi-scale one-class recurrent neural networks for discrete event sequence ano-maly detection[C]//Proc of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. New York: ACM Press, 2021: 3726-3734.

    [29]Pennington J, Socher R, Christopher D. Manning. GloVe: global vectors for word representation[C]//Proc of Conference on Empirical Methods in Natural Language Processing. Stroudsburg, PA: ACL Press, 2014: 1532-1543.

    [30]McInnes L, Healy J, Astels S. HDBSCAN: hierarchical d+BbziV4l++hmVIQbFW5Dzg==ensity based clustering[J]. Journal of Open Source Software, 2017,2(11): 205.

    [31]Oja E, Yuan Zhijian. The FastICA algorithm revisited: convergence analysis[J]. IEEE Trans on Neural Networks, 2006, 17(6): 1370-1381.

    [32]Zhu Jieming, He Shilin, He Pinjia, et al. Loghub: a large collection of system log datasets for AI-driven log analytics[C]//Proc of the 34th International Symposium on Software Reliability Engineering. Piscataway,NJ: IEEE Press, 2023: 355-366.

    [33]Xu Wei, Huang Ling, Fox A, et al. Detecting large-scale system problems by mining console logs[C]//Proc of the 22nd ACM SIGOPS Symposium on Operating Systems Principles. New York: ACM Press, 2009: 117-132.

    [34]Lou Jianguang, Fu Qiang, Yang Shengqi, et al. Mining invariants from console logs for system problem detection[C]//Proc of USENIX Annual Technical Conference. Berkeley: USENIX Press,2010: 24.

    [35]Guo Haixuan, Yuan Shuhan, Wu Xintao. LogBERT: log anomaly detection via BERT[C]//Proc of International Joint Conference on Neural Networks. Piscataway,NJ: IEEE Press, 2021: 1-8.

    [36]Qi Jiaxing, Luan Zhongzhi, Huang Shaohan, et al. LogEncoder: log-based contrastive representation learning for anomaly detection[J]. IEEE Trans on Network and Service Management, 2023,20(2): 1378-1391.

    亚洲五月天丁香| 天天躁夜夜躁狠狠久久av| 99热网站在线观看| 日韩高清综合在线| 一卡2卡三卡四卡精品乱码亚洲| 美女被艹到高潮喷水动态| 亚洲专区国产一区二区| eeuss影院久久| 噜噜噜噜噜久久久久久91| 午夜精品在线福利| 国产又黄又爽又无遮挡在线| 欧美最新免费一区二区三区| 99久久精品热视频| 午夜福利在线观看吧| 久久草成人影院| 日韩在线高清观看一区二区三区| 久久精品人妻少妇| 国产精品爽爽va在线观看网站| 精品欧美国产一区二区三| 国产在视频线在精品| 大香蕉久久网| 无遮挡黄片免费观看| 舔av片在线| 久99久视频精品免费| 日本一本二区三区精品| 成年女人看的毛片在线观看| 91麻豆精品激情在线观看国产| 久久韩国三级中文字幕| 亚洲不卡免费看| 又黄又爽又免费观看的视频| 成人国产麻豆网| av在线播放精品| 99热这里只有是精品在线观看| 国产激情偷乱视频一区二区| 天天躁夜夜躁狠狠久久av| 哪里可以看免费的av片| 成人性生交大片免费视频hd| 天堂av国产一区二区熟女人妻| 身体一侧抽搐| 国产一区二区激情短视频| 麻豆国产av国片精品| 亚洲在线自拍视频| 亚洲人成网站高清观看| 三级国产精品欧美在线观看| 国产黄a三级三级三级人| 一本一本综合久久| 欧美最黄视频在线播放免费| 欧美一区二区精品小视频在线| 国产精品人妻久久久影院| 久久久久九九精品影院| 天堂网av新在线| 午夜福利在线观看免费完整高清在 | 99久久久亚洲精品蜜臀av| 国产精品国产三级国产av玫瑰| 国产精品久久视频播放| 亚洲国产精品久久男人天堂| 你懂的网址亚洲精品在线观看 | 国产av在哪里看| 亚洲av.av天堂| 一级毛片电影观看 | 欧美3d第一页| 亚洲av电影不卡..在线观看| 国产成人a区在线观看| 欧美高清成人免费视频www| 免费无遮挡裸体视频| 两个人的视频大全免费| 成人三级黄色视频| 日韩三级伦理在线观看| 国产精品精品国产色婷婷| 精品久久久久久久末码| a级毛色黄片| 亚洲图色成人| 国产精品久久久久久久电影| 成年女人永久免费观看视频| 精品人妻熟女av久视频| 亚洲无线观看免费| 在线观看一区二区三区| 日韩欧美精品免费久久| a级一级毛片免费在线观看| 国内少妇人妻偷人精品xxx网站| 亚洲精品粉嫩美女一区| 最新在线观看一区二区三区| 亚洲av五月六月丁香网| 国产一区亚洲一区在线观看| 国产精品美女特级片免费视频播放器| 国产亚洲精品av在线| 亚洲乱码一区二区免费版| 久久综合国产亚洲精品| 精品久久久久久成人av| 日本-黄色视频高清免费观看| 国产一区亚洲一区在线观看| 非洲黑人性xxxx精品又粗又长| 亚洲中文日韩欧美视频| 国产真实伦视频高清在线观看| 亚洲人成网站高清观看| 色哟哟哟哟哟哟| 国国产精品蜜臀av免费| 麻豆av噜噜一区二区三区| 国产免费男女视频| 国产不卡一卡二| 免费人成视频x8x8入口观看| 午夜久久久久精精品| 夜夜看夜夜爽夜夜摸| 国产亚洲91精品色在线| 最近的中文字幕免费完整| 观看免费一级毛片| 99久久九九国产精品国产免费| 精品不卡国产一区二区三区| 蜜臀久久99精品久久宅男| 免费不卡的大黄色大毛片视频在线观看 | 亚洲精品色激情综合| 精品乱码久久久久久99久播| 国产国拍精品亚洲av在线观看| 亚洲av成人av| 日韩强制内射视频| 亚洲四区av| 亚洲国产精品国产精品| 日本熟妇午夜| 久久人人精品亚洲av| 国产精品精品国产色婷婷| 晚上一个人看的免费电影| 婷婷亚洲欧美| 免费高清视频大片| 非洲黑人性xxxx精品又粗又长| 欧美+日韩+精品| 国产一区二区在线观看日韩| 老司机影院成人| 国产在线男女| 成人国产麻豆网| 国产精华一区二区三区| 99热精品在线国产| 人人妻,人人澡人人爽秒播| 日本免费a在线| 高清毛片免费看| 国产成人精品久久久久久| 国产成人福利小说| 如何舔出高潮| 亚洲中文字幕一区二区三区有码在线看| 亚洲内射少妇av| 99热这里只有是精品在线观看| 欧美激情久久久久久爽电影| 亚洲精品色激情综合| 在线免费观看不下载黄p国产| 成人永久免费在线观看视频| 午夜a级毛片| 午夜免费激情av| 淫妇啪啪啪对白视频| 嫩草影视91久久| 国产高清有码在线观看视频| 人妻丰满熟妇av一区二区三区| 波多野结衣高清无吗| 日本免费a在线| 久久久久精品国产欧美久久久| 99久久久亚洲精品蜜臀av| 俄罗斯特黄特色一大片| 老师上课跳d突然被开到最大视频| 国产精品一区二区性色av| 舔av片在线| 91精品国产九色| 国产亚洲精品久久久久久毛片| 亚洲内射少妇av| 国产单亲对白刺激| 亚洲欧美精品自产自拍| 综合色av麻豆| 日韩欧美国产在线观看| av中文乱码字幕在线| 少妇猛男粗大的猛烈进出视频 | 成人av一区二区三区在线看| 一夜夜www| 欧美国产日韩亚洲一区| 97碰自拍视频| videossex国产| 99久久精品一区二区三区| 亚洲成人精品中文字幕电影| 久久午夜亚洲精品久久| 又黄又爽又免费观看的视频| 国产成年人精品一区二区| 在线看三级毛片| 国产毛片a区久久久久| 日韩三级伦理在线观看| 国产91av在线免费观看| 国产三级中文精品| 男插女下体视频免费在线播放| 亚洲中文日韩欧美视频| 99久久精品热视频| 干丝袜人妻中文字幕| 在线观看免费视频日本深夜| 久久精品综合一区二区三区| 特大巨黑吊av在线直播| av.在线天堂| 亚洲最大成人av| 亚洲精品乱码久久久v下载方式| 三级国产精品欧美在线观看| 男女视频在线观看网站免费| 久久久久久久久中文| 男人舔女人下体高潮全视频| 亚洲国产色片| 三级男女做爰猛烈吃奶摸视频| 99在线人妻在线中文字幕| 干丝袜人妻中文字幕| 夜夜看夜夜爽夜夜摸| 淫秽高清视频在线观看| 久久人妻av系列| 国产男靠女视频免费网站| 亚洲高清免费不卡视频| 国产伦一二天堂av在线观看| 99在线人妻在线中文字幕| 亚洲精品456在线播放app| 不卡一级毛片| 男女视频在线观看网站免费| 成人精品一区二区免费| 丰满人妻一区二区三区视频av| aaaaa片日本免费| av福利片在线观看| 日本爱情动作片www.在线观看 | 黄色视频,在线免费观看| 欧美高清性xxxxhd video| 老熟妇仑乱视频hdxx| 女人十人毛片免费观看3o分钟| 久久久久久久亚洲中文字幕| 在线观看一区二区三区| 日本黄色片子视频| 国产精品综合久久久久久久免费| 日日干狠狠操夜夜爽| 亚洲丝袜综合中文字幕| 菩萨蛮人人尽说江南好唐韦庄 | 少妇的逼好多水| 亚洲欧美精品综合久久99| av.在线天堂| 69人妻影院| 美女被艹到高潮喷水动态| 亚洲美女视频黄频| 中文字幕人妻熟人妻熟丝袜美| 免费在线观看影片大全网站| 欧美xxxx黑人xx丫x性爽| 91在线观看av| 国产成人福利小说| 久久精品国产亚洲av天美| 男人舔奶头视频| 国模一区二区三区四区视频| 内射极品少妇av片p| 五月玫瑰六月丁香| 色尼玛亚洲综合影院| 99国产极品粉嫩在线观看| 男人的好看免费观看在线视频| 欧美激情国产日韩精品一区| 男女边吃奶边做爰视频| 亚洲人成网站高清观看| 国产精品久久久久久精品电影| 一级黄片播放器| 在线天堂最新版资源| 搡老妇女老女人老熟妇| 国产亚洲精品综合一区在线观看| 九色成人免费人妻av| 直男gayav资源| 亚洲真实伦在线观看| 亚洲av免费高清在线观看| 99久久九九国产精品国产免费| 日韩强制内射视频| 国产av麻豆久久久久久久| 一进一出好大好爽视频| 一卡2卡三卡四卡精品乱码亚洲| 亚洲精品日韩在线中文字幕 | 久久久久久久亚洲中文字幕| 国产成人91sexporn| 久久久国产成人精品二区| 老熟妇仑乱视频hdxx| 久久久久国内视频| 伊人久久精品亚洲午夜| 欧美性感艳星| 啦啦啦韩国在线观看视频| 色综合亚洲欧美另类图片| 男人狂女人下面高潮的视频| 欧美又色又爽又黄视频| 日韩亚洲欧美综合| 日本成人三级电影网站| 嫩草影院新地址| 波多野结衣巨乳人妻| 丰满人妻一区二区三区视频av| 色av中文字幕| 美女大奶头视频| 国产成人aa在线观看| 熟女电影av网| 成人无遮挡网站| 特级一级黄色大片| 亚洲精品国产成人久久av| 天堂网av新在线| 99久久精品热视频| 成年av动漫网址| 国产精品福利在线免费观看| 国产黄色视频一区二区在线观看 | 老熟妇乱子伦视频在线观看| 91在线精品国自产拍蜜月| 看片在线看免费视频| 亚州av有码| 亚洲不卡免费看| 91av网一区二区| 中文字幕精品亚洲无线码一区| 日本黄色视频三级网站网址| 最后的刺客免费高清国语| 免费看光身美女| 国产精品爽爽va在线观看网站| 啦啦啦观看免费观看视频高清| 色综合亚洲欧美另类图片| 女的被弄到高潮叫床怎么办| 深夜a级毛片| 最近的中文字幕免费完整| 国产免费一级a男人的天堂| 99riav亚洲国产免费| 久久久久国产精品人妻aⅴ院| 成人漫画全彩无遮挡| 国产av麻豆久久久久久久| 国产一区亚洲一区在线观看| 久久久久久久亚洲中文字幕| 99热只有精品国产| 一本精品99久久精品77| 久久99热这里只有精品18| 国产单亲对白刺激| 一级a爱片免费观看的视频| 欧美色欧美亚洲另类二区| 国产成人精品久久久久久| 午夜老司机福利剧场| 老熟妇乱子伦视频在线观看| 国产成人a∨麻豆精品| 亚洲最大成人中文| 岛国在线免费视频观看| 久久久久国产精品人妻aⅴ院| 一级毛片久久久久久久久女| 国产精品99久久久久久久久| 18禁在线播放成人免费| 久久亚洲国产成人精品v| 亚洲国产欧美人成| 在线国产一区二区在线| 中国国产av一级| 99久久精品一区二区三区| 十八禁网站免费在线| 国产在视频线在精品| 亚洲美女视频黄频| 又爽又黄a免费视频| 男女做爰动态图高潮gif福利片| 老司机福利观看| 亚洲精品日韩av片在线观看| 欧美成人免费av一区二区三区| 深夜a级毛片| 国产69精品久久久久777片| 日韩精品青青久久久久久| 成人性生交大片免费视频hd| 大型黄色视频在线免费观看| 精品无人区乱码1区二区| 中文字幕av成人在线电影| 国产人妻一区二区三区在| 我的老师免费观看完整版| 国产成人影院久久av| 大香蕉久久网| 午夜福利在线观看吧| 人人妻人人澡人人爽人人夜夜 | 国产探花极品一区二区| 日本a在线网址| 国产伦一二天堂av在线观看| 91在线精品国自产拍蜜月| 天天一区二区日本电影三级| 免费人成视频x8x8入口观看| 三级男女做爰猛烈吃奶摸视频| 亚洲高清免费不卡视频| 国产熟女欧美一区二区| 男人和女人高潮做爰伦理| 永久网站在线| 成人av在线播放网站| 亚洲成人久久性| 国内精品宾馆在线| 人妻夜夜爽99麻豆av| 99久国产av精品国产电影| 国产一级毛片七仙女欲春2| 久久午夜亚洲精品久久| 日本免费一区二区三区高清不卡| 乱系列少妇在线播放| 久久久久久九九精品二区国产| 国产真实乱freesex| 一进一出抽搐gif免费好疼| 男人和女人高潮做爰伦理| 人妻夜夜爽99麻豆av| 亚洲国产精品成人久久小说 | 一级毛片电影观看 | 最新在线观看一区二区三区| 欧美日韩精品成人综合77777| 国产精品久久久久久久久免| 国产高清激情床上av| 亚洲人成网站在线播| 精华霜和精华液先用哪个| 精品午夜福利视频在线观看一区| 久久精品久久久久久噜噜老黄 | 成人二区视频| 久久人人精品亚洲av| 久久草成人影院| 在线观看一区二区三区| 乱码一卡2卡4卡精品| 深夜精品福利| 美女被艹到高潮喷水动态| 一级毛片电影观看 | 免费高清视频大片| 午夜精品国产一区二区电影 | 久久精品久久久久久噜噜老黄 | 中出人妻视频一区二区| 国产精品精品国产色婷婷| av在线亚洲专区| 搡老妇女老女人老熟妇| 亚洲精品一卡2卡三卡4卡5卡| 美女内射精品一级片tv| 欧美日韩一区二区视频在线观看视频在线 | 在线免费观看的www视频| 麻豆乱淫一区二区| 午夜福利在线观看免费完整高清在 | 国产精品无大码| 毛片女人毛片| 三级经典国产精品| 欧美性猛交╳xxx乱大交人| 成人综合一区亚洲| 亚洲综合色惰| 久久草成人影院| 波多野结衣高清无吗| 日本欧美国产在线视频| 白带黄色成豆腐渣| 美女xxoo啪啪120秒动态图| 淫妇啪啪啪对白视频| 色综合亚洲欧美另类图片| 国产精品久久久久久久久免| 欧美+亚洲+日韩+国产| 1024手机看黄色片| 成人特级黄色片久久久久久久| 日日摸夜夜添夜夜爱| 日韩成人伦理影院| 国产精品精品国产色婷婷| 免费看光身美女| 亚洲精品影视一区二区三区av| 在线天堂最新版资源| av女优亚洲男人天堂| 亚洲激情五月婷婷啪啪| 成年女人毛片免费观看观看9| 久久精品国产自在天天线| 亚洲国产精品久久男人天堂| 国产精品一区二区三区四区久久| 亚洲av中文字字幕乱码综合| av天堂在线播放| 插阴视频在线观看视频| 国产视频一区二区在线看| 国产精品嫩草影院av在线观看| 看十八女毛片水多多多| 99国产精品一区二区蜜桃av| 一个人看的www免费观看视频| 俺也久久电影网| ponron亚洲| 亚洲成a人片在线一区二区| 看非洲黑人一级黄片| 亚洲国产精品国产精品| 床上黄色一级片| 久久久久免费精品人妻一区二区| 天天躁日日操中文字幕| 亚洲中文字幕一区二区三区有码在线看| 最近2019中文字幕mv第一页| 精品人妻视频免费看| 亚洲美女搞黄在线观看 | 亚洲欧美成人精品一区二区| 99国产精品一区二区蜜桃av| 亚洲中文字幕一区二区三区有码在线看| 亚洲人与动物交配视频| 久久精品国产自在天天线| 真实男女啪啪啪动态图| 九九热线精品视视频播放| 精品少妇黑人巨大在线播放 | 嫩草影院新地址| 精品不卡国产一区二区三区| 欧美xxxx性猛交bbbb| 日韩欧美精品v在线| 亚洲国产精品国产精品| 97在线视频观看| 日本熟妇午夜| 国产亚洲精品久久久com| 波多野结衣高清无吗| 在线看三级毛片| 日韩一本色道免费dvd| 日韩欧美精品免费久久| 国产视频内射| 亚洲av中文av极速乱| 久久精品国产亚洲网站| 亚洲精品一区av在线观看| 午夜老司机福利剧场| 亚洲专区国产一区二区| 春色校园在线视频观看| 国产老妇女一区| 国产成人影院久久av| 国产一级毛片七仙女欲春2| 国产片特级美女逼逼视频| 永久网站在线| 日韩亚洲欧美综合| 22中文网久久字幕| 国产人妻一区二区三区在| 国产女主播在线喷水免费视频网站 | 99热只有精品国产| 国产色爽女视频免费观看| 99久久中文字幕三级久久日本| 欧美国产日韩亚洲一区| 搡女人真爽免费视频火全软件 | .国产精品久久| av卡一久久| 欧美最新免费一区二区三区| 一个人观看的视频www高清免费观看| 日本熟妇午夜| 嫩草影院新地址| 成人永久免费在线观看视频| 黄色视频,在线免费观看| 亚洲精华国产精华液的使用体验 | 乱人视频在线观看| 97超碰精品成人国产| or卡值多少钱| 美女被艹到高潮喷水动态| 久久精品影院6| 联通29元200g的流量卡| 国产一区二区在线av高清观看| 啦啦啦观看免费观看视频高清| 国产一区亚洲一区在线观看| 亚洲欧美日韩高清在线视频| 国产成年人精品一区二区| 亚洲人成网站高清观看| 黑人高潮一二区| 精品一区二区三区av网在线观看| 国产精品国产三级国产av玫瑰| 久久人妻av系列| 国产成年人精品一区二区| 男女那种视频在线观看| 草草在线视频免费看| 内地一区二区视频在线| 久久精品久久久久久噜噜老黄 | 淫秽高清视频在线观看| 午夜日韩欧美国产| 亚洲精品国产成人久久av| 18+在线观看网站| 国产精品精品国产色婷婷| 欧美+日韩+精品| 国产高清有码在线观看视频| 久久久久国产精品人妻aⅴ院| 色播亚洲综合网| 三级经典国产精品| 亚洲精品影视一区二区三区av| av天堂中文字幕网| 天天躁日日操中文字幕| 国产老妇女一区| 亚洲四区av| 国产精品综合久久久久久久免费| 亚洲人与动物交配视频| 久久久午夜欧美精品| 97超级碰碰碰精品色视频在线观看| 此物有八面人人有两片| 午夜激情福利司机影院| 午夜影院日韩av| 亚洲欧美精品综合久久99| 久久精品夜夜夜夜夜久久蜜豆| 内地一区二区视频在线| 久久精品国产亚洲av香蕉五月| 日本三级黄在线观看| 日日撸夜夜添| 久久久久久久亚洲中文字幕| 精品午夜福利在线看| 精品久久久噜噜| 国产一区二区在线av高清观看| 天堂av国产一区二区熟女人妻| av在线天堂中文字幕| 日韩成人伦理影院| 天美传媒精品一区二区| 大香蕉久久网| 性插视频无遮挡在线免费观看| 欧美日韩综合久久久久久| 午夜精品在线福利| 天天躁夜夜躁狠狠久久av| 成年免费大片在线观看| 久久久午夜欧美精品| 99热6这里只有精品| 2021天堂中文幕一二区在线观| 欧美成人精品欧美一级黄| 热99在线观看视频| 国产精品永久免费网站| 亚洲熟妇中文字幕五十中出| 久久精品综合一区二区三区| 91狼人影院| 久久韩国三级中文字幕| 欧美日韩一区二区视频在线观看视频在线 | 亚洲美女搞黄在线观看 | 亚洲不卡免费看| 亚洲av美国av| 亚洲中文日韩欧美视频| 一夜夜www| 亚洲专区国产一区二区| 久久午夜亚洲精品久久| 欧美+亚洲+日韩+国产| 男人狂女人下面高潮的视频| 久久精品国产亚洲av香蕉五月| 亚洲av成人精品一区久久| 成年女人永久免费观看视频| 国产免费男女视频| 亚洲精品影视一区二区三区av| 九九在线视频观看精品| 熟女人妻精品中文字幕| 2021天堂中文幕一二区在线观| 色av中文字幕| 亚洲精品色激情综合| 18+在线观看网站| av视频在线观看入口| 国产高清不卡午夜福利| 国产淫片久久久久久久久| 人人妻,人人澡人人爽秒播| 精品午夜福利视频在线观看一区| 久久精品国产清高在天天线| 国产综合懂色| 露出奶头的视频| 国产毛片a区久久久久| 简卡轻食公司|