摘" 要: 計算機網(wǎng)絡鏈路的漏洞信息具有類型復雜、來源廣及數(shù)量龐大等特點,導致此類漏洞的威脅判斷尤為困難。知識圖譜技術具有數(shù)據(jù)整合及統(tǒng)一表示特性,可以統(tǒng)一結構化整合呈現(xiàn)復雜特點的漏洞信息,為此,文中提出基于知識圖譜技術的計算機網(wǎng)絡鏈路漏洞檢測方法。收集計算機網(wǎng)絡鏈路的各種數(shù)據(jù)源漏洞信息,抽取其中的漏洞實體知識與關系知識,構建網(wǎng)絡鏈路漏洞知識圖譜。運用卷積神經(jīng)網(wǎng)絡模型學習該知識圖譜中的漏洞知識,通過訓練后的模型實現(xiàn)網(wǎng)絡鏈路漏洞檢測。結果顯示,該方法可針對包含不同類型、數(shù)量鏈路漏洞的工況,實現(xiàn)漏洞知識圖譜的構建,并且漏洞威脅檢測精度始終保持在90%以上。因此,說明所研究檢測方法的檢測結果精準可靠,可為計算機網(wǎng)絡鏈路數(shù)據(jù)安全傳輸提供保障。
關鍵詞: 知識圖譜; 計算機網(wǎng)絡; 鏈路漏洞; 漏洞實體知識; 關系知識; 知識抽??; 網(wǎng)絡安全
中圖分類號: TN711?34; TP311" " " " " " " " " " " 文獻標識碼: A" " " " " " " " " "文章編號: 1004?373X(2025)01?0097?05
Research on computer network link vulnerability detection"based on knowledge graph technology
XIN Ruiwen1, GAO Yun2
(1. Shanxi University, Taiyuan 030006, China;
2. School of Computer and Network Engineering, Shanxi Datong University, Datong 037009, China)
Abstract: The vulnerability information of computer network links has the characteristics of complex types, broad sources and large quantities, which makes it particularly difficult to determine the threat of such vulnerabilities. Knowledge graph technology has the characteristics of data integration and unified representation, so it can unify and structurally integrate complex vulnerability information. Therefore, a computer network link vulnerability detection method based on knowledge graph technology is proposed. Various data source vulnerability information of computer network links is collected, vulnerability entity knowledge and relationship knowledge are extracted, and a network link vulnerability knowledge graph is constructed. A convolutional neural network (CNN) model is used to learn the vulnerability knowledge in the constructed knowledge graph, and the network link vulnerability detection is implemented by the trained model. The results show that the method can be used to construct a vulnerability knowledge graph for working conditions containing different types and quantities of link vulnerabilities. In addition, the accuracy of vulnerability threat detection always remains above 90%. It indicates that the detection results of the detection method studied are accurate and reliable, so the method studied can provide guarantees for the secure transmission of data in computer network links.
Keywords: knowledge graph; computer network; link vulnerability; vulnerability entity knowledge; relationship knowledge; knowledge extraction; network security
0" 引" 言
計算機網(wǎng)絡作為現(xiàn)代社會不可或缺的基礎設施,支撐著從個人通信到全球商業(yè)交易等廣泛領域的運作[1]。然而,計算機網(wǎng)絡環(huán)境的日益復雜化和互聯(lián)性的增強,也為黑客攻擊和網(wǎng)絡犯罪提供了可乘之機。網(wǎng)絡鏈路作為數(shù)據(jù)傳輸?shù)臉蛄?,其安全性直接關系到整個網(wǎng)絡系統(tǒng)的穩(wěn)定性和數(shù)據(jù)的安全性[2]。近年來,計算機網(wǎng)絡攻擊手段不斷翻新,從傳統(tǒng)的病毒、木馬到高級持續(xù)性威脅、勒索軟件等,這些攻擊往往利用網(wǎng)絡鏈路中的薄弱環(huán)節(jié)實施滲透和擴散[3?4]。因此,為及時發(fā)現(xiàn)并修復計算機網(wǎng)絡鏈路中的各種漏洞,有效防范潛在的網(wǎng)絡威脅,保障網(wǎng)絡信息安全,需研究一種科學、高效的計算機網(wǎng)絡鏈路漏洞檢測方法,以應對日益嚴峻的網(wǎng)絡安全挑戰(zhàn)[5]。
目前,已有部分國內(nèi)外學者針對此領域展開了相關研究。例如,文獻[6]研究一種復雜路徑下漏洞檢測技術,經(jīng)靜態(tài)分析采集程序漏洞數(shù)可能導致漏洞風險的路徑實施符號執(zhí)行,獲得可引發(fā)程序漏洞的測試用例。但靜態(tài)分析采集的程序漏洞數(shù)據(jù)有限,當所需檢測的漏洞涉及多個主體時,該方法無法實現(xiàn)大量多源數(shù)據(jù)的有效收集,導致檢測結果受限。文獻[7]研究的基于膠囊網(wǎng)絡和注意力機制的合約漏洞檢測方法,抽取智能合約核心操作指令序列為特征,采用結合膠囊網(wǎng)絡與注意力機制的混合模型訓練。膠囊網(wǎng)絡解析上下文及關聯(lián),注意力機制分配權重。但該方法僅關注核心指令,忽略了非核心部分的信息,容易導致漏洞檢測效果下降。文獻[8]研究的切片級漏洞檢測方法,通過代碼切片分割網(wǎng)絡代碼為數(shù)個重要數(shù)據(jù)切片,輸入到圖神經(jīng)網(wǎng)絡中,得到各個切片的特征,運用此類特征訓練后實現(xiàn)漏洞檢測,該方法依賴高精度訓練數(shù)據(jù)實現(xiàn),當實際切片數(shù)據(jù)包含冗余,會造成最終檢測結果出現(xiàn)偏差。文獻[9]研究的源代碼漏洞檢測方法,通過轉(zhuǎn)化源代碼為代碼屬性圖,構建關系圖卷積網(wǎng)絡(Relational Graph Convolutional Network, RGCN),學習此類屬性圖后,使用學習后的RGCN檢測出源代碼中的漏洞。RGCN的功能實現(xiàn)重點依賴于屬性圖的學習,但在漏洞檢測中,僅依靠屬性圖信息無法全面捕捉漏洞的全部知識,導致部分類別漏洞無法有效檢出。
知識圖譜技術是一種前沿技術,在人工智能和數(shù)據(jù)科學領域發(fā)揮著重要作用[10]。該技術是通過圖形化方式表達知識的語義網(wǎng)絡,通過將現(xiàn)實世界中的實體、概念、關系和事件等元素實施有效的連接和整合,實現(xiàn)了知識的結構化和可視化[11?12]。其主要優(yōu)勢包括數(shù)據(jù)整合與統(tǒng)一表示、實體關系清晰化、推理與預測能力、可視化與交互性、自動化與智能化以及持續(xù)更新與擴展性等,被廣泛應用在風險防控、智能搜索以及知識推理等應用場景內(nèi)。
基于此,本文以知識圖譜技術為基礎,研究計算機網(wǎng)絡鏈路漏洞檢測方法,及時檢出網(wǎng)絡鏈路運行中的各類漏洞,降低網(wǎng)絡鏈路的數(shù)據(jù)傳輸風險,保障計算機網(wǎng)絡的安全運行。
1" 鏈路漏洞檢測
1.1" 知識圖譜構建
由于計算機網(wǎng)絡鏈路漏洞信息具有數(shù)據(jù)量龐大、來源廣、復雜等特點,故需構建計算機網(wǎng)絡鏈路的漏洞知識圖譜,有效整合網(wǎng)絡鏈路各類漏洞的屬性、實體及關系等知識,將網(wǎng)絡鏈路的安全漏洞、相關屬性以關聯(lián)關系呈現(xiàn),為之后的網(wǎng)絡鏈路漏洞檢測提供關鍵的數(shù)據(jù)支撐。計算機網(wǎng)絡鏈路漏洞知識圖譜的構建主要包含網(wǎng)絡鏈路漏洞數(shù)據(jù)獲取、網(wǎng)絡鏈路漏洞知識抽取、網(wǎng)絡鏈路漏洞知識圖譜構成三大部分,其主要過程如下。
1) 網(wǎng)絡鏈路漏洞數(shù)據(jù)獲取。采用文本數(shù)據(jù)挖掘技術,從計算機網(wǎng)絡的流量分析、系統(tǒng)日志、配置文件等多種數(shù)據(jù)源中收集計算機網(wǎng)絡鏈路漏洞信息。收集的有效網(wǎng)絡鏈路漏洞數(shù)據(jù)可表示為:
[X=X-a] (1)
式中:[X]表示采集的全部網(wǎng)絡鏈路漏洞數(shù)據(jù);[a]表示采集的無效網(wǎng)絡鏈路漏洞數(shù)據(jù),且[aminlt;alt;amax],[amax]與[amin]分別表示漏洞最大與最小信息數(shù)據(jù)載量。
2) 網(wǎng)絡鏈路漏洞知識抽取。從有效采集的網(wǎng)絡鏈路漏洞數(shù)據(jù)[X]中,抽取出漏洞的屬性、實體及關聯(lián)關系等知識。計算機網(wǎng)絡鏈路運行時,各漏洞均配備專屬ID,且其屬性信息各具特色,據(jù)此可抽取漏洞實體知識。網(wǎng)絡鏈路漏洞的屬性信息涵蓋漏洞爆發(fā)點、編程語言、文件名及危險等級評分等,詳見表1。
結合表中信息可看出,計算機網(wǎng)絡鏈路的各漏洞都包含數(shù)個屬性信息,基于此對已知漏洞和未知漏洞的屬性信息關聯(lián)系數(shù)實施權衡,具體表達式為:
[αBi,Cj=σβBi,CjM] (2)
式中:[σ]表示關聯(lián)系數(shù)權衡過程中的誤差調(diào)整參量;[M]表示計算機網(wǎng)絡鏈路漏洞的屬性信息總數(shù)量;[βBi,Cj]表示計算機網(wǎng)絡鏈路的已知漏洞與未知漏洞屬性信息之間的相似程度,[Bi]與[Cj]分別表示計算機網(wǎng)絡鏈路的已知漏洞與未知漏洞屬性信息集。
運用[αBi,Cj]創(chuàng)建計算機網(wǎng)絡鏈路漏洞的實體抽取規(guī)則為:
[αBi,Cj≥χ,Bi為漏洞實體αBi,Cjlt;χ,Bi為非漏洞實體] (3)
式中[χ]表示抽取計算機網(wǎng)絡鏈路漏洞實體知識的閾值。
在計算機網(wǎng)絡鏈路現(xiàn)實運行中,其漏洞實體主要涉及的關系包括數(shù)據(jù)流、聲明、控制以及函數(shù)調(diào)用四類依賴關系。為便于此類關系的描述與抽取,設[D1]和[D2]分別表示計算機網(wǎng)絡鏈路漏洞知識圖譜的兩個隨機節(jié)點,即兩個隨機漏洞實體。其中,在計算機網(wǎng)絡鏈路漏洞實體的函數(shù)調(diào)用依賴關系抽取中,當向[D2]實體邊緣調(diào)用[D1]實體時,此時這兩個漏洞實體之間便存在函數(shù)調(diào)用依賴關系[D1→FCDD2];在計算機網(wǎng)絡鏈路漏洞實體的控制依賴關系抽取中,當[D2]實體屬于[D1]實體時,同時[D2]實體需借助[D1]實體方可實現(xiàn)相關操作,此時這兩個漏洞實體之間屬于控制依賴關系[D1→CDD2];在計算機網(wǎng)絡鏈路漏洞實體的聲明依賴關系抽取中,當某個漏洞實體聲明時同時涉及到[D1]和[D2]兩個漏洞實體,此時二者即屬于聲明依賴關系[D1→DDD2];在計算機網(wǎng)絡鏈路漏洞實體的數(shù)據(jù)流依賴關系抽取中,當[D1]和[D2]兩個漏洞實體之間具備特殊路徑時,同時二者具有相同的定義,此時二者便屬于數(shù)據(jù)流依賴關系[D1→DFDD2]。
3) 網(wǎng)絡鏈路漏洞知識圖譜構成。對鏈路漏洞的知識圖譜表現(xiàn)形式實施定義,實現(xiàn)知識圖譜結構設計,獲得可視化的網(wǎng)絡鏈路漏洞知識圖譜。通過三元組呈現(xiàn)網(wǎng)絡鏈路漏洞知識圖譜為:
[H=X,B,D] (4)
式中:[D]與[B]分別表示網(wǎng)絡鏈路漏洞知識圖譜的關系與實體集合。所構建的網(wǎng)絡鏈路漏洞知識圖譜主要由漏洞實體和其他實體結構構成。其中:網(wǎng)絡鏈路的漏洞實體結構主要由漏洞基礎信息與屬性信息等構成;其他實體結構主要由網(wǎng)絡鏈路的運行程序?qū)嶓w與安防實體等構成。
構建的網(wǎng)絡鏈路漏洞知識圖譜結構如圖1所示。
1.2" 計算機網(wǎng)絡鏈路漏洞檢測
以計算機網(wǎng)絡鏈路漏洞知識圖譜中的漏洞實體及關系等知識信息作為輸入,創(chuàng)建卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)模型[13],運用訓練后的CNN模型檢測出計算機網(wǎng)絡鏈路運行中潛在的漏洞。在CNN模型訓練過程中,需要利用已構建的計算機網(wǎng)絡鏈路漏洞知識圖譜的鏈路漏洞屬性、實體及關系等知識數(shù)據(jù)實施訓練,以提高CNN模型的準確性和泛化能力,保證該模型對計算機網(wǎng)絡鏈路漏洞檢測結果的精度與可靠性。
基于所構建知識圖譜與CNN模型的計算機網(wǎng)絡鏈路漏洞檢測過程如下。
1) 向CNN模型的輸入層中輸入所構建網(wǎng)絡鏈路漏洞知識圖譜[H]的知識信息[X]、[B]、[D],設[h1,h2,…,hN]表示此類漏洞知識集合,將該集合傳輸至卷積層提取此類知識的特征。設[f1]與[f2]分別表示輸入卷積層的漏洞知識[hi]與卷積層所輸出的漏洞知識特征的大小,則[f2]的運算式為:
[f2=1+hif1-γ+2ηι] (5)
式中:[γ]表示卷積核的尺度;[η]與[ι]分別表示卷積核的填充與步長。
2) 通過卷積層所提取到的各個漏洞知識特征經(jīng)激活函數(shù)[λ]與池化層處理后,輸入到全連接層中,通過該層融合全部漏洞知識特征后,向輸出層輸入。
3) 輸出層運用Softmax函數(shù),獲得網(wǎng)絡鏈路漏洞知識的分類結果,實現(xiàn)計算機網(wǎng)絡鏈路漏洞檢測。最終檢測輸出結果[yi]可表示為:
[yi=λω′1h1,ω′2h2,…,ω′NhN?f2] (6)
式中[ω′i]表示權重參量。
2" 結果分析
實驗中選取計算機網(wǎng)絡運行中8種常見的鏈路漏洞(a~h),通過本文方法實施檢測,檢驗檢測結果。所選取的8種常見鏈路漏洞詳情如表2所示。
為提升實驗檢驗結果的可信程度,避免單一工況下檢驗結果可信程度低的問題,依據(jù)實驗計算機網(wǎng)絡的現(xiàn)實情況,設定6種實驗工況,分別檢驗各種設定工況下本文方法的漏洞檢測效果。所設定的各種實驗工況詳情如表3所示。
由所設定的實驗工況可看出,各種實驗工況中的網(wǎng)絡鏈路漏洞的數(shù)量或類別存在差異,這種差異性可增加本文方法實驗檢驗結果的可信程度。
通過本文方法采集實驗計算機網(wǎng)絡鏈路不同工況下的多源漏洞數(shù)據(jù),構成各工況下的實驗計算機網(wǎng)絡鏈路漏洞知識圖譜。各個工況下所獲得的鏈路漏洞知識圖譜的實體知識與關系知識數(shù)據(jù)集信息統(tǒng)計情況如圖2所示。
通過圖2能夠看出,各種工況下構建的實驗計算機網(wǎng)絡鏈路漏洞知識圖譜中,所包含的實體知識與關系知識數(shù)據(jù)集信息量存在顯著差異,說明本文方法可依據(jù)實際網(wǎng)絡鏈路漏洞情況,獲得與實際工況相符的漏洞知識圖譜,為后續(xù)的不同工況下各類漏洞檢測提供可靠保障。
為清晰呈現(xiàn)本文方法的最終漏洞檢測結果,以漏洞威脅檢測精度為指標,將本文提出的基于知識圖譜技術的漏洞檢測方法、基于膠囊網(wǎng)絡和注意力機制的漏洞檢測方法、切片級漏洞檢測方法進行對比測試。三種方法的漏洞威脅檢測精度結果如圖3所示。
由圖3能夠得出,基于知識圖譜技術的漏洞檢測方法應用后,漏洞威脅檢測精度顯著提高,始終保持在90%以上。而基于膠囊網(wǎng)絡和注意力機制的漏洞檢測方法與切片級漏洞檢測方法應用后,漏洞威脅檢測精度最高未超過70%。
這一結果表明,知識圖譜技術能夠高效地整合和利用鏈路中的各類信息,準確識別潛在的漏洞威脅,為網(wǎng)絡安全防護提供了強有力的支持。
3" 結" 語
計算機網(wǎng)絡運行中,數(shù)據(jù)傳輸鏈路可能因各種原因產(chǎn)生風險漏洞,導致數(shù)據(jù)丟失或錯誤。為保障鏈路安全,本文研究了基于知識圖譜的鏈路漏洞檢測方法。該方法利用知識圖譜技術整合不同來源、格式的數(shù)據(jù),統(tǒng)一表示為結構化知識,將網(wǎng)絡設備配置、流量數(shù)據(jù)、漏洞數(shù)據(jù)庫等整合至知識圖譜,提高了數(shù)據(jù)可用性,使漏洞檢測更高效、準確。知識圖譜技術可持續(xù)更新和擴展,保證實時檢測的準確性和完整性。
參考文獻
[1] 林雍博,凌捷.基于殘差網(wǎng)絡和GRU的XSS攻擊檢測方法[J].計算機工程與應用,2022,58(10):101?107.
[2] 王鎖成,陳世平.一種基于殘差網(wǎng)絡改進的異常流量入侵檢測模型[J].小型微型計算機系統(tǒng),2023,44(12):2757?2764.
[3] 陳澤,鄔桐,左曉軍,等.基于知識圖譜的電力網(wǎng)絡安全漏洞挖掘系統(tǒng)設計[J].制造業(yè)自動化,2023,45(7):100?105.
[4] 管軍霖,師功才,陳宏.基于Apriori風險數(shù)據(jù)分析的網(wǎng)絡漏洞挖掘研究[J].計算機仿真,2022,39(1):343?347.
[5] 鄭鵬,沙樂天.基于混合分析的Java反序列化漏洞檢測方法[J].計算機工程,2023,49(12):136?145.
[6] 李明磊,黃暉,陸余良,等.SymFuzz:一種復雜路徑條件下的漏洞檢測技術[J].計算機科學,2021,48(5):25?31.
[7] 陸璐,賴錦雄.基于膠囊網(wǎng)絡和注意力機制的智能合約漏洞檢測方法[J].華南理工大學學報(自然科學版),2023,51(5):36?44.
[8] 胡雨濤,王溯遠,吳月明,等.基于圖神經(jīng)網(wǎng)絡的切片級漏洞檢測及解釋方法[J].軟件學報,2023,34(6):2543?2561.
[9] 文敏,王榮存,姜淑娟.基于關系圖卷積網(wǎng)絡的源代碼漏洞檢測[J].計算機應用,2022,42(6):1814?1821.
[10] 杜藝帆,叢紅艷.基于知識圖譜的網(wǎng)絡安全漏洞智能檢測系統(tǒng)設計[J].計算機測量與控制,2024,32(3):63?70.
[11] 行久紅,牛保民.基于文本挖掘的軟件漏洞信息知識圖譜構建方法[J].無線互聯(lián)科技,2023,20(12):109?112.
[12] 何芳州,王祉淇.知識圖譜特征重構下無線傳感網(wǎng)絡數(shù)據(jù)存儲恢復[J].傳感技術學報,2024,37(7):1265?1270.
[13] 曲瀧玉,賈依真,郝永樂.結合CNN和文本語義的漏洞自動分類方法[J].北京理工大學學報,2019,39(7):738?742.
作者簡介:辛瑞雯(1997—),女,山西太原人,碩士研究生,研究方向為文本分類、知識圖譜。
高" 云(1976—),女,山西大同人,碩士研究生,副教授,研究方向為人工智能、深度學習。