張 江,孫 治,徐 銳,陳劍鋒
(1.網(wǎng)絡(luò)空間安全四川省重點實驗室,四川 成都 610041;2.中國電科網(wǎng)絡(luò)空間安全技術(shù)重點實驗室,四川 成都 610041;3.中國電子科技網(wǎng)絡(luò)信息安全有限公司,四川 成都 610041)
網(wǎng)絡(luò)空間資源是指網(wǎng)絡(luò)空間中“載體”、“信息”、“主體”等各類要素的總和,不僅包括通信基礎(chǔ)設(shè)施、IP網(wǎng)絡(luò)、覆蓋網(wǎng)絡(luò)、應(yīng)用支撐系統(tǒng)等互聯(lián)網(wǎng)基礎(chǔ)設(shè)施實體資源,還包括了承載在實體設(shè)施之上的信息內(nèi)容、用戶等虛擬資源等[1]。
網(wǎng)絡(luò)空間資源測繪按照一定的方法、技術(shù)和標(biāo)準(zhǔn),利用軟件或硬件工具,通過測試表征網(wǎng)絡(luò)空間各層次要素狀態(tài)、屬性和關(guān)系的多元指標(biāo)來認(rèn)知網(wǎng)絡(luò)空間的構(gòu)成及發(fā)展規(guī)律的行為。
網(wǎng)絡(luò)空間資源測度是指一定標(biāo)度下對網(wǎng)絡(luò)空間資源的可探測屬性的定量計算,而可探測屬性需要通過測繪技術(shù)實現(xiàn),通過對網(wǎng)絡(luò)空間資源的探測、采集、分析、處理,可以根據(jù)網(wǎng)絡(luò)資源在網(wǎng)絡(luò)空間的分布,并結(jié)合地理和社會空間信息,以邏輯圖和地理信息圖的形式繪制出網(wǎng)絡(luò)資源實時分布的屬性狀態(tài)和發(fā)展趨勢。
通過網(wǎng)絡(luò)空間資源測繪能夠為各類網(wǎng)絡(luò)資產(chǎn)評估等提供數(shù)據(jù)和技術(shù)支撐,研究網(wǎng)絡(luò)空間資源測繪技術(shù)對于維護(hù)推動國民經(jīng)濟(jì)發(fā)展具有十分重要的理論意義和應(yīng)用價值[2],而通過網(wǎng)絡(luò)空間資源測度可以對網(wǎng)絡(luò)空間資源測繪技術(shù)進(jìn)行量化評估,因此網(wǎng)絡(luò)空間資源測度技術(shù)可以對網(wǎng)絡(luò)空間資源測繪技術(shù)起到促進(jìn)和推動作用。
網(wǎng)絡(luò)空間資源包括網(wǎng)絡(luò)空間的組成、結(jié)構(gòu)、屬性、行為、特征、規(guī)律和趨勢等,測量獲取的信息構(gòu)成一類典型的大數(shù)據(jù),其內(nèi)容格式多樣、結(jié)構(gòu)復(fù)雜、變化迅速,為測繪信息的理解、交互、傳播帶來了較大困難。測繪的范圍可以是網(wǎng)絡(luò)空間局部,也可以是全域。現(xiàn)有測度方法又有多種,不同的測度方法各有優(yōu)缺點。因此,在網(wǎng)絡(luò)資源測度的過程中需要綜合考慮,在對測度方法進(jìn)行遴選與組合時需要遵循以下原則。
一種測度方法如果能夠被廣泛使用和發(fā)展,首先其科學(xué)性必須是受承認(rèn)的,其科學(xué)性是已經(jīng)得到了前人檢驗的。在眾多測度方法中進(jìn)行選擇和組合,給出適合網(wǎng)絡(luò)空間資源測量效果的測度方法,由于不同的測度對象適用于不同的測度方法,因此測度方法的合理性是必須考慮的一個重要原則。合理性指所選擇的方法須遵循“三個是否”,即是否能客觀反映測度網(wǎng)絡(luò)空間資源測量的效果、是否能全面覆蓋網(wǎng)絡(luò)空間資源的各個方面、是否能突出網(wǎng)絡(luò)空間測量的特點與重點等。
適用性原則要求測度方法的選擇要考慮數(shù)據(jù)來源情況、測度對象本身的發(fā)展情況。網(wǎng)絡(luò)空間資源測量效果雖然屬于測量測度范疇,但是也有其特殊性。首先,它屬于宏觀范疇的測度,使得測度數(shù)據(jù)的來源必須具有公認(rèn)的或官方認(rèn)可的統(tǒng)計性;其次,網(wǎng)絡(luò)空間資源測量的效果測度從總體上看還處于探索階段,許多數(shù)據(jù)目前還無法獲取,有些數(shù)據(jù)只能部分獲取,一些數(shù)據(jù)無法判斷正確性。因此要考慮到數(shù)據(jù)來源的實際情況,選擇適用的測度方法。
有些方法看似非常嚴(yán)謹(jǐn),然而在使用過程中缺乏可操作性,一些指標(biāo)體系非常龐雜、涉及方方面面,但是由于數(shù)據(jù)的缺乏而無法實施。重要的是,由于事物之間的普遍聯(lián)系,某方面的數(shù)據(jù)可能與另一方面的數(shù)據(jù)之間存在同樣的揭示效果,如果指標(biāo)體系過于龐雜、數(shù)據(jù)來源過多,反而會掩蓋實質(zhì)而不利于測度。因此,指標(biāo)體系不宜龐雜,指標(biāo)體系的設(shè)計要考慮指標(biāo)之間的相互關(guān)系,指標(biāo)項的擬定要考慮數(shù)據(jù)的可獲取性等問題。
可擴(kuò)展性指測度方法的可發(fā)展、可變化性。在網(wǎng)絡(luò)空間的效果測度中,可擴(kuò)展性體現(xiàn)在兩個方面。一方面是指標(biāo)體系的可擴(kuò)展性,即要考慮網(wǎng)絡(luò)空間測繪發(fā)展的實際情況,在早期階段,指標(biāo)體系可以適當(dāng)粗略,反映網(wǎng)絡(luò)空間測量的主要方面;另一方面是指測度中使用指標(biāo)的可擴(kuò)展性。設(shè)計出來的指標(biāo)體系可能是比較完備的,然而實施過程中可以選擇其中操作性強的指標(biāo)進(jìn)行調(diào)查與測度,在數(shù)據(jù)條件具備之后逐步擴(kuò)展指標(biāo)的數(shù)量。這一原則也符合網(wǎng)絡(luò)空間資源測度生命周期理論,即逐步深入、逐步增加測度的維度。
測度就是對多屬性體系結(jié)構(gòu)描述的對象系統(tǒng)做出全局性、整體性的測度,即根據(jù)一個復(fù)雜系統(tǒng)同時受到多種因素影響的特點,依據(jù)多個有關(guān)指標(biāo)對復(fù)雜系統(tǒng)進(jìn)行總測度的方法。測度的結(jié)果需要通過比較來說明,有不同測繪方法之間的比較,也有同一測量方法不同時間的比較、不同區(qū)域的比較。比較的目的是為了更好地認(rèn)識的網(wǎng)絡(luò)空間資源,分析其中的優(yōu)劣勢,從而制定網(wǎng)絡(luò)空間測繪的對策。為了達(dá)到比較的目的,測度方法必須具備通用性、標(biāo)準(zhǔn)化特征,既可以用來測度不同網(wǎng)絡(luò)空間資源,又可以用來測度不同時期的網(wǎng)絡(luò)空間資源。
按照資源在網(wǎng)絡(luò)空間不同層次表現(xiàn)出來的狀態(tài)、結(jié)構(gòu)和行為特征,將網(wǎng)絡(luò)空間資源測度劃分為實體資源測度和虛擬資源測度兩大類[3],分別用于測度資源在不同層次上的顯性和隱性特征。測度指標(biāo)體系的確立是網(wǎng)絡(luò)空間資源測度工作中的首要環(huán)節(jié),測度的指標(biāo)體系原理圖如圖1所示。
實體資源根據(jù)設(shè)備用途可分為網(wǎng)絡(luò)基礎(chǔ)設(shè)施和接入設(shè)備;虛擬資源包括網(wǎng)絡(luò)虛擬人物、網(wǎng)絡(luò)虛擬社區(qū)等。在借鑒已有的信息經(jīng)濟(jì)測度、城市發(fā)展測度[4]以及統(tǒng)計理論與方法的基礎(chǔ)上,通過對網(wǎng)絡(luò)空間資源測繪研究對象的分析研究,提出了分層分級的網(wǎng)絡(luò)空間資源測度體系制定指標(biāo)體系,如表1所示。
該指標(biāo)體系為三級測度指標(biāo)體系,第一級2個指標(biāo),分別是實體資源測度和虛擬資源測度。第二級6個指標(biāo),分別是所屬機構(gòu)信息測度、網(wǎng)絡(luò)拓?fù)錅y度、網(wǎng)絡(luò)節(jié)點測度、網(wǎng)絡(luò)服務(wù)測度、虛擬主體測度、投影實體測度。第三級有超過20個指標(biāo),這其中,網(wǎng)絡(luò)服務(wù)測度包括了服務(wù)共性測度和各類應(yīng)用層協(xié)議對應(yīng)的服務(wù)內(nèi)容,包括超文本傳輸協(xié)議(HyperText Transfer Protocol,HTTP)、文件傳輸協(xié)議(File Transfer Protocol,FTP)等服務(wù);虛擬主體測度包括了賬號測度、共性測度、群體測度;投影實體測度包括了共性測度、群體測度。
圖1 測度指標(biāo)體系原理圖
表1 網(wǎng)絡(luò)空間資源測度指標(biāo)體系
每一葉子層次的資源測度指標(biāo)由測度指標(biāo)名稱、測量數(shù)據(jù)類型、測量值域、歸一化測量值、主觀指標(biāo)權(quán)值構(gòu)成,而非葉子層次的資源測度指標(biāo)則由測度指標(biāo)名稱、測度數(shù)學(xué)符號、測度和主觀測度權(quán)值構(gòu)成。
測度是指一定指標(biāo)下對事物某種屬性的定量計算。而指標(biāo)是根據(jù)人們對客觀事物觀察所取得的經(jīng)驗來決定,它不是絕對一成不變的,因此要確定測度就必須先要按照指標(biāo)體系進(jìn)行指標(biāo)確認(rèn),該過程需要通過大量的測量實現(xiàn)。
網(wǎng)絡(luò)測量的分類標(biāo)準(zhǔn)有多種,不同的分類方式有不同的分類結(jié)果。根據(jù)測量的方式可以分為主動測量和被動測量;根據(jù)測量點的多少又分為單點測量與多點測量;根據(jù)被測量者知情與否可分為協(xié)作式測量與非協(xié)作式測量;根據(jù)測量的對象可分為實體資源測量和虛擬資源測量,而實體資源測量包括所屬組織機構(gòu)測量、拓?fù)錅y量、性能測量、網(wǎng)絡(luò)節(jié)點測量、網(wǎng)絡(luò)服務(wù)測量和安全測量,而虛擬資源測量包括虛擬主體測量和投影實體測量。由于測度指標(biāo)體系關(guān)注的是網(wǎng)絡(luò)空間資源,屬于研究對象的范疇,因此下面針對網(wǎng)絡(luò)資源測量的主要對象展開論述。
在拓?fù)錅y量方面,網(wǎng)絡(luò)拓?fù)淇梢杂梅譃樽灾斡?Autonomous System,AS)級、路由器級和IP級。IP級網(wǎng)絡(luò)測量主要基于Traceroute的方式實現(xiàn),由于傳統(tǒng)IP級探測會導(dǎo)致拓?fù)渲写嬖诖罅康哪涿酚善?,拓?fù)渫暾圆粔虻葐栴},文獻(xiàn)[5]提出了一種多協(xié)議的分布式IP級互聯(lián)網(wǎng)拓?fù)涮綔y方法。路由器級拓?fù)錅y量方法包括基于協(xié)議的方法和基于Traceroute的方法?;趨f(xié)議的方式通過簡單網(wǎng)絡(luò)管理協(xié)議(Simple Network Management Protocol,SNMP)獲取路由器的IP子網(wǎng)的路由信息表,從而恢復(fù)路由器級拓?fù)?。而基于Traceroute的方法則是利用IP路徑數(shù)據(jù)通過別名解析等方式恢復(fù)網(wǎng)絡(luò)拓?fù)???傊葾S級拓?fù)鋱D的方法可采用基于邊界網(wǎng)關(guān)協(xié)議(Border Gateway Protocol,BGP)的路由信息方法、基于Traceroute的方法和基于互聯(lián)網(wǎng)路由注冊信息庫(Internet Routing Registry,IRR)的方法[6]。由于BGP的路由表和更新報文中都包含有AS路徑信息,采集器通過偵聽BGP路由表和更新報文獲取AS級拓?fù)湫畔順?gòu)造AS級拓?fù)鋱D。將通過Traceroute得到的IP地址映射到AS號的IP-AS技術(shù)將IP級拓?fù)溆成錇锳S級拓?fù)洹RR作為全球化的分布式路由信息數(shù)據(jù)庫,用于受理IP和AS號申請和記錄ISP的BGP路由信息,因此也可以恢復(fù)部分AS級網(wǎng)絡(luò)拓?fù)洹?/p>
在性能測量方面,測量內(nèi)容主要包括帶寬、吞吐量、延遲、丟包率,并作網(wǎng)絡(luò)可靠性、穩(wěn)定性、可達(dá)性等方面的分析[7]。帶寬測量主要包括兩種測量方式,一種是端到端帶寬測量,其又包括可用帶寬和瓶頸帶寬的測量[8];另外一種是逐跳帶寬測量,主要測量網(wǎng)絡(luò)路徑上各段鏈路的帶寬參數(shù),重點在于測量逐跳鏈路的帶寬值。而延遲測量是指借助于全球定位系統(tǒng)(Global Positioning System,GPS)接收機或網(wǎng)絡(luò)時間服務(wù)(Network Time Protocol,NTP)來實現(xiàn)同步測量[9]。
網(wǎng)絡(luò)節(jié)點測量和網(wǎng)絡(luò)服務(wù)主要分為主動探測和被動監(jiān)測。其中,主動探測主要包括設(shè)備端口開放性檢測、主機存活性檢測、Web框架偵察、系統(tǒng)指紋發(fā)現(xiàn)、服務(wù)指紋發(fā)現(xiàn)和漏洞掃描等;被動解析子模塊主要有高速流量獲取、協(xié)議識別和字段解析、入侵檢測系統(tǒng)日志匯聚等功能。
虛擬資源主要包括網(wǎng)絡(luò)虛擬人物、網(wǎng)絡(luò)虛擬社區(qū),以及人物相關(guān)的文本、音視頻等信息內(nèi)容。在虛擬資源測量方面,主要包括特定信息內(nèi)容快速探測和話題發(fā)現(xiàn)技術(shù)、音視頻內(nèi)容探測技術(shù)、網(wǎng)站自動探測技術(shù)等。
從數(shù)學(xué)的角度,測度論是實分析的一個分支,研究對象有σ代數(shù)、測度、可測函數(shù)和積分,它對一個給定集合的某些子集指定為一個數(shù),這個數(shù)可以比作大小、體積、概率等。本方法給出測度的數(shù)學(xué)定義,以便引出網(wǎng)絡(luò)空間資源的測度定義。
測度μ(可列可加的正測度)是個函數(shù)。設(shè)A的元素是X的子集合,而且是一個σ-代數(shù),μ在A上定義,取值范圍為[0,+∞],并且滿足以下性質(zhì):
(1)空集合的測度為零
μ(?)=0
(1)
(2)非負(fù)性
?E∈A,μ(E)≥0
(2)
(3)可數(shù)可加性
若可數(shù)個兩兩不相交集合的序列,則所有Ei的聯(lián)集的測度等于每個Ei的測度之和:
(3)
這樣的三元組(X,A,μ)稱為一個測度空間,而A中的元素稱為這個空間中的可測集合。
依據(jù)測度的數(shù)學(xué)定義,給出網(wǎng)絡(luò)空間資源的測度S的定義。定義網(wǎng)絡(luò)空間為T,存在某一網(wǎng)絡(luò)資源tp∈T,那么資源tp的屬性全集為X。定義對資源tp的n次測量結(jié)果為A={a1,a2,…,an},某次探測結(jié)果為ai∈A,S是網(wǎng)絡(luò)空間資源tp的測度。因此,網(wǎng)絡(luò)空間資源tp的測度空間為(X,A,S)。
(4)
當(dāng)εji是數(shù)值且數(shù)值越大對認(rèn)識網(wǎng)絡(luò)資源越有利時,采用正向指標(biāo)計算方法,那么歸一化指標(biāo)mji為:
(5)
當(dāng)εji是數(shù)值且數(shù)值越小對認(rèn)識網(wǎng)絡(luò)資源越有利時,采用負(fù)向指標(biāo)計算方法處理,那么歸一化指標(biāo)mji為:
(6)
綜上,歸一化指標(biāo)mji的值域為[0,1]。由于網(wǎng)絡(luò)空間資源的測度指標(biāo)有重要性區(qū)別,有些指標(biāo)可以很好地表征該資源,而有些指標(biāo)不是該資源的特征屬性,因此,有必要對測度指標(biāo)的重要性進(jìn)行評估,指標(biāo)的重要性即為測度權(quán)值W。
確定指標(biāo)權(quán)重的方法包括主觀賦權(quán)法和客觀賦權(quán)法兩類。主觀賦權(quán)法是指從評價者主觀角度出發(fā)來決定權(quán)重的方法,客觀賦權(quán)法是指根據(jù)各指標(biāo)所提供的信息量來決定指標(biāo)的權(quán)重。按照信息熵的理念,可以根據(jù)熵值大小,也即各項指標(biāo)值的變異程度,計算出權(quán)重。
本方法中測度權(quán)值W的計算綜合考慮了主觀因素和客觀因素,測度指標(biāo)的權(quán)值W等于主觀賦權(quán)(領(lǐng)域?qū)<?乘以客觀賦權(quán)(信息熵)來確定測度指標(biāo)的權(quán)重系數(shù)。其中,領(lǐng)域?qū)<医o出的權(quán)值表征了先驗知識,信息熵給出的權(quán)值表征了客觀測量結(jié)果。因此,測度指標(biāo)的權(quán)值W等于:
W=Ws×Wo
(7)
式中Ws是主觀權(quán)重,由領(lǐng)域?qū)<医o出,取值范圍為Ws∈[0,1],且針對同一級測度指標(biāo)Ws滿足:
(8)
以下給出客觀賦權(quán)Wo的計算過程。假定測量指標(biāo)εm和εn是獨立隨機變量,滿足p(εm,εn)=p(εm)p(εn)。那么指標(biāo)εj的信息熵為:
(9)
式中p(εji)表示指標(biāo)εji在多次測量中出現(xiàn)的概率,顯然有0≤ej≤1。那么信息熵冗余度計算為:
dj=1-ej
(10)
綜上,客觀賦權(quán)Wo的計算公式為:
(11)
顯然,客觀賦權(quán)的值域范圍Wo∈[0,1],因此指標(biāo)權(quán)重W∈[0,1]。那么按照指標(biāo)體系分層,level 3層級的測度計算公式為:
(12)
顯然,測度Si的值域范圍為S∈[0,1]。同理level 1、level 2層級的測度計算公式為:
(13)
當(dāng)前網(wǎng)絡(luò)空間資源測繪技術(shù)是一個全新的研究領(lǐng)域,研究其網(wǎng)絡(luò)空間資源的測度當(dāng)屬于一個開創(chuàng)性研究。本文從滿足網(wǎng)絡(luò)資源測度的基本需求出發(fā),提出了一種網(wǎng)絡(luò)空間資源的測度方法,包括測度標(biāo)準(zhǔn)的原則性要求、網(wǎng)絡(luò)空間資源測度的數(shù)學(xué)定義、網(wǎng)絡(luò)空間資源測度指標(biāo)體系和網(wǎng)絡(luò)資源測量方法。該測度方法可應(yīng)用于網(wǎng)絡(luò)空間資源測繪技術(shù)的評估,通過將抽象問題量化,能夠適應(yīng)網(wǎng)絡(luò)空間資源的多樣性和動態(tài)變化的特性,對網(wǎng)絡(luò)空間資源測繪研究起到一定的指導(dǎo)和促進(jìn)作用。