• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于隨機(jī)性測(cè)試的分組密碼體制識(shí)別方案*

      2019-06-10 06:44:02趙志誠(chéng)趙亞群劉鳳梅
      密碼學(xué)報(bào) 2019年2期
      關(guān)鍵詞:隨機(jī)性密文體制

      趙志誠(chéng),趙亞群,劉鳳梅

      1.信息工程大學(xué)數(shù)學(xué)工程與先進(jìn)計(jì)算國(guó)家重點(diǎn)實(shí)驗(yàn)室,鄭州 450001

      2.信息保障技術(shù)重點(diǎn)實(shí)驗(yàn)室,北京 100072

      1 引言

      密碼分析作為一種被動(dòng)攻擊方法,是指在不知道解密密鑰及通信者所采用的加密體制的細(xì)節(jié)的條件下,試圖獲得機(jī)密信息.根據(jù)所研究的對(duì)象,密碼分析研究的對(duì)象主要包括兩個(gè)部分:密碼算法和密文.根據(jù)著名的Kerchoffs 原理[1]提出加密算法的公開(kāi)不應(yīng)該影響明文和密鑰的安全,當(dāng)前大多數(shù)密碼分析方法也是在假設(shè)密碼體制已知的前提下,展開(kāi)對(duì)各種密碼算法的分析.然而在現(xiàn)實(shí)中,被動(dòng)攻擊的一方通常僅能獲取敵手的密文,這種情況下密碼分析者只能開(kāi)展唯密文攻擊.因此識(shí)別密文的密碼體制(以下簡(jiǎn)稱(chēng)密碼體制識(shí)別)就成為了開(kāi)展密碼分析的一個(gè)前提條件.

      近年來(lái),AES 征集和評(píng)選、NESSIE 計(jì)劃和Estream 計(jì)劃等一系列公開(kāi)的加密標(biāo)準(zhǔn)征集活動(dòng)極大地帶動(dòng)了密碼體制設(shè)計(jì)的發(fā)展[2,3].與此同時(shí),針對(duì)當(dāng)前各類(lèi)密碼體制的密碼分析正持續(xù)成為研究熱點(diǎn).密碼體制識(shí)別技術(shù)是密碼分析的一個(gè)重要組成部分,主要研究在不同密碼體制加密的密文中識(shí)別出具體的密碼體制.許多具體的密碼分析技術(shù)是專(zhuān)為某種密碼體制設(shè)計(jì)的,或假設(shè)已知產(chǎn)生密文的密碼體制.而在現(xiàn)實(shí)中,密碼分析者得到的只是未知編制的密文,因此對(duì)于密碼體制的識(shí)別是開(kāi)展具體密碼分析的前提條件.此外,密碼體制抵抗識(shí)別的能力也可以衡量密碼體制安全性,對(duì)于密碼體制的設(shè)計(jì)與安全性評(píng)估具有積極的參考意義.因此開(kāi)展密碼體制識(shí)別相關(guān)研究,對(duì)于推動(dòng)密碼學(xué)的應(yīng)用與發(fā)展有著雙重的促進(jìn)作用.

      目前,密碼體制識(shí)別方案的設(shè)計(jì)思路主要來(lái)源于統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)技術(shù)[4].研究者認(rèn)為,某一特定密碼體制產(chǎn)生的密文與其他密碼體制產(chǎn)生的密文在空間分布上存在一定的差異,從而嘗試提取出能夠刻畫(huà)相應(yīng)差異的特征,作為識(shí)別密碼體制的依據(jù).早期基于統(tǒng)計(jì)學(xué)的密碼體制識(shí)別方法通過(guò)提取密文的各類(lèi)統(tǒng)計(jì)指標(biāo)進(jìn)行比較,并給出識(shí)別結(jié)果.隨著密碼學(xué)的發(fā)展,各類(lèi)密碼體制混淆擴(kuò)散能力不斷提升,給密碼體制識(shí)別帶來(lái)巨大挑戰(zhàn).為此機(jī)器學(xué)習(xí)方法被引入密碼體制識(shí)別任務(wù)中.基于機(jī)器學(xué)習(xí)技術(shù)的密碼體制識(shí)別方案將特征視為一組屬性、將識(shí)別任務(wù)等同于分類(lèi)任務(wù),在包含特征和算法標(biāo)簽的訓(xùn)練數(shù)據(jù)集上訓(xùn)練分類(lèi)器模型,再用訓(xùn)練好的分類(lèi)器對(duì)測(cè)試集數(shù)據(jù)(僅包含從密文中提取的特征)進(jìn)行識(shí)別[4–7].基于機(jī)器學(xué)習(xí)技術(shù)的密碼體制識(shí)別方案設(shè)計(jì)簡(jiǎn)單、表現(xiàn)穩(wěn)定,且能處理數(shù)據(jù)之間的復(fù)雜關(guān)系,已經(jīng)成為密碼體制識(shí)別領(lǐng)域的研究熱點(diǎn).

      密碼體制識(shí)別最初的研究對(duì)象是古典密碼體制.2001年,Pooja[8]設(shè)計(jì)了一種基于字母使用頻率的古典密碼體制識(shí)別方案,分析了包括置換密碼、代換密碼和維吉尼亞密碼在內(nèi)的主要的古典密碼.隨著現(xiàn)代密碼技術(shù)的飛速發(fā)展,傳統(tǒng)的基于統(tǒng)計(jì)學(xué)方法的密碼體制識(shí)別技術(shù)逐漸失效.此時(shí)針對(duì)復(fù)雜且安全系數(shù)高的現(xiàn)代密碼,國(guó)外研究者結(jié)合模式識(shí)別領(lǐng)域相關(guān)技術(shù),設(shè)計(jì)了一系列基于機(jī)器學(xué)習(xí)方法的密碼體制識(shí)別方案.2006年,文獻(xiàn)[5]借鑒文檔分類(lèi)技術(shù),提出了基于支持向量機(jī)的分組密碼識(shí)別方案,考慮了對(duì)包含AES、DES、3DES、Blowfish、RC5 在內(nèi)的五種密碼體制的識(shí)別.2008年,Negireddy 等人[9]利用模式識(shí)別技術(shù),對(duì)AES、DES、TDES、Blowfish、RC5 等密碼體制在ECB 與CBC 模式下的加密密文做了區(qū)分實(shí)驗(yàn).

      2011年,Manjula 等人[4]提出了一種基于決策樹(shù)分類(lèi)器的密碼體制識(shí)別方案,對(duì)包含2 種古典密碼、1 種序列密碼、6 種分組密碼、2 種公鑰密碼的11 種密碼體制進(jìn)行了識(shí)別.2012年,Chou 等人[10]利用支持向量機(jī)技術(shù)分別對(duì)CBC 和ECB 兩種工作模式下的加密密文進(jìn)行區(qū)分,對(duì)ECB 模式下的密文進(jìn)行了成功區(qū)分,對(duì)于CBC 模式下的密文則不能區(qū)分.2013年,De Souza 等人設(shè)計(jì)了一種基于神經(jīng)網(wǎng)絡(luò)的識(shí)別方案,研究了AES 最終輪候選密碼算法的識(shí)別[5].2015年,吳楊等人[11]基于隨機(jī)性測(cè)試采集了3 種密文特征,并在對(duì)AES、Camellia、DES、3DES、SMS4 五種分組密碼體制的識(shí)別過(guò)程中使用了K-均值聚類(lèi)算法.Sharif 等人[6,12]在其設(shè)計(jì)的分組密碼體制識(shí)別方案中,比較了使用8 種不同的分類(lèi)器模型的識(shí)別效果,其結(jié)果顯示,組合分類(lèi)器模型Rotation Forest 效果最佳.2017年,黃良韜等人[13]結(jié)合已有的密碼體制識(shí)別研究成果,從密碼體制識(shí)別方案設(shè)計(jì)和特征提取兩大問(wèn)題著手,提出一種基于隨機(jī)森林算法的密碼體制分層識(shí)別方案,其識(shí)別研究對(duì)象涵蓋古典、分組、序列和公鑰等現(xiàn)有主要的密碼體制.該文給出一個(gè)較完整的密碼體制識(shí)別問(wèn)題的定義系統(tǒng),并將密碼體制的單層識(shí)別和分層識(shí)別統(tǒng)一于該系統(tǒng)下.

      密碼體制識(shí)別方案主要關(guān)注兩個(gè)方面:密文特征的選取與挖掘、機(jī)器學(xué)習(xí)算法的選擇.隨著機(jī)器學(xué)習(xí)算法包括深度神經(jīng)學(xué)習(xí)網(wǎng)絡(luò)的發(fā)展,在算法選擇方面,目前多數(shù)機(jī)器學(xué)習(xí)算法均有相應(yīng)的程序包(例如R語(yǔ)言),研究者可以較為簡(jiǎn)易的對(duì)各類(lèi)算法的分類(lèi)性能進(jìn)行比較.在密碼體制識(shí)別任務(wù)中,特征提取對(duì)密碼體制識(shí)別的成功率具有重要影響.由于分類(lèi)算法直接對(duì)所提取特征進(jìn)行處理,而密文數(shù)據(jù)自身通常具備較強(qiáng)的隨機(jī)性質(zhì),因此提取出能有效地刻畫(huà)密文信息的特征,成為識(shí)別任務(wù)中的關(guān)鍵環(huán)節(jié).目前公開(kāi)研究中的密文特征可以大致分為五類(lèi):

      (1)計(jì)算字符、特定長(zhǎng)度字節(jié)或比特等的熵[13];

      (2)統(tǒng)計(jì)字符、特定長(zhǎng)度字節(jié)、比特的概率[13];

      (3)對(duì)密文開(kāi)展隨機(jī)性測(cè)試獲得足夠的返回值作為密文特征,如文獻(xiàn)[11]基于碼元頻數(shù)檢測(cè)、塊內(nèi)頻數(shù)檢測(cè)及游程檢測(cè)設(shè)計(jì)了3 類(lèi)表現(xiàn)比較優(yōu)異的特征;

      (4)將密文看成可變長(zhǎng)的文檔向量[5];

      (5)將以上某幾類(lèi)特征組合成新的特征[10,13].

      表1 部分文獻(xiàn)中出現(xiàn)的密文特征Table 1 Typical features in some papers

      觀察表1,可以看到上述特征維數(shù)均在100 以上,個(gè)別特征維數(shù)已經(jīng)超過(guò)10 萬(wàn)維.在機(jī)器學(xué)習(xí)領(lǐng)域,特征維數(shù)的提高通常會(huì)增加數(shù)據(jù)分析的存儲(chǔ)開(kāi)銷(xiāo)與運(yùn)行時(shí)間消耗.在機(jī)器學(xué)習(xí)領(lǐng)域,特征工程[14]的一個(gè)重要內(nèi)容就是篩選信息量更多、靈活性更強(qiáng)的特征,從而能夠在簡(jiǎn)單模型訓(xùn)練中也能得到優(yōu)秀的結(jié)果.基于機(jī)器學(xué)習(xí)的密碼體制識(shí)別任務(wù),同樣需要關(guān)注密文特征提取方式的改進(jìn)以提高復(fù)雜數(shù)據(jù)環(huán)境下的識(shí)別效率.然而由于密數(shù)據(jù)通常具有較高的隨機(jī)性,如何提取有效的密文特征、密文特征構(gòu)建方法的創(chuàng)新,國(guó)內(nèi)外關(guān)于該方面的公開(kāi)研究較少,密文特征提取方式較為簡(jiǎn)單,因此特征所包含的密文信息有限.

      分組密碼算法以其易于標(biāo)準(zhǔn)化及運(yùn)算速度快等特點(diǎn)得到廣泛應(yīng)用,其安全性也一直備受關(guān)注.目前關(guān)于分組密碼算法攻擊的分析集中于差分密碼分析、線(xiàn)性密碼分析和強(qiáng)力攻擊[3].對(duì)分組密碼體制識(shí)別的研究,可以為現(xiàn)實(shí)中的密碼分析提供支持,同時(shí)也有助于密碼安全性評(píng)估.本文主要關(guān)注AES、Blowfish和Camellia 等多種安全性較高且被廣泛使用的分組密碼體制的識(shí)別任務(wù).基于隨機(jī)性測(cè)試提出的一類(lèi)新密文特征,并在由隨機(jī)森林算法構(gòu)成的分類(lèi)器中開(kāi)展分類(lèi)訓(xùn)練和測(cè)試.

      本文主要內(nèi)容如下:第1 節(jié)介紹密碼體制識(shí)別的相關(guān)概念和領(lǐng)域近年來(lái)的研究脈絡(luò)與成果,對(duì)于已有的主要工作及其方法作簡(jiǎn)要分析;第2 節(jié)簡(jiǎn)略介紹了本文所提方案的主要構(gòu)成部分;第3 節(jié)主要介紹基于隨機(jī)性測(cè)試的密文特征提取方法;第4 節(jié)給出完整的密碼體制識(shí)別方案;在第5 節(jié)展示實(shí)驗(yàn)結(jié)果并作分析;最后第6 節(jié)總結(jié)全文并展望后續(xù)工作.

      2 密碼體制識(shí)別基本原理

      密碼體制識(shí)別問(wèn)題首先涉及到待識(shí)別密碼體制集合即識(shí)別對(duì)象.當(dāng)識(shí)別對(duì)象確定后,即可對(duì)具體的識(shí)別問(wèn)題進(jìn)行研究,給出相應(yīng)的識(shí)別方案.而對(duì)方案效果的評(píng)價(jià)一般通過(guò)識(shí)別準(zhǔn)確率給出.文獻(xiàn)[13]將這些密碼體制識(shí)別問(wèn)題中的基本要素進(jìn)行整合,給出密碼體制識(shí)別及其識(shí)別方案的定義如下:

      定義1(密碼體制識(shí)別)考慮密碼體制集合M={m1,m2,···,mN},其中N為密碼體制數(shù)量.對(duì)于由任意密碼體制m∈M加密生成的密文文件F,密碼體制識(shí)別是指在可獲取文件內(nèi)容,但不知曉其密碼體制m的情形下,通過(guò)某一識(shí)別方案J,以一定的準(zhǔn)確率hJ識(shí)別出其密碼體制m的過(guò)程,它由三元組Γ =(M,J,hJ)完全刻畫(huà).識(shí)別準(zhǔn)確率在模式識(shí)別語(yǔ)意下有明確的意義,這里準(zhǔn)確率hJ是評(píng)價(jià)密碼體制識(shí)別方案的一種自然的度量.

      定義2(密碼體制識(shí)別方案)在密碼體制識(shí)別問(wèn)題 Γ 中,密碼體制識(shí)別方案由三元組J=(oper,fea,alg)刻畫(huà),其中oper 表示方案進(jìn)行密碼體制識(shí)別的工作流程,fea 表示方案對(duì)密文數(shù)據(jù)所提取的特征或特征集,alg 表示方案采取的識(shí)別算法.

      定義3(識(shí)別場(chǎng)景)在密碼體制識(shí)別方案J中,任意待識(shí)別密碼體制集合M即對(duì)應(yīng)一種識(shí)別場(chǎng)景,記作qM.

      根據(jù)識(shí)別場(chǎng)景和分類(lèi)需求的不同,密碼體制識(shí)別可以細(xì)分為簇分和單分.簇分是為了判斷密文所屬的密碼體制在較大層次下的類(lèi)別,如:判斷密文是分組密碼加密的還是公鑰密碼加密的,是分組密碼中的CBC 模式還是ECB 模式等.單分則是確定密碼體制的具體類(lèi)別,如ECB 模式下128 bits 密鑰長(zhǎng)度下AES 與Camellia 所加密密文的識(shí)別.

      在上述定義下,密碼體制識(shí)別問(wèn)題可記為Γ =(M,J,hJ),其中,密碼體制識(shí)別方案由三元組J=(oper,feaM,CA)刻畫(huà),其中oper 表示方案進(jìn)行密碼體制識(shí)別的工作流程、feaM表示方案對(duì)密文數(shù)據(jù)所提取的特征(與待識(shí)別密碼體制集合M相關(guān)),CA 為方案采取的分類(lèi)算法,在本文中即為后續(xù)提到的隨機(jī)森林算法.工作流程oper 由訓(xùn)練階段和測(cè)試階段的一系列步驟組成,以過(guò)程形式敘述如下:

      過(guò)程oper.

      訓(xùn)練階段

      步驟1.采集已知密碼體制的一組密文文件F1,F2,···,Fn,其中n為文件個(gè)數(shù);

      步驟2.對(duì)文件內(nèi)容數(shù)據(jù)進(jìn)行特征提取,得一組特征集FeaM={,,···,},其中,i=1,2,···,n是維數(shù)為d的向量,稱(chēng)d為特征維數(shù);

      步驟3.記n個(gè)文件的密碼體制標(biāo)簽(已知)形成一個(gè)n維向量Lab={lab1,lab2,···,labn},稱(chēng)二元組(FeaM,Lab)為帶標(biāo)簽的數(shù)據(jù);

      步驟4.將帶標(biāo)簽的數(shù)據(jù)(FeaM,Lab)提交分類(lèi)算法CA,進(jìn)行分類(lèi)模型的訓(xùn)練.

      測(cè)試階段

      步驟1.對(duì)一個(gè)待識(shí)別密文文件F的內(nèi)容數(shù)據(jù)進(jìn)行特征提取,得到d維特征fea;

      步驟2.將特征fea 輸入到在訓(xùn)練階段訓(xùn)練好的分類(lèi)模型中,后者給出密碼體制識(shí)別結(jié)果,即密碼體制標(biāo)簽lab.

      上述示例展示了形式化定義的基于機(jī)器學(xué)習(xí)的密碼體制識(shí)別方案,給定三元組J=(oper,fea,alg),即決定了一種密碼體制識(shí)別方案.圖1 是識(shí)別方案的訓(xùn)練與測(cè)試流程圖.

      3 特征提取

      在機(jī)器學(xué)習(xí)領(lǐng)域,模型的質(zhì)量通常由所選取的特征直接決定,特征對(duì)機(jī)器學(xué)習(xí)應(yīng)用的效果有重要影響[15].本文引言已經(jīng)介紹了密碼體制識(shí)別任務(wù)中常見(jiàn)的密文特征提取方式,現(xiàn)有的密文特征存在識(shí)別成功率較低、維數(shù)較高的缺點(diǎn).在文獻(xiàn)[11]中,研究者運(yùn)用隨機(jī)性測(cè)試返回值構(gòu)建的密文特征向量,對(duì)部分分組密碼體制取得了較好的區(qū)分結(jié)果.文獻(xiàn)[13]也選擇了NIST 標(biāo)準(zhǔn)中的5 種隨機(jī)性測(cè)試特征作為密文特征,并完成了多項(xiàng)密碼體制識(shí)別任務(wù).分析已有的研究結(jié)果可以發(fā)現(xiàn)部分隨機(jī)性測(cè)試返回值確實(shí)可以反映密文中存在的差異,并以此完成密碼體制識(shí)別任務(wù).下面本文將從隨機(jī)性測(cè)試的數(shù)學(xué)基礎(chǔ)出發(fā),介紹基于隨機(jī)性測(cè)試的密文特征提取方法.

      圖1 密碼體制識(shí)別方案流程圖Figure 1 Flowchart of cryptosystems recognition scheme

      3.1 隨機(jī)性測(cè)試的數(shù)學(xué)基礎(chǔ)

      目前眾多的隨機(jī)性檢測(cè)項(xiàng)目和方法,主要用于檢測(cè)密碼算法輸出序列的統(tǒng)計(jì)特性,其中影響較為廣泛的是美國(guó)商務(wù)部國(guó)家標(biāo)準(zhǔn)技術(shù)協(xié)會(huì)(NIST)于2001年5月公布的NIST FIPS140-2 標(biāo)準(zhǔn)[16]中定義的用于密碼系統(tǒng)安全性度量的諸多隨機(jī)性檢測(cè)方案.測(cè)試一個(gè)序列的隨機(jī)性,實(shí)質(zhì)上是檢驗(yàn)其是否是真隨機(jī)的或與真隨機(jī)序列之間的差距,而假設(shè)檢驗(yàn)[17]是隨機(jī)性測(cè)試的理論基礎(chǔ).在檢驗(yàn)時(shí),首先提出一個(gè)待檢驗(yàn)的原假設(shè),記作H0.相應(yīng)地,與原假設(shè)相反的假設(shè)稱(chēng)備擇假設(shè),記作H1.例如,在隨機(jī)性測(cè)試中一般設(shè)置原假設(shè)H0為:序列是隨機(jī)的;備擇假設(shè)H1:序列是非隨機(jī)的.對(duì)于每個(gè)檢驗(yàn)來(lái)說(shuō),若檢驗(yàn)結(jié)果接受原假設(shè)即表明待檢數(shù)據(jù)是隨機(jī)的,否則認(rèn)為待檢數(shù)據(jù)是非隨機(jī)的.檢驗(yàn)的具體步驟如下:

      步驟1.確定原假設(shè)H0和備擇假設(shè)H1;

      步驟2.根據(jù)H0的內(nèi)容選取合適的統(tǒng)計(jì)量X,并確定其分布;

      步驟3.按給定的顯著性水平α,查統(tǒng)計(jì)量X所對(duì)應(yīng)分布的分位數(shù)表,找出臨界值,確定拒絕域;

      步驟4.將由樣本計(jì)算出的統(tǒng)計(jì)量X的值與查得的臨界值進(jìn)行比較,從而作出判斷,即:若統(tǒng)計(jì)量X的值落入了拒絕域中,則拒絕H0,否則接受H0.

      此外,假設(shè)檢驗(yàn)會(huì)產(chǎn)生二類(lèi)錯(cuò)誤類(lèi)型,如表2 所示.

      表2 假設(shè)檢驗(yàn)錯(cuò)誤類(lèi)型Table 2 Types of hypothesis testing errors

      在實(shí)際應(yīng)用中,衡量隨機(jī)性的方法通常有2 種:門(mén)限值法和P-value 值法.這里以測(cè)試統(tǒng)計(jì)量X服從χ2分布為例來(lái)說(shuō)明.

      (1)門(mén)限值法.先做出分布的概率密度曲線(xiàn)如圖2,根據(jù)給定的顯著性水平α與相應(yīng)的α分位點(diǎn),再對(duì)統(tǒng)計(jì)量X與進(jìn)行比較,確定是拒絕還是接受原假設(shè).

      (2)P-value 值法.同樣作出χ2分布的概率密度曲線(xiàn),先求出統(tǒng)計(jì)量X,然后計(jì)算從X到無(wú)窮的積分,將積分結(jié)果(即P-value 值,圖中的陰影部分面積)與α進(jìn)行比較,確定接受原假設(shè)與否.本文中討論的隨機(jī)性測(cè)試正是通過(guò)選取的測(cè)試統(tǒng)計(jì)量來(lái)計(jì)算P-value 值,將P-value 值作為接受原假設(shè)的強(qiáng)度,其含義是:真隨機(jī)數(shù)的隨機(jī)性比待測(cè)序列弱的概率.如果其值為1 則是完全真隨機(jī)的,值為0 則是完全非隨機(jī)的.對(duì)于顯著性水平α,如果P-valueα,那么原假設(shè)被接受,序列是隨機(jī)的,反之被拒絕,序列是非隨機(jī)的.參數(shù)α也即是表2 中錯(cuò)誤類(lèi)型1 的概率,通常α的取值范圍是[0.001,0.01],如圖3 所示.

      圖2 卡方分布的概率密度曲線(xiàn)及其α 分位點(diǎn)Figure 2 Probability density curve of Chi-square distribution and its quantile of α

      圖3 卡方分布的概率密度曲線(xiàn)及其P-value 分位點(diǎn)Figure 3 Probability density curve of Chi-square distribution and its quantile of P-value

      3.2 密文特征提取方法

      同時(shí)在3.1 節(jié)中對(duì)隨機(jī)性測(cè)試的介紹中也可以了解到,NIST 隨機(jī)性測(cè)試對(duì)于序列隨機(jī)性的檢測(cè)具有較廣泛的覆蓋面,對(duì)于序列的全局或部分的隨機(jī)性均有針對(duì)性的測(cè)試.本文在保證隨機(jī)性測(cè)試返回值有意義的前提下,對(duì)密文進(jìn)行分塊或改變部分測(cè)試中的參數(shù),再分別運(yùn)行15 種NIST 隨機(jī)性測(cè)試,分別得到了密數(shù)據(jù)集數(shù)量不等的測(cè)試返回值也就是第2 節(jié)中提到的P-value 值,這些返回值就作為密數(shù)據(jù)的特征數(shù)據(jù).

      采集密文特征數(shù)據(jù)過(guò)程中,為保證隨機(jī)性測(cè)試返回值的有效性,在對(duì)密文分塊時(shí),對(duì)于測(cè)試的每個(gè)密文塊均做到符合各隨機(jī)性測(cè)試對(duì)序列長(zhǎng)度的要求.設(shè)置密文分塊個(gè)數(shù)有兩個(gè)依據(jù):(1)分塊后的密文塊大小必須符合隨機(jī)性測(cè)試所需的序列長(zhǎng)度要求(一些測(cè)試對(duì)于檢測(cè)序列的長(zhǎng)度要求較大,本文一般對(duì)密文不再分塊,或者只分較少塊);(2)在保證條件一的基礎(chǔ)上,由于文件大小為512 kb,為了方便測(cè)試,所以選擇的分塊數(shù)都是512 的因子,這樣在分塊后,可以減少密文數(shù)據(jù)的損失.考慮到本文試圖選取一些性能優(yōu)良的低維特征,為此對(duì)于密文分塊或特征維數(shù)均采取一定控制,一般不超過(guò)256 維.根據(jù)特征提取的方式和維數(shù)不同,上述特征可分為15 類(lèi)共計(jì)48 種特征,其具體提取方式如下(設(shè)待檢測(cè)序列長(zhǎng)度為n):

      (1)累積和測(cè)試(cumulative sums test).檢測(cè)序列中的部分和是否太大或太小,太大或太小均被認(rèn)為是非隨機(jī)的,該測(cè)試返回2 個(gè)值.該測(cè)試要求待檢測(cè)序列n100.分別將密文分為8、16、32、64和128 塊,執(zhí)行該測(cè)試提取得到的特征有:16 維、32 維、64 維、128 維和256 維共計(jì)5 種,分別簡(jiǎn)記為:Cus16、Cus32、Cus64、Cus128、Cus256.

      (2)線(xiàn)性復(fù)雜度測(cè)試(linear complexity test).采用Berlekamp-Massey 算法[18,19]計(jì)算每個(gè)子序列的線(xiàn)性復(fù)雜度,并與真隨機(jī)序列的復(fù)雜度作比較,以確定待測(cè)序列的隨機(jī)性,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列長(zhǎng)度n106,且子序列長(zhǎng)度M滿(mǎn)足500M5000,因此最多只能將密文分為4 塊.執(zhí)行該測(cè)試得到的特征有:4 維共計(jì)1 種,簡(jiǎn)記為:Lc4.

      (3)最長(zhǎng)1 游程測(cè)試(longest run of ones test).檢測(cè)序列中最長(zhǎng)1 游程的長(zhǎng)度與真隨機(jī)序列中最長(zhǎng)1 游程的長(zhǎng)度是否近似一致,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列長(zhǎng)度n128.分別將密文分為32、64、128 塊,執(zhí)行該測(cè)試得到的特征有:32 維、64 維和128 維共計(jì)3 種,分別簡(jiǎn)記為:Lro32、Lro64 和Lro128.

      (4)重疊塊測(cè)試(overlapping template matchings test).統(tǒng)計(jì)待測(cè)序列中,特定長(zhǎng)度的連續(xù)“1”的數(shù)目,并計(jì)算與真隨機(jī)序列的情況偏離,如果偏離較大則認(rèn)為序列是非隨機(jī)的,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列長(zhǎng)度n106,考慮到測(cè)試對(duì)于序列的長(zhǎng)度要求較大,對(duì)于該測(cè)試的密文序列未作分塊.更改測(cè)試中參數(shù)的取值,得到特征有:4 維(根據(jù)參數(shù)不同設(shè)置分為2 種),分別簡(jiǎn)記為:Otm4-1 和Otm4-2.

      (5)隨機(jī)游走測(cè)試(random excursions test).檢測(cè)序列中某個(gè)特定狀態(tài)出現(xiàn)的次數(shù)是否遠(yuǎn)遠(yuǎn)超過(guò)真隨機(jī)序列中的情況,如果超出較多,則認(rèn)為序列是非隨機(jī)的,該測(cè)試返回8 個(gè)值,要求待檢測(cè)序列長(zhǎng)度n106.將密文快分為1、2、3、4 塊,執(zhí)行該測(cè)試得到的特征有:8 維、16 維、24 維和32 維共計(jì)4 種,分別簡(jiǎn)記為:Re8、Re16、Re24 和Re32.

      (6)隨機(jī)游走測(cè)試變量(random excursions variant test).檢測(cè)序列中某一特定狀態(tài)在一個(gè)隨機(jī)游程中出現(xiàn)的次數(shù)與真隨機(jī)序列的偏離程度,如果偏離程度較大,則序列是非隨機(jī)的,該測(cè)試返回18 個(gè)值,要求待檢測(cè)序列長(zhǎng)度n106.將密文平均分割為1、2、3 和4 塊,執(zhí)行該測(cè)試得到的特征有:18 維、36 維、54 維、72 維共計(jì)4 種,分別簡(jiǎn)記為:Rev18、Rev36、Rev54 和Rev72.

      (7)近似熵測(cè)試(approximate entropy test).比較序列中長(zhǎng)度分別為m-bit 與(m?1)-bit 串出現(xiàn)的頻次,再與正態(tài)分布下的序列對(duì)比,從而確定序列隨機(jī)性,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列長(zhǎng)度m

      (8)全局通用測(cè)試(universal statistical test).檢測(cè)序列是否能在信息不丟失的情況下被明顯壓縮,通常一個(gè)不可被明顯壓縮的序列是隨機(jī)的,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列n387840.因此將密文平均分割為2、4 和8 塊,執(zhí)行測(cè)試得到的特征有:2 維、4 維和8 維共計(jì)3 種,分別簡(jiǎn)記為:Us2、Us4 和Us8.

      (9)離散傅里葉測(cè)試(discrete Fourier transform test).檢測(cè)序列中的周期性質(zhì),并與真隨機(jī)序列的周期性質(zhì)比較,通過(guò)二者之間的偏離程度來(lái)確定待測(cè)序列隨機(jī)性,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列n1000.將密文平均分割為32、64、128 和256 塊,執(zhí)行該測(cè)試得到的特征有:32 維、64 維、128維和256 維共計(jì)4 種,分別簡(jiǎn)記為:Dft32、Dft64、Dft128 和Dft256.

      (10)連續(xù)塊測(cè)試(serial test).檢測(cè)序列中所有m-bit 組合子串出現(xiàn)的次數(shù)是否與真隨機(jī)序列中的情況近似相同,如果是則序列符合隨機(jī)性要求,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列長(zhǎng)度m

      (11)二元矩陣秩測(cè)試(rank test).將序列構(gòu)造成若干矩陣,檢測(cè)序列中固定長(zhǎng)度子序列的線(xiàn)性相關(guān)性.如果線(xiàn)性相關(guān)性較小,則認(rèn)為序列是隨機(jī)的,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列長(zhǎng)度n>M×N,其中M和N分別為矩陣的行列數(shù)(NIST 默認(rèn)M=N=32).將密文平均分割為32、64 和96 塊,執(zhí)行該測(cè)試得到的特征有:32 維、64 維和96 維共計(jì)3 種,分別簡(jiǎn)記為:Rt32、Rt64 和Rt96.

      (12)非重疊塊測(cè)試(non-overlapping template matchings test).統(tǒng)計(jì)序列中,某特定模式出現(xiàn)的次數(shù),并計(jì)算與真隨機(jī)序列中的偏離,如果偏離較大則認(rèn)為序列是不隨機(jī)的.當(dāng)重疊模塊長(zhǎng)度為5 時(shí),該測(cè)試返回12 個(gè)值;當(dāng)重疊模塊長(zhǎng)度為6 時(shí),該測(cè)試返回20 個(gè)值;當(dāng)重疊模塊長(zhǎng)度為7 時(shí),該測(cè)試返回40 個(gè)值;當(dāng)重疊模塊長(zhǎng)度為8 時(shí),該測(cè)試返回74 個(gè)值;當(dāng)重疊模塊長(zhǎng)度為9 時(shí),該測(cè)試返回148 個(gè)值,該測(cè)試對(duì)待測(cè)序列未給明確規(guī)定,但是在測(cè)試樣例中,序列長(zhǎng)度為220.由于該測(cè)試不分塊即可返回?cái)?shù)十個(gè)返回值,故在本測(cè)試中不再對(duì)密文做分塊.分別選擇測(cè)試參數(shù)即重疊模塊長(zhǎng)度為:m=5,6,7,8,9,執(zhí)行該測(cè)試得到的特征有:12 維、20 維、40 維、74 維和148 維共計(jì)5 種,分別簡(jiǎn)記為:Nt12、Nt20、Nt40、Nt74和Nt148.

      (13)組內(nèi)頻率測(cè)試(block frequency test).功能是檢測(cè)待測(cè)序列中,所有非重疊的M-bit 塊內(nèi)的0 和1 的數(shù)量是否表現(xiàn)為隨機(jī)分布,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列n100 .將密文平均分割為32、64、128 和256 塊,執(zhí)行該測(cè)試得到的特征有:32 維、64 維、128 維和256 維共計(jì)4 種,分別簡(jiǎn)記為:Bf32、Bf64、Bf128 和Bf256.

      (14)頻率測(cè)試(frequency test).功能是檢測(cè)二進(jìn)制序列中,0 和1 的比例是否均衡,該測(cè)試返回1個(gè)值,要求待檢測(cè)序列n100.將密文平均分割為32、64、128 和256 塊,執(zhí)行該測(cè)試得到的特征有:32維、64 維、128 維和256 維共計(jì)4 種,分別簡(jiǎn)記為:Fre32、Fre64、Fre128 和Fre256.

      (15)游程測(cè)試(run test).功能是檢測(cè)二進(jìn)制序列中,游程分布情況是否符合隨機(jī)序列的要求,該測(cè)試返回1 個(gè)值,要求待檢測(cè)序列n100.將密文平均分割為32、64、128 和256 塊,執(zhí)行該測(cè)試得到的特征有:32 維、64 維、128 維和256 維共計(jì)4 種,分別簡(jiǎn)記為:Run32、Run64、Run128 和Run256.

      作為上述特征性能的對(duì)比,本文選擇了6 種在公開(kāi)文獻(xiàn)[4,7,12,13]中所使用的密文特征參與密碼體制識(shí)別.下面是這些特征的具體提取方法:

      (16)將密文分別按分組長(zhǎng)度為56 bits、128 bits、256 bits 分塊,計(jì)算所有塊中某一固定比特位的熵,形成維數(shù)與分塊長(zhǎng)度相同的特征,3 種特征分別記為:F_56b、F_128b、F_256b;

      (17)將密文分別按分組長(zhǎng)度為9 bits、10 bits、11 bits 分塊,計(jì)算不同組合形式的比特串出現(xiàn)頻率,形成維數(shù)分別為256、512 和1024 的特征,3 種特征分別記為:F_256、F_512、F_1024.

      4 識(shí)別方案

      本文首先基于上述特征開(kāi)展密文分類(lèi)、分組密碼工作模式分類(lèi)任務(wù),以驗(yàn)證基于隨機(jī)性特征在密數(shù)據(jù)分類(lèi)任務(wù)中的有效性.在此基礎(chǔ)上選擇AES、DES、3DES、IDEA、Blowfish 和Camellia 等6 種分組密碼作為密碼體制識(shí)別研究對(duì)象.在方法構(gòu)成層面,可分為兩個(gè)主要部分:密文特征提取和密碼體制識(shí)別分類(lèi)器的構(gòu)造.利用NIST 隨機(jī)性測(cè)試程序包中的15 種隨機(jī)性測(cè)試作為密文特征提取的方法基礎(chǔ),提取了45 種密文特征,同時(shí)也提取了部分已有的文獻(xiàn)中提到的密文特征作為新密文特征的參照對(duì)象.本文采用隨機(jī)森林算法構(gòu)造密碼體制識(shí)別分類(lèi)器,并以提取到的各類(lèi)密文特征數(shù)據(jù)作為分類(lèi)器的輸入,經(jīng)過(guò)數(shù)據(jù)的訓(xùn)練與測(cè)試階段,最終完成對(duì)密碼體制的識(shí)別任務(wù).

      隨機(jī)森林算法由Tin Kam Ho[20]提出,隨后經(jīng)由Leo Breiman 等人[21]對(duì)該算法做了擴(kuò)展.隨機(jī)森林是一個(gè)包含多個(gè)決策樹(shù)的分類(lèi)器,其輸出類(lèi)別是由個(gè)別樹(shù)輸出類(lèi)別的眾數(shù)而定(即所謂的投票方法).該算法對(duì)數(shù)據(jù)集的適應(yīng)能力強(qiáng),對(duì)于高維度的、離散和連續(xù)數(shù)據(jù)均能很好的處理,具有很好的抗噪聲能力,而且算法本身簡(jiǎn)單且易于并行化.在分類(lèi)實(shí)踐中得到廣泛應(yīng)用.本文基于機(jī)器學(xué)習(xí)中的隨機(jī)森林(random forest)算法構(gòu)造分類(lèi)器,所提識(shí)別方案分為兩個(gè)部分:訓(xùn)練部分和測(cè)試部分.其具體算法流程展示如下:

      基于隨機(jī)森林的密碼體制識(shí)別分類(lèi)器

      輸入:密碼體制數(shù)目k、每種密碼體制加密密文數(shù)量S,維數(shù)為Dim 的密文特征fea=(x1,···,xDim)組成的樣本集T=(C1,C2,···,Ck),其中Ci=(feai,1,feai,2,···,feai,S),Ci包含的是所有密碼體制i加密的密文的特征集.

      輸出:分類(lèi)結(jié)果密碼體制A1,A2,···,Ak.

      訓(xùn)練階段

      步驟1.輸入密文特征集T,包含kS個(gè)樣本,每個(gè)樣本表示一個(gè)密文特征,每個(gè)特征有Dim 個(gè)屬性,記為f1,f2,···,fDim;設(shè)定整數(shù)n

      步驟2.采用有放回取樣,隨機(jī)在T中抽取M個(gè)樣本,形成Bootstrap 樣本集T?,作為決策樹(shù)根節(jié)點(diǎn)處的樣本.

      步驟3.隨機(jī)從Dim 個(gè)屬性中選擇n個(gè)屬性作為單棵樹(shù)的候選屬性,符合條件n?Dim.再?gòu)倪@n個(gè)屬性中采用某種策略(如信息增益)來(lái)選擇1 個(gè)屬性作為該節(jié)點(diǎn)的分裂屬性.

      步驟4.決策樹(shù)形成過(guò)程中每個(gè)節(jié)點(diǎn)都要按照步驟2 來(lái)分裂,至不能夠再分裂為止.

      步驟5.重復(fù)步驟2–3 建立t棵決策樹(shù)構(gòu)成隨機(jī)森林.

      測(cè)試階段

      步驟1.對(duì)任一個(gè)輸入的特征向量feai,j,記錄其在每一棵樹(shù)上輸出分類(lèi)結(jié)果.

      步驟2.統(tǒng)計(jì)投票結(jié)果,票數(shù)最高的類(lèi)別就是feai,j的類(lèi)別標(biāo)簽.

      5 實(shí)驗(yàn)結(jié)果與分析

      5.1 實(shí)驗(yàn)對(duì)象及相關(guān)設(shè)置

      本文中實(shí)驗(yàn)選擇以由OpenSSL 密碼庫(kù)提供的AES、DES、3DES、IDEA、Blowfish 和Camellia 等6 種密碼體制,其基本設(shè)置如表3.基于隨機(jī)性測(cè)試的密文特征提取方法由C 程序?qū)崿F(xiàn),通過(guò)Rstudio 平臺(tái)上的隨機(jī)森林算法完成各類(lèi)文本的分類(lèi).實(shí)驗(yàn)所用到的明文來(lái)自圖片庫(kù)[22]隨機(jī)選擇的圖片拼接而成,隨后被平均分割成1000 份,每份大小均為512 kb.對(duì)于不同的分組密碼算法,凡未注明密鑰設(shè)置的均使用固定密鑰加密.實(shí)驗(yàn)過(guò)程中,待分析的密文樣本量均為1000 份,每份大小均為512 kb.對(duì)實(shí)驗(yàn)數(shù)據(jù)(即對(duì)密文文件提取特征所得到的數(shù)據(jù))進(jìn)行重復(fù)隨機(jī)子抽樣驗(yàn)證(repeat random sub-sampling validation),每次抽樣對(duì)每一密碼體制生成的密文文件提取得到的特征樣本,隨機(jī)抽樣75% 作為訓(xùn)練集,其余25% 作為測(cè)試集.以十折重復(fù)隨機(jī)子抽樣驗(yàn)證測(cè)試集識(shí)別的平均準(zhǔn)確率作為識(shí)別效果的度量.對(duì)6 種密碼體制的一一識(shí)別共計(jì)15 種識(shí)別場(chǎng)景進(jìn)行了分類(lèi)實(shí)驗(yàn).

      表3 7 種分組密碼體制的具體參數(shù)列表Table 3 Parameter setting of 7 block ciphers

      5.2 實(shí)驗(yàn)結(jié)果與分析

      5.2.1 明密文與分組密碼工作模式識(shí)別

      在開(kāi)展密碼體制識(shí)別前,本文首先測(cè)試基于隨機(jī)性測(cè)試密文特征在明密文識(shí)別和ECB 和CBC 兩種分組密碼工作模式識(shí)別任務(wù)中的有效性.其中,明密文識(shí)別實(shí)驗(yàn)是對(duì)ECB 模式下AES 加密密文與明文進(jìn)行分類(lèi),分組密碼工作模式識(shí)別則是對(duì)分別由ECB 和CBC 模式下的AES 加密密文的分類(lèi).為簡(jiǎn)化數(shù)據(jù)采集,該部分實(shí)驗(yàn)只選擇基于上述15 種隨機(jī)性測(cè)試的代表性密文特征作為分類(lèi)時(shí)采集的特征數(shù)據(jù).

      表4 明文與AES 加密密文的識(shí)別結(jié)果Table 4 Recognition results of plaintext and ciphertext encrypted by AES

      由表4 和表5 可以看出,多數(shù)基于隨機(jī)性測(cè)試特征均能夠以超過(guò)94% 的成功率實(shí)現(xiàn)對(duì)明密文的識(shí)別,以不低于82% 的成功率區(qū)分密文所使用的工作模式.考慮到明密文之間在統(tǒng)計(jì)上通常存在比較明顯的差異且密碼體制的工作模式對(duì)于密文隨機(jī)性也具有較大的影響,上述實(shí)驗(yàn)初步驗(yàn)證了這些特征在密數(shù)據(jù)分析中的有效性.

      5.2.2 分組密碼體制識(shí)別

      為進(jìn)一步驗(yàn)證基于隨機(jī)性測(cè)試特征在密碼體制識(shí)別中的作用,采集54 種基于隨機(jī)性測(cè)試的密文特征基礎(chǔ)上,對(duì)6 種分組密碼體質(zhì)進(jìn)行了一對(duì)一的分類(lèi)實(shí)驗(yàn),表6 展示各類(lèi)特征在15 種識(shí)別場(chǎng)景下的平均識(shí)別成功率和識(shí)別成功率的標(biāo)準(zhǔn)差,其中平均識(shí)別率表示密文特征其密碼體制識(shí)別性能的集中趨勢(shì),標(biāo)準(zhǔn)差則反映其識(shí)別性能的穩(wěn)定性.圖4 則以箱式圖的形式展示基于隨機(jī)性測(cè)試特征在不同識(shí)別情境下識(shí)別準(zhǔn)確率的波動(dòng)范圍與中位數(shù)的分布.

      表5 ECB 模式與CBC 模式下AES 加密密文的識(shí)別結(jié)果Table 5 Recognition results of ciphertext encrypted by AES ECB and AES CBC

      表6 基于隨機(jī)性測(cè)試的54 種密文特征的識(shí)別結(jié)果Table 6 Recognition performance of 54 features based on random tests

      圖4 54 種基于隨機(jī)性測(cè)試特征在各識(shí)別場(chǎng)景下識(shí)別準(zhǔn)確率的箱式圖Figure 4 Boxplot of 54 features’ recognition accuracies

      結(jié)合表6 和圖4,可以發(fā)現(xiàn),上述54 種密文特征的識(shí)別結(jié)果雖然存在較大差異,但總體上,多數(shù)特征能以高于隨機(jī)(圖3中的黑色水平線(xiàn))的識(shí)別成功率區(qū)分6 種分組密碼體制中的任意2 種密碼體制,且部分特征具有較高的識(shí)別準(zhǔn)確率.隨著維數(shù)增大,Aet 系列特征的識(shí)別準(zhǔn)確率波動(dòng)幅度也在增大,Bf 系列、Cus系列、Fre 系列、Run 系列、Us 系列、Rev 系列和Re 系列特征的識(shí)別準(zhǔn)確率隨著維數(shù)增大而提高,Dft系列、Nt 系列特征識(shí)別準(zhǔn)確率與維數(shù)的關(guān)系不明顯,Rt 系列特征的識(shí)別準(zhǔn)確率隨著維數(shù)增大呈現(xiàn)出下降趨勢(shì).從實(shí)驗(yàn)數(shù)據(jù)來(lái)看,基于隨機(jī)性測(cè)試的密文特征維數(shù)與其識(shí)別準(zhǔn)確率并沒(méi)有必然的關(guān)系.不同密碼體制加密的密文其隨機(jī)性存在差異,那么如果隨機(jī)性測(cè)試可以反映出這種差異,其對(duì)應(yīng)密文特征的識(shí)別準(zhǔn)確率就會(huì)高.而提取密文特征時(shí)密文分塊數(shù)、密文數(shù)據(jù)量顯然對(duì)于隨機(jī)性測(cè)試返回值的準(zhǔn)確性(即反映密文隨機(jī)性水平的能力)有一定影響,這種影響既可能是正向的也可能是反向的,其具體的作用機(jī)理有待進(jìn)一步驗(yàn)證.

      在對(duì)各密文特征在具體識(shí)別場(chǎng)景中的識(shí)別性能時(shí),也發(fā)現(xiàn)部分特征的識(shí)別成功率與所識(shí)別的密碼體制存在明顯的相關(guān)性關(guān)系.如表7,Bf 系列特征(表中選取Bf128)對(duì)于3DES、IDEA 的區(qū)分,Us 系列特征(表中選取Us8)對(duì)于Camellia 的區(qū)分,Fre 系列特征(表中選取Fre256)對(duì)于3DES 的區(qū)分均要優(yōu)于它們?cè)谄渌R(shí)別場(chǎng)景中的表現(xiàn).這幾類(lèi)特征對(duì)于某幾類(lèi)密碼具有較高的識(shí)別率,表明部分密碼體制加密密文確實(shí)存在一定的隨機(jī)性差異,也說(shuō)明了開(kāi)展密碼體制識(shí)別研究的可行性.

      表7 部分密文特征的具體識(shí)別結(jié)果Table 7 Recognition results of part features in different situations(%)

      5.2.3 與現(xiàn)有結(jié)果對(duì)比

      為驗(yàn)證基于隨機(jī)性測(cè)試的密文特征有效性,本文選擇了6 種公開(kāi)文獻(xiàn)中提出的密文特征,并在相同實(shí)驗(yàn)條件下開(kāi)展了密碼體制識(shí)別實(shí)驗(yàn).對(duì)比實(shí)驗(yàn)選擇的特征分為兩類(lèi):(1)基于比特熵的特征;(2)基于比特串概率的特征.

      由于本文所提出的54 種基于隨機(jī)性測(cè)試的密文特征識(shí)別性能差異較大,受篇幅所限,在表6 中識(shí)別性能相對(duì)較低的密文特征就不再與公開(kāi)文獻(xiàn)中的特征做對(duì)比.在表8 中,我們只選取基于隨機(jī)性測(cè)試的6 種密文特征與其它已有的6 種密文特征做對(duì)比.可以發(fā)現(xiàn),基于隨機(jī)性測(cè)試的6 種特征雖然在識(shí)別準(zhǔn)確率并不占優(yōu)勢(shì),但是其特征維數(shù)通常較低.例如Nt20 特征的識(shí)別準(zhǔn)確率與F_1024 的識(shí)別準(zhǔn)確率相差5% 左右,但是Nt20 特征的維數(shù)僅為后者的1/50,這也顯示出Nt20 特征具有數(shù)據(jù)存儲(chǔ)量小的優(yōu)勢(shì),對(duì)于提高大批量密數(shù)據(jù)的快速識(shí)別能力有一定的現(xiàn)實(shí)意義.

      表8 部分基于隨機(jī)性測(cè)試的密文特征與其它密文特征識(shí)別結(jié)果對(duì)比Table 8 NT series features and other features’ recognition results

      5.2.4 實(shí)驗(yàn)結(jié)果的假設(shè)檢驗(yàn)

      在上述基于機(jī)器學(xué)習(xí)的密碼體制識(shí)別方案中,分類(lèi)實(shí)驗(yàn)將在同等條件下運(yùn)行分類(lèi)算法十次所得結(jié)果的平均值作為分類(lèi)的最終結(jié)果.為驗(yàn)證分類(lèi)方法的準(zhǔn)確性,本文采用均值檢驗(yàn)法獨(dú)立兩樣本T-檢驗(yàn)[23]對(duì)各實(shí)驗(yàn)結(jié)果進(jìn)行檢驗(yàn).即:兩組不同特征的識(shí)別準(zhǔn)確率數(shù)據(jù),檢驗(yàn)一組總體均值是否大于對(duì)照組總體均值,這里假定兩個(gè)總體獨(dú)立地服從正態(tài)分布.相應(yīng)的假設(shè)檢驗(yàn)問(wèn)題為:H0:μ1=μ2?H1:μ1>μ2.

      將上述實(shí)驗(yàn)中十折的每一折數(shù)據(jù)記錄下來(lái)并作為一組數(shù)據(jù),同時(shí)生成一組以為均值的隨機(jī)數(shù)數(shù)據(jù).設(shè)置顯著性水平為0.01,檢測(cè)兩組數(shù)據(jù)的均值是否相等,驗(yàn)證實(shí)驗(yàn)數(shù)據(jù)的真實(shí)性.經(jīng)檢驗(yàn),在顯著性水平為0.01 的情況下,本文實(shí)驗(yàn)中涉及的所有數(shù)據(jù)的假設(shè)檢驗(yàn)結(jié)果均符合要求.

      6 總結(jié)與展望

      本文在已知密文條件下,以AES、DES、3DES、IDEA、Blowfish 和Camellia 等六類(lèi)典型分組密碼為識(shí)別分析對(duì)象,通過(guò)改變隨機(jī)性測(cè)試算法的提取方式與參數(shù)設(shè)置,提出了一系列分組密碼算法識(shí)別的新特征.以上述所提取的特征為分類(lèi)依據(jù),并在OpenSLL 密碼庫(kù)、VS2012 以及R 語(yǔ)言環(huán)境下進(jìn)行了實(shí)驗(yàn)仿真.實(shí)驗(yàn)表明,基于隨機(jī)性測(cè)試的密文特征能夠以較高的識(shí)別準(zhǔn)確率完成明密文識(shí)別和密碼體制工作模式的識(shí)別.對(duì)于難度較高的分組密碼體制識(shí)別,本文提出的54 種特征絕大多數(shù)也具有一定的識(shí)別性能,部分特征的識(shí)別性能接近或達(dá)到了目前已有的密文特征的水平.與現(xiàn)有的多數(shù)密文特征比較,基于隨機(jī)性測(cè)試的密文特征具有更低的維數(shù).此外,通過(guò)比較實(shí)驗(yàn)數(shù)據(jù),發(fā)現(xiàn)一些密文特征在不同識(shí)別場(chǎng)景下的識(shí)別準(zhǔn)確率與密碼體制存在一定的相關(guān)性,即對(duì)于某幾類(lèi)密碼體制具有較高的識(shí)別準(zhǔn)確率.基于隨機(jī)性測(cè)試的密文特征,在密碼體制識(shí)別中具有一定的有效性,因此作為改進(jìn)密文特征提取的一個(gè)新思路值得進(jìn)一步研究探索.

      本文的實(shí)驗(yàn)對(duì)象包含的密碼體制種類(lèi)有限,基于隨機(jī)性測(cè)試的密文特征在密碼體制識(shí)別中的適用性及其識(shí)別效果也需要結(jié)合密碼學(xué)中的相關(guān)理論做出嚴(yán)謹(jǐn)?shù)慕忉?同時(shí)對(duì)于隨機(jī)化密鑰設(shè)置和CBC 模式下的分組密碼體制識(shí)別也需要進(jìn)一步的研究探索.后續(xù)工作中,將針對(duì)更多識(shí)別情形下,基于隨機(jī)性測(cè)試的密文特征的提取方法,進(jìn)一步改進(jìn)識(shí)別分類(lèi)器的算法以提高密碼體制識(shí)別效率.

      猜你喜歡
      隨機(jī)性密文體制
      一種針對(duì)格基后量子密碼的能量側(cè)信道分析框架
      一種支持動(dòng)態(tài)更新的可排名密文搜索方案
      基于模糊數(shù)學(xué)的通信網(wǎng)絡(luò)密文信息差錯(cuò)恢復(fù)
      試論烏俄案對(duì)多邊貿(mào)易體制的維護(hù)
      淺析電網(wǎng)規(guī)劃中的模糊可靠性評(píng)估方法
      建立“大健康”體制是當(dāng)務(wù)之急
      為“三醫(yī)聯(lián)動(dòng)”提供體制保障
      考慮負(fù)荷與分布式電源隨機(jī)性的配電網(wǎng)無(wú)功優(yōu)化
      適用于隨機(jī)性電源即插即用的模塊化儲(chǔ)能電池柜設(shè)計(jì)
      建立高效的政府辦醫(yī)體制
      靖安县| 治多县| 华阴市| 砀山县| 上高县| 奉贤区| 沐川县| 哈尔滨市| 淅川县| 阆中市| 马鞍山市| 黄山市| 沧源| 汉沽区| 曲松县| 温宿县| 汽车| 鸡泽县| 凤台县| 黔东| 石棉县| 黄冈市| 紫金县| 青川县| 长海县| 怀远县| 岗巴县| 大同县| 长兴县| 老河口市| 慈溪市| 永州市| 广灵县| 磐安县| 建平县| 仁寿县| 大石桥市| 确山县| 茌平县| 浦江县| 定兴县|