• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于指令序列嵌入的安卓惡意應(yīng)用檢測(cè)框架

    2022-08-08 01:35:20孫才俊王偉忠何能強(qiáng)王之宇孫天寧張奕鵬
    信息安全研究 2022年8期
    關(guān)鍵詞:指令特征方法

    孫才俊 白 冰 王偉忠 何能強(qiáng) 王之宇 孫天寧 張奕鵬

    1(之江實(shí)驗(yàn)室智能網(wǎng)絡(luò)研究院 杭州 311121) 2(中國(guó)工業(yè)互聯(lián)網(wǎng)研究院 北京 100102) 3(國(guó)家互聯(lián)網(wǎng)應(yīng)急中心浙江分中心 杭州 310052)

    安卓是一款開(kāi)源的操作系統(tǒng),目前全球安卓活躍用戶數(shù)已達(dá)20億[1],它吸引大量使用者的同時(shí)也吸引了大量的惡意軟件開(kāi)發(fā)者.根據(jù)McAfee在2019年發(fā)布的移動(dòng)安全報(bào)告[2],與2017年相比,2018年與安卓銀行相關(guān)的惡意應(yīng)用增加了77%.根據(jù)奇虎360在2020年2月發(fā)布的惡意軟件報(bào)告[3],在2019年全年,360安全大腦攔截了9.5億次惡意軟件攻擊.因此,學(xué)術(shù)界提出了一系列檢測(cè)安卓惡意軟件的方法[4-5],基本思路是從應(yīng)用程序中提取1組描述其行為的特征,并利用提取的特征,采用適當(dāng)?shù)臋C(jī)器學(xué)習(xí)算法來(lái)識(shí)別惡意軟件.

    基于機(jī)器學(xué)習(xí)方法的安卓惡意軟件檢測(cè)通常依賴(lài)于訓(xùn)練樣本數(shù)據(jù)集.在訓(xùn)練過(guò)程中,檢測(cè)系統(tǒng)需要大量的樣本特征才能在預(yù)測(cè)中達(dá)到良好的效果.但由于惡意軟件及其變種數(shù)量眾多,為減少研究人員的工作量,必須使用可擴(kuò)展和自動(dòng)化的特征提取方法[6],實(shí)現(xiàn)大規(guī)模的惡意樣本識(shí)別.當(dāng)前,普遍采用的特征提取方法有靜態(tài)分析與動(dòng)態(tài)分析2種,對(duì)應(yīng)提取到的特征分別為靜態(tài)特征與動(dòng)態(tài)特征.靜態(tài)特征如應(yīng)用程序接口(API)調(diào)用、操作代碼(opcode)序列、權(quán)限請(qǐng)求、控制流或數(shù)據(jù)流,通過(guò)應(yīng)用靜態(tài)特征發(fā)現(xiàn)應(yīng)用可疑行為;動(dòng)態(tài)特征通過(guò)在模擬器或物理機(jī)上運(yùn)行指定的安卓樣本進(jìn)行提取,主要包含日志文件、網(wǎng)絡(luò)流量、文件系統(tǒng)訪問(wèn)、安卓系統(tǒng)交互等運(yùn)行時(shí)產(chǎn)生的行為特征[7-8].

    通常,靜態(tài)分析由于其高速處理能力,適合處理大規(guī)模樣本.然而,當(dāng)遇到使用復(fù)雜混淆技術(shù)(如加密、加殼)的應(yīng)用程序時(shí),靜態(tài)分析方法可能會(huì)失去其有效性,因?yàn)檫@些樣本的源代碼是加密和隱藏的.因此,研究人員通常采用動(dòng)態(tài)分析方法處理這些樣本.動(dòng)態(tài)分析方法可以繞過(guò)源代碼分析,直接在運(yùn)行時(shí)分析測(cè)試樣本的行為.然而,動(dòng)態(tài)分析的執(zhí)行通常基于固定的自動(dòng)化測(cè)試腳本,其測(cè)試覆蓋范圍不如靜態(tài)分析方法全面.此外,在某些情況下,測(cè)試工具可能無(wú)法觸發(fā)惡意行為,例如,缺少必要的系統(tǒng)事件或交互操作.此外,動(dòng)態(tài)分析需要運(yùn)行測(cè)試樣本來(lái)執(zhí)行特征提取,這一過(guò)程非常耗時(shí),需要大規(guī)模硬件設(shè)備作為支撐[9].

    傳統(tǒng)安卓惡意應(yīng)用檢測(cè)方法是從樣本中采集大量原始特征,然后訓(xùn)練分類(lèi)模型(包括常見(jiàn)的機(jī)器學(xué)習(xí)算法與神經(jīng)網(wǎng)絡(luò)).然而這些方法忽略了惡意應(yīng)用代碼自身所攜帶的語(yǔ)義信息,因此在準(zhǔn)確率方面還有待提高.鑒于此,Christodorescu等人[10]在2005年提出基于語(yǔ)義感知的惡意應(yīng)用檢測(cè)方法,用于檢測(cè)Windows惡意應(yīng)用.隨著Word2vec,Doc2vec等一系列自然語(yǔ)言分析工具的出現(xiàn),越來(lái)越多的研究人員將相關(guān)技術(shù)應(yīng)用到惡意應(yīng)用的檢測(cè)中,他們對(duì)樣本的原始特征進(jìn)行2次挖掘,采用分布式表征(distributed representation)[11]的方式表征惡意應(yīng)用特征語(yǔ)義,從而對(duì)惡意性進(jìn)行分析.Raghav等人[12]從安卓應(yīng)用的manifest文件與dex文件提取語(yǔ)義特征,用于應(yīng)用的惡意性判斷.根據(jù)類(lèi)似的研究思路,本文從安卓樣本的源代碼提取opcode指令序列,然后從指令序列中提取語(yǔ)義摘要進(jìn)行分析.

    本文方法提出的假設(shè)是代碼指令如同自然語(yǔ)言中的詞匯,代碼指令不僅包含豐富的語(yǔ)義,并且嚴(yán)格遵循編程語(yǔ)法.如果將自然語(yǔ)言處理中的嵌入(embedding)方法借鑒過(guò)來(lái),就可以計(jì)算出每個(gè)指令的嵌入向量,并且可以在高維空間中比較不同指令之間的相似性.進(jìn)一步,利用段落嵌入(paragraph embedding)算法,得出不同代碼片段的低維特征向量表示方法,比較不同代碼片段之間的空間距離,從而得出代碼行為相似性.基于上述假設(shè),本文提出一種基于指令序列嵌入的算法,用于發(fā)現(xiàn)代碼指令之間存在的隱藏結(jié)構(gòu).本文方法基于靜態(tài)分析手段,無(wú)需運(yùn)行應(yīng)用程序提取特征,計(jì)算開(kāi)銷(xiāo)低.特別地,本文對(duì)比多種機(jī)器學(xué)習(xí)算法,分析不同特征維度對(duì)惡意應(yīng)用識(shí)別系統(tǒng)的影響,并使用超參數(shù)優(yōu)化算法訓(xùn)練出最優(yōu)分類(lèi)模型,以有效、高效的方式判斷樣本是否具有惡意.

    本文的主要貢獻(xiàn)概括如下:

    1) 使用指令序列嵌入方法檢測(cè)安卓惡意應(yīng)用.指令序列嵌入方法借鑒自然語(yǔ)言處理中的嵌入原理,對(duì)代碼指令序列進(jìn)行嵌入,提取代碼中豐富的語(yǔ)義表達(dá).

    2) 使用average pooling算法計(jì)算樣本代碼的語(yǔ)義摘要.該摘要以向量形式表征樣本代碼行為,因而可以從數(shù)值角度反映樣本代碼行為語(yǔ)義.

    3) 通過(guò)大量實(shí)驗(yàn)證明了指令序列嵌入方法的有效性.在檢測(cè)惡意樣本過(guò)程中,本文方法的F1得分達(dá)到0.952.

    1 相關(guān)研究

    1.1 基于代碼特征的檢測(cè)方法

    Arp等人[9]提出一種輕量級(jí)的安卓惡意應(yīng)用檢測(cè)框架Drebin.Drebin對(duì)安卓應(yīng)用進(jìn)行靜態(tài)分析,從dex文件和manifest文件中收集特征,如使用權(quán)限、API調(diào)用以及組件調(diào)用意圖,用于構(gòu)建特征向量,最后采用支持向量機(jī)作為分類(lèi)模型.李劍等人[13]提出一種基于權(quán)限分析的安卓惡意應(yīng)用檢測(cè)方法,該方法從AndroidManifest.xml文件中提取權(quán)限特征,并使用特征選擇算法優(yōu)化特征,最終在多個(gè)機(jī)器學(xué)習(xí)算法上展開(kāi)實(shí)驗(yàn),取得了良好效果.王柯林等人[14]提出一種可對(duì)抗混淆的安卓惡意應(yīng)用檢測(cè)方法,該方法選用高危權(quán)限、敏感API、Service、Activity、Intent、短信發(fā)送頻率等作為特征,然后選擇多個(gè)機(jī)器學(xué)習(xí)分類(lèi)模型對(duì)混淆數(shù)據(jù)集進(jìn)行測(cè)試,最終證明該方法可有效對(duì)抗混淆技術(shù).Li等人[15]使用高風(fēng)險(xiǎn)API和高風(fēng)險(xiǎn)權(quán)限作為特征,通過(guò)分析,最終收集了237個(gè)重要特征,并且利用深度學(xué)習(xí)算法取得良好的識(shí)別效果.陳澤峰等人[16]提出一種基于多維特征協(xié)作的輕量級(jí)安卓惡意應(yīng)用檢測(cè)方法,該方法使用多級(jí)別的不同分類(lèi)模型實(shí)現(xiàn)對(duì)未知樣本的快速、精確檢測(cè),文中使用的特征包括應(yīng)用申請(qǐng)權(quán)限、運(yùn)行時(shí)權(quán)限,操作碼序列等,用于機(jī)器學(xué)習(xí)模型的訓(xùn)練.

    1.2 基于語(yǔ)義特征的檢測(cè)方法

    Raghav等人[12]提出一種基于文檔向量的安卓惡意應(yīng)用檢測(cè)方法.該研究分別從classes.dex和AndroidManifest.xml文件中提取頭部32000個(gè)字節(jié)作為樣本特征,之后使用PV-BoW算法生成這2個(gè)文件的文檔向量,最后使用機(jī)器學(xué)習(xí)與深度學(xué)習(xí)算法對(duì)應(yīng)用惡意性進(jìn)行判斷.Kakisim等人[17]提出一種基于連續(xù)操作碼嵌入的Windows惡意應(yīng)用檢測(cè)方法.該方法將連續(xù)的opcode以圖的形式進(jìn)行表達(dá),通過(guò)隨機(jī)游走算法選擇權(quán)重相對(duì)較高的一批opcode序列,將這批opcode序列進(jìn)行嵌入,接著選擇固定個(gè)數(shù)的向量作為樣本特征,最后使用深度學(xué)習(xí)算法對(duì)樣本進(jìn)行惡意性判斷.Alam等人[18]提出一種基于自然語(yǔ)言處理的安卓惡意應(yīng)用模式檢測(cè)方法,將安卓應(yīng)用程序代碼中的控制流類(lèi)比于自然語(yǔ)言中的詞匯,多個(gè)控制流組成自然語(yǔ)言中的1個(gè)句子,基于這種思想使用Doc2vec將樣本轉(zhuǎn)成向量形式,最后通過(guò)構(gòu)建相似度模型來(lái)判斷應(yīng)用惡意性.

    2 預(yù)備知識(shí)

    2.1 Word2vec模型

    Word2vec[19]是一種經(jīng)典的詞向量生成模型.詞嵌入(word embedding)是將自然語(yǔ)言中的符號(hào)轉(zhuǎn)換成數(shù)值形式的過(guò)程.詞向量則是詞嵌入之后輸出的數(shù)值表達(dá),詞向量模型基于自然語(yǔ)言中的1個(gè)概念,即1個(gè)詞的含義可以從其上下文語(yǔ)義環(huán)境推斷得出.Word2vec實(shí)現(xiàn)了詞的分布式表征表示方法,該方法訓(xùn)練出的詞向量維度更低,信息密度更高,相比于傳統(tǒng)的one-hot編碼方式,該方法在語(yǔ)義提煉與信息保留方面都有較大的提升.Word2vec在訓(xùn)練過(guò)程中,利用詞的上下文詞匯信息,使得訓(xùn)練出的嵌入模型語(yǔ)義信息更加豐富.Word2vec包含以下2個(gè)重要模型:

    2.1.1 CBOW模型

    CBOW模型使用中心詞匯前后的詞匯來(lái)預(yù)測(cè)中心詞,即模型的輸入為中心詞匯上下文對(duì)應(yīng)的詞向量,輸出則是中心詞匯的詞向量.CBOW模型設(shè)置1個(gè)滑動(dòng)窗口,每次滑動(dòng)時(shí)選擇中心詞匯作為輸出,滑動(dòng)窗口內(nèi)其他詞匯則是該中心詞匯的上下文,用作模型訓(xùn)練時(shí)的輸入.經(jīng)過(guò)多次迭代訓(xùn)練之后,模型中的隱含層就成了單詞的詞向量.

    2.1.2 Skip-gram模型

    Skip-gram與CBOW恰好相反,它是利用中心詞來(lái)預(yù)測(cè)上下文詞匯.Skip-gram同CBOW模型一樣,也有滑動(dòng)窗口概念,不同的是不是每次都預(yù)測(cè)1個(gè)單詞,而是使用其中1個(gè)單詞來(lái)預(yù)測(cè)滑動(dòng)窗口內(nèi)的其他單詞.在效率上,Skip-gram相較CBOW要低,但是對(duì)于出現(xiàn)頻率不高的單詞,其輸出更為準(zhǔn)確.

    圖1 ISEDroid工作流程

    2.2 Doc2vec模型

    Doc2vec[20]是Mikolov等人[21]基于Word2vec模型提出的一種擴(kuò)展模型,用于訓(xùn)練段落向量(paragraph vector).該模型用于訓(xùn)練一個(gè)能夠使用向量來(lái)表示不同文檔的嵌入模型,解決了Word2vec模型在生成句向量時(shí)語(yǔ)序丟失的問(wèn)題[21].和Word2vec類(lèi)似,Doc2vec也包含2種訓(xùn)練方式,分別為分布記憶段落向量和分布詞袋版本段落向量.

    2.2.1 分布記憶段落向量模型

    分布記憶段落向量模型(distributed memory model of paragraph vector, PV-DM)訓(xùn)練句向量的方法和Word2vec的CBOW詞向量訓(xùn)練方法類(lèi)似.在CBOW的基礎(chǔ)上,PV-DM加入段落向量的概念,每個(gè)段落向量對(duì)應(yīng)訓(xùn)練集的1段文本,段落向量可以認(rèn)為是1個(gè)詞向量,可以看作是句子的主題.每次訓(xùn)練時(shí)句子的主題都作為輸入的一部分來(lái)訓(xùn)練.如此,可以同時(shí)訓(xùn)練詞向量與句向量.

    2.2.2 分布詞袋版本段落向量模型

    分布詞袋版本段落向量模型(distributed bag of words version model of paragraph vector, PV-DBOW)和Word2vec的Skip-gram訓(xùn)練方法類(lèi)似.Skip-gram使用滑動(dòng)窗口內(nèi)的中間詞來(lái)預(yù)測(cè)上下文詞匯,PV-DBOW則是用段落向量來(lái)預(yù)測(cè)文本中任意詞匯的向量,其訓(xùn)練過(guò)程為:設(shè)置1個(gè)滑動(dòng)窗口,從段落中采樣該窗口的1段文字,再?gòu)倪@個(gè)窗口中隨機(jī)選擇1個(gè)詞匯作為輸出,輸入則是段落向量,然后不斷迭代訓(xùn)練模型.

    3 系統(tǒng)設(shè)計(jì)

    3.1 系統(tǒng)總覽

    本節(jié)詳細(xì)給出基于指令序列嵌入的安卓惡意應(yīng)用檢測(cè)方法的實(shí)現(xiàn)過(guò)程,將實(shí)現(xiàn)后的框架命名為ISEDroid(ISE, instruction sequence embedding).圖1為ISEDroid的工作流程圖,ISEdroid主要通過(guò)靜態(tài)代碼分析方法對(duì)惡意應(yīng)用進(jìn)行識(shí)別.對(duì)每個(gè)樣本通過(guò)apktool獲得dex文件后,ISEDroid使用baksmali反編譯dex文件獲得Smali代碼;從Smali代碼中提取出所有Java方法的Dalvik操作碼序列;接著將提取到的操作碼序列轉(zhuǎn)換成句向量;然后通過(guò)average pooling的方式從每個(gè)樣本的句向量獲得樣本的代碼行為摘要;最后將代碼行為摘要用于機(jī)器學(xué)習(xí)模型的訓(xùn)練和預(yù)測(cè).

    3.2 Smali特征提取

    Smali是安卓Dalvik字節(jié)碼反編譯之后的匯編程序,可以通過(guò)baksmali等反編譯工具轉(zhuǎn)換生成.一個(gè)反編譯后的Smali文件代表Java語(yǔ)言中的1個(gè)類(lèi),準(zhǔn)確說(shuō)為1個(gè).class文件.每個(gè)Java類(lèi)中的方法都由若干行字節(jié)碼指令序列組成,并且字節(jié)碼指令序列由Dalvik操作碼和操作數(shù)構(gòu)成.同類(lèi)惡意應(yīng)用的運(yùn)行時(shí)行為存在較大相似性,這意味著類(lèi)似邏輯的指令序列也存在較大的相似性,但由于2次開(kāi)發(fā)或者重打包等原因,指令行的操作數(shù)存在較大差異.因此,本文在提取Smali指令序列時(shí),只保留opcode.按照詞嵌入模型的做法,可以將每行的opcode作為1個(gè)單詞,1個(gè)Java方法內(nèi)的指令序列組成1段語(yǔ)句,該語(yǔ)句可以通過(guò)段落嵌入模型生成1段句向量,用于表示該代碼片段的語(yǔ)義.本文采用Smali解析工具,從每個(gè)樣本的Smali文件提取出所有的opcode序列,作為原始的樣本特征,用于后續(xù)指令嵌入步驟中使用.

    3.3 指令序列嵌入

    在進(jìn)行指令序列嵌入之前,首先需要構(gòu)建語(yǔ)料庫(kù),即從所有的樣本opcode序列中找出所有非重復(fù)序列.構(gòu)建過(guò)程如式(1)所示:

    (1)

    其中,N為用于生成語(yǔ)料庫(kù)的樣本總數(shù),si為第i個(gè)樣本所有的opcode序列.

    當(dāng)語(yǔ)料庫(kù)Dcorpus構(gòu)建完畢之后,使用Doc2vec模型進(jìn)行段落嵌入模型構(gòu)建.最后,采用average pooling算法處理樣本代碼片段的嵌入向量,實(shí)現(xiàn)過(guò)程如式(2)所示:

    (2)

    其中,Ω為1個(gè)樣本中提取的所有代碼片段向量,vi為該樣本第i個(gè)代碼片段向量,輸出結(jié)果V為樣本代碼行為的語(yǔ)義摘要,作為后續(xù)分類(lèi)模型的輸入.

    3.4 超參數(shù)優(yōu)化

    在機(jī)器學(xué)習(xí)模型的應(yīng)用中存在2類(lèi)參數(shù),分別為模型參數(shù)與模型超參數(shù).模型參數(shù)是模型內(nèi)部的變量,可以通過(guò)模型訓(xùn)練達(dá)到最優(yōu);而模型超參數(shù)為模型外部參數(shù),需要人工指定.在模型訓(xùn)練前對(duì)超參數(shù)進(jìn)行優(yōu)化極為重要,這是由于合適的超參數(shù)對(duì)模型的性能影響較大.模型的超參數(shù)優(yōu)化是機(jī)器學(xué)習(xí)技術(shù)應(yīng)用中的一個(gè)難點(diǎn).模型的超參數(shù)優(yōu)化是通過(guò)評(píng)估算法從多組候選超參數(shù)中選擇1組最佳超參數(shù)的過(guò)程,雖然超參數(shù)的數(shù)量有限,但由于其取值的范圍較大,將產(chǎn)生大量組合,對(duì)計(jì)算效率而言將是一大挑戰(zhàn).

    傳統(tǒng)的調(diào)參方式有Grid search和Random search.Grid search通過(guò)全空間掃描的方式進(jìn)行搜索,搜索過(guò)程極為耗時(shí),效率低下;而Random search則是從候選集中隨機(jī)抽選進(jìn)行評(píng)估,特點(diǎn)是速度快,但容易陷入局部最優(yōu).為了解決上述難題,本文使用啟發(fā)式超參數(shù)搜索框架Hyperopt.Hyperopt使用貝葉斯優(yōu)化算法來(lái)調(diào)整參數(shù),可在參數(shù)空間上進(jìn)行串行和并行搜索,該方法迭代次數(shù)少且收斂速度快.表1所示為ISEDroid所采用的機(jī)器學(xué)習(xí)算法的超參數(shù).在超參數(shù)搜索過(guò)程中,使用K折交叉驗(yàn)證方法選擇最佳超參數(shù),將K折交叉驗(yàn)證結(jié)果的均值作為模型表現(xiàn)的評(píng)估手段,從而對(duì)不同模型進(jìn)行對(duì)比.使用K折交叉驗(yàn)證方法,在一定程度上能夠消除輸出結(jié)果產(chǎn)生的偶然性.

    表1 ISEDroid所采用的機(jī)器學(xué)習(xí)算法的超參數(shù)

    續(xù)表1

    4 實(shí)驗(yàn)評(píng)估

    本節(jié)對(duì)ISEDroid的性能進(jìn)行系統(tǒng)評(píng)估,ISEDroid的實(shí)驗(yàn)工作在服務(wù)器上完成.該服務(wù)器的CPU型號(hào)為Intel?Xeon?Gold 6230R,擁有2個(gè)處理器、104個(gè)CPU核心,基準(zhǔn)時(shí)鐘頻率為2.1 GHz,內(nèi)存大小為503 GB,操作系統(tǒng)為Ubuntu 18.04 LST.本實(shí)驗(yàn)使用的Python庫(kù)有:hyperopt,版本0.2.7,為超參數(shù)優(yōu)化的模型庫(kù);scikit-learn,版本0.24.2,為多種常見(jiàn)機(jī)器學(xué)習(xí)模型的官方庫(kù);lightgbm,版本3.3.2,為L(zhǎng)ightGBMClassifier模型的官方庫(kù);xgboost,版本1.4.2,為XGBoostClassifier模型的官方庫(kù);gensim,版本4.1.2,為Doc2vec模型的官方庫(kù).

    4.1 數(shù)據(jù)集

    本文將從Google Play上獲得的1 462個(gè)有效安卓應(yīng)用程序作為良性應(yīng)用,標(biāo)記為Sg.為了從這些應(yīng)用程序中排除潛在的惡意應(yīng)用,本文將每個(gè)應(yīng)用程序發(fā)送給VirusTotal.VirusTotal囊括了70個(gè)以上的反病毒檢測(cè)引擎,當(dāng)且僅當(dāng)所有防病毒掃描程序未檢測(cè)到可疑行為時(shí),該應(yīng)用程序才被標(biāo)記為良性.對(duì)于惡意應(yīng)用程序,本文采用了Malgenome項(xiàng)目[22]提供的樣本集,該安卓惡意應(yīng)用樣本集由1 259個(gè)有效惡意應(yīng)用程序組成,標(biāo)記為Sm.為了方便后面的實(shí)驗(yàn),本文將上述2 721個(gè)樣本分成Strain和Stest,Strain包含1 314個(gè)良性樣本與1 133個(gè)惡意樣本,占總樣本數(shù)的90%;Stest包含148個(gè)良性樣本與126個(gè)惡意樣本,占總樣本數(shù)的10%.

    4.2 分類(lèi)模型選擇與優(yōu)化

    本節(jié)通過(guò)實(shí)驗(yàn)的方式詳細(xì)給出了ISEDroid執(zhí)行過(guò)程,并且通過(guò)特征提取、模型選擇以及超參數(shù)優(yōu)化等一系列方法,訓(xùn)練出1個(gè)最優(yōu)的惡意應(yīng)用分類(lèi)模型.在本實(shí)驗(yàn)中,分別從樣本集Strain和Stest中提取Smali代碼片段,執(zhí)行提取特征操作.提取后的代碼片段長(zhǎng)度分布如圖2所示:

    圖2 樣本內(nèi)Smali片段數(shù)以及代碼序列中指令數(shù)分布

    本文使用式(1)在訓(xùn)練集Strain上提取數(shù)據(jù)集語(yǔ)料庫(kù),然后使用Doc2vec對(duì)語(yǔ)料庫(kù)進(jìn)行數(shù)據(jù)集的構(gòu)建,Doc2vec使用的訓(xùn)練模型為gensim默認(rèn)選項(xiàng),即PV-DM.訓(xùn)練出對(duì)應(yīng)的句向量生成模型.接著,對(duì)每個(gè)樣本代碼片段的句向量使用式(2)求均值,得出該樣本代碼行為的語(yǔ)義摘要.將樣本轉(zhuǎn)化成向量形式,用于構(gòu)建特征矩陣,本文將此特征矩陣命名為數(shù)據(jù)集Dtrain.

    圖3 模型超參數(shù)優(yōu)化迭代時(shí)損失函數(shù)收斂過(guò)程

    當(dāng)獲得優(yōu)化后的超參數(shù)之后,本文將該最優(yōu)模型放到訓(xùn)練集Dtrain上進(jìn)行訓(xùn)練,以獲得最終的分類(lèi)模型.為對(duì)比各個(gè)模型最終表現(xiàn),本文使用測(cè)試集Dtest作為驗(yàn)證數(shù)據(jù)集.對(duì)Dtest進(jìn)行預(yù)測(cè)時(shí)采用F1分?jǐn)?shù)作為評(píng)估指標(biāo),結(jié)果如表2所示.表2示出不同機(jī)器學(xué)習(xí)算法在不同語(yǔ)義摘要向量維數(shù)的測(cè)試集上的F1分?jǐn)?shù).可以看出,Graident Boosting,LightGBM以及XGBoost均達(dá)到0.952的F1分?jǐn)?shù).鑒于特征維度越高,計(jì)算用時(shí)越長(zhǎng),因此選用XGBoost作為最優(yōu)分類(lèi)器,數(shù)據(jù)集采用的特征維數(shù)為150.

    表2 基于不同特征維數(shù)的Dtest的模型評(píng)估結(jié)果

    4.3 同類(lèi)研究對(duì)比

    為了進(jìn)一步驗(yàn)證ISEDroid的有效性,本文將ISEDroid與Raghav等人[12]、李劍等人[13]的方案進(jìn)行對(duì)比.采用數(shù)據(jù)集Dtrain作為訓(xùn)練集,選用AUC(area under curve)作為表現(xiàn)評(píng)估指標(biāo),將Dtest作為測(cè)試集.本實(shí)驗(yàn)中,ISEDroid選擇模型XGBoost,特征維數(shù)為150;Raghav等人采用的分類(lèi)模型為常規(guī)CNN網(wǎng)絡(luò),李劍等人采用的分類(lèi)模型為隨機(jī)森林.實(shí)驗(yàn)結(jié)果如圖4所示,可以看出,ISEDroid的AUC得分明顯優(yōu)于Raghav等人的方案,略優(yōu)于李劍等人的方案.

    圖4 本文方案與其他2種方案的對(duì)比結(jié)果

    5 總 結(jié)

    針對(duì)現(xiàn)有安卓惡意應(yīng)用日益增多的問(wèn)題,本文提出一種輕量化的基于指令序列嵌入的安卓惡意應(yīng)用檢測(cè)框架ISEDroid.該框架利用自然語(yǔ)言處理中的嵌入模型提取代碼中豐富的語(yǔ)義表達(dá),通過(guò)average pooling算法得出樣本代碼行為的語(yǔ)義摘要.通過(guò)基于貝葉斯算法的超參數(shù)優(yōu)化框架優(yōu)化不同模型.通過(guò)實(shí)驗(yàn),本文選擇XGBoost作為最優(yōu)模型,并取得了0.952的F1分?jǐn)?shù).在與同類(lèi)研究對(duì)比實(shí)驗(yàn)中,ISEDroid也取得了不錯(cuò)的表現(xiàn).ISEDroid為安卓惡意應(yīng)用檢測(cè)提供了有價(jià)值的研究方向.

    猜你喜歡
    指令特征方法
    聽(tīng)我指令:大催眠術(shù)
    如何表達(dá)“特征”
    不忠誠(chéng)的四個(gè)特征
    ARINC661顯控指令快速驗(yàn)證方法
    LED照明產(chǎn)品歐盟ErP指令要求解讀
    抓住特征巧觀察
    可能是方法不對(duì)
    用對(duì)方法才能瘦
    Coco薇(2016年2期)2016-03-22 02:42:52
    四大方法 教你不再“坐以待病”!
    Coco薇(2015年1期)2015-08-13 02:47:34
    捕魚(yú)
    有码 亚洲区| 麻豆av噜噜一区二区三区| 日韩中字成人| 亚洲成人中文字幕在线播放| 天美传媒精品一区二区| 久久99热6这里只有精品| 久久这里有精品视频免费| av天堂中文字幕网| 国内揄拍国产精品人妻在线| 69av精品久久久久久| 日本黄色片子视频| 不卡视频在线观看欧美| 亚洲激情五月婷婷啪啪| 国产视频首页在线观看| 国产黄色视频一区二区在线观看| 99热这里只有是精品50| 日本免费在线观看一区| 美女国产视频在线观看| 亚洲av免费高清在线观看| 国产在视频线在精品| 久久久久久久久久久免费av| 九九久久精品国产亚洲av麻豆| 国产av国产精品国产| 亚洲成人一二三区av| 午夜免费男女啪啪视频观看| 亚洲乱码一区二区免费版| 久久久久久国产a免费观看| 五月天丁香电影| 又黄又爽又刺激的免费视频.| 波野结衣二区三区在线| 在线免费观看的www视频| av国产久精品久网站免费入址| 亚洲不卡免费看| 黄色配什么色好看| 色综合亚洲欧美另类图片| 卡戴珊不雅视频在线播放| 欧美 日韩 精品 国产| 成人一区二区视频在线观看| 日韩视频在线欧美| 黄色欧美视频在线观看| 免费看光身美女| 插逼视频在线观看| 亚洲乱码一区二区免费版| 国产av在哪里看| 男女啪啪激烈高潮av片| 人人妻人人澡欧美一区二区| 国产成人91sexporn| 九色成人免费人妻av| 天美传媒精品一区二区| 亚洲欧美清纯卡通| 亚洲精品成人av观看孕妇| 亚洲精品乱码久久久v下载方式| 一级毛片aaaaaa免费看小| 免费看光身美女| 亚洲欧美一区二区三区黑人 | 国产av在哪里看| 搡老乐熟女国产| 久久精品夜色国产| 国产一区二区三区综合在线观看 | 男女边摸边吃奶| 麻豆国产97在线/欧美| 精品一区二区三区视频在线| 欧美潮喷喷水| 婷婷色麻豆天堂久久| 一级毛片电影观看| 最近的中文字幕免费完整| 亚洲av中文字字幕乱码综合| 亚洲精品日韩在线中文字幕| 久久99热这里只频精品6学生| 女人被狂操c到高潮| 伦精品一区二区三区| 亚洲欧美日韩无卡精品| 亚洲aⅴ乱码一区二区在线播放| 欧美极品一区二区三区四区| 国产有黄有色有爽视频| 国产国拍精品亚洲av在线观看| 亚洲欧美中文字幕日韩二区| 国产精品不卡视频一区二区| 日本色播在线视频| 亚洲欧美日韩卡通动漫| 老师上课跳d突然被开到最大视频| 九九在线视频观看精品| 国产一区二区亚洲精品在线观看| 麻豆精品久久久久久蜜桃| 色5月婷婷丁香| 国产精品无大码| 免费观看性生交大片5| 极品教师在线视频| 伦理电影大哥的女人| 亚洲欧美成人综合另类久久久| 性插视频无遮挡在线免费观看| 国产在线一区二区三区精| 精品国产一区二区三区久久久樱花 | 麻豆精品久久久久久蜜桃| 国产伦一二天堂av在线观看| 日韩不卡一区二区三区视频在线| 国产淫片久久久久久久久| av专区在线播放| 国产黄色免费在线视频| 免费观看无遮挡的男女| 99热这里只有是精品50| 人人妻人人澡欧美一区二区| 在线观看免费高清a一片| 国产乱人偷精品视频| 99视频精品全部免费 在线| 国产一区亚洲一区在线观看| 青春草国产在线视频| 精品少妇黑人巨大在线播放| 美女主播在线视频| 国产精品熟女久久久久浪| 国产激情偷乱视频一区二区| 亚洲欧美精品专区久久| 亚洲精品影视一区二区三区av| av在线老鸭窝| 日韩av不卡免费在线播放| 青春草亚洲视频在线观看| 成人鲁丝片一二三区免费| 久久鲁丝午夜福利片| 亚洲伊人久久精品综合| 三级毛片av免费| 国产成人一区二区在线| 精品一区二区免费观看| 热99在线观看视频| 51国产日韩欧美| 人妻一区二区av| eeuss影院久久| 成人无遮挡网站| 国产免费又黄又爽又色| 亚洲成人精品中文字幕电影| 一区二区三区乱码不卡18| 成人美女网站在线观看视频| 街头女战士在线观看网站| 搡老妇女老女人老熟妇| 国产精品麻豆人妻色哟哟久久 | 国产单亲对白刺激| 波野结衣二区三区在线| av一本久久久久| 啦啦啦啦在线视频资源| 国产老妇女一区| 国产亚洲91精品色在线| 亚洲精品中文字幕在线视频 | 视频中文字幕在线观看| 观看免费一级毛片| 国产三级在线视频| 亚洲综合精品二区| 中国美白少妇内射xxxbb| eeuss影院久久| 春色校园在线视频观看| 国产精品人妻久久久久久| 亚洲乱码一区二区免费版| 欧美成人a在线观看| 一级爰片在线观看| 亚洲精品成人久久久久久| 一区二区三区免费毛片| 老师上课跳d突然被开到最大视频| 久久久久久久久久久免费av| 久久午夜福利片| 男女视频在线观看网站免费| 最近2019中文字幕mv第一页| 精品99又大又爽又粗少妇毛片| 午夜福利成人在线免费观看| 久久鲁丝午夜福利片| 午夜福利在线观看免费完整高清在| 亚洲成人中文字幕在线播放| 青春草亚洲视频在线观看| 成年免费大片在线观看| 国产成人午夜福利电影在线观看| 亚洲精品亚洲一区二区| 最近视频中文字幕2019在线8| 午夜老司机福利剧场| 国产片特级美女逼逼视频| 午夜视频国产福利| 国产乱人视频| 综合色av麻豆| 狂野欧美白嫩少妇大欣赏| 久久精品国产亚洲av天美| 日韩成人伦理影院| 两个人的视频大全免费| 亚洲av男天堂| 日本欧美国产在线视频| 成人一区二区视频在线观看| 亚洲激情五月婷婷啪啪| 中国美白少妇内射xxxbb| 亚洲成人精品中文字幕电影| 日韩av在线大香蕉| 超碰97精品在线观看| 少妇熟女aⅴ在线视频| 精品不卡国产一区二区三区| 亚洲成人中文字幕在线播放| 美女大奶头视频| 在线观看美女被高潮喷水网站| 麻豆av噜噜一区二区三区| 亚洲无线观看免费| av播播在线观看一区| 看非洲黑人一级黄片| av一本久久久久| 亚洲av免费高清在线观看| 久久精品久久久久久久性| 亚洲性久久影院| 久久99蜜桃精品久久| 一二三四中文在线观看免费高清| 成人亚洲精品av一区二区| 欧美日韩综合久久久久久| 美女国产视频在线观看| 一区二区三区四区激情视频| 久久精品夜色国产| 夜夜爽夜夜爽视频| 亚洲经典国产精华液单| 亚洲av.av天堂| 亚洲综合精品二区| av线在线观看网站| av专区在线播放| 色网站视频免费| 一边亲一边摸免费视频| 国产麻豆成人av免费视频| 中文资源天堂在线| 91久久精品电影网| 亚洲欧洲国产日韩| av在线播放精品| 成人二区视频| 国产在线男女| 国产一区二区在线观看日韩| 少妇猛男粗大的猛烈进出视频 | 亚洲va在线va天堂va国产| 免费黄网站久久成人精品| 九草在线视频观看| 国内揄拍国产精品人妻在线| 国产在视频线精品| 天堂av国产一区二区熟女人妻| 亚洲真实伦在线观看| 高清av免费在线| 久久韩国三级中文字幕| 久久99热6这里只有精品| 中文资源天堂在线| 精品久久久久久久久亚洲| 色播亚洲综合网| 丝瓜视频免费看黄片| 欧美+日韩+精品| 日韩人妻高清精品专区| 亚洲欧洲国产日韩| 国产亚洲av嫩草精品影院| 日韩电影二区| 黄色配什么色好看| 成人毛片60女人毛片免费| 亚洲18禁久久av| 99久久精品国产国产毛片| 欧美变态另类bdsm刘玥| 91av网一区二区| 一区二区三区免费毛片| 99热这里只有精品一区| 小蜜桃在线观看免费完整版高清| 国产精品99久久久久久久久| 美女大奶头视频| 综合色丁香网| 欧美成人午夜免费资源| 亚洲国产高清在线一区二区三| 亚洲欧洲日产国产| 少妇熟女欧美另类| 波多野结衣巨乳人妻| 成人毛片a级毛片在线播放| 亚洲av成人av| 韩国高清视频一区二区三区| 伦精品一区二区三区| 97人妻精品一区二区三区麻豆| 性插视频无遮挡在线免费观看| 国产单亲对白刺激| 白带黄色成豆腐渣| 亚洲精品乱久久久久久| 秋霞在线观看毛片| 国产成人精品福利久久| 午夜福利在线在线| 免费大片18禁| 人妻系列 视频| 91精品一卡2卡3卡4卡| 少妇人妻一区二区三区视频| av在线天堂中文字幕| 午夜久久久久精精品| 亚洲精品aⅴ在线观看| 国产精品爽爽va在线观看网站| 亚洲精品456在线播放app| 久久鲁丝午夜福利片| 色吧在线观看| 人妻系列 视频| 亚洲三级黄色毛片| 两个人的视频大全免费| 精品一区在线观看国产| 国产精品熟女久久久久浪| 国产高清三级在线| av播播在线观看一区| 插阴视频在线观看视频| 日韩在线高清观看一区二区三区| 久久精品夜夜夜夜夜久久蜜豆| 一本一本综合久久| 亚洲人成网站高清观看| h日本视频在线播放| 国产老妇女一区| 色综合站精品国产| 91精品国产九色| 精品99又大又爽又粗少妇毛片| 国产黄片美女视频| 精品国产三级普通话版| 乱人视频在线观看| 51国产日韩欧美| 老司机影院毛片| av在线天堂中文字幕| 国产乱人偷精品视频| 国产乱人视频| 国产精品久久久久久av不卡| 国产激情偷乱视频一区二区| 国产不卡一卡二| 亚洲欧美中文字幕日韩二区| 国产毛片a区久久久久| 国产欧美另类精品又又久久亚洲欧美| 日韩一区二区三区影片| 波野结衣二区三区在线| 久久久国产一区二区| 99热6这里只有精品| 免费看光身美女| eeuss影院久久| 国产黄片视频在线免费观看| 亚洲美女搞黄在线观看| 高清午夜精品一区二区三区| or卡值多少钱| 国产精品久久久久久久久免| 亚洲第一区二区三区不卡| 综合色av麻豆| 亚洲精品一区蜜桃| 天堂中文最新版在线下载 | 夫妻性生交免费视频一级片| 亚洲最大成人av| 国产亚洲av片在线观看秒播厂 | 欧美精品国产亚洲| 在线免费观看不下载黄p国产| 亚洲无线观看免费| 婷婷色综合大香蕉| 免费观看无遮挡的男女| 国产色爽女视频免费观看| 久久这里只有精品中国| 免费黄网站久久成人精品| 亚洲精品成人久久久久久| 超碰97精品在线观看| 亚洲真实伦在线观看| 亚洲精品成人av观看孕妇| 日韩一本色道免费dvd| 国内精品宾馆在线| 色网站视频免费| 一区二区三区四区激情视频| 白带黄色成豆腐渣| 久久午夜福利片| 国产精品1区2区在线观看.| 卡戴珊不雅视频在线播放| 国产毛片a区久久久久| 久久精品久久精品一区二区三区| 天天一区二区日本电影三级| 舔av片在线| 天堂av国产一区二区熟女人妻| 九色成人免费人妻av| 国产淫语在线视频| 色哟哟·www| 国产伦精品一区二区三区四那| 久久久国产一区二区| 久久久久久久亚洲中文字幕| 高清av免费在线| 日韩电影二区| av一本久久久久| 看黄色毛片网站| 亚洲最大成人av| 97超碰精品成人国产| 亚洲精品国产成人久久av| 少妇的逼水好多| 国产亚洲最大av| 成人午夜精彩视频在线观看| 青春草亚洲视频在线观看| 中国美白少妇内射xxxbb| 成人漫画全彩无遮挡| 中国美白少妇内射xxxbb| 偷拍熟女少妇极品色| 国产成人一区二区在线| 国精品久久久久久国模美| 成人高潮视频无遮挡免费网站| 听说在线观看完整版免费高清| 少妇的逼水好多| 久久久精品欧美日韩精品| 欧美日本视频| 校园人妻丝袜中文字幕| 欧美激情久久久久久爽电影| 欧美xxxx黑人xx丫x性爽| 三级男女做爰猛烈吃奶摸视频| av国产久精品久网站免费入址| 亚洲成人av在线免费| 一本久久精品| 国产精品综合久久久久久久免费| 秋霞在线观看毛片| 国产 一区精品| 欧美日韩亚洲高清精品| 亚洲国产精品专区欧美| 黄色欧美视频在线观看| 综合色av麻豆| 天天一区二区日本电影三级| 久久午夜福利片| 在线天堂最新版资源| 99久国产av精品国产电影| 人妻夜夜爽99麻豆av| 熟女人妻精品中文字幕| 免费高清在线观看视频在线观看| 一级av片app| 在线观看一区二区三区| 观看免费一级毛片| 国产精品三级大全| 国产成人一区二区在线| 国产成人a∨麻豆精品| 成人亚洲欧美一区二区av| 禁无遮挡网站| 22中文网久久字幕| 最近最新中文字幕免费大全7| 国产精品蜜桃在线观看| 3wmmmm亚洲av在线观看| 直男gayav资源| 日韩欧美三级三区| 美女被艹到高潮喷水动态| 久久久久久久午夜电影| 亚洲性久久影院| 国产av国产精品国产| av天堂中文字幕网| 亚洲精品日本国产第一区| 男女边摸边吃奶| 欧美3d第一页| 精品久久久久久电影网| 成人美女网站在线观看视频| 国产亚洲最大av| 内射极品少妇av片p| 一二三四中文在线观看免费高清| h日本视频在线播放| 最近手机中文字幕大全| 在线观看av片永久免费下载| 婷婷色av中文字幕| 国产伦精品一区二区三区视频9| 国产在视频线在精品| 欧美精品国产亚洲| 久久亚洲国产成人精品v| 校园人妻丝袜中文字幕| 精品不卡国产一区二区三区| 成年人午夜在线观看视频 | 大香蕉97超碰在线| 亚洲精品视频女| 嘟嘟电影网在线观看| 日韩制服骚丝袜av| 免费人成在线观看视频色| 中国国产av一级| 黄色一级大片看看| 亚洲综合精品二区| 亚洲精品乱码久久久久久按摩| 啦啦啦啦在线视频资源| 免费av毛片视频| 成人综合一区亚洲| 久久综合国产亚洲精品| 夫妻性生交免费视频一级片| 成人性生交大片免费视频hd| 街头女战士在线观看网站| 九九爱精品视频在线观看| 国产成年人精品一区二区| 亚洲人成网站在线观看播放| 欧美激情在线99| 肉色欧美久久久久久久蜜桃 | 欧美日本视频| 亚洲高清免费不卡视频| 中文天堂在线官网| 嘟嘟电影网在线观看| 美女国产视频在线观看| 午夜视频国产福利| 欧美+日韩+精品| 精品国产三级普通话版| 亚洲一区高清亚洲精品| 天天躁夜夜躁狠狠久久av| 日韩亚洲欧美综合| 人体艺术视频欧美日本| 国产高清有码在线观看视频| 国产伦理片在线播放av一区| 有码 亚洲区| 久久精品熟女亚洲av麻豆精品 | 久久久色成人| 国产免费福利视频在线观看| 国产精品一二三区在线看| 在线观看一区二区三区| 日韩电影二区| 91在线精品国自产拍蜜月| 国产老妇女一区| 最近2019中文字幕mv第一页| 久久久久精品久久久久真实原创| 欧美一级a爱片免费观看看| 99九九线精品视频在线观看视频| .国产精品久久| 简卡轻食公司| 看非洲黑人一级黄片| 国产成人a区在线观看| 嫩草影院精品99| 网址你懂的国产日韩在线| 在现免费观看毛片| 日韩欧美精品v在线| 精品人妻一区二区三区麻豆| 成人特级av手机在线观看| 99久久九九国产精品国产免费| 精品欧美国产一区二区三| 国产午夜精品久久久久久一区二区三区| 五月伊人婷婷丁香| 一级爰片在线观看| 少妇裸体淫交视频免费看高清| 岛国毛片在线播放| 久久久久精品性色| 日韩伦理黄色片| 国产成人a区在线观看| 深爱激情五月婷婷| 精品国产一区二区三区久久久樱花 | 天天躁夜夜躁狠狠久久av| 午夜福利成人在线免费观看| 日韩av免费高清视频| 人妻制服诱惑在线中文字幕| 五月天丁香电影| 哪个播放器可以免费观看大片| 久久久久久久亚洲中文字幕| 一个人免费在线观看电影| 欧美三级亚洲精品| 一级av片app| 日韩三级伦理在线观看| 精品少妇黑人巨大在线播放| 99久国产av精品国产电影| 日韩欧美精品v在线| 久久久久久久亚洲中文字幕| 一夜夜www| 亚洲av日韩在线播放| 99久国产av精品| 亚洲av福利一区| 久久精品国产亚洲av涩爱| 春色校园在线视频观看| 国产真实伦视频高清在线观看| 丝袜喷水一区| 校园人妻丝袜中文字幕| 午夜福利网站1000一区二区三区| 成人亚洲精品av一区二区| 日韩av免费高清视频| 精品酒店卫生间| 国产人妻一区二区三区在| 精品久久久久久久久亚洲| 一级毛片aaaaaa免费看小| 国产免费视频播放在线视频 | 久热久热在线精品观看| 天堂√8在线中文| 精品酒店卫生间| 国产麻豆成人av免费视频| 精品久久久久久电影网| 国产亚洲精品av在线| 亚洲欧美清纯卡通| 久久国产乱子免费精品| 日韩电影二区| 性插视频无遮挡在线免费观看| 亚洲精品乱码久久久久久按摩| 久久久久久久久久久丰满| 最近视频中文字幕2019在线8| 全区人妻精品视频| 亚洲成人一二三区av| 国产成人精品婷婷| 99久久九九国产精品国产免费| 国产黄色视频一区二区在线观看| www.色视频.com| 在线播放无遮挡| 国产亚洲av嫩草精品影院| 精华霜和精华液先用哪个| 国产欧美日韩精品一区二区| 精品久久久久久久末码| 亚洲精品久久久久久婷婷小说| 极品少妇高潮喷水抽搐| 免费看美女性在线毛片视频| 我的老师免费观看完整版| 狠狠精品人妻久久久久久综合| 国国产精品蜜臀av免费| 九九在线视频观看精品| 嘟嘟电影网在线观看| 国产精品三级大全| 欧美日韩综合久久久久久| 女人被狂操c到高潮| 一边亲一边摸免费视频| 夫妻性生交免费视频一级片| 麻豆av噜噜一区二区三区| 午夜激情久久久久久久| 成人亚洲精品一区在线观看 | 国产黄色小视频在线观看| 一区二区三区高清视频在线| 国产在线一区二区三区精| 欧美一区二区亚洲| 永久免费av网站大全| 国产在线一区二区三区精| 在线观看美女被高潮喷水网站| 国产高潮美女av| 高清在线视频一区二区三区| 午夜亚洲福利在线播放| 午夜福利高清视频| videos熟女内射| 久久99热这里只频精品6学生| 日韩一本色道免费dvd| 免费黄频网站在线观看国产| 欧美zozozo另类| 神马国产精品三级电影在线观看| 老女人水多毛片| 69av精品久久久久久| 亚洲真实伦在线观看| 亚洲三级黄色毛片| 久久午夜福利片| 日本色播在线视频| 国产在线男女| 2021少妇久久久久久久久久久| 精品国产三级普通话版| 人妻一区二区av| 亚洲成人久久爱视频| 爱豆传媒免费全集在线观看| 久久久久久久久久久免费av|