一種惡意程序分析方法與流程

文檔序號：12669981閱讀：342來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及惡意程序檢測領(lǐng)域，尤其是涉及一種惡意程序分析方法。

背景技術(shù)：

傳統(tǒng)惡意程序分析方法，作為傳統(tǒng)軟件惡意行為檢測技術(shù)的核心技術(shù)，主要包括程序惡意行為檢測、文件特征和行為特征比對等方法，存在匯編指令級信息缺失，難以有效檢測軟件中隱藏的惡意行為，無法有效應(yīng)對惡意程序不斷采用新的混淆和隱藏技術(shù)。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明的目的在于：針對現(xiàn)有技術(shù)存在的問題，提供一種惡意程序分析方法，解決傳統(tǒng)方法難以有效檢測軟件中隱藏的惡意行為的問題。

本發(fā)明的發(fā)明目的通過以下技術(shù)方案來實(shí)現(xiàn)：一種惡意程序分析方法，該方法包括步驟：(1)將惡意程序樣本庫映射為一個(gè)以惡意程序基因?yàn)樽钚卧膼阂獬绦蚧驇欤?2)利用惡意程序基因庫進(jìn)行惡意程序分析。

作為進(jìn)一步的技術(shù)方案，將惡意程序樣本庫映射為惡意程序基因庫的方法為：基于每個(gè)惡意程序運(yùn)行時(shí)的匯編指令流，提取其中的關(guān)鍵匯編指令流片段，并建立關(guān)鍵匯編指令流片段與惡意行為的語義映射。

作為進(jìn)一步的技術(shù)方案，建立關(guān)鍵匯編指令流片段與惡意行為的語義映射的方法包括步驟：1)建立匯編指令流IS＝I₀，I₁，...，I_N中的任意匯編指令I(lǐng)進(jìn)行抽象描述的映射關(guān)系I→ID；2)形式化惡意程序運(yùn)行時(shí)的匯編指令流序列，將匯編指令流序列IS＝I₀，I₁，...，I_N映射為序列IDS＝ID₀，ID₁，...，ID_N；3)將惡意程序的樣本集合中所有的惡意程序均執(zhí)行步驟1)和步驟2)，得到一個(gè)惡意程序的DNA行為序列集合，同時(shí)每個(gè)惡意程序DNA行為序列對應(yīng)不同的惡意程序分類；4)針對每一類惡意程序DNA行為序列，提取每一類惡意程序DNA序列集合中K個(gè)相同的平凡子序列片段；5)計(jì)算得到最優(yōu)的惡意程序基因信息。

作為進(jìn)一步的技術(shù)方案，步驟1)中，ID為六元組<C，OP，F(xiàn)，WR，d，t>，其中，C是描述指令操作碼屬性的三元組C＝<c，m>，c表示指令的操作碼，m表示指令的操作模式；OP是描述指令操作數(shù)的多元組OP＝<n，op₁，...，op_n>，n表示指令的操作數(shù)個(gè)數(shù)，op_i指向指令的第i個(gè)操作數(shù)；F是描述指令對標(biāo)志寄存器置位的九元組F＝<cf，pf，af，zf，sf，tf，if，df，of>，分別對應(yīng)9個(gè)標(biāo)志寄存器；WR是描述指令的內(nèi)存和寄存器讀寫狀態(tài)的三元組WR＝<wr_r，wr_m，r_m>，wr_r表示指令是否有寄存器讀寫，wr_m表示指令是否有內(nèi)存讀寫，r_m表示指令對內(nèi)存讀寫的區(qū)間；d描述指令的循環(huán)嵌套深度；t描述指令在代碼中位置的時(shí)間戳。

作為進(jìn)一步的技術(shù)方案，步驟2)中還包括步驟：定義兩個(gè)ID間相似度SimID的計(jì)算公式：SimID＝SimC*(λ_bSimB+λ_sSimS)，根據(jù)六元組<C，OP，F(xiàn)，WR，d，t>，其中SimC表示兩個(gè)ID間的指令語義相似度，即<C，OP>的相似度；SimB表示兩個(gè)ID間的行為相似度，即<F，WR>的相似度，SimS表示兩個(gè)ID間的結(jié)構(gòu)相似度，即<d，t>的相似度；同時(shí)，公式需要滿足如下要求：

λ_b+λ_s＝1，1≥SimC≥0，1≥SimB≥0，1≥SimS≥0。

作為進(jìn)一步的技術(shù)方案，步驟5)中，計(jì)算得到最優(yōu)的惡意程序基因信息的公式：其中，參數(shù)π_w表示閾值設(shè)定。

作為進(jìn)一步的技術(shù)方案，利用梯度下降法求解公式第n個(gè)最優(yōu)化公式

與現(xiàn)有技術(shù)相比，本發(fā)明具有以下優(yōu)點(diǎn)：

1、本發(fā)明能夠從底層有效語義刻畫惡意程序的惡意行為，從而提高惡意程序分析和檢測的匹配準(zhǔn)確率。

2、本發(fā)明能夠有效克服代碼層級的加殼、加密、多態(tài)等技術(shù)，從而能夠有效應(yīng)對未知惡意程序的快速動態(tài)增長。

具體實(shí)施方式

下面結(jié)合具體實(shí)施例對本發(fā)明進(jìn)行詳細(xì)說明。

實(shí)施例

本發(fā)明是基于惡意程序運(yùn)行時(shí)的匯編指令流，提取其中的關(guān)鍵匯編指令流片段，并建立其與惡意行為的語義映射。具體包括以下步驟：

第一步，針對每一個(gè)匯編指令，設(shè)計(jì)將指令流IS＝I₀，I₁，...，I_N中的任意匯編指令I(lǐng)進(jìn)行抽象描述的映射關(guān)系I→ID。其中，ID為六元組<C，OP，F(xiàn)，WR，d，t>。其中，C是描述指令操作碼屬性的三元組C＝<c，m>，c表示指令的操作碼，m表示指令的操作模式，包括讀寫賦值、邏輯運(yùn)算、算術(shù)運(yùn)算、控制跳轉(zhuǎn)、函數(shù)調(diào)用等；OP是描述指令操作數(shù)的多元組OP＝<n，op₁，...，op_n>，n表示指令的操作數(shù)個(gè)數(shù)(包括隱含操作數(shù))，op_i指向指令的第i個(gè)操作數(shù)；F是描述指令對標(biāo)志寄存器置位的九元組F＝<cf，pf，af，zf，sf，tf，if，df，of>，分別對應(yīng)9個(gè)標(biāo)志寄存器；WR是描述指令的內(nèi)存和寄存器讀寫狀態(tài)的三元組WR＝<wr_r，wr_m，r_m>，wr_r表示指令是否有寄存器讀寫，wr_m表示指令是否有內(nèi)存讀寫，r_m表示指令對內(nèi)存讀寫的區(qū)間，包括棧、堆、代碼段等；d描述指令的循環(huán)嵌套深度；t描述指令在代碼中位置的時(shí)間戳。

第二步，形式化惡意程序運(yùn)行時(shí)的匯編指令流序列。通過I→ID的映射關(guān)系，將指令流序列IS＝I₀，I₁，...，I_N映射為序列IDS＝ID₀，ID₁，...，ID_N，視為對程序從初始指令I(lǐng)₀出發(fā)的指令執(zhí)行路徑的序列的抽象描述，抽象的正確性有語義包容來保證。IDS是通過六元組ID＝<C，OP，F(xiàn)，WR，d，t>描述的匯編指令流序列，即IDS＝ID₀，ID₁，...，ID_N。為針對IDS進(jìn)行序列比對，首先需要定義兩個(gè)ID間相似度SimID的計(jì)算公式：

SimID＝SimC*(λ_bSimB+λ_sSimS)

根據(jù)六元組<C，OP，F(xiàn)，WR，d，t>，其中SimC表示兩個(gè)ID間的指令語義相似度，即<C，OP>的相似度；SimB表示兩個(gè)ID間的行為相似度，即<F，WR>的相似度，SimS表示兩個(gè)ID間的結(jié)構(gòu)相似度，即<d，t>的相似度。由于指令操作碼包含了最高程度的語義信息，因此Sim_c作為公式的乘法因子。同時(shí)，公式需要滿足如下要求：

λ_b+λ_s＝1，1≥SimC≥0，1≥SimB≥0，1≥SimS≥0

因此Sim_ID滿足1≥SimID≥0，描述了兩個(gè)ID間的語義、行為和結(jié)構(gòu)的歸一化相似度。

第三步，定義惡意程序的DNA行為序列集合。針對一個(gè)惡意程序的樣本集合，我們可以通過提取每個(gè)惡意程序運(yùn)行的匯編指令流序列IDS(即惡意程序的DNA行為序列)。因此，該惡意程序樣本集合對應(yīng)一個(gè)惡意程序的DNA行為序列集合，表示為IDS∈I^N×Q，其中表示有N條惡意程序DNA行為序列，每個(gè)DNA序列長度為Q(DNA序列長度是不定長度的，為了建模方便，我們統(tǒng)一為相同長度)。同時(shí)每個(gè)惡意程序DNA行為序列對應(yīng)不同的惡意程序分類，即該惡意程序樣本集合有一個(gè)標(biāo)簽向量Y∈{1，...，C}^N，其中惡意程序表示有C個(gè)分類。

第四步，針對每一類惡意程序DNA行為序列，我們的目標(biāo)是提取每一類惡意程序DNA序列集合中K個(gè)相同的平凡子序列片段，即提取一個(gè)長度為L(L<<Q)的惡意程序DNA序列片段，即惡意程序基因序列，表示為G^K×L。不同長度的序列之間的距離采用如下公式計(jì)算：

其中M_n，k表示第n個(gè)惡意程序DNA序列與第k個(gè)惡意程序基因的距離，下標(biāo)表示中j(j＝1，...，J；J＝：Q-L+1)。因此對于惡意程序基因序列的提取，轉(zhuǎn)化成對于k個(gè)平凡子序列的計(jì)算，即：

第五步，采用最優(yōu)化的方式，計(jì)算得到最優(yōu)的惡意程序基因信息，計(jì)算公式如下：

對于每個(gè)每個(gè)子序列的距離與計(jì)算的距離之間采用logistics回歸模型計(jì)算得到，即其中參數(shù)π_w表示閾值設(shè)定。

第六步，利用梯度下降法求解公式第n(n＝1，...，N)個(gè)最優(yōu)化公式計(jì)算F_n針對變量G_k，l的偏微分使其等于0，即：

其中，M_n，k作為一種不可微的公式，可以作近似計(jì)算，即因此上述的偏分計(jì)算得到如下的結(jié)果：

第七步，計(jì)算計(jì)算F_n針對變量W的偏微分使其等于0，即：

以上所述僅為本發(fā)明的較佳實(shí)施例而已，并不用以限制本發(fā)明，應(yīng)當(dāng)指出的是，凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：丁建偉;陳周國;趙越;郭宇斌;蘇宏
技術(shù)所有人：中國電子科技集團(tuán)公司第三十研究所
我是此專利的發(fā)明人

上一篇：一種可移動式生化系統(tǒng)活性污泥投加裝置及方法與流程
上一篇：一種老年旅游服裝的制作方法與工藝

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

三種競爭力分析方法相關(guān)技術(shù)

幾種常用的分析方法相關(guān)技術(shù)

問卷信度幾種分析方法相關(guān)技術(shù)

一組數(shù)據(jù)的分析方法相關(guān)技術(shù)

swot分析方法相關(guān)技術(shù)

材料分析方法相關(guān)技術(shù)

分析方法相關(guān)技術(shù)

問題分析方法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種惡意程序分析方法與流程