欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于nga-ts算法的蛋白質結構預測方法

文檔序號:10471363閱讀:655來源:國知局
基于nga-ts算法的蛋白質結構預測方法
【專利摘要】本發(fā)明涉及蛋白質結構預測領域,涉及了一種基于小生境遺傳和算法禁忌搜索算法的結合算法的蛋白質結構預測方法。該方法將禁忌搜索算法引入小生境遺傳算法中來解決蛋白質結構預測問題,并對小生境遺傳算法過程中的交叉、變異、小生境淘汰進行了一定的改進。從實驗得出的數(shù)據(jù)和與其他方法的比較結果來看,該方法可以更加全面的搜索出相應的蛋白質最小自由能量值,從而能得到更穩(wěn)定的蛋白質結構,說明了本方法在解決蛋白質結構預測問題上是有效的。
【專利說明】
基于NGA-TS算法的蛋白質結構預測方法
技術領域
[0001] 本發(fā)明設及小生境遺傳算法和禁忌算法,具體講的是通過小生境遺傳算法和禁忌 算法捜索到最小的蛋白質自由能量值,并改進了捜索過程中的交叉算子、變異算子和小生 境淘汰算子。
【背景技術】
[0002] 在生物信息學領域中,蛋白質工程一直是一口重要的研究課題。蛋白質作為人體 生命活動的基本體現(xiàn)者,是人體不可或缺的物質,可是生物體內存在的天然蛋白質,有的往 往不盡人意,需要加 W改造。蛋白質工程是按人們的意志改變蛋白質的結構和功能來改造 或創(chuàng)建新的蛋白質的過程。由于蛋白質是由許多氨基酸按一定順序結構組合而成的,每一 種蛋白質都有獨特的氨基酸序列,蛋白質中氨基酸序列的結構也決定了蛋白質的功能和性 質。所W,改變蛋白質中的氨基酸序列結構就能改變蛋白質的性質,蛋白質結構預測問題是 蛋白質工程中重要的研究問題之一。
[0003] 蛋白質結構預測問題又被稱為蛋白質折疊問題。在醫(yī)學上,有許多因蛋白質折疊 錯誤、結構發(fā)生改變而引起的疾病,例如:瘋牛?。╞ovine spongiform encephalopathy, BSE)、新型克雅病(CJD)、構象?。ㄓ珊降鞍子置鞍踪|傳染因子引起的疾?。⒓∥s性側 索硬化癥、家族性淀粉樣屯、肌病、阿爾茨海默病(ADI)等。因此,研究蛋白質結構預測對運些 疾病機制的研究和治療藥物的研究都有重大的實踐意義。
[0004] 蛋白質結構預測問題也是對蛋白質結構中的氨基酸的空間折疊的預測,W達到蛋 白質的最低能量和最穩(wěn)定結構(能量越低,蛋白質結構越穩(wěn)定)。通常對蛋白質結構的預測 問題的解決一般采用更為方便有效的模擬仿真技術,首先要將根據(jù)問題建立合適的數(shù)學模 型和物理模型,其次是找到合適的尋優(yōu)算法。
[0005] 前人提出了多種研究蛋白質結構預測的適用模型,其中應用最廣泛的是按照氨基 酸的親疏水性分為疏水氨基酸和親水氨基酸的兩種簡化模型:HP格點模型和AB非格點模 型。兩種模型最主要的區(qū)別在于,HP格點模型中兩個殘基鍵之間的角度是直角或者平角,而 AB非格點模型中兩個鍵之間的角度是任意的并且被記作兩平面的折疊角和同一平面的扭 轉角,同時AB非格點模型不僅考慮了相鄰兩個氨基酸間的相互作用還考慮了不相鄰氨基酸 之間的非局部作用對蛋白質結構的影響。因此,AB非格點模型比HP格點模型更接近真實的 蛋白質結構。目前,采用AB非格點模型的研究人員較多,而且大部分研究人員都在尋找更好 的尋優(yōu)算法,W提高研究的精確度。
[0006] 當前,國內外很多研究者對蛋白質結構預測問題的研究提出了許多算法,例如:遺 傳算法、粒子群算法、蟻群算法、蜂群算法、禁忌算法、模擬退火算法、免疫算法等智能算法 或是多種算法的混合算法?;痚ng等提出一種基于AB非格點模型的改進禁忌捜索算法,它適 用于短的蛋白質結構序列。Zheng等采用遺傳、禁忌算法的混合算法,并采取了許多改進策 略,如:排隊選擇、交叉操作、變異操作、變種群策略等等?;疷等提出改進的遺傳、粒子群混 合算法和改進的遺傳、粒子群、禁忌混合算法兩種解決方法,結合了遺傳算法、粒子群算法 和禁忌算法的優(yōu)點,提高全局最優(yōu)捜索,提高結果的捜索精度。Li等采用平衡進化人工蜂群 算法來解決蛋白質結構預測問題,并且獲得了好的結果。但是,對蛋白質結構預測方法進行 改進,有效提高了捜索的效率,提高精確度仍是十分必要的。

【發(fā)明內容】

[0007] 本發(fā)明的目的在于提出一種基于NGA-TS算法的蛋白質結構預測方法,將小生境遺 傳算法和禁忌捜索算法用于蛋白質結構預測中,捜索出更小的自由能值和對應的更穩(wěn)定的 結構,并有效提高了捜索的效率,提高精確度。其基本思想是先對種群進行競技選擇、自適 應交叉、自適應變異后,再根據(jù)種群個體之間的歐氏距離進行小生境淘汰,淘汰掉較為相似 的個體,從而增加種群個體的多樣性,最后用禁忌捜索算法進行全局性領域捜索找到全局 最優(yōu)解。
[0008] 為達到上述目的,本發(fā)明的技術方案為:首先進行種群初始化,并對種群進行選 擇、交叉、變異操作,然后再對種群進行小生境淘汰選擇操作,在進化后期對種群進行全局 性的禁忌捜索運樣就可W捜索出最小自由能的蛋白質結構。在捜索穩(wěn)定蛋白質結構的過程 中,對使用的交叉操作、變異操作和小生境淘汰操作進行一些的改進:交叉操作采用自適應 交叉算子,避免過早收斂現(xiàn)象和停滯現(xiàn)象的產生;變異操作采用自適應的隨機線性變異算 子,可W增強局部捜索能力,加快收斂速度;小生境淘汰操作也采用動態(tài)函數(shù)求得距離參 數(shù),使參數(shù)更靈活精確,使小生境淘汰更有效?;贜GA-TS算法的蛋白質結構預測方法,其 特征在于:其包括W下步驟:
[0009] 步驟1:初始化參數(shù)及種群;
[0010] 步驟2:進行迭代循環(huán),計算種群適應度;
[0011] 步驟3:對種群進行競技選擇、自適應交叉、自適應隨機線性變異,更新種群;
[0012] 步驟4:對新種群進行小生境淘汰選擇,更新種群;
[0013] 步驟5:在進化后期,對新種群進行禁忌捜索算法,更新種群;
[0014] 步驟6:判斷是否滿足終止條件,若滿足則退出循環(huán),繼續(xù)運行步驟7,否則跳到步 驟3;
[0015] 步驟7:結束循環(huán)后,對最優(yōu)值再進行一次禁忌捜索,最后輸出結果。
[0016] 該方法具體步驟如下:
[0017] 1)初始化種群《=財,町...而,其中11為種群大小;
[001引2)計算種群X中個體的適應度值Fi,其中i = l,2,···,η;根據(jù)適應度值的大小進行 升序排序,并記憶保留前rV2個個體記作記憶種群Ρ;
[0019] 3)設置代數(shù)計數(shù)器t = l;
[0020] 4)先將種群X中的前k個適應度值小的個體復制到新種群XI中,再將XI中的n-k個 個體通過對種群X進行競技選擇選出,其中競技選擇的個數(shù)為y,即從X中隨機選擇y個個體, 選取適應度值好的保留到新種群XI中,運樣進行n-k次選擇,形成種群XI;
[0021 ] 5)對種群XI進行自適應交叉:在進化初期,交叉概率化0等于0.8;在進化后期,即 I > I,其中T為迭代次數(shù),交叉概率化用自適應公式:
[0022]化= Pc〇X(l-i/n)i/2,
[0023] 其中i為交叉?zhèn)€體在種群中的下標索引確定,Pco等于0.8,判斷隨機數(shù)a(a為一個 (〇,1)范圍內的正態(tài)分布隨機數(shù),且每個個體交叉判斷都要重新生成的隨機數(shù))與交叉概率 的大?。寒攁小于交叉概率時,隨機確定交叉點對XI中的個體xi和個體xn-i+i進行交叉;當a大 于交叉概率時,不進行交叉。運樣進行rV2次交叉后形成種群X2;
[0024] 6)對種群X2進行自適應隨機線性變異:在進化初期,即t<^xT,其中T為迭代次 4 數(shù),變異概率化用自適應公式:
[0025]
[0026] 其中i為變異個體在種群中的下標索引確定,在進化后期變異概率化0等于0.08, 判斷隨機數(shù)b(b為一個(0,1)范圍內的正態(tài)分布隨機數(shù),且每個個體交叉判斷都要重新生成 的隨機數(shù))與變異概率的大?。寒攂大于變異概率時,不進行變異;當b小于變異概率時,對XI 中的個體XI隨機選取一個位置i用線性變異公式:
[0030] 進行變異,其中ran為(0,1)區(qū)間內的隨機數(shù),當ran<0.5時f (ran) = -1,當ran〉0.5 時f(ran) = l;r和α都是(〇,1)區(qū)間內的隨機數(shù);i為下標索引;
[0031] 整個種群X2運行完變異后就得到種群X3,并計算種群X3適應度;
[0032] 7)將種群X3和記憶種群P合并為種群XP,種群XP的個體數(shù)為化/2,對種群XP進行小 生境淘汰;分別對XP中的兩兩個體進行計算歐式距離:
[003:3]
1= l,2,...,:;00;.j 二 i + l,...,.;00 :
[0034] 當,其中L為小生境的距離參數(shù),小生境的距離參數(shù)是由動態(tài)函數(shù)公式
爵到的,判斷^和^的適應度Fi和。的大小并將適應度差的處W罰函數(shù), 然后根據(jù)當前變更的適應度將種群XP中的個體升序排列;
[0035] 8)取種群XP的前η個個體作為種群X,計算更新種群X的適應度值并根據(jù)適應度值 大小進行升序排列,取種群X的前rV2個個體作為新的記憶種群Ρ;
[0036] 9)判斷是否禁忌捜索:若t<T-5,則運行步驟10);否則對種群X進行禁忌捜索;具體 步驟如下:
[0037] a)初始化禁忌表,設置禁忌迭代計數(shù)器tscount = l;
[0038] b)對當前候選解進行隨機線性變異操作,線性變異公式:
[0039] x = x+f(ran)X 化 Xfi-i,
[0040] 其中ran和f和步驟6)中定義相同,i為鄰域的下標索引,范圍為(1,100)的區(qū)間形 成一組鄰域解,并按照適應度值排序;
[0041] C)判斷鄰域解中的最小值是否比最優(yōu)解更小,若是則滿足藐視準則,若否則不滿 足藐視準則;
[0042] 若滿足則更新候選解、禁忌表和最優(yōu)解,即將鄰域中最小值賦值給候選解和最優(yōu) 解,并將鄰域中最小值放入禁忌表中;
[0043] 若不滿足則判斷鄰域解中最小的10個解是否在禁忌表中,若不在則更新禁忌表, 即將其放入禁忌表中;
[0044] (1)禁忌迭代計數(shù)器13(3〇11]11 = 13(3〇11]11+1,判斷終止條件,若13(3〇11]11:< = 1'1:,其中1'1 為禁忌捜索的迭代次數(shù),貝峭巧Ij步驟b)繼續(xù)運行,若tscountxrt,則終止迭代,返回主函數(shù) 中運行,并返回最優(yōu)解。
[0045] 10)判斷禁忌捜索算法得到的適應度值是否小于步驟8)中X種群的適應度值,若是 則將X中原先的個體序列和適應度值替換掉,否則不做改變;運樣形成新種群X,取X種群的 前n/2個個體作為新的記憶種群P;
[0046] 11)迭代計數(shù)器累加 t = t+l,判斷終止條件,若t< = T,其中T為迭代次數(shù),則繼續(xù)迭 代跳到步驟4)運行,若t〉T則迭代結束,運行步驟12);
[0047] 12)將得到的最優(yōu)值進行禁忌捜索,其具體步驟同步驟9),返回其鄰域中的最優(yōu)值 作為最后的最佳結果;
[004引13)輸出最佳結果,程序結束。
[0049]優(yōu)選地,上述具體步驟中步驟4)為先將種群X中的前50個適應度值小的個體復制 到新種群XI中,再將XI中的n-50個個體通過對種群X進行競技選擇選出,其中競技選擇的個 數(shù)為20,即從X中隨機選擇20個個體,選取適應度值好的保留到新種群XI中,運樣進行n-50 次選擇,形成種群XI。
[(K)加]其他說明:
[0051]適應度大小是能量函數(shù)值E,能量函數(shù)值E的計算公式為:
[0057]求解適應度時需要用到將每個個體的角度值轉換為Ξ維空間坐標的公式如下:
[0化引
[0059] 本發(fā)明與現(xiàn)有技術相比具有W下優(yōu)點:
[0060] (1)將小生境遺傳算法和禁忌捜索算法同時引入蛋白質結構預測中,通過小生境 淘汰算子對種群進一步進行選擇淘汰其中相近的個體,增加了種群的多樣性,避免了大量 重復解的出現(xiàn),并且通過禁忌捜索算法來避免陷入局部最優(yōu),實現(xiàn)全局化的捜索,保證了全 局捜索,加快收斂,提高了程序的準確性。
[0061] (2)對普通的小生境遺傳算法和禁忌捜索算法做了一些改進,采用自適應交叉、自 適應隨機線性變異、采用動態(tài)函數(shù)確定距離參數(shù)L、加入隨機線性變異的禁忌捜索算法等改 進策略,改進后的NGA-TS算法更易跳出局部最優(yōu),更好地提高了全局捜索能力,從而能更準 確地捜索到最優(yōu)值,提高了捜索結果的準確性。
[0062] 本發(fā)明采用小生境遺傳算法和禁忌算法混合的NGA-TS算法來解決蛋白質結構預 測問題。小生境遺傳算法是一種在遺傳算法的基礎上添加了小生境淘汰機制的算法。小生 境算法的思想是生物進化過程中總是與自己相同的物種生活在一起的現(xiàn)象,反應到遺傳算 法中就是使遺傳算法中的個體趨向于在一個特定的生存環(huán)境中進化。遺傳算法中加入小生 境淘汰機制可W保護種群的多樣性,避免重復解的出現(xiàn),但是也容易產生后期進化的停滯 和陷入局部最優(yōu)。所W,為了改進小生境遺傳算法的缺陷,我們在進化后期引入了禁忌算 法。禁忌算法是一種亞啟發(fā)式隨機捜索算法,其思想最早由化ed Glover提出,是一種全局 逐步尋優(yōu)算法,也是對人類智力過程的一種模擬。在NGA-TS算法運行后期,禁忌算法更好的 保證多樣化的有效捜索,W實現(xiàn)全局捜索優(yōu)化。本文還通過對斐波那契序列和真實蛋白質 序列的模擬實驗,得到了一些較好的結果,并和其他算法結果的進行比較,更充分有力的說 明了 NGA-TS算法在解決蛋白質結構預測問題上是有效的。
【附圖說明】
[0063] 圖1為整體程序流程圖;
[0064] 圖2為禁忌算法流程圖;
[0065] 圖3為斐波那契序列;
[0066] 圖4為真實蛋白質序列;
[0067] 圖5為本發(fā)明與其他方法對斐波那契序列的實驗結果比較;
[0068] 圖6為本發(fā)明與其他方法對真實蛋白質序列的實驗結果比較;
[0069] 圖7為本發(fā)明與其他方法對真實蛋白質序列的實驗結果比較。
【具體實施方式】
[0070] 下面結合附圖對本發(fā)明作進一步說明.
[0071 ]結合圖5的整體程序流程圖,下面進行詳細步驟介紹:
[0072] 步驟1:初始化參數(shù)及種群。
[0073] 步驟2:進行迭代循環(huán),計算種群適應度值。
[0074] 步驟3:對種群進行競技選擇、自適應交叉、自適應隨機線性變異,更新種群。
[0075] 步驟4:對新種群進行小生境淘汰選擇,更新種群。
[0076] 步驟5:在進化后期,對新種群進行禁忌捜索算法(如圖6禁忌捜索流程),更新種 群。
[0077] 步驟6:判斷是否滿足終止條件,若滿足則退出循環(huán),繼續(xù)運行步驟7,否則跳到步 驟3。
[0078] 步驟7:結束循環(huán)后,對最優(yōu)值再進行一次禁忌捜索,最后輸出結果。
[0079] 實施例1
[0080] 本發(fā)明的實施例是在W本發(fā)明技術方案為前提下進行實施的,給出了詳細的實施 方式和具體的操作過程,但本發(fā)明的保護范圍不限于下述實施例。因為蛋白質序列的種類 很多,我們W長度為5的蛋白質序列即斐波那契序列為例,具體序列見圖3中長度為5的序 列。
[0081] 步驟1:首先將蛋白質序列抽象為數(shù)字序列,W便計算機運算。其中A表示疏水氨基 酸,B表示親水氨基酸,在程序中疏水氨基酸對應的值為1,親水氨基酸對應的值為-1(真實 蛋白質也是同樣的規(guī)則,只是氨基酸的表示字母不同)。即長度為5的序列表示為[1 -1 -1 1 -1 ]。
[0082] 步驟2:根據(jù)蛋白質序列的長度確定種群個體的維度,當序列為η時,其中η表示序 列長度,種群個體的維度應為化-5(實為氨基酸的鍵角和扭轉角之和)。所W,在實例序列長 度為5的情況下,種群個體的維度為2*5-5 = 5。運樣就可W初始化種群乂 = ^1,枯,-',^,其中 m為種群大小,且每個元素都表示角度即[-31,31]范圍中的隨機數(shù)。
[0083] 步驟3:根據(jù)Ξ維空間坐標的公式將每個個體中的角度轉換為氨基酸的Ξ維坐標, 求解適應度時需要用到將每個個體的角度值轉換為Ξ維空間坐標的公式如下:
[0084]
[0085] 并由能量函數(shù)值E的計算公式計算自由能量值作為適應度值Fi(i = l,2,…,m)。能 量函數(shù)值E的計算公式為:
[0090]
[0091] 根據(jù)Fi的大小進行升序排序,并記憶保留前m/2個個體記作種群P。設置代數(shù)計數(shù) 器t = l,進行迭代循環(huán)。
[0092] 步驟4:對種群X進行競技選擇形成新種群XI。
[0093] 步驟5:對種群XI進行自適應交叉形成新種群X2。在進化初期(t<^,其中T為迭代 次數(shù)),交叉概率化0 = 0.8;在進化后期(,交叉概率用自適應公式(化=化DX(l-i/ 其中i為交叉?zhèn)€體在種群中的下標索引,m為種群大?。┐_定。判斷隨機數(shù)a(a為一個 (〇,1)范圍內的正態(tài)分布隨機數(shù),且每個個體交叉判斷都要重新生成的隨機數(shù))與交叉概率 的大小:當a小于交叉概率時,隨機確定交叉點對XI中的個體xi和個體xm-i+i進行交叉;當a大 于交叉概率時,不進行交叉。運樣進行m次交叉后形成新種群X2。
[0094] 步驟6:對種群X2進行自適應的隨機線性變異。在進化初期(t<^xT ),變異概率用 4 自適應公式
確定;在進化后期,變異概率化〇 = 〇.08。判斷隨機數(shù)b(b為一 個(〇,1)范圍內的正態(tài)分布隨機數(shù),且每個個體交叉判斷都要重新生成的隨機數(shù))與變異概 率的大小:當b小于變異概率時,對X隨機選取一個位置i用線性變異公式進行變異;線性變 異公式為:
[0098] 當b大于變異概率時,不進行變異。經過變異操作后得到新種群X3,并計算其適應 度值。
[0099] 步驟7:將種群X3和記憶種群P合并為新種群XP(個體數(shù)為3m/2)進行小生境淘汰選 擇,用歐式公式計算歐式距離dij,歐式公式為:
[0100]
[0101]當du<L(L為小生境的距離參數(shù),由動態(tài)函數(shù)公式
-得到)時,判 斷Xi和Xj的適應度Fi和Fj的大小并將適應度差的處w (加上)罰函數(shù)(Penalty=l〇i5),使之 差的適應度更大W便淘汰,最后根據(jù)當前變更的適應度值將種群XP升序排列。
[0102] 步驟8:更新種群。取XP種群的前m個個體作為新種群X,計算更新其適應度值并進 行升序排列,取X種群的前m/2個個體作為新的記憶種群P。
[0103] 步驟9:判斷是否禁忌捜索。若t<T-5,則運行步驟10;否則對種群X進行禁忌捜索。 具體步驟如下:
[0104] a)初始化禁忌表,設置禁忌迭代計數(shù)器tscount = l;
[0105] b)對當前候選解進行隨機線性變異操作,用線性變異公式進行變異,線性變異公 古九,
[0108]
;形成一組鄰域解,并按照適應度值排序;
[0109] C)判斷是否滿足藐視準則(鄰域解中的最小值是否比最優(yōu)解更小,若是則滿足,若 否則不滿足),若滿足則更新候選解、禁忌表和最優(yōu)解(將鄰域中最小值賦值給候選解和最 優(yōu)解,并將鄰域中最小值放入禁忌表中),若不滿足則判斷鄰域解中最小的10個解是否在禁 忌表中,若不在則更新禁忌表(將其放入禁忌表中);
[0110] (1)禁忌迭代計數(shù)器13(3〇11]11 = 13(3〇11]11+1,判斷終止條件,若13(3〇11]11:< = 1'1:(1'1:為禁 忌捜索的迭代次數(shù))則固巧Ij步驟b)繼續(xù)運行,若tscount〉Tt則終止迭代,返回主函數(shù)中運 行,并返回最優(yōu)解。
[0111] 步驟10:判斷禁忌捜索算法得到的適應度值是否小于X種群中原先對應的值,若是 則將X中原先的個體序列和適應度值替換掉,否則不做改變。運樣形成新種群X,取X種群的 前m/2個個體作為新的記憶種群P。
[0112] 步驟11:迭代計數(shù)器累加 t = t+l,判斷終止條件,若t< = T(T為迭代次數(shù))則繼續(xù)迭 代跳到步驟4運行,若t〉T則迭代結束,繼續(xù)運行步驟12。
[0113] 步驟12:將得到的最優(yōu)值進行禁忌捜索(具體步驟同步驟9),返回其鄰域中的最優(yōu) 值作為最后的最佳結果。
[0114] 步驟13:輸出最佳結果,程序結束。
[0115] 根據(jù)W上所示的步驟,我們對斐波那契序列(見圖3)和真實蛋白質序列(見圖4)進 行相關操作,對所獲得NGA-TS的數(shù)據(jù)與其他方法的數(shù)據(jù)進行了比較(見圖5、圖6和圖7)。
[0116] 綜上所述,我們通過NGA-TS算法來解決蛋白質結構預測方法,可W減少大量冗余 解的存在從而增加種群的多樣性,也可W避免過早收斂現(xiàn)象和停滯現(xiàn)象的產生從而增強局 部捜索能力,還可W避免陷入局部最優(yōu),實現(xiàn)全局化的。由此說明我們的方法是有效可行 的。
[0117] W上所述,僅為本發(fā)明較佳的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此, 任何熟悉本技術領域的技術人員在本發(fā)明披露的技術范圍內,根據(jù)本發(fā)明的技術方案及其 發(fā)明構思加 W等同替換或改變,都應涵蓋在本發(fā)明的保護范圍內。
【主權項】
1. 基于NGA-TS算法的蛋白質結構預測方法,其特征在于:其包括以下步驟: 步驟1:初始化參數(shù)及種群; 步驟2:進行迭代循環(huán),計算種群適應度; 步驟3:對種群進行競技選擇、自適應交叉、自適應隨機線性變異,更新種群; 步驟4:對新種群進行小生境淘汰選擇,更新種群; 步驟5:在進化后期,對新種群進行禁忌搜索算法,更新種群; 步驟6:判斷是否滿足終止條件,若滿足則退出循環(huán),繼續(xù)運行步驟7,否則跳到步驟3; 步驟7:結束循環(huán)后,對最優(yōu)值再進行一次禁忌搜索,最后輸出結果。2. 根據(jù)權利要求1所述的基于NGA-TS算法的蛋白質結構預測方法,其特征在于:該方法 具體步驟如下: 1) 初始化種群Χ=χι,χ2,…,χη,其中η為種群大?。? 2) 計算種群X中個體的適應度值Fi,其中? = 1,2,···,η;根據(jù)適應度值的大小進行升序 排序,并記憶保留前η/2個個體記作記憶種群Ρ; 3) 設置代數(shù)計數(shù)器t = l;4) 先將種群X中的前k個適應度值小的個體復制到新種群XI中,再將XI中的n-k個個體 通過對種群X進行競技選擇選出,其中競技選擇的個數(shù)為y,即從X中隨機選擇y個個體,選取 適應度值好的保留到新種群XI中,這樣進行n-k次選擇,形成種群XI; 5) 對種群XI進行自適應交叉:在進化初期,交叉概率Pco等于0.8;在進化后期, 其中T為迭代次數(shù),交叉概率Pc用自適應公式: Pc = Pc〇X (l-i/n)1/2, 其中i為交叉?zhèn)€體在種群中的下標索引確定,Pco等于0.8;判斷隨機數(shù)a與交叉概率的大 小,其中隨機數(shù)a為一個(0,1)范圍內的正態(tài)分布隨機數(shù),且每個個體交叉判斷都要重新生 成隨機數(shù)a;當隨機數(shù)a小于交叉概率時,隨機確定交叉點對XI中的個體^和個體χ η-1+1進行 交叉;當隨機數(shù)a大于交叉概率時,不進行交叉,這樣進行η/2次交叉后形成種群X2; 6) 對種群Χ2進行自適應隨機線性變異:在進化初期:其中Τ為迭代次數(shù),變 異概率Pm用自適應公式:其中i為變異個體在種群中的下標索引確定,在進化后期變異概率Pmo等于0.08;判斷隨 機數(shù)b與變異概率的大小,其中隨機數(shù)b為一個(0,1)范圍內的正態(tài)分布隨機數(shù),且每個個體 交叉判斷都要重新生成隨機數(shù)b:當b大于變異概率時,不進行變異;當b小于變異概率時,對 XI中的個體^隨機選取一個位置i用線性變異公式:進行變異,其中ran為(0,1)區(qū)間內的隨機數(shù),當ran〈0.5時f (ran) = -1,當ran>0.5時f (ran) = 1;r和α都是(Oj)區(qū)間內的隨機數(shù);i為下標索引; 整個種群X2運行完變異后就得到種群X3,并計算種群X3適應度; 7) 將種群X3和記憶種群P合并為種群XP,種群XP的個體數(shù)為3n/2,對種群XP進行小生境 淘汰;分別對XP中的兩兩個體進行計算歐式距離 2,···,300;j = i+Ι,···,300;當dij〈L時,其中L為小生境的距離參數(shù),小生境的距離參數(shù)是由動態(tài)函數(shù)公式-得到的,判斷xi和xj的適應度Fi和Fj的大小并將適應度差的處以罰函數(shù),然 后根據(jù)當前變更的適應度將種群XP中的個體升序排列; 8) 取種群XP的前η個個體作為種群X,計算更新種群X的適應度值并根據(jù)適應度值大小 進行升序排列,取種群X的前η/2個個體作為新的記憶種群Ρ; 9) 判斷是否禁忌搜索:若t〈T-5,則運行步驟10);否則對種群X進行禁忌搜索;具體步驟 如下: a) 初始化禁忌表,設置禁忌迭代計數(shù)器tscount = 1; b) 對當前候選解進行隨機線性變異操作,線性變異公式: x = x+f(ran) X 2π Xr1-1, 其中ran為(0,1)區(qū)間內的隨機數(shù),當ran〈0 · 5時f (ran) = -1,當ran>0 · 5時f (ran) = 1; r 和α都是(0,1)區(qū)間內的隨機數(shù);i為鄰域的下標索引,范圍為(1,100)的區(qū)間形成一組鄰域 解,并按照適應度值排序; c) 判斷鄰域解中的最小值是否比最優(yōu)解更小,若是則滿足藐視準則,若否則不滿足藐 視準則; 若滿足則更新候選解、禁忌表和最優(yōu)解,即將鄰域中最小值賦值給候選解和最優(yōu)解,并 將鄰域中最小值放入禁忌表中; 若不滿足則判斷鄰域解中最小的10個解是否在禁忌表中,若不在則更新禁忌表,即將 其放入禁忌表中; (1)禁忌迭代計數(shù)器丨8001111丨=丨8〇01111丨+1,判斷終止條件,若丨8〇011111:〈 = 1'1:,其中1'1:為禁 忌搜索的迭代次數(shù),則跳到步驟b)繼續(xù)運行,若tSC〇Unt>Tt,則終止迭代,返回主函數(shù)中運 行,并返回最優(yōu)解; 10) 判斷禁忌搜索算法得到的適應度值是否小于步驟8)中X種群的適應度值,若是則將 X中原先的個體序列和適應度值替換掉,否則不做改變;這樣形成新種群X,取X種群的前η/2 個個體作為新的記憶種群Ρ; 11) 迭代計數(shù)器累加 t = t+l,判斷終止條件,若t〈 = T,其中Τ為迭代次數(shù),則繼續(xù)迭代跳 到步驟4)運行,若t>T則迭代結束,運行步驟12); 12) 將得到的最優(yōu)值進行禁忌搜索,其具體步驟同步驟9),返回其鄰域中的最優(yōu)值作為 最后的最佳結果; 13) 輸出最佳結果,程序結束。3.根據(jù)權利要求2所述的基于NGA-TS算法的蛋白質結構預測方法,其特征在于:所述步 驟4)為先將種群X中的前50個適應度值小的個體復制到新種群XI中,再將XI中的n-50個個 體通過對種群X進行競技選擇選出,其中競技選擇的個數(shù)為20,即從X中隨機選擇20個個體, 選取適應度值好的保留到新種群XI中,這樣進行n-50次選擇,形成種群XI。
【文檔編號】G06F19/16GK105825075SQ201610144174
【公開日】2016年8月3日
【申請日】2016年3月11日
【發(fā)明人】周昌軍, 魏雪, 鄭學東, 王賓
【申請人】大連大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
玉树县| 锡林浩特市| 扶绥县| 南江县| 昌吉市| 景洪市| 肥城市| 旬阳县| 北碚区| 山东省| 泸定县| 临夏市| 敖汉旗| 延吉市| 中超| 松江区| 班戈县| 璧山县| 运城市| 吴堡县| 北川| 三都| 博乐市| 永嘉县| 基隆市| 图片| 长顺县| 上林县| 武功县| 日土县| 安阳县| 宁都县| 若羌县| 平原县| 玛纳斯县| 沁阳市| 遵化市| 柯坪县| 仲巴县| 仁怀市| 凤台县|