專利名稱:蛋白質(zhì)三維結(jié)構的預測方法及預測裝置的制作方法
技術領域:
本發(fā)明涉及蛋白質(zhì)結(jié)構預測技術領域,尤其涉及一種蛋白質(zhì)三維結(jié)構的預測方法及預測裝置。
背景技術:
生物學研究表明,蛋白質(zhì)是由特定的氨基酸序列構成的。正常情況下,蛋白質(zhì)并不是以完全伸展的多肽鏈結(jié)構存在,而是以緊密折疊的三維結(jié)構存在,并且一個特定蛋白質(zhì)行使其功能的能力通常由其三維結(jié)構決定。因此,確定蛋白質(zhì)的三維結(jié)構,或稱其構象,是生物領域的一項重要課題。目前,采用X射線衍射和核磁共振等分析化學的方法已經(jīng)實現(xiàn)了對部分蛋白質(zhì)三維結(jié)構的分析,但是,這些分析技術需要花費大量的時間和費用,不能滿足蛋白質(zhì)結(jié)構分析的需要,而結(jié)合信息技術發(fā)展起來的蛋白質(zhì)結(jié)構預測方法由于具有快速的優(yōu)點成為研究熱
;ο現(xiàn)有預測蛋白質(zhì)結(jié)構的方法主要有兩種比較建模法和從頭預測法。比較建模法是通過比較目標蛋白質(zhì)與另外一種已知結(jié)構、其氨基酸序列與目標蛋白質(zhì)聯(lián)系密切的蛋白質(zhì)進行預測,比較建模法需要以結(jié)構已知、且其氨基酸序列與目標蛋白質(zhì)相似的蛋白質(zhì)為基礎,如果不存在與目標蛋白質(zhì)氨基酸序列相似的蛋白質(zhì),則無法進行預測。而從頭預測是假設折疊后的蛋白質(zhì)取能量最低的構象,通過計算得到蛋白質(zhì)每一部分不同的卷曲狀態(tài)對應的結(jié)構,直到發(fā)現(xiàn)最低能量狀態(tài)。從頭預測蛋白結(jié)構有兩個關鍵問題一是找到一個能嚴格區(qū)分蛋白質(zhì)的天然構象和非天然構象的能量函數(shù);二是選擇適當?shù)乃阉魉惴ǎ催x擇有效的優(yōu)化算法?,F(xiàn)有技術公開了使用遺傳算法、模擬退火算法等算法對蛋白質(zhì)三維結(jié)構進行預測,但是,使用這些算法進行預測的精度較低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明所要解決的技術問題在于提供一種蛋白質(zhì)三維結(jié)構的預測方法及預測裝置,本發(fā)明提供的預測方法能夠?qū)崿F(xiàn)對蛋白質(zhì)三維結(jié)構的從頭預測,預測精度較
尚ο本發(fā)明提供了一種蛋白質(zhì)三維結(jié)構的預測方法,包括a、選擇目標蟻群,初始化蟻群算法參數(shù);b、初始化蛋白質(zhì)構象,建立蛋白質(zhì)構象與片段庫的映射關系;C、以所述蛋白質(zhì)構象上的任一位置為起點,所述目標蟻群在信息素的指引下對所述蛋白質(zhì)構象進行優(yōu)化,利用能量函數(shù)對優(yōu)化后的蛋白質(zhì)構象進行能量計算,選擇能量最小的蛋白質(zhì)構象;d、對所述能量最小的蛋白質(zhì)構象進行局部優(yōu)化,利用能量函數(shù)對局部優(yōu)化后的蛋白質(zhì)構象進行能量計算,根據(jù)所述計算結(jié)果更新信息素矩陣,并將所述局部優(yōu)化后的蛋白質(zhì)構象的能量與所述能量最小的蛋白質(zhì)構象的能量進行比較,選擇能量小的蛋白質(zhì)構象;
e、重復步驟c d,直至滿足終止條件,得到較優(yōu)蛋白質(zhì)構象;f、對所述較優(yōu)蛋白質(zhì)構象進行Loop重建,得到最優(yōu)蛋白質(zhì)構象。優(yōu)選的,選擇ρ個目標蟻群,初始化蟻群算法參數(shù)時,使P個目標蟻群共享同一個信息素矩陣。優(yōu)選的,所述ρ個目標蟻群在信息素的指引下并行對所述蛋白質(zhì)構象進行優(yōu)化, 利用η個能量函數(shù)對優(yōu)化后的蛋白質(zhì)構象進行能量計算,所述1 < η < ρ。優(yōu)選的,還包括g、將所述最優(yōu)蛋白質(zhì)構象進行交叉,得到交叉蛋白質(zhì)構象,所述交叉蛋白質(zhì)構象和所述最優(yōu)蛋白質(zhì)構象共同構成蛋白質(zhì)構象decoys集。優(yōu)選的,所述步驟c包括Cl、隨機選擇片段庫F;c2、隨機選擇片段位置i,從所述片段庫F中確定第i組片段集合Fi ;c3、目標蟻群在信息素的指引下從片段集合Fi中選擇片段。,并根據(jù)蛋白質(zhì)構象與片段庫的映射關系,用&替換所述初始蛋白質(zhì)構象中對應位置的片段;c4、重復步驟Cl c3,使所述初始蛋白質(zhì)構象上的所有片段至少被替換一次,得到優(yōu)化的蛋白質(zhì)構象;c5、重復步驟Cl c4,直至滿足預定次數(shù)w,得到w個優(yōu)化的蛋白質(zhì)構象;c6、利用能量函數(shù)分別對所述w個優(yōu)化的蛋白質(zhì)構象進行能量計算,選擇能量最小的蛋白質(zhì)構象。優(yōu)選的,所述步驟d包括dl、隨機選擇片段庫F;d2、隨機選擇位置i,從所述片段庫F中確定第i組片段集合Fi ;(13、從&中選擇p-pt個啟發(fā)值η υ最高的片段{fj};d4、根據(jù)蛋白質(zhì)構象與片段庫的映射關系,用{fj中的片段替換步驟c中得到的能量最小蛋白質(zhì)構象中對應位置的片段,計算替換后的蛋白質(zhì)構象與替換前的蛋白質(zhì)構象的能量差Δ E,并判斷是否接受替換如果ΔΕ<0,則接受替換,如果ΔΕ>0,則根據(jù) Metropolis規(guī)則判斷是否接受替換;d5、重復步驟d4,直至{fj}中的p-pt個片段均至少經(jīng)過一次替換;d6、重復步驟dl d5,直至滿足預定次數(shù)Q,得到局部優(yōu)化的蛋白質(zhì)構象;d7、利用能量函數(shù)對所述局部優(yōu)化的蛋白質(zhì)構象進行能量計算,根據(jù)所述計算結(jié)果更新所述信息素矩陣,并將所述局部優(yōu)化后的蛋白質(zhì)構象的能量與所述能量最小的蛋白質(zhì)構象的能量進行比較,選擇能量小的蛋白質(zhì)構象。本發(fā)明還提供可一種蛋白質(zhì)三維結(jié)構的預測裝置,包括蟻群選擇單元,用于選擇目標蟻群;初始化單元,用于初始化蟻群算法參數(shù)和蛋白質(zhì)構象,并建立蛋白質(zhì)構象和片段庫的映射關系;片段選擇單元,用于選擇蛋白質(zhì)構象片段;蟻群控制單元,用于控制所述目標蟻群在信息素的指引下對所述初始蛋白質(zhì)構象進行優(yōu)化;
第一能量計算單元,用于對優(yōu)化后的蛋白質(zhì)構象進行能量計算,并選擇能量最小的蛋白質(zhì)構象;蛋白質(zhì)構象局部優(yōu)化單元,用于對所述能量最小的蛋白質(zhì)構象進行局部優(yōu)化;第二能量計算單元,用于對所述局部優(yōu)化后的蛋白質(zhì)構象進行能量計算;信息素矩陣更新單元,用于根據(jù)第二能量計算單元的計算結(jié)果更新信息素矩陣;比較單元,用于對所述局部優(yōu)化后的蛋白質(zhì)構象的能量與所述能量最小的蛋白質(zhì)構象的能量進行比較,并選擇能量小的蛋白質(zhì)構象;循環(huán)控制單元,用于控制對蛋白質(zhì)構象進行優(yōu)化和局部優(yōu)化操作的循環(huán);判斷單元,用于判斷循環(huán)是否滿足終止條件,如果否,則通知所述蟻群控制單元繼續(xù)進行控制所述目標蟻群在信息素的指引下對所述蛋白質(zhì)構象進行優(yōu)化;如果是,則確定較優(yōu)蛋白質(zhì)構象;Loop重建單元,用于對所述較優(yōu)蛋白質(zhì)構象進行Loop重建,得到最優(yōu)蛋白質(zhì)構象。優(yōu)選的,還包括交叉控制單元,用于將所述最優(yōu)蛋白質(zhì)構象進行交叉。與現(xiàn)有技術相比,本發(fā)明采用并行蟻群算法對蛋白質(zhì)三維結(jié)構進行從頭預測,主要采用并行蟻群算法對蛋白質(zhì)構象進行優(yōu)化,并采用貪婪模擬退火相結(jié)合的方法對所述優(yōu)化后的蛋白質(zhì)構象進行局部優(yōu)化,在局部優(yōu)化的過程中選擇迭代最好解更新并行蟻群共享的信息素矩陣,從而使隨機搜索成為在信息素指引下進行的搜索,提高了搜索的質(zhì)量,從而提高了預測的精度。另外,本發(fā)明融合了不同的能量函數(shù)對優(yōu)化和局部優(yōu)化后的蛋白質(zhì)構象進行評價,使預測得到的蛋白質(zhì)結(jié)構能夠融合不同能量函數(shù)的評價標準,減少單一能量函數(shù)的偏好,從而更接近于蛋白質(zhì)的實際結(jié)構。實驗表明,采用本發(fā)明提供的預測方法對第8屆關于蛋白質(zhì)結(jié)構預測技術評估(the 8th Critical Assessment of Techniques for Protein Structure Prediction, CASP8)的全社會實驗所公布的13個從頭預測類案例進行預測,將得到的結(jié)果與CASP8比賽結(jié)果的實際排名進行對照,其中有2個案例的預測結(jié)果超過CASP8中最好的結(jié)果,7個位列前10名,取得了較好的預測效果。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。圖1為本發(fā)明實施例一提供的蛋白質(zhì)三維結(jié)構的預測方法的流程圖;圖2為本發(fā)明實施例一利用蟻群算法對蛋白質(zhì)構象進行優(yōu)化的流程圖;圖3為本發(fā)明實施例一對蛋白質(zhì)構象進行局部優(yōu)化的流程圖;圖4為本發(fā)明實施例二提供的蛋白質(zhì)三維結(jié)構的預測方法的流程圖;圖5為本發(fā)明實施例三提供的蛋白質(zhì)三維結(jié)構的預測方法的流程圖;圖6為本發(fā)明實施例提供的蛋白質(zhì)三維結(jié)構的預測裝置的結(jié)構示意圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。本發(fā)明公開了一種蛋白質(zhì)三維結(jié)構的預測方法和預測裝置,通過共享信息素矩陣的并行蟻群算法對所述蛋白質(zhì)構象進行優(yōu)化,然后采用貪婪模擬退火相結(jié)合的方法對所述優(yōu)化后的蛋白質(zhì)構象進行局部優(yōu)化,并在局部優(yōu)化的過程中選擇迭代最好解更新并行蟻群共享的信息素矩陣,最后對局部優(yōu)化后的蛋白質(zhì)構象進行Loop重建,得到最優(yōu)蛋白質(zhì)構象。本發(fā)明在并行預測過程中,融合不同的能量函數(shù)對優(yōu)化、局部優(yōu)化和Loop重建后的蛋白質(zhì)構象進行評價,從而使預測得到的蛋白質(zhì)構象能夠融合不同能量函數(shù)的評價標準,減少單一能量函數(shù)的偏好,從而更接近于蛋白質(zhì)的實際結(jié)構。下面結(jié)合實施例對本發(fā)明提供的蛋白質(zhì)三維結(jié)構的預測方法和預測裝置進行詳細描述。實施例一參見圖1,圖1為本發(fā)明實施例一提供的蛋白質(zhì)三維結(jié)構的預測方法的流程圖。步驟S101,選擇目標蟻群,并初始化蟻群算法參數(shù)。執(zhí)行步驟S101,選擇目標蟻群,即確定目標蟻群的數(shù)目,本實施例中確定蟻群數(shù)目為1,即進行基于單蟻群算法的預測。初始化蟻群算法參數(shù),所述蟻群算法參數(shù)包括概率參數(shù)^ ;在本發(fā)明中,概率參數(shù)Cil的取值范圍為W,1],本實施例中將其設置為 0.8 ;信息素τ,本實施例中將其初值設置為10 ;信息素揮發(fā)系數(shù)P,在本發(fā)明中,信息素揮發(fā)系數(shù)P的取值范圍為W,l),本實施例中將其設置為0. 001 ;用于確定循環(huán)次數(shù)的比例因子p-ac,本實施例中將其設置為0.6 ;用于確定循環(huán)次數(shù)的比例因子p-cc,本實施例中將其設置為6 ;螞蟻個數(shù)m,本發(fā)明實施例中將其設置為50。步驟S102、初始化蛋白質(zhì)構象,并建立蛋白質(zhì)構象與片段庫的映射關系。由于蛋白質(zhì)構象具有豐富的自由度而且各自由度基于連續(xù)的變化空間,為便于處理,采用片段庫對搜索空間進行離散化。在本發(fā)明提供的預測方法中,是以任意一個初始的蛋白質(zhì)構象為起點,通過在信息素指導下從片段庫中選擇片段來裝配蛋白質(zhì)結(jié)構,從而得到蛋白質(zhì)構象。因此,需要對蛋白質(zhì)構象進行初始化,確定片段庫,并建立蛋白質(zhì)構象與片段庫的映射關系。在本實施例中,將各殘基的Φ、少和ω分別賦值-150、150和180即可得到近似直鏈的蛋白質(zhì)構象。對于片段庫來說,本發(fā)明同時采用3殘基片段庫和9殘基片段庫兩個片段庫,因此,需要對3殘基片段庫和9殘基片段庫分別建立映射關系,即使各片段庫和蛋白質(zhì)構象具有對應的位置,以便實現(xiàn)后續(xù)優(yōu)化和局部優(yōu)化。
步驟S103、以所述蛋白質(zhì)構象上的任一位置為起點,所述目標蟻群在信息素的指引下對所述蛋白質(zhì)構象進行優(yōu)化,利用能量函數(shù)對優(yōu)化后的蛋白質(zhì)構象進行能量計算,選擇能量最小的蛋白質(zhì)構象。將蟻群和蛋白質(zhì)構象初始化后,開始利用蟻群算法對蛋白質(zhì)構象進行優(yōu)化,參見圖2,圖2為本發(fā)明實施例一利用蟻群算法對蛋白質(zhì)構象進行優(yōu)化的流程圖。步驟S1031、隨機選擇片段庫F。本發(fā)明同時采用3殘基片段庫和9殘基片段庫兩個片段庫,因此,在進行優(yōu)化時, 需要在兩個片段庫之間進行選擇。本實施例中按照公式I進行選擇
權利要求
1.一種蛋白質(zhì)三維結(jié)構的預測方法,包括a、選擇目標蟻群,初始化蟻群算法參數(shù);b、初始化蛋白質(zhì)構象,建立蛋白質(zhì)構象與片段庫的映射關系;c、以所述蛋白質(zhì)構象上的任一位置為起點,所述目標蟻群在信息素的指引下對所述蛋白質(zhì)構象進行優(yōu)化,利用能量函數(shù)對優(yōu)化后的蛋白質(zhì)構象進行能量計算,選擇能量最小的蛋白質(zhì)構象;d、對所述能量最小的蛋白質(zhì)構象進行局部優(yōu)化,利用能量函數(shù)對局部優(yōu)化后的蛋白質(zhì)構象進行能量計算,根據(jù)所述計算結(jié)果更新信息素矩陣,并將所述局部優(yōu)化后的蛋白質(zhì)構象的能量與所述能量最小的蛋白質(zhì)構象的能量進行比較,選擇能量小的蛋白質(zhì)構象;e、重復步驟c d,直至滿足終止條件,得到較優(yōu)蛋白質(zhì)構象;f、對所述較優(yōu)蛋白質(zhì)構象進行Loop重建,得到最優(yōu)蛋白質(zhì)構象。
2.根據(jù)權利要求1所述的預測方法,其特征在于,選擇P個目標蟻群,初始化蟻群算法參數(shù)時,使P個目標蟻群共享同一個信息素矩陣。
3.根據(jù)權利要求2所述的預測方法,其特征在于,所述ρ個目標蟻群在信息素的指引下并行對所述蛋白質(zhì)構象進行優(yōu)化,利用η個能量函數(shù)對優(yōu)化后的蛋白質(zhì)構象進行能量計算,所述1< η彡ρ。
4.根據(jù)權利要求3所述的預測方法,其特征在于,還包括g、將所述最優(yōu)蛋白質(zhì)構象進行交叉,得到交叉蛋白質(zhì)構象,所述交叉蛋白質(zhì)構象和所述最優(yōu)蛋白質(zhì)構象共同構成蛋白質(zhì)構象decoys集。
5.根據(jù)權利要求1 4任意一項所述的預測方法,其特征在于,所述步驟c包括 Cl、隨機選擇片段庫F;c2、隨機選擇片段位置i,從所述片段庫F中確定第i組片段集合Fi ; c3、目標蟻群在信息素的指引下從片段集合Fi中選擇片段。,并根據(jù)蛋白質(zhì)構象與片段庫的映射關系,用A替換所述初始蛋白質(zhì)構象中對應位置的片段;c4、重復步驟cl c3,使所述初始蛋白質(zhì)構象上的所有片段至少被替換一次,得到優(yōu)化的蛋白質(zhì)構象;c5、重復步驟cl c4,直至滿足預定次數(shù)w,得到w個優(yōu)化的蛋白質(zhì)構象; c6、利用能量函數(shù)分別對所述w個優(yōu)化的蛋白質(zhì)構象進行能量計算,選擇能量最小的蛋白質(zhì)構象。
6.根據(jù)權利要求1 4任意一項所述的預測方法,其特征在于,所述步驟d包括 dl、選擇片段庫F;d2、隨機選擇位置i,從所述片段庫F中確定第i組片段集合Fi ; (13、從Fi中選擇p-pt個啟發(fā)值最高的片段{fj};d4、根據(jù)蛋白質(zhì)構象與片段庫的映射關系,用{fj中的片段替換步驟c中得到的能量最小蛋白質(zhì)構象中對應位置的片段,計算替換后的蛋白質(zhì)構象與替換前的蛋白質(zhì)構象的能量差ΔΕ,并判斷是否接受替換如果ΔΕ<0,則接受替換,如果ΔΕ>0,則根據(jù) Metropolis規(guī)則判斷是否接受替換;d5、重復步驟d4,直至{。}中的p-pt個片段均至少經(jīng)過一次替換; d6、重復步驟dl d5,直至滿足預定次數(shù)Q,得到局部優(yōu)化的蛋白質(zhì)構象;d7、利用能量函數(shù)對所述局部優(yōu)化的蛋白質(zhì)構象進行能量計算,根據(jù)所述計算結(jié)果更新所述信息素矩陣,并將所述局部優(yōu)化后的蛋白質(zhì)構象的能量與所述能量最小的蛋白質(zhì)構象的能量進行比較,選擇能量小的蛋白質(zhì)構象。
7.一種蛋白質(zhì)三維結(jié)構的預測裝置,其特征在于,包括 蟻群選擇單元,用于選擇目標蟻群;初始化單元,用于初始化蟻群算法參數(shù)和蛋白質(zhì)構象,并建立蛋白質(zhì)構象和片段庫的映射關系;片段選擇單元,用于選擇蛋白質(zhì)構象片段;蟻群控制單元,用于控制所述目標蟻群在信息素的指引下對所述初始蛋白質(zhì)構象進行優(yōu)化;第一能量計算單元,用于對優(yōu)化后的蛋白質(zhì)構象進行能量計算,并選擇能量最小的蛋白質(zhì)構象;蛋白質(zhì)構象局部優(yōu)化單元,用于對所述能量最小的蛋白質(zhì)構象進行局部優(yōu)化; 第二能量計算單元,用于對所述局部優(yōu)化后的蛋白質(zhì)構象進行能量計算; 信息素矩陣更新單元,用于根據(jù)第二能量計算單元的計算結(jié)果更新信息素矩陣; 比較單元,用于對所述局部優(yōu)化后的蛋白質(zhì)構象的能量與所述能量最小的蛋白質(zhì)構象的能量進行比較,并選擇能量小的蛋白質(zhì)構象;循環(huán)控制單元,用于控制對蛋白質(zhì)構象進行優(yōu)化和局部優(yōu)化操作的循環(huán); 判斷單元,用于判斷循環(huán)是否滿足終止條件,如果否,則通知所述蟻群控制單元繼續(xù)進行控制所述目標蟻群在信息素的指引下對所述蛋白質(zhì)構象進行優(yōu)化;如果是,則確定較優(yōu)蛋白質(zhì)構象;Loop重建單元,用于對所述較優(yōu)蛋白質(zhì)構象進行Loop重建,得到最優(yōu)蛋白質(zhì)構象。
8.根據(jù)權利要求7所述的預測裝置,其特征在于,還包括 交叉控制單元,用于將所述最優(yōu)蛋白質(zhì)構象進行交叉。
全文摘要
本發(fā)明提供了一種蛋白質(zhì)三維結(jié)構的預測方法,包括a、選擇目標蟻群,初始化蟻群算法參數(shù);b、初始化蛋白質(zhì)構象,建立蛋白質(zhì)構象與片段庫的映射關系;c、以蛋白質(zhì)構象上的任一位置為起點,目標蟻群在信息素的指引下進行優(yōu)化,對優(yōu)化后的蛋白質(zhì)構象進行能量計算,選擇能量最小的蛋白質(zhì)構象;d、對能量最小的蛋白質(zhì)構象進行局部優(yōu)化,并進行能量計算,根據(jù)計算結(jié)果更新信息素矩陣,并將局部優(yōu)化后的蛋白質(zhì)構象的能量與能量最小的蛋白質(zhì)構象的能量進行比較,選擇能量小的蛋白質(zhì)構象;e、重復步驟c~d,得到較優(yōu)蛋白質(zhì)構象;f、對較優(yōu)蛋白質(zhì)構象進行Loop重建,得到最優(yōu)蛋白質(zhì)構象。本發(fā)明還提供了一種蛋白質(zhì)三維結(jié)構的預測裝置。
文檔編號G06F19/14GK102402649SQ20101028770
公開日2012年4月4日 申請日期2010年9月17日 優(yōu)先權日2010年9月17日
發(fā)明者呂強 申請人:蘇州大學