專利名稱:一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法
技術(shù)領(lǐng)域:
本發(fā)明涉及蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)領(lǐng)域,尤其涉及蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法。
背景技術(shù):
蛋白質(zhì)側(cè)鏈(Side-chain)空間結(jié)構(gòu)是影響蛋白質(zhì)分子結(jié)構(gòu)及功能的重要因素。一方面,不同氨基酸殘基的“R”基團構(gòu)成存在很大差異;另一方面,受蛋白質(zhì)主鏈(Main-chain,或Backbone)構(gòu)成及構(gòu)象、分子溶液環(huán)境等影響,同一種氨基酸殘基“R”基團也將呈現(xiàn)不同構(gòu)象。通常將一種氨基酸殘基“R”基團的特定結(jié)構(gòu)狀態(tài)稱為該殘基的旋轉(zhuǎn)異構(gòu)體(rotational isomer,或稱rotamer)。為便于側(cè)鏈預(yù)測,通常采用化學鍵的扭轉(zhuǎn)角(torsion angles,或稱二面角,dihedral angles)來描述旋轉(zhuǎn)異構(gòu)體。氨基酸殘基中除參與肽鍵形成這一部分(主鏈)的二面角Φ、Ψ、ω外,側(cè)鏈上還存在xl、χ2、χ3、χ4等O到4個不等的二面角。一組二面角序列可以確定蛋白質(zhì)特定的空間結(jié)構(gòu)。蛋白質(zhì)結(jié)構(gòu)預(yù)測就是找出最接近天然結(jié)構(gòu)的這組二面角序列。通常認為蛋白質(zhì)的結(jié)構(gòu)組成單元——氨基酸殘基的側(cè)鏈形態(tài)與蛋白質(zhì)主鏈形態(tài)密切相關(guān)。通常的蛋白質(zhì)側(cè)鏈預(yù)測分為兩大階段:一是基于主鏈形態(tài)分別為每個殘基位置生成側(cè)鏈旋轉(zhuǎn)異構(gòu)體庫;二是基于該庫進行采樣,并結(jié)合主鏈形態(tài)組裝最終構(gòu)象。側(cè)鏈旋轉(zhuǎn)異構(gòu)體庫的生成實際上是一個機器學習問題,從大量已知數(shù)據(jù)集(訓練集)中學習一個連續(xù)模型,然后基于該模型進行采樣,從而構(gòu)建所需的旋轉(zhuǎn)異構(gòu)體庫,作為側(cè)鏈預(yù)測離散空間的表達。目前廣泛采用的側(cè)鏈預(yù)測方法基于側(cè)鏈形態(tài)與主鏈形態(tài)的關(guān)聯(lián)性,通過機器學習的手段,將主鏈形態(tài)信息作為系統(tǒng)的重要輸入,從而導(dǎo)出側(cè)鏈形態(tài)的二面角描述。通常采用的主鏈信息包括殘基類型aa、二級結(jié)構(gòu)類型ss、主鏈扭轉(zhuǎn)角Φ、主鏈扭轉(zhuǎn)角Ψ四種。而描述側(cè)鏈的信息則根據(jù)殘基類型采用O 4個二面角:xl、x2、x3、x4。發(fā)明人認為,除主鏈對側(cè)鏈的影響外,側(cè)鏈二面角之間也有相互影響,而這種影響從側(cè)鏈根部(靠近主鏈部分)到末梢逐級遞減。換言之,殘基側(cè)鏈扭轉(zhuǎn)角一方面受到殘基類型以及主鏈信息的影響,另一方面還受到側(cè)鏈內(nèi)部接近主鏈一側(cè)扭轉(zhuǎn)角的影響。而目前常用的側(cè)鏈預(yù)測方法往往忽略了這種影響。如果考慮到這種影響關(guān)系,在建模時就應(yīng)當將4個X角的推理分別放在不同層次上。本發(fā)明基于動態(tài)貝葉斯網(wǎng)絡(luò)(DynamicBayesianNetworks, DBN),結(jié)合xl、x2、x3、x4對旋轉(zhuǎn)異構(gòu)體結(jié)構(gòu)貢獻的不同,設(shè)計了蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的不足,本發(fā)明所要解決的技術(shù)問題在于提供一種用于蛋白質(zhì)結(jié)構(gòu)側(cè)鏈預(yù)測的層次化建模方法,能夠有效提高蛋白質(zhì)側(cè)鏈預(yù)測質(zhì)量。為此,本發(fā)明采用以下技術(shù)方案,它包括以下步驟:(I).以主鏈信息作為輸入,執(zhí)行第一層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角Xl ;
(2).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角Xl作為輸入,執(zhí)行第二層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x2 ;(3).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角xl、x2作為輸入,執(zhí)行第三層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x3 ;(4).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角xl、x2、x3作為輸入,執(zhí)行第四層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x4。本發(fā)明基于側(cè)鏈形態(tài)既與主鏈形態(tài)有關(guān),又受側(cè)鏈上相鄰二面角的影響這種認識,設(shè)計了蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法。建模方法總體流程如圖1所示。該方法輸入為當前殘基所對應(yīng)的主鏈信息:殘基類型aa、二級結(jié)構(gòu)類型SS、主鏈扭轉(zhuǎn)角0、主鏈扭轉(zhuǎn)角V,輸出為當前殘基的側(cè)鏈二面角描述:xl、x2、x3、x4。圖中實線矩形為推理單元。所有推理單元按層次進行組織。在每一層中,分別根據(jù)各層的實際需求設(shè)計了數(shù)量不等的輸入數(shù)據(jù),而各層只有一個輸出。只保留一個未知結(jié)點,有利于降低模型復(fù)雜程度,緩解數(shù)據(jù)稀疏現(xiàn)象。同時,對每一個側(cè)鏈扭轉(zhuǎn)角的推理,既考慮到主鏈信息的影響,又考慮到主鏈一側(cè)X角的影響,符合對蛋白質(zhì)側(cè)鏈形態(tài)的認識。該方法針對各個層次分別單獨操作。在第一層中,選取殘基類型aa、二級結(jié)構(gòu)類型ss、主鏈二面角0、主鏈二面角V4個屬性作為推理輸入,側(cè)鏈扭轉(zhuǎn)角xl為推理輸出;第二層的輸入在第一層基礎(chǔ)上增加了 xl,側(cè)鏈扭轉(zhuǎn)角x2為推理輸出。以下各層依次類推。由于氨基酸的側(cè)鏈二面角個數(shù)可能為0 4,為便于模型操作,對于側(cè)鏈二面角個數(shù)不足4個的情況,通過標記特殊值的方法加以區(qū)別,即在整理輸出數(shù)據(jù)時,過濾掉特殊值,從而得到符合實際氨基酸結(jié)構(gòu)特點的輸出數(shù)據(jù)。本發(fā)明基于動態(tài)貝葉斯網(wǎng)絡(luò)(DBN)設(shè)計推理單元。本發(fā)明還針對上述各層推理單元,提供了層次化建模方法的訓練流程。訓練流程的輸入為蛋白質(zhì)三維構(gòu)象集合,輸出為各層推理單元的最優(yōu)DBN模型。其中,no Improve表示訓練質(zhì)量未提高次數(shù),convergentlter表示收斂迭代閾值,bestLL表示最好似然值,bestBic表示最好Bic值,具體訓練流程如下:(2.1).為當前層推理單元創(chuàng)建DBN模型對象,記為dbn ;(2.2).為該dbn對象創(chuàng)建EM引擎,記為em ;(2.3).將訓練數(shù)據(jù)裝入em引擎;(2.4).當 nolmprove < convergentlter 時,進入(2.5),否則退出訓練流程;
(2.5).執(zhí)行 em 的 E 步驟;(2.6).計算em的似然值11 ;(2.7).執(zhí)行 em 的 M 步驟;(2.8).如果 11 > bestLL,則用 11 更新 bestLL,同時將 nolmprove 清 0,否貝丨Jnolmprove 自增;(2.9).根據(jù) bestLL 計算 bic 值;(2.10).如果 bic > bestBic,則用 bic 更新 bestBic。具體訓練流程如圖2所示。訓練過程中,采用貝葉斯信息標準BIC打分函數(shù)評價DBN模型質(zhì)量。隨著訓練參數(shù)的增加,模型極大似然值越來越大,因此只能依靠極大似然值來進行模型選擇。而BIC是大樣本前提下對邊緣似然函數(shù)的一種逼近,是一種用于模型選擇的統(tǒng)計方法。其公式如下:BIC = 21n(L)-pin(η) (公式 I)其中,L表示模型極大似然估計,P表示訓練時參數(shù)個數(shù),η表示訓練集數(shù)據(jù)條數(shù)。BIC打分函數(shù)考慮了懲罰機制,使得沒有出現(xiàn)似然值顯著增長的參數(shù)增加被忽略掉。從而在給定數(shù)據(jù)情況下得到最優(yōu)參數(shù)個數(shù),避免得到過擬合模型。本發(fā)明采用Mocappy++l.0工具訓練模型。Mocappy是一個通過MCMC (MarkovChain Monte Carlo)來進行動態(tài)貝葉斯網(wǎng)絡(luò)參數(shù)學習和推理的工具。該工具可以方便地描述與蛋白質(zhì)結(jié)構(gòu)有關(guān)的概率模型,便于程序員將精力集中于模型本身,而不用過多考慮參數(shù)選擇和學習算法。訓練過程的輸出是針對各層推理單元的最優(yōu)DBN模型(根據(jù)bestBic確定),這些模型將用于下一步采樣過程中。本發(fā)明將訓練過程中獲得的上述4個層次推理單元所對應(yīng)的最優(yōu)DBN模型分別標記為nip m2、m3、m4。本發(fā)明還提供了層次化建模方法的采樣流程?;谟柧毩鞒趟@ 得的各層推理單元DBN模型,本發(fā)明針對目標主鏈構(gòu)象,通過各層推理單元進行采樣,以獲得目標主鏈各個殘基位置處的旋轉(zhuǎn)異構(gòu)體庫。為此設(shè)計了層次化建模方法的采樣流程。采樣流程的輸入為已知目標主鏈構(gòu)象信息,包括上述殘基類型aa、二級結(jié)構(gòu)類型ss、主鏈扭轉(zhuǎn)角Φ、主鏈扭轉(zhuǎn)角Ψ等四種;輸出為主鏈各殘基位置處所對應(yīng)的旋轉(zhuǎn)異構(gòu)體庫。由于輸出的側(cè)鏈扭轉(zhuǎn)角逐層疊加,最終的旋轉(zhuǎn)異構(gòu)體信息集中在第四層輸出當中。在米樣過程中,本發(fā)明將用于第一層米樣的輸入信息稱為b1;僅包含aa、ss、Φ、Ψ等已知數(shù)據(jù),隱結(jié)點信息設(shè)置為0,xl為空(用O表示)。接下來對第一層采樣的結(jié)果進行調(diào)整,增加已知的xl角度,并設(shè)置x2為空。調(diào)整之后,將其作為第二層采樣的輸入信息,本發(fā)明稱其為b2。同樣,在第二層采樣結(jié)果的基礎(chǔ)上增加x2角度,并設(shè)置x3為空,作為第三層輸入信息,稱為b3 ;在第三層采樣結(jié)果的基礎(chǔ)上增加x3角度,并設(shè)置x4為空,作為第四層輸入信息,稱為b4。每層通過采樣的方式,依次增加已知信息,并向下一層傳遞。具體采樣步驟如下:(3.1).參數(shù)初始化,包括采樣信息Id1初始化為主鏈信息,符號1^、m2、m3、m4表示訓練流程輸出的針對第I 4層推理單元的DBN模型,采樣次數(shù)t由用戶輸入,該流程中用符號S表示采樣結(jié)果集合,即最終的旋轉(zhuǎn)異構(gòu)體庫;(3.2).為第I層推理單元的DBN模型Hi1計算Viterbi路徑P1 ;(3.3).設(shè)置循環(huán)計數(shù)器i = 1,j = I ;(3.4).基于Viterbi路徑p]和采樣信息bp采用模型n^_進行一次采樣,采樣結(jié)果記入Sj ;(3.5).基于Sj為第j+Ι層構(gòu)建米樣信息bj+1,該米樣信息在權(quán)利要求1中描述為各層的輸入信息;(3.6).為第j+Ι層推理單元的DBN模型計算Viterbi路徑pJ+1 ;(3.7).計數(shù)器 j增 I;(3.8).如果 j < 4,轉(zhuǎn)第(3.4)步;(3.9).將采樣結(jié)果S4累計保存到結(jié)果集合S中;
(3.10).計數(shù)器i 增 I ;(3.11) 如果 i ≤ t,轉(zhuǎn)第(3.4)步。具體采樣流程如圖3所示。每一次采樣結(jié)果保存在S4中,而最終的采樣結(jié)果累積到S中。S的結(jié)構(gòu)可分為t個部分,每部分對應(yīng)目標蛋白質(zhì)一條完整的采樣結(jié)構(gòu)。在每一部分中,整條蛋白質(zhì)主鏈每個殘基位置對應(yīng)I個旋轉(zhuǎn)異構(gòu)體,每個旋轉(zhuǎn)異構(gòu)體占I行。這樣,對于長度為n的主鏈的每個位置i而言,其所對應(yīng)的t個旋轉(zhuǎn)異構(gòu)體分別位于結(jié)果S中的第nX (j-l)+i行,其中j =l,2,...,t。S的結(jié)構(gòu)如圖4所示。對結(jié)構(gòu)預(yù)測而言,獲取采樣結(jié)果之后,接下來將進行結(jié)構(gòu)裝配,具體到側(cè)鏈預(yù)測就是為目標主鏈結(jié)構(gòu)添加側(cè)鏈,形成最終的三維構(gòu)象。本發(fā)明重點在于提供側(cè)鏈預(yù)測的層次化建模方法,在裝配結(jié)構(gòu)之前還進行了層次化建模方法的評價。對層次化建模方法的評價包括兩個方面:各層推理單元的DBN模型質(zhì)量;最終采樣的旋轉(zhuǎn)異構(gòu)體庫質(zhì)量。兩個方面的評價結(jié)果表明本發(fā)明所提出的層次化建模方法能夠更準確地模擬天然蛋白質(zhì)側(cè)鏈扭轉(zhuǎn)角狀態(tài),生成質(zhì)量更高的DBN模型;并基于這些DBN模型采樣獲得了質(zhì)量更高的旋轉(zhuǎn)異構(gòu)體庫。因此,本發(fā)明對于提高蛋白質(zhì)側(cè)鏈預(yù)測質(zhì)量具有基礎(chǔ)意義。
為了更清楚地說明本發(fā)明,下面將對本發(fā)明和現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹。顯而易見地,下面描述中的附圖僅僅是本發(fā)明所針對的方法原理及本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。圖1是蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法的總體流程圖。圖2是層次化建模方法訓練階段的流程圖。圖3是層次化建模方法采樣階段的流程圖。圖4是最終采樣結(jié)果S的結(jié)構(gòu)示意圖。圖5a、5b、5c、5d分別是本發(fā)明實施例提供的訓練方法實驗結(jié)果圖:DBN模型BIC值。圖5a是為第一層推理單元訓練而得到的49個DBN模型所對應(yīng)的BIC值。橫坐標為模型編號,縱坐標為BIC值。與圖5a類似,圖5b、5c、5d分別對應(yīng)于第二、三、四層推理單元DBN模型的BIC值。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。本發(fā)明公開了一種蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法,通過對蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中所提供的結(jié)構(gòu)數(shù)據(jù)進行分類,分別用于不同層次上的訓練。該方法既考慮到主鏈形態(tài)對側(cè)鏈結(jié)構(gòu)的影響,又考慮到側(cè)鏈扭轉(zhuǎn)角之間的影響關(guān)系。對每一個層次而言,由于有針對性地選擇了適合的訓練數(shù)據(jù),相對減少了訓練數(shù)據(jù)的稀疏性,提高了各層次上的訓練質(zhì)量,并成功獲得了質(zhì)量較高的DBN模型。同時,基于每一層所對應(yīng)的最好DBN模型進行采樣,將采樣結(jié)果封裝為下一次所需要的采樣數(shù)據(jù),依次對每一層進行采樣。本發(fā)明在蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法的采樣中,獲得了質(zhì)量較高的旋轉(zhuǎn)異構(gòu)體庫,表明本發(fā)明的方法有望組裝出質(zhì)量較高的蛋白質(zhì)三維結(jié)構(gòu)。下面結(jié)合實施例對本發(fā)明提供的蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法進行詳細描述。實施例一采用的訓練數(shù)據(jù)是與Dunbrack庫所采用的訓練集相同的850個蛋白質(zhì)。這些數(shù)據(jù)是PDB庫中通過X射線晶體學方法得到的。如果PDB結(jié)構(gòu)中含有多條鏈,則只取其中的A鏈,且保證任意兩條鏈之間相似性不超過50%。訓練流程需要用到以下8種數(shù)據(jù):殘基類型aa、二級結(jié)構(gòu)類型ss、主鏈扭轉(zhuǎn)角Φ、主鏈扭轉(zhuǎn)角¥、側(cè)鏈扭轉(zhuǎn)角11、12、13和14。訓練之前需要將信息數(shù)字化,將連續(xù)數(shù)據(jù)離散化。首先是蛋白質(zhì)類型,目前已知參與蛋白質(zhì)組成的常見氨基酸只有20種,因此蛋白質(zhì)類型本身就是離散化的信息,分別用整數(shù)O 19表示。同樣,主鏈二級結(jié)構(gòu)也是離散信息。本發(fā)明所考慮的蛋白質(zhì)二級結(jié)構(gòu)只有α螺旋、β折疊、Loop三種,分別用整數(shù)O 2表示。而扭轉(zhuǎn)角信息是連續(xù)值,本發(fā)明以1°為單位將連續(xù)值離散化,即舍棄小數(shù)位。這樣即方便訓練模型,又不會因過度離散化而丟失太多信息。此外,由于20種氨基酸的側(cè)鏈各不相同,有些氨基酸沒有側(cè)鏈或側(cè)鏈各種形態(tài)等價,即X角不存在,本發(fā)明將這種情況下的X角度值用數(shù)值360表示。因此,X角度值離散化之后有361個可能數(shù)值(O 360)。本發(fā)明在16核1.6-GHz AMD CPU的AMD機群上并行對四個層次進行訓練。實驗設(shè)置模型編號H < 50,因此每層分別訓練了 49個DBN模型。訓練結(jié)果中每個DBN模型的BIC如圖5所示。圖5a 5d分別描述了第I 4層的訓練結(jié)果。橫坐標是DBN模型編號H,縱坐標是其BIC值。由圖中可以看出,在整個訓練過程中,各DBN模型的BIC值先上升,最高值分別位于曲線前半段,然后逐漸下降,并趨于穩(wěn)定。由于訓練過程相當耗時,因此確定合理的H值有助于有效節(jié)約訓練時間。根據(jù)當前實驗數(shù)據(jù)的變化趨勢,當H > 50時應(yīng)該難以有更高的BIC出現(xiàn)。說明設(shè)置H < 50比較合理。最終根據(jù)BIC選擇的最優(yōu)DBN模型及相關(guān)訓練情況如表I所示。表I層次化建模方法訓練結(jié)果
權(quán)利要求
1.一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法,其特征在于它包括以下步驟: (1).以主鏈信息作為輸入,執(zhí)行第一層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角Xl; (2).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角Xl作為輸入,執(zhí)行第二層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x2 ; (3).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角xl、x2作為輸入,執(zhí)行第三層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x3 ; (4).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角xl、x2、x3作為輸入,執(zhí)行第四層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x4。
2.根據(jù)權(quán)利要求1所述的一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法,其特征在于,針對上述各層推理單元,還提供了層次化建模方法的訓練流程;訓練流程輸入為蛋白質(zhì)三維構(gòu)象集合,輸出為對應(yīng)于各層推理單元的DBN模型;訓練流程涉及以下參數(shù)moImpiOve表示訓練質(zhì)量未提高次數(shù),convergentlter表示收斂迭代閾值,bestLL表示最好似然值,bestBic表示最好Bic值;所述訓練流程包括以下過程: (2.1).為當前層推理單元創(chuàng)建DBN模型對象,記為dbn ; (2.2).為該dbn對象創(chuàng)建EM引擎,記為em ; (2.3).將訓練數(shù)據(jù)裝入em引擎; (2.4).當 no Improve < convergentlter 時,進入(2.5),否則退出訓練流程; (2.5).執(zhí)行em的E步驟; (2.6).計算em的似然值11 ; (2.7).執(zhí)行em的M步驟;(2.8).如果 11 > bestLL,則用 11 更新 bestLL,同時將 no Improve 清 O,否則 no Improve自增; (2.9).根據(jù) bestLL 計算 bic 值; (2.10).如果 bic > bestBic,則用 bic 更新 bestBic。
3.根據(jù)權(quán)利要求1所述的一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法,其特征在于,針對所述各層推理單元,并結(jié)合權(quán)利要求2所述訓練流程輸出的對應(yīng)于各層推理單元的DBN模型,它還提供了層次化建模方法的采樣流程;采樣流程輸入為目標骨架信息,并結(jié)合對應(yīng)于各層推理單元的DBN模型進行采樣,輸出為目標骨架各殘基位置處的旋轉(zhuǎn)異構(gòu)體庫;采樣流程包括: (3.1).參數(shù)初始化,包括采樣信息Id1初始化為主鏈信息,符號m2、m3、m4表示訓練流程輸出的針對第I 4層推理單元的DBN模型,采樣次數(shù)t由用戶輸入,該流程中用符號S表示采樣結(jié)果集合,即最終的旋轉(zhuǎn)異構(gòu)體庫; (3.2).為第I層推理單元的DBN模型Iii1計算Viterbi路徑P1 ; (3.3).設(shè)置循環(huán)計數(shù)器i = 1,j = I ; (3.4).基于Viterbi路徑p]和采樣信息Iv采用模型π^_進行一次采樣,采樣結(jié)果記入Sj ; (3.5).基于Sj為第j+Ι層構(gòu)建米樣信息bj+1,該米樣信息在權(quán)利要求1中描述為各層的輸入信息; (3.6).為第j+Ι層推理單元的DBN模型計算Viterbi路徑pj+1 ;(3.7).計數(shù)器j增1;(3.8).如果j <4,轉(zhuǎn)第(3.4)步;(3.9).將采樣結(jié)果S4累計保存到結(jié)果集合S中;(3.10).計數(shù)器i增I;(3.11).如 果 i ( t,轉(zhuǎn)第(3.4)步。
全文摘要
本發(fā)明提供了一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法。它包括以下步驟(1)以主鏈信息作為輸入,執(zhí)行第一層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x1;(2)以主鏈信息、側(cè)鏈扭轉(zhuǎn)角x1作為輸入,執(zhí)行第二層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x2;(3)以主鏈信息、側(cè)鏈扭轉(zhuǎn)角x1、x2作為輸入,執(zhí)行第三層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x3;(4)以主鏈信息、側(cè)鏈扭轉(zhuǎn)角x1、x2、x3作為輸入,執(zhí)行第四層推理單元,輸出側(cè)鏈扭轉(zhuǎn)角x4。在該層次化建模方法基礎(chǔ)上,針對上述各層推理單元,本發(fā)明還提供了層次化建模方法的訓練流程。同時,針對所述各層推理單元,并結(jié)合訓練流程輸出的對應(yīng)于各層推理單元的DBN模型,還提供了層次化建模方法的采樣流程。
文檔編號G06F19/12GK103093117SQ20131001549
公開日2013年5月8日 申請日期2013年1月16日 優(yōu)先權(quán)日2013年1月16日
發(fā)明者蔣云良, 黃旭, 呂強, 繆大俊, 錢培德, 范婧 申請人:湖州師范學院