一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法

文檔序號：6397920閱讀：778來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法
技術(shù)領(lǐng)域：
本發(fā)明涉及蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)領(lǐng)域，尤其涉及蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法。
背景技術(shù)：
蛋白質(zhì)側(cè)鏈(Side-chain)空間結(jié)構(gòu)是影響蛋白質(zhì)分子結(jié)構(gòu)及功能的重要因素。一方面，不同氨基酸殘基的“R”基團構(gòu)成存在很大差異；另一方面，受蛋白質(zhì)主鏈(Main-chain,或Backbone)構(gòu)成及構(gòu)象、分子溶液環(huán)境等影響，同一種氨基酸殘基“R”基團也將呈現(xiàn)不同構(gòu)象。通常將一種氨基酸殘基“R”基團的特定結(jié)構(gòu)狀態(tài)稱為該殘基的旋轉(zhuǎn)異構(gòu)體(rotational isomer,或稱rotamer)。為便于側(cè)鏈預(yù)測,通常采用化學鍵的扭轉(zhuǎn)角(torsion angles,或稱二面角，dihedral angles)來描述旋轉(zhuǎn)異構(gòu)體。氨基酸殘基中除參與肽鍵形成這一部分(主鏈)的二面角Φ、Ψ、ω外，側(cè)鏈上還存在xl、χ2、χ3、χ4等O到4個不等的二面角。一組二面角序列可以確定蛋白質(zhì)特定的空間結(jié)構(gòu)。蛋白質(zhì)結(jié)構(gòu)預(yù)測就是找出最接近天然結(jié)構(gòu)的這組二面角序列。通常認為蛋白質(zhì)的結(jié)構(gòu)組成單元——氨基酸殘基的側(cè)鏈形態(tài)與蛋白質(zhì)主鏈形態(tài)密切相關(guān)。通常的蛋白質(zhì)側(cè)鏈預(yù)測分為兩大階段:一是基于主鏈形態(tài)分別為每個殘基位置生成側(cè)鏈旋轉(zhuǎn)異構(gòu)體庫；二是基于該庫進行采樣，并結(jié)合主鏈形態(tài)組裝最終構(gòu)象。側(cè)鏈旋轉(zhuǎn)異構(gòu)體庫的生成實際上是一個機器學習問題，從大量已知數(shù)據(jù)集(訓練集)中學習一個連續(xù)模型，然后基于該模型進行采樣，從而構(gòu)建所需的旋轉(zhuǎn)異構(gòu)體庫，作為側(cè)鏈預(yù)測離散空間的表達。目前廣泛采用的側(cè)鏈預(yù)測方法基于側(cè)鏈形態(tài)與主鏈形態(tài)的關(guān)聯(lián)性，通過機器學習的手段，將主鏈形態(tài)信息作為系統(tǒng)的重要輸入，從而導(dǎo)出側(cè)鏈形態(tài)的二面角描述。通常采用的主鏈信息包括殘基類型aa、二級結(jié)構(gòu)類型ss、主鏈扭轉(zhuǎn)角Φ、主鏈扭轉(zhuǎn)角Ψ四種。而描述側(cè)鏈的信息則根據(jù)殘基類型采用O 4個二面角:xl、x2、x3、x4。發(fā)明人認為，除主鏈對側(cè)鏈的影響外，側(cè)鏈二面角之間也有相互影響，而這種影響從側(cè)鏈根部(靠近主鏈部分)到末梢逐級遞減。換言之，殘基側(cè)鏈扭轉(zhuǎn)角一方面受到殘基類型以及主鏈信息的影響，另一方面還受到側(cè)鏈內(nèi)部接近主鏈一側(cè)扭轉(zhuǎn)角的影響。而目前常用的側(cè)鏈預(yù)測方法往往忽略了這種影響。如果考慮到這種影響關(guān)系，在建模時就應(yīng)當將4個X角的推理分別放在不同層次上。本發(fā)明基于動態(tài)貝葉斯網(wǎng)絡(luò)(DynamicBayesianNetworks, DBN),結(jié)合xl、x2、x3、x4對旋轉(zhuǎn)異構(gòu)體結(jié)構(gòu)貢獻的不同，設(shè)計了蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法。

發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)的不足，本發(fā)明所要解決的技術(shù)問題在于提供一種用于蛋白質(zhì)結(jié)構(gòu)側(cè)鏈預(yù)測的層次化建模方法，能夠有效提高蛋白質(zhì)側(cè)鏈預(yù)測質(zhì)量。為此，本發(fā)明采用以下技術(shù)方案，它包括以下步驟:(I).以主鏈信息作為輸入，執(zhí)行第一層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角Xl ；
(2).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角Xl作為輸入，執(zhí)行第二層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x2 ；(3).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角xl、x2作為輸入，執(zhí)行第三層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x3 ；(4).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角xl、x2、x3作為輸入，執(zhí)行第四層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x4。本發(fā)明基于側(cè)鏈形態(tài)既與主鏈形態(tài)有關(guān)，又受側(cè)鏈上相鄰二面角的影響這種認識，設(shè)計了蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法。建模方法總體流程如圖1所示。該方法輸入為當前殘基所對應(yīng)的主鏈信息:殘基類型aa、二級結(jié)構(gòu)類型SS、主鏈扭轉(zhuǎn)角0、主鏈扭轉(zhuǎn)角V，輸出為當前殘基的側(cè)鏈二面角描述:xl、x2、x3、x4。圖中實線矩形為推理單元。所有推理單元按層次進行組織。在每一層中，分別根據(jù)各層的實際需求設(shè)計了數(shù)量不等的輸入數(shù)據(jù)，而各層只有一個輸出。只保留一個未知結(jié)點，有利于降低模型復(fù)雜程度，緩解數(shù)據(jù)稀疏現(xiàn)象。同時，對每一個側(cè)鏈扭轉(zhuǎn)角的推理，既考慮到主鏈信息的影響，又考慮到主鏈一側(cè)X角的影響，符合對蛋白質(zhì)側(cè)鏈形態(tài)的認識。該方法針對各個層次分別單獨操作。在第一層中，選取殘基類型aa、二級結(jié)構(gòu)類型ss、主鏈二面角0、主鏈二面角V4個屬性作為推理輸入，側(cè)鏈扭轉(zhuǎn)角xl為推理輸出；第二層的輸入在第一層基礎(chǔ)上增加了 xl，側(cè)鏈扭轉(zhuǎn)角x2為推理輸出。以下各層依次類推。由于氨基酸的側(cè)鏈二面角個數(shù)可能為0 4，為便于模型操作，對于側(cè)鏈二面角個數(shù)不足4個的情況，通過標記特殊值的方法加以區(qū)別，即在整理輸出數(shù)據(jù)時，過濾掉特殊值，從而得到符合實際氨基酸結(jié)構(gòu)特點的輸出數(shù)據(jù)。本發(fā)明基于動態(tài)貝葉斯網(wǎng)絡(luò)(DBN)設(shè)計推理單元。本發(fā)明還針對上述各層推理單元，提供了層次化建模方法的訓練流程。訓練流程的輸入為蛋白質(zhì)三維構(gòu)象集合，輸出為各層推理單元的最優(yōu)DBN模型。其中，no Improve表示訓練質(zhì)量未提高次數(shù)，convergentlter表示收斂迭代閾值，bestLL表示最好似然值，bestBic表示最好Bic值,具體訓練流程如下:(2.1).為當前層推理單元創(chuàng)建DBN模型對象，記為dbn ；(2.2).為該dbn對象創(chuàng)建EM引擎,記為em ;(2.3).將訓練數(shù)據(jù)裝入em引擎；(2.4).當 nolmprove < convergentlter 時，進入(2.5),否則退出訓練流程；
(2.5).執(zhí)行 em 的 E 步驟；(2.6).計算em的似然值11 ；(2.7).執(zhí)行 em 的 M 步驟；(2.8).如果 11 > bestLL,則用 11 更新 bestLL,同時將 nolmprove 清 0,否貝丨Jnolmprove 自增；(2.9).根據(jù) bestLL 計算 bic 值；(2.10).如果 bic > bestBic,則用 bic 更新 bestBic。具體訓練流程如圖2所示。訓練過程中，采用貝葉斯信息標準BIC打分函數(shù)評價DBN模型質(zhì)量。隨著訓練參數(shù)的增加，模型極大似然值越來越大，因此只能依靠極大似然值來進行模型選擇。而BIC是大樣本前提下對邊緣似然函數(shù)的一種逼近，是一種用于模型選擇的統(tǒng)計方法。其公式如下:BIC = 21n(L)-pin(η) (公式 I)其中，L表示模型極大似然估計，P表示訓練時參數(shù)個數(shù)，η表示訓練集數(shù)據(jù)條數(shù)。BIC打分函數(shù)考慮了懲罰機制，使得沒有出現(xiàn)似然值顯著增長的參數(shù)增加被忽略掉。從而在給定數(shù)據(jù)情況下得到最優(yōu)參數(shù)個數(shù)，避免得到過擬合模型。本發(fā)明采用Mocappy++l.0工具訓練模型。Mocappy是一個通過MCMC (MarkovChain Monte Carlo)來進行動態(tài)貝葉斯網(wǎng)絡(luò)參數(shù)學習和推理的工具。該工具可以方便地描述與蛋白質(zhì)結(jié)構(gòu)有關(guān)的概率模型，便于程序員將精力集中于模型本身，而不用過多考慮參數(shù)選擇和學習算法。訓練過程的輸出是針對各層推理單元的最優(yōu)DBN模型(根據(jù)bestBic確定)，這些模型將用于下一步采樣過程中。本發(fā)明將訓練過程中獲得的上述4個層次推理單元所對應(yīng)的最優(yōu)DBN模型分別標記為nip m2、m3、m4。本發(fā)明還提供了層次化建模方法的采樣流程?；谟柧毩鞒趟@ 得的各層推理單元DBN模型，本發(fā)明針對目標主鏈構(gòu)象，通過各層推理單元進行采樣，以獲得目標主鏈各個殘基位置處的旋轉(zhuǎn)異構(gòu)體庫。為此設(shè)計了層次化建模方法的采樣流程。采樣流程的輸入為已知目標主鏈構(gòu)象信息，包括上述殘基類型aa、二級結(jié)構(gòu)類型ss、主鏈扭轉(zhuǎn)角Φ、主鏈扭轉(zhuǎn)角Ψ等四種；輸出為主鏈各殘基位置處所對應(yīng)的旋轉(zhuǎn)異構(gòu)體庫。由于輸出的側(cè)鏈扭轉(zhuǎn)角逐層疊加，最終的旋轉(zhuǎn)異構(gòu)體信息集中在第四層輸出當中。在米樣過程中，本發(fā)明將用于第一層米樣的輸入信息稱為b1;僅包含aa、ss、Φ、Ψ等已知數(shù)據(jù)，隱結(jié)點信息設(shè)置為0，xl為空(用O表示)。接下來對第一層采樣的結(jié)果進行調(diào)整，增加已知的xl角度，并設(shè)置x2為空。調(diào)整之后，將其作為第二層采樣的輸入信息，本發(fā)明稱其為b2。同樣，在第二層采樣結(jié)果的基礎(chǔ)上增加x2角度，并設(shè)置x3為空，作為第三層輸入信息，稱為b3 ;在第三層采樣結(jié)果的基礎(chǔ)上增加x3角度，并設(shè)置x4為空，作為第四層輸入信息，稱為b4。每層通過采樣的方式，依次增加已知信息，并向下一層傳遞。具體采樣步驟如下:(3.1).參數(shù)初始化,包括采樣信息Id1初始化為主鏈信息,符號1^、m2、m3、m4表示訓練流程輸出的針對第I 4層推理單元的DBN模型，采樣次數(shù)t由用戶輸入，該流程中用符號S表示采樣結(jié)果集合，即最終的旋轉(zhuǎn)異構(gòu)體庫；(3.2).為第I層推理單元的DBN模型Hi1計算Viterbi路徑P1 ；(3.3).設(shè)置循環(huán)計數(shù)器i = 1，j = I ;(3.4).基于Viterbi路徑p]和采樣信息bp采用模型n^_進行一次采樣，采樣結(jié)果記入Sj ；(3.5).基于Sj為第j+Ι層構(gòu)建米樣信息bj+1,該米樣信息在權(quán)利要求1中描述為各層的輸入信息；(3.6).為第j+Ι層推理單元的DBN模型計算Viterbi路徑pJ+1 ；(3.7).計數(shù)器 j增 I;(3.8).如果 j < 4，轉(zhuǎn)第(3.4)步;(3.9).將采樣結(jié)果S4累計保存到結(jié)果集合S中；
(3.10).計數(shù)器i 增 I ;(3.11) 如果 i ≤ t，轉(zhuǎn)第(3.4)步。具體采樣流程如圖3所示。每一次采樣結(jié)果保存在S4中，而最終的采樣結(jié)果累積到S中。S的結(jié)構(gòu)可分為t個部分，每部分對應(yīng)目標蛋白質(zhì)一條完整的采樣結(jié)構(gòu)。在每一部分中，整條蛋白質(zhì)主鏈每個殘基位置對應(yīng)I個旋轉(zhuǎn)異構(gòu)體，每個旋轉(zhuǎn)異構(gòu)體占I行。這樣，對于長度為n的主鏈的每個位置i而言，其所對應(yīng)的t個旋轉(zhuǎn)異構(gòu)體分別位于結(jié)果S中的第nX (j-l)+i行，其中j =l，2，...，t。S的結(jié)構(gòu)如圖4所示。對結(jié)構(gòu)預(yù)測而言，獲取采樣結(jié)果之后，接下來將進行結(jié)構(gòu)裝配，具體到側(cè)鏈預(yù)測就是為目標主鏈結(jié)構(gòu)添加側(cè)鏈，形成最終的三維構(gòu)象。本發(fā)明重點在于提供側(cè)鏈預(yù)測的層次化建模方法，在裝配結(jié)構(gòu)之前還進行了層次化建模方法的評價。對層次化建模方法的評價包括兩個方面:各層推理單元的DBN模型質(zhì)量；最終采樣的旋轉(zhuǎn)異構(gòu)體庫質(zhì)量。兩個方面的評價結(jié)果表明本發(fā)明所提出的層次化建模方法能夠更準確地模擬天然蛋白質(zhì)側(cè)鏈扭轉(zhuǎn)角狀態(tài)，生成質(zhì)量更高的DBN模型；并基于這些DBN模型采樣獲得了質(zhì)量更高的旋轉(zhuǎn)異構(gòu)體庫。因此，本發(fā)明對于提高蛋白質(zhì)側(cè)鏈預(yù)測質(zhì)量具有基礎(chǔ)意義。

為了更清楚地說明本發(fā)明，下面將對本發(fā)明和現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹。顯而易見地，下面描述中的附圖僅僅是本發(fā)明所針對的方法原理及本發(fā)明的實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)提供的附圖獲得其他的附圖。圖1是蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法的總體流程圖。圖2是層次化建模方法訓練階段的流程圖。圖3是層次化建模方法采樣階段的流程圖。圖4是最終采樣結(jié)果S的結(jié)構(gòu)示意圖。圖5a、5b、5c、5d分別是本發(fā)明實施例提供的訓練方法實驗結(jié)果圖:DBN模型BIC值。圖5a是為第一層推理單元訓練而得到的49個DBN模型所對應(yīng)的BIC值。橫坐標為模型編號，縱坐標為BIC值。與圖5a類似，圖5b、5c、5d分別對應(yīng)于第二、三、四層推理單元DBN模型的BIC值。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發(fā)明一部分實施例，而不是全部的實施例。基于本發(fā)明中的實施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。本發(fā)明公開了一種蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法，通過對蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中所提供的結(jié)構(gòu)數(shù)據(jù)進行分類，分別用于不同層次上的訓練。該方法既考慮到主鏈形態(tài)對側(cè)鏈結(jié)構(gòu)的影響，又考慮到側(cè)鏈扭轉(zhuǎn)角之間的影響關(guān)系。對每一個層次而言，由于有針對性地選擇了適合的訓練數(shù)據(jù)，相對減少了訓練數(shù)據(jù)的稀疏性，提高了各層次上的訓練質(zhì)量，并成功獲得了質(zhì)量較高的DBN模型。同時，基于每一層所對應(yīng)的最好DBN模型進行采樣，將采樣結(jié)果封裝為下一次所需要的采樣數(shù)據(jù)，依次對每一層進行采樣。本發(fā)明在蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法的采樣中，獲得了質(zhì)量較高的旋轉(zhuǎn)異構(gòu)體庫，表明本發(fā)明的方法有望組裝出質(zhì)量較高的蛋白質(zhì)三維結(jié)構(gòu)。下面結(jié)合實施例對本發(fā)明提供的蛋白質(zhì)側(cè)鏈預(yù)測層次化建模方法進行詳細描述。實施例一采用的訓練數(shù)據(jù)是與Dunbrack庫所采用的訓練集相同的850個蛋白質(zhì)。這些數(shù)據(jù)是PDB庫中通過X射線晶體學方法得到的。如果PDB結(jié)構(gòu)中含有多條鏈，則只取其中的A鏈，且保證任意兩條鏈之間相似性不超過50%。訓練流程需要用到以下8種數(shù)據(jù):殘基類型aa、二級結(jié)構(gòu)類型ss、主鏈扭轉(zhuǎn)角Φ、主鏈扭轉(zhuǎn)角￥、側(cè)鏈扭轉(zhuǎn)角11、12、13和14。訓練之前需要將信息數(shù)字化，將連續(xù)數(shù)據(jù)離散化。首先是蛋白質(zhì)類型，目前已知參與蛋白質(zhì)組成的常見氨基酸只有20種，因此蛋白質(zhì)類型本身就是離散化的信息，分別用整數(shù)O 19表示。同樣，主鏈二級結(jié)構(gòu)也是離散信息。本發(fā)明所考慮的蛋白質(zhì)二級結(jié)構(gòu)只有α螺旋、β折疊、Loop三種，分別用整數(shù)O 2表示。而扭轉(zhuǎn)角信息是連續(xù)值，本發(fā)明以1°為單位將連續(xù)值離散化，即舍棄小數(shù)位。這樣即方便訓練模型，又不會因過度離散化而丟失太多信息。此外，由于20種氨基酸的側(cè)鏈各不相同，有些氨基酸沒有側(cè)鏈或側(cè)鏈各種形態(tài)等價，即X角不存在，本發(fā)明將這種情況下的X角度值用數(shù)值360表示。因此，X角度值離散化之后有361個可能數(shù)值(O 360)。本發(fā)明在16核1.6-GHz AMD CPU的AMD機群上并行對四個層次進行訓練。實驗設(shè)置模型編號H < 50，因此每層分別訓練了 49個DBN模型。訓練結(jié)果中每個DBN模型的BIC如圖5所示。圖5a 5d分別描述了第I 4層的訓練結(jié)果。橫坐標是DBN模型編號H,縱坐標是其BIC值。由圖中可以看出，在整個訓練過程中，各DBN模型的BIC值先上升，最高值分別位于曲線前半段，然后逐漸下降，并趨于穩(wěn)定。由于訓練過程相當耗時，因此確定合理的H值有助于有效節(jié)約訓練時間。根據(jù)當前實驗數(shù)據(jù)的變化趨勢，當H > 50時應(yīng)該難以有更高的BIC出現(xiàn)。說明設(shè)置H < 50比較合理。最終根據(jù)BIC選擇的最優(yōu)DBN模型及相關(guān)訓練情況如表I所示。表I層次化建模方法訓練結(jié)果
權(quán)利要求
1.一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法，其特征在于它包括以下步驟: (1).以主鏈信息作為輸入，執(zhí)行第一層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角Xl； (2).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角Xl作為輸入，執(zhí)行第二層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x2 ； (3).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角xl、x2作為輸入，執(zhí)行第三層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x3 ； (4).以主鏈信息、側(cè)鏈扭轉(zhuǎn)角xl、x2、x3作為輸入，執(zhí)行第四層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x4。
2.根據(jù)權(quán)利要求1所述的一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法，其特征在于，針對上述各層推理單元，還提供了層次化建模方法的訓練流程；訓練流程輸入為蛋白質(zhì)三維構(gòu)象集合，輸出為對應(yīng)于各層推理單元的DBN模型；訓練流程涉及以下參數(shù)moImpiOve表示訓練質(zhì)量未提高次數(shù)，convergentlter表示收斂迭代閾值，bestLL表示最好似然值，bestBic表示最好Bic值；所述訓練流程包括以下過程: (2.1).為當前層推理單元創(chuàng)建DBN模型對象，記為dbn ； (2.2).為該dbn對象創(chuàng)建EM引擎,記為em ; (2.3).將訓練數(shù)據(jù)裝入em引擎； (2.4).當 no Improve < convergentlter 時，進入(2.5),否則退出訓練流程； (2.5).執(zhí)行em的E步驟； (2.6).計算em的似然值11 ； (2.7).執(zhí)行em的M步驟；(2.8).如果 11 > bestLL,則用 11 更新 bestLL,同時將 no Improve 清 O,否則 no Improve自增； (2.9).根據(jù) bestLL 計算 bic 值； (2.10).如果 bic > bestBic,則用 bic 更新 bestBic。
3.根據(jù)權(quán)利要求1所述的一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法，其特征在于，針對所述各層推理單元，并結(jié)合權(quán)利要求2所述訓練流程輸出的對應(yīng)于各層推理單元的DBN模型，它還提供了層次化建模方法的采樣流程；采樣流程輸入為目標骨架信息，并結(jié)合對應(yīng)于各層推理單元的DBN模型進行采樣，輸出為目標骨架各殘基位置處的旋轉(zhuǎn)異構(gòu)體庫；采樣流程包括: (3.1).參數(shù)初始化,包括采樣信息Id1初始化為主鏈信息,符號m2、m3、m4表示訓練流程輸出的針對第I 4層推理單元的DBN模型，采樣次數(shù)t由用戶輸入，該流程中用符號S表示采樣結(jié)果集合，即最終的旋轉(zhuǎn)異構(gòu)體庫； (3.2).為第I層推理單元的DBN模型Iii1計算Viterbi路徑P1 ； (3.3).設(shè)置循環(huán)計數(shù)器i = 1，j = I ; (3.4).基于Viterbi路徑p]和采樣信息Iv采用模型π^_進行一次采樣，采樣結(jié)果記入Sj ; (3.5).基于Sj為第j+Ι層構(gòu)建米樣信息bj+1,該米樣信息在權(quán)利要求1中描述為各層的輸入信息； (3.6).為第j+Ι層推理單元的DBN模型計算Viterbi路徑pj+1 ；(3.7).計數(shù)器j增1;(3.8).如果j <4，轉(zhuǎn)第(3.4)步；(3.9).將采樣結(jié)果S4累計保存到結(jié)果集合S中；(3.10).計數(shù)器i增I;(3.11).如果 i ( t，轉(zhuǎn)第(3.4)步。
全文摘要
本發(fā)明提供了一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法。它包括以下步驟(1)以主鏈信息作為輸入，執(zhí)行第一層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x1；(2)以主鏈信息、側(cè)鏈扭轉(zhuǎn)角x1作為輸入，執(zhí)行第二層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x2；(3)以主鏈信息、側(cè)鏈扭轉(zhuǎn)角x1、x2作為輸入，執(zhí)行第三層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x3；(4)以主鏈信息、側(cè)鏈扭轉(zhuǎn)角x1、x2、x3作為輸入，執(zhí)行第四層推理單元，輸出側(cè)鏈扭轉(zhuǎn)角x4。在該層次化建模方法基礎(chǔ)上，針對上述各層推理單元，本發(fā)明還提供了層次化建模方法的訓練流程。同時，針對所述各層推理單元，并結(jié)合訓練流程輸出的對應(yīng)于各層推理單元的DBN模型，還提供了層次化建模方法的采樣流程。
文檔編號G06F19/12GK103093117SQ20131001549
公開日2013年5月8日申請日期2013年1月16日優(yōu)先權(quán)日2013年1月16日
發(fā)明者蔣云良, 黃旭, 呂強, 繆大俊, 錢培德, 范婧申請人:湖州師范學院

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：蔣云良;黃旭;呂強;繆大俊;錢培德;范婧
技術(shù)所有人：湖州師范學院
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

蛋白質(zhì)同源建模相關(guān)技術(shù)

側(cè)鏈壓縮相關(guān)技術(shù)

側(cè)鏈相關(guān)技術(shù)

比特幣側(cè)鏈相關(guān)技術(shù)

莫西沙星側(cè)鏈相關(guān)技術(shù)

美羅培南側(cè)鏈相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種蛋白質(zhì)側(cè)鏈預(yù)測的層次化建模方法