欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于半擴(kuò)展結(jié)構(gòu)的核糖核酸假結(jié)結(jié)構(gòu)的預(yù)測(cè)方法與裝置的制造方法

文檔序號(hào):8445778閱讀:567來源:國(guó)知局
基于半擴(kuò)展結(jié)構(gòu)的核糖核酸假結(jié)結(jié)構(gòu)的預(yù)測(cè)方法與裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于生物信息工程領(lǐng)域,涉及一種對(duì)核糖核酸(以下簡(jiǎn)稱為RNA)的結(jié)構(gòu)進(jìn) 行預(yù)測(cè)的方法,尤其涉及基于半擴(kuò)展結(jié)構(gòu)的RNA假結(jié)結(jié)構(gòu)預(yù)測(cè)的方法及裝置。
【背景技術(shù)】
[0002] RNA是生物系統(tǒng)內(nèi)最為重要的生物大分子之一,它在生物體內(nèi)行使多種功能,是合 成蛋白質(zhì)的模板。RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)用于蛋白質(zhì)功能分析,是RNA三級(jí)結(jié)構(gòu)預(yù)測(cè)的基礎(chǔ)。假 結(jié)(pseudoknot)是RNA中最廣泛的結(jié)構(gòu)單元,是非常復(fù)雜和穩(wěn)定的RNA結(jié)構(gòu),假結(jié)在RNA 分子中具有構(gòu)造、催化和調(diào)節(jié)功能,假結(jié)結(jié)構(gòu)是目前RNA結(jié)構(gòu)預(yù)測(cè)研宄的關(guān)鍵點(diǎn)。
[0003] RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)采用的方法主要有兩種:早期采用的是序列對(duì)比分析方法,即 對(duì)于在不同有機(jī)體中起相同生物功能的一級(jí)結(jié)構(gòu)進(jìn)行比較,此方法的困難之處在于:許多 RNA分子的同源序列不易得到;需要大量人力,效率較低,所以目前主要采用的是最小自由 能量方法。
[0004] 最小自由能量算法的理論依據(jù)是穩(wěn)定的二級(jí)結(jié)構(gòu)的自由能量最小?;谧钚∽杂?能量算法的PKNOTS算法使用0(n6)時(shí)間和0(n4)空間計(jì)算任意的平面假結(jié)和部分非平面假 結(jié)。PKNOTS算法僅能計(jì)算長(zhǎng)度短于140個(gè)堿基的RNA序列,不能滿足較長(zhǎng)序列結(jié)構(gòu)預(yù)測(cè)的 需要。PknotsRG算法計(jì)算兩個(gè)莖區(qū)構(gòu)成的簡(jiǎn)單的嵌套假結(jié),其中任意兩個(gè)假結(jié)為并列或嵌 套關(guān)系。事實(shí)上,由內(nèi)環(huán)和凸起構(gòu)成的假結(jié)在RNA中普遍存在,交叉假結(jié)也具有重要作用。 因此,兩者都不能被忽略。平面假結(jié)是最廣泛的假結(jié)子類,包含上面提到的由內(nèi)環(huán)和凸起構(gòu) 成的假結(jié)以及交叉假結(jié)的情況。PseudoBase數(shù)據(jù)庫(kù)的所有序列中僅一個(gè)序列折疊為一個(gè)非 平面假結(jié),其余序列都折疊為平面假結(jié)。因此我們主要考慮任意平面假結(jié)的計(jì)算。
[0005] Zuker首次將動(dòng)態(tài)規(guī)劃算法用于最鄰近鄰居模型提出MFOLD算法,經(jīng)過二十多年 的不斷改進(jìn)和發(fā)展,現(xiàn)己成為國(guó)際上最廣泛使用的RNA二級(jí)結(jié)構(gòu)預(yù)測(cè)方法,對(duì)于包含n個(gè)核 苷酸的RNA序列,MFOLD算法使用0(n3)時(shí)間和0(n2)空間預(yù)測(cè)最優(yōu)二級(jí)結(jié)構(gòu),目前對(duì)于長(zhǎng) 度小于700個(gè)核普酸的RNA序列,MFOLD算法可正確預(yù)測(cè)大約73%的基對(duì),對(duì)于較長(zhǎng)的RNA 序列及部分子類的預(yù)測(cè)正確率更低,僅僅給出了三級(jí)結(jié)構(gòu)的粗略框架,另外由于算法本身 的限制,MFOLD算法不能預(yù)測(cè)假結(jié)和更復(fù)雜的三級(jí)相互作用。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明解決的技術(shù)問題是使得對(duì)RNA結(jié)構(gòu)、尤其是使基于半擴(kuò)展結(jié)構(gòu)RNA假結(jié)結(jié) 構(gòu)進(jìn)行預(yù)測(cè),降低其時(shí)間復(fù)雜性和空間復(fù)雜性,提高預(yù)測(cè)準(zhǔn)確性。
[0007] 本發(fā)明的一種基于半擴(kuò)展結(jié)構(gòu)的核糖核酸假結(jié)結(jié)構(gòu)的預(yù)測(cè)方法包括以下步驟:
[0008] 輸入一段核糖核酸堿基序列;
[0009] 定義k莖、半擴(kuò)展結(jié)構(gòu);
[0010] 建立包含k莖和半擴(kuò)展結(jié)構(gòu)的核糖核酸假結(jié)結(jié)構(gòu)表示模型和相應(yīng)的最小能量的 計(jì)算式;
[0011] 根據(jù)最小能量原理,輸出核糖核酸的二級(jí)結(jié)構(gòu)。
[0012] 一個(gè)半擴(kuò)展結(jié)構(gòu)由兩個(gè)核糖核酸序列片斷\1;和81^構(gòu)成,1〈1^〈1〈」。兩個(gè)核糖核 酸序列片斷中存在P和q,i〈P〈q〈k,使sp;(^Ps1;j構(gòu)成k莖,用F[i,k:j]表示其最優(yōu)半擴(kuò)展 結(jié)構(gòu)。或兩個(gè)核糖核酸序列片斷中存在P和q,l〈P〈q〈j,使sp,jPsi;k構(gòu)成k基F[i:I,j] 為其最優(yōu)半擴(kuò)展結(jié)構(gòu)。
[0013] 以W(i,j)為子序列Su對(duì)應(yīng)的包含假結(jié)的二級(jí)結(jié)構(gòu)S的最小自由能量,計(jì)算 W(i,j)的情況包括:(I)sJPs」是未配對(duì)堿基;si和s」不構(gòu)成基對(duì)(i,j)且在不同子序列 Su和sk+1,j對(duì)應(yīng)的二級(jí)結(jié)構(gòu)中,i〈k〈j;⑵sJPs」構(gòu)成基對(duì)(i,j);su由兩個(gè)半擴(kuò)展結(jié)構(gòu) 和一個(gè)子序列構(gòu)成;或si;j由一個(gè)半擴(kuò)展結(jié)構(gòu)和一個(gè)子序列構(gòu)成。
[0014] V(i,j)為在堿基sJPSj構(gòu)成基對(duì)(i,j)時(shí),子序列SiJ對(duì)應(yīng)的包含假結(jié)的二級(jí)結(jié) 構(gòu)S的最小能量,計(jì)算V(i,j)情況包括:S是由基對(duì)(i,j)封閉的1環(huán),S是由基對(duì)(i,j) 和(k,1)封閉的2環(huán),S是k環(huán)(k彡3)或者假結(jié)結(jié)構(gòu),i〈k〈j。
[0015] 計(jì)算一個(gè)半擴(kuò)展結(jié)構(gòu)的情況包括:(1) 一個(gè)半擴(kuò)展結(jié)構(gòu)由另一個(gè)半擴(kuò)展結(jié)構(gòu)和一 個(gè)未配對(duì)堿基構(gòu)成;(2) -個(gè)半擴(kuò)展結(jié)構(gòu)由另一個(gè)半擴(kuò)展結(jié)構(gòu)和一個(gè)子序列構(gòu)成;(3) -個(gè) 半擴(kuò)展結(jié)構(gòu)由另外的兩個(gè)半擴(kuò)展結(jié)構(gòu)構(gòu)成;(4) 一個(gè)半擴(kuò)展結(jié)構(gòu)是一個(gè)k莖。
[0016]使用動(dòng)態(tài)規(guī)劃算法計(jì)算w(i,j)、V(i,j)和RNA半擴(kuò)展結(jié)構(gòu)的最小能量。
[0017] 一種基于半擴(kuò)展結(jié)構(gòu)的核糖核酸假結(jié)結(jié)構(gòu)預(yù)測(cè)裝置包括:
[0018] 輸入單元,輸入一段核糖核酸序列;
[0019] 初始化單元,定義k莖和半擴(kuò)展結(jié)構(gòu);
[0020] 存儲(chǔ)單元,存儲(chǔ)建立包含k莖和半擴(kuò)展結(jié)構(gòu)的核糖核酸假結(jié)結(jié)構(gòu)表示模型及其相 應(yīng)的最小能量的計(jì)算公式;
[0021] 輸出單元,其根據(jù)最小能量原理,輸出核糖核酸的假結(jié)結(jié)構(gòu)。
[0022] 本發(fā)明方法的搜索速度、正確率、敏感性和特異性都比PKNOTS算法好,因此本發(fā) 明的方法在平面假結(jié)的預(yù)測(cè)上比PKNOTS算法更有效。
【附圖說明】
[0023] 圖1是根據(jù)本發(fā)明的用于預(yù)測(cè)RNA假結(jié)結(jié)構(gòu)的預(yù)測(cè)方法的流程圖。
[0024] 圖2是根據(jù)本發(fā)明的k莖處理的流程圖;
[0025] 圖3是根據(jù)本發(fā)明的半擴(kuò)展結(jié)構(gòu)處理的流程圖;
[0026] 圖4是參照?qǐng)D1用于預(yù)測(cè)RNA的假結(jié)結(jié)構(gòu)的預(yù)測(cè)裝置;
[0027] 圖5是本發(fā)明的有關(guān)RNA假結(jié)結(jié)構(gòu)的例子;
[0028] 圖6是本發(fā)明的包含假結(jié)結(jié)構(gòu)的RNA中V(i,j)與W(i,j)最小自由能量的表示;
[0029] 圖7是本發(fā)明的包含假結(jié)結(jié)構(gòu)的RNA的半擴(kuò)展結(jié)構(gòu)的表示。
【具體實(shí)施方式】
[0030] 首先說明關(guān)于RNA序列、堿基對(duì)、假結(jié)等的概念。
[0031] RNA-級(jí)結(jié)構(gòu):RNA序列側(cè)鏈上四種堿基的排列順序表示。一般來說RNA序列 從5'到3'結(jié)束,這樣整個(gè)序列S表示為S=S1S2…811,81是RNA序列的第i個(gè)堿基, SiG{A,U,G,C},RNA子序列s是s的一個(gè)序列片段,表不為:si,」=sSjtj
[0032] 堿基對(duì):如果Si ?SjG{AU,CG,⑶},則si?Sj構(gòu)成堿基對(duì)。堿基對(duì)堆積的能量為 負(fù)值。
[0033] RNA二級(jí)結(jié)構(gòu):RNA序列中的一組基對(duì)構(gòu)成的集合構(gòu)成RNA二級(jí)結(jié)構(gòu),以S表示。 對(duì)于任意基對(duì),如果Si^SjGShSi, .Sj,GS且i=W,則j=f,亦即,一個(gè)基不可同 時(shí)與兩個(gè)及兩個(gè)以上的基構(gòu)成基對(duì)。
[0034] 圖1是根據(jù)本發(fā)明的用于預(yù)測(cè)RNA的二級(jí)結(jié)構(gòu)的預(yù)測(cè)方法的流程圖。本發(fā)明的方 法包括以下步驟:輸入一段核糖核酸堿基序列;定義半擴(kuò)展結(jié)構(gòu);建立包含k莖和半擴(kuò)展結(jié) 構(gòu)的核糖核酸假結(jié)結(jié)構(gòu)表示模型并計(jì)算出模型的最小能量;根據(jù)最小能量原理,輸出核糖 核酸的二級(jí)結(jié)構(gòu)。圖4是與圖1是用于預(yù)測(cè)RNA的假結(jié)結(jié)構(gòu)的預(yù)測(cè)裝置。RNA假結(jié)結(jié)構(gòu)的 預(yù)測(cè)裝置包括:輸入單元,其輸入一段核糖核酸堿基序列;初始化單元,其定義k莖和半擴(kuò) 展結(jié)構(gòu);存儲(chǔ)單元,其存儲(chǔ)建立的包含k莖和半擴(kuò)展結(jié)構(gòu)的核糖核酸假結(jié)結(jié)構(gòu)表示模型和 相應(yīng)的最小能量的計(jì)算式;輸出單元,其根據(jù)最小能量原理,輸出核糖核酸堿基序列的二級(jí) 結(jié)構(gòu)。
[0035] 圖2是根據(jù)本發(fā)明的k莖處理的流程圖:輸入一段s=S1S^Sn序列,從左向右查 找堿基,如果存在i、j,使得sJPs』配對(duì),j-i多6,并且s中存在三個(gè)以上連續(xù)的相鄰基對(duì) Si ?Sj、S(i+1) ?SuI^Sk ?S1,則基對(duì)Si ?Sj和Sk ?S1封閉的區(qū)間確定為1莖;對(duì)1莖中所有 配對(duì)的堿基進(jìn)行標(biāo)記;在1莖封閉的游離堿基中繼續(xù)查找配對(duì)的堿基,如果存在三個(gè)以上 基對(duì),確定為2莖
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
广汉市| 陆河县| 玛多县| 宜黄县| 彰化县| 蓬溪县| 北辰区| 锡林浩特市| 辽宁省| 兴文县| 广汉市| 蒙城县| 鄂州市| 清流县| 福贡县| 西乌珠穆沁旗| 佛教| 闽清县| 连江县| 寿宁县| 甘德县| 泗水县| 兖州市| 武平县| 高淳县| 阿巴嘎旗| 安岳县| 无为县| 淳化县| 青阳县| 托克逊县| 太白县| 祁门县| 大冶市| 大化| 临沧市| 南木林县| 武邑县| 铜川市| 北安市| 营口市|