欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

蛋白質(zhì)組數(shù)據(jù)庫及其應(yīng)用

文檔序號:9397085閱讀:865來源:國知局
蛋白質(zhì)組數(shù)據(jù)庫及其應(yīng)用
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及生物信息領(lǐng)域,具體的,本發(fā)明涉及構(gòu)建蛋白質(zhì)組數(shù)據(jù)庫的方法、蛋白 質(zhì)組數(shù)據(jù)庫、蛋白質(zhì)組數(shù)據(jù)庫在蛋白質(zhì)分類和/或檢索定位中的用途、定位蛋白的方法、定 位蛋白的系統(tǒng)、蛋白的分類方法及系統(tǒng)。
【背景技術(shù)】
[0002] 蛋白質(zhì)是生命功能的執(zhí)行者和生命活動的直接體現(xiàn)者。隨著四千多個物種全基因 組序列測定的完成,基因組研究的戰(zhàn)略重點從結(jié)構(gòu)基因組學(xué)轉(zhuǎn)向功能基因組學(xué),蛋白質(zhì)組 學(xué)正是功能基因組研究的重要支柱,是后基因組時代生命科學(xué)研究的核心內(nèi)容之一。蛋白 質(zhì)組學(xué)對蛋白質(zhì)的功能分析、鑒定及其翻譯后修飾的研究,將會對闡明基因的功能起到極 大的推動作用,并能更加客觀準確地揭示生命現(xiàn)象。
[0003]質(zhì)譜(MS)為基礎(chǔ)來分析蛋白質(zhì)組的鳥槍法是非常強大的方法,但是鳥槍法這樣 的策略在很大程度上依賴于完整的蛋白質(zhì)組數(shù)據(jù)庫,通常使用數(shù)據(jù)庫檢索算法進行蛋白質(zhì) 的鑒定。目前,全蛋白質(zhì)組數(shù)據(jù)庫中的大部分蛋白質(zhì)序列是來源于預(yù)測全基因組和轉(zhuǎn)錄組 序列中的蛋白質(zhì)編碼基因得到的注釋結(jié)果,只有部分蛋白質(zhì)具有實驗證據(jù)的支持。隨著實 驗數(shù)據(jù)的積累和預(yù)測注釋的改進,蛋白質(zhì)數(shù)據(jù)庫不斷更新且日趨完善其完整性和準確性, 但是依然不能反映全蛋白質(zhì)組的全部信息。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的之一在于構(gòu)建一種蛋白質(zhì)組數(shù)據(jù)庫。發(fā)明人基于以下發(fā)現(xiàn)和認識而 作出本發(fā)明:
[0005] 蛋白質(zhì)分子的疏水性(Hydrophobicity),等電點(PI),序列長度和分子量等理化 特性只依賴于蛋白質(zhì)氨基酸組成,與蛋白質(zhì)序列信息無關(guān),這些理化特性被認為是蛋白質(zhì) 氨基酸組成相關(guān)的理化特性。這些特性值可以從一個線性氨基酸序列推算出。蛋白質(zhì)氨基 酸組成和氨基酸組成衍生的理化特性,已被廣泛用于預(yù)測蛋白質(zhì)結(jié)構(gòu)和功能分類,蛋白_ 蛋白相互作用和蛋白質(zhì)亞細胞定位。
[0006] 蛋白質(zhì)組學(xué)獲得和鑒定低豐度蛋白是一個巨大的挑戰(zhàn)。例如,雙向電泳方法有一 定的局限性:它很難分析出非常酸性的,堿性的,小的,大的和疏水性的蛋白質(zhì)。完全測序的 四千多個蛋白序列構(gòu)成的全蛋白質(zhì)組可提供豐富的生物信息來指導(dǎo)未來的生物研究,但是 本領(lǐng)域普通技術(shù)人員無法應(yīng)對含有幾千至幾萬條蛋白序列的全蛋白質(zhì)組的大數(shù)據(jù)挑戰(zhàn),所 以目前全蛋白質(zhì)組的數(shù)據(jù)應(yīng)用并不廣泛。
[0007] 因而,構(gòu)建蛋白質(zhì)組數(shù)據(jù)庫,建立全蛋白質(zhì)組的坐標系統(tǒng),實現(xiàn)對含有幾千、幾萬 甚至更多條蛋白序列的全蛋白質(zhì)組的大數(shù)據(jù)進行有序化管理,實現(xiàn)對蛋白質(zhì)組的蛋白質(zhì)序 列的理化特性有序化組織,成為促進蛋白質(zhì)組學(xué)的發(fā)展的一種強烈需要。
[0008] 依據(jù)本發(fā)明的第一方面,本發(fā)明提供一種構(gòu)建蛋白質(zhì)組數(shù)據(jù)庫的方法,該方法包 括以下步驟:接收多個蛋白序列;消除每個所述蛋白序列的起始氨基酸,獲得相應(yīng)的截斷 序列;建立數(shù)據(jù)表,以獲得所述蛋白質(zhì)組數(shù)據(jù)庫,所述數(shù)據(jù)表包含多個記錄,一個所述記錄 與一個所述截斷序列對應(yīng),所述數(shù)據(jù)表包含多個字段,所述字段包括以下序列參數(shù)中的至 少兩種:氨基酸豐度、序列長度、序列分子量、序列疏水性和序列等電點,所述氨基酸豐度包 括以下至少之一:Ala豐度、Cys豐度、Asp豐度、Glu豐度、Phe豐度、Gly豐度、His豐度、 Ile豐度、Lys豐度、Leu豐度、Met豐度、Asn豐度、Pro豐度、Gln豐度、Arg豐度、Ser豐度、 Thr豐度、Val豐度、Trp豐度和Tyr豐度。利用該方法構(gòu)建蛋白質(zhì)組數(shù)據(jù)庫時,不限制接收 的蛋白序列的數(shù)目,即不限制所構(gòu)建的蛋白質(zhì)組數(shù)據(jù)庫包含的序列數(shù)目,較佳的,接收的蛋 白序列為幾十條、幾百條、幾千條或者幾萬條,或者更多。消除接收的每個蛋白序列的起始 氨基酸,例如消除每個真核生物蛋白序列一般都有的起始甲硫氨酸,獲得相應(yīng)的甲硫氨酸 截斷序列(M-truncated sequence,MTS),真核生物或者原核生物的蛋白一般都具有相同的 起始氨基酸。這樣,消除原始數(shù)據(jù)的共性,基于接收數(shù)據(jù)的差異進行數(shù)據(jù)庫構(gòu)建,利于蛋白 質(zhì)組數(shù)據(jù)庫構(gòu)建,也利于構(gòu)建得的數(shù)據(jù)庫用于蛋白定位和/或分類。
[0009] 依據(jù)本發(fā)明的第二方面,本發(fā)明提供一種蛋白質(zhì)組數(shù)據(jù)庫,其根據(jù)上述本發(fā)明一 方面的構(gòu)建蛋白質(zhì)組數(shù)據(jù)庫的方法構(gòu)建獲得。該蛋白質(zhì)組數(shù)據(jù)庫,其數(shù)據(jù)表的字段為蛋白 序列本身固有的理化性質(zhì)指標。將數(shù)據(jù)表作為坐標系統(tǒng),其各個記錄即每條蛋白序列都以 其理化性質(zhì)參數(shù)數(shù)值作為坐標,方便對所包含的蛋白序列的組織、批量操作處理。該蛋白質(zhì) 組數(shù)據(jù)庫,能夠承載幾十、幾百、幾千、幾萬甚至更多的蛋白序列信息,使得能夠在多維空間 中對一個全蛋白質(zhì)組含有幾千至幾萬條甚至更多的蛋白序列實現(xiàn)定位和/或分類。
[0010] 依據(jù)本發(fā)明的第三方面,本發(fā)明提供上述本發(fā)明一方面的蛋白質(zhì)組數(shù)據(jù)庫在蛋白 質(zhì)分類和/或檢索定位中的用途。
[0011] 依據(jù)本發(fā)明的第四方面,本發(fā)明提供一種定位蛋白的方法,其根據(jù)所述蛋白的序 列參數(shù)在上述本發(fā)明一方面的蛋白質(zhì)組數(shù)據(jù)庫中的位置,以實現(xiàn)所述定位,所述序列參數(shù) 與所述蛋白質(zhì)組數(shù)據(jù)庫中的數(shù)據(jù)表的字段相對應(yīng)。
[0012] 依據(jù)本發(fā)明的第五方面,本發(fā)明提供一種定位蛋白的系統(tǒng),該系統(tǒng)能夠?qū)崿F(xiàn)上述 本發(fā)明一方面的定位蛋白的方法的全部或部分步驟,該系統(tǒng)包括:輸入裝置,用以輸入所述 蛋白的序列參數(shù);輸出裝置,用以輸出所述蛋白的定位信息;以及本發(fā)明一方面提供的蛋 白質(zhì)組數(shù)據(jù)庫,與所述輸入裝置和所述輸出裝置相連,用以依據(jù)所述蛋白的序列參數(shù)在所 述蛋白質(zhì)組數(shù)據(jù)庫中的位置,實現(xiàn)所述定位,所述序列參數(shù)與所述蛋白質(zhì)組數(shù)據(jù)庫中的數(shù) 據(jù)表的字段相對應(yīng)。
[0013] 依據(jù)本發(fā)明的第六方面,本發(fā)明提供一種對蛋白進行分類的方法,其根據(jù)每個所 述蛋白的序列參數(shù)在本發(fā)明一方面提供的蛋白質(zhì)組數(shù)據(jù)庫中的位置,以實現(xiàn)所述分類,所 述序列參數(shù)與所述蛋白質(zhì)組數(shù)據(jù)庫中的數(shù)據(jù)表的字段相對應(yīng)。
[0014] 依據(jù)本發(fā)明的第七方面,本發(fā)明提供一種對蛋白進行分類的系統(tǒng),其能夠用于實 施上述本發(fā)明一方面的蛋白分類方法的全部或部分步驟,該系統(tǒng)包括:輸入裝置,用以輸入 各個蛋白的序列參數(shù);輸出裝置,用以輸出所述蛋白的分類信息;以及上述本發(fā)明一方面 提供的蛋白質(zhì)組數(shù)據(jù)庫,與所述輸入裝置和所述輸出裝置相連,用以依據(jù)每個所述蛋白的 序列參數(shù)在所述蛋白質(zhì)組數(shù)據(jù)庫中的位置,實現(xiàn)所述分類,所述序列參數(shù)與所述蛋白質(zhì)組 數(shù)據(jù)庫中的數(shù)據(jù)表的字段相對應(yīng)。
[0015] 上述涉及的蛋白質(zhì)組數(shù)據(jù)庫,是基于發(fā)明人提出的利用蛋白序列本身固有的理化 性質(zhì)指標作為坐標系統(tǒng),使每個蛋白序列的理化性質(zhì)參數(shù)成為其的坐標參數(shù),從而構(gòu)建獲 得的。構(gòu)建的蛋白質(zhì)組數(shù)據(jù)庫能夠方便的對其中的蛋白序列進行批量操作處理,例如,依據(jù) 數(shù)據(jù)表中的任一字段和/或序列信息,實現(xiàn)對蛋白的檢索定位和/或分類分組。
【附圖說明】
[0016] 本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施方式的描述中將 變得明顯和容易理解,其中:
[0017] 圖1是本發(fā)明的一個實施例中的構(gòu)建蛋白質(zhì)組數(shù)據(jù)庫的方法的流程圖。
[0018] 圖2是本發(fā)明的一個實施例中
當(dāng)前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
正蓝旗| 夏津县| 大足县| 炎陵县| 余姚市| 鹤山市| 安庆市| 昌平区| 克拉玛依市| 罗源县| 定结县| 南丰县| 郸城县| 台湾省| 若羌县| 保山市| 广安市| 莱芜市| 巴林右旗| 漾濞| 新蔡县| 独山县| 德化县| 澄江县| 龙门县| 白朗县| 房产| 彭阳县| 龙里县| 绍兴市| 山西省| 仙游县| 通榆县| 凤翔县| 塔城市| 玉山县| 徐水县| 沙雅县| 琼海市| 古浪县| 泾阳县|