欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法

文檔序號:6433393閱讀:509來源:國知局
專利名稱:一種基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)圖形學(xué)與生物計(jì)算技術(shù)領(lǐng)域,尤其涉及一種基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法。
背景技術(shù)
蛋白質(zhì)分子體系中的各種相互作用決定了分子內(nèi)各結(jié)構(gòu)域在空間的形態(tài)和變構(gòu)方式,而這些多重作用在空間中疊加成為一個(gè)綜合性作用一一 “分子場(molecular field)”。當(dāng)體系外分子接近該蛋白質(zhì)分子體系時(shí),蛋白質(zhì)分子相關(guān)部位的局部場就將發(fā)生變化。分子場構(gòu)成了對蛋白質(zhì)分子特別是活性中心行為的一種限制和表達(dá),其研究對于揭示蛋白質(zhì)結(jié)構(gòu)與功能之間的內(nèi)在關(guān)系,尤其是對蛋白質(zhì)識別、穩(wěn)定和黏附行為具有重要意義。分子場從原子尺度上描述蛋白質(zhì)分子體系,它不僅與分子體系中原子的類型、坐標(biāo)和所帶電荷密切相關(guān),而且與分子的空間構(gòu)型等立體信息有關(guān),在活性中心等關(guān)鍵部位,其功能的實(shí)現(xiàn)(如生理活性)還與親疏水性分布等相關(guān)。蛋白質(zhì)三維空間結(jié)構(gòu)的相似性比較是探明結(jié)構(gòu)與功能的重要分析手段,而蛋白質(zhì)分子場的研究可以作為蛋白質(zhì)結(jié)構(gòu)相似性比較的有益補(bǔ)充。許多生物學(xué)家和藥學(xué)家已經(jīng)認(rèn)識到蛋白質(zhì)分子場的重要性,蛋白質(zhì)勢能場的動態(tài)幾何分布與功能區(qū)域密切對應(yīng)。但是,正如文獻(xiàn)所述,目前的技術(shù)還缺乏對勢能場的動態(tài)幾何分布有效的計(jì)算和分析手段。此外,現(xiàn)有的蛋白質(zhì)可視化分析方法,如范德華表面,分子表面,球棍模型等,難以實(shí)現(xiàn)對分子間作用力進(jìn)行有效地空間可視化分析。所以,蛋白質(zhì)分子場的計(jì)算、可視化分析是一項(xiàng)對結(jié)構(gòu)生物信息學(xué)有價(jià)值且意義深遠(yuǎn)的研究。本發(fā)明工作已表明,通過算法開發(fā),可以實(shí)現(xiàn)對蛋白質(zhì)分子場在量子化學(xué)精度上實(shí)現(xiàn)有效計(jì)算,為研究相關(guān)問題,尤其是含有金屬元素的發(fā)生化學(xué)反應(yīng)的相關(guān)蛋白質(zhì)分子場提供了基礎(chǔ)。但是,由于生物計(jì)算涉及的分子很大,計(jì)算過程十分復(fù)雜。因此,如何加速其計(jì)算過程是結(jié)構(gòu)生物信息學(xué)等領(lǐng)域一個(gè)亟待解決的問題。在結(jié)構(gòu)生物信息學(xué)領(lǐng)域,量子化學(xué)蛋白質(zhì)分子場的研究,對于揭示蛋白質(zhì)結(jié)構(gòu)與功能之間的內(nèi)在關(guān)系,預(yù)測蛋白質(zhì)相互作用網(wǎng)絡(luò),發(fā)現(xiàn)疾病診斷標(biāo)志蛋白(Biomark),實(shí)現(xiàn)藥物的設(shè)計(jì)及快速篩選等方面都有著重大的應(yīng)用價(jià)值。但是,由于蛋白質(zhì)分子體系龐大,通常有成千上萬個(gè)原子,若直接使用量子化學(xué)方法進(jìn)行計(jì)算將是非常困難的。通常的做法是采用線性標(biāo)度的計(jì)算技術(shù),即將蛋白質(zhì)分子放到三維空間中的一個(gè)盒子里面,以包含的氨基酸鏈為單位進(jìn)行分解,分割成許多小片段,對應(yīng)原子構(gòu)成矩陣元。但現(xiàn)有技術(shù)僅考慮到原始PDB
(Protein Data Bank,即蛋白質(zhì)數(shù)據(jù)庫),其文件中沒有包含氫原子。而本發(fā)明的方法采用CHARMM方法,根據(jù)拓?fù)湮募M(jìn)行坐標(biāo)預(yù)測,補(bǔ)充氫原子坐標(biāo);然后利用GaUSSian03軟件對每個(gè)片段局部使用AMl (Austin Model 1)哈密頓量或者PM3 (Parametric Method 3) 哈密頓量方法進(jìn)行計(jì)算,得到對應(yīng)的局域分子場數(shù)據(jù);接著由距離最近的三個(gè)局域分子場通過Modified Si印ard插值獲得每一個(gè)網(wǎng)格點(diǎn)上的分子場值,最后將結(jié)果拼接為一個(gè)完整的體數(shù)據(jù)網(wǎng)格。
現(xiàn)有工作雖然可得到相對分子力學(xué)較為可靠的結(jié)果,但是其計(jì)算過程非常耗時(shí)。

發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提供一種基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法。本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的一種基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法,該方法包括以下步驟
(1)搭建一個(gè)GPU與CPU異構(gòu)的高性能集群計(jì)算平臺并建立優(yōu)化算法以進(jìn)行蛋白質(zhì)的復(fù)雜生物計(jì)算;
(2)實(shí)現(xiàn)蛋白質(zhì)相互作用的分子動力學(xué)模擬;
(3)從蛋白質(zhì)分子相互作用開始到結(jié)束,保存其中若干幀的位置信息;
(4)對每一幀計(jì)算蛋白質(zhì)分子場;
(5)分析蛋白質(zhì)中每一個(gè)殘基的分子場變化,找出變化最大的若干個(gè)殘基,即可能的相互作用位點(diǎn)。進(jìn)一步地,所述步驟(1)中,搭建的高性能集群計(jì)算平臺由10臺主機(jī)組成,其中,2 臺作為計(jì)算顯示終端;另外8臺作為并行計(jì)算節(jié)點(diǎn);整個(gè)系統(tǒng)由千兆高速網(wǎng)相連接。本發(fā)明的有益效果是,在計(jì)算局部分子場數(shù)據(jù)值時(shí),每個(gè)部分的計(jì)算是相對獨(dú)立的,因此本發(fā)明采用并行計(jì)算技術(shù);同樣,在拼接過程中計(jì)算網(wǎng)格點(diǎn)上的場數(shù)據(jù)值時(shí),也可以采用并行計(jì)算。雖然通常單機(jī)計(jì)算中,雙精度比單精度運(yùn)算要慢8-12倍,但是,本發(fā)明在GPU+CPU異構(gòu)優(yōu)化集群上實(shí)現(xiàn)了量子化學(xué)蛋白質(zhì)分子場的模擬計(jì)算,在保持雙精度計(jì)算要求下,重點(diǎn)對單機(jī)的多核CPU和GPU進(jìn)行了并行計(jì)算優(yōu)化設(shè)計(jì),從而大大加快了計(jì)算的速度,并提高了計(jì)算精度。


圖1是GPU集群上的算法流程圖2是單結(jié)點(diǎn)中GPU和多核CPU并行計(jì)算流程圖; 圖3是多核+ GPU協(xié)同計(jì)算示意圖。
具體實(shí)施例方式本發(fā)明基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法,包括以下步驟 一種基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法,該方法包括以下步驟
1、搭建一個(gè)GPU與CPU異構(gòu)的高性能集群計(jì)算平臺并建立優(yōu)化算法以進(jìn)行蛋白質(zhì)的復(fù)雜生物計(jì)算。2、實(shí)現(xiàn)蛋白質(zhì)相互作用的分子動力學(xué)模擬。3、從蛋白質(zhì)分子相互作用開始到結(jié)束,保存其中若干幀的位置信息。4、對每一幀計(jì)算蛋白質(zhì)分子場。5、分析蛋白質(zhì)中每一個(gè)殘基的分子場變化,找出變化最大的若干個(gè)殘基,即可能的相互作用位點(diǎn)。本發(fā)明具有以下特點(diǎn)
1、搭建GPU與CPU異構(gòu)的高性能集群計(jì)算平臺對于高復(fù)雜度課題的加速計(jì)算問題,如生物計(jì)算的解決,采用高性能的多核CPU集群系統(tǒng)將是一個(gè)有效的方法。而目前圖形處理器GPU并行處理性能的極高速發(fā)展,更是為這一問題的解決提供了可能。為此我們搭建起一個(gè)GPU與CPU異構(gòu)的高性能集群計(jì)算平臺。其中GPU集群采用10臺配置有NVIDIA公司所生產(chǎn)的Gei^orce GTX 260顯卡、8GB內(nèi)存、ITB硬盤的主機(jī)組成,其中2臺作為計(jì)算顯示終端;另外8臺作為并行計(jì)算節(jié)點(diǎn);多核CPU系統(tǒng)采用Dell公司所生產(chǎn)的 核E7 0 2. OGHz 的CPU、256GB內(nèi)存、500TG硬盤所組成的部件,但不限于此。整個(gè)系統(tǒng)由千兆高速網(wǎng)相連接。2、本發(fā)明將蛋白質(zhì)所在的包圍盒均勻劃分成八個(gè)部分,利用MPICH對應(yīng)分配到集群中的八個(gè)計(jì)算結(jié)點(diǎn),以實(shí)現(xiàn)粗粒度并行。采用SPMD (Single Program Multiple Data Stream Computers)單程序多數(shù)據(jù)流并行計(jì)算機(jī)執(zhí)行模式一個(gè)程序同時(shí)啟動多份,形成多個(gè)獨(dú)立的進(jìn)程,在不同的處理機(jī)上運(yùn)行,并擁有獨(dú)立的內(nèi)存空間,進(jìn)程間通信通過調(diào)用MPI 函數(shù)來實(shí)現(xiàn)。3、在每臺機(jī)器分配到任務(wù)后,每個(gè)結(jié)點(diǎn)同時(shí)啟動八個(gè)線程并行計(jì)算,實(shí)現(xiàn)細(xì)粒度并行,大大提高了運(yùn)算速度。計(jì)算結(jié)果收集、合并至控制臺,從而得到蛋白質(zhì)的整個(gè)空間網(wǎng)絡(luò)體結(jié)構(gòu)。計(jì)算完畢,在控制臺可采用高質(zhì)量預(yù)集成的體繪制硬件加速方法繪制得到蛋白質(zhì)分子場勢能分布。4、對于海量數(shù)據(jù)及復(fù)雜模型的加速計(jì)算,本發(fā)明同時(shí)了考慮多核CPU的并行優(yōu)化及GPU的并行優(yōu)化。即在本發(fā)明的GPU集群系統(tǒng)中充分開發(fā)利用單結(jié)點(diǎn)中多核CPU和GPU 兩者的各自優(yōu)勢,結(jié)合MPI、0penMP和CUDA混合編程模式,從而達(dá)到計(jì)算架構(gòu)的優(yōu)化設(shè)計(jì)。5、本發(fā)明計(jì)算系統(tǒng)中的多核CPU在一個(gè)CPU內(nèi)真正意義上提供了多個(gè)獨(dú)立的邏輯運(yùn)算組件,即CPU內(nèi)核,并使各內(nèi)核通過協(xié)作方式實(shí)現(xiàn)運(yùn)算負(fù)載在多個(gè)內(nèi)核之間的平均分配及任務(wù)調(diào)度,比傳統(tǒng)單核CPU帶來了更強(qiáng)的并行處理能力、更高的計(jì)算密度和更低的時(shí)鐘頻率,并大大減少了散熱和功耗。6、在單結(jié)點(diǎn)上利用GPU和多核CPU協(xié)同加速計(jì)算的主要思想是充分利用GPU高效的浮點(diǎn)數(shù)處理能力和多核CPU良好的任務(wù)分配和調(diào)度能力,將其中的主要插值計(jì)算寫入CUDA子程序,安排在GPU上進(jìn)行;而將預(yù)計(jì)算和讀取文件的步驟寫入主程序,安排在多核CPU上進(jìn)行。即對χ坐標(biāo)相同的平面上的所有點(diǎn),根據(jù)距離最小原則,預(yù)計(jì)算Modified Siepard插值所需要的若干氨基酸片段,并從片段所在數(shù)據(jù)文件中獲取原始分子場值,然后連同預(yù)處理得到的距離信息一并傳入GPU并行計(jì)算模塊,進(jìn)行Modified證印ard插值。算法完整流程如圖2所示。7、考慮到可以進(jìn)行多核CPU并行計(jì)算,因此本發(fā)明把求取氨基酸片段分子場數(shù)據(jù)值進(jìn)行OpenMP并行編程模型下的多核CPU并行計(jì)算。其中,并行域在多核CPU上通過主線程開啟(fork)新線程實(shí)現(xiàn),計(jì)算結(jié)束后將結(jié)果傳給CUDA子程序做下一步并行計(jì)算。由于 GPU集群環(huán)境的特殊性,本發(fā)明實(shí)現(xiàn)了將OpenMP和CUDA協(xié)同工作,S卩首先分別用CUDA編譯器nvcc編譯寫有Modified Shepard插值計(jì)算的GPU子程序,然后用MPICH的編譯器mpicc 編譯主程序,添加-fopenmp命令行參數(shù);最后使用MPICH的鏈接器進(jìn)行鏈接,得到可執(zhí)行程序。實(shí)施例為了近似表示蛋白質(zhì)各個(gè)原子電勢能的value值,將原子坐標(biāo)周圍格點(diǎn)中的value值加權(quán)平均,繼而求出每個(gè)原子組成的殘基的平均value。最后對a_k各幀,求出各殘基的value值的變化趨勢。對變化趨勢進(jìn)行分析發(fā)現(xiàn)殘基可根據(jù)其value的變化趨
5勢進(jìn)行分類。第一類變化趨勢呈震蕩下降趨勢。此部分殘基共60個(gè),標(biāo)號為1-60。第二類變化趨勢并非呈下降趨勢。此部分殘基共M個(gè),標(biāo)號為6165,86,89,106,110,113, 127,131,140,144,147,151,155,162,165,170,172,175,184,187,其對應(yīng)為左側(cè)未被拉離、 但對被拉離部分呈包圍狀的殘基片段。這些就是可能的作用位點(diǎn)。第三類變化趨勢呈平穩(wěn)單調(diào)下降趨勢。此部分殘基共135個(gè)。對應(yīng)左側(cè)未被拉離,且處于較外圍的殘基片段。
權(quán)利要求
1.一種基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法,其特征在于,該方法包括以下步驟(1)搭建一個(gè)GPU與CPU異構(gòu)的高性能集群計(jì)算平臺并建立優(yōu)化算法以進(jìn)行蛋白質(zhì)的復(fù)雜生物計(jì)算;(2)實(shí)現(xiàn)蛋白質(zhì)相互作用的分子動力學(xué)模擬;(3)從蛋白質(zhì)分子相互作用開始到結(jié)束,保存其中若干幀的位置信息;(4)對每一幀計(jì)算蛋白質(zhì)分子場;(5)分析蛋白質(zhì)中每一個(gè)殘基的分子場變化,找出變化最大的若干個(gè)殘基,即可能的相互作用位點(diǎn)。
2.根據(jù)權(quán)利要求1所述基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法,其特征在于,所述步驟(1)中,搭建的高性能集群計(jì)算平臺由10臺主機(jī)組成,其中,2臺作為計(jì)算顯示終端; 另外8臺作為并行計(jì)算節(jié)點(diǎn);整個(gè)系統(tǒng)由千兆高速網(wǎng)相連接。
全文摘要
本發(fā)明公開了一種基于蛋白質(zhì)分子場預(yù)測相互作用位點(diǎn)的方法,首先搭建起一個(gè)GPU與CPU異構(gòu)的高性能集群計(jì)算平臺并建立優(yōu)化算法以進(jìn)行蛋白質(zhì)的復(fù)雜生物計(jì)算,實(shí)現(xiàn)蛋白質(zhì)相互作用的分子動力學(xué)模擬,從蛋白質(zhì)分子相互作用開始到結(jié)束,保存其中若干幀的位置信息,對每一幀計(jì)算蛋白質(zhì)分子場,最后分析蛋白質(zhì)中每一個(gè)殘基的分子場變化,找出變化最大的若干個(gè)殘基,即可能的相互作用位點(diǎn)。本發(fā)明利用建立的GPU與CPU異構(gòu)的高性能集群計(jì)算平臺及其優(yōu)化計(jì)算途徑,運(yùn)用量子化學(xué)計(jì)算蛋白質(zhì)分子場,具有較高的精度,可以方便、快速、有效地對蛋白質(zhì)相互作用過程進(jìn)行分析,對可能的作用位點(diǎn)具有較高的預(yù)測度,在生物計(jì)算領(lǐng)域具有很大的實(shí)用價(jià)值。
文檔編號G06F19/18GK102385668SQ20111027656
公開日2012年3月21日 申請日期2011年9月19日 優(yōu)先權(quán)日2011年9月19日
發(fā)明者吳韜, 張繁, 彭群生, 王章野 申請人:浙江大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
霍城县| 双峰县| 镇康县| 七台河市| 永福县| 百色市| 富顺县| 平度市| 南陵县| 周口市| 江阴市| 孟村| 东明县| 海晏县| 沾化县| 留坝县| 三河市| 沁源县| 响水县| 合阳县| 涟源市| 于田县| 阿克陶县| 江口县| 临邑县| 格尔木市| 宝鸡市| 隆子县| 蒲江县| 琼中| 贵德县| 吕梁市| 东平县| 芜湖县| 望江县| 博湖县| 贵南县| 定州市| 罗平县| 滨海县| 泗阳县|