Bp神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)二肽模型多極展開(kāi)屬性計(jì)算方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于量子力學(xué)與分子力學(xué)計(jì)算相結(jié)合,計(jì)算方法和人工智能領(lǐng)域,具體涉 及一種通過(guò)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)二肽模型多極展開(kāi)屬性的計(jì)算方法。
【背景技術(shù)】
[0002] 分子模擬(Molecular Simulation)是二十世紀(jì)后期發(fā)展起的一種基于計(jì)算機(jī) 的模擬方法。隨著量子力學(xué)理論的完善、經(jīng)驗(yàn)力場(chǎng)的更新?lián)Q代以及計(jì)算機(jī)硬件發(fā)展所推 動(dòng)的計(jì)算速度和容量提升,分子模擬的理論和方法得到了飛速的發(fā)展,并已經(jīng)在眾多學(xué)科 及應(yīng)用領(lǐng)域發(fā)揮著關(guān)鍵作用。從模擬的原理進(jìn)行區(qū)分,分子模擬可以分為兩大類:理論 計(jì)算的量子力學(xué)模擬QM (Quantum Mechanics)和經(jīng)驗(yàn)計(jì)算的分子力學(xué)模擬MM (Molecular Mechanics)。量子力學(xué)主要是指利用計(jì)算機(jī)技術(shù)進(jìn)行的量子力學(xué)模擬和計(jì)算,即計(jì)算的量 子力學(xué),它可以精確地表達(dá)電子的運(yùn)動(dòng),能夠得到依賴于電子分布的性質(zhì)。因?yàn)榇蠓肿芋w 系在原子分辨率下包含數(shù)以千記甚至是萬(wàn)記的原子,所以對(duì)其進(jìn)行動(dòng)力學(xué)模擬是非常具有 挑戰(zhàn)性的工作。QM巨大的計(jì)算量使得得到精確解變的非常耗時(shí)。分子力學(xué)模擬則是建立在 經(jīng)驗(yàn)力場(chǎng)(Force field)的基礎(chǔ)之上,是不同原子力場(chǎng)類型的定義及不同價(jià)鍵和非鍵能量 表達(dá)形式的集合體。與量子力學(xué)相比,分子力學(xué)忽略了電子運(yùn)動(dòng),可以大大節(jié)約計(jì)算時(shí)間, 因而可用于計(jì)算包含上萬(wàn)個(gè)粒子數(shù)目的體系。從本質(zhì)上說(shuō),分子力學(xué)是對(duì)真實(shí)勢(shì)能函數(shù)的 近似擬合。由于忽略了電子的運(yùn)動(dòng),分子力學(xué)無(wú)法獲得那些取決于分子中電子分布的性 質(zhì)。
[0003] 分子動(dòng)力學(xué)模擬已經(jīng)被廣泛地應(yīng)用于模擬生物分子體系。而進(jìn)行分子動(dòng)力學(xué)模擬 必須使用描述原子之間相互作用勢(shì)的分子力場(chǎng)。目前,大多數(shù)使用的分子力場(chǎng)采用的是以 固定點(diǎn)電荷模型來(lái)描述靜電相互作用。盡管量子力學(xué)與分子力學(xué)混合(QM/MM)的方法已經(jīng) 被使用了很長(zhǎng)的一段時(shí)間,但是由于它本身固有的點(diǎn)電荷模型以及單向極化作用,在很多 情況下應(yīng)用依舊存在著很大的局限性。
[0004]目前,被廣泛應(yīng)用于生命科學(xué)領(lǐng)域中幾種主要力場(chǎng)
[0005]力場(chǎng) 1: AMBER
[0006] AMBER(Assisted Model Building with Energy Refinement)力場(chǎng)是在生物大分 子的模擬計(jì)算領(lǐng)域有著廣泛應(yīng)用的一個(gè)分子力場(chǎng)。主要適用于比較小的蛋白質(zhì),核酸,多醣 等分子。最初AMBER力場(chǎng)是專門(mén)為了計(jì)算蛋白質(zhì)和核酸體系而開(kāi)發(fā)的,計(jì)算其力場(chǎng)參數(shù)的 數(shù)據(jù)均來(lái)自實(shí)驗(yàn)值。在AMBER力場(chǎng)中,-CH 2-和-CH3作為聯(lián)合原子出現(xiàn),并考慮氫鍵的相互 作用。AMBER力場(chǎng)的勢(shì)能函數(shù)形勢(shì)較為簡(jiǎn)單,所需參數(shù)不多,計(jì)算量也比較小,這是這個(gè)力場(chǎng) 的一大特色,但是總體來(lái)講,AMBER力場(chǎng)的優(yōu)勢(shì)在于對(duì)生物大分子的計(jì)算,其對(duì)小分子體系 的計(jì)算結(jié)果常常不能令人滿意,也在一定程度上限制了這個(gè)力場(chǎng)的擴(kuò)展性。
[0007]力場(chǎng) 2: CHARM
[0008] CHARM (Chemistry at Harvard Macromolecular Mechanics)力場(chǎng)參數(shù)除 了來(lái)自 計(jì)算結(jié)果與實(shí)驗(yàn)值的比對(duì)外,還引用了大量的量子力學(xué)計(jì)算的結(jié)果。此力場(chǎng)可應(yīng)用于研究 許多分子系統(tǒng),包括小的有機(jī)分子、溶液、聚合物,生化分子等。CHARM力場(chǎng)能夠進(jìn)行能量?jī)?yōu) 化MD和MC模擬,并且可以應(yīng)用周期邊界條件,但它不支持氫鍵的計(jì)算。所以,幾乎除了有 機(jī)金屬分子外,通常皆可得到與實(shí)驗(yàn)值相近的數(shù)值。
[0009]力場(chǎng) 3:0PLS
[0010] OPLS(Optimized Potentials for Liquid Simulations)是一個(gè)模擬有機(jī)分子和 多肽的分子力場(chǎng)。它有組合原子模型(〇PLS_UA)和全原子模型(0PLS_AA)兩種。它的鍵伸 縮和彎曲參數(shù)是由AMBER力場(chǎng)修改得到的。該力場(chǎng)致力于計(jì)算氣態(tài)有機(jī)分子的構(gòu)象能和純 有機(jī)液體的水合自由能及其它熱力學(xué)性質(zhì)。
[0011]力場(chǎng) 4: AMOEBA
[0012] AMOEBA (Atomic Multipole Optimized Energetic for Biomolecular Simulation)是可極化分子力場(chǎng),其是基于多極距離以及考慮了誘導(dǎo)偶極效應(yīng)的一個(gè)力場(chǎng), 此力場(chǎng)已經(jīng)被提出了很多年,并廣泛應(yīng)用于生物科學(xué)領(lǐng)域。
[0013] 對(duì)于同一個(gè)需要計(jì)算的體系中氨基酸中的二肽模型的不同構(gòu)象,現(xiàn)有的大多數(shù)力 場(chǎng)以各自的同一套參數(shù)對(duì)原子的物理化學(xué)參數(shù)進(jìn)行描述。它們不考慮原子之間的極化效 應(yīng),這與現(xiàn)實(shí)的情況具有一定的差異。AMOEBA考慮這一現(xiàn)象,但依舊是對(duì)各種構(gòu)象物理化學(xué) 參數(shù)的一種綜合,達(dá)不到針對(duì)特定構(gòu)象有其特定物理化學(xué)參數(shù)用以描述原子狀態(tài)的程度。
【發(fā)明內(nèi)容】
[0014] 為了克服現(xiàn)有力場(chǎng)的各種不足,本發(fā)明提出了一種基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)二肽模 型多極展開(kāi)屬性的計(jì)算方法,本發(fā)明采用的技術(shù)方案是:
[0015] 基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)二肽模型多極展開(kāi)屬性計(jì)算方法,包括以下步驟:
[0016] 通過(guò)量子力學(xué)計(jì)算軟件Gaussian優(yōu)化不同二肽構(gòu)象的結(jié)構(gòu),并計(jì)算其物理化學(xué) 參數(shù)及原子間相互距離;
[0017] 選擇部分二肽構(gòu)象的原子的物理化學(xué)參數(shù)以及原子間相互距離訓(xùn)練BP神經(jīng)網(wǎng) 絡(luò),得到BP神經(jīng)網(wǎng)絡(luò)的物理化學(xué)參數(shù);并通過(guò)剩余的二肽構(gòu)象作為測(cè)試集驗(yàn)證BP神經(jīng)網(wǎng)絡(luò) 的預(yù)測(cè)結(jié)果。
[0018] 所述物理化學(xué)參數(shù)包括能量、電荷、偶極距、四極距。
[0019] 所述通過(guò)量子力學(xué)計(jì)算軟件Gaussian優(yōu)化不同二肽構(gòu)象的結(jié)構(gòu),并計(jì)算其物理 化學(xué)參數(shù)及原子間相互距離包括以下步驟:
[0020] 從數(shù)據(jù)庫(kù)中選擇二肽構(gòu)象模型,并通過(guò)Gaussian軟件優(yōu)化得到二肽構(gòu)象,經(jīng)量子 力學(xué)計(jì)算得到二肽構(gòu)象的能量、電荷、偶極距、四極距;通過(guò)二肽構(gòu)象中各原子的位置得到 各原子之間的相互距離。
[0021] 所述選擇部分二肽構(gòu)象的原子的物理化學(xué)參數(shù)以及原子間相互距離訓(xùn)練BP神經(jīng) 網(wǎng)絡(luò)包括以下步驟:
[0022] 將二肽構(gòu)象的能量、電荷、偶極距、四極距作為BP神經(jīng)網(wǎng)絡(luò)的輸出,將各原子之間 的相互距離作為BP神經(jīng)網(wǎng)絡(luò)的輸入;隨機(jī)選擇數(shù)據(jù)庫(kù)中的部分?jǐn)?shù)據(jù)作為訓(xùn)練集數(shù)據(jù)用于 訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)。
[0023] 所述通過(guò)剩余的二肽構(gòu)象作為測(cè)試集驗(yàn)證BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果包括以下步 驟:
[0024] 從數(shù)據(jù)庫(kù)中選擇剩余的二肽構(gòu)象模型,通過(guò)兩個(gè)二肽構(gòu)象之間的相互作用能驗(yàn)證 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果;
[0025] 從數(shù)據(jù)庫(kù)中選擇剩余的二肽構(gòu)象模型,通過(guò)二肽構(gòu)象與水分子之間的相互作用能 驗(yàn)證神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果;
[0026] 隨機(jī)生成若干對(duì)二肽構(gòu)象,通過(guò)隨機(jī)生成的二肽構(gòu)象之間的相互作用能驗(yàn)證神經(jīng) 網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果;
[0027] 隨機(jī)生成若干對(duì)二肽構(gòu)象,通過(guò)隨機(jī)生成的二肽構(gòu)象與水分子之間的相互作用能 驗(yàn)證神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果。
[0028] 所述從數(shù)據(jù)庫(kù)中選擇剩余的二肽構(gòu)象模型,通過(guò)兩個(gè)二肽構(gòu)象之間的相互作用能 驗(yàn)證神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果包括以下步驟:
[0029] 從數(shù)據(jù)庫(kù)中選擇剩余的二肽構(gòu)象模型,得到兩個(gè)二肽構(gòu)象之間的相對(duì)位置,并通 過(guò)量子力學(xué)計(jì)算軟件Gaussian得到兩個(gè)二肽構(gòu)象之間的相互作用能A ;
[0030] 根據(jù)所得的BP神經(jīng)網(wǎng)絡(luò)的物理化學(xué)參數(shù)、通過(guò)分子力學(xué)軟件Tinker得到兩個(gè)二 肽構(gòu)象之間的相互作用能B;
[0031] 將相互作用能A作為真值,通過(guò)統(tǒng)計(jì)分析誤差驗(yàn)證預(yù)測(cè)結(jié)果。
[0032] 所述從數(shù)據(jù)庫(kù)中選擇剩余的二肽構(gòu)象模型,通過(guò)二肽構(gòu)象與水分子之間的相互作 用能驗(yàn)證神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果包括以下步驟:
[0033] 從數(shù)據(jù)庫(kù)中選擇剩余的二肽構(gòu)象模型,得到二肽構(gòu)象與水分子的相對(duì)位置,并通 過(guò)量子力學(xué)計(jì)算軟件Gaussian得到二肽構(gòu)象與水分子之間的相互作用能C ;
[0034] 根據(jù)所得的BP神經(jīng)網(wǎng)絡(luò)的物理化學(xué)參數(shù)、通過(guò)分子力學(xué)軟件Tinker得到二肽構(gòu) 象與水分子之間的相互作用能D;
[0035] 將相互作用能C作為真值,通過(guò)統(tǒng)計(jì)分析誤差驗(yàn)證預(yù)測(cè)結(jié)果。
[0036] 所述隨機(jī)生成若干對(duì)二肽構(gòu)象,通過(guò)隨機(jī)生成的二肽構(gòu)象之間的相互作用能驗(yàn)證 神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果包括以下步驟:
[0037] 隨機(jī)生成若干對(duì)二肽構(gòu)象,得到兩組二肽構(gòu)象間的相對(duì)位置,并通過(guò)量子力學(xué)計(jì) 算軟件Gaussian得到兩組二肽構(gòu)象間的相互作用能E ;
[0038] 根據(jù)所得的BP神經(jīng)網(wǎng)絡(luò)的物理化學(xué)參數(shù)、通過(guò)分子力學(xué)軟件Tinker得到兩組二 肽構(gòu)象間的相互作用能F;
[0039] 將相互作用能E作為真值,通過(guò)統(tǒng)計(jì)分析誤差驗(yàn)證預(yù)測(cè)結(jié)果。
[0040] 所述隨機(jī)生成若干對(duì)二肽構(gòu)象,通過(guò)隨機(jī)生成的二肽構(gòu)象與水分子之間的相互作 用能驗(yàn)證神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)結(jié)果包括以下步驟:
[0041] 隨機(jī)生成若干對(duì)二肽構(gòu)象,得到二肽構(gòu)象與水分子之間的相對(duì)位置,并通過(guò)量子 力學(xué)計(jì)算軟件Gaussian得到二肽構(gòu)象與水分子之間的相互作用能G ;
[0042] 根據(jù)所得的BP神經(jīng)網(wǎng)絡(luò)的物理化學(xué)參數(shù)、通過(guò)分子力學(xué)軟件Tinker得到二肽構(gòu) 象與水分子之間的相互作用能H;
[0043] 將相互作用能G作為真值,通過(guò)統(tǒng)計(jì)分析誤差驗(yàn)證預(yù)測(cè)結(jié)果。
[0044] 本發(fā)明具有以下有