金字塔型篩選方法對內(nèi)源性代謝產(chǎn)物進(jìn)行分類與鑒定的方法
【專利摘要】本發(fā)明公開了一種采用金字塔型篩選方法對內(nèi)源性代謝產(chǎn)物進(jìn)行分類與鑒定的方法。它是將由Masslynx軟件提取的色譜峰數(shù)據(jù)導(dǎo)入Excel表格中;根據(jù)不同能量碰撞裂解的過程,在正離子模式下,查找母離子要符合[M+H]+、[M+Na]+、[M+K]+或[M+H+Na]+的條件;在負(fù)離子模式下,查找母離子要符合[M-H]-或[M-HAC]-的條件,對碎片離子進(jìn)行合并;利用金字塔型篩選方法,對大量的生物樣本數(shù)據(jù)進(jìn)行不同類別的目標(biāo)化合物的分類與篩選:經(jīng)HMDB與KEGG等數(shù)據(jù)庫查詢驗(yàn)證,進(jìn)一步確認(rèn)目標(biāo)化合物結(jié)構(gòu)等信息。本發(fā)明對脂質(zhì)組學(xué)、石油化工、中藥分析等領(lǐng)域中化合物的分類、鑒定、發(fā)現(xiàn)、分離都有著重要的指導(dǎo)意義。
【專利說明】金字塔型篩選方法對內(nèi)源性代謝產(chǎn)物進(jìn)行分類與鑒定的方 法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于生物樣本的數(shù)據(jù)后處理【技術(shù)領(lǐng)域】,涉及體內(nèi)內(nèi)源性物質(zhì)的篩選與鑒別 的過程處理技,更具體的說是一種采用金字培型篩選方法對內(nèi)源性代謝產(chǎn)物進(jìn)行分類與鑒 定的方法。
【背景技術(shù)】
[0002] 如今,隨著數(shù)據(jù)后處理技術(shù)的不斷發(fā)展,質(zhì)量虧損過濾(Mass defect filtering, MDF)、診斷碎片過濾(Dia即ostic fragments filtering, DFF)與中性丟失過濾(Neutral loss filtering, NLF)在物質(zhì)的篩選與鑒別方面顯示出獨(dú)特的優(yōu)勢。質(zhì)量虧損過濾是指化 合物分子的準(zhǔn)確質(zhì)量數(shù)與其最接近的整數(shù)值之間的差值,一般根據(jù)同一類化合物具有相同 的母核結(jié)構(gòu)的特征,通過某一質(zhì)量虧損范圍,從而篩選與鑒別出某類化合物。目前,質(zhì)量虧 損過濾技術(shù)已經(jīng)應(yīng)用在檢測與表征生物基質(zhì)代謝物、藥物設(shè)計(jì)、中草藥中物質(zhì)分析W及脂 質(zhì)種類的成像等方面,然而其在代謝組學(xué)領(lǐng)域未見報(bào)道。由于體內(nèi)內(nèi)源性物質(zhì)成分復(fù)雜,雖 然可對不同類別的物質(zhì)進(jìn)行區(qū)分,但不同類別物質(zhì)的質(zhì)量虧損范圍存在相互重疊與交叉的 現(xiàn)象,因此不能對其進(jìn)行準(zhǔn)確的分類。同時我們注意到,雖然體內(nèi)內(nèi)源性物質(zhì)種類繁多、化 學(xué)組成復(fù)雜,但同一類別的物質(zhì)具有相似或相同的母核結(jié)構(gòu),致使同類物質(zhì)在質(zhì)譜碰撞誘 導(dǎo)的過程中存在相同的斷裂行為。從而,診斷碎片過濾與中性丟失過濾被應(yīng)用于物質(zhì)篩選 與鑒定過程中。診斷碎片是指同類化合物在質(zhì)譜斷裂過程中均可W形成的特征碎片離子, 因此診斷碎片的方法可W用于不同類別物質(zhì)的篩選W及已知與未知化合物的分類及鑒定。 中性丟失是指一級質(zhì)譜(MSI)與二級質(zhì)譜(MS2)之間的質(zhì)量差值(m),利用質(zhì)量差值可對具 有某一類特征取代基團(tuán)的物質(zhì)進(jìn)行粗略的分類。然而,發(fā)現(xiàn)不同類別的化合物存在共用一 個診斷碎片或中性丟失的情況,導(dǎo)致物質(zhì)篩選過程中易出現(xiàn)混淆,假陽性的結(jié)果增多。由于 不同碰撞能量誘導(dǎo)所產(chǎn)生的母離子與碎片離子的豐度差異較大,如果單獨(dú)的研究某一特定 碰撞能下的物質(zhì)裂解規(guī)律可能會造成碎片信息的丟失,而致假陽性結(jié)果。許國胚等利用不 同碰撞能量裂解下的碎片結(jié)合HPLC-MS對慢性己型肝炎進(jìn)行分析,彌補(bǔ)了單一碰撞能量下 的信息丟失。因此,對于復(fù)雜的體內(nèi)內(nèi)源性物質(zhì)的篩選與鑒別的過程,亟需一個快速、準(zhǔn)確 的數(shù)據(jù)后處理方法。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明可W從復(fù)雜生物樣本中準(zhǔn)確提取多類物質(zhì),該對內(nèi)源性代謝物的分類、鑒 定W及快速發(fā)現(xiàn)潛在生物標(biāo)記物具有重要的意義。本發(fā)明在一定程度上解決了代謝組學(xué)中 的關(guān)鍵難題一代謝物的分類與鑒別,該將有利于代謝組學(xué)的進(jìn)一步發(fā)展。
[0004] 為實(shí)現(xiàn)上述目的,本發(fā)明公開了如下的技術(shù)內(nèi)容: 一種采用金字培型篩選方法對內(nèi)源性代謝產(chǎn)物進(jìn)行分類與鑒定的方法,其特征在于按 如下的步驟進(jìn)行: (1) 將由Masslynx軟件提取的色譜峰數(shù)據(jù)導(dǎo)入Excel表格中; (2) 根據(jù)不同能量碰撞裂解的過程,在正離子模式下,查找母離子要符合[M+田\ [M+Na]\ [M+時+或[M+H+Nar的條件;在負(fù)離子模式下,查找母離子要符合[M-田-或 [M-HACr的條件,對碎片離子進(jìn)行合并; (3) 利用金字培型篩選方法,對大量的生物樣本數(shù)據(jù)進(jìn)行不同類別的目標(biāo)化合物的分 類與篩選: (4) 經(jīng)HMDB與KEGG等數(shù)據(jù)庫查詢驗(yàn)證,進(jìn)一步確認(rèn)目標(biāo)化合物結(jié)構(gòu)等信息;其中所述 的金字培型篩選方法指的是: 1) 當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在60. 0-204. 1和-0. 0046-0. 1150范圍內(nèi)時, 則此類物質(zhì)屬于第I類物質(zhì),隨后對不同能量碰撞誘導(dǎo)下的離子碎片進(jìn)行進(jìn)一步篩選,正 離子模式下,若丟失畑3和HCOOH的中性丟失碎片,則為氨基酸;若丟失畑3的中性丟失碎 片,則為堿基或單胺類神經(jīng)遞質(zhì);負(fù)離子模式下,若丟失(?的中性丟失碎片,則為有機(jī)酸; 2) 當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在227. 0-364. 3和0. 0695-0. 240范圍內(nèi) 時,則此類物質(zhì)屬于第II類物質(zhì),即核巧和類固醇激素;在正離子模式下,若含有m/z 97. 06 [C化0r 和 m/z 109. 06 [C7H9O] + 的診斷碎片和對應(yīng) 0. 0643-0. 0662 和 0. 0642-0. 0663 化的診斷碎片質(zhì)量虧損范圍時,則為類固醇激素;在負(fù)離子模式下,若含有m/z 145. 06 [CwHgOr的診斷碎片和0. 0638-0. 0667化的診斷碎片質(zhì)量虧損范圍,則為雌激素; 正離子模式下,若丟失巧服03和巧服04中性丟失碎片,則為核巧; 3) 當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在412. 2-607. 5和0. 2385-0. 4576范 圍內(nèi)時,則此類物質(zhì)屬于第III類物質(zhì),即LPEs和LPCs;正離子模式下,若含有m/z 184. 07 [C吊uN04Pr的診斷碎片和0. 0720-0. 0757化的診斷碎片質(zhì)量虧損范圍,則為LPCs ; 若丟失咕&側(cè)4巧的中性丟失碎片,則為LPEs ; 4) 當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在635. 4-915. 8和0. 4369-0. 8125范圍內(nèi) 時,則此類物質(zhì)屬于第IV類物質(zhì),即PCs/陽s/PSs/PIs/PAs/PGs物質(zhì);正離子模式下,若 含有m/z 184. 07 [CsHisNOaP]+的診斷碎片和0.0720-0. 0757化的診斷碎片質(zhì)量虧損范 圍,則為PCs ;若丟失咕&側(cè)4巧的中性丟失碎片,則為PEs ;負(fù)離子模式下,若含有m/z 241. Ol [CeHioPOsF的診斷碎片和0. 0088-0. 0137 Da的診斷碎片質(zhì)量虧損值范圍,則為PIs ; 若含有m/z 152. 99[CjHePOg]-的診斷碎片和0. 9937-0. 9968化的診斷碎片質(zhì)量虧損范圍,貝U 為PAs/PGs ;若丟失(C3&N02)的中性丟失碎片,則為PSs,最終對已篩選出的不同類別的化 合物,進(jìn)行HMDB數(shù)據(jù)庫的查詢,W期快速準(zhǔn)確的篩選出目標(biāo)化。
[0005] 本發(fā)明更加詳細(xì)的步驟如下: 1、將由Masslynx軟件提取的色譜峰數(shù)據(jù)導(dǎo)入Excel表格中。
[0006] 2、根據(jù)不同能量碰撞裂解的過程,母離子在質(zhì)譜中隨碰撞能量的逐漸升高,響應(yīng) 值逐漸降低,然而碎片離子無此特點(diǎn),所W可W同時分別提取母離子和碎片離子的信息。正 離子模式下,查找母離子要符合[M+H]\ [M+Na]\ [M+K]+或[M+H+Nar的條件;負(fù)離子模式 下,查找母離子要符合[M-田-或[M-HACr的條件,同時不同碎片離子可能來源于同一個化 合物,需要對碎片離子進(jìn)行合并。
[0007] 3、利用金字培型篩選方法,對大量的生物樣本數(shù)據(jù)進(jìn)行不同類別的目標(biāo)化合物的 分類與篩選。
[0008] I)當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在(60. 0-204. I)和(-0.0046-0. 1150)范 圍內(nèi)時,則此類物質(zhì)屬于第I類物質(zhì),即氨基酸、有機(jī)酸、單糖、單胺類神經(jīng)遞質(zhì)、堿基。隨 后,對不同能量碰撞誘導(dǎo)下的離子碎片進(jìn)行進(jìn)一步篩選。正離子模式下,若丟失畑3和HCOOH 的中性丟失碎片,則為氨基酸;若丟失NHs的中性丟失碎片,則為堿基或單胺類神經(jīng)遞質(zhì); 負(fù)離子模式下,若丟失C〇2的中性丟失碎片,則為有機(jī)酸。
[0009] 2)當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在(227. 0-364. 3)和(0.0695-0. 240) 范圍內(nèi)時,則此類物質(zhì)屬于第II類物質(zhì),即核巧和類固醇激素。正離子模式下,若含 有 m/z 97. 06的&0] + 和 m/z 109. 06[(:化0]+ 的診斷碎片和對應(yīng)(0. 0643-0. 0662)和 (0. 0642-0. 0663)化的診斷碎片質(zhì)量虧損范圍時,則為雄激素、孕激素、糖皮質(zhì)激素和鹽皮 質(zhì)激素;在負(fù)離子模式下,若含有m/z 145. 06 [CwHgOr的診斷碎片和(0. 0638-0. 0667)化 的診斷碎片質(zhì)量虧損范圍,則為雌激素;正離子模式下,若丟失(C5服03)和(C5服04)中性 丟失碎片,則為核巧。
[0010] 3)當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在(412. 2-607. 5)和(0. 2385-0. 4576) 范圍內(nèi)時,則此類物質(zhì)屬于第III類物質(zhì),即LPEs和LPCs。正離子模式下,若含有m/ Z 184. 07 [CsHisNOaP]+的診斷碎片和(0. 0720-0. 0757)化的診斷碎片質(zhì)量虧損范圍,則為 LPCs ;若丟失(C化NO4P)的中性丟失碎片,則為LPEs。
[0011] 4)當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在(635. 4-915. 8)和(0.4369-0. 8125) 范圍內(nèi)時,則此類物質(zhì)屬于第IV類物質(zhì),即PCs/PEs/PSs/PIs/PAs/PGs物質(zhì)。正離子模式 下。若含有m/z 184. 07 [CsHisNOaP] +的診斷碎片和(0. 0720-0. 0757 )化的診斷碎片質(zhì)量虧 損范圍,則為PCs;若丟失(CsHsNOa巧的中性丟失碎片,則為PEs。負(fù)離子模式下,若含有m/ Z 241. Ol [CeHwPOs]-的診斷碎片和(0. 0088-0. 0137) Da的診斷碎片質(zhì)量虧損值范圍,則為 PIs ;若含有m/z 152. 99 [CsHePOs]-的診斷碎片和(0. 9937-0. 9968)Da的診斷碎片質(zhì)量虧損 范圍,則為PAs/PGs ;若丟失(C3&N02)的中性丟失碎片,則為PSs。最終對已篩選出的不同 類別的化合物,進(jìn)行HMDB數(shù)據(jù)庫的查詢,W期快速準(zhǔn)確的篩選出目標(biāo)化合物。
[0012] 4、經(jīng)HMDB與KEGG等數(shù)據(jù)庫查詢驗(yàn)證,進(jìn)一步確認(rèn)目標(biāo)化合物結(jié)構(gòu)等信息。
[0013] 本發(fā)明公開的采用金字培型篩選方法對內(nèi)源性代謝產(chǎn)物進(jìn)行分類與鑒定的方法 與現(xiàn)有技術(shù)相比所具有的積極效果在于: (1) 常規(guī)的代謝物鑒定方法是與標(biāo)準(zhǔn)品信息比對或參考已發(fā)表的文獻(xiàn)數(shù)據(jù)或與數(shù)據(jù)庫 中信息匹配,但由于內(nèi)源性物質(zhì)的標(biāo)準(zhǔn)品不易獲得,質(zhì)譜解析操作復(fù)雜、耗時,同時存在不 同類別代謝物互為同分異構(gòu)體的現(xiàn)象。因此,本發(fā)明采用質(zhì)量虧損過濾技術(shù)、診斷碎片質(zhì)量 虧損過濾與中性丟失過濾相結(jié)合的方法,構(gòu)建內(nèi)源性代謝物的金字培型篩選方法,能夠快 速、靈敏、準(zhǔn)確的對內(nèi)源性代謝物進(jìn)行分類與鑒定。
【權(quán)利要求】
1. 一種采用金字塔型篩選方法對內(nèi)源性代謝產(chǎn)物進(jìn)行分類與鑒定的方法,其特征在于 按如下的步驟進(jìn)行: (1) 將由Masslynx軟件提取的色譜峰數(shù)據(jù)導(dǎo)入Excel表格中; (2) 根據(jù)不同能量碰撞裂解的過程,在正離子模式下,查找母離子要符合[M+H]+、 [M+Na] +、[M+K] +或[M+H+Na] +的條件;在負(fù)離子模式下,查找母離子要符合[M-H] _或 [M-HACr的條件,對碎片離子進(jìn)行合并; (3) 利用金字塔型篩選方法,對大量的生物樣本數(shù)據(jù)進(jìn)行不同類別的目標(biāo)化合物的分 類與篩選: (4) 經(jīng)HMDB與KEGG等數(shù)據(jù)庫查詢驗(yàn)證,進(jìn)一步確認(rèn)目標(biāo)化合物結(jié)構(gòu)等信息;其中所述 的金字塔型篩選方法指的是: 1) 當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在60. 0-204. 1和-0. 0046-0. 1150范圍內(nèi)時, 則此類物質(zhì)屬于第I類物質(zhì),隨后對不同能量碰撞誘導(dǎo)下的離子碎片進(jìn)行進(jìn)一步篩選,正 離子模式下,若丟失NH 3和HCOOH的中性丟失碎片,則為氨基酸;若丟失NH3的中性丟失碎 片,則為堿基或單胺類神經(jīng)遞質(zhì);負(fù)離子模式下,若丟失C0 2的中性丟失碎片,則為有機(jī)酸; 2) 當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在227. 0-364. 3和0. 0695-0. 240范圍內(nèi) 時,則此類物質(zhì)屬于第II類物質(zhì),即核苷和類固醇激素;在正離子模式下,若含有m/z 97. 06 [C6H90] + 和 m/z 109. 06 [C7H90] + 的診斷碎片和對應(yīng) 0· 0643-0. 0662 和 0· 0642-0. 0663 Da的診斷碎片質(zhì)量虧損范圍時,則為類固醇激素;在負(fù)離子模式下,若含有m/z 145. 06 [C1(lH9〇r的診斷碎片和0. 0638-0. 0667 Da的診斷碎片質(zhì)量虧損范圍,則為雌激素; 正離子模式下,若丟失C5H803和C5H804中性丟失碎片,則為核苷; 3) 當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在412. 2-607. 5和0. 2385-0. 4576范 圍內(nèi)時,則此類物質(zhì)屬于第III類物質(zhì),即LPEs和LPCs;正離子模式下,若含有m/z 184. 07 [C5H15N04P]+的診斷碎片和0. 0720-0. 0757 Da的診斷碎片質(zhì)量虧損范圍,則為LPCs ; 若丟失(C2H8N04P)的中性丟失碎片,則為LPEs ; 當(dāng)化合物分子質(zhì)量與質(zhì)量虧損值分別在635.4-915.8和0.4369-0. 8125范圍內(nèi) 時,則此類物質(zhì)屬于第IV類物質(zhì),即PCs/PEs/PSs/PIs/PAs/PGs物質(zhì);正離子模式下, 若含有m/z 184. 07[C5H15N04P]+的診斷碎片和0.0720-0. 0757 Da的診斷碎片質(zhì)量虧損 范圍,則為PCs ;若丟失(C2H8N04P)的中性丟失碎片,則為PEs ;負(fù)離子模式下,若含有m/ z 241. 01 [C6H1(lP08]_的診斷碎片和0. 0088-0. 0137 Da的診斷碎片質(zhì)量虧損值范圍,則為 Pis ;若含有m/z 152. 99 [C3H6P05]_的診斷碎片和0. 9937-0. 9968Da的診斷碎片質(zhì)量虧損范 圍,則為PAs/PGs ;若丟失(C3H5N02)的中性丟失碎片,則為PSs,最終對已篩選出的不同類別 的化合物,進(jìn)行HMDB數(shù)據(jù)庫的查詢,以期快速準(zhǔn)確的篩選出目標(biāo)化合物。
2. 權(quán)利要求1所述采用金字塔型篩選方法對內(nèi)源性代謝產(chǎn)物進(jìn)行分類與鑒定的方法, 其中所述的第I類物質(zhì)指的是:氨基酸、有機(jī)酸、單糖、單胺類神經(jīng)遞質(zhì)、堿基。
3. 權(quán)利要求1所述采用金字塔型篩選方法對內(nèi)源性代謝產(chǎn)物進(jìn)行分類與鑒定的方法, 其中所述的固醇激素指的是:雄激素、孕激素、糖皮質(zhì)激素和鹽皮質(zhì)激素。
【文檔編號】G01N33/48GK104237493SQ201410329539
【公開日】2014年12月24日 申請日期:2014年7月11日 優(yōu)先權(quán)日:2014年7月11日
【發(fā)明者】張艷軍, 李遇伯, 張振珠, 侯治國, 王磊, 武欣, 張秀秀 申請人:天津中醫(yī)藥大學(xué)