欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于非線性擬合方式的肽質(zhì)譜峰特征參數(shù)提取方法

文檔序號:6242160閱讀:672來源:國知局
一種基于非線性擬合方式的肽質(zhì)譜峰特征參數(shù)提取方法
【專利摘要】本發(fā)明涉及一種肽質(zhì)譜峰特征參數(shù)提取方法。現(xiàn)有方法針對在肽段質(zhì)譜圖中形成譜峰的各樣點(diǎn)其分布存在較大偏差時(shí),存在難以保證所提取出的質(zhì)譜峰特征參數(shù)精準(zhǔn)度的不足。本發(fā)明提出基于非線性擬合方式的肽質(zhì)譜峰特征參數(shù)提取方法,利用多個(gè)樣點(diǎn)數(shù)據(jù),以實(shí)際數(shù)據(jù)與擬合結(jié)果之間差值最小為導(dǎo)向,采用迭代方法不斷更新特征參數(shù)估計(jì)值,直至滿足收斂條件,從而獲得最終特征參數(shù)估值。該方法可有效減少樣點(diǎn)分布偏差對高斯曲線特征參數(shù)求解帶來的不利影響,提高特征參數(shù)數(shù)值精準(zhǔn)度,進(jìn)而有利于肽段鑒定精度的改善。
【專利說明】一種基于非線性擬合方式的肽質(zhì)譜峰特征參數(shù)提取方法

【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于生物質(zhì)譜數(shù)據(jù)預(yù)處理及信息提取【技術(shù)領(lǐng)域】,具體涉及一種基于非線性擬合方式的肽質(zhì)譜峰特征參數(shù)提取方法。

【背景技術(shù)】
[0002]基于串聯(lián)質(zhì)譜的肽鑒定是目前蛋白質(zhì)組研究領(lǐng)域中廣泛使用的技術(shù)。待鑒定的肽在質(zhì)譜儀中被碎裂為碎片離子,從而生成串聯(lián)質(zhì)譜數(shù)據(jù),并與理論串聯(lián)質(zhì)譜庫或已鑒定的肽段質(zhì)譜庫進(jìn)行比對及分析,最后完成對未知肽段的鑒定。
[0003]通常情況下對某種離子進(jìn)行質(zhì)譜檢測,所檢測到的質(zhì)荷比數(shù)據(jù)不是單一數(shù)值點(diǎn),而是存在若干樣點(diǎn),在質(zhì)譜圖上其擬合為高斯曲線,即高斯峰。為確定該離子的荷質(zhì)比,需對這些樣點(diǎn)進(jìn)行預(yù)處理,計(jì)算出其橫軸方向上的質(zhì)心(Centroid),即該離子的實(shí)測質(zhì)荷比。根據(jù)所求質(zhì)心,可進(jìn)而推算出該離子最大豐度值等其他特征參數(shù)。目前質(zhì)心求解方法有多種,比較常見的思路是:假定質(zhì)譜圖上構(gòu)成高斯峰的各個(gè)樣點(diǎn)均嚴(yán)格分布在某條高斯曲線上,利用各樣點(diǎn)的數(shù)值(質(zhì)荷比和豐度值),代入到參數(shù)未知的通用高斯曲線函數(shù)表達(dá)式中,構(gòu)造聯(lián)立方程組,從而解出相應(yīng)高斯峰的特征參數(shù),包括質(zhì)心,最大豐度值等。當(dāng)前應(yīng)用極為廣泛的一款蛋白質(zhì)組學(xué)數(shù)據(jù)分析軟件MAXQUANT采用的即是這一方法。然而在實(shí)際檢測中,受實(shí)驗(yàn)條件、所在環(huán)境以及儀器設(shè)備噪聲等因素的影響,質(zhì)譜圖上各個(gè)樣點(diǎn)往往并非嚴(yán)格分布在高斯曲線上,而是存在一定偏差。當(dāng)各個(gè)樣點(diǎn)偏差數(shù)值較大,則上述方法中的假設(shè)條件難以成立,因而勢必造成求解出的特征參數(shù)在數(shù)值上存在較大誤差,進(jìn)而影響到肽段鑒定的精度。


【發(fā)明內(nèi)容】

[0004]本發(fā)明的目的在于解決上述方法的缺點(diǎn)和不足,提出一種基于非線性擬合方式的肽質(zhì)譜峰特征參數(shù)提取方法。
[0005]設(shè)質(zhì)譜圖中某離子的高斯峰由N個(gè)樣點(diǎn)組成,通常情況下N彡3。對樣點(diǎn)按其豐度值從大到小排序后,其坐標(biāo)構(gòu)成集合A。
[0006]A = {(Hi1, (I1),(m2, d2),…(mN, dN)}
[0007]其中,Hii表示質(zhì)荷比,(Ii表示豐度,其值大于O, i e {1,2,3,...,N}。需要通過樣點(diǎn)擬合出的高斯曲線其函數(shù)形式設(shè)為:
[0008]^ -(T)
/(.V, P) = p{ Xe
[0009]其中,函數(shù)f(x,p)代表豐度值,自變量X代表質(zhì)荷比,Pl、PjP P3S待求解的高斯曲線特征參數(shù),分別表征縮放因子、質(zhì)心、標(biāo)準(zhǔn)差,構(gòu)成特征參數(shù)向量P = [P1 P2 P3I °所述的特征參數(shù)提取方法處理步驟如下:
[0010]步驟(I)根據(jù)豐度值最大的3個(gè)樣點(diǎn)數(shù)據(jù),對高斯曲線特征參數(shù)賦初值。

(呷-]).|~(所:-匕 |~(衍3 ~^2 |~
[0011] ^^ ^ 十32 X 4 ^」+ ^3 ^6 ^

1 卜⑷)—)] X !11\ + [111(4 )—卜1“,! )] 乂 1111 + [1^(^, ) — 1*1(4 )] X
〔 〕 巧 2 卜⑷)—!!!“/;)^"、+(10(4)-(門⑷)…"。+^1^(^/,)-^]^/^;
[0013]卜=1?|』卜—巧)2+1(^ — ^ )2-(^ — ^ )2
[0014]其中,IV 0表示取自然對數(shù)操作。
[0015]步驟(2)選擇合適數(shù)值初始化迭代步長參數(shù)入,該參數(shù)初始化數(shù)值的大小將影響本處理方法的迭代次數(shù)和收斂速度。
[0016]步驟(3)計(jì)算擬合結(jié)果誤差此!",判定迭代過程是否結(jié)束。
[0017]£^ = ^/(^,., ^)-^,-]2

卜1
[0018]設(shè)定判決門限、,如果此!"彡8工,則處理過程結(jié)束,當(dāng)前向量?中的特征參數(shù)值即為求解的最終結(jié)果。反之,如果此1~? 8工,則進(jìn)入步驟(幻。
[0019]門限8 ,的取值決定了所提取的特征參數(shù)值的精準(zhǔn)度,同時(shí)影響處理過程的迭代次數(shù)。8工取值越小,特征參數(shù)值的精準(zhǔn)度就越高,處理所需迭代次數(shù)越多。需要注意的是,如果8工取值過小,則該迭代過程可能將無法最終收斂。反之,8工取值越大,所提取的參數(shù)精準(zhǔn)度將相應(yīng)降低,而迭代次數(shù)將會減少。
[0020]步驟⑷根據(jù)當(dāng)前特征參數(shù)向量?,構(gòu)造矩陣了。
0” 卩)(:/.(坩丨,??0丨,??

8(), €/),
0/ (1112 , 11)0/ (1112 ,
[0021]1= 01^0^25/?

¢7/.(川、,卩)句'11.1、, 0) £/ (111.,,卩)
— 5/^,5廠2(? 一
[0022]步驟(5)計(jì)算每次迭代過程中,特征參數(shù)向量?的更新向量!I =[八巧八%八巧]7,八巧,八巧和八分別為特征參數(shù)巧,和的待定更新值。構(gòu)造誤差矢量2。
[0023]2 = (叫,戶),(叫,?;?,…0%,戶)11
[0024]則:
[0025]11= [了?了+入父乜叫(了?了)]—1※】1※^
[0026]其中,(11^( ? )表示矩陣對角元素提取和創(chuàng)建對角陣操作。
[0027]步驟(6)計(jì)算更新向量??!的度量值9⑶。
「 ^ [[/(坩” ?卜式]2-[[,(岬’ ^ + 0)-^-]2〔0028〕 /7(?) =^~-~,-
[0029]步驟(7)更新特征參數(shù)向量P和迭代步長參數(shù)λ。設(shè)定判決門限ε2,如果更新向量H的度量值P⑶> ε2,則當(dāng)前特征參數(shù)向量P數(shù)值由Ρ+Η替代,即P —Ρ+Η,完成更新,同時(shí)當(dāng)前迭代步長參數(shù)λ數(shù)值減小至λ/K,S卩λ — λ/Κ。反之,如果P (H) ( ε2,則當(dāng)前特征參數(shù)向量P保持不變,同時(shí)迭代步長參數(shù)λ數(shù)值增加K倍,即λ — ΚΧλ。K為比例因子,一般取值范圍為5?20。判決門限ε2應(yīng)根據(jù)樣點(diǎn)偏差程度、收斂速度要求等具體指標(biāo)設(shè)置合適數(shù)值。
[0030]在完成特征參數(shù)向量P和迭代步長參數(shù)λ更新后,返回至步驟(3),進(jìn)入行下一輪迭代。
[0031]本發(fā)明中肽質(zhì)譜峰特征參數(shù)提取方法,采用多樣點(diǎn)非線性擬合方式求解特征參數(shù),減少了樣點(diǎn)分布偏差帶來的不利影響,提升了參數(shù)提取精準(zhǔn)度,進(jìn)而有利于肽段鑒定精度的改善。

【具體實(shí)施方式】
[0032]步驟(I)根據(jù)豐度值最大的3個(gè)樣點(diǎn)數(shù)據(jù),對高斯曲線特征參數(shù)賦初值。
II rn「p2 j~I m1-Pi Γ? ?H-Pi
[0033]P1 = Jx xe" ρ> J +d2xe- Pl ^ +d^xe" Pi」

I [?η(?/9) - ln(c/,)] X mf + [Ιη(?/,) - \χ\{?{)] χ ηι?, + [lr^i/,) - Ιη(?/,,)] χ m\
[ ]2 [?η(?/7)- Ιη(?/,)] χ + [ln(t/,) - ln(f/,)] χ nu + [?η(?/,) -\n(cL)] χ m,
I Ι( nu — ) " - (ηι — ) " I(/η, - ρΛ - ? nu - Γ
[0035]P3 =-x Jv 二 ' J~J +J J~h
3 2 ]j ln(i/,)-ln(r/:) ]j In(V2)-1n(Ji)
[0036]其中,ln(.)表示取自然對數(shù)操作。
[0037]步驟(2)選擇合適數(shù)值初始化迭代步長參數(shù)λ,該參數(shù)初始化數(shù)值的大小將影響本處理方法的迭代次數(shù)和收斂速度。
[0038]步驟(3)計(jì)算擬合結(jié)果誤差Err,判定迭代過程是否結(jié)束。
N?
[0039]Err = Yj [/ (m,, P) - cl ]"

/-1
[0040]設(shè)定判決門限S1,如果Err彡ε i,則處理過程結(jié)束,當(dāng)前向量P中的特征參數(shù)值即為求解的最終結(jié)果。反之,如果Err > S1,則進(jìn)入步驟(4)。
[0041]門限ε ,的取值決定了所提取的特征參數(shù)值的精準(zhǔn)度,同時(shí)影響處理過程的迭代次數(shù)。^取值越小,特征參數(shù)值的精準(zhǔn)度就越高,處理所需迭代次數(shù)越多。需要注意的是,如果^取值過小,則該迭代過程可能將無法最終收斂。反之,^取值越大,所提取的參數(shù)精準(zhǔn)度將相應(yīng)降低,而迭代次數(shù)將會減少。
[0042]步驟(4)根據(jù)當(dāng)前特征參數(shù)向量P,構(gòu)造矩陣J。
¢/.(/0丨,?? ¢/ (/^7,,卩)??

(7/^5/7,

¢7/ (//7,,卩)0/ (1)1,,0/()11-,,卩)
[0043]I = 0^01?25/7,
0)趴坩',飛)
— 印丨印20/1, —
[0044]步驟(5)計(jì)算每次迭代過程中,特征參數(shù)向量?的更新向量!I =[八巧八%八巧]7,八巧,八巧和八分別為特征參數(shù)巧,?2和的待定更新值。構(gòu)造誤差矢量2。
[0045]2 = (叫,戶),(叫,?;?,…0%,戶)11
[0046]則:
[0047]?。?= [了?了+入父乜叫(了1)^)]—1※/※^
[0048]其中,(11^( ? )表示矩陣對角元素提取和創(chuàng)建對角陣操作。
[0049]步驟(6)計(jì)算更新向量!!的度量值9⑶。
[[/(歷,.,^)-4] -[[/(?,妒十0)-式]
[0050]即=^~-~,-
[0051]步驟(7)更新特征參數(shù)向量?和迭代步長參數(shù)\。設(shè)定判決門限、,如果更新向量0的度量值0⑶? 8 2,則當(dāng)前特征參數(shù)向量?數(shù)值由?+?替代,即? 一 9+?,完成更新,同時(shí)當(dāng)前迭代步長參數(shù)\數(shù)值減小至^/1(,即\ \ II反之,如果0 (?) ( 82,則當(dāng)前特征參數(shù)向量?保持不變,同時(shí)迭代步長參數(shù)、數(shù)值增加X倍,即、—XXX。X為比例因子,一般取值范圍為5?20。判決門限8 2應(yīng)根據(jù)樣點(diǎn)偏差程度、收斂速度要求等具體指標(biāo)設(shè)置合適數(shù)值。
[0052]在完成特征參數(shù)向量?和迭代步長參數(shù)\更新后,返回至步驟(3),進(jìn)入行下一輪迭代。
【權(quán)利要求】
1.一種基于非線性擬合方式的肽質(zhì)譜峰特征參數(shù)提取方法,其特征在于: 設(shè)質(zhì)譜圖中某離子的高斯峰由N個(gè)樣點(diǎn)組成,N ^ 3 ;對樣點(diǎn)按其豐度值從大到小排序后,其坐標(biāo)構(gòu)成集合A ;
A = {(HI1, (I1),(m2, d2),…(mN, dN)} 其中,Hii表示質(zhì)荷比,Cli表示豐度值,i e {1,2,3,…,N};準(zhǔn)備通過樣點(diǎn)擬合出的高斯曲線其函數(shù)形式設(shè)為:

Jfzft V
f(x, P) = p, xe ' Pi J 其中,函數(shù)f(x,P)代表理論豐度值,自變量X代表質(zhì)荷比,PpP2和P3S待求解的高斯曲線特征參數(shù),分別表征縮放因子、質(zhì)心、標(biāo)準(zhǔn)差,構(gòu)成特征參數(shù)向量P = [P1 P2 P3I ;具體步驟如下: 步驟(I)根據(jù)豐度值最大的3個(gè)樣點(diǎn)數(shù)據(jù),對高斯曲線特征參數(shù)賦初值;
-f -P1 X? η>2~Ρι[ ^%-Ρι Γ
ρ, = —χ d, xe^ Pi J -\-d0xe^ Pi」+d,xeK ih」.1 323
_ I [ln(i/2)- ln(i/.)] Xinf + [ln(i/.)- ln(i/,)] X m; +[lnii/,) - ln(i/.)] x m:
P1 2 [ln(i1.)-ln(i/.)]x//z, + [ln(i/,) -1n(i/,)] x nu + ) - ln(i/,)] x ///,
=Ix ?θ?2-Ρ:? -(ln1-PzY.Pl)2 -('nZ- PlY . 3 ~2 ]j ln(i/,)-ln(i/2) ^ In(J2)-ln(i/;) 其中,ln(.)表示取自然對數(shù)操作; 步驟(2)選擇合適數(shù)值初始化迭代步長參數(shù)λ,該參數(shù)初始化數(shù)值的大小將影響迭代次數(shù)和收斂速度; 步驟(3)計(jì)算擬合結(jié)果誤差Err,判定迭代過程是否結(jié)束; ["=Σ[/(3,p)-4]2

/=1 設(shè)定判決門限S1,如果ErrS S1,則處理過程結(jié)束,當(dāng)前向量P中的特征參數(shù)值即為求解的最終結(jié)果;反之,如果Err > ε i,則進(jìn)入步驟(4); 步驟(4)根據(jù)當(dāng)前特征參數(shù)向量P,構(gòu)造矩陣J ;
CfQni, P) Cfjniy, P) Cfjmi, P)
Φ,op2cpy
Cfim1, P) cf (nu, P) cf(nu, P) J = φ,Gp2dp.,
cf{ms, P) cf(m,, P) cf(m,, Ρ)
Gplδρ--ρ.步驟(5)計(jì)算每次迭代過程中,特征參數(shù)向量P的更新向量H= [ΛΡι Ap2 Δρ3]τ,ΔΡι,ΔΡ2和Δ P3分別為特征參數(shù)Pi,P2和Ρ3的待定更新值;構(gòu)造誤差矢量E ;
E = [dff (Hi1, P),d2-f (m2, P),…dN-f (mN, P) ]τ
則: H= [JTXJ+A Xdiag(JTXJ) F1XJtXE 其中,diag(.)表示矩陣對角元素提取和創(chuàng)建對角陣操作; 步驟(6)計(jì)算更新向量H的度量值P⑶;
Σ[/(";,, P)-c-/.]:-1[/(m, P + H)-^.]2 p(H) = ^?~?ξΙ--

2HTx(/lxH + JTxE) 步驟(7)更新特征參數(shù)向量P和迭代步長參數(shù)λ ;設(shè)定判決門限ε2,如果更新向量H的度量值P⑶> ε2,則當(dāng)前特征參數(shù)向量P數(shù)值由Ρ+Η替代,即P —Ρ+Η,完成更新,同時(shí)當(dāng)前迭代步長參數(shù)λ數(shù)值減小至λ/K,S卩λ — λ/K ;反之,如果P (H) ( ε2,則當(dāng)前特征參數(shù)向量P保持不變,同時(shí)迭代步長參數(shù)λ數(shù)值增加K倍,S卩λ — ΚΧλ ;Κ為比例因子,取值范圍為5?20 ;在完成特征參數(shù)向量P和迭代步長參數(shù)λ更新后,返回至步驟(3),進(jìn)行下一輪迭代。
【文檔編號】G01N27/62GK104316591SQ201410498854
【公開日】2015年1月28日 申請日期:2014年9月25日 優(yōu)先權(quán)日:2014年9月25日
【發(fā)明者】易志強(qiáng), 李蕓, 章劍秋, 曾嶸, 姚英彪, 張福洪, 李希元 申請人:杭州電子科技大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
奉化市| 承德市| 灵宝市| 顺平县| 社旗县| 楚雄市| 宁都县| 甘肃省| 柯坪县| 古田县| 丽水市| 青浦区| 林州市| 兴业县| 抚顺市| 盐边县| 盖州市| 塔河县| 黎平县| 公主岭市| 祥云县| 清涧县| 刚察县| 东光县| 西吉县| 云林县| 谢通门县| 天全县| 聂拉木县| 海晏县| 七台河市| 扎囊县| 开封市| 延庆县| 东源县| 谷城县| 海淀区| 兴和县| 芷江| 浙江省| 富源县|