本技術(shù)涉及動(dòng)物基因組育種領(lǐng)域,且更為具體地,涉及一種利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法、利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的裝置及電子設(shè)備。
背景技術(shù):
1、動(dòng)物個(gè)體復(fù)雜性狀由多個(gè)基因和環(huán)境因素共同決定,因此難以通過(guò)傳統(tǒng)的單基因遺傳分析來(lái)準(zhǔn)確預(yù)測(cè)。基因組選擇通過(guò)利用大量單核苷酸多態(tài)性(single?nucleotidepolymorphisms,snps)與數(shù)量性狀核苷酸之間的連鎖不平衡(linkage?disequilibrium,ld)關(guān)系來(lái)預(yù)測(cè)這些復(fù)雜性狀。
2、在動(dòng)物遺傳評(píng)估領(lǐng)域,基因組選擇方法已經(jīng)取得了顯著的成功,其通過(guò)構(gòu)建基于全基因組snps數(shù)據(jù)的預(yù)測(cè)模型,研究人員能夠更準(zhǔn)確地估計(jì)個(gè)體的遺傳潛力,提高育種效率,加速優(yōu)良品種的選育。然而,基因組選擇在預(yù)測(cè)豬復(fù)雜性狀方面正面臨諸多挑戰(zhàn),由于ld在不同群體或品種個(gè)體間存在顯著差異,這意味著在一個(gè)群體中有效的預(yù)測(cè)模型可能無(wú)法直接應(yīng)用于另一個(gè)群體,例如不同環(huán)境下或不同品種的豬群體。這種群體特異性的ld模式增加了跨群體預(yù)測(cè)的復(fù)雜性;此外,環(huán)境因素與基因型之間的相互作用也增加了預(yù)測(cè)復(fù)雜性狀的難度。因此需要改進(jìn)當(dāng)前的基因組選擇方法。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)問(wèn)題,提出了本技術(shù)。本技術(shù)的實(shí)施例提供了一種利用大規(guī)模基因組注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法、利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的裝置和電子設(shè)備,其整合了豬基因組上不同類(lèi)別的多個(gè)功能注釋?zhuān)煤喜⒑蟮玫降墓δ茏⑨尲幕蚪M親緣關(guān)系矩陣采用包含多個(gè)隨機(jī)遺傳效應(yīng)的混合線(xiàn)性模型計(jì)算功能注釋集的隨機(jī)遺傳效應(yīng)值,提高了基因組選擇的準(zhǔn)確性和時(shí)效性。
2、具體來(lái)說(shuō),本技術(shù)涉及如下方面:
3、1.根據(jù)本技術(shù)的一方面,提供了一種利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法,包括:
4、收集參考群豬只基因組的多個(gè)功能注釋及其位置信息;
5、根據(jù)多個(gè)功能注釋的位置信息確定參考群豬只基因組的多個(gè)功能注釋區(qū)域,提取多個(gè)功能注釋區(qū)域的snps數(shù)據(jù)并分別構(gòu)建多個(gè)功能注釋中的每個(gè)功能注釋的基因組親緣關(guān)系矩陣a;
6、估計(jì)基因組親緣關(guān)系矩陣a的方差組分,基于方差組分的大小對(duì)多個(gè)功能注釋進(jìn)行排序,合并多個(gè)功能注釋以得到功能注釋集;
7、刪除功能注釋集中的重復(fù)snps數(shù)據(jù)并構(gòu)建功能注釋集的基因組親緣關(guān)系矩陣b,基于基因組親緣關(guān)系矩陣b采用包含多個(gè)隨機(jī)遺傳效應(yīng)的混合線(xiàn)性模型計(jì)算功能注釋集的隨機(jī)遺傳效應(yīng)值以得到候選群豬只目標(biāo)性狀估計(jì)的基因組育種值。
8、2.根據(jù)項(xiàng)1的利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法,其中,
9、根據(jù)多個(gè)功能注釋的位置信息確定參考群豬只基因組的多個(gè)功能注釋區(qū)域之前包括:
10、對(duì)參考群豬只基因組進(jìn)行全基因組關(guān)聯(lián)分析以得到參考群豬只的目標(biāo)性狀的顯著性位點(diǎn),將目標(biāo)性狀的顯著性位點(diǎn)作為一類(lèi)功能注釋合并至多個(gè)功能注釋中。
11、3.根據(jù)項(xiàng)1的利用大規(guī)模基因組注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法,其中,
12、合并多個(gè)功能注釋以得到功能注釋集包括:
13、基于方差組分中的最大方差組分確定合并區(qū)間;
14、響應(yīng)于方差組分位于合并區(qū)間內(nèi)合并功能注釋?zhuān)缘玫焦δ茏⑨尲?/p>
15、4.根據(jù)項(xiàng)3的利用大規(guī)模基因組注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法,其中,
16、基于方差組分中的最大方差組分確定合并區(qū)間包括:
17、將最大方差組分的十分之一到最大方差組分之間的方差組分區(qū)間作為合并區(qū)間a;
18、將最大方差組分的萬(wàn)分之一到最大方差組分的十分之一之間的方差組分區(qū)間作為合并區(qū)間b;以及
19、將零到最大方差組分的萬(wàn)分之一之間的方差組分區(qū)間作為合并區(qū)間c。
20、5.根據(jù)項(xiàng)4的利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法,其中,
21、合并區(qū)間b包括合并區(qū)間b1、合并區(qū)間b2和合并區(qū)間b3;
22、合并區(qū)間b、合并區(qū)間b2和合并區(qū)間b3的區(qū)間端點(diǎn)依次具有等比關(guān)系。
23、6.根據(jù)項(xiàng)1的利用大規(guī)模基因組注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法,其中,
24、基于基因組親緣關(guān)系矩陣b采用包含多個(gè)隨機(jī)遺傳效應(yīng)的混合線(xiàn)性模型計(jì)算功能注釋集的隨機(jī)遺傳效應(yīng)值以得到候選群豬只目標(biāo)性狀的基因組育種值包括:
25、累加功能注釋集的隨機(jī)遺傳效應(yīng)值,以作為候選群豬只目標(biāo)性狀的基因組育種值。
26、7.根據(jù)本技術(shù)的另一方面,提供了一種利用大規(guī)模基因組注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的裝置,包括:
27、功能注釋收集單元,收集參考群豬只基因組的多個(gè)功能注釋及其位置信息;
28、親緣關(guān)系構(gòu)建單元,根據(jù)多個(gè)功能注釋的位置信息確定參考群豬只基因組的多個(gè)功能注釋區(qū)域,提取多個(gè)功能注釋區(qū)域的snps數(shù)據(jù)并分別構(gòu)建多個(gè)功能注釋中的每個(gè)功能注釋的基因組親緣關(guān)系矩陣a;
29、功能注釋整合單元,估計(jì)基因組親緣關(guān)系矩陣a的方差組分,基于方差組分的大小對(duì)多個(gè)功能注釋進(jìn)行排序,合并多個(gè)功能注釋以得到功能注釋集;
30、輸出單元,刪除功能注釋集中的重復(fù)snps數(shù)據(jù)并構(gòu)建功能注釋集的基因組親緣關(guān)系矩陣b,基于基因組親緣關(guān)系矩陣b采用包含多個(gè)隨機(jī)遺傳效應(yīng)的混合線(xiàn)性模型計(jì)算功能注釋集的隨機(jī)遺傳效應(yīng)值以得到候選群豬只目標(biāo)性狀的基因組育種值。
31、8.根據(jù)項(xiàng)7的利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的裝置,進(jìn)一步包括:
32、功能注釋補(bǔ)充單元,對(duì)參考群豬只基因組進(jìn)行全基因組關(guān)聯(lián)分析以得到參考群豬只的目標(biāo)性狀的顯著性位點(diǎn),將目標(biāo)性狀的顯著性位點(diǎn)作為一類(lèi)功能注釋合并至多個(gè)功能注釋中。
33、9.根據(jù)本技術(shù)的又一方面,提供了一種電子設(shè)備,包括:
34、處理器;以及
35、存儲(chǔ)器,在存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)程序指令,計(jì)算機(jī)程序指令在被處理器運(yùn)行時(shí)使得處理器執(zhí)行根據(jù)項(xiàng)1-6中任一項(xiàng)的利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法。
36、有益效果
37、1、本技術(shù)提出的利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法可通過(guò)整合基因組的功能注釋信息提高基因組選擇的準(zhǔn)確性,加快目標(biāo)性狀的遺傳進(jìn)展,算短育種周期。所述的方法可以根據(jù)豬基因組的多種功能注釋位置信息和參考群基因組信息得到各功能注釋的基因組親緣關(guān)系矩陣,以確定豬只復(fù)雜性狀的遺傳特性關(guān)系,將方差組分相近的功能注釋合并以作為隨機(jī)遺傳效應(yīng)預(yù)測(cè)具有目標(biāo)性狀的動(dòng)物個(gè)體的基因組育種值,這樣,就可以使用多個(gè)目標(biāo)性狀的基因組育種值構(gòu)建目標(biāo)的綜合選擇指數(shù),根據(jù)綜合選擇指數(shù)對(duì)目標(biāo)動(dòng)物的個(gè)體進(jìn)行排序,提供選留侯選個(gè)體名單以?xún)?yōu)化育種策略。
38、2、本技術(shù)提出的利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法在提取豬基因組的多種功能注釋及其位置信息時(shí),可以不限制所需的功能注釋的類(lèi)別,可在豬基因組中提取至多百種功能注釋信息并作為多個(gè)隨機(jī)遺傳效應(yīng),通過(guò)合并降低信息維度并快速擬合混合線(xiàn)性模型,以計(jì)算個(gè)體的基因組育種值,因此在保持準(zhǔn)確性的前提下具有更高的豬育種評(píng)估泛用性和普及度,可以避免通過(guò)特定功能注釋信息構(gòu)建的模型對(duì)豬群體ld異構(gòu)的低適應(yīng)性,同時(shí)避免利用多個(gè)功能注釋構(gòu)建模型時(shí)效率低下、實(shí)時(shí)性不強(qiáng)的問(wèn)題。
39、3、本技術(shù)提出的利用大規(guī)?;蚪M注釋信息提高豬復(fù)雜性狀基因組選擇準(zhǔn)確性的方法,在現(xiàn)有基因組選擇方法所達(dá)到的育種預(yù)測(cè)最優(yōu)水平的基礎(chǔ)上,其對(duì)目標(biāo)豬只育種值的預(yù)測(cè)準(zhǔn)確率相比提高了4.61%,向豬育種技術(shù)人員提供了更高選擇優(yōu)先度的選擇,進(jìn)一步提高了育種優(yōu)化效率和優(yōu)化水平。