專利名稱:使用dna標記和數量性狀數據產生遺傳預測器的方法
技術領域:
本發(fā)明涉及產生遺傳預測器的方法,特別涉及使用脫氧核糖核酸(DNA)標記和 數量性狀數據產生遺傳預測器的方法。
背景技術:
在近20年中,通過記錄系譜和性狀數據并分析這些數據以估計表型的繼承(遺 傳)成分的最佳線性無偏預測法(BLUP),在各種植物和動物種類中已經實現了遺傳改 進。對于這種方法,有很多修正和改進。最近,方法的發(fā)展取得了顯著的進步,可以使用分子標記促進遺傳預測。初期 主要關注標記輔助選擇(MAS),其經常涉及合適的標記或連鎖的多態(tài)性(經常稱作數量 性狀位點,QTL),作為BLUP分析中的固定或隨機效應。這個領域最新的進展是全基因 組MAS或基因組選擇,其中同時確定大量標記(例如60000個)的遺傳型。使用反復取 樣方法產生遺傳性能的SNP鍵預測器。這些方法的主要缺陷如下(1)數量測定要使用BLUP估計遺傳或育種值,動物通常需要有系譜和性狀記 錄,并可以在環(huán)境/彼此間有遺傳聯(lián)系的組間理性地比較動物。這極大地限制了遺傳預 測器的范圍,使其只能用于可以進行大量記錄,并且在不同的組中和環(huán)境條件下存在遺 傳聯(lián)系(例如有共同的父親)連接不同動物時。大多數數量估計的另一個缺陷是只有在 動物有大量后代時估計才準確,并且因此子畜中的準確率通常為低至中等水平,高度可 遺傳的性狀除外。很多BLUP系統(tǒng)的另一個缺陷是它們只提供種群內比較,因為缺乏合 適的在相同環(huán)境中培養(yǎng)的物種與雜交物種的遺傳型數據結構。盡管有種群比較實驗,并 且存在世界上廣泛承認的雜交物種遺傳評價體系,但是環(huán)境交互作用仍然使確定基因型 存在很多問題。(2)MAS ;盡管理論上可行,但是MAS和上述(1)有很多相同的問題,并且此 外,已經證明標記輔助選擇(MAS)在實踐中難于執(zhí)行。原因之一是,在實踐中,會大量 丟失遺傳型和/或表型數據。方法如遺傳型干擾可以容許丟失一些遺傳型數據。已經在 個別的管理較好的大型育種計劃中成功使用了 MAS,但是參數估計和遺傳型數據非常稀 少的問題意味著很難在對農牧業(yè)的遺傳育種值服務中使用MAS。(3)基因組選擇表現出能提供可以不需要數量信息而使用的穩(wěn)健的預測器,但是 (1)基因組選擇需要的非常大量的標記目前很昂貴,并且(2)產生的SNP鍵傾向于只與來 自相同種群/群體的動物有關,除非密度非常高。在不同群體中應用時,SNP鍵預測器 的能力會迅速下降。針對以上問題,需要在多種條件下精確而穩(wěn)定的產生遺傳預測器的方法,并且 能跨種群和種群組成進行比較。此外,需要產生這種遺傳預測器的方法,所述遺傳預測器在參數估計中的誤差 相對較少。
發(fā)明內容
本發(fā)明通過提供基于DNA標記和數量性狀數據而產生遺傳預測器的方法來滿足 上述需要。在本發(fā)明中,通過將價值的分子估計值(estimates)與由數量性狀測定推導出的 至少一個遺傳值的估計混合,產生遺傳預測器。個體分子估計值可以包括分子性狀估計 或分子性狀變異。個體分子估計值可以通過應用個體脫氧核糖核酸(DNA)標記、DNA 標記組、其具體的參數估計和特定參數變化,和測試樣本的遺傳型而確定。數量性狀測 定可以包括估計育種值、原始性狀數據,和根據動物祖先信息記錄的種群組成數據,和 祖先的種群狀態(tài)。本發(fā)明的遺傳預測器在多種條件下有益并有用,而且對于大于零的參 數值,在參數估計中誤差相對較少。根據本發(fā)明的一個方面,提供針對動物或植物種類產生遺傳性狀預測器的方 法,其包括產生個體分子估計值;和將所述個體分子估計值與由數量性狀測定推導出的至少一個遺傳值的估計混 合,其中所述遺傳器與通過所述數量性狀測定而測得的性狀相關。在一個方面,通過分析來自動物的不同群體的參比數據集而針對個體DNA標記 或DNA標記組推導參數,描述標記對于具體性狀的效應隨遺傳距離的衰退或變化,從而 產生個體分子估計值。在另一個方面,通過比較來自測試樣本和參比數據集的DNA標記信息,計算測 試樣本和參比驗證數據集之間的遺傳距離,從而產生個體分子估計值。在另一個方面, 在簡單的情況下,雜交繁育的動物的種群類型或種群類型的百分比可以用作遺傳距離的 替代指標。在這種情況下,可以根據分子數據計算動物的種群組成,并且使用對于指定 種群合適的個體分子效應成比例地產生個體分子估計值?;蛘?,可以根據父母的種群組 成鑒定種群組成。在另一個方面,使用方法更準確和簡單地提供來自不同種群和種群混合群體的 動物的相對遺傳價值的估計。在這種情況下,通過將動物遺傳型與種群參比群體比較而 估計動物的種群組成,并且使用種群組成(1)產生動物的合適的基線性能(例如在雜交品 種中,種群針對性狀的權重平均性能)和⑵如上所述計算合適的種群特異性混合參數。通過使用測試樣本和參比樣本之間的遺傳距離,并使用上述計算的參數,推導 針對測試樣本的每個個體標記/標記組的特定參數估計值和變異,產生個體分子估計 值。然后對個體/標記/生狀特異性參數和測試樣本的遺傳型應用混合算法,其可計算 分子性狀估計和變異,可用于估計任何動物的遺傳價值。在一個方面,遺傳價值是飼養(yǎng) 場畜肉脂肪紋路(大理石紋,feedlot marbling)。然而這可以用于對于任何性狀的遺傳 價值的任何估計,其中有分子預測器和收集與性狀相關的表型數據的能力。這包括繁殖 性狀比如,性成熟時的年齡、性成熟時的體重、生育能力、繁殖能力、產犢間隔、人工 受精的產出率、懷孕期時長、生產難度、胚胎或嬰兒存活率、撫育能力;乳汁性狀,比 如體積、蛋白質和脂肪百分比和組成、體細胞數、泌乳曲線線型;生長和屠體組成性狀 比如出生體重、斷乳體重、周歲體重、成年體重、屠宰體重、屠體重、斷乳前和斷乳后每天平均體重增加量、屠體肌肉和脂肪和骨骼比例和屠體中的位置或分布、疾病耐受性 和免疫性狀比如對于內部和外部寄生蟲、細菌、病毒或朊病毒病的響應;代謝性狀比如 對于毒素的耐受性、飼養(yǎng)效率、碳排放量;物理性狀比如畸形、足部結構、種群定義特 性、顏色類型、是否有角;纖維性狀比如纖維量、纖維直徑、纖維曲度、纖維強度、纖 維顏色、纖維本體;行為性狀比如飛行距離、好斗性、溫順性、撫育能力;肉質性狀, 比如柔軟度、質量等級、顏色、顏色穩(wěn)定性、肌肉類型、切開形狀、畜肉脂肪紋路、代 謝物或脂肪質量和容量;生物化學或基因表達性狀比如組織樣本中RNA或特定基因產物 的量。在另一個方面,使用本文提供的公式,將個體分子估計值與由數量性狀測定推 導的遺傳值的估計混合。在另一個方面,由數量性狀測定推導的遺傳值的估計包括估計育種值、原始性 狀數據或種群組成數據(由可視、系譜或DNA標記信息推導)。
圖1是流程圖,闡述根據本發(fā)明用于產生遺傳預測器的步驟。
具體實施例方式如上所述,本發(fā)明涉及使用脫氧核糖核酸(DNA)標記和數量性狀數據產生遺傳 預測器的方法,現在詳細描述所述方法。如本文所使用的,在介紹本發(fā)明或其優(yōu)選實施 方案的元素是,冠詞和“所述”意欲表示有一個或多個元素。定義。提供下述定義以幫助本領域的普通數量或分子遺傳學者或動物育種者更 容易和更完整地了解本發(fā)明。本文提供的定義并不意欲作為唯一的定義,而是作為優(yōu)選 定義給出,意欲輔助技術人員理解本發(fā)明。通過“等位基因”,表示特定基因的特別版 本或變體。通過“動物”,表示所有動物比如牲畜,包括但不限于牛、羊、豬,水生種 類包括但不限于魚、軟體動物和甲殼綱動物,和家畜比如狗、貓和馬。通過“混合指 數”,表示標記分數Xm和針對目標性狀α)的多性狀BLUP估計育種值的組合,通過公 式(Ib)表示。Mb = y ‘ Im+β · Ir其中γ和β是混合修正因子。通過“BLUP”,表示最佳線性無偏預測(best linear unbiased prediction)的首字母縮略詞,并且指由 Henderson(1959-HENDERSON, C.R. ; KEMPTHORNE, O. ; SEARLE, S.R. ; VON KROSIGK, Biometrics
195913192-218)介紹的統(tǒng)計方法,其已經成為動物育種行業(yè)預測個體動物育種值的標 準。BLUP程序和本領域已知的算法的常用輸入參數包括遺傳和表型參數估計、表型、 系譜和固定效應。通過“育種值”,表示作為針對限定性狀或性能特性的母體的動物的 真實值。與本發(fā)明聯(lián)用時也理解為動物凈育種值的量度。通過“性能性狀”,表示一組 性狀,其以數量方式限定飼養(yǎng)牲畜的期望和/或不期望的屬性。這種性狀的實例包括但 不限于平均每天體重增加值、平均每天飼料攝入量、飼養(yǎng)效率、背膘厚度、腰眼肌面 積,和瘦肉百分比。通過“估計育種值”(EBV),表示預測其“育種值”的動物的具體 數值。通過“DNA標記”或“DNA標記組”,表示與各種動物性狀相關的基因標記,比如但不限于畜肉脂肪紋路、肌內脂肪、柔軟度、乳汁量等。標記是能在實驗室測定的、 在染色體上有特殊定位的DNA的序列。本發(fā)明期望的標記包括,但不限于RFLP(限 制性片段長度多態(tài)性)、SSR(簡單序列重復或微衛(wèi)星標記)和SNP (單核苷酸多態(tài)性)。 通過“遺傳距離”,表示與兩個群體之間進化遺傳距離有關的量度,理想地,其應該精 確測量兩個個體之間的減數分裂次數(或兩個群體之間的減數分裂平均值)和它們最近的 共同祖先。通過“遺傳價值”,表示選擇作為繁殖親本而對遺傳后代將來性狀性能水平 改進有貢獻的待研究動物的值。在一個實施方案中,對于指定性狀,動物的遺傳價值越 高,越可能提供該性狀水平改進的后代。通過“固定效應”,表示可對表型引起系統(tǒng)效 應的季節(jié)、空間、地理或環(huán)境影響。通過“群”或“群體”,表示育種動物的任何組, 其具有足夠數量的動物,可有效使用本發(fā)明。這些術語可以用于動物如豬、牛、羊、魚 或任何其它可以通過商業(yè)育種的動物,包括,但不限于鳥或任何其它種類,其無論出于 何種原因,對于作為遺傳改進項目的一部分在選擇育種動物以產生后代之前分析一個或 多個性狀是理想的。動物還可以包括家畜,例如,比如狗、貓和馬。通過“基因座”, 表示染色體上的特定位置(例如基因或DNA標記所在處)。通過“多態(tài)性”,表示對于 特定標記或基因,在DNA序列中存在的變化。通過“數量性狀”,表示由大量基因控制 的性狀,所述基因中每個基因具有小至中等的效應。對于數量性狀的觀察通常遵循正態(tài) 分布。術語“數量性狀基因座(QTL) ”,表示包含多態(tài)性的基因組,所述多態(tài)性對于數 量性狀有影響?!斑x擇指數”指不同經濟性狀的EBV的加權總和。參照圖1,表示闡述了根據本發(fā)明用于產生遺傳預測器的步驟的流程圖。參照步驟10,分析來自動物的不同群體的數據集,為個體DNA標記或DNA標 記組推導出參數,描述標記對于特定性狀的效應隨遺傳距離的衰退或變化。參照步驟20,通過比較來自測試樣本和參比數據集的DNA標記信息,計算測試 樣本和參比驗證數據集之間的遺傳距離??蛇x地,可以使用種群類型組成作為遺傳距離 的替代指標。參照步驟30,使用測試樣本和參比樣本之間的遺傳距離[步驟20]和步驟10中 計算的參數,計算每個個體DNA標記或標記組的特定參數估計值和變異。參照步驟40,通過應用個體/標記/性狀特異性參數和測試樣本的遺傳型,計算 分子估計值。參照步驟50,至少一個遺傳值的估計由數量性狀測定推導而來。數量性狀測定 的非限定性實例包括估計育種值51、原始性狀數據52和種群組成數據53。數量性狀測 定可以是估計育種值51、原始性狀數據52和種群組成數據53中的至少一個。數量性狀 測定可以是估計育種值51、原始性狀數據52和種群組成數據53中至少兩個的組合。數 量性狀測定可以是估計育種值51、原始性狀數據52和種群組成數據53。數量性狀測定 包括通過現場觀察產生的原始性狀數據,繁殖狀態(tài)或動物行為,顏色和一致性;不同時 間生物體或生物體部位的重量或長度;身體組成測定比如通過用聲波(超聲)掃描或電磁 輻射(χ-射線、近紅外)或直接測定確定的瘦肉、脂肪分布;取自組織樣本的免疫或代謝 或基因表達狀態(tài)的分析;肉質測定,其通過機械測定,比如剪切力,化學測定比如脂肪 組成,或者通過消費者口感調查。實施例
A.選擇指數理論i.概述根據本發(fā)明,針對影響利潤的單性狀(后文稱作目標性狀),用于比較一組選擇 候選體的性能的標準選擇指數定義為
權利要求
1.產生遺傳性狀預測器的方法,其包括產生個體分子估計值;并將所述個體分子估計值與來自數量性狀測定的至少一個遺傳值的估計混合,其中所 述遺傳性狀預測器與通過所述數量性狀測定得到的性狀相關聯(lián)。
2.權利要求1的方法,其中所述數量性狀測定包括估計育種值。
3.權利要求1的方法,其中所述數量性狀測定包括通過實地觀察繁殖狀態(tài)或動物行 為、顏色和一致性而產生的原始性狀數據;不同時刻生物體或生物體部位的重量或長 度;通過聲波(超聲)掃描或電磁輻射或直接測量而確定的機體組成測量值,比如瘦肉、 脂肪分布;取自組織樣本的免疫或代謝或基因表達狀態(tài)的分析;采用機械比如剪切力, 化學比如脂肪組成,或者通過消費者口味調查而得到的肉質測量值。
4.權利要求1的方法,其中所述數量性狀測定包括種群組成數據。
5.權利要求1的方法,其中所述數量性狀測定包括至少兩個估計育種值、原始性狀數 據和種群組成數據的組合。
6.權利要求1的方法,其中所述個體分子估計值通過分析來自動物或植物群體的參比 數據集而產生。
7.權利要求6的方法,其中所述分析產生針對個體脫氧核糖核酸(DNA)標記或DNA 標記組而推導出的參數,其描述標記對于具體性狀的效應隨遺傳距離的衰退或變化。
8.權利要求7的方法,其中所述個體分子估計值通過確定種群類型而產生。
9.權利要求7的方法,其中所述個體分子估計值通過確定測試樣本和所述參比數據集 之間的遺傳距離而產生。
10.權利要求9的方法,其進一步包括針對所述測試樣本的每個所述個體DNA標記和 所述DNA標記組推導出特定參數估計值和特定參數變化。
11.權利要求10的方法,其中所述特定參數估計值的所述變異使用所述測試樣本和所 述參比數據集之間的遺傳距離。
12.權利要求10的方法,其中所述特定參數估計值的推導使用針對所述個體DNA標 記或所述DNA標記組的參數。
13.權利要求10的方法,其中所述特定參數估計值的推導使用所述測試樣本和所述參 比數據集之間的遺傳距離,和針對所述個體DNA標記或所述DNA標記組的參數。
14.權利要求13的方法,其進一步包括確定至少一個所述遺傳值的估計,其中至少一 個所述遺傳值的估計包括分子性狀估計和分子性狀變異中的至少一個。
15.權利要求14的方法,其中通過使用所述個體DNA標記、所述特定參數估計值和 所述測試樣本的遺傳型中的至少一個確定所述分子性狀估計。
16.權利要求14的方法,其中通過使用所述個體DNA標記、所述特定參數估計值和 所述測試樣本的遺傳型中的至少一個確定所述分子性狀變異。
17.權利要求14的方法,其中通過使用所述個體DNA標記、所述特定參數估計值和 所述測試樣本的遺傳型確定所述分子性狀估計。
18.權利要求14的方法,其中所述數量性狀測定包括估計育種值、原始性狀數據和種 群組成數據中的至少一個。
19.權利要求18的方法,其中所述數量性狀測定包括所述估計育種值、所述原始性狀數據和所述種群組成數據中至少兩個的組合。
20.權利要求19的方法,其中所述數量性狀測定包括所述估計育種值、所述原始性狀 數據和所述種群組成數據。
21.權利要求19的方法,其中所述種群組成數據源自可視信息、系譜信息,或DNA 標記信息。
22.產生遺傳性狀預測器的方法,其包括產生個體分子估計值;和將所述個體分子估計值和由數量性狀測定推導出的至少一個遺傳值的估計混合,其 中所述個體分子估計值通過分析來自動物或植物群體的參比數據集而產生,并且其中所 述分析產生針對個體脫氧核糖核酸(DNA)標記或DNA標記組推導出的參數,描述標記 對具體性狀的效應隨遺傳距離的衰退和變化,其中所述個體分子估計值通過確定種群類 型而產生,并且其中所述個體分子估計值通過測試樣本和所述參比數據集之間的遺傳距 離相關性而產生。
23.產生遺傳性狀預測器的方法,其包括產生個體分子估計值;和將所述個體分子估計值和由數量性狀測定推導出的至少一個遺傳值的估計混合,其 中所述個體分子估計值通過分析來自動物或植物群體的參比數據集而產生,并且其中所 述分析產生針對個體脫氧核糖核酸(DNA)標記或DNA標記組推導出的參數,描述標記 對具體性狀的效應隨遺傳距離的衰退和變化,其中所述個體分子估計值通過確定種群類 型而產生,并且其中所述個體分子估計值通過測試樣本和所述參比數據集之間的種群類 型相關性而產生。
全文摘要
本發(fā)明涉及通過將個體分子估計值與來自數量性狀測定的至少一個屬值的估計混合而產生遺傳性狀預測器。所述個體分子估計值可以包括分子性狀估計或分子性狀變異。所述個體分子估計值可以通過應用個體脫氧核糖核酸(DNA)標記物、DNA標記組、其具體的參數估計和特定參數變化,和測試樣本的遺傳型而確定。數量性狀測定可以包括估計的育種數據、原始性狀數據和種群組成數據。所述遺傳預測器在各種條件下精確而穩(wěn)定,并且參數估計中的誤差相對減少。
文檔編號G06F19/18GK102016858SQ200980116660
公開日2011年4月13日 申請日期2009年5月6日 優(yōu)先權日2008年5月9日
發(fā)明者彼得·R·阿默, 邁克爾·L·泰特 申請人:美國輝瑞有限公司