欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于決策樹的作物育種評價方法

文檔序號:9235883閱讀:330來源:國知局
基于決策樹的作物育種評價方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及作物育種技術(shù)領(lǐng)域,尤其設(shè)及一種基于決策樹的作物育種評價方法。
【背景技術(shù)】
[0002] 作物育種技術(shù)通過改良作物的遺傳特性,選擇培育高產(chǎn)優(yōu)質(zhì)品種,是種業(yè)創(chuàng)新和 發(fā)展的根本動力,對促進(jìn)我國農(nóng)業(yè)長期穩(wěn)定發(fā)展、保障國家糧食安全具有十分重要的意義。 作物育種評價從培育品種中評價、選擇滿足育種目標(biāo)的優(yōu)良品種,是作物育種技術(shù)的重要 環(huán)節(jié),是對育種效果的有效保證。
[0003] 隨著我國糧食生產(chǎn)形勢的變化,作物育種評價從W產(chǎn)量為主的方式向綜合考慮產(chǎn) 量、品質(zhì)、抗逆性等因素轉(zhuǎn)變。與此同時,關(guān)聯(lián)分析、主成分分析、層次分析法、模糊綜合評 價、灰色關(guān)聯(lián)評價等多種信息技術(shù)皆在作物育種中發(fā)揮了重要的作用。該些技術(shù)通過對作 物性狀數(shù)據(jù)的分析利用有效提升了作物育種評價技術(shù)的數(shù)據(jù)化、信息化程度,推動作物育 種評價從經(jīng)驗化育種向數(shù)據(jù)化、信息化育種轉(zhuǎn)變。然而,育種過程中的評價結(jié)果信息作為重 要的專家經(jīng)驗,卻仍未用在作物育種評價的過程中。本發(fā)明使用決策樹對育種評價結(jié)果信 息與作物性狀信息構(gòu)建模型,提出一種基于決策樹的作物育種評價方法。
[0004] 鑒于此,如何利用育種過程中的評價結(jié)果信息,W實現(xiàn)后續(xù)的作物育種的評價成 為當(dāng)前需要解決的技術(shù)問題。

【發(fā)明內(nèi)容】

[0005]針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種基于決策樹的作物育種評價方法,將作 物育種過程中的評價數(shù)據(jù)引入育種評價模型的訓(xùn)練中,作為構(gòu)建育種評價決策樹的指導(dǎo)數(shù) 據(jù),可W有效地利用已有育種經(jīng)驗數(shù)據(jù)指導(dǎo)后續(xù)育種工作,輔助育種家實現(xiàn)后續(xù)的作物育 種的評價工作。
[0006] 第一方面,本發(fā)明提供一種基于決策樹的作物育種評價方法,包括:
[0007]W育種目標(biāo)為篩選條件,構(gòu)建作物育種評價數(shù)據(jù)集,所述數(shù)據(jù)集共享相同的育種 目標(biāo),其中,所述數(shù)據(jù)集中的每個數(shù)據(jù)均W四元數(shù)據(jù)類型{實驗材料編號,性狀特征集合T, 所屬實驗e,實驗結(jié)果r}來表示;
[0008] 對所述數(shù)據(jù)集中的性狀特征集合T進(jìn)行預(yù)處理,得到預(yù)處理后的數(shù)據(jù)集;
[0009] 根據(jù)所述預(yù)處理后的數(shù)據(jù)集,使用決策樹構(gòu)建性狀特征與實驗結(jié)果間的模型,得 到針對育種目標(biāo)的基于決策樹的作物育種評價模型;
[0010] 根據(jù)所述作物育種評價模型對具有相同育種目標(biāo)的待評價作物性狀數(shù)據(jù)進(jìn)行分 析,并獲得評價結(jié)果。
[0011] 可選地,所述對所述數(shù)據(jù)集中的性狀特征集合T進(jìn)行預(yù)處理,得到預(yù)處理后的數(shù) 據(jù)集,包括:
[0012] 對所述數(shù)據(jù)集中的性狀特征集合T中的每種性狀進(jìn)行規(guī)范化處理;
[0013] 對經(jīng)過規(guī)范化處理之后的性狀特征集合T進(jìn)行去噪處理;
[0014] 對經(jīng)過去噪處理之后的性狀特征集合T進(jìn)行歸一化處理,得到預(yù)處理后的數(shù)據(jù) 集。
[0015] 可選地,所述規(guī)范化處理包括;統(tǒng)一量化方式,和/或統(tǒng)一計量單位,和/或統(tǒng)一表 現(xiàn)形式。
[0016] 可選地,所述對經(jīng)過規(guī)范化處理之后的性狀特征集合T進(jìn)行去噪處理,包括:
[0017] 判斷經(jīng)過規(guī)范化處理之后的性狀特征集合T中的性狀特征所對應(yīng)的數(shù)據(jù)是否在 該性狀特征的預(yù)設(shè)性狀參考值范圍內(nèi),若否,則將不在該性狀特征的預(yù)設(shè)性狀參考值范圍 內(nèi)的經(jīng)過規(guī)范化處理之后的性狀特征集合T中的性狀特征所對應(yīng)的數(shù)據(jù)從所述數(shù)據(jù)集中 剔除;
[0018] 將經(jīng)過規(guī)范化處理之后的性狀特征集合T中的離群性狀特征對應(yīng)的數(shù)據(jù)從所述 數(shù)據(jù)集中剔除;
[0019] 其中,所述離群性狀特征為滿足第一公式的性狀特征,所述第一公式
[0020]
[0021] 其中,與.為Tj.的平均值,0為性狀特征Tj.的標(biāo)準(zhǔn)差,K為預(yù)設(shè)參數(shù),Tj.為離群性 狀特征,j為不大于性狀特征集合T中元素個數(shù)的任一正整數(shù)。
[0022] 可選地,所述對經(jīng)過去噪處理之后的性狀特征集合T進(jìn)行歸一化處理,具體包括:
[0023] 根據(jù)第二公式,對經(jīng)過去噪處理之后的性狀特征集合T進(jìn)行歸一化處理;
[0024] 其中,所述第二公式為:
[00 巧]
[0026] Ti為性狀特征集合T中第i個性狀特征,i為不大于性狀特征集合T中元素個數(shù)的 任一正整數(shù),T'i為Ti經(jīng)歸一化處理后的結(jié)果,min(Ti)為性狀特征Ti中的最小值,max(Ti) 為性狀特征Ti中的最大值。
[0027] 可選地,所述根據(jù)所述預(yù)處理后的數(shù)據(jù)集,使用決策樹構(gòu)建性狀特征與實驗結(jié)果 間的模型,得到針對育種目標(biāo)的基于決策樹的作物育種評價模型,包括:
[0028] S1、將預(yù)處理后的數(shù)據(jù)集記為D。,D。中的特征集合記為T。,根據(jù)D。與T。生成根節(jié) 點root,并令所述根節(jié)點root作為當(dāng)前節(jié)點;
[0029] S2、根據(jù)第S公式,計算得到D。的基巧Gini指標(biāo);
[0030] S3、判斷D。是否小于預(yù)設(shè)闊值G或T。中性狀的個數(shù)是否為0,若D。小于預(yù)設(shè)闊值且 T。中性狀的個數(shù)為0,則將當(dāng)前節(jié)點標(biāo)記為葉子節(jié)點,取Pi中的最大值對應(yīng)的實驗結(jié)果為 該節(jié)點的實驗結(jié)果;若D。大于等于預(yù)設(shè)闊值且T。中性狀的個數(shù)不為0,則執(zhí)行步驟S4-S7 ;
[0031] S4、計算T。中各性狀特征與實驗結(jié)果的排序相關(guān)性;
[0032] S5、取T。中與實驗結(jié)果排序相關(guān)性最大的性狀特征作為當(dāng)前節(jié)點的劃分性狀
[0033] S6、根據(jù)劃分性狀L計算劃分闊值V,,并根據(jù)Vj尋D。劃分為兩個集合D1、化;
[0034] S7、從T。中移除T,,分別令Di、〇2作為D。,重復(fù)S2至S7建立其對應(yīng)的決策樹模型, 并將結(jié)果分別作為當(dāng)前節(jié)點的左、右子樹;
[00巧]其中,所述第S公式為:
[0036]
[0037] 其中,a為所述實驗結(jié)果r中不同取值的個數(shù),Pi為D。中數(shù)據(jù)對應(yīng)實驗結(jié)果的 概率。
[0038]可選地,所述步驟S4,具體包括:
[0039]S41、根據(jù)所屬實驗e將D。劃分為k個子集,每個子集中的數(shù)據(jù)是同一次實驗的數(shù) 據(jù),記為Sm,lk;
[0040]S42、從T。中選擇性狀特征t。,并根據(jù)所述性狀特征t。,將Sm中的數(shù)據(jù)的大小進(jìn)行 排序,將升序排序結(jié)果記為瑞,將降序排序結(jié)果記為乂i;
[0041]S43、根據(jù)實驗結(jié)果r,分別對所述瑞和義中的t。取值相同的數(shù)據(jù)進(jìn)行降序微 調(diào);
[0042]S44、根據(jù)所述*5,^和義;和第四公式,分別計算所述Sm中數(shù)據(jù)的性狀特征t。與實驗 結(jié)果r的相關(guān)性;
[0043]S45、根據(jù)第走公式,獲取D。中性狀特征tn的相關(guān)性《 (n);
[0044]S46、重復(fù)步驟S42至S45,直至獲取所述T。中所有性狀特征的相關(guān)性;
[0045] 其中,所述第四公式為:
[0046]
[0047] 其中,DCG(n,m)是通過第五公式計算得到的,IDCG(n,m)是通過第六公式計算得 到的,所述第五公式為:
[0051] 其中,q為所述Sm中實驗材料的編號,r(P)為所述巧或&中第P位置的實驗材料 對應(yīng)的實驗結(jié)果,r*(p)為是所述Sm中實驗材料根據(jù)實驗結(jié)果降序排序時第P位置對應(yīng)的 實驗結(jié)果,《 (n,m)依其使用所述巧或Si中的排序結(jié)果分別記為《°(n,m)或《i(n,m);
[0052] 所述第走公式為:
[0053] ? (n) =max{ ?° (n), ? 1 (n)},
[0054] 其中,《°(n)是通過第八公式計算得到的,《i(n)是通過第九公式計算得到的,所 述第八公式為:
[00 巧]
[0056] 所述第九公式為:
[0057]
[00則其中,|Sm|是Sm中實驗材料的個數(shù)。
[0059] 可選地,所述步驟S6,具體包括:
[0060] 根據(jù)所屬實驗e將D。劃分為k個子集,每個子集中的數(shù)據(jù)是同一次實驗的數(shù)據(jù), 記為S。,1《m《k;
[006。 根據(jù)所述劃分性狀T曲大小,將所述Sm中的數(shù)據(jù)進(jìn)行升序排序;
[0062] 根據(jù)篩選條件,對排序后的Sm中的數(shù)據(jù)進(jìn)行篩選;
[0063] 根據(jù)滿足所述篩選條件的Sm(n),通過第十公式計算候選劃分闊值Vm(X);
[0064] 針對所有候選劃分闊值Vm(X),通過第十一公式計算使用所有候選劃分闊值Vm(X) 進(jìn)對所述Sm進(jìn)行劃分后的Gini指標(biāo)Gini,(Vm(x));
[0065] 對所述Sm,獲取使Gini,(Vm(X))取最小值的Vm(X),根據(jù)使Gini,(Vm(X))取最小值 的Vm(X),通過第十二公式計算V, (m);
[0066] 根據(jù)所述V, (m),通過第十S公式計算劃分闊值V,:
[0067] 判斷D。中的數(shù)據(jù)是否滿足第一條件,將D。中滿足所述第一條件的數(shù)據(jù)劃入子集 〇1,將D。中不滿足所述第一條件的數(shù)據(jù)劃入子集D2;
[0068] 其中,所述篩選條件為:
[0069] Sm(n)聲Sm(n+1)
[0070] 其中,Sm(n)為Sm中第n個數(shù)據(jù)的劃分性狀TS的取值;
[0071] 所述第十公式為:
[007引其中,Smi、Sm2為使用Vm(X)對Sm進(jìn)行劃分后的數(shù)據(jù)集合;
[00
當(dāng)前第1頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
平远县| 微博| 鲁山县| 正蓝旗| 长岭县| 屏边| 乌审旗| 青阳县| 延安市| 大兴区| 新疆| 崇州市| 洛扎县| 罗平县| 乳山市| 沁水县| 盐边县| 兰州市| 朝阳市| 新巴尔虎左旗| 凤山县| 介休市| 交城县| 灵寿县| 安岳县| 搜索| 桃源县| 武隆县| 霍邱县| 安泽县| 湖北省| 方山县| 扬州市| 温泉县| 长乐市| 太仆寺旗| 桓台县| 西丰县| 新龙县| 固安县| 卓尼县|