本發(fā)明涉及計(jì)算機(jī)應(yīng)用,特別是涉及一種深度學(xué)習(xí)模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的分支,是試圖使用包含復(fù)雜結(jié)構(gòu)或由多重非線性變換構(gòu)成的多處理層計(jì)算模型對(duì)數(shù)據(jù)進(jìn)行高層抽象的一類算法。
2、在深度學(xué)習(xí)中,為了快速將其應(yīng)用落地到各個(gè)具體的行業(yè)中,不斷提升模型精度是一個(gè)挑戰(zhàn)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明實(shí)施例的目的在于提供一種深度學(xué)習(xí)模型訓(xùn)練方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以提高深度學(xué)習(xí)模型的精度。具體技術(shù)方案如下:
2、第一方面,提供了一種深度學(xué)習(xí)模型訓(xùn)練方法,包括:
3、獲取更新頻率系數(shù),所述更新頻率系數(shù)用于表示更新負(fù)樣本數(shù)據(jù)的更新間隔;
4、按照所述更新間隔,從負(fù)樣本數(shù)據(jù)集中選取負(fù)樣本數(shù)據(jù),其中,所述負(fù)樣本數(shù)據(jù)集包括基于預(yù)設(shè)深度學(xué)習(xí)模型從至少一個(gè)數(shù)據(jù)集中篩選出的第一處理對(duì)象與數(shù)據(jù)中實(shí)際包含的對(duì)象不一致、且數(shù)據(jù)中實(shí)際包含的對(duì)象中不包括目標(biāo)對(duì)象的數(shù)據(jù),所述第一處理對(duì)象是所述預(yù)設(shè)深度學(xué)習(xí)模型對(duì)所述數(shù)據(jù)進(jìn)行處理而得到的;
5、將選取的負(fù)樣本數(shù)據(jù)作為樣本數(shù)據(jù),添加到訓(xùn)練數(shù)據(jù)集中,基于所述訓(xùn)練數(shù)據(jù)集對(duì)所述預(yù)設(shè)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練。
6、可選地,構(gòu)建所述負(fù)樣本數(shù)據(jù)集,包括:
7、收集至少一個(gè)數(shù)據(jù)集;
8、通過預(yù)設(shè)深度學(xué)習(xí)模型對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行處理,得到所述數(shù)據(jù)對(duì)應(yīng)的第一處理對(duì)象;
9、在所述第一處理對(duì)象與所述數(shù)據(jù)中實(shí)際包含的對(duì)象不一致的情況下,將所述數(shù)據(jù)作為候選數(shù)據(jù),并在所述候選數(shù)據(jù)中實(shí)際包含的對(duì)象中包括目標(biāo)對(duì)象的情況下,從數(shù)據(jù)集中剔除所述候選數(shù)據(jù),得到負(fù)樣本數(shù)據(jù)集。
10、可選地,所述方法還包括:
11、通過預(yù)設(shè)深度學(xué)習(xí)模型對(duì)數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行處理,還得到所述第一處理對(duì)象對(duì)應(yīng)的置信度;
12、所述在所述第一處理對(duì)象與所述數(shù)據(jù)中實(shí)際包含的對(duì)象不一致的情況下,將所述數(shù)據(jù)作為候選數(shù)據(jù),包括:
13、若所述第一處理對(duì)象與所述數(shù)據(jù)中實(shí)際包含的對(duì)象不一致,且所述第一處理對(duì)象對(duì)應(yīng)的置信度超過第一置信度閾值,則將所述數(shù)據(jù)作為候選數(shù)據(jù)。
14、可選地,所述按照所述更新間隔,從負(fù)樣本數(shù)據(jù)集中選取負(fù)樣本數(shù)據(jù),包括:
15、每隔所述更新間隔,從負(fù)樣本數(shù)據(jù)集中選取預(yù)設(shè)數(shù)量的負(fù)樣本數(shù)據(jù),所述預(yù)設(shè)數(shù)量基于負(fù)樣本數(shù)量系數(shù)與正樣本數(shù)據(jù)的數(shù)量確定。
16、可選地,所述從負(fù)樣本數(shù)據(jù)集中選取負(fù)樣本數(shù)據(jù),包括:
17、從負(fù)樣本數(shù)據(jù)集中隨機(jī)選取預(yù)設(shè)數(shù)量的負(fù)樣本數(shù)據(jù);
18、和/或,
19、從負(fù)樣本數(shù)據(jù)集中選取第二處理對(duì)象與數(shù)據(jù)中實(shí)際包含的對(duì)象不一致,且所述第二處理對(duì)象對(duì)應(yīng)的置信度超過第二置信度閾值的負(fù)樣本數(shù)據(jù)。
20、可選地,所述從負(fù)樣本數(shù)據(jù)集中選取第二處理對(duì)象與數(shù)據(jù)中實(shí)際包含的對(duì)象不一致,且所述第二處理對(duì)象對(duì)應(yīng)的置信度超過第二置信度閾值的負(fù)樣本數(shù)據(jù),包括:
21、通過訓(xùn)練后的預(yù)設(shè)深度學(xué)習(xí)模型對(duì)負(fù)樣本數(shù)據(jù)集中的負(fù)樣本數(shù)據(jù)進(jìn)行處理,得到所述負(fù)樣本數(shù)據(jù)對(duì)應(yīng)的第二處理對(duì)象以及所述第二處理對(duì)象對(duì)應(yīng)的置信度,其中,訓(xùn)練后的預(yù)設(shè)深度學(xué)習(xí)模型包括將從負(fù)樣本數(shù)據(jù)集中隨機(jī)選取的預(yù)設(shè)數(shù)量的負(fù)樣本數(shù)據(jù)與正樣本數(shù)據(jù)作為樣本數(shù)據(jù),對(duì)所述預(yù)設(shè)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練得到的模型;
22、若所述第二處理對(duì)象與所述負(fù)樣本數(shù)據(jù)中實(shí)際包含的對(duì)象不一致,且所述第二處理對(duì)象對(duì)應(yīng)的置信度超過第二置信度閾值,則將所述負(fù)樣本數(shù)據(jù)作為選取出的負(fù)樣本數(shù)據(jù)。
23、可選地,若選取出的負(fù)樣本數(shù)據(jù)的數(shù)量未達(dá)到所述預(yù)設(shè)數(shù)量,則按照所述第二處理對(duì)象對(duì)應(yīng)的置信度從大到小的順序,依次將所述第二處理對(duì)象與所述負(fù)樣本數(shù)據(jù)中實(shí)際包含的對(duì)象不一致,且所述第二處理對(duì)象對(duì)應(yīng)的置信度超過第二置信度閾值的負(fù)樣本數(shù)據(jù)作為選取出的負(fù)樣本數(shù)據(jù),直至選取出的負(fù)樣本數(shù)據(jù)的數(shù)量達(dá)到所述預(yù)設(shè)數(shù)量。
24、可選地,所述預(yù)設(shè)深度學(xué)習(xí)模型包括以下模型中的至少一種:圖像檢測(cè)模型、圖像識(shí)別模型、圖像分類模型,所述至少一個(gè)數(shù)據(jù)集包括圖像數(shù)據(jù)集,所述至少一個(gè)數(shù)據(jù)集包括的數(shù)據(jù)為圖像。
25、第二方面,提供了一種深度學(xué)習(xí)模型訓(xùn)練裝置,包括:
26、獲取模塊,用于獲取更新頻率系數(shù),所述更新頻率系數(shù)用于表示更新負(fù)樣本數(shù)據(jù)的更新間隔;
27、選取模塊,用于按照所述更新間隔,從負(fù)樣本數(shù)據(jù)集中選取負(fù)樣本數(shù)據(jù),其中,所述負(fù)樣本數(shù)據(jù)集包括基于預(yù)設(shè)深度學(xué)習(xí)模型從至少一個(gè)數(shù)據(jù)集中篩選出的第一處理對(duì)象與數(shù)據(jù)中實(shí)際包含的對(duì)象不一致、且數(shù)據(jù)中實(shí)際包含的對(duì)象中不包括目標(biāo)對(duì)象的數(shù)據(jù),所述第一處理對(duì)象是所述預(yù)設(shè)深度學(xué)習(xí)模型對(duì)所述數(shù)據(jù)進(jìn)行處理而得到的;
28、訓(xùn)練模塊,用于將選取的負(fù)樣本數(shù)據(jù)作為樣本數(shù)據(jù),添加到訓(xùn)練數(shù)據(jù)集中,基于所述訓(xùn)練數(shù)據(jù)集對(duì)所述預(yù)設(shè)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練。
29、第三方面,提供了一種電子設(shè)備,包括處理器、通信接口、存儲(chǔ)器和通信總線,其中,處理器,通信接口,存儲(chǔ)器通過通信總線完成相互間的通信;
30、存儲(chǔ)器,用于存放計(jì)算機(jī)程序;
31、處理器,用于執(zhí)行存儲(chǔ)器上所存放的程序時(shí),實(shí)現(xiàn)第一方面任一所述的方法步驟。
32、本發(fā)明實(shí)施例還一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面任一所述的方法步驟。
33、本發(fā)明實(shí)施例還提供了一種包含指令的計(jì)算機(jī)程序產(chǎn)品,當(dāng)其在計(jì)算機(jī)上運(yùn)行時(shí),使得計(jì)算機(jī)執(zhí)行上述任一所述的深度學(xué)習(xí)模型訓(xùn)練方法。
34、本發(fā)明實(shí)施例有益效果:
35、本發(fā)明實(shí)施例提供的深度學(xué)習(xí)模型訓(xùn)練方法,可以按照更新頻率系數(shù)所表示的更新負(fù)樣本數(shù)據(jù)的更新間隔,從負(fù)樣本數(shù)據(jù)集中選取負(fù)樣本數(shù)據(jù),并將選取的負(fù)樣本數(shù)據(jù)作為樣本數(shù)據(jù),添加到訓(xùn)練數(shù)據(jù)集中,基于所述訓(xùn)練數(shù)據(jù)集對(duì)所述預(yù)設(shè)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,也即,動(dòng)態(tài)地選取負(fù)樣本數(shù)據(jù)進(jìn)行模型訓(xùn)練,且,負(fù)樣本數(shù)據(jù)集包括基于預(yù)設(shè)深度學(xué)習(xí)模型從至少一個(gè)數(shù)據(jù)集中篩選出的第一處理對(duì)象與數(shù)據(jù)中實(shí)際包含的對(duì)象不一致、且數(shù)據(jù)中實(shí)際包含的對(duì)象中不包括目標(biāo)對(duì)象的數(shù)據(jù)。在對(duì)深度學(xué)習(xí)模型的訓(xùn)練過程中考慮基于預(yù)設(shè)深度學(xué)習(xí)模型從至少一個(gè)數(shù)據(jù)集中篩選出的第一處理對(duì)象與數(shù)據(jù)中實(shí)際包含的對(duì)象不一致、且數(shù)據(jù)中實(shí)際包含的對(duì)象中不包括目標(biāo)對(duì)象的數(shù)據(jù),也即,在對(duì)深度學(xué)習(xí)模型的訓(xùn)練過程中針對(duì)容易出錯(cuò)的負(fù)樣本數(shù)據(jù)進(jìn)行訓(xùn)練,如此,能夠提高深度學(xué)習(xí)模型的精度。
36、當(dāng)然,實(shí)施本發(fā)明的任一產(chǎn)品或方法并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。
1.一種深度學(xué)習(xí)模型訓(xùn)練方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,構(gòu)建所述負(fù)樣本數(shù)據(jù)集,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述按照所述更新間隔,從負(fù)樣本數(shù)據(jù)集中選取負(fù)樣本數(shù)據(jù),包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述從負(fù)樣本數(shù)據(jù)集中選取負(fù)樣本數(shù)據(jù),包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述從負(fù)樣本數(shù)據(jù)集中選取第二處理對(duì)象與數(shù)據(jù)中實(shí)際包含的對(duì)象不一致,且所述第二處理對(duì)象對(duì)應(yīng)的置信度超過第二置信度閾值的負(fù)樣本數(shù)據(jù),包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,若選取出的負(fù)樣本數(shù)據(jù)的數(shù)量未達(dá)到所述預(yù)設(shè)數(shù)量,則按照所述第二處理對(duì)象對(duì)應(yīng)的置信度從大到小的順序,依次將所述第二處理對(duì)象與所述負(fù)樣本數(shù)據(jù)中實(shí)際包含的對(duì)象不一致,且所述第二處理對(duì)象對(duì)應(yīng)的置信度超過第二置信度閾值的負(fù)樣本數(shù)據(jù)作為選取出的負(fù)樣本數(shù)據(jù),直至選取出的負(fù)樣本數(shù)據(jù)的數(shù)量達(dá)到所述預(yù)設(shè)數(shù)量。
8.根據(jù)權(quán)利要求1至7任一項(xiàng)所述的方法,其特征在于,所述預(yù)設(shè)深度學(xué)習(xí)模型包括以下模型中的至少一種:圖像檢測(cè)模型、圖像識(shí)別模型、圖像分類模型,所述至少一個(gè)數(shù)據(jù)集包括圖像數(shù)據(jù)集,所述至少一個(gè)數(shù)據(jù)集包括的數(shù)據(jù)為圖像。
9.一種深度學(xué)習(xí)模型訓(xùn)練裝置,其特征在于,包括:
10.一種電子設(shè)備,其特征在于,包括處理器、通信接口、存儲(chǔ)器和通信總線,其中,處理器,通信接口,存儲(chǔ)器通過通信總線完成相互間的通信;
11.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)內(nèi)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-8任一所述的方法步驟。