本申請涉及計算機視覺,尤其涉及一種目標識別模型優(yōu)化方法、設備及計算機可讀存儲介質。
背景技術:
1、基于深度學習的目標檢測模型由于其高效的性能,被越來越廣泛地應用到生活中的各方各面。交通目標識別場景是目標檢測在道路交通中的應用場景,例如,自動駕駛中目標檢測能夠為車輛采集實時的環(huán)境信息,以確保安全和提供正確的規(guī)劃決策。目前,基于深度學習的目標檢測模型在交通目標識別場景中已經(jīng)有應用,但是,目前缺乏針對低算力的設備專門設計的目標識別模型網(wǎng)絡結構,從而導致低算力的設備在進行目標識別時識別效率不高,進而影響交通目標識別的應用效果,例如影響車輛及時作出自動駕駛規(guī)劃決策。
技術實現(xiàn)思路
1、本申請的主要目的在于提供一種目標識別模型優(yōu)化方法、設備及計算機可讀存儲介質,旨在提供一種針對自動駕駛領域的目標識別模型的優(yōu)化方法,以保證交通目標識別場景中低算力的設備目標識別的準確度的同時,提高低算力的設備目標識別的識別效率。
2、為實現(xiàn)上述目的,本申請?zhí)峁┮环N目標識別模型優(yōu)化方法,所述目標識別模型優(yōu)化方法包括以下步驟:
3、獲取第一訓練樣本集,其中,所述第一訓練樣本集包括在交通目標識別場景下采集的多張樣本圖像和所述多張樣本圖像分別對應的第一標簽信息,所述第一標簽信息反映對應的所述樣本圖像中是否存在任意目標物以及反映對應的所述樣本圖像中是否存在各種預設類型的目標物;
4、采用所述第一訓練樣本集對目標識別模型進行訓練以優(yōu)化所述目標識別模型,其中,所述目標識別模型包括特征提取骨干網(wǎng)絡和檢測頭,所述特征提取骨干網(wǎng)絡包括依次連接的第一卷積層、殘差層和第二卷積層,所述第一卷積層用于接收第一預設尺寸的圖像,所述第二卷積層用于輸出第二預設尺寸的特征圖到所述檢測頭,所述檢測頭用于根據(jù)所述第二預設尺寸的特征圖進行分類回歸得到所述第一預設尺寸的圖像的目標識別結果,所述目標識別結果反映所述第一預設尺寸的圖像中是否存在任意目標物,以及反映所述第一預設尺寸的圖像中是否存在所述各種預設類型的目標物。
5、為實現(xiàn)上述目的,本申請還提供一種目標識別模型優(yōu)化設備,所述目標識別模型優(yōu)化設備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的目標識別模型優(yōu)化程序,所述目標識別模型優(yōu)化程序被所述處理器執(zhí)行時實現(xiàn)如上所述的目標識別模型優(yōu)化方法的步驟。
6、為實現(xiàn)上述目的,本申請還提出一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有目標識別模型優(yōu)化程序,所述目標識別模型優(yōu)化程序被處理器執(zhí)行時實現(xiàn)如上所述的目標識別模型優(yōu)化方法的步驟。
7、本申請實施例中,針對交通場景中所需識別的目標主要為車輛,且車輛的尺寸相對固定的特點,針對性地提出了一種目標識別模型的網(wǎng)絡結構,包括特征提取骨干網(wǎng)絡和檢測頭,特征提取骨干網(wǎng)絡包括依次連接的第一卷積層、殘差層和第二卷積層,第一卷積層用于接收第一預設尺寸的圖像,第二卷積層用于輸出第二預設尺寸的特征圖到檢測頭,檢測頭用于根據(jù)特征圖進行分類回歸得到輸入的圖像的目標識別結果。相比于提取多種尺寸特征圖的復雜網(wǎng)絡,本申請實施例中提出的該網(wǎng)絡結構提取一種尺寸的特征圖,針對交通場景中所需識別的尺寸相對固定的目標,從而保證了目標識別的準確度,并且也減小了網(wǎng)絡模型的規(guī)模,從而提高低算力的設備進行目標識別的效率。又針對交通場景中低算力的設備只需要識別出是否包含目標的結果的特點,針對性地設置該網(wǎng)絡結構輸出的目標識別結果為反映輸入的圖像中是否存在任一目標物以及反映輸入的圖像中是否存在各種預設類型的目標物,使得輸出結果能夠滿足低算力的設備在交通場景中的目標識別需求,又能夠降低網(wǎng)絡模型的復雜度,從而提高低算力的設備進行目標識別的效率。
1.一種目標識別模型優(yōu)化方法,其特征在于,所述目標識別模型優(yōu)化方法包括:
2.如權利要求1所述的目標識別模型優(yōu)化方法,其特征在于,選取yolov3的骨干網(wǎng)絡中用于提取最大尺寸特征圖的枝干網(wǎng)絡,將所述枝干網(wǎng)絡剔除拼接層后剩余的網(wǎng)絡作為所述特征提取骨干網(wǎng)絡。
3.如權利要求1所述的目標識別模型優(yōu)化方法,其特征在于,所述采用所述第一訓練樣本集對目標識別模型進行訓練以優(yōu)化所述目標識別模型的步驟包括:
4.如權利要求3所述的目標識別模型優(yōu)化方法,其特征在于,所述根據(jù)所述多張樣本圖像分別對應的所述第一標簽信息和所述目標識別結果,計算目標置信度損失和目標類別損失的步驟包括:
5.如權利要求1至4中任一項所述的目標識別模型優(yōu)化方法,其特征在于,所述獲取第一訓練樣本集的步驟包括:
6.如權利要求5所述的目標識別模型優(yōu)化方法,其特征在于,所述根據(jù)各張所述目標樣本圖像構建所述第一訓練樣本集的步驟包括:
7.如權利要求6所述的目標識別模型優(yōu)化方法,其特征在于,所述將各張所述目標樣本圖像分別輸入到預先訓練得到的循環(huán)生成對抗網(wǎng)絡中,生成與各張所述目標樣本圖像分別對應的異視角圖像的步驟之前,還包括:
8.如權利要求7所述的目標識別模型優(yōu)化方法,其特征在于,所述循環(huán)生成對抗網(wǎng)絡包括第一生成對抗網(wǎng)絡和第二生成對抗網(wǎng)絡,所述第一生成對抗網(wǎng)絡包括第一生成網(wǎng)絡和第一判別網(wǎng)絡,所述第二生成對抗網(wǎng)絡包括第二生成網(wǎng)絡和第二判別網(wǎng)絡;
9.如權利要求8所述的目標識別模型優(yōu)化方法,其特征在于,所述第一生成對抗網(wǎng)絡還包括由若干全連接層串聯(lián)而成的第一網(wǎng)絡映射層,所述第一網(wǎng)絡映射層位于所述第一生成網(wǎng)絡之前,用于在將圖像輸入所述第一生成網(wǎng)絡之前對圖像進行網(wǎng)絡映射;
10.如權利要求8所述的目標識別模型優(yōu)化方法,其特征在于,所述第二標簽信息包括第一標簽值;將所述多組圖像輸入待訓練的所述循環(huán)生成對抗網(wǎng)絡,基于輸出結果和所述多組圖像分別對應預設的第二標簽信息,計算得到所述第一生成對抗網(wǎng)絡的第一對抗損失的步驟包括:
11.如權利要求10所述的目標識別模型優(yōu)化方法,其特征在于,所述第二標簽信息還包括第二標簽值,所述根據(jù)所述第一損失計算得到所述第一生成對抗網(wǎng)絡的第一對抗損失的步驟包括:
12.如權利要求11所述的目標識別模型優(yōu)化方法,其特征在于,所述第二標簽信息還包括第三標簽值,所述根據(jù)所述第一損失和所述第二損失計算得到所述第一生成對抗網(wǎng)絡的第一對抗損失的步驟包括:
13.如權利要求6所述的目標識別模型優(yōu)化方法,其特征在于,所述根據(jù)各張所述目標樣本圖像和各張所述異視角圖像構建所述第一訓練樣本集的步驟包括:
14.一種目標識別模型優(yōu)化設備,其特征在于,所述目標識別模型優(yōu)化設備包括:存儲器、處理器及存儲在所述存儲器上并可在所述處理器上運行的目標識別模型優(yōu)化程序,所述目標識別模型優(yōu)化程序被所述處理器執(zhí)行時實現(xiàn)如權利要求1至13中任一項所述的目標識別模型優(yōu)化方法。
15.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質上存儲有目標識別模型優(yōu)化程序,所述目標識別模型優(yōu)化程序被處理器執(zhí)行時實現(xiàn)如權利要求1至13中任一項所述的目標識別模型優(yōu)化方法。