欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于卷積神經(jīng)網(wǎng)絡的目標定位方法及裝置的制造方法

文檔序號:9751330閱讀:624來源:國知局
基于卷積神經(jīng)網(wǎng)絡的目標定位方法及裝置的制造方法
【技術領域】
[0001 ]本發(fā)明涉及機器視覺技術領域,尤其涉及一種基于卷積神經(jīng)網(wǎng)絡的目標定位方法及裝置。
【背景技術】
[0002]目標定位是機器視覺中的一個重要技術,定位到目標后,系統(tǒng)可方便地對目標進行存儲、分析、3D建模、識別、跟蹤和搜索等后續(xù)處理,因此目標定位的準確性直接影響到對目標的分析、識別、跟蹤和搜索等的效果。
[0003]現(xiàn)有技術中,一般通過對圖像進行預處理排除一些干擾因素,例如利用濾波對圖像進行去噪處理,圖像增強,量化;然后利用基于行人的H0G(Histogram of Gradient,方向梯度直方圖)特征,或者基于人臉的Gabor紋理特征,以及FAST匹配算法以及SIFT(Scale-1nvariant feature transform,尺度不變特征變換)等方法對預處理后的圖像進行特征提取得到一些基于區(qū)域的特征信息,比如紋理、直方圖、邊緣等;最后利用區(qū)域合并的方式得到目標框,可使用選擇性搜索(Selective Search)來得到目標框,即實現(xiàn)目標定位?,F(xiàn)有技術中,預處理技術難以做到自適應處理,因此需要對不同場景設置不同的參數(shù)來確保預處理的效果,難以保證后續(xù)特征提取的準確性;而HOG特征或者Gabor特征只能描述目標的某一種顯著性特征,受限于某些場景,缺乏普適性;而為了能夠在不同場景中有效合并相似的小區(qū)域得到最終的目標框,使用選擇性搜索(Selective Search)得到的目標框數(shù)量比較多,在圖像中出現(xiàn)多目標的情況下,得到的目標框可能就接近全圖(即多個目標可能分不開),可影響后續(xù)對目標的分析、識別、跟蹤和搜索等的效果。

【發(fā)明內(nèi)容】

[0004]本發(fā)明提供一種基于卷積神經(jīng)網(wǎng)絡的目標定位方法及裝置,以解決現(xiàn)有技術中在目標定位時受限于某些場景,缺乏普適性,準確性低的問題。
[0005]根據(jù)本發(fā)明實施例的第一方面,提供一種基于卷積神經(jīng)網(wǎng)絡的目標定位方法,所述方法包括:
[0006]提取訓練樣本的CNN(Convolut1nal Neural Network,卷積神經(jīng)網(wǎng)絡)特征;
[0007]使用所述CNN特征對SVM(Support Vector Machines,支持向量機)分類器進行訓練,得到級聯(lián)SVM分類器的第一級分類器;使用所述第一級分類器和所述訓練樣本在不同尺度下縮放的圖像的CNN特征,對SVM分類器進行訓練,得到所述級聯(lián)SVM分類器的第二級分類器;
[0008]提取測試樣本的CNN特征,并且利用所述第一級分類器進行檢測,得到多個測試目標框及多個測試目標框的一級得分;使用非極大值抑制算法對所述多個測試目標框進行抑制,并利用所述第二級分類器對抑制后的剩余測試目標框進行打分,得到每個剩余測試目標框的二級得分;
[0009]對每個剩余測試目標框的一級得分和二級得分進行加權處理,得到每個剩余測試目標框的分數(shù),并根據(jù)所述剩余測試目標框的分數(shù)對每個剩余測試目標框進行排序。
[0010]根據(jù)本發(fā)明實施例的第二方面,提供一種基于卷積神經(jīng)網(wǎng)絡的目標定位裝置,所述裝置包括:
[0011 ]提取單元,用于提取訓練樣本的卷積神經(jīng)網(wǎng)絡CNN特征;
[0012]訓練單元,用于使用所述CNN特征對SVM分類器進行訓練,得到級聯(lián)SVM分類器的第一級分類器;并使用所述第一級分類器和所述訓練樣本在不同尺度下縮放的圖像的CNN特征,對SVM分類器進行訓練,得到所述級聯(lián)SVM分類器的第二級分類器;
[0013]測試單元,用于提取測試樣本的CNN特征,并且利用所述第一級分類器進行檢測,得到多個測試目標框及多個測試目標框的一級得分;使用非極大值抑制算法對所述多個測試目標框進行抑制,并利用所述第二級分類器對抑制后的剩余測試目標框進行打分,得到每個剩余測試目標框的二級得分;
[0014]計算單元,用于對每個剩余測試目標框的一級得分和二級得分進行加權處理,得到每個剩余測試目標框的分數(shù);
[0015]排序單元,用于根據(jù)所述剩余測試目標框的分數(shù)對每個剩余測試目標框進行排序。
[0016]應用本發(fā)明實施例,通過提取訓練樣本的CNN特征,使用提取的CNN特征對SVM分類器進行訓練,得到級聯(lián)SVM分類器的第一級分類器;使用第一級分類器和訓練樣本在不同尺度下縮放的圖像的CNN特征,對SVM分類器進行訓練,得到級聯(lián)SVM分類器的第二級分類器;提取測試樣本的CNN特征,并且利用第一級分類器進行檢測,得到多個測試目標框及多個測試目標框的一級得分;使用非極大值抑制算法對多個測試目標框進行抑制,并利用第二級分類器對抑制后的剩余測試目標框進行打分,得到每個剩余測試目標框的二級得分;對每個剩余測試目標框的一級得分和二級得分進行加權處理,得到每個剩余測試目標框的分數(shù),并根據(jù)剩余測試目標框的分數(shù)對每個剩余測試目標框進行排序。根據(jù)測試目標框的得分排序可以定位目標,因此使用本發(fā)明的技術方案進行目標定位時并不受限于場景,具有普適性,而且通過級聯(lián)SVM分類器的第一級分類器和第二級分類器進行目標檢測提高了目標定位的準確性,由此本發(fā)明解決了現(xiàn)有技術中在目標定位時受限于某些場景,缺乏普適性,準確性低的問題。
【附圖說明】
[0017]此處的附圖被并入說明書中并構成本說明書的一部分,示出了符合本發(fā)明的實施例,并與說明書一起用于解釋本發(fā)明的原理。
[0018]圖1為本發(fā)明一種實施方式中基于卷積神經(jīng)網(wǎng)絡的目標定位方法流程圖;
[0019]圖2為本發(fā)明一種實施方式中基于卷積神經(jīng)網(wǎng)絡的目標定位裝置所在設備的一種硬件結構圖;
[0020]圖3為本發(fā)明一種實施方式中基于卷積神經(jīng)網(wǎng)絡的目標定位裝置框圖。
【具體實施方式】
[0021]為便于對本發(fā)明的理解,下面將結合附圖以具體實施例做進一步的解釋說明,實施例并不構成對本發(fā)明保護范圍的限定。
[0022]本發(fā)明實施例提供的技術方案可應用于機器視覺技術領域,可應用于智能交通場景下的機動車、非機動車、行人等多目標或者單目標的定位,還可應用于公安圖像偵查中目標物體,如帽子、雨傘等的定位,以及泛卡口智能分析技術中某些特定目標的定位。
[0023]本申請文件中提及的訓練樣本和測試樣本為前景圖片,該前景圖片可能包含比較多的背景;而正樣本為目標確切位置的圖片,該圖片基本不包含背景元素,負樣本為目標位置不確切的圖片,該圖片也基本不包含背景元素。
[0024]參見圖1,為本發(fā)明一種實施方式中基于卷積神經(jīng)網(wǎng)絡的目標定位方法流程圖,本發(fā)明實施例的執(zhí)行主體可為具有圖形處理能力的任意設備,這里以圖形處理設備為執(zhí)行主體進行描述:
[0025]步驟101:生成標定好的訓練樣本數(shù)據(jù)集。
[0026]其中,標定好的訓練樣本集包括每個訓練樣本的目標圖片以及每個目標的標定好的位置,每個目標標定好的位置可為一個區(qū)域,如可為一個100像素*200像素的區(qū)域。
[0027]生成標定好的訓練樣本數(shù)據(jù)集后,可將該訓練樣本數(shù)據(jù)集存儲為XML格式,以供后續(xù)采樣正樣本和負樣本。
[0028]步驟102:基于標定好的訓練樣本數(shù)據(jù)集,采樣生成正樣本和負樣本。
[0029]圖形處理設備可利用標定好的目標位置生成正樣本,例如,如果需要定位的目標是行人,正樣本集就是行人,如果樣本集比較大,可直接利用標定好的行人樣本集作為正樣本;如果樣本集比較小,可根據(jù)標定好的目標位置信息對原圖像采樣生成樣本,以確保樣本集比較小的情況下采樣的準確性。
[0030]對于沒有標定好目標位置的樣本,可在原圖像中進行隨機采樣生成目標圖片,計算隨機采樣生成的目標圖片的位置所覆蓋區(qū)域與標定好的位置所覆蓋區(qū)域的重合度,如果重合度小于預設閾值,則判定采樣得到的圖片為負樣本,否則為正樣本。
[0031]步驟103:分別提取正樣本和負樣本的CNN特征,并使用所述CNN特征對SVM分類器進行訓練
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
濉溪县| 宁都县| 远安县| 咸阳市| 马龙县| 罗城| 呼图壁县| 蛟河市| 合水县| 涡阳县| 陆川县| 沙洋县| 芮城县| 友谊县| 峨山| 建德市| 保定市| 梁平县| 黄骅市| 栾城县| 增城市| 武鸣县| 宜宾市| 福海县| 龙胜| 潼关县| 沅江市| 永川市| 从江县| 封丘县| 依安县| 巨鹿县| 德兴市| 卢龙县| 丹棱县| 仁布县| 永兴县| 锡林郭勒盟| 临湘市| 卫辉市| 滦南县|