本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,特別是涉及一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別方法及裝置。
背景技術(shù):
隨著計(jì)算機(jī)應(yīng)用技術(shù)的快速發(fā)展,圖像識(shí)別技術(shù)的應(yīng)用越來越廣泛,對(duì)圖像識(shí)別的需求也越來越多。比如在視頻監(jiān)控中,或者在簽名比對(duì)中,都需要進(jìn)行圖像識(shí)別。
隨著對(duì)人腦結(jié)構(gòu)和神經(jīng)網(wǎng)絡(luò)的眼睛,技術(shù)人員已經(jīng)了解并逐漸探索出人腦對(duì)信息的處理及工作方式。但基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如何進(jìn)行圖像的準(zhǔn)確識(shí)別,是目前本領(lǐng)域技術(shù)人員亟需解決的技術(shù)問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別方法及裝置,以基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對(duì)圖像進(jìn)行準(zhǔn)確識(shí)別。
為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:
一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別方法,包括:
根據(jù)圖像識(shí)別指令,確定待識(shí)別的目標(biāo)圖像;
針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將所述目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配,所述查找表集合包含多個(gè)具有不同內(nèi)容的參考圖像對(duì)應(yīng)的查找表,每個(gè)查找表基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立,每個(gè)查找表中的表項(xiàng)為所述神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元;
根據(jù)匹配結(jié)果,確定所述目標(biāo)圖像對(duì)應(yīng)的參考圖像。
在本發(fā)明的一種具體實(shí)施方式中,所述針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將所述目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配,包括:
針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將所述目標(biāo)圖像的每個(gè)像素與該查找表中相應(yīng)像素位置的表項(xiàng)進(jìn)行比對(duì);
針對(duì)該查找表中每個(gè)像素位置的表項(xiàng),如果該像素位置的表項(xiàng)有過學(xué)習(xí)記錄,則順延至該查找表的該像素位置后方下一表項(xiàng)處做迭代匹配,直至達(dá)到預(yù)設(shè)深度處。
在本發(fā)明的一種具體實(shí)施方式中,還包括:
針對(duì)所述查找表集合中每個(gè)查找表,如果在設(shè)定時(shí)長(zhǎng)內(nèi)沒有任何一個(gè)待識(shí)別的圖像被識(shí)別為該查找表對(duì)應(yīng)的參考圖像,則在所述查找表集合中刪除該查找表。
在本發(fā)明的一種具體實(shí)施方式中,針對(duì)任意一個(gè)參考圖像,通過以下步驟預(yù)先獲得該參考圖像對(duì)應(yīng)的查找表:
接收針對(duì)該參考圖像的待學(xué)習(xí)的圖像數(shù)據(jù)流,所述圖像數(shù)據(jù)流中每個(gè)圖像樣本具有與該參考圖像相同的內(nèi)容;
針對(duì)所述圖像數(shù)據(jù)流中的每個(gè)圖像樣本的每個(gè)像素,使用一個(gè)查找表中的相應(yīng)像素位置的表項(xiàng)對(duì)該像素進(jìn)行學(xué)習(xí);
將學(xué)習(xí)后的查找表確定為該參考圖像對(duì)應(yīng)的查找表。
在本發(fā)明的一種具體實(shí)施方式中,所述針對(duì)所述圖像數(shù)據(jù)流中的每個(gè)圖像樣本的每個(gè)像素,使用一個(gè)查找表中的相應(yīng)像素位置的表項(xiàng)對(duì)該像素進(jìn)行學(xué)習(xí),包括:
如果在該像素位置的表項(xiàng)首次接受學(xué)習(xí),則直接在該像素位置的表項(xiàng)處進(jìn)行學(xué)習(xí)記錄;
如果在該像素位置的表項(xiàng)非首次接受學(xué)習(xí),則對(duì)該像素位置后方表項(xiàng)進(jìn)行迭代學(xué)習(xí),直至迭代至首次接受學(xué)習(xí)的表項(xiàng)。
一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別裝置,包括:
目標(biāo)圖像確定模塊,用于根據(jù)圖像識(shí)別指令,確定待識(shí)別的目標(biāo)圖像;
表項(xiàng)匹配模塊,用于針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將所述目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配,所述查找表集合包含多個(gè)具有不同內(nèi)容的參考圖像對(duì)應(yīng)的查找表,每個(gè)查找表基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立,每個(gè)查找表中的表項(xiàng)為所述神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元;
參考圖像確定模塊,用于根據(jù)匹配結(jié)果,確定所述目標(biāo)圖像對(duì)應(yīng)的參考圖像。
在本發(fā)明的一種具體實(shí)施方式中,所述表項(xiàng)匹配模塊,具體用于:
針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將所述目標(biāo)圖像的每個(gè)像素與該查找表中相應(yīng)像素位置的表項(xiàng)進(jìn)行比對(duì);
針對(duì)該查找表中每個(gè)像素位置的表項(xiàng),如果該像素位置的表項(xiàng)有過學(xué)習(xí)記錄,則順延至該查找表的該像素位置后方下一表項(xiàng)處做迭代匹配,直至達(dá)到預(yù)設(shè)深度處。
在本發(fā)明的一種具體實(shí)施方式中,還包括查找表刪除模塊,用于:
針對(duì)所述查找表集合中每個(gè)查找表,如果在設(shè)定時(shí)長(zhǎng)內(nèi)沒有任何一個(gè)待識(shí)別的圖像被識(shí)別為該查找表對(duì)應(yīng)的參考圖像,則在所述查找表集合中刪除該查找表。
在本發(fā)明的一種具體實(shí)施方式中,還包括查找表獲得模塊,用于針對(duì)任意一個(gè)參考圖像,通過以下步驟預(yù)先獲得該參考圖像對(duì)應(yīng)的查找表:
接收針對(duì)該參考圖像的待學(xué)習(xí)的圖像數(shù)據(jù)流,所述圖像數(shù)據(jù)流中每個(gè)圖像樣本具有與該參考圖像相同的內(nèi)容;
針對(duì)所述圖像數(shù)據(jù)流中的每個(gè)圖像樣本的每個(gè)像素,使用一個(gè)查找表中的相應(yīng)像素位置的表項(xiàng)對(duì)該像素進(jìn)行學(xué)習(xí);
將學(xué)習(xí)后的查找表確定為該參考圖像對(duì)應(yīng)的查找表。
在本發(fā)明的一種具體實(shí)施方式中,所述查找表獲得模塊,具體用于:
如果在該像素位置的表項(xiàng)首次接受學(xué)習(xí),則直接在該像素位置的表項(xiàng)處進(jìn)行學(xué)習(xí)記錄;
如果在該像素位置的表項(xiàng)非首次接受學(xué)習(xí),則對(duì)該像素位置后方表項(xiàng)進(jìn)行迭代學(xué)習(xí),直至迭代至首次接受學(xué)習(xí)的表項(xiàng)。
應(yīng)用本發(fā)明實(shí)施例所提供的技術(shù)方案,根據(jù)圖像識(shí)別指令,可以確定待識(shí)別的目標(biāo)圖像,針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配,根據(jù)匹配結(jié)果,可以確定目標(biāo)圖像對(duì)應(yīng)的參考圖像,即目標(biāo)圖像更像哪一個(gè)參考圖像。查找表集合中的每個(gè)查找表基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立,通過圖像學(xué)習(xí)獲得,該集合中包含多個(gè)具有不同內(nèi)容的參考圖像對(duì)應(yīng)的查找表,每個(gè)查找表的表項(xiàng)為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元?;谏窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行圖像識(shí)別,模擬了人腦的學(xué)習(xí)能力,使得圖像識(shí)別更加準(zhǔn)確。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例中一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別方法的實(shí)施流程圖;
圖2為本發(fā)明實(shí)施例中一種圖像識(shí)別系統(tǒng)的結(jié)構(gòu)示意圖;
圖3為本發(fā)明實(shí)施例中一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的示意圖;
圖4為本發(fā)明實(shí)施例中一個(gè)圖像樣本的示意圖;
圖5為本發(fā)明實(shí)施例中樣本學(xué)習(xí)過程示意圖;
圖6為本發(fā)明實(shí)施例中圖像識(shí)別過程示意圖;
圖7為本發(fā)明實(shí)施例中查找表讀寫示意圖;
圖8為本發(fā)明實(shí)施例中一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和具體實(shí)施方式對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明。顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
參見圖1所示,為本發(fā)明實(shí)施例所提供的一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別方法的實(shí)施流程圖,該方法可以包括以下步驟:
S110:根據(jù)圖像識(shí)別指令,確定待識(shí)別的目標(biāo)圖像。
在本發(fā)明實(shí)施例中,控制單元可以通過前端接口單元接收?qǐng)D像識(shí)別指令,如圖2所示。圖像識(shí)別指令中可以攜帶待識(shí)別的目標(biāo)圖像。根據(jù)圖像識(shí)別指令,可以確定待識(shí)別的目標(biāo)圖像。
前端接口可以解析上層指令,與其交互的可以是通用x86架構(gòu)下的PCI-E(PCI Express,新一代總線接口),還可以是ARM架構(gòu)下AXI(Advancedextensible Interface,一種總線協(xié)議)等接口。
在接收到圖像識(shí)別指令時(shí),可以通過計(jì)算單元先對(duì)圖像識(shí)別指令中的目標(biāo)圖像進(jìn)行預(yù)處理,以達(dá)到加速識(shí)別的目的,如圖2所示。比如,可以使用卷積特征提取算法,將高像素圖像匹配至后端基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立的查找表的規(guī)格,并使圖像的輪廓更加清晰明顯,或者,可以設(shè)定對(duì)識(shí)別圖像的旋轉(zhuǎn)識(shí)別模式,例如,預(yù)先獲得的基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立的查找表中學(xué)習(xí)過一個(gè)正立的字符圖像“M”,則在接收到“W”時(shí)會(huì)將其識(shí)別為學(xué)習(xí)過的反轉(zhuǎn)了180°的“M”,或者,可以標(biāo)記學(xué)習(xí)和識(shí)別內(nèi)容的顏色,區(qū)分識(shí)別圖像的不同顏色代表的不同意義。
本發(fā)明實(shí)施例所基于的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,為一個(gè)立方體結(jié)構(gòu),立方體的三維坐標(biāo)系分別為XwYhZd,其中每一個(gè)節(jié)點(diǎn)為一個(gè)神經(jīng)元。在圖3中,如果目標(biāo)圖像為64*64像素大小,則其每一個(gè)像素可以對(duì)應(yīng)[X0,Y0]至[X63,Y63]相應(yīng)像素位置的神經(jīng)元。
確定待識(shí)別的目標(biāo)圖像后,可以繼續(xù)執(zhí)行步驟S120的操作。
S120:針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配。
查找表集合包含多個(gè)具有不同內(nèi)容的參考圖像對(duì)應(yīng)的查找表,每個(gè)查找表基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立,每個(gè)查找表中的表項(xiàng)為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元。
在本發(fā)明實(shí)施例中,可以通過圖像學(xué)習(xí)獲得具有不同內(nèi)容的參考圖像對(duì)應(yīng)的查找表,查找表是基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立的。即,每個(gè)具有神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的查找表對(duì)應(yīng)于具有不同內(nèi)容的參考圖像。多個(gè)查找表構(gòu)成查找表集合。
在本發(fā)明的一種具體實(shí)施方式中,針對(duì)任意一個(gè)參考圖像,可以通過以下步驟預(yù)先獲得該參考圖像對(duì)應(yīng)的查找表:
第一個(gè)步驟:接收針對(duì)該參考圖像的待學(xué)習(xí)的圖像數(shù)據(jù)流,圖像數(shù)據(jù)流中每個(gè)圖像樣本具有與該參考圖像相同的內(nèi)容;
第二個(gè)步驟:針對(duì)圖像數(shù)據(jù)流中的每個(gè)圖像樣本的每個(gè)像素,使用一個(gè)查找表中的相應(yīng)像素位置的表項(xiàng)對(duì)該像素進(jìn)行學(xué)習(xí);
第三個(gè)步驟:將學(xué)習(xí)后的查找表確定為該參考圖像對(duì)應(yīng)的查找表。
為便于描述,將上述三個(gè)步驟結(jié)合起來進(jìn)行說明。
在實(shí)際應(yīng)用中,可以通過前端接口接收針對(duì)參考圖像的學(xué)習(xí)指令。學(xué)習(xí)指令中可以攜帶針對(duì)該參考圖像的待學(xué)習(xí)的圖像數(shù)據(jù)流。圖像數(shù)據(jù)流中每個(gè)圖像樣本具有與該參考圖像相同的內(nèi)容,具體表現(xiàn)形式可能不同。圖像數(shù)據(jù)流中可以包含參考圖像的內(nèi)容信息。
基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的查找表對(duì)圖像數(shù)據(jù)流中的每個(gè)圖像樣本進(jìn)行學(xué)習(xí),并在相應(yīng)表項(xiàng)中記錄。針對(duì)圖像數(shù)據(jù)流中的每個(gè)圖像樣本的每個(gè)像素,使用一個(gè)查找表中的相應(yīng)像素位置的表項(xiàng)對(duì)該像素進(jìn)行學(xué)習(xí),獲得圖像含義、圖像特征等信息,在學(xué)習(xí)過程中可以配置學(xué)習(xí)加權(quán)值。
具體的,如果在該像素位置的表項(xiàng)首次接受學(xué)習(xí),則直接在該像素位置的表項(xiàng)處進(jìn)行學(xué)習(xí)記錄;如果在該像素位置的表項(xiàng)非首次接受學(xué)習(xí),則對(duì)該像素位置后方表項(xiàng)進(jìn)行迭代學(xué)習(xí),直至迭代至首次接受學(xué)習(xí)的表項(xiàng)。
比如,圖4為一個(gè)圖像樣本的示意圖,對(duì)該圖像樣本進(jìn)行學(xué)習(xí),在圖3所示的基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立的查找表的相應(yīng)像素位置的表項(xiàng)處進(jìn)行學(xué)習(xí)記錄,得到圖3所示的學(xué)習(xí)記錄結(jié)果。如果X2Y3Z1處的表項(xiàng)首次接受學(xué)習(xí),則可以直接在該表項(xiàng)處進(jìn)行學(xué)習(xí)記錄,如果該表項(xiàng)非首次接受學(xué)習(xí),則可以對(duì)Z軸方向表項(xiàng),即X2Y3Z2處的表項(xiàng)進(jìn)行迭代學(xué)習(xí),直至迭代至首次接受學(xué)習(xí)的表項(xiàng)。
具體學(xué)習(xí)過程可以參考圖5所示,配置相應(yīng)學(xué)習(xí)參數(shù)后,進(jìn)行樣本學(xué)習(xí),直至學(xué)習(xí)完成。樣本學(xué)習(xí)時(shí),首先根據(jù)索引查詢查找表,根據(jù)配置寫表項(xiàng),確定表項(xiàng)是否有過記錄,如果是,則修改報(bào)文準(zhǔn)備查后一個(gè)表項(xiàng),如果否,則學(xué)習(xí)完成。
通過學(xué)習(xí)記錄,可以將學(xué)習(xí)后的查找表確定為該參考圖像對(duì)應(yīng)的查找表。
當(dāng)要學(xué)習(xí)的圖像樣本不多時(shí),可以自定義分布寬度和深度,達(dá)到快速學(xué)習(xí)的目的。
在本發(fā)明的一種具體實(shí)施方式中,在上述第二個(gè)步驟之前,還可以對(duì)圖像數(shù)據(jù)流中的每個(gè)圖像進(jìn)行加速預(yù)處理。
具體的,可以參見識(shí)別過程的預(yù)處理過程,本發(fā)明實(shí)施例在此不再贅述。
針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配。
在本發(fā)明的一種具體實(shí)施方式中,步驟S120可以包括以下步驟:
步驟一:針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將目標(biāo)圖像的每個(gè)像素與該查找表中相應(yīng)像素位置的表項(xiàng)進(jìn)行比對(duì);
步驟二:針對(duì)該查找表中每個(gè)像素位置的表項(xiàng),如果該像素位置的表項(xiàng)有過學(xué)習(xí)記錄,則順延至該查找表的該像素位置后方下一表項(xiàng)處做迭代匹配,直至達(dá)到預(yù)設(shè)深度處。
為便于描述,將上述兩個(gè)步驟結(jié)合起來進(jìn)行說明。
針對(duì)預(yù)先獲得查找表集合中每個(gè)查找表,該查找表對(duì)應(yīng)于一個(gè)參考圖像,其可以通過學(xué)習(xí)該參考圖像的多種具有相同內(nèi)容的變形圖像獲得。
將目標(biāo)圖像的每個(gè)像素對(duì)應(yīng)至該查找表中相應(yīng)像素位置的表項(xiàng),并與相應(yīng)像素位置的表項(xiàng)進(jìn)行比對(duì)。針對(duì)該查找表中每個(gè)像素位置的表項(xiàng),如果該像素位置的表項(xiàng)有過學(xué)習(xí)記錄,則可以順延至該查找表的該像素位置后方下一表項(xiàng)處做迭代匹配,即順延至該查找表的Z軸后方下一表項(xiàng)處做迭代匹配,直至達(dá)到預(yù)設(shè)深度處。
針對(duì)目標(biāo)圖像的每個(gè)像素,通過將該像素與該查找表中相應(yīng)像素位置的表項(xiàng)的匹配,可以得到該像素與每個(gè)相應(yīng)表項(xiàng)的學(xué)習(xí)記錄的匹配程度,最后可以得到可量化的匹配深度結(jié)果。
預(yù)設(shè)深度可以根據(jù)實(shí)際情況進(jìn)行設(shè)定和調(diào)整,本發(fā)明實(shí)施例對(duì)此不做限制。
S130:根據(jù)匹配結(jié)果,確定目標(biāo)圖像對(duì)應(yīng)的參考圖像。
在步驟S120,針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配,可以得到目標(biāo)圖像的每個(gè)像素與該查找表的匹配結(jié)果,根據(jù)匹配結(jié)果,可以確定目標(biāo)圖像對(duì)應(yīng)的參考圖像。
具體的,可以將匹配程度最大的查找表對(duì)應(yīng)的參考圖像確定為目標(biāo)圖像對(duì)應(yīng)的參考圖像。
具體的識(shí)別過程可以參考圖6,輸入識(shí)別圖像后,通過查找表識(shí)別,識(shí)別完成返回結(jié)果。通過查找表識(shí)別時(shí),首先根據(jù)索引查詢查找表,分析表項(xiàng),確定表項(xiàng)是否有過記錄,如果是,則修改報(bào)文準(zhǔn)備查后一個(gè)表項(xiàng),如果否,則識(shí)別完成。
讀寫查找表示意圖如圖7所示,表請(qǐng)求模塊Tbl_req在一個(gè)像素信息輸入后發(fā)出一個(gè)讀表項(xiàng)的請(qǐng)求發(fā)送給DDR接口Ddr_if,DDR接口Ddr_if會(huì)從DDR里讀出數(shù)據(jù),返回給表確認(rèn)模塊Tbl_act進(jìn)行匹配或者學(xué)習(xí),在返回的時(shí)候要把迭代后的數(shù)據(jù)再寫回到DDR的表項(xiàng)里面。
本發(fā)明實(shí)施例對(duì)圖像的識(shí)別過程,是模擬人腦的學(xué)習(xí)能力,實(shí)現(xiàn)對(duì)學(xué)習(xí)過的圖像得到目標(biāo)圖像更“像”哪一個(gè),而不是“是”哪一個(gè),實(shí)現(xiàn)一個(gè)圖像在對(duì)學(xué)習(xí)過的信息中匹配識(shí)別得到一個(gè)可以量化的學(xué)習(xí)深度,達(dá)到識(shí)別圖像的目的。
應(yīng)用本發(fā)明實(shí)施例所提供的方法,根據(jù)圖像識(shí)別指令,可以確定待識(shí)別的目標(biāo)圖像,針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配,根據(jù)匹配結(jié)果,可以確定目標(biāo)圖像對(duì)應(yīng)的參考圖像,即目標(biāo)圖像更像哪一個(gè)參考圖像。查找表集合中的每個(gè)查找表基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立,通過圖像學(xué)習(xí)獲得,該集合中包含多個(gè)具有不同內(nèi)容的參考圖像對(duì)應(yīng)的查找表,每個(gè)查找表的表項(xiàng)為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元?;谏窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行圖像識(shí)別,模擬了人腦的學(xué)習(xí)能力,使得圖像識(shí)別更加準(zhǔn)確。
在本發(fā)明的一個(gè)實(shí)施例中,該方法還可以包括以下步驟:
針對(duì)查找表集合中每個(gè)查找表,如果在設(shè)定時(shí)長(zhǎng)內(nèi)沒有任何一個(gè)目標(biāo)圖像被識(shí)別為該查找表對(duì)應(yīng)的參考圖像,則在查找表集合中刪除該查找表。
具體的,可以通過配置記憶遺忘速率參數(shù),模擬對(duì)學(xué)習(xí)圖像的遺忘特征,將查找表集合中長(zhǎng)期未使用的查找表進(jìn)行刪除操作,以在對(duì)圖像進(jìn)行識(shí)別時(shí),節(jié)省匹配時(shí)間,提高識(shí)別效率。
相應(yīng)于上面的方法實(shí)施例,本發(fā)明實(shí)施例還提供了一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別裝置,下文描述的一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別裝置與上文描述的一種基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像識(shí)別方法可相互對(duì)應(yīng)參照。
參見圖4所示,該裝置包括以下模塊:
目標(biāo)圖像確定模塊210,用于根據(jù)圖像識(shí)別指令,確定待識(shí)別的目標(biāo)圖像;
表項(xiàng)匹配模塊220,用于針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配,查找表集合包含多個(gè)具有不同內(nèi)容的參考圖像對(duì)應(yīng)的查找表,每個(gè)查找表基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立,每個(gè)查找表中的表項(xiàng)為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元;
參考圖像確定模塊230,用于根據(jù)匹配結(jié)果,確定目標(biāo)圖像對(duì)應(yīng)的參考圖像。
應(yīng)用本發(fā)明實(shí)施例所提供的裝置,根據(jù)圖像識(shí)別指令,可以確定待識(shí)別的目標(biāo)圖像,針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將目標(biāo)圖像的每個(gè)像素與該查找表的每個(gè)表項(xiàng)進(jìn)行匹配,根據(jù)匹配結(jié)果,可以確定目標(biāo)圖像對(duì)應(yīng)的參考圖像,即目標(biāo)圖像更像哪一個(gè)參考圖像。查找表集合中的每個(gè)查找表基于神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立,通過圖像學(xué)習(xí)獲得,該集合中包含多個(gè)具有不同內(nèi)容的參考圖像對(duì)應(yīng)的查找表,每個(gè)查找表的表項(xiàng)為神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的神經(jīng)元?;谏窠?jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行圖像識(shí)別,模擬了人腦的學(xué)習(xí)能力,使得圖像識(shí)別更加準(zhǔn)確。
在本發(fā)明的一種具體實(shí)施方式中,表項(xiàng)匹配模塊220,具體用于:
針對(duì)預(yù)先獲得的查找表集合中每個(gè)查找表,將目標(biāo)圖像的每個(gè)像素與該查找表中相應(yīng)像素位置的表項(xiàng)進(jìn)行比對(duì);
針對(duì)該查找表中每個(gè)像素位置的表項(xiàng),如果該像素位置的表項(xiàng)有過學(xué)習(xí)記錄,則順延至該查找表的該像素位置后方下一表項(xiàng)處做迭代匹配,直至達(dá)到預(yù)設(shè)深度處。
在本發(fā)明的一種具體實(shí)施方式中,還包括查找表刪除模塊,用于:
針對(duì)查找表集合中每個(gè)查找表,如果在設(shè)定時(shí)長(zhǎng)內(nèi)沒有任何一個(gè)待識(shí)別的圖像被識(shí)別為該查找表對(duì)應(yīng)的參考圖像,則在查找表集合中刪除該查找表。
在本發(fā)明的一種具體實(shí)施方式中,還包括查找表獲得模塊,用于針對(duì)任意一個(gè)參考圖像,通過以下步驟預(yù)先獲得該參考圖像對(duì)應(yīng)的查找表:
接收針對(duì)該參考圖像的待學(xué)習(xí)的圖像數(shù)據(jù)流,圖像數(shù)據(jù)流中每個(gè)圖像樣本具有與該參考圖像相同的內(nèi)容;
針對(duì)圖像數(shù)據(jù)流中的每個(gè)圖像樣本的每個(gè)像素,使用一個(gè)查找表中的相應(yīng)像素位置的表項(xiàng)對(duì)該像素進(jìn)行學(xué)習(xí);
將學(xué)習(xí)后的查找表確定為該參考圖像對(duì)應(yīng)的查找表。
在本發(fā)明的一種具體實(shí)施方式中,查找表獲得模塊,具體用于:
如果在該像素位置的表項(xiàng)首次接受學(xué)習(xí),則直接在該像素位置的表項(xiàng)處進(jìn)行學(xué)習(xí)記錄;
如果在該像素位置的表項(xiàng)非首次接受學(xué)習(xí),則對(duì)該像素位置后方表項(xiàng)進(jìn)行迭代學(xué)習(xí),直至迭代至首次接受學(xué)習(xí)的表項(xiàng)。
本說明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其它實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同或相似部分互相參見即可。對(duì)于實(shí)施例公開的裝置而言,由于其與實(shí)施例公開的方法相對(duì)應(yīng),所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法部分說明即可。
專業(yè)人員還可以進(jìn)一步意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來實(shí)現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
結(jié)合本文中所公開的實(shí)施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實(shí)施。軟件模塊可以置于隨機(jī)存儲(chǔ)器(RAM)、內(nèi)存、只讀存儲(chǔ)器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動(dòng)磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲(chǔ)介質(zhì)中。
本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的技術(shù)方案及其核心思想。應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對(duì)本發(fā)明進(jìn)行若干改進(jìn)和修飾,這些改進(jìn)和修飾也落入本發(fā)明權(quán)利要求的保護(hù)范圍內(nèi)。