專利名稱:局部描述子的提取方法、圖像檢索方法及圖像匹配方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像檢索技術(shù),尤其涉及一種局部描述子的提取方法、圖像檢索方法及圖像匹配方法。
背景技術(shù):
當(dāng)前,視覺檢索方法主要采用在圖像中提取尺度不變描述子(Scale InvariantFeature Transform,簡(jiǎn)稱:SIFT)或快速魯棒的尺度不變特征(Speeded Up RobustFeatures,簡(jiǎn)稱:SURF)進(jìn)行圖像的檢索。然而,針對(duì)紋理特征稀疏的圖像/圖片,或者用于映射人類思維特征的線圖時(shí),該些圖像本身缺乏紋理的特點(diǎn),SIFT和SURF不能獲取足夠的興趣點(diǎn),因此若采用SIFT和SURF進(jìn)行圖像的檢索,則嚴(yán)重的影響了檢索系統(tǒng)的性能和效率。業(yè)內(nèi)人士針對(duì)紋理信息缺少,但輪廓信息分明的手繪圖片/手繪圖像提出了形狀上下文描述子(Shape Context Descriptor,簡(jiǎn)稱:SCD),該SCD相對(duì)于SIFT和SURF重視了形狀特征,但是由于其本身的構(gòu)造方式為對(duì)圖像的輪廓進(jìn)行密集采樣,統(tǒng)計(jì)采樣點(diǎn)之間的距離及角度關(guān)系,這種構(gòu)造方式使得描述子的表現(xiàn)力集中于邊緣輪廓,因此,上述的SCD在對(duì)形狀內(nèi)部蘊(yùn)含大量線條及信息的圖像在搜索時(shí)不能反映圖像的真實(shí)形狀信息,導(dǎo)致匹配檢索失敗。為此,如何獲取能夠準(zhǔn)確的反映圖像形狀的構(gòu)造信息的局部描述子成為當(dāng)前需要解決的技術(shù)問題。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種局部描述子的提取方法、圖像檢索方法及圖像匹配方法。第一方面,本發(fā)明提供一種局部描述子的提取方法,包括:獲取圖像的核心興趣點(diǎn),所述核心興趣點(diǎn)為用于體現(xiàn)所述圖像的關(guān)鍵特征的像素
占.
確定所述核心興趣點(diǎn)的子區(qū)域半徑和所述核心興趣點(diǎn)對(duì)應(yīng)的王方向;根據(jù)所述子區(qū)域半徑和所述主方向,獲取所述圖像的局部描述子。由上述技術(shù)方案可知,本發(fā)明的局部描述子的提取方法通過獲取圖像的核心興趣點(diǎn),進(jìn)而確定核心興趣點(diǎn)的子區(qū)域半徑和核心興趣點(diǎn)對(duì)應(yīng)的主方向,以根據(jù)子區(qū)域半徑和主方向獲取圖像的局部描述子,進(jìn)而得到圖像的局部描述子能夠準(zhǔn)確的反映圖像形狀的構(gòu)造信息,相對(duì)于現(xiàn)有技術(shù)中的局部描述子具有較高的區(qū)分能力。第二方面,本發(fā)明還提供一種圖像檢索方法,包括:服務(wù)器根據(jù)如上所述的局部描述子的提取方法獲取圖像庫中每一圖像的局部描述子;服務(wù)器將所有圖像的局部描述子建立量化詞典;
服務(wù)器采用所述量化詞典對(duì)所述圖像庫中的所有圖像進(jìn)行量化,建立所述圖像庫對(duì)應(yīng)的索引表;所述服務(wù)器接收客戶端發(fā)送的目標(biāo)圖像的局部描述子,所述目標(biāo)圖像的局部描述子為客戶端采用如上所述的局部描述子的提取方法獲取的目標(biāo)圖像的局部描述子;服務(wù)器采用所述量化詞典對(duì)所述目標(biāo)圖像的局部描述子進(jìn)行量化,在所述索引表中查找量化后的目標(biāo)圖像的局部描述子對(duì)應(yīng)的索引,以獲得與所述目標(biāo)圖像對(duì)應(yīng)的查找結(jié)果。由上述技術(shù)方案可知,本發(fā)明的圖像檢索方法通過采用局部描述子的獲取方法獲取圖像庫中每一圖像的局部描述子以及目標(biāo)圖像的局部描述子,進(jìn)而采用所有圖像的局部描述子組成的量化詞典對(duì)目標(biāo)圖像的局部描述子進(jìn)行量化,以獲取與所述目標(biāo)圖像對(duì)應(yīng)的查找結(jié)果,可以提高圖像檢索的效率,同時(shí)提高圖像檢索的準(zhǔn)確率。第三方面,本發(fā)明還提供一種圖像匹配方法,包括:服務(wù)器接收客戶端發(fā)送的壓縮后的目標(biāo)圖像,并采用如上所述的局部描述子的提取方法獲取目標(biāo)圖像的局部描述子,以及圖像庫中任一圖像的局部描述子;根據(jù)預(yù)設(shè)比值的方式確定兩個(gè)所述局部描述子的匹配度,根據(jù)所述匹配度獲取與所述目標(biāo)圖像匹配的圖像;其中,所述兩個(gè)所述局部描述子包括:所述目標(biāo)圖像的局部描述子,和所述圖像庫中的一個(gè)圖像的局部描述子。由上述技術(shù)方案可知,本發(fā)明的圖像匹配方法能夠圖稿圖像匹配的準(zhǔn)確率,同時(shí)提聞圖像匹配的效率。第四方面,本發(fā)明還提供一種局部描述子的提取設(shè)備,包括:第一獲取單元,用于獲取圖像的核心興趣點(diǎn),所述核心興趣點(diǎn)為用于體現(xiàn)所述圖像的關(guān)鍵特征的像素點(diǎn);確定單元,用于確定所述核心興趣點(diǎn)的子區(qū)域半徑和所述核心興趣點(diǎn)對(duì)應(yīng)的主方向;第二獲取單元,用于根據(jù)所述子區(qū)域半徑和所述主方向,獲取所述圖像的局部描述子。由上述技術(shù)方案可知,本發(fā)明的局部描述子的提取設(shè)備獲得的圖像的局部描述子能夠準(zhǔn)確的反映圖像形狀的構(gòu)造信息,相對(duì)于現(xiàn)有技術(shù)中的局部描述子具有較高的區(qū)分能力。
為了更清楚地說明本發(fā)明的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見地:下面附圖只是本發(fā)明的一些實(shí)施例的附圖,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得同樣能實(shí)現(xiàn)本發(fā)明技術(shù)方案的其它附圖。圖1為本發(fā)明一實(shí)施例提供的局部描述子的提取方法的流程示意圖;圖2A至圖2C為本發(fā)明一實(shí)施例提供的局部描述子的提取方法的參考示意圖;圖3為本發(fā)明一實(shí)施例提供的量化詞典的獲取方法的流程示意圖4為本發(fā)明一實(shí)施例提供的視覺單詞索引表獲取方法的流程示意圖;圖5為本發(fā)明一實(shí)施例提供的圖像檢索方法的流程示意圖;圖6為本發(fā)明另一實(shí)施例提供的圖像檢索方法的流程示意圖;圖7為本發(fā)明一實(shí)施例提供的圖像匹配方法的流程示意圖;圖8為本發(fā)明一實(shí)施例提供的局部描述的提取設(shè)備的結(jié)構(gòu)示意圖。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明的技術(shù)方案進(jìn)行清楚、完整地描述。顯然,下述的各個(gè)實(shí)施例都只是本發(fā)明一部分的實(shí)施例?;诒景l(fā)明下述的各個(gè)實(shí)施例,本領(lǐng)域普通技術(shù)人員即使沒有作出創(chuàng)造性勞動(dòng),也可以通過等效變換部分甚至全部的技術(shù)特征,而獲得能夠解決本發(fā)明技術(shù)問題,實(shí)現(xiàn)本發(fā)明技術(shù)效果的其它實(shí)施例,而這些變換而來的各個(gè)實(shí)施例顯然并不脫離本發(fā)明所公開的范圍。圖1示出了本發(fā)明一實(shí)施例提供的局部描述子的提取方法的流程示意圖,如圖1所示,本實(shí)施例中的局部描述子的提取方法如下所述。101、獲取圖像的核心興趣點(diǎn),所述核心興趣點(diǎn)為用于體現(xiàn)圖像的關(guān)鍵特征的像素點(diǎn)。在本實(shí)施例中,關(guān)鍵特征可指通過邊緣提取獲得的圖像的邊緣或圖像邊緣中的角點(diǎn)。由于邊緣提取是一個(gè)提取圖像中梯度變化明顯的像素點(diǎn)的過程,因此邊緣是圖像中很重要的關(guān)鍵特征。舉例來說,在步驟101可包括:獲取所述圖像的一個(gè)以上的興趣點(diǎn),通過預(yù)置的篩選規(guī)則在所述一個(gè)以上的興趣點(diǎn)中篩選所述核心興趣點(diǎn)。其中,反映圖像關(guān)鍵特征的像素點(diǎn)通常為經(jīng)過邊緣提取獲得的邊緣點(diǎn),也可以對(duì)邊緣點(diǎn)進(jìn)一步篩選反映關(guān)鍵特征的像素點(diǎn),例如采用邊緣的交點(diǎn)作為關(guān)鍵特征點(diǎn)。所述的預(yù)置的篩選規(guī)則可根據(jù)興趣點(diǎn)的確定方式進(jìn)行選擇,一個(gè)典型的實(shí)施例中,如采用曲線局部極值的方式獲取興趣點(diǎn),可以采用非最大值抑制規(guī)則作為篩選規(guī)則。在具體的應(yīng)用中,如果有需要,可以不采用邊緣點(diǎn)作為興趣點(diǎn),可選擇圖像的任意一個(gè)像素點(diǎn)作為興趣點(diǎn)。102、確定所述核心興趣點(diǎn)的子區(qū)域半徑和所述核心興趣點(diǎn)對(duì)應(yīng)的主方向。舉例來說,確定核心興趣點(diǎn)的子區(qū)域半徑的方式可以包括如下的方式:第一種可選的方式:根據(jù)所述核心興趣點(diǎn)與相鄰的核心興趣點(diǎn)之間的距離分布獲取每一核心興趣點(diǎn)的子區(qū)域半徑,以及得到所述核心興趣點(diǎn)的子區(qū)域;第二種可選的方式:設(shè)定一核心興趣點(diǎn)為中心,預(yù)設(shè)長(zhǎng)度為半徑的子區(qū)域,所述預(yù)設(shè)長(zhǎng)度為所述核心興趣點(diǎn)的子區(qū)域半徑。此外,確定核心興趣點(diǎn)對(duì)應(yīng)的主方向,可包括如下的子步驟:M01、將所述核心興趣點(diǎn)的子區(qū)域按照預(yù)設(shè)的角度和內(nèi)部距離劃分為多個(gè)塊;M02、統(tǒng)計(jì)每一塊內(nèi)的所述圖像的非背景像素點(diǎn)的數(shù)目,以及所述子區(qū)域的每一角度上投影的非背景像素點(diǎn)的數(shù)目;
M03、將統(tǒng)計(jì)的一塊中某一角度上投影的非背景像素點(diǎn)的數(shù)目最多的方向作為所述核心興趣點(diǎn)的主方向;也就是說,將統(tǒng)計(jì)的子區(qū)域內(nèi)預(yù)設(shè)角度中投影的像素點(diǎn)的數(shù)目最多的角度作為所述核心興趣點(diǎn)的主方向;其中,步驟MOl中的內(nèi)部距離為所述子區(qū)域內(nèi)的非背景像素點(diǎn)通過所述圖像內(nèi)部非背景像素點(diǎn)到達(dá)所述子區(qū)域內(nèi)的核心興趣點(diǎn)的最小像素?cái)?shù)目。舉例來說,當(dāng)前,圖像可分為前景區(qū)域與背景區(qū)域,此時(shí),步驟MOl中的內(nèi)部距離為所述子區(qū)域內(nèi)的像素點(diǎn)通過所述圖像內(nèi)部的非背景區(qū)域的像素點(diǎn)到達(dá)所述子區(qū)域的核心興趣點(diǎn)的最小像素?cái)?shù)目。因此,在此處用非背景指代的是圖像在興趣點(diǎn)提取之前經(jīng)過的邊緣提取步驟(如下述的步驟SOl中的canny)中提取的邊緣像素點(diǎn)。其中,在具體的實(shí)施例中,非背景像素點(diǎn)定義可根據(jù)需求變化,例如在一個(gè)典型的實(shí)施例中,將像素灰度值大于某一閾值的點(diǎn)作為非背景像素,像素灰度值不大于該閾值的點(diǎn)作為背景像素。103、根據(jù)所述子區(qū)域半徑和所述主方向,獲取所述圖像的局部描述子。在具體的應(yīng)用中,步驟103可包括如下的子步驟:1031 、將所述主方向設(shè)為起始方向,以順時(shí)針方向或逆時(shí)針方向順序統(tǒng)計(jì)所述多個(gè)塊中每一塊中的非背景像素點(diǎn)的數(shù)目,根據(jù)統(tǒng)計(jì)的每一塊中的非背景像素點(diǎn)的數(shù)目形成每一核心興趣點(diǎn)對(duì)應(yīng)的局部描述子。在另一可選的實(shí)現(xiàn)方式中,圖1中的局部描述子的提取方法還可包括如下的圖中未示出的步驟104:104、在特征空間內(nèi)對(duì)所述圖像的局部描述子進(jìn)行距離度量,將距離小于預(yù)設(shè)閾值的局部描述子進(jìn)行編碼,得到編碼后的所述圖像的局部描述子;其中,特征空間為根據(jù)獲取所述圖像的局部描述子所使用的參數(shù)所確定的空間。舉例來說,該處的參數(shù)包括:前述步驟MOl中的預(yù)設(shè)的角度、塊等。例如,子區(qū)域半徑為D,將子區(qū)域的角度按照均勻劃分的方式劃分為
,(90° -180° ],(180。-270。],(270。-360。) 4 個(gè)區(qū)間,將內(nèi)部距離按照
,(0.0T-+^ )兩個(gè)區(qū)間進(jìn)行劃分,則產(chǎn)生的描述子為4*2=8維的描述子,則描述子對(duì)應(yīng)的特征空間為8維向量對(duì)應(yīng)的可能取值空間。通常,特征空間是由描述子的維度與每一維取值范圍確定的,而描述子的維度是由預(yù)設(shè)角度和對(duì)內(nèi)部距離的劃分確定的。在其他的實(shí)施例中,對(duì)特征空間進(jìn)行劃分的一個(gè)典型方法是參考D.Comaniciuand P.Meeer.Mean shift:A robust approach toward feature space analysis.1EEEtrans.PAMIj 24(5):603-619, 2002 的 Mean-shift 技術(shù)。由上述實(shí)施例可知,本實(shí)施例中的局部描述子的提取方法通過獲取圖像的核心興趣點(diǎn),進(jìn)而確定核心興趣點(diǎn)的子區(qū)域半徑和核心興趣點(diǎn)對(duì)應(yīng)的主方向,以根據(jù)子區(qū)域半徑和主方向獲取圖像的局部描述子,進(jìn)而得到圖像的局部描述子能夠準(zhǔn)確的反映圖像形狀的構(gòu)造信息,相對(duì)于現(xiàn)有技術(shù)中的局部描述子具有較高的區(qū)分能力。結(jié)合圖2A、圖2B和圖2C所示,以下通過一個(gè)具體的實(shí)施例進(jìn)一步詳細(xì)說明局部描述子的提取方法。S01、獲取圖像的一個(gè)以上的興趣點(diǎn),通過預(yù)置篩選規(guī)則在所述一個(gè)以上的興趣點(diǎn)中篩選所述核心興趣點(diǎn)。本實(shí)施例中的核心興趣點(diǎn)為用于體現(xiàn)所述圖像的關(guān)鍵特征的像素點(diǎn)。舉例來說,本實(shí)施例中的圖像可以為任意一張缺乏紋理信息的圖像,例如,數(shù)學(xué)函數(shù)圖像、衣物圖像、箱包圖像、素描圖像、工業(yè)圖紙圖像等。本實(shí)施例中不限定圖像的類型和圖像的內(nèi)容。此外,在計(jì)算機(jī)領(lǐng)域中,紋理用來表示圖像的均勻、細(xì)致、粗糙等現(xiàn)象。如圖2A所示,圖2A中的左側(cè)圖為紋理信息豐富的圖像,圖2A中的右側(cè)圖為缺乏紋理信息(即紋理信息稀疏)的圖像。通常,可以根據(jù)曲線局部極值的計(jì)算方式獲取所述圖像的一個(gè)以上的興趣點(diǎn)?;蛘?,獲取圖像的興趣點(diǎn)的方式可以是對(duì)圖像進(jìn)行邊緣提取(如canny變換),得到canny變換后的圖像曲線,進(jìn)而檢測(cè)圖像曲線的曲率極值,將該些曲率極值對(duì)應(yīng)的角點(diǎn)可作為上述圖像的興趣點(diǎn)。應(yīng)說明的是,一張80*80像素的圖像,興趣點(diǎn)可以是幾個(gè)或上千個(gè)興趣點(diǎn)。興趣點(diǎn)的數(shù)量根據(jù)興趣點(diǎn)的選取方式進(jìn)行設(shè)置。應(yīng)理解,上述僅舉例說明圖像的興趣點(diǎn)的提取方式,在具體的應(yīng)用過程中,還可以采用其他方式提取圖像的興趣點(diǎn),如隨機(jī)采樣的方式等,本實(shí)施例不限定興趣點(diǎn)的提取方式。在另一種具體的實(shí)現(xiàn)場(chǎng)景中,從興趣點(diǎn)中獲取核心興趣點(diǎn)的預(yù)置篩選規(guī)則可為非最大值抑制規(guī)則,例如,預(yù)先設(shè)置相鄰興趣點(diǎn)之間的最小距離,若圖像的任意相鄰興趣點(diǎn)之間的距離小于所述設(shè)定的最小距離,則選取相鄰興趣點(diǎn)之間興趣點(diǎn)所對(duì)應(yīng)的曲率極值最大的興趣點(diǎn)為核心興趣點(diǎn),若任意相鄰興趣點(diǎn)之間的距離大于或等于所設(shè)定的最小距離,則丟棄該相鄰的興趣點(diǎn)??梢岳斫獾氖?,當(dāng)興趣點(diǎn)采集過為密集時(shí),可以采用一定的策略降低興趣點(diǎn)的數(shù)量,如圖2B所示的經(jīng)非最大值抑制后的興趣點(diǎn)。S02、確定核心興趣點(diǎn)的子區(qū)域半徑和所述核心興趣點(diǎn)對(duì)應(yīng)的主方向。舉例來說,核心興趣點(diǎn)的子區(qū)域半徑的確定方式包括:可根據(jù)核心興趣點(diǎn)與相鄰的核心興趣點(diǎn)之間的距離分布獲取每一核心興趣點(diǎn)的子區(qū)域半徑,進(jìn)而得到核心興趣點(diǎn)的子區(qū)域?;蛘撸稍O(shè)定以核心興趣點(diǎn)為中心,預(yù)設(shè)長(zhǎng)度為半徑的子區(qū)域;此時(shí)預(yù)設(shè)長(zhǎng)度可為核心興趣點(diǎn)的子區(qū)域半徑。當(dāng)然,在實(shí)際的應(yīng)用中,用戶可以根據(jù)自己的需求選擇不同的方式作為確定子區(qū)域半徑的方式,本實(shí)施例僅為舉例說明。另外,核心興趣點(diǎn)對(duì)應(yīng)的主方向的確定方式可包括:步驟一、將核心興趣點(diǎn)的子區(qū)域按照預(yù)設(shè)的角度和內(nèi)部舉例劃分為多個(gè)塊;步驟二、統(tǒng)計(jì)每一塊內(nèi)的所述圖像的非背景像素點(diǎn)的數(shù)目,以及所述子區(qū)域的每一角度上投影的非背景像素點(diǎn)的數(shù)目;步驟三、將統(tǒng)計(jì)的子區(qū)域內(nèi)預(yù)設(shè)角度中投影的非背景像素點(diǎn)的數(shù)目最多的角度作為所述核心興趣點(diǎn)的主方向,其中,內(nèi)部距離為子區(qū)域內(nèi)像素點(diǎn)通過圖像內(nèi)部非背景像素點(diǎn)到達(dá)子區(qū)域內(nèi)的核心興趣點(diǎn)的最小像素?cái)?shù)目。具體地,如圖2C所示,對(duì)每一個(gè)子區(qū)域R,以核心興趣點(diǎn)C為中心,在對(duì)數(shù)極坐標(biāo)系下,將半徑a和角度0獨(dú)立的劃分為a =5和¢=12塊,統(tǒng)計(jì)每一塊內(nèi)的非背景像素分布直方圖,如統(tǒng)計(jì)5*12=60 (bin)個(gè)塊內(nèi)的非背景像素分布。應(yīng)理解的是,如圖2C所示,右側(cè)圖劃分方式為在歐氏距離空間下劃分,在本實(shí)施例中,圖2C右側(cè)圖的劃分方式僅僅是邏輯劃分方式中的一種示意圖。當(dāng)然,局部描述子的統(tǒng)計(jì)方式是在內(nèi)部距離空間下的。此外,對(duì)子區(qū)域內(nèi)的所有非背景像素,度量其通過內(nèi)部非背景像素點(diǎn)到達(dá)核心興趣點(diǎn)的距離及相對(duì)于核心興趣點(diǎn)的角度。對(duì)于每一子區(qū)域R,在對(duì)數(shù)極坐標(biāo)系下進(jìn)行度量,例如,針對(duì)子區(qū)域R內(nèi)的每一個(gè)非背景像素點(diǎn),分別統(tǒng)計(jì)該像素點(diǎn)到核心興趣點(diǎn)的距離。請(qǐng)注意:該處的距離為采用通過圖像內(nèi)部非背景像素點(diǎn)可到達(dá)的最短距離的對(duì)數(shù)作為該像素點(diǎn)與核心興趣點(diǎn)的距離。若該像素點(diǎn)與核心興趣點(diǎn)無法通過圖像非背景像素點(diǎn)連通,則舍棄該像素點(diǎn)。具體地,可參考如下的公式(I)進(jìn)行計(jì)算。dXjC;E=log r (X, C ;R) I (口)其中,公式(I)中的X代表正在統(tǒng)計(jì)的非背景像素點(diǎn),C代表核心興趣點(diǎn),r (x,c ;R)代表沿著在子區(qū)域R內(nèi)的非背景像素從像素點(diǎn)X到核心興趣點(diǎn)C所經(jīng)過的最短路徑。進(jìn)一步地,獲取上述提及的r (X,C ;R)最短路徑的方式如下:
第一、統(tǒng)計(jì)子區(qū)域R內(nèi)非背景像素點(diǎn)的鄰接矩陣,相鄰的像素點(diǎn)距離設(shè)為1,非相鄰的像素點(diǎn)初始值設(shè)為0 ;第二、將該鄰接矩陣應(yīng)用Floyd算法,該Floyd算法是一種用于尋找給定的加權(quán)圖中頂點(diǎn)間最短路徑的經(jīng)典算法。當(dāng)前的Floyd算法需要輸入一個(gè)初始鄰接矩陣,輸出為任意兩點(diǎn)之間的最短距離。初始鄰接矩陣的獲得方式為,生成一個(gè)長(zhǎng)寬均為子區(qū)域R內(nèi)像素?cái)?shù)目的矩陣,初始矩陣中每個(gè)元素的值均設(shè)為無窮大,若兩個(gè)像素(i,j)相鄰,則元素(i,j)設(shè)為I。經(jīng)過多次迭代,F(xiàn)loyd算法輸出核心興趣點(diǎn)C可達(dá)的子區(qū)域R內(nèi)全部非背景像素點(diǎn)的最短距離。應(yīng)說明的是,原始的像素信息均為在笛卡爾坐標(biāo)系下的信息,為了獲得對(duì)數(shù)極坐標(biāo)系下的每個(gè)像素點(diǎn)的角度,需要通過原始的笛卡爾坐標(biāo)系進(jìn)行如下轉(zhuǎn)換:針對(duì)角度的度量包括如下過程:在笛卡爾坐標(biāo)系下,按照如下公式(2)獲得目標(biāo)像素X的角度:9 = arctan (AX/ AY) (2)其中,AX與A Y分別為選取的非背景像素點(diǎn)X與核心興趣點(diǎn)C在X軸與y軸上的差值,對(duì)該比值求其反正切函數(shù)值作為選取的像素點(diǎn)X的角度,該角度即為對(duì)數(shù)極坐標(biāo)系下的角度。前述的核心興趣點(diǎn)的主方向的確定方式即為:選擇非背景像素?cái)?shù)目最多的投影方向?yàn)橹鞣较?¢=12中的其中一個(gè)方向),如圖2C右側(cè)圖所示,主方向?yàn)槠鹗挤较颍渌较虬凑枕槙r(shí)針排列。S03、根據(jù)子區(qū)域半徑和主方向,獲取所述圖像的局部描述子。舉例來說,將所述主方向?yàn)槠鹗挤较?,以順時(shí)針方向或逆時(shí)針方向順序統(tǒng)計(jì)所述多個(gè)塊中每一塊中的非背景像素點(diǎn)的數(shù)目,根據(jù)統(tǒng)計(jì)的每一塊中的非背景像素點(diǎn)的數(shù)目獲取每一核心興趣點(diǎn)對(duì)應(yīng)的局部描述子。本實(shí)施例中獲取的局部描述子可以較好的反映圖像形狀構(gòu)造信息。圖3示出了本發(fā)明一實(shí)施例提供的量化詞典的獲取方法的流程示意圖,如圖3所示,本實(shí)施例中的量化詞典的獲取方法如下所述。301、按照局部描述子的提取方法對(duì)圖像庫中的每一圖像提取對(duì)應(yīng)的局部描述子。302、對(duì)圖像庫中的所有圖像對(duì)應(yīng)的局部描述子進(jìn)行匯總,如聚類,獲取K個(gè)聚類中心,該K個(gè)聚類中心組成量化詞典,K為大于零的自然數(shù)。本實(shí)施例中,聚類可以是K均值聚類方式,或分層聚類方式等。特別地,在聚類時(shí)采用的相似性度量規(guī)則可為:局部描述子之間的歐式距離或者余弦距離等。進(jìn)一步地,上述的量化詞典的獲取方法還可包括如下的步驟303:303、為K個(gè)聚類中心編碼,以得到每一個(gè)聚類中心對(duì)應(yīng)的位置描述符。舉例來說,編碼方式可為從0開始,順序?qū)個(gè)中心編碼為0到K-1。本實(shí)施例中的量化詞典可對(duì)任一目標(biāo)圖像的局部描述子進(jìn)行量化,提高圖像檢索的準(zhǔn)確率。圖4示出了本發(fā)明一實(shí)施例提供的視覺單詞索引表獲取方法的流程示意圖,如圖4所示,本實(shí)施例中的視覺單詞索引表獲取方法如下所述。401、按照局部描述子的提取方法對(duì)圖像庫中的每一圖像提取對(duì)應(yīng)的局部描述子。402、對(duì)每 一張圖像對(duì)應(yīng)的所有局部描述子,在預(yù)置的量化詞典中查找與局部描述子相似的視覺單詞,針對(duì)每一張圖像,得到與每一興趣點(diǎn)對(duì)應(yīng)每一局部描述子的N個(gè)視覺單詞。可理解的是,每一張圖像對(duì)應(yīng)多個(gè)局部描述子,每一個(gè)局部描述子對(duì)應(yīng)一個(gè)視覺單詞(實(shí)際中,不同的描述子可能對(duì)應(yīng)同一個(gè)視覺單詞),因此,一張圖像提取出M個(gè)描述子(M為大于零的自然數(shù)),則M個(gè)描述子每一個(gè)對(duì)應(yīng)一個(gè)視覺單詞。在實(shí)際應(yīng)用中,查找相似視覺單詞的過程可以使用KD-tree或者順序查找等多種方式。403、統(tǒng)計(jì)每一張圖像對(duì)應(yīng)的視覺單詞位置描述符,合并同一張圖像對(duì)應(yīng)的多個(gè)相同位置描述符,將每個(gè)獲得的視覺單詞與對(duì)應(yīng)圖像的關(guān)聯(lián)信息保存在索引表之中。舉例來說,關(guān)聯(lián)信息為:針對(duì)一個(gè)視覺單詞,該視覺單詞在哪張圖像中出現(xiàn)了,且出現(xiàn)了多少次,占這張圖像的全部視覺單詞的比例等信息。需要注意的是,視覺單詞索引表可代表服務(wù)器所有的圖像的視覺單詞信息。在本實(shí)施例中,一個(gè)典型的索引表項(xiàng)包括:圖像位置信息,視覺單詞位置描述符,該圖像內(nèi)該描述符的存在比率。舉例來說,描述符存在比率的計(jì)算方式為:
2 Ou Dtl e W^.
P= J *——-其中,Dij為第j個(gè)圖像的第i個(gè)描述子,Wffl為第m個(gè)視覺單詞,Sj為第j個(gè)圖像的描述子的總數(shù)量。圖5示出了本發(fā)明一實(shí)施例提供的圖像檢索方法的流程示意圖,如圖5所示,本實(shí)施例中的圖像檢索方法如下所述。
501、服務(wù)器根據(jù)局部描述子的提取方法獲取圖像庫中每一圖像的局部描述子;502、服務(wù)器將所有圖像的局部描述子建立量化詞典;503、服務(wù)器采用所述量化詞典對(duì)所述圖像庫中的所有圖像進(jìn)行量化,建立所述圖像庫對(duì)應(yīng)的索引表;504、客戶端采用局部描述子的提取方法獲取目標(biāo)圖像的局部描述子,將獲取的所述目標(biāo)圖像的局部描述子發(fā)送至服務(wù)器。也就是說,服務(wù)器接收客戶端發(fā)送的目標(biāo)圖像的局部描述子,所述目標(biāo)圖像的局部描述子為客戶端采用前述的局部描述子的提取方法獲取的目標(biāo)圖像的局部描述子。舉例來說,客戶端可將目標(biāo)圖像的局部描述子進(jìn)行壓縮,將壓縮后的目標(biāo)圖像的局部描述子發(fā)送至服務(wù)器。505、服務(wù)器采用所述量化詞典對(duì)所述目標(biāo)圖像的局部描述子進(jìn)行量化,在所述索引表中查找量化后的目標(biāo)圖像的局部描述子對(duì)應(yīng)的索引,以獲得與所述目標(biāo)圖像對(duì)應(yīng)的查找結(jié)果。上述的圖像檢索方法尤其適用于無線網(wǎng)絡(luò)的圖像檢索。圖6為本發(fā)明一實(shí)施例提供的圖像檢索方法的流程示意圖,如圖6所示,本實(shí)施例中的圖像檢索方法進(jìn)行如下文所述。600、客戶端對(duì)目標(biāo)圖像使用圖像增強(qiáng)技術(shù),以及將增強(qiáng)后的目標(biāo)圖像進(jìn)行壓縮,發(fā)送給服務(wù)器。在實(shí)際應(yīng)用中,可以采用Retinex作為增強(qiáng)算法,具體步驟可以參考文獻(xiàn)“DJJobson Z Rahman.Retinex processing for automatic image enhancement.Journal ofElectronic Imaging, 2004.,,。601、服務(wù)器接收客戶端發(fā)送的壓縮的圖像。602、服務(wù)器目標(biāo)壓縮圖像進(jìn)行解壓縮,得到經(jīng)過圖像增強(qiáng)的目標(biāo)圖像,以及通過前述的局部描述子的提取方式獲得目標(biāo)圖像的局部描述子。603、服務(wù)器在預(yù)置的量化詞典中查找與局部描述子相似的視覺單詞,得到與每一興趣點(diǎn)對(duì)應(yīng)的視覺單詞,將查找的所有的視覺單詞作為目標(biāo)視覺單詞,同時(shí),在視覺單詞前端附加保留描述子的前綴信息用以計(jì)算該視覺單詞的存在比率。604、服務(wù)器在預(yù)置的視覺單詞索引表中查找與目標(biāo)視覺單詞匹配/ 一致的視覺單詞,根據(jù)查找的視覺單詞獲得與所述視覺單詞對(duì)應(yīng)的結(jié)果信息。當(dāng)視覺單詞索引表中的一視覺單詞對(duì)應(yīng)多個(gè)包含該視覺單詞的圖像時(shí),該多個(gè)圖像根據(jù)本身含有該視覺單詞數(shù)量及該視覺單詞權(quán)重進(jìn)行排序,當(dāng)對(duì)目標(biāo)圖像的所有目標(biāo)視覺單詞查找完畢后,形成一個(gè)圖像序列,排在前面的圖像是與目標(biāo)圖像最相似的。上述圖像按照相似性分?jǐn)?shù)排序的方法可參照現(xiàn)有技術(shù)。605、服務(wù)器將結(jié)果信息發(fā)送至客戶端。舉例來說,結(jié)果信息包括查找的圖像以及圖像的相關(guān)說明等。由上述實(shí)施例可知,服務(wù)器回復(fù)客戶端信息快速準(zhǔn)確,查詢結(jié)果信息的準(zhǔn)確性高。圖7為本發(fā)明一實(shí)施例提供的圖像匹配方法的流程示意圖,如圖7所示,本實(shí)施例中的圖像匹配方法如下文所述。701、服務(wù)器接收客戶端發(fā)送的壓縮的目標(biāo)圖像。
702、服務(wù)器對(duì)目標(biāo)圖像解壓縮,并采用前述的局部描述子的提取方法提取該目標(biāo)圖像對(duì)應(yīng)的N個(gè)局部描述子。703、服務(wù)器根據(jù)預(yù)設(shè)比值的方式確定兩個(gè)所述局部描述子是否匹配,并采用預(yù)設(shè)匹配描述子數(shù)量閾值的方式判斷目標(biāo)圖片與圖像庫內(nèi)的任一圖像是否匹配,將目標(biāo)圖像與圖像庫中圖像匹配描述子的數(shù)量作為目標(biāo)圖像與圖像庫中圖像的匹配度,根據(jù)所述匹配度獲取與所述目標(biāo)圖像匹配的圖像;其中,所述兩個(gè)所述局部描述子包括:所述目標(biāo)圖像的局部描述子,和所述圖像庫中的一個(gè)圖像的局部描述子。也就是說,目標(biāo)圖像和圖像庫中的所有圖像進(jìn)行匹配,但是單次的匹配過程是目標(biāo)圖像和圖像庫中的一個(gè)圖像進(jìn)行匹配,而對(duì)于單次的匹配過程,具體為,對(duì)每一個(gè)目標(biāo)圖像的局部描述子在本次與之預(yù)匹配的圖像的局部描述子中計(jì)算與其最近的和次近的局部描述子距離,當(dāng)兩者的比值小于某一閾值時(shí),則認(rèn)為這兩個(gè)局部描述子匹配,進(jìn)而,統(tǒng)計(jì)該圖像與目標(biāo)圖像的局部描述子匹配的數(shù)目,如果匹配數(shù)目超過某一閾值,則認(rèn)為兩張圖像匹配。在實(shí)際應(yīng)用中,前述的步驟703可具體包括圖中未示出的步驟7031和步驟7032:7031、服務(wù)器針對(duì)目標(biāo)圖像的每一個(gè)局部描述子,在服務(wù)器的圖像庫中的每一張圖像對(duì)應(yīng)的一組原始局部描述子中查找與目標(biāo)局部描述子的第一距離和第二距離的局部描述子。上述的第一距離為局部描述子與目標(biāo)局部描述子的距離最小,第二距離為局部描述子與目標(biāo)局部描述子的距離次小。需要注意的是,這里的距離度量方式通常采用卡方距離,也可采用歐式距離或余弦距離等。若某一距離采用歐式距離度量,則全部的度量標(biāo)準(zhǔn)均采用歐式距離;相應(yīng)地,若某一距離采用余弦距離進(jìn)行度量,則其他距離全部采用余弦距離進(jìn)行度量。也就是說,在任一距離計(jì)算的過程中距離的計(jì)算方式是相同的。7032、若第一距離與第二距離的比值小于預(yù)設(shè)閾值,則目標(biāo)局部描述子與原始局部描述子相匹配;否則,上述比值大于預(yù)設(shè)閾值,則認(rèn)為該圖像中不存在與目標(biāo)圖像客戶端的該目標(biāo)局部描述子匹配的原始局部描述子。上述的閾值通常設(shè)為0.6。7033、統(tǒng)計(jì)目標(biāo)圖像與圖像庫中每一張圖像匹配的局部描述子數(shù)量,匹配的局部描述子數(shù)量為目標(biāo)圖像與該圖像的匹配度,若目標(biāo)圖像與圖像庫中某一圖像匹配的局部描述子數(shù)量小于預(yù)設(shè)閾值,則認(rèn)為兩者不匹配,若匹配的局部描述子數(shù)量大于預(yù)設(shè)閾值,則判斷目標(biāo)圖像與該圖像匹配。其中對(duì)于匹配的局部描述子數(shù)量的閾值可以根據(jù)所處理的圖像庫中的數(shù)據(jù)預(yù)設(shè)為不同的數(shù)值。704、服務(wù)器統(tǒng)計(jì)圖像庫每張圖像針對(duì)目標(biāo)圖像的匹配度,并向客戶端返回對(duì)應(yīng)結(jié)果。由上實(shí)施例可知,本實(shí)施例中的圖像匹配方法能夠在服務(wù)器準(zhǔn)確查找到與目標(biāo)圖像相匹配的圖像,進(jìn)而較好的降低圖像匹配時(shí)的等待時(shí)間,使得圖像匹配的效率提高,且提高了結(jié)果的準(zhǔn)確性。根據(jù)本發(fā)明的另一方面,本發(fā)明還提供一種局部描述子的提取設(shè)備,如圖8所示,本實(shí)施例中的局部描述子的提取設(shè)備包括:第一獲取單元81、確定單元82和第二獲取單元83 ;其中,第一獲取單元81用于獲取圖像的核心興趣點(diǎn),所述核心興趣點(diǎn)為用于體現(xiàn)所述圖像的關(guān)鍵特征的像素點(diǎn);確定單元82用于確定所述核心興趣點(diǎn)的子區(qū)域半徑和所述核心興趣點(diǎn)對(duì)應(yīng)的主方向;第二獲取單元83用于根據(jù)所述子區(qū)域半徑和所述主方向,獲取所述圖像的局部描述子。在具體的實(shí)現(xiàn)過程中,前述的確定單元82具體用于,根據(jù)所述核心興趣點(diǎn)與相鄰的核心興趣點(diǎn)之間的距離分布獲取每一核心興趣點(diǎn)的子區(qū)域半徑,以及得到所述核心興趣點(diǎn)的子區(qū)域;將所述核心興趣點(diǎn)的子區(qū)域按照預(yù)設(shè)的角度和內(nèi)部距離劃分為多個(gè)塊;統(tǒng)計(jì)每一塊內(nèi)的所述圖像的像素點(diǎn)的數(shù)目,以及所述子區(qū)域的每一角度上投影的非背景像素點(diǎn)的數(shù)目;將統(tǒng)計(jì)的一塊中某一角度上投影的非背景像素點(diǎn)的數(shù)目最多的方向作為所述核心興趣點(diǎn)的王方向;其中,所述內(nèi)部距離為所述子區(qū)域內(nèi)的非背景像素點(diǎn)通過所述圖像內(nèi)部非背景像素點(diǎn)到達(dá)所述子區(qū)域內(nèi)的核心興趣點(diǎn)的最小像素?cái)?shù)目;或者,設(shè)定以所述核心興趣點(diǎn)為中心,預(yù)設(shè)長(zhǎng)度為半徑的子區(qū)域,所述預(yù)設(shè)長(zhǎng)度為所述核心興趣點(diǎn)的子區(qū)域半徑;也就是說,將預(yù)設(shè)長(zhǎng)度作為所述核心興趣點(diǎn)的子區(qū)域半徑,在確定所述核心興趣點(diǎn)的子區(qū)域半徑之后,得到所述核心興趣點(diǎn)的子區(qū)域;將所述核心興趣點(diǎn)的子區(qū)域按照預(yù)設(shè)的角度和內(nèi)部距離劃分為多個(gè)塊;統(tǒng)計(jì)每一塊內(nèi)的所述圖像的非背景像素點(diǎn)的數(shù)目,以及所述子區(qū)域的每一角度上投影的非背景像素點(diǎn)的數(shù)目;將統(tǒng)計(jì)的一塊中某一角度上投影的非背景像素點(diǎn)的數(shù)目最多的方向作為所述核心興趣點(diǎn)的王方向;其中,所述內(nèi)部距離為所述子區(qū)域內(nèi)的非背景像素點(diǎn)通過所述圖像內(nèi)部非背景像素點(diǎn)到達(dá)所述子區(qū)域內(nèi)的核心興趣點(diǎn)的最小像素?cái)?shù)目。在可選的實(shí)現(xiàn)過程中,前述的第二獲取單元83具體用于,將所述主方向設(shè)為起始方向,以順時(shí)針方向或逆時(shí)針方向順序統(tǒng)計(jì)所述多個(gè)塊中每一塊中的非背景像素點(diǎn)的數(shù)目,根據(jù)統(tǒng)計(jì)的每一塊中的非背景像素點(diǎn)的數(shù)目形成每一核心興趣點(diǎn)對(duì)應(yīng)的局部描述子。本實(shí)施例中的局部描述子的提取設(shè)備可以位于服務(wù)器中,也可以設(shè)置在客戶端中,如移動(dòng)終端、IPAD等。本實(shí)施例中局部描述子的提取設(shè)備獲得的圖像的局部描述子能夠準(zhǔn)確的反映圖像形狀的構(gòu)造信息,相對(duì)于現(xiàn)有技術(shù)中的局部描述子具有較高的區(qū)分能力。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:R0M、RAM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。
權(quán)利要求
1.一種局部描述子的提取方法,其特征在于,包括: 獲取圖像的核心興趣點(diǎn),所述核心興趣點(diǎn)為用于體現(xiàn)所述圖像的關(guān)鍵特征的像素點(diǎn); 確定所述核心興趣點(diǎn)的子區(qū)域半徑和所述核心興趣點(diǎn)對(duì)應(yīng)的主方向; 根據(jù)所述子區(qū)域半徑和所述主方向,獲取所述圖像的局部描述子。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述核心興趣點(diǎn)的子區(qū)域半徑,包括: 根據(jù)所述核心興趣點(diǎn)與相鄰的核心興趣點(diǎn)之間的距離分布獲取每一核心興趣點(diǎn)的子區(qū)域半徑; 或者, 將預(yù)設(shè)長(zhǎng)度作為所述核心興趣點(diǎn)的子區(qū)域半徑。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,確定所述核心興趣點(diǎn)對(duì)應(yīng)的主方向,包括: 在確定所述核心興趣點(diǎn)的子區(qū)域半徑之后,得到所述核心興趣點(diǎn)的子區(qū)域,將所述核心興趣點(diǎn)的子區(qū)域按照預(yù)設(shè)的角度和內(nèi)部距離劃分為多個(gè)塊; 統(tǒng)計(jì)每一塊內(nèi)的所述圖像的非背景像素點(diǎn)的數(shù)目,以及所述子區(qū)域的每一角度上投影的非背景像素點(diǎn)的數(shù)目; 將統(tǒng)計(jì)的子區(qū)域內(nèi)預(yù)設(shè)角度中投影的非背景像素點(diǎn)的數(shù)目最多的角度作為所述核心興趣點(diǎn)的主方向; 其中,所述內(nèi)部距離為所述子區(qū)域內(nèi)的非背景像素點(diǎn)通過所述圖像內(nèi)部非背景像素點(diǎn)到達(dá)所述子區(qū)域內(nèi)的核心興趣點(diǎn)的最小像素?cái)?shù)目。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述子區(qū)域半徑和所述主方向,獲取所述圖像的局部描述子,包括: 將所述主方向設(shè)為起始方向,以順時(shí)針方向或逆時(shí)針方向順序統(tǒng)計(jì)所述多個(gè)塊中每一塊中的非背景像素點(diǎn)的數(shù)目,根據(jù)統(tǒng)計(jì)的每一塊中的非背景像素點(diǎn)的數(shù)目形成每一核心興趣點(diǎn)對(duì)應(yīng)的局部描述子。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在所述根據(jù)所述子區(qū)域半徑和所述主方向,獲取所述圖像的局部描述子的步驟之后,還包括: 在特征空間內(nèi)對(duì)所述圖像的局部描述子進(jìn)行距離度量,將距離小于預(yù)設(shè)閾值的局部描述子進(jìn)行編碼,得到編碼后的所述圖像的局部描述子; 其中,特征空間為根據(jù)獲取所述圖像的局部描述子所使用的參數(shù)所確定的空間。
6.一種圖像檢索方法,其特征在于,包括: 服務(wù)器根據(jù)如上權(quán)利要求1至5任一所述的方法獲取圖像庫中每一圖像的局部描述子; 服務(wù)器將所有圖像的局部描述子建立量化詞典; 服務(wù)器采用所述量化詞典對(duì)所述圖像庫中的所有圖像進(jìn)行量化,建立所述圖像庫對(duì)應(yīng)的索引表; 所述服務(wù)器接收客戶端發(fā)送的目標(biāo)圖像的局部描述子,所述目標(biāo)圖像的局部描述子為所述客戶端采用如上權(quán)利要求1至5任一所述的方法獲取的局部描述子; 服務(wù)器采用所述量化詞典對(duì)所述目標(biāo)圖像的局部描述子進(jìn)行量化,在所述索引表中查找量化后的目標(biāo)圖像的局部描述子對(duì)應(yīng)的索引,以獲得與所述目標(biāo)圖像對(duì)應(yīng)的查找結(jié)果。
7.一種圖像匹配方法,其特征在于,包括: 服務(wù)器接收客戶端發(fā)送的壓縮后的目標(biāo)圖像,并采用如上權(quán)利要求1至5任一所述的方法獲取目標(biāo)圖像的局部描述子,以及圖像庫中任一圖像的局部描述子; 服務(wù)器根據(jù)預(yù)設(shè)比值的方式確定兩個(gè)所述局部描述子的匹配度,根據(jù)所述匹配度獲取與所述目標(biāo)圖像匹配的圖像; 其中,所述兩個(gè)所述局部描述子包括:所述目標(biāo)圖像的局部描述子,和所述圖像庫中的一個(gè)圖像的局部描述子。
8.一種局部描述子的提取設(shè)備,其特征在于,包括: 第一獲取單元,用于獲取圖像的核心興趣點(diǎn),所述核心興趣點(diǎn)為用于體現(xiàn)所述圖像的關(guān)鍵特征的像素點(diǎn); 確定單元,用于確定所述核心興趣點(diǎn)的子區(qū)域半徑和所述核心興趣點(diǎn)對(duì)應(yīng)的主方向; 第二獲取單元,用于根據(jù)所述子區(qū)域半徑和所述主方向,獲取所述圖像的局部描述子。
9.根據(jù)權(quán)利要求8所述的設(shè)備,其特征在于,所述確定單元,具體用于 根據(jù)所述核心興趣點(diǎn)與相鄰的核心興趣點(diǎn)之間的距離分布獲取每一核心興趣點(diǎn)的子區(qū)域半徑; 在確定所述核心興趣點(diǎn)的子區(qū)域半徑之后,得到所述核心興趣點(diǎn)的子區(qū)域,將所述核心興趣點(diǎn)的子區(qū)域按照預(yù)設(shè)的角度和內(nèi)部距離劃分為多個(gè)塊; 統(tǒng)計(jì)每一塊內(nèi)的所述圖像的非背景像素點(diǎn)的數(shù)目,以及所述子區(qū)域的每一角度上投影的非背景像素點(diǎn)的數(shù)目; 將統(tǒng)計(jì)的一塊中某一角度上投影的非背景像素點(diǎn)的數(shù)目最多的方向作為所述核心興趣點(diǎn)的主方向; 其中,所述內(nèi)部距離為所述子區(qū)域內(nèi)的非背景像素點(diǎn)通過所述圖像內(nèi)部非背景像素點(diǎn)到達(dá)所述子區(qū)域內(nèi)的核心興趣點(diǎn)的最小像素?cái)?shù)目; 或者, 將預(yù)設(shè)長(zhǎng)度作為所述核心興趣點(diǎn)的子區(qū)域半徑; 在確定所述核心興趣點(diǎn)的子區(qū)域半徑之后,得到所述核心興趣點(diǎn)的子區(qū)域,將所述核心興趣點(diǎn)的子區(qū)域按照預(yù)設(shè)的角度和內(nèi)部距離劃分為多個(gè)塊; 統(tǒng)計(jì)每一塊內(nèi)的所述圖像的非背景像素點(diǎn)的數(shù)目,以及所述子區(qū)域的每一角度上投影的非背景像素點(diǎn)的數(shù)目; 將統(tǒng)計(jì)的一塊中某一角度上投影的非背景像素點(diǎn)的數(shù)目最多的方向作為所述核心興趣點(diǎn)的主方向; 其中,所述內(nèi)部距離為所述子區(qū)域內(nèi)的非背景像素點(diǎn)通過所述圖像內(nèi)部非背景像素點(diǎn)到達(dá)所述子區(qū)域內(nèi)的核心興趣點(diǎn)的最小像素?cái)?shù)目。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其特征在于,所述第二獲取單元,具體用于 將所述主方向設(shè)為起始方向,以順時(shí)針方向或逆時(shí)針方向順序統(tǒng)計(jì)所述多個(gè)塊中每一塊中的非背景像素點(diǎn)的數(shù)目,根據(jù)統(tǒng)計(jì)的每一塊中的非背景像素點(diǎn)的數(shù)目形成每一核心興趣點(diǎn)對(duì)應(yīng)的局部描述子。
全文摘要
本發(fā)明提供一種局部描述子的提取方法、圖像檢索方法及圖像匹配方法,其中,局部描述子的提取方法包括獲取圖像的核心興趣點(diǎn),所述核心興趣點(diǎn)為用于體現(xiàn)所述圖像的關(guān)鍵特征的像素點(diǎn);確定所述核心興趣點(diǎn)的子區(qū)域半徑和所述核心興趣點(diǎn)對(duì)應(yīng)的主方向;根據(jù)所述子區(qū)域半徑和所述主方向,獲取所述圖像的局部描述子。上述提取方法提取的局部描述子能夠準(zhǔn)確的反映圖像形狀的構(gòu)造信息,使得使用該局部描述子進(jìn)行后期的檢索結(jié)果的準(zhǔn)確率更高。
文檔編號(hào)G06K9/46GK103218427SQ20131011842
公開日2013年7月24日 申請(qǐng)日期2013年4月8日 優(yōu)先權(quán)日2013年4月8日
發(fā)明者段凌宇, 宣昱聰, 王仿坤, 黃鐵軍 申請(qǐng)人:北京大學(xué)