本發(fā)明涉及智能識(shí)別、圖像處理領(lǐng)域,具體涉及一種圖像配準(zhǔn)方法及裝置。
背景技術(shù):
在視頻圖像領(lǐng)域,對(duì)于模糊的圖像處理,常常需要多幅相同場(chǎng)景的圖像來進(jìn)行重建達(dá)到提高分辨率的目的。而要實(shí)現(xiàn)這個(gè)目的,需要進(jìn)行兩幅甚至是多幅圖像之間的配準(zhǔn)。圖像配準(zhǔn)是將同一場(chǎng)景在不同時(shí)間、不同視角或者是不同傳感器拍攝的兩幅或多幅具有重疊區(qū)域的圖像進(jìn)行處理的過程,它在計(jì)算機(jī)視覺、遙感技術(shù)、醫(yī)學(xué)圖像處理、圖像融合、圖像超分辨率重建等領(lǐng)域有著廣泛的應(yīng)用。
圖像配準(zhǔn)的現(xiàn)有常用方法包括灰度信息法、基于變換域法、基于特征的方法。
1)基于灰度信息法對(duì)異源圖像配準(zhǔn)效果較好,但是計(jì)算量大,要求圖像有較大的重疊區(qū)域,容易出現(xiàn)局部極值;
2)基于變換域的方法是采用頻域的方法,利用傅里葉變換,通過對(duì)比、平移、旋轉(zhuǎn)、縮放在時(shí)域和頻域的對(duì)應(yīng)關(guān)系,求得變換關(guān)系;
3)而基于特征的圖像配準(zhǔn)方法是目前最常用的方法,因?yàn)檫@種方法只需要針對(duì)圖像特征進(jìn)行分析,減少了圖像處理過程的運(yùn)算量,并且對(duì)于亮度變化,圖像變形和遮擋都有較好的適應(yīng)能力。這種方法首先通過提取圖像的特征,然后構(gòu)造描述子,再進(jìn)行兩幅圖像之間特征的匹配,最后進(jìn)行融合變換,達(dá)到配準(zhǔn)的效果。
但是現(xiàn)存的圖像特征提取方法,比如sift、surf等,都是基于線性的高斯金字塔進(jìn)行多尺度分解來消除噪聲和提取圖像特征點(diǎn)。高斯分解犧牲了局部精度作為代價(jià),容易造成邊界模糊和細(xì)節(jié)丟失。非線性的尺度分解可以解決這個(gè)問題,但非線性擴(kuò)散方程并沒有解析解,只能使用數(shù)值分析的方法來求解。傳統(tǒng)的基于正向歐拉法求解時(shí)迭代收斂的步長(zhǎng)太短、耗時(shí)長(zhǎng)、計(jì)算復(fù)雜度高。
現(xiàn)有的比較理想的特征提取方法kaza也存在一些缺陷。kaza方法中采用加性算子分裂方法(additiveoperatorsplitting,aos)來求解非線性擴(kuò)散方程,可以采用任意步長(zhǎng)來構(gòu)造穩(wěn)定的非線性尺度空間,但實(shí)現(xiàn)復(fù)雜。加速版本的kaze方法(akaza)采用快速顯示擴(kuò)散(fastexplicitdiffusion,fed)數(shù)值分析框架來求解非線性擴(kuò)散濾波方程,相比aos方法在精度方面得到了較好的提升,并且降低了實(shí)現(xiàn)的復(fù)雜度。但是akaze方法采用的m-surf特征描述子構(gòu)建的特征向量在進(jìn)行特征匹配過程中耗時(shí)長(zhǎng)且匹配精度不夠高。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述技術(shù)問題,進(jìn)一步提高圖像配準(zhǔn)過程中的速度和精度,本發(fā)明提出一種改進(jìn)的圖像配準(zhǔn)方法及裝置,并且采用漢明距離度量圖像特征之間的相似度,減少計(jì)算量,提高配準(zhǔn)速度。
為了達(dá)到上述目的,本發(fā)明的技術(shù)方案如下:
一種圖像配準(zhǔn)方法具體包括以下步驟:
1)進(jìn)行圖像特征提??;
2)將灰度矩引入ldb描述子,構(gòu)建特征點(diǎn)的主方向,在對(duì)特征點(diǎn)描述時(shí),將特征點(diǎn)的鄰域圖像塊旋轉(zhuǎn)到主方向,構(gòu)建描述子;
3)進(jìn)行圖像之間的特征匹配;
4)查找最佳匹配點(diǎn)。
本發(fā)明發(fā)明了一種改進(jìn)ldb(localdifferencebinary)描述子的方法,提高匹配的精度,實(shí)現(xiàn)特征描述子的魯棒性。
在上述技術(shù)方案的基礎(chǔ)上,還可做如下改進(jìn):
作為優(yōu)選的方案,步驟1)具體包括以下步驟:
1.1)構(gòu)建圖像的非線性尺度空間;
1.2)進(jìn)行特征點(diǎn)檢測(cè),提取出特征點(diǎn);
1.3)找到特征點(diǎn)后,進(jìn)行亞像素的精確定位。
采用上述優(yōu)選的方案,有效進(jìn)行特征提取,提取精度高,速度快。
作為優(yōu)選的方案,步驟1.1)利用非線性擴(kuò)散方法和fed求解隱性差分方程的原理來構(gòu)建圖像的非線性尺度空間。
采用上述優(yōu)選的方案,非線性擴(kuò)散濾波是一種用流動(dòng)函數(shù)的散度來描述圖像亮度在不同尺度空間變化的方法。采用快速顯示擴(kuò)散(fed)來求解方程,因?yàn)樗Y(jié)合了顯示和半隱式的優(yōu)點(diǎn)。
作為優(yōu)選的方案步驟1.2)使用非極大值抑制方法,計(jì)算圖像金字塔中每個(gè)像素點(diǎn)的hessian矩陣,步驟1.2)檢測(cè)中的這些特征點(diǎn)在非線性尺度空間上,是經(jīng)過尺度歸一化之后的hessian矩陣行列式值在局部的極大值。
采用上述優(yōu)選的方案,效果好。
作為優(yōu)選的方案,步驟1.2)中hessian矩陣的窗口大小為3*3。
采用上述優(yōu)選的方案,加快搜索速度。
作為優(yōu)選的方案,步驟3)利用漢明距離的方法來度量?jī)蓚€(gè)描述子之間的相似度。
采用上述優(yōu)選的方案,采用漢明距離度量圖像特征之間的相似度,減少計(jì)算量,提高配準(zhǔn)速度。
作為優(yōu)選的方案,步驟4)利用knn方法來查找最佳匹配點(diǎn)。
采用上述優(yōu)選的方案,精度高,速度快。
作為優(yōu)選的方案,步驟4)中knn方法的k值取為2;
這樣對(duì)于每個(gè)特征點(diǎn)都有兩個(gè)待匹配點(diǎn),將兩個(gè)距離記為dist1和dist2;
其中,前者為最近鄰距離,后者為次近鄰距離,如果兩者比值小于設(shè)定的閾值ratio則接受這個(gè)最近鄰的匹配點(diǎn)。
采用上述優(yōu)選的方案,精度高,速度快。
作為優(yōu)選的方案,還包括步驟5),采用ransac方法來擬合出最優(yōu)的匹配對(duì),去除誤匹配對(duì)。
采用上述優(yōu)選的方案,有效去除誤配對(duì)。
一種圖像配準(zhǔn)裝置包括:存儲(chǔ)器或采集器,用于存儲(chǔ)或采集圖像樣本;處理器,利用圖像配準(zhǔn)方法對(duì)圖像進(jìn)行特征提取和配準(zhǔn)。
本發(fā)明一種圖像配準(zhǔn)裝置結(jié)構(gòu)簡(jiǎn)單,可以有效對(duì)圖像進(jìn)行有效配準(zhǔn),效率高,精確度好。
附圖說明
圖1為本發(fā)明實(shí)施例提供的一種圖像配準(zhǔn)方法的流程圖。
圖2為三個(gè)不同灰度分布的圖像塊(a)、(b)和(c)。
圖3為圖像對(duì)1-3。
圖4為graf組匹配正確率比對(duì)結(jié)果圖。
圖5為leuven組匹配正確率比對(duì)結(jié)果圖。
圖6為btree組匹配正確率比對(duì)結(jié)果圖。
圖7為compa組匹配正確率比對(duì)結(jié)果圖。
圖8為graf組中的圖像對(duì)1-3配準(zhǔn)之后的效果圖。
具體實(shí)施方式
下面結(jié)合附圖詳細(xì)說明本發(fā)明的優(yōu)選實(shí)施方式。
為了達(dá)到本發(fā)明的目的,一種圖像配準(zhǔn)方法及裝置中一些實(shí)施例中,
如圖1所示,一種圖像配準(zhǔn)方法具體包括以下步驟:
1)進(jìn)行圖像特征提??;
2)將灰度矩引入ldb描述子,構(gòu)建特征點(diǎn)的主方向,在對(duì)特征點(diǎn)描述時(shí),將特征點(diǎn)的鄰域圖像塊旋轉(zhuǎn)到主方向,構(gòu)建描述子;
3)進(jìn)行圖像之間的特征匹配;
4)查找最佳匹配點(diǎn)。
步驟1)具體包括以下步驟:
1.1)利用非線性擴(kuò)散方法和fed求解隱性差分方程的原理來構(gòu)建圖像的非線性尺度空間;
1.2)進(jìn)行特征點(diǎn)檢測(cè),提取出特征點(diǎn),這些特征點(diǎn)在非線性尺度空間上,是經(jīng)過尺度歸一化之后的hessian矩陣行列式值在局部的極大值;
1.3)找到特征點(diǎn)后,進(jìn)行亞像素的精確定位。
步驟3)利用漢明距離的方法來度量?jī)蓚€(gè)描述子之間的相似度,采用漢明距離度量圖像特征之間的相似度,減少計(jì)算量,提高配準(zhǔn)速度。
步驟4)利用knn方法來查找最佳匹配點(diǎn),k值取為2;這樣對(duì)于每個(gè)特征點(diǎn)都有兩個(gè)待匹配點(diǎn),將兩個(gè)距離記為dist1和dist2;
其中,前者為最近鄰距離,后者為次近鄰距離,如果兩者比值小于設(shè)定的閾值ratio則接受這個(gè)最近鄰的匹配點(diǎn)。
一種圖像配準(zhǔn)裝置包括:存儲(chǔ)器或采集器,用于存儲(chǔ)或采集圖像樣本;處理器,利用圖像配準(zhǔn)方法對(duì)圖像進(jìn)行特征提取和配準(zhǔn)。本發(fā)明一種圖像配準(zhǔn)裝置結(jié)構(gòu)簡(jiǎn)單,可以有效對(duì)圖像進(jìn)行有效配準(zhǔn),效率高,精確度好。
本發(fā)明提出一種圖像配準(zhǔn)方法及裝置,具有以下有益效果:
1)將灰度矩引入到ldb描述子中,作為圖像特征的方向信息,并將其應(yīng)用到圖像配準(zhǔn)中,提高了配準(zhǔn)的準(zhǔn)確度。
2)本發(fā)明使用漢明距離代替歐式距離計(jì)算圖像特征向量之間的距離,提高了圖像配準(zhǔn)的速度。
以下對(duì)本發(fā)明的方法進(jìn)行具體詳細(xì)的描述。
傳統(tǒng)的akaze方法在提取圖像特征的時(shí)候分為三個(gè)主要的步驟:
1)利用非線性擴(kuò)散方法和fed求解隱性差分方程的原理來構(gòu)建非線性尺度空間;
2)檢測(cè)感興趣的特征點(diǎn),這些特征點(diǎn)在非線性尺度空間上,是經(jīng)過尺度歸一化之后的hessian矩陣行列式值在局部(3×3鄰域)的極大值;
3)構(gòu)造特征向量,計(jì)算特征點(diǎn)的主方向,并基于一階微分圖像提取具有尺度和旋轉(zhuǎn)不變性的特征描述向量。
首先進(jìn)行非線性尺度空間的構(gòu)造。非線性擴(kuò)散濾波是一種用流動(dòng)函數(shù)的散度來描述圖像亮度在不同尺度空間變化的方法。用非線性偏微分方程來描述:
式中,div和
函數(shù)c定義如下:
式中函數(shù)g的定義可以根據(jù)不同的要求進(jìn)行設(shè)計(jì)。在實(shí)驗(yàn)中為了優(yōu)先保留寬度較大的區(qū)域?qū)定義為:
式中,
采用快速顯示擴(kuò)散(fed)來求解方程(1),因?yàn)樗Y(jié)合了顯示和半隱式的優(yōu)點(diǎn)。采用盒子濾波來近似高斯內(nèi)核。易于實(shí)現(xiàn)且計(jì)算復(fù)雜度低。fed的主要思想進(jìn)行m次循環(huán),m是圖像金字塔中組數(shù)o與層數(shù)s的積,即得到的濾波后的圖像總數(shù);每次循環(huán)都是一個(gè)n次的迭代過程,第j次迭代步長(zhǎng)τj的定義為:
式中,τmax是不破壞迭代過程穩(wěn)定性的最大迭代步長(zhǎng)。利用顯示擴(kuò)散可以將偏微分方程(1)表示為顯示模式:
式中τ是一個(gè)常量的迭代步長(zhǎng);a(li)是圖像的傳導(dǎo)矩陣。進(jìn)行迭代之后求解出的圖像亮度表示為:
li+1,j+1=(i+τja(li))li+1,j,j=0,...,n-1(6)
式中,i是單位陣。而li+1,0=li作為初始化的先驗(yàn)信息。
而每一次迭代的時(shí)間由空間濾波參數(shù)決定。對(duì)每一層的圖像進(jìn)行高斯濾波的參數(shù)定義為σi:
在傳導(dǎo)擴(kuò)散方程中以時(shí)間為單位進(jìn)行迭代,所以需要將空間濾波參數(shù)轉(zhuǎn)化為時(shí)間單位,而在高斯尺度空間下,使用標(biāo)準(zhǔn)差為σ的高斯核對(duì)圖像進(jìn)行卷積,相當(dāng)于對(duì)圖像進(jìn)行持續(xù)時(shí)間為t=σ2/2的濾波。所以尺度參數(shù)σi轉(zhuǎn)化為時(shí)間單位的映射公式為:
當(dāng)結(jié)束某一層(oi)的濾波之后,在圖像金字塔的下一層進(jìn)行降采樣操作;然后修改對(duì)比度因子λ。這樣就可以得到一個(gè)o組每組s層的圖像金子塔。
然后進(jìn)行特征點(diǎn)的檢測(cè),提取出特征。特征點(diǎn)的檢測(cè)與sift方法類似。使用非極大值抑制方法,計(jì)算圖像金字塔中每個(gè)像素點(diǎn)的hessian矩陣,為了加快搜索速度,窗口大小固定為3*3。即在上一層和下一層及周圍共26個(gè)像素點(diǎn)中尋找歸一化后不同尺度的hessian矩陣行列式的局部極大值.hessian矩陣行列式的值計(jì)算如下:
式中σ是這一層的尺度參數(shù)σi的整數(shù)值。(lxx,lyy)分別是圖像水平和垂直方向的二階偏導(dǎo),而lxy是交叉偏導(dǎo)數(shù)。
找到特征點(diǎn)后,再進(jìn)行亞像素的精確定位.利用空間尺度的泰勒展開式:
式中,l(x)是空間尺度函數(shù),x是特征點(diǎn)所在的坐標(biāo)。亞像素坐標(biāo)的解為:
得到亞像素的坐標(biāo)后,就可以進(jìn)行特征描述子的構(gòu)造。本發(fā)明采用的方案是引入灰度矩到ldb中,實(shí)現(xiàn)特征描述子的魯棒性。ldb描述子是一種二值描述子,相比于傳統(tǒng)的數(shù)值描述子sift、m-sufr等,具有計(jì)算機(jī)量小,實(shí)時(shí)性強(qiáng)的優(yōu)點(diǎn)。判斷一個(gè)描述子是否具良好的特性,主要有三個(gè)方面:
1)差異性,即對(duì)于不同的特征具有強(qiáng)區(qū)分度;
2)低計(jì)算復(fù)雜度,易于計(jì)算,匹配時(shí)消耗時(shí)間少,具有實(shí)時(shí)性;
3)魯棒性,對(duì)于光照變化,旋轉(zhuǎn)等具有不變性。
ldb描述子由于引入了圖像的一階梯度,而不僅僅是基于圖像的灰度信息,所以具有很高的差異性。如圖2所示,如果僅僅考慮平均灰度信息,那么三個(gè)圖像(a)、(b)、(c)的平均灰度是一樣的。ldb使用兩個(gè)網(wǎng)格內(nèi)的平均灰度和水平以及垂直方向的一階梯度信息來區(qū)分三個(gè)圖像塊。
加入梯度信息雖然使描述子增強(qiáng)了差異性,但是沒有加入方向信息和尺度信息導(dǎo)致這種描述子對(duì)于圖像的旋轉(zhuǎn)和尺度變化比較敏感,降低了魯棒性。
本發(fā)明將灰度矩添加到ldb中,用它來描述特征子的方向。圖像塊的灰度矩定義為:
式中,(x,y)是像素點(diǎn)的坐標(biāo),p,q分別取0和1。i(x,y)代表像素點(diǎn)的灰度.利用灰度矩將灰度的重心定義為:
假設(shè)特征點(diǎn)的位置為f,則將主方向定義為向量
通過以上方法構(gòu)建描述子的主方向,在對(duì)特征點(diǎn)進(jìn)行描述時(shí),首先將特征點(diǎn)的鄰域圖像塊旋轉(zhuǎn)到主方向,然后構(gòu)建出描述子。
另外,為了提高的匹配的速度,在對(duì)特征點(diǎn)進(jìn)行匹配時(shí),首先需要度量?jī)蓚€(gè)描述子之間的相似度,本發(fā)明中采用漢明距離。它對(duì)兩個(gè)相同長(zhǎng)度的二進(jìn)制字符串進(jìn)行異或操作,結(jié)果中為1的字符個(gè)數(shù)即兩個(gè)字符串的漢明距離。這對(duì)于ildb二值描述子來說計(jì)算量非常小,匹配效率非常高。
在查找最佳匹配點(diǎn)時(shí),采用knn方法,其中k值取為2。這樣對(duì)于每個(gè)特征點(diǎn)都有兩個(gè)待匹配點(diǎn)。不妨將兩個(gè)距離記為distl和dist2;其中前者為最近鄰距離,后者為次近鄰距離。如果兩者比值小于某個(gè)閾值ratio則接受這個(gè)最近鄰的匹配點(diǎn)。實(shí)驗(yàn)表明,ratio的值在0.65到0.8之間為最佳。
上述的操作雖然有助于找到一些最佳的匹配點(diǎn),去除一些不必要的匹配對(duì)。但是在匹配的結(jié)果中仍然會(huì)有誤匹配對(duì)。所以在實(shí)驗(yàn)中再次采用ransac方法來擬合出最優(yōu)的匹配對(duì),去除誤匹配對(duì)。
以下對(duì)本發(fā)明所提出的方法進(jìn)行實(shí)驗(yàn)驗(yàn)證。
為了驗(yàn)證本發(fā)明在配準(zhǔn)速度和精度上相比于現(xiàn)存方法的優(yōu)勢(shì),本發(fā)明分別使用surf、m-surf以及ildb三種描述子構(gòu)建圖像特征向量,對(duì)應(yīng)三種方法的實(shí)驗(yàn)對(duì)比分別是surf、a-kaze和akaze-ildb。實(shí)驗(yàn)中從配準(zhǔn)正確率和配準(zhǔn)時(shí)間兩個(gè)指標(biāo)對(duì)方法做出評(píng)價(jià)分析。實(shí)驗(yàn)平臺(tái)為windows7系統(tǒng),cpu2.6ghz,8g內(nèi)存的個(gè)人電腦。編程環(huán)境為qt4.7以及opencv3.1。實(shí)驗(yàn)采用katholieke大學(xué)公開的4組圖像進(jìn)行測(cè)試。
每組四幅圖像,其中一幅作為參考圖像,其余三幅作為待配準(zhǔn)圖像。根據(jù)圖片的現(xiàn)實(shí)場(chǎng)景,每組圖像分別屬于四種類別:
1)不同視點(diǎn),圖像組命名為graf;
2)不同亮度,圖像組命名為leuven;
3)不同模糊,圖像組命名為btree;
4)壓縮失真,圖像組命名為compa;
并且每組圖像中的每一對(duì)圖像1-2,1-3,1-4的配準(zhǔn)難度是逐漸上升的。選取每組圖像中配準(zhǔn)難度適中的圖像對(duì)1-3描述如圖3所示。
實(shí)驗(yàn)分為兩部分,首先從配準(zhǔn)時(shí)間的角度分析三種方法的效率;其次從圖像特征向量匹配正確率的角度分析三種方法所提取特征點(diǎn)的精確度。
方法時(shí)間上的開銷主要包括三個(gè)部分:
1)尺度空間的構(gòu)造;
2)特征描述向量的構(gòu)造;
3)特征向量的匹配;
為了保證實(shí)驗(yàn)的一致性,三種方法采用的都是k近鄰匹配,其中k值為2。獲取最佳匹配點(diǎn)的閾值設(shè)置為0.8。取每組圖像3次匹配的平均時(shí)間作為結(jié)果,如表1所示:
表1三種方法針對(duì)每組圖像的平均配準(zhǔn)時(shí)間
從表1中可以看出akaze-ildb方法除了在亮度變化的圖像組中與原始的a-kaze方法持平,其他圖像組中都具有優(yōu)勢(shì),平均配準(zhǔn)的時(shí)間減少了約300ms。雖然surf方法在時(shí)間上具有優(yōu)勢(shì),但在下面的匹配正確率的分析中表現(xiàn)并不理想。
采用匹配正確率來衡量配準(zhǔn)方法是否匹配了兩幅圖像中正確的特征點(diǎn).實(shí)際方法中檢測(cè)的匹配對(duì)數(shù)量記為#matches;將這些匹配對(duì)作為輸入,使用已知輸入的單應(yīng)性矩陣驗(yàn)證其是否是另一幅圖中相應(yīng)的正確特征點(diǎn),采用歐式距離進(jìn)行判斷,如果距離小于設(shè)定的閾值2.5,則將其記為正確的匹配對(duì),總數(shù)量記為#correct,則匹配正確率的計(jì)算公式為:
如圖4-7所示,匹配正確率的值越大,表示方法提取出的特征點(diǎn)精確度越高。從圖3中可以看出本發(fā)明方法在圖像亮度變換、不同模糊程度以及壓縮失真的圖像匹配中比另外兩種方法有明顯優(yōu)勢(shì),這是因?yàn)閍kaze-ildb利用非線性尺度空間構(gòu)造圖像金字塔來保持圖像局部精度和邊緣細(xì)節(jié),所以在配準(zhǔn)精度上保持了原始akaze方法的優(yōu)勢(shì)。
通過仿射變換將參考圖像標(biāo)定在待配準(zhǔn)圖像上。圖8是graf組中的圖像對(duì)1-3配準(zhǔn)之后的效果,左邊是參考圖像,右邊是是視點(diǎn)變化之后的待配準(zhǔn)圖像,兩幅圖中的小圓圈代表的是檢測(cè)到的特征點(diǎn),實(shí)線連接的是兩幅圖像中對(duì)應(yīng)的特征點(diǎn)。最后在待配準(zhǔn)圖像中,用實(shí)線框?qū)⒆筮叺膮⒖紙D像標(biāo)定出來。
為了進(jìn)一步地優(yōu)化本發(fā)明的實(shí)施效果,在另外一些實(shí)施方式中,其余特征技術(shù)相同,不同之處在于,還包括步驟5),采用ransac方法來擬合出最優(yōu)的匹配對(duì),去除誤匹配對(duì)。
以上的僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明創(chuàng)造構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。