專利名稱:一種圖像識別中群相關(guān)并行計算的硬件實現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機技術(shù)、圖像識別處理技術(shù)領(lǐng)域,具體的涉及一種圖像識別中群相關(guān)并行計算的硬件實現(xiàn)方法。
背景技術(shù):
圖像識別是一項應(yīng)用范圍很廣的技術(shù)。在圖像識別的各種手段中,圖像匹配是最基本的方法。而圖像匹配的常用算法是計算兩幅圖像的相關(guān)系數(shù),歸一化相關(guān)系數(shù)的計算公式如下
Σσ,-fy^-g)
Coef= I 廣- ι.
-7)2* JE(Si-S)2
V i=lV =1式中η為窗口像素點的個數(shù),f是模板數(shù)據(jù),g來自實時圖數(shù)據(jù),7是模板數(shù)據(jù)窗口的平均值,I是實時圖窗口數(shù)據(jù)的平均值。具體實施圖像匹配計算時經(jīng)常以窗口為單位,即用實時圖的一個窗口與模板的一個窗口做相關(guān)系數(shù)計算,參見圖I所示,Coef數(shù)值的大小反映了兩個窗口圖像的相似度。因為相關(guān)計算是以像素為單位的,一幅圖像的像素點很多,所以計算量很大。一般為了作出圖像識別,一個實時圖的窗口往往要與許多模板存儲器的窗口做相關(guān)計算,即所謂的群相關(guān)計算。這里的群是指許多窗口的意思,如圖2所示。實時圖的一個窗口要與模板中許多同尺寸、但位置不相同的窗口做計算,計算量巨大。用軟件做上述計算的耗時是相當大的。
發(fā)明內(nèi)容
為克服現(xiàn)有技術(shù)中的不足,本發(fā)明旨在提供一種圖像識別中群相關(guān)并行計算的硬件實現(xiàn)方法,該方法可在不增加訪問存儲器通路的情況下大大提高群相關(guān)計算的速度。為實現(xiàn)上述技術(shù)目的,達到上述技術(shù)效果,本發(fā)明通過以下技術(shù)方案實現(xiàn)步驟I)設(shè)置一個模板的大窗口,所述大窗口將模板中的所有窗口都包羅在內(nèi);步驟2)將模板存儲器數(shù)據(jù)通路讀出的數(shù)據(jù)送到所有運算器中;步驟3)各個運算器判斷該數(shù)據(jù)是否屬于本運算器負責的窗口中的數(shù)據(jù),如果是,則該數(shù)據(jù)參加運算;如果不是,不預(yù)理睬,等待屬于它的數(shù)據(jù)的到來。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果I、使用兩路存儲器通道,完成η個窗口的相關(guān)計算(或點積計算等其它計算)所需的η個數(shù)據(jù),從而大大減少了對存儲器數(shù)據(jù)流量或芯片I/O引腳數(shù)的要求;2、多個窗口的計算基本同步并行完成,而不是串行完成,大大提高了計算的并行度,提高了計算速度;3、因為η個窗口是并行執(zhí)行的,所以芯片內(nèi)不需要大容量的緩沖器來順序執(zhí)行點積或相關(guān)計算。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,并可依照說明書的內(nèi)容予以實施,以下以本發(fā)明的較佳實施例并配合附圖詳細說明如后。本發(fā)明的具體實施方式
由以下實施例及其附圖詳細給出。
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。在附圖中圖I表示以窗口為單位的相關(guān)比較。圖2表示窗口群示意圖。圖3表示本發(fā)明的大窗口示意圖。圖4表示本發(fā)明的一路模板數(shù)據(jù)由η個運算器公用的示意圖?!?br>
具體實施例方式下面將參考附圖并結(jié)合實施例,來詳細說明本發(fā)明。使用硬件實現(xiàn)群相關(guān)計算的目的是為了加速,而加速計算的方法是并行計算。本發(fā)明采用群內(nèi)所有模板窗口同時與實時圖的一個窗口做計算以實現(xiàn)提速,如此,如果采用η個窗口同時計算的話,那速度就提高η倍了。采用η個運算器同時做計算的一個條件就是要有η個通道讀出模板數(shù)據(jù)。當η較大時,硬件很難實現(xiàn)。比如η = 49,數(shù)據(jù)寬度為16,按照現(xiàn)在的工藝水平,這是無法實現(xiàn)的。這是群相關(guān)并行計算的難點所在。然而,從圖2中可以得知,模板中眾多窗口大部分區(qū)域都是重疊的,所以可充分利用從存儲器讀出的數(shù)據(jù),使讀出的數(shù)據(jù)可以被所有包含它的窗口共同使用。按照上述思想眾多模板窗口的數(shù)據(jù)只用一路存儲器讀出通道與實時圖的一路存儲器通道就可以實現(xiàn)所有窗口相關(guān)并行計算的需要了。具體實施方法是這樣的參見圖3及圖4所示,一種圖像識別中群相關(guān)并行計算的硬件實現(xiàn)方法,其包括以下步驟步驟I)設(shè)置一個模板的大窗口,所述大窗口將模板中的所有窗口都包羅在內(nèi);步驟2)將模板存儲器數(shù)據(jù)通路讀出的數(shù)據(jù)送到所有運算器中;步驟3)各個運算器判斷該數(shù)據(jù)是否屬于本運算器負責的窗口中的數(shù)據(jù),如果是,則該數(shù)據(jù)參加運算;如果不是,不預(yù)理睬,等待屬于它的數(shù)據(jù)的到來。進一步的,本發(fā)明的實現(xiàn)方法可以用于群相關(guān)計算,也可以用于其它計算,如矩陣的加減乘除等計算。以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1.一種圖像識別中群相關(guān)并行計算的硬件實現(xiàn)方法,其特征在于,包括以下步驟 步驟I)設(shè)置一個模板的大窗口,所述大窗口將模板中的所有窗口都包羅在內(nèi); 步驟2)將模板存儲器數(shù)據(jù)通路讀出的數(shù)據(jù)送到所有運算器中; 步驟3)各個運算器判斷該數(shù)據(jù)是否屬于本運算器負責的窗口中的數(shù)據(jù),如果是,則該數(shù)據(jù)參加運算;如果不是,不預(yù)理睬,等待屬于它的數(shù)據(jù)的到來。
全文摘要
本發(fā)明公開了一種圖像識別中群相關(guān)并行計算的硬件實現(xiàn)方法,其包括以下步驟步驟1)設(shè)置一個模板的大窗口,所述大窗口將模板中的所有窗口都包羅在內(nèi);步驟2)將模板存儲器數(shù)據(jù)通路讀出的數(shù)據(jù)送到所有運算器中;步驟3)各個運算器判斷該數(shù)據(jù)是否屬于本運算器負責的窗口中的數(shù)據(jù),如果是,則該數(shù)據(jù)參加運算;如果不是,不預(yù)理睬,等待屬于它的數(shù)據(jù)的到來。本發(fā)明在不增加訪問存儲器通路的情況下大大提高了計算的并行度,提高了計算速度。
文檔編號G06K9/64GK102842048SQ20111016515
公開日2012年12月26日 申請日期2011年6月20日 優(yōu)先權(quán)日2011年6月20日
發(fā)明者鞠怡明, 易凱 申請人:蘇州科雷芯電子科技有限公司