專利名稱:對圖像進行分類的方法和設備的制作方法
技術領域:
本發(fā)明涉及對視頻或圖像的分類(包含對象/不包含對象),即視頻或圖像中對象的檢測或識別,尤其涉及生成用于區(qū)分視頻或圖像中是否包含所要檢測的對象的分類器的方法和設備,以及用所生成的分類器對圖像進行分類的方法和設備。
背景技術:
隨著視頻監(jiān)控、人工智能、計算機視覺等應用的不斷普及,對檢測視頻和圖像中出現(xiàn)的特定對象,例如人、動物、車輛等等的技術的需求日益增加。在用于檢測視頻或者圖像中的對象的方法中,已知有一類方法是采用靜態(tài)圖像特征來建立用于區(qū)分視頻或圖像中是包含對象還是非對象的分類器,從而用該分類器來對圖像進行分類,即在圖像中檢測對象, 其中對于視頻,將每一幀視為一幅圖像來進行檢測。Paul Viola 禾口 Michael Jones 在"Robust Real-time Object Detection,,, Second International Workshop On Statistical And ComputationalTheories Of Vision-Modeling,Learning,Computing,And Sampling,Vancouver,Canada,July 13,2001 中公開了一種這樣的技術。在Paul Viola等人的技術中,從圖像中提取矩形塊的像素和之間的差作為特征,通過AdaBoost方法從所提取的特征中選擇更適合用來區(qū)分對象和非對象的特征來形成弱分類器,并且通過融合弱分類器來形成強分類器。這類方法比較適合在圖像中檢測例如人臉這樣的對象,但是對于例如人這樣的對象的檢測的魯棒性則不是很尚ο
發(fā)明內(nèi)容
鑒于現(xiàn)有技術的上述不足,本發(fā)明旨在提供一種生成分類器的方法、設備和對圖像進行分類的方法和設備,以提高圖像中對象檢測的魯棒性。本發(fā)明的一個實施例是一種生成用于區(qū)分對象圖像和非對象圖像的分類器的方法,包括從輸入圖像中提取特征向量,其中所述特征向量包括多個第一候選特征,每個所述第一候選特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的候選組合相對應,每個所述第一候選特征的提取包括獲得相應候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和相應候選組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在相應候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和,以作為所述第一候選特征;以及根據(jù)所述提取的特征向量訓練出所述分類器。本發(fā)明的另一個實施例是一種生成用于區(qū)分對象圖像和非對象圖像的分類器的設備,所述設備從輸入圖像中提取特征向量,其中所述特征向量包括多個第一候選特征,每個所述第一候選特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的候選組合相對應,并且所述設備包括差計算單元,其針對每個所述第一候選特征,獲得相應候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和相應候選組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量,并且獲得所述第一差向量和第二差向量在相應候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及特征計算單元,其獲得所述第一投影差向量和第二投影差向量的大小的和,以作為所述第一候選特征;以及訓練單元,根據(jù)所述提取的特征向量訓練出所述分類器。根據(jù)本發(fā)明的上述實施例,分別基于沿兩個方向布置的區(qū)域的像素來計算第一差向量和第二差向量,使得所提取的特征能夠更加真實地反映相應圖像部分中對象邊緣的分布。此外,通過不同的預定取向來假設對象局部的各種可能的邊緣取向,能夠進一步提高分類器的魯棒性。進一步地,在上述方法和設備中,特征向量還可以包括至少一個第二候選特征,每個所述第二候選特征與沿第一軸的方向布置的多個第一區(qū)域、沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的至少兩個候選組合相對應。每個第二候選特征的提取可以包括針對與所述第二候選特征相對應的至少兩個候選組合中的每個候選組合,獲得所述候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述候選組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在所述候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和;以及獲得與所述至少兩個候選組合對應的和的均值或總和,以作為所述第二候選特征。根據(jù)本發(fā)明的上述實施例,每個候選組合的相應特征表征一個對象邊緣,而將至少兩個候選組合的相應特征聯(lián)合起來,則能夠獲得表征至少兩個對象邊緣的單個特征,從而有利于訓練出更加魯棒的分類器。在上述方法和設備中,各區(qū)域可以是矩形區(qū)域,其中第一區(qū)域是相接的,并且第二區(qū)域也是相接的。在上述方法和設備中,在第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均為二,第一區(qū)域是相接的并且第二區(qū)域是相接的情況下,第一軸和第二軸的交點在第一區(qū)域的連接線上或連接點的預定范圍內(nèi),并且在第二區(qū)域的連接線上或連接點的預定范圍內(nèi)。在上述方法和設備中,在第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均為二,第一區(qū)域是間隔開的并且第二區(qū)域是間隔開的情況下,第一軸和第二軸的交點在第一區(qū)域的位置中心之間的中點和第二區(qū)域的位置中心之間的中點的預定范圍內(nèi)。在上述方法和設備中,在第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均為三的情況下,第一軸和第二軸的交點分別在第一區(qū)域中居于中間的第一區(qū)域內(nèi)和第二區(qū)域中居于中間的第二區(qū)域內(nèi)。在上述方法和設備中,至少兩個所述候選組合之間的差別可以包括下述中的一個或多個區(qū)域的相對位置關系、區(qū)域的數(shù)目、區(qū)域的形狀、區(qū)域的大小、區(qū)域的縱橫比。這使得可供考察的特征更加豐富,從而更加利于選擇適合區(qū)分對象和非對象的特征。
在上述方法和設備中,多個預定取向相對于所述第一軸或第二軸旋轉(zhuǎn)的角度范圍可以為O度到180度或0度到360度。在上述方法和設備中,多個預定取向中的相鄰預定取向間的角度可以相同。在上述方法和設備中,可以根據(jù)與第一候選特征對應的候選組合生成至少一個集合,其中每個所述集合包含至少兩個所述候選組合。可以通過以下述方式獲得對應于每個所述集合的第二候選特征,來評估所述第二候選特征的鑒別能力針對所述集合的每個候選組合,獲得所述候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述候選組合的所述多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在所述候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和;以及獲得所述集合的各個候選組合的相應和的均值或總和,以作為所述第二候選特征。在所述第二候選特征的鑒別能力不滿足預定要求的情況下,可以從生成的集合中排除所述集合。之后,可以將每個集合的各個候選組合作為第二候選特征之一的對應候選組合。本發(fā)明的另一個實施例是一種對圖像進行分類的方法,包括從所述圖像中提取特征向量,其中所述特征向量包括多個第一特征,每個所述第一特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的組合相對應,每個所述第一特征的提取包括獲得相應組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和相應組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在相應組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和,以作為所述第一特征;以及根據(jù)所述提取的特征向量,對所述圖像進行分類。本發(fā)明的另一個實施例是一種對圖像進行分類的設備,所述設備從所述圖像中提取特征向量,其中所述特征向量包括多個第一特征,每個所述第一特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的組合相對應,并且所述設備包括差計算單元,其針對每個所述第一特征,獲得相應組合的所述多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和相應組合的所述多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量,并且獲得所述第一差向量和第二差向量在相應組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及特征計算單元,其獲得所述第一投影差向量和第二投影差向量的大小的和,以作為所述第一特征;以及分類單元,其根據(jù)所述提取的特征向量,對所述圖像進行分類。根據(jù)本發(fā)明的上述實施例,分別基于沿兩個方向布置的區(qū)域的像素來計算第一差向量和第二差向量,使得所提取的特征能夠更加真實地反映相應圖像部分中對象邊緣的分布。此外,通過不同的預定取向來假設對象局部的各種可能的邊緣取向,能夠得到具有更強鑒別能力的特征,從而進一步提高分類的魯棒性。在上述方法和設備中,特征向量還可以包括至少一個第二特征,其中每個所述第二特征與沿第一軸的方向布置的多個第一區(qū)域、沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的至少兩個組合相對應。每個第二特征的提取可以包括針對與所述第二特征相對應的至少兩個組合中的每個組合,獲得所述組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量; 獲得所述第一差向量和第二差向量在所述組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和;以及獲得與所述至少兩個組合對應的和的均值或總和,以作為所述第二特征。根據(jù)本發(fā)明的上述實施例,每個組合的相應特征表征一個對象邊緣,而將至少兩個候選組合的相應特征聯(lián)合起來,則能夠獲得表征至少兩個對象邊緣的單個特征,從而增強特征的鑒別能力,有利于提高分類的魯棒性。在上述方法和設備中,各區(qū)域可以是矩形區(qū)域,其中第一區(qū)域是相接的,并且第二區(qū)域是相接的。在上述方法和設備中,在第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均為二,第一區(qū)域是相接的并且第二區(qū)域是相接的情況下,第一軸和第二軸的交點在第一區(qū)域的連接線上或連接點的預定范圍內(nèi),并且在第二區(qū)域的連接線上或連接點的預定范圍內(nèi)。在上述方法和設備中,在第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均為二,第一區(qū)域是間隔開的并且第二區(qū)域是間隔開的情況下,第一軸和第二軸的交點在第一區(qū)域的位置中心之間的中點和第二區(qū)域的位置中心之間的中點的預定范圍內(nèi)。在上述方法和設備中,在第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均為三的情況下,第一軸和第二軸的交點分別在第一區(qū)域中居于中間的第一區(qū)域內(nèi)和第二區(qū)域中居于中間的第二區(qū)域內(nèi)。在上述方法和設備中,至少兩個所述組合之間的差別可以包括下述中的一個或多個區(qū)域的相對位置關系、區(qū)域的數(shù)目、區(qū)域的形狀、區(qū)域的大小、區(qū)域的縱橫比。這使得可供考察的特征更加豐富,從而更加利于選擇適合區(qū)分對象和非對象的特征。在上述方法和設備中,與每個所述第二特征相對應的至少兩個組合能夠形成一個序列,該序列中相鄰組合的預定取向的偏差在預定范圍內(nèi),其各個區(qū)域的覆蓋范圍彼此接近并且所述至少兩個組合所覆蓋的像素彼此不完全相同。在上述方法和設備中,多個預定取向相對于所述第一軸或第二軸旋轉(zhuǎn)的角度范圍可以為0度到180度或0度到360度。在上述方法和設備中,多個預定取向中的相鄰預定取向間的角度可以相同。
參照下面結合附圖對本發(fā)明實施例的說明,會更加容易地理解本發(fā)明的以上和其它目的、特點和優(yōu)點。在附圖中,相同的或?qū)募夹g特征或部件將采用相同或?qū)母綀D標記來表示。在附圖中不必依照比例繪制出單元的尺寸和相對位置。圖1的框圖示出了根據(jù)本發(fā)明一個實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的設備的結構。圖2是示出特征的區(qū)域的布局的例子的示意圖。圖3a示出了對象(人體)的輪廓邊緣的分布的一個例子。
圖北和3c分別示出了基于圖加和2b示出的區(qū)域布局在圖3a示出的部分中確定第一區(qū)域和第二區(qū)域的示意圖。圖如是示出圖3a所示的部分302中所包含的對象輪廓邊緣的示意圖,圖4b是多個預定取向的示意圖,圖4c是示出差向量和投影差向量的示例的圖例,圖4d示出了差向量和投影差向量之間的投影關系的例子。圖5示出了根據(jù)本發(fā)明一個實施例的生成用于區(qū)分對象圖像和非對象圖像的分類器的方法的流程圖。圖6a示出了存在關聯(lián)的候選組合的覆蓋范圍的例子的示意圖,圖6b是示出存在連續(xù)性的對象輪廓邊緣部分的例子的示意圖,圖6c是說明候選組合的取向一致性約束的圖例,圖6d和6e分別示出了相鄰候選組合的預定取向的偏差的例子。圖7示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的設備的框圖。圖8示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的方法的流程圖。圖9示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的方法的流程圖。圖10示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的設備的框圖。圖11示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的方法的流程圖。圖12的框圖示出了根據(jù)本發(fā)明一個實施例的、對圖像進行分類的設備的結構。圖13示出了根據(jù)本發(fā)明一個實施例的、檢測圖像中的對象的方法的流程圖。圖14示出了根據(jù)本發(fā)明一個優(yōu)選實施例的分類方法的流程圖。圖15是示出其中實現(xiàn)本發(fā)明的計算機的示例性結構的框圖。
具體實施例方式下面參照附圖來說明本發(fā)明的實施例。應當注意,為了清楚的目的,附圖和說明中省略了與本發(fā)明無關的、本領域普通技術人員已知的部件和處理的表示和描述。圖1的框圖示出了根據(jù)本發(fā)明一個實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的設備100的結構。如圖1所示,設備100包括差計算單元102、特征計算單元103和訓練單元104。在采用靜態(tài)圖像特征來建立分類器的技術中,收集對象圖像和非對象圖像,從所收集的對象圖像和非對象圖像中提取特征,利用例如AdaBoost方法的篩選方法對提取的特征進行選擇和融合,得到區(qū)分對象圖像和非對象圖像的分類器。在Ding等人的標題為“A Robust Human Face DetectingMethod In Complicated Background Image,,的專禾丨J申請WO 2008/151470中公開了收集和準備這樣的對象圖像和非對象圖像的方法(參見說明書第2 頁至第3頁)。所收集和準備的對象圖像和非對象圖像可作為設備100的輸入圖像。設備 100從多個輸入圖像的每個圖像中提取一組特征作為特征向量。因而,每個圖像提取出一個特征向量VJf1, f2,. . .,fn),然后根據(jù)所提取的向量的集合來訓練出分類器。
對于各個圖像的特征向量而言,其每個維的特征是基于相應圖像的一或多個部分的像素來計算的。在本發(fā)明的實施例中,特征由特征區(qū)域和取向決定。每個特征的計算所基于的像素由若干像素區(qū)域來限定。為便于說明,這里將限定一個特征的計算所基于的像素的像素區(qū)域稱為該特征的特征區(qū)域。相同維的特征的特征區(qū)域是相同的。可以預先確定要提取的特征向量包含哪些特征,以及這些特征中的每個特征與什么樣的特征區(qū)域相對應。一個特征的特征區(qū)域可以包括沿第一軸的方向布置的多個第一區(qū)域和沿與第一軸方向相交(例如,以直角或非直角相交)的第二軸的方向布置的多個第二區(qū)域??蓮牟季趾臀恢脙蓚€方面確定特征的特征區(qū)域。這里所說的布局包括區(qū)域的相對位置關系、區(qū)域的數(shù)目、區(qū)域的形狀、區(qū)域的大小、區(qū)域的縱橫比。第一區(qū)域和第二區(qū)域的布局可以有各種方式。在一個例子中,多個第一區(qū)域的像素的位置的加權平均位置以及多個第二區(qū)域的像素的位置的加權平均位置在所述第一軸和第二軸的交點的預定范圍內(nèi)。具體以第一區(qū)域為例,可以將第一區(qū)域的像素的位置表示為(Xij,yj,其中Xij表示第i個第一區(qū)域中的第j個像素在第一軸(例如X軸)上的座標,Yij表示第i個第一區(qū)域中的第j個像素在第二軸(例如Y軸)上的座標??蓪⒌谝粎^(qū)域的像素的位置的加權平均位置(xa, ya)定義如下
N MiN Mixa =Hxij X W.,ya =ΣΣ少χ 乂
i j i j其中N為第一區(qū)域的數(shù)目,Mi為第i個第一區(qū)域中像素的數(shù)目,Wi為第i個第一區(qū)域的權重,并且 μ=1 進一步地,或可選地,在上述例子中,所有第一區(qū)域的權重可以相同,也可以至少部分地不同。在不相同的情況下,可以為包含的像素較多的第一區(qū)域分配較小的權重,為包含的像素較少的第一區(qū)域分配較大的權重。雖然前面以第一區(qū)域為例對加權平均位置進行了說明,然而上述說明也適用于第二區(qū)域。在另一個例子中,區(qū)域可以是矩形區(qū)域,第一區(qū)域是相接的,并且第二區(qū)域是相接的。圖2是示出特征的特征區(qū)域的布局的例子的示意圖。在圖2中,X軸表示第一軸, Y軸表示第二軸,并且矩形塊的白色和黑色只是用于區(qū)分的目的。雖然圖2中的第一軸和第二軸被示出為相互正交的,然而第一軸和第二軸也可以以非直角的角度相交。此外,第一軸和第二軸的方向可以分別與圖像寬度方向和圖像高度方向一致,或者第二軸和第一軸的方向可以分別與圖像寬度方向和圖像高度方向一致,或者第一軸和第二軸的方向可以相對圖像寬度方向或圖像高度方向旋轉(zhuǎn)預定角度,例如45度的整數(shù)倍。根據(jù)一種區(qū)域布局,第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均為二,第一區(qū)域是相接的并且第二區(qū)域是相接的。在這種布局中,第一軸和第二軸的交點在第一區(qū)域的連接線上或連接點(例如當矩形區(qū)域的頂點相接時)的預定范圍內(nèi)(例如基本重合),并且在第二區(qū)域的連接線上或連接點的預定范圍內(nèi)。圖加和圖2b示出了這種區(qū)域布局的一個例子。具體地,圖加示出了在第一軸方
14向上第一區(qū)域的布置,其中白色矩形塊201和黑色矩形塊202均表示第一區(qū)域并且在連接線上相接,而第一軸和第二軸的交點在連接線上。圖2b示出了在第二軸方向上第二區(qū)域的布置,其中白色矩形塊203和黑色矩形塊204均表示第二區(qū)域并且在連接線上相接,而第一軸和第二軸的交點在連接線上。雖然圖加和圖2b中分別示出了第一軸和第二軸方向上區(qū)域的布置,但實際上反映的是將圖加和圖2b合并,即圖加的第一軸和第二軸分別與圖2b 的第一軸和第二軸相同時的區(qū)域布局??蛇x地,矩形塊201與202,以及矩形塊203與204 可以通過各自的頂點彼此相接。根據(jù)另一種區(qū)域布局,第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均為二,第一區(qū)域是間隔開的并且第二區(qū)域是間隔開的。在這種布置中,第一軸和第二軸的交點在第一區(qū)域的位置中心之間的中點和第二區(qū)域的位置中心之間的中點的預定范圍內(nèi)。圖2c和圖2d示出了這種區(qū)域布局的一個例子。圖2c示出了在第一軸方向上第一區(qū)域的布置,其中白色矩形塊205和黑色矩形塊206均表示第一區(qū)域并且是間隔開的,而第一軸和第二軸的交點在白色矩形塊205和黑色矩形塊206的位置中心之間的中點的預定范圍內(nèi)。圖2d示出了在第二軸方向上第二區(qū)域的布置,其中白色矩形塊207和黑色矩形塊 208均表示第二區(qū)域并且是間隔開的,而第一軸和第二軸的交點在白色矩形塊207和黑色矩形塊208的位置中心之間的中點的預定范圍內(nèi)。雖然圖2c和圖2d中分別示出了第一軸和第二軸方向上區(qū)域的布置,但實際上反映的是將圖2c和圖2d合并,即圖2c的第一軸和第二軸分別與圖2d的第一軸和第二軸相同時的區(qū)域布局。圖2g和圖池示出了這種區(qū)域布局的另一個例子,其中矩形塊的頂點相對。圖2g 示出了在第一軸方向上第一區(qū)域的布置,其中白色矩形塊215和黑色矩形塊216均表示第一區(qū)域并且是間隔開的,而第一軸和第二軸的交點在白色矩形塊215和黑色矩形塊216的位置中心之間的中點的預定范圍內(nèi)。圖池示出了在第二軸方向上第二區(qū)域的布置,其中白色矩形塊217和黑色矩形塊218均表示第二區(qū)域并且是間隔開的,而第一軸和第二軸的交點在白色矩形塊217和黑色矩形塊218的位置中心之間的中點的預定范圍內(nèi)。雖然圖2g 和圖池中分別示出了第一軸和第二軸方向上區(qū)域的布置,但實際上反映的是將圖2g和圖池合并,即圖2g的第一軸和第二軸分別與圖池的第一軸和第二軸相同時的區(qū)域布局。根據(jù)另一種區(qū)域布局,第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均為三。在這種布置中, 第一軸和第二軸的交點分別在第一區(qū)域中居于中間的第一區(qū)域內(nèi)和第二區(qū)域中居于中間的第二區(qū)域內(nèi)。圖加和圖2f示出了這種區(qū)域布局的一個例子。圖加示出了在第一軸方向上第一區(qū)域的布置,其中白色矩形塊210和黑色矩形塊209、211均表示第一區(qū)域,并且第一軸和第二軸的交點在居中的白色矩形塊210內(nèi)。圖2f示出了在第二軸方向上第二區(qū)域的布置, 其中白色矩形塊213和黑色矩形塊212、214均表示第二區(qū)域,并且第一軸和第二軸的交點在居中的白色矩形塊213內(nèi)。雖然圖加和圖2f中分別示出了第一軸和第二軸方向上區(qū)域的布置,但實際上反映的是將圖2e和圖2f合并,即圖加的第一軸和第二軸分別與圖2f的第一軸和第二軸相同時的區(qū)域布局??蛇x地,矩形塊209、210與211,以及矩形塊212、213 與214可以是分離的,而不是相接的。需要注意,第一區(qū)域和第二區(qū)域的形狀并不限于矩形,也可以是其它形狀,例如多邊形、三角形、圓形、環(huán)形、不規(guī)則形狀。第一區(qū)域和第二區(qū)域的形狀也可以是不同的,并且同一特征的特征區(qū)域中,不同第一 /第二區(qū)域的形狀也可以是不同的。另外,在具有矩形形狀的情況下,第一區(qū)域中的不同區(qū)域的邊可以是彼此平行的, 也可以是彼此相對旋轉(zhuǎn)一個角度,例如45度的整數(shù)倍。同樣地,在具有矩形形狀的情況下, 第二區(qū)域中的不同區(qū)域的邊可以是彼此平行的,也可以是彼此相對旋轉(zhuǎn)一個角度,例如45 度的整數(shù)倍。在具有矩形形狀的情況下,矩形區(qū)域的相接包括通過各自的邊來相接(即第一軸和第二軸的交點在這些邊上),和通過各自的角部的頂點相接(即第一軸和第二軸的交點在這些頂點處)。還應注意,第一軸方向上布置的第一區(qū)域和第二軸方向上布置的第二區(qū)域的數(shù)目不限于圖2所示的數(shù)目,并且第一區(qū)域的數(shù)目不必與第二區(qū)域的數(shù)目相同,只要第一區(qū)域的像素的位置的加權平均位置以及第二區(qū)域的像素的位置的加權平均位置在第一軸和第二軸的交點的預定范圍內(nèi)。優(yōu)選地,第一區(qū)域的數(shù)目和第二區(qū)域的數(shù)目均不超過3。還應注意,在同一特征的特征區(qū)域中,第一區(qū)域的相對位置關系和第二區(qū)域的相對位置關系可以是任意的,例如第一軸方向上布置的第一區(qū)域可以是相接的、分離的、部分相接的、部分分離的,第二軸方向上布置的第二區(qū)域可以是相接的、分離的、部分相接的、部分分離的,只要第一區(qū)域的像素的位置的加權平均位置以及第二區(qū)域的像素的位置的加權平均位置在第一軸和第二軸的交點的預定范圍內(nèi)。特征的特征區(qū)域還具有位置屬性,其限定區(qū)域布局所涉及的各個第一區(qū)域和第二區(qū)域在圖像中的位置。這里所說的位置是指整個區(qū)域布局在圖像中的位置。該位置可以用整個區(qū)域布局中或之外的點(例如,特征區(qū)域的幾何中心)在圖像中的位置來表示,但對于具有相同區(qū)域布局的不同特征的特征區(qū)域而言,所述點針對特征區(qū)域的相對位置是固定的。某些特征的特征區(qū)域可能未完全落在圖像內(nèi)。在這樣的情況下,可以為圖像之外的部分的像素指定預定值,例如0,或圖像所有像素的均值。在收集的對象圖像中,對象的輪廓邊緣表現(xiàn)出區(qū)別于非對象的特征。對象的輪廓邊緣在對象圖像中可能具有各種分布。為了能夠提取出足夠的反映對象的輪廓邊緣的特征,不同特征的特征區(qū)域可以涉及不同區(qū)域布局和圖像中的不同位置,以獲得足夠的輪廓邊緣特征。圖3a示出了對象(人體)的輪廓邊緣的分布的一個例子。如圖3a所示,在輸入圖像中,人體的輪廓邊緣存在于例如部分301、302、303的大小不同、位置不同的各個部分中。圖北和3c示出了基于圖加和2b示出的區(qū)域布局在圖3a示出的部分302中確定第一區(qū)域和第二區(qū)域的示意圖。在圖北中,附圖標記304指示第一區(qū)域的布置。在圖3c 中,附圖標記305指示第一區(qū)域的布置。就確定特征向量的每個特征的特征區(qū)域而言,在一個實施例中,可以基于一種區(qū)域布局在輸入圖像的不同位置確定第一區(qū)域和第二區(qū)域(即特征區(qū)域)。接著通過改變這種區(qū)域布局中區(qū)域大小和/或區(qū)域縱橫比來得到新的區(qū)域布局,并且基于新的區(qū)域布局在輸入圖像的不同位置確定第一區(qū)域和第二區(qū)域。重復此過程,直到這種區(qū)域布局的所有可能區(qū)域大小或區(qū)域縱橫比均被嘗試過。另外,或可選地,在上述實施例中,可以通過改變區(qū)域布局中區(qū)域的相對位置關系來得到新的區(qū)域布局。另外,或可選地,在上述實施例中,可以通過改變區(qū)域布局中區(qū)域的數(shù)目來得到新的區(qū)域布局。另外,或可選地,在上述實施例中,可以通過改變區(qū)域布局中區(qū)域的形狀來得到新的區(qū)域布局。基于一種區(qū)域布局在輸入圖像中的一個位置確定的第一區(qū)域和第二區(qū)域決定了一個要提取的特征所基于的特征區(qū)域。概括地講,特征向量中至少兩個特征所基于的特征區(qū)域的區(qū)域布局是不同的。例如,不同區(qū)域布局之間的差別可以包括下述中的一個或多個 區(qū)域的相對位置關系、區(qū)域的數(shù)目、區(qū)域的形狀、區(qū)域的大小、區(qū)域的縱橫比。每個特征區(qū)域的第一區(qū)域和第二區(qū)域基本上覆蓋了圖像中某個位置的部分。在這個圖像部分中,如果存在對象的輪廓邊緣,則輪廓邊緣可能有各種取向??梢灶A先假設圖像部分中對象輪廓邊緣的各種可能取向,根據(jù)假設的取向來提取表征對象輪廓邊緣的特征, 以便能夠在分類器中采用更加有鑒別能力的特征。例如,圖如示出圖3a所示的圖像部分302中所包含的對象輪廓邊緣的示意圖。圖 4b是多個預定取向的示意圖??梢钥闯?,圖4b中的取向402與圖如中示出的對象輪廓邊緣401的取向接近?;谌∠?02來提取特征,能夠較好地表征對象輪廓邊緣401。因此,在本發(fā)明的實施例中,特征向量中同一維的特征由相應特征區(qū)域和多個預定取向之一的組合來決定,也就是說,每個特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與第一軸相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的組合相對應。特征向量的每一維的特征的相應組合可以是根據(jù)上述方法預先確定的,并且由設備100在運行時使用。如果在設備100運行時尚未確定特征向量的每一維的特征的相應組合,設備100可以包含一個確定單元來根據(jù)上述方法確定這些組合。下面對差計算單元102進行說明。由于在訓練出分類器之前所提取的特征并不一定能夠成為分類器所采用的特征,因而這里出于說明清楚的目的將訓練出分類器之前提取的特征和相應的第一區(qū)域、第二區(qū)域與預定取向的組合分別稱為候選特征和候選組合?;氐綀D1,對于輸入圖像,差計算單元102針對要提取的特征向量的每個候選特征,獲得相應候選組合的多個第一區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第一差值),以得到第一軸方向上的第一差向量,和相應候選組合的多個第二區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第二差值),以得到第二軸方向上的第二差向量。差向量的大小為相應差值的絕對值。如果差值為正,則相應差向量的方向為相應軸的方向;如果差值為負,則相應差向量的方向為相應軸的方向的反方向??蛇x地,如果差值為正,則相應差向量的方向為相應軸的方向的反方向;如果差值為負,則相應差向量的方向為相應軸的方向??蛇x地,差向量也可以恒定為相應軸的方向或其反方向,無論差值為正還是負。計算軸向上區(qū)域的像素和或均值(灰度)之間的差值的目的是獲得反映相應軸向上像素灰度的變化的信息。對于不同的區(qū)域布局,可以根據(jù)此目的確定相應的計算差值的方法,只要其能夠反映這種變化。例如在Ding等人的標題為“A Robust Human Face Detecting Method In ComplicatedBackground Image” 的#禾I」串i青 WO 2008/151470 開了根據(jù)單個方向上區(qū)域的布局計算差值的方法(參見說明書第9頁至第10頁)。例如,對于圖加和2b示出的區(qū)域布局,可以通過下式計算第一差值和第二差值第一差值=矩形塊202的像素和或均值-矩形塊201的像素和或均值,
第二差值=矩形塊204的像素和或均值-矩形塊203的像素和或均值。再例如,對于圖2c和2d示出的區(qū)域布局,可以通過下式計算第一差值和第二差值第一差值=矩形塊206的像素和或均值-矩形塊205的像素和或均值,第二差值=矩形塊208的像素和或均值-矩形塊207的像素和或均值。再例如,對于圖示出的區(qū)域布局,可以通過下式計算第一差值和第二差值第一差值=矩形塊209的像素和或均值+矩形塊211的像素和或均值-矩形塊 210的像素和或均值X2,第二差值=矩形塊212的像素和或均值+矩形塊214的像素和或均值-矩形塊 213的像素和或均值X2。再例如,對于圖2g和池示出的區(qū)域布局,可以通過下式計算第一差值和第二差值第一差值=矩形塊216的像素和或均值-矩形塊215的像素和或均值,第二差值=矩形塊218的像素和或均值-矩形塊217的像素和或均值。圖如是示出差向量的示例的圖例。在圖如的例子中,假設一個要提取的候選特征的相應候選組合包括由圖加和2b所示的區(qū)域布局和圖3a所示的位置302確定的特征區(qū)域和圖4b所示的取向402,并且還假設如果差值為正,則相應差向量的方向為相應軸的方向; 如果差值為負,則相應差向量的方向為相應軸的方向的反方向。由于在部分302中右上部分的像素較暗,即灰度值較低,而左下部分的像素較亮,即灰度值較高,所以當根據(jù)下式第一差值=矩形塊202的像素和或均值-矩形塊201的像素和或均值,第二差值=矩形塊204的像素和或均值-矩形塊203的像素和或均值,計算的第一差值和第二差值均為負。相應地,得到的第一差向量和第二差向量分別如圖4c中向量 403和404所示?;氐綀D1,相應地,差計算單元102獲得第一差向量和第二差向量在相應候選組合的預定取向的直線上的第一投影差向量和第二投影差向量。這里的差向量和投影差向量之間可以存在任何投影關系,包括但不限于正投影關系和斜投影關系,只要滿足差向量的大小越大,則投影差向量的大小就越大的關系即可。圖如也示出了差向量的投影差向量的例子。如圖如所示,向量405和406分別是差向量403和404在候選組合的預定取向402的直線上的投影差向量。在一個具體例子,多個預定取向相對于第一軸或第二軸旋轉(zhuǎn)的角度范圍可以為0 度到180度。所述旋轉(zhuǎn)可以是順時針或逆時針的。進一步地,多個預定取向中的相鄰預定取向間的角度相同,在一個具體例子中為15度,于是這些預定取向分別為相對于第一軸或第二軸旋轉(zhuǎn)0度、15度、30度、45度、…、120度、…、165度。在旋轉(zhuǎn)角度范圍為0度到180 度的情況下,取向被認為是無方向的,因為在取向的直線上不區(qū)分兩個方向。在一個具體例子,多個預定取向相對于第一軸或第二軸旋轉(zhuǎn)的角度范圍可以為0 度到360度。所述旋轉(zhuǎn)可以是順時針或逆時針的。進一步地,多個預定取向中的相鄰預定取向間的角度相同,在一個具體例子中為15度,于是這些預定取向分別為相對于第一軸或第二軸旋轉(zhuǎn)0度、15度、30度、45度、…、120度、…、165度、…、345度。在旋轉(zhuǎn)角度范圍為0度到180度的情況下,取向被認為是有方向的,因為同一直線可以有兩個不同的取向。在圖4d所示的一個具體例子中,令dx和dy分別表示第一差向量和第二差向量, pdx和pdy分別表示第一投影差向量和第二投影差向量,α表示相對于第一軸逆時針旋轉(zhuǎn)的角度,于是,pdx = dx * cos(a )pdy = dy * sin ( a )?;氐綀D1,特征計算單元103獲得第一投影差向量和第二投影差向量的大小的和, 以作為候選特征。在取向為無方向的情況下,投影差向量的大小可以均為正值或均為負值, 或者,也可以求出兩個投影差向量的和向量,并且以和向量的大小作為結果。在取向為有方向的情況下,如果投影差向量的方向與取向的方向一致,則其大小為正值,否則其大小為負值,反之亦然。訓練單元104根據(jù)所提取的特征向量訓練出分類器??衫靡阎姆椒▉碛柧毘龇诸惼?。例如可采用SVM(支持向量機)方法或AdaBoost方法。在訓練分類器的過程中, 特征向量的某些維的候選特征會因鑒別能力較差而被淘汰,而保留下來被分類器采用的特征的相應候選組合會被用于對象分類或檢測應用的特征提取。圖5示出了根據(jù)本發(fā)明一個實施例的生成用于區(qū)分對象圖像和非對象圖像的分類器的方法500的流程圖。如圖5所示,方法500從步驟501開始。步驟503、505和507用于從當前輸入圖
像中提取一組候選特征作為特征向量。在步驟503,對于輸入圖像,針對要提取的特征向量的每個候選特征,獲得相應候選組合的多個第一區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第一差值),以得到第一軸方向上的第一差向量,和相應候選組合的多個第二區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第二差值),以得到第二軸方向上的第二差向量。差向量的大小為相應差值的絕對值。如果差值為正,則相應差向量的方向為相應軸的方向;如果差值為負,則相應差向量的方向為相應軸的方向的反方向??蛇x地,如果差值為正,則相應差向量的方向為相應軸的方向的反方向;如果差值為負,則相應差向量的方向為相應軸的方向??蛇x地,差向量也可以恒定為相應軸的方向或其反方向,無論差值為正還是負。如參照圖1所描述的,可通過Ding等人的標題為“A Robust HumanFace Detecting Method In Complicated Background Image” 的專利申請 WO 2008/151470 中公開的方法 (參見說明書第2頁至第3頁)來收集和準備包括對象圖像和非對象圖像的輸入圖像。候選組合可以是前面結合生成分類器的設備的實施例說明的候選組合。特征向量的每一維的特征的相應候選組合可以是根據(jù)前面結合生成分類器的設備的實施例說明的方法預先確定的,并且在執(zhí)行方法500時使用。如果在執(zhí)行方法500時尚未確定特征向量的每一維的特征的相應候選組合,則方法500可以在步驟503之前包含一個根據(jù)前面結合生成分類器的設備的實施例說明的方法確定這些候選組合的步驟。計算軸向上區(qū)域的像素和或均值(灰度)之間的差值的目的是獲得反映相應軸向上像素灰度的變化的信息。對于不同的區(qū)域布局,可以根據(jù)此目的確定相應的計算差值的方法,只要其能夠反映這種變化。例如在Ding等人的標題為“A Robust Human Face
19Detecting Method In ComplicatedBackground Image” 的#禾I」串i青 WO 2008/151470 開了根據(jù)單個方向上區(qū)域的布局計算差值的方法(參見說明書第9頁至第10頁)。再例如,可采用前面結合圖2的示例說明的計算方法。在步驟505,獲得第一差向量和第二差向量在相應候選組合的預定取向的直線上的第一投影差向量和第二投影差向量。這里的差向量和投影差向量之間可以存在任何投影關系,包括但不限于正投影關系和斜投影關系,只要滿足差向量的大小越大,則投影差向量的大小就越大的關系即可。在一個具體例子,多個預定取向相對于第一軸或第二軸旋轉(zhuǎn)的角度范圍可以為O 度到180度。所述旋轉(zhuǎn)可以是順時針或逆時針的。進一步地,多個預定取向中的相鄰預定取向間的角度相同,在一個具體例子中為15度,于是這些預定取向分別為相對于第一軸或第二軸旋轉(zhuǎn)0度、15度、30度、45度、…、120度、…、165度。在旋轉(zhuǎn)角度范圍為0度到180 度的情況下,取向被認為是無方向的,因為在取向的直線上不區(qū)分兩個方向。在一個具體例子,多個預定取向相對于第一軸或第二軸旋轉(zhuǎn)的角度范圍可以為0 度到360度。所述旋轉(zhuǎn)可以是順時針或逆時針的。進一步地,多個預定取向中的相鄰預定取向間的角度相同,在一個具體例子中為15度,于是這些預定取向分別為相對于第一軸或第二軸旋轉(zhuǎn)0度、15度、30度、45度、…、120度、…、165度、…、345度。在旋轉(zhuǎn)角度范圍為0度到180度的情況下,取向被認為是有方向的,因為同一直線可以有兩個不同的取向。接著在步驟507,獲得第一投影差向量和第二投影差向量的大小的和,以作為候選特征。在取向為無方向的情況下,投影差向量的大小可以均為正值或均為負值,或者,也可以求出兩個投影差向量的和向量,并且以和向量的大小作為結果。在取向為有方向的情況下,如果投影差向量的方向與取向的方向一致,則其大小為正值,否則其大小為負值,反之亦然。接著在步驟509,確定對于當前輸入圖像,是否存在未提取的候選特征。如果存在, 則返回步驟503,以執(zhí)行提取下一個候選特征的過程;否則,執(zhí)行步驟511。在步驟511,確定是否還有未提取特征向量的輸入圖像。如果有,則返回步驟503, 以執(zhí)行提取下一個輸入圖像的特征向量的過程;否則,方法前進到步驟513。在步驟513,根據(jù)所提取的特征向量訓練出分類器??衫靡阎姆椒▉碛柧毘龇诸惼鳌@缈刹捎肧VM(支持向量機)方法或AdaBoost方法。在訓練分類器的過程中,特征向量的某些維的候選特征會因鑒別能力較差而被淘汰,而保留下來被分類器采用的特征的相應候選組合會被用于對象分類或檢測應用的特征提取。方法500在步驟515結束。在前面描述的實施例中,所提取的特征向量由孤立的候選特征組成。事實上,由于對象輪廓邊緣的連續(xù)性,某些特征之間存在著關聯(lián)。圖6a示出了這種關聯(lián)的一個例子。如圖6a所示,存在三個組合,其各自的特征區(qū)域的大致的覆蓋范圍如塊601、602和603所示。 這三個塊覆蓋了對象從右肩到右上臂的輪廓邊緣部分。圖6b更加清楚地示出了這三個塊覆蓋的對象輪廓邊緣部分604、605和606。通過圖6a和6b可以看出,這三個塊所覆蓋的輪廓邊緣反映了對象輪廓邊緣的連續(xù)性。如果將這三個塊所反映的特征關聯(lián)起來以提取出能夠反映這種輪廓邊緣連續(xù)性的特征,則其鑒別能力顯然會強過三個孤立的特征。雖然通過訓練過程的篩選和融合能夠?qū)㈣b別能力較強的孤立特征結合起來,然而這種訓練過程無法發(fā)現(xiàn)和利用反映對象輪廓邊緣連續(xù)性的多個特征之間的這種關聯(lián)。對于前面描述的生成用于區(qū)分對象圖像和非對象圖像的分類器的設備,為了利于發(fā)現(xiàn)和利用反映對象輪廓邊緣連續(xù)性的多個特征之間的這種關聯(lián),除了預先準備或由確定單元確定的候選組合之外,還預先準備或由確定單元確定至少一個集合,每個集合包含這些候選組合中的至少兩個候選組合。相應地,所提取的特征向量還包括與每個這樣的集合相對應的候選特征(也稱作聯(lián)合候選特征)。在圖1所示的實施例的進一步改進中,除了如前所述針對每個孤立候選特征獲得與該候選特征相對應第一投影差向量和第二投影差向量之外,進一步地,差計算單元102 針對每個聯(lián)合候選特征,獲得與該聯(lián)合候選特征相對應的集合的每個候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到第一軸方向上的第一差向量,和該候選組合的多個第二區(qū)域的像素和或均值之間的差值,以得到第二軸方向上的第二差向量,并且獲得第一差向量和第二差向量在候選組合的預定取向的直線上的第一投影差向量和第二投影差向量。這里,對于集合中的每個候選組合,差計算單元102獲得相應第一差向量、第二差向量、第一投影差向量和第二投影差向量的方法與前面描述的差計算單元102獲得孤立候選組合的相應第一差向量、第二差向量、第一投影差向量和第二投影差向量的方法相同,因此不再重復說明。除了如前所述針對每個孤立候選特征獲得與該候選特征相對應第一投影差向量與第二投影差向量的大小的和之外,進一步地,對于差計算單元102獲得的分別與每個集合的各個候選組合相對應的各個第一投影差向量和第二投影差向量對,特征計算單元103 分別獲得每對第一投影差向量和第二投影差向量的大小的和。特征計算單元103獲得每對第一投影差向量和第二投影差向量的大小的和的方法與前面描述的特征計算單元103獲得孤立候選組合的相應第一投影差向量和第二投影差向量的大小的和的方法相同,因此不再重復說明。此外,特征計算單元103獲得與每個集合的各個候選組合對應的和(即各對第一投影差向量和第二投影差向量的大小的和)的均值或總和,以作為與該集合對應的聯(lián)合候選特征。上述總和也可以是加權和,其中可以為覆蓋的像素較多的候選組合的相應和分配較小的權重,為覆蓋的像素較少的候選組合的相應和分配較大的權重。訓練單元104的處理與前面描述的相同,因此不再重復說明。在上述實施例中,各個集合包含的內(nèi)容是候選組合的簡單組合。事實上,聯(lián)合候選特征所反映的對象輪廓邊緣不宜過長,即集合中包含的候選組合的數(shù)目不宜過多,否則會有損特征的代表性,從而降低特征的鑒別能力。因此,在一個優(yōu)選實施例中,每個集合所包含的候選組合的數(shù)目被限制在某個閾值以下。該閾值例如為5到10。另外,由于對象輪廓邊緣的連續(xù)性,每個集合的各個候選組合所覆蓋的圖像部分不宜相距過遠。因此,在一個優(yōu)選實施例中,可以將每個集合包含的候選組合約束為每個候選組合的覆蓋區(qū)域與至少一個其它候選組合的覆蓋區(qū)域的間距在某個閾值以下,即彼此接近。間距例如可以用覆蓋區(qū)域的幾何中心間的距離來衡量。閾值的選擇應考慮到覆蓋區(qū)域的大小。對于較小的覆蓋區(qū)域, 閾值相應較小。對于較大的覆蓋區(qū)域,閾值相應較大。在上述實施例中,在確定每個集合包含的候選組合時,在反映對象輪廓邊緣連續(xù)性的多個特征之間的關聯(lián)方面施加的限制較少。因而,可能有相當數(shù)量的集合所包含的候選組合并未反映這種關聯(lián)。這可能限制分類器性能的提高。一種簡單的改進是增加集合的數(shù)目,但這樣可能會增加工作量,降低效率。圖7示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的設備700的框圖。如圖7所示,設備700包括差計算單元702、特征計算單元703、訓練單元704、搜索單元705和過濾單元706。組合信息701包含如前面結合生成分類器的設備和方法的實施例描述的孤立候選組合。搜索單元105從組合信息701的孤立候選組合中搜索至少一個集合。每個集合包含滿足下述條件的至少兩個孤立候選組合1)各個候選組合能夠形成一個序列,該序列中相鄰候選組合的預定取向的偏差在預定范圍(例如45度、90度)內(nèi)并且其各個區(qū)域(第一區(qū)域和第二區(qū)域)的覆蓋范圍(即候選組合的覆蓋區(qū)域)彼此接近;幻不同的孤立候選組合所覆蓋的像素彼此不完全相同。在本文中,假設存在沿相鄰候選組合中在前候選組合的預定取向并且穿過在前候選組合的覆蓋區(qū)域的幾何中心Gl的直線Li,以及沿相鄰候選組合中在后候選組合的預定取向并且穿過在后候選組合的覆蓋區(qū)域的幾何中心G2的直線L2,并且直線Ll和L2的交點為C。上述相鄰候選組合的預定取向的偏差是指從交點C開始沿從幾何中心Gl到交點C 的方向延伸的邊與從交點C開始沿從交點C到幾何中心G2的方向延伸的邊所夾的角。圖 6d和6e分別示出了這樣的偏差的例子,其中圓點610表示在前候選組合的覆蓋區(qū)域的幾何中心Gl,線611表示直線Li,圓點614表示在后候選組合的覆蓋區(qū)域的幾何中心G2,線613 表示直線L2,圓點612表示直線Ll和L2的交點,角δ表示從交點C開始沿從幾何中心Gl 到交點C的方向延伸的邊與從交點C開始沿從交點C到幾何中心G2的方向延伸的邊所夾的角,即相鄰候選組合的預定取向的偏差。條件1)利于提高聯(lián)合候選特征反映對象輪廓邊緣連續(xù)性的可能性。連續(xù)的對象輪廓邊緣的各個部分通常具有邊緣取向的一致性。在條件1)中通過序列中相鄰候選組合的預定取向的偏差在預定范圍內(nèi)的約束來表征這種一致性。圖6c結合圖6b的示例說明了這種約束。在圖6c中,覆蓋區(qū)域601的相應候選組合、覆蓋區(qū)域602的相應候選組合和覆蓋區(qū)域603的相應候選組合形成一個序列。該序列中,覆蓋區(qū)域601的相應候選組合與覆蓋區(qū)域602的相應候選組合相鄰,并且其取向607和608的偏差在45度內(nèi)。此外,覆蓋區(qū)域602的相應候選組合與覆蓋區(qū)域603的相應候選組合相鄰,并且其取向608和609的偏差在45度內(nèi)。對于條件1),可以通過使相鄰候選組合的覆蓋區(qū)域之間的間距保持在某個閾值以下來保證彼此接近。間距例如可以用覆蓋區(qū)域的幾何中心間的距離來衡量。閾值的選擇應考慮到覆蓋區(qū)域的大小。對于較小的覆蓋區(qū)域,閾值相應較小。對于較大的覆蓋區(qū)域,閾值相應較大。條件幻的目的在于避免同一集合內(nèi)不同候選組合的覆蓋區(qū)域彼此重合或一個覆蓋區(qū)域被另一個覆蓋區(qū)域包含,即避免冗余。在一個簡單實現(xiàn)中,搜索單元705可以先獲得各個集合,然后根據(jù)條件1)至2)來過濾不符合條件的集合。
為提高搜索效率,可選地,搜索單元705可以以各個候選組合為種子,嘗試將種子與其它候選組合組成滿足條件1)至幻的序列。此外,搜索單元705可以以獲得的序列為種子,從序列的兩端開始嘗試加入其它候選組合以組成滿足條件1)至幻的新序列。上述過程可以迭代執(zhí)行,直到序列不能繼續(xù)增長或達到預定長度限制。上述迭代過程可稱為序列的生長。過濾單元706將作為搜索結果的每個集合包含在組合信息701中,以用于提取相應的聯(lián)合候選特征。差計算單元702針對組合信息701中的每個孤立候選特征獲得與該候選特征相對應第一投影差向量和第二投影差向量。這個方面的處理與前面結合生成分類器的設備的實施例描述的處理相同,因此不再重復說明。進一步地,差計算單元702針對組合信息701中的每個集合,獲得與該集合的每個候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到第一軸方向上的第一差向量,和該候選組合的多個第二區(qū)域的像素和或均值之間的差值,以得到第二軸方向上的第二差向量,并且獲得第一差向量和第二差向量在該候選組合的預定取向的直線上的第一投影差向量和第二投影差向量。這里,對于集合中的每個候選組合,差計算單元702獲得相應第一差向量、第二差向量、第一投影差向量和第二投影差向量的方法與前面描述的差計算單元102獲得孤立候選組合的相應第一差向量、第二差向量、第一投影差向量和第二投影差向量的方法相同,因此不再重復說明。特征計算單元703針對組合信息701中的每個孤立候選特征獲得與該候選特征相對應第一投影差向量與第二投影差向量的大小的和。這個方面的處理與前面結合生成分類器的設備的實施例描述的處理相同,因此不再重復說明。進一步地,對于差計算單元702獲得的分別與每個集合的各個候選組合相對應的各個第一投影差向量和第二投影差向量對,特征計算單元703分別獲得每對第一投影差向量和第二投影差向量的大小的和。特征計算單元703獲得每對第一投影差向量和第二投影差向量的大小的和的方法與前面描述的特征計算單元103獲得孤立候選組合的相應第一投影差向量和第二投影差向量的大小的和的方法相同,因此不再重復說明。此外,特征計算單元703獲得與每個集合的各個候選組合對應的和(即各對第一投影差向量和第二投影差向量的大小的和)的均值或總和,以作為與該集合對應的聯(lián)合候選特征。訓練單元704的處理與前面描述的相同,因此不再重復說明。圖8示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的方法800的流程圖。如圖8所示,方法800從步驟801開始。在步驟803,對于輸入圖像,針對每個孤立候選組合或每個集合的每個候選組合, 獲得相應候選組合的多個第一區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第一差值),以得到第一軸方向上的第一差向量,和相應候選組合的多個第二區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第二差值),以得到第二軸方向上的第二差向量。在步驟805,獲得第一差向量和第二差向量在相應候選組合的預定取向的直線上的第一投影差向量和第二投影差向量。接著在步驟807,獲得第一投影差向量和第二投影差向量的大小的和。
接著在步驟808,確定所計算的和的相應候選組合是孤立候選組合還是集合的候選組合。如果是孤立候選組合,則將計算的和作為候選特征,并且前進到步驟809。否則,在步驟817確定集合中是否還有未處理的候選組合。如果有,則返回步驟803以針對下一未處理的候選組合進行計算。否則,前進到步驟819計算集合的各個候選組合的相應和的均值或總和,以作為該集合的相應聯(lián)合候選特征。然后前進到步驟809。在步驟809,確定對于當前輸入圖像,是否存在未提取的候選特征。如果存在,則返回步驟803,以執(zhí)行提取下一個候選特征的過程;否則,執(zhí)行步驟811。在步驟811,確定是否還有未提取特征向量的輸入圖像。如果有,則返回步驟803, 以執(zhí)行提取下一個輸入圖像的特征向量的過程;否則,方法前進到步驟813。在步驟813,根據(jù)所提取的特征向量訓練出分類器。方法800在步驟815結束。圖9示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的方法900的流程圖。如圖9所示,方法900從步驟901開始。在步驟902-1,從組合信息的孤立候選組合中搜索至少一個集合。每個集合包含滿足下述條件的至少兩個孤立候選組合1)各個候選組合能夠形成一個序列,該序列中相鄰候選組合的預定取向的偏差在預定范圍(例如45度、90度)內(nèi)并且其各個區(qū)域(第一區(qū)域和第二區(qū)域)的覆蓋范圍(即候選組合的覆蓋區(qū)域)彼此接近;幻不同的孤立候選組合所覆蓋的像素彼此不完全相同。在一個簡單實現(xiàn)中,可以先獲得各個集合,然后根據(jù)條件1)至幻來過濾不符合條件的集合。為提高搜索效率,可選地,可以以各個候選組合為種子,嘗試將種子與其它候選組合組成滿足條件1)至幻的序列。此外,可以以獲得的序列為種子,從序列的兩端開始嘗試加入其它候選組合以組成滿足條件1)至幻的新序列。上述過程可以迭代執(zhí)行,直到序列不能繼續(xù)增長或達到預定長度限制。上述迭代過程可稱為序列的生長。接著在步驟902-3,將作為搜索結果的每個集合包含在組合信息中,以用于提取相應的聯(lián)合候選特征。其它步驟903、905、907、908、909、911、913、915、917、919分別與圖 8 的方法中的步驟 803、805、807、808、809、811、813、815、817、819 相同,因此不再重復說明。圖10示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的設備的框圖。如圖10所示,設備1000包括差計算單元1002、特征計算單元1003、訓練單元 1004、搜索單元1005、過濾單元1006和評估單元1007。組合信息1001包含如前面結合生成分類器的設備和方法的實施例描述的孤立候選組合。差計算單元1002、特征計算單元1003、訓練單元1004和搜索單元1005分別與圖 7的實施例中的差計算單元702、特征計算單元703、訓練單元704和搜索單元705相同,因此不再重復說明。
對于搜索單元1005搜索到的每個集合,評估單元1007可獲得對應于每個集合的聯(lián)合候選特征,來評估聯(lián)合候選特征的鑒別能力。如圖10所示,評估單元1007可通過差計算單元1002和特征計算單元1003來獲得聯(lián)合候選特征?;蛘撸u估單元1007也可包含差計算單元1002和特征計算單元1003用于提取聯(lián)合候選特征的功能。可以采用已知的評估方法來評估聯(lián)合候選特征的鑒別能力。例如根據(jù)從樣本圖像中提取的聯(lián)合候選特征來構造分類器,并且通過樣本圖像來統(tǒng)計分類器的出錯率,以衡量鑒別能力。過濾單元1006在聯(lián)合候選特征的鑒別能力滿足預定要求的情況下,將該集合包含在組合信息1001中。否則,過濾單元1006從搜索到的集合中排除該集合。在圖10所示的設備的一種變型中,可以將搜索單元1005改變?yōu)楦鶕?jù)與孤立候選特征對應的孤立候選組合生成至少一個集合,其中每個集合包含至少兩個孤立候選組合。評估單元1007可獲得對應于每個集合的聯(lián)合候選特征,來評估聯(lián)合候選特征的鑒別能力。評估單元1007可通過差計算單元1002和特征計算單元1003來獲得聯(lián)合候選特征?;蛘撸u估單元1007也可包含差計算單元1002和特征計算單元1003用于提取聯(lián)合候選特征的功能。過濾單元1006可以在聯(lián)合候選特征的鑒別能力不滿足預定要求的情況下,從生成的集合中排除所評估的集合,并且將每個滿足預定要求的集合的各個孤立候選組合作為聯(lián)合候選特征之一的對應孤立候選組合,即將該集合包含在組合信息1001中。在這個變型中,去除了前面條件1)和2、的要求,因而能夠獲得表征對象輪廓中非連續(xù)的多個局部邊緣的特征。當然,可以增量、迭代地生成集合、評估鑒別能力和過濾集合。圖11示出了根據(jù)本發(fā)明一個優(yōu)選實施例的、生成用于區(qū)分對象圖像和非對象圖像的分類器的方法1100的流程圖。如圖11所示,方法1100從步驟1101開始。步驟1102-1與圖9的方法中的步驟902_1相同,因此不再重復說明。在步驟1102-2,對于步驟1102-1搜索到的每個集合,獲得對應于每個集合的聯(lián)合候選特征,來評估聯(lián)合候選特征的鑒別能力??赏ㄟ^與步驟1103、1105、1107、1108、1117和 1119同樣的功能來獲得聯(lián)合候選特征。可以采用已知的評估方法來評估聯(lián)合候選特征的鑒別能力。例如根據(jù)從樣本圖像中提取的聯(lián)合候選特征來構造分類器,并且通過樣本圖像來統(tǒng)計分類器的出錯率,以衡量鑒別能力。在步驟1102-3,在聯(lián)合候選特征的鑒別能力滿足預定要求的情況下,將該集合包含在組合信息1001中。否則,過濾單元1006從搜索到的集合中排除該集合。其它步驟1103、1105、1107、1108、1109、1111、1113、1115、1117、1119 分別與圖 9 的方法中的步驟903、905、907、908、909、911、913、915、917、919相同,因此不再重復說明。在圖11所示的方法的一種變型中,可以將步驟1102-1改變?yōu)楦鶕?jù)與孤立候選特征對應的孤立候選組合生成至少一個集合,其中每個集合包含至少兩個孤立候選組合。在步驟1102-2,對于步驟1102-1搜索到的每個集合,獲得對應于每個集合的聯(lián)合候選特征,來評估聯(lián)合候選特征的鑒別能力。在步驟1102-3,在第聯(lián)合選特征的鑒別能力不滿足預定要求的情況下,從生成的集合中排除所評估的集合,并且將每個滿足預定要求的集合的各個孤立候選組合作為聯(lián)合
25候選特征之一的對應孤立候選組合,即將該集合包含在組合信息1001中。在這個變型中,去除了前面條件1)和幻的要求,因而能夠獲得表征對象輪廓中非連續(xù)的多個局部邊緣的特征。當然,可以增量、迭代地生成集合、評估鑒別能力和過濾集合。在前面的實施例中,首先搜索出作為候選的集合,然后再進行評估和過濾。優(yōu)選地,可以在搜索過程中逐步生長,每當生長出新序列(即集合)時就進行評估和過濾。如此迭代執(zhí)行,直到滿足迭代終止條件,例如達到預定迭代次數(shù)、找到預定數(shù)目的集合、不能生長出新集合、等等。另外,由于生長是在序列的兩端進行的,這樣可能會錯過一些可能的集合。優(yōu)選地,可以在生長過程中通過從序列中去除兩端中未生長的一端的候選組合來獲得新集合。對于多個獲得的新集合,可以保留其中鑒別能力較優(yōu)的新集合,并且淘汰其它新集
I=I O下面會說明對圖像進行分類的設備和方法的實施例。經(jīng)過訓練而得到的分類器所采用的候選特征的相應孤立候選組合和集合被保留在組合信息中。在對圖像進行分類的設備和方法的實施例使用了該組合信息。在下面的說明中,也將組合信息中保留的孤立候選組合和集合中的候選組合稱為孤立組合和集合的組合。也將候選特征和聯(lián)合候選特征稱為特征和聯(lián)合特征。圖12的框圖示出了根據(jù)本發(fā)明一個實施例的、對圖像進行分類的設備1200的結構。如圖12所示,設備1200包括差計算單元1202、特征計算單元1203和分類單元 1204。輸入設備1200的圖像可以是通過掃描窗口從要處理的圖像中獲得預定尺寸的圖 象。"STililiDing·入白勺豐示||》“A Robust Human FaceDetecting Method In Complicated Background Image”的專利申請W02008/151470中描述的方法來獲得圖像(參見說明書第 5頁)。要從輸入圖像中提取的特征向量所包含的特征由組合信息中包含的孤立組合和
集合決定ο對于輸入圖像,差計算單元1202針對要提取的特征向量的每個特征,獲得相應組合的多個第一區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第一差值),以得到第一軸方向上的第一差向量,和相應組合的多個第二區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第二差值),以得到第二軸方向上的第二差向量。差向量的大小為相應差值的絕對值。如果差值為正,則相應差向量的方向為相應軸的方向;如果差值為負,則相應差向量的方向為相應軸的方向的反方向??蛇x地,如果差值為正,則相應差向量的方向為相應軸的方向的反方向;如果差值為負,則相應差向量的方向為相應軸的方向??蛇x地,差向量也可以恒定為相應軸的方向或其反方向,無論差值為正還是負。計算軸向上區(qū)域的像素和或均值(灰度)之間的差值的目的是獲得反映相應軸向上像素灰度的變化的信息。對于不同的區(qū)域布局,可以根據(jù)此目的確定相應的計算差值的方法,只要其能夠反映這種變化。例如在Ding等人的標題為“A Robust Human Face Detecting Method In Comp 1 icatedBackground Image” 的#禾I」串i青 WO 2008/151470開了根據(jù)單個方向上區(qū)域的布局計算差值的方法(參見說明書第9頁至第10頁)。再例如,可采用前面結合圖2的示例說明的計算方法。相應地,差計算單元1202獲得第一差向量和第二差向量在相應組合的預定取向的直線上的第一投影差向量和第二投影差向量。這里的差向量和投影差向量之間可以存在任何投影關系,包括但不限于正投影關系和斜投影關系,只要滿足差向量的大小越大,則投影差向量的大小就越大的關系即可。特征計算單元1203獲得第一投影差向量和第二投影差向量的大小的和,以作為孤立特征。在取向為無方向的情況下,投影差向量的大小可以均為正值或均為負值,或者, 也可以求出兩個投影差向量的和向量,并且以和向量的大小作為結果。在取向為有方向的情況下,如果投影差向量的方向與取向的方向一致,則其大小為正值,否則其大小為負值, 反之亦然。分類單元1204根據(jù)所提取的特征向量,對輸入圖像進行分類。圖13示出了根據(jù)本發(fā)明一個實施例的、對圖像進行分類的方法1300的流程圖。如圖13所示,方法1300從步驟1301開始。步驟1303、1305和1307用于從當前輸入圖像中提取一組特征作為特征向量。要從輸入圖像中提取的特征向量所包含的特征由組合信息中包含的孤立組合和集合決定。輸入圖像可以是通過掃描窗口從要處理的圖像中獲得預定尺寸的圖像??赏ㄟ^在 Ding等人的標題為“A Robust Human Face DetectingMethod In Complicated Background Image”的專利申請WO 2008/151470中描述的方法來獲得圖像(參見說明書第5頁)。在步驟1303,對于輸入圖像,針對要提取的特征向量的每個特征,獲得相應組合的多個第一區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第一差值),以得到第一軸方向上的第一差向量,和相應組合的多個第二區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第二差值),以得到第二軸方向上的第二差向量。差向量的大小為相應差值的絕對值。如果差值為正,則相應差向量的方向為相應軸的方向;如果差值為負,則相應差向量的方向為相應軸的方向的反方向??蛇x地,如果差值為正,則相應差向量的方向為相應軸的方向的反方向;如果差值為負,則相應差向量的方向為相應軸的方向??蛇x地,差向量也可以恒定為相應軸的方向或其反方向,無論差值為正還是負。計算軸向上區(qū)域的像素和或均值(灰度)之間的差值的目的是獲得反映相應軸向上像素灰度的變化的信息。對于不同的區(qū)域布局,可以根據(jù)此目的確定相應的計算差值的方法,只要其能夠反映這種變化。例如在Ding等人的標題為“A Robust Human Face Detecting Method In ComplicatedBackground Image” 的#禾I」串i青 WO 2008/151470 開了根據(jù)單個方向上區(qū)域的布局計算差值的方法(參見說明書第9頁至第10頁)。再例如,可采用前面結合圖2的示例說明的計算方法。接著在步驟1305,獲得第一差向量和第二差向量在相應組合的預定取向的直線上的第一投影差向量和第二投影差向量。這里的差向量和投影差向量之間可以存在任何投影關系,包括但不限于正投影關系和斜投影關系,只要滿足差向量的大小越大,則投影差向量的大小就越大的關系即可。接著在步驟1307,獲得第一投影差向量和第二投影差向量的大小的和,以作為孤立特征。在取向為無方向的情況下,投影差向量的大小可以均為正值或均為負值,或者,也可以求出兩個投影差向量的和向量,并且以和向量的大小作為結果。在取向為有方向的情況下,如果投影差向量的方向與取向的方向一致,則其大小為正值,否則其大小為負值,反之亦然。接著在步驟1309,確定對于當前輸入圖像,是否存在未提取的特征。如果存在,則返回步驟1303,以執(zhí)行提取下一個特征的過程;否則,執(zhí)行步驟1311。在步驟1311,根據(jù)所提取的特征向量,對輸入圖像進行分類。方法1300在步驟1313結束。在圖12所示的實施例的進一步改進中,組合信息還包含有集合,因而要提取的特征向量中還包含相應的聯(lián)合特征。除了如前所述針對每個孤立特征獲得與該孤立特征相對應第一投影差向量和第二投影差向量之外,進一步地,差計算單元1202針對每個聯(lián)合特征,獲得與該聯(lián)合特征相對應的集合的每個組合的多個第一區(qū)域的像素和或均值之間的差值,以得到第一軸方向上的第一差向量,和該組合的多個第二區(qū)域的像素和或均值之間的差值,以得到第二軸方向上的第二差向量,并且獲得第一差向量和第二差向量在該組合的預定取向的直線上的第一投影差向量和第二投影差向量。這里,對于集合中的每個組合,差計算單元1202獲得相應第一差向量、第二差向量、第一投影差向量和第二投影差向量的方法與前面描述的差計算單元1202獲得孤立組合的相應第一差向量、第二差向量、第一投影差向量和第二投影差向量的方法相同,因此不再重復說明。除了如前所述針對每個孤立特征獲得與該孤立特征相對應第一投影差向量與第二投影差向量的大小的和之外,進一步地,對于差計算單元1202獲得的分別與每個集合的各個組合相對應的各個第一投影差向量和第二投影差向量對,特征計算單元1203分別獲得每對第一投影差向量和第二投影差向量的大小的和。特征計算單元1203獲得每對第一投影差向量和第二投影差向量的大小的和的方法與前面描述的特征計算單元1203獲得孤立組合的相應第一投影差向量和第二投影差向量的大小的和的方法相同,因此不再重復說明。此外,特征計算單元1203獲得與每個集合的各個組合對應的和(即各對第一投影差向量和第二投影差向量的大小的和)的均值或總和,以作為與該集合對應的聯(lián)合特征。分類單元1204根據(jù)所提取的特征向量,對輸入圖像進行分類。圖14示出了根據(jù)本發(fā)明一個實施例的、對圖像進行分類的方法1400的流程圖,其中組合信息還包含有集合,因而要提取的特征向量中還包含相應的聯(lián)合特征。如圖14所示,方法1400從步驟1401開始。在步驟1403,對于輸入圖像,針對每個孤立組合或每個集合的每個組合,獲得相應組合的多個第一區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第一差值),以得到第一軸方向上的第一差向量,和相應組合的多個第二區(qū)域的像素和或均值(例如灰度)之間的差值(也稱為第二差值),以得到第二軸方向上的第二差向量。在步驟1405,獲得第一差向量和第二差向量在相應組合的預定取向的直線上的第一投影差向量和第二投影差向量。接著在步驟1407,獲得第一投影差向量和第二投影差向量的大小的和。接著在步驟1408,確定所計算的和的相應組合是孤立組合還是集合的組合。如果是孤立組合,則將計算的和作為孤立特征,并且前進到步驟1409。否則,在步驟1417確定集合中是否還有未處理的組合。如果有,則返回步驟1403以針對下一未處理的組合進行計算。否則,前進到步驟1419計算集合的各個組合的相應和的均值或總和,以作為該集合的相應聯(lián)合特征。然后前進到步驟1409。在步驟1409,確定對于當前輸入圖像,是否存在未提取的特征。如果存在,則返回步驟1403,以執(zhí)行提取下一個特征的過程;否則,執(zhí)行步驟1411。在步驟1411,根據(jù)所提取的特征向量,對輸入圖像進行分類。方法1400在步驟1413結束。本發(fā)明的設備和方法可通過硬件、軟件和二者的結合的方式來實現(xiàn)。在通過硬件實現(xiàn)的情況下,對于設備包括的各個裝置,可以根據(jù)其功能設計出輸入輸出的邏輯真值表,然后按照數(shù)字邏輯設計方法由邏輯真值表構造出相應邏輯電路。也可以根據(jù)邏輯真值表對可編程邏輯器件進行編程,以實現(xiàn)相應邏輯電路。各個裝置可通過總線、專用連接或網(wǎng)絡相連。對于方法的各個步驟,可以根據(jù)其功能設計出輸入輸出的邏輯真值表,然后按照數(shù)字邏輯設計方法由邏輯真值表構造出執(zhí)行步驟的功能的相應邏輯電路。也可以根據(jù)邏輯真值表對可編程邏輯器件進行編程,以實現(xiàn)步驟的功能的相應邏輯電路。相互銜接的步驟可通過總線、專用連接或網(wǎng)絡相連。在通過軟件實現(xiàn)的情況下,可將設備的各個裝置和方法的各個步驟的功能通過諸如C、BASIC、JAVA等的編程語言編制成計算機程序。當諸如個人計算機的計算機執(zhí)行這樣的計算機程序時,能夠?qū)崿F(xiàn)設備和方法的功能。圖15是示出其中實現(xiàn)本發(fā)明的設備和方法的計算機的示例性結構的框圖。在圖15中,中央處理單元(CPU) 1501根據(jù)只讀映射數(shù)據(jù)(ROM) 1502中存儲的程序或從存儲部分1508加載到隨機存取映射數(shù)據(jù)(RAM) 1503的程序執(zhí)行各種處理。在RAM 1503 中,也根據(jù)需要存儲當CPU 1501執(zhí)行各種處理等等時所需的數(shù)據(jù)。CPU 150UR0M 1502和RAM 1503經(jīng)由總線1504彼此連接。輸入/輸出接口 1505 也連接到總線1504。下述部件連接到輸入/輸出接口 1505 輸入部分1506,包括鍵盤、鼠標等等;輸出部分1507,包括顯示器,比如陰極射線管(CRT)、液晶顯示器(IXD)等等,和揚聲器等等;存儲部分1508,包括硬盤等等;和通信部分1509,包括網(wǎng)絡接口卡比如LAN卡、調(diào)制解調(diào)器等等。通信部分1509經(jīng)由網(wǎng)絡比如因特網(wǎng)執(zhí)行通信處理。根據(jù)需要,驅(qū)動器1510也連接到輸入/輸出接口 1505??刹鹦督橘|(zhì)1511比如磁盤、光盤、磁光盤、半導體映射數(shù)據(jù)等等根據(jù)需要被安裝在驅(qū)動器1510上,使得從中讀出的計算機程序根據(jù)需要被安裝到存儲部分1508中。在通過軟件實現(xiàn)上述步驟和處理的情況下,從網(wǎng)絡比如因特網(wǎng)或存儲介質(zhì)比如可拆卸介質(zhì)1511安裝構成軟件的程序。本領域的技術人員應當理解,這種存儲介質(zhì)不局限于圖15所示的其中存儲有程序、與方法相分離地分發(fā)以向用戶提供程序的可拆卸介質(zhì)1511??刹鹦督橘|(zhì)1511的例子包含磁盤、光盤(包含光盤只讀映射數(shù)據(jù)(⑶-ROM)和數(shù)字通用盤(DVD))、磁光盤(包含迷你盤(MD)和半導體映射數(shù)據(jù)?;蛘?,存儲介質(zhì)可以是ROM 1502、存儲部分1508中包含的硬盤等等,其中存有程序,并且與包含它們的方法一起被分發(fā)給用戶。在前面的說明書中參照特定實施例描述了本發(fā)明。然而本領域的普通技術人員理解,在不偏離如權利要求書限定的本發(fā)明的范圍的前提下可以進行各種修改和改變。
權利要求
1.一種對圖像進行分類的方法,包括從所述圖像中提取特征向量,其中所述特征向量包括多個第一特征,每個所述第一特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的組合相對應,每個所述第一特征的提取包括獲得相應組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和相應組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在相應組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和,以作為所述第一特征;以及根據(jù)所述提取的特征向量,對所述圖像進行分類。
2.如權利要求1所述的方法,其中所述特征向量還包括至少一個第二特征,其中每個所述第二特征與沿第一軸的方向布置的多個第一區(qū)域、沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的至少兩個組合相對應,每個所述第二特征的提取包括針對與所述第二特征相對應的至少兩個組合中的每個組合,獲得所述組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在所述組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和;以及獲得與所述至少兩個組合對應的和的均值或總和,以作為所述第二特征。
3.如權利要求1或2所述的方法,其中所述區(qū)域為矩形區(qū)域,所述第一區(qū)域是相接的, 并且所述第二區(qū)域是相接的。
4.如權利要求1或2所述的方法,其中,在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為二,所述第一區(qū)域是相接的并且所述第二區(qū)域是相接的情況下,所述第一軸和第二軸的交點在所述第一區(qū)域的連接線上或連接點的預定范圍內(nèi),并且在所述第二區(qū)域的連接線上或連接點的預定范圍內(nèi);在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為二,所述第一區(qū)域是間隔開的并且所述第二區(qū)域是間隔開的情況下,所述第一軸和第二軸的交點在所述第一區(qū)域的位置中心之間的中點和所述第二區(qū)域的位置中心之間的中點的預定范圍內(nèi);在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為三的情況下,所述第一軸和第二軸的交點分別在所述第一區(qū)域中居于中間的第一區(qū)域內(nèi)和所述第二區(qū)域中居于中間的第二區(qū)域內(nèi)。
5.如權利要求1或2所述的方法,其中至少兩個所述組合之間的差別包括下述中的一個或多個區(qū)域的相對位置關系、區(qū)域的數(shù)目、區(qū)域的形狀、區(qū)域的大小、區(qū)域的縱橫比。
6.如權利要求2所述的方法,其中與每個所述第二特征相對應的至少兩個組合能夠形成一個序列,該序列中相鄰組合的預定取向的偏差在預定范圍內(nèi),其各個區(qū)域的覆蓋范圍彼此接近并且所述至少兩個組合所覆蓋的像素彼此不完全相同。
7.如權利要求1所述的方法,其中所述多個預定取向相對于所述第一軸或第二軸旋轉(zhuǎn)的角度范圍為0度到180度或0度到360度。
8.如權利要求1或7所述的方法,其中所述多個預定取向中的相鄰預定取向間的角度相同。
9.一種對圖像進行分類的設備,所述設備從所述圖像中提取特征向量,其中所述特征向量包括多個第一特征,每個所述第一特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的組合相對應,并且所述設備包括差計算單元,其針對每個所述第一特征,獲得相應組合的所述多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和相應組合的所述多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量,并且獲得所述第一差向量和第二差向量在相應組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及特征計算單元,其獲得所述第一投影差向量和第二投影差向量的大小的和,以作為所述第一特征;以及分類單元,其根據(jù)所述提取的特征向量,對所述圖像進行分類。
10.如權利要求9所述的設備,其中所述特征向量還包括至少一個第二特征,每個所述第二特征與沿第一軸的方向布置的多個第一區(qū)域、沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的至少兩個組合相對應,其中,所述差計算單元進一步被配置為針對與每個所述第二特征相對應的至少兩個組合中的每個組合,獲得所述組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量,并且獲得所述第一差向量和第二差向量在所述組合的預定取向的直線上的第一投影差向量和第二投影差向量,其中,所述特征計算單元進一步被配置為計算與每個所述第二特征的相對應的至少兩個組合的相應第一投影差向量和第二投影差向量的大小的和的均值或總和,以作為所述第二特征。
11.如權利要求9或10所述的設備,其中所述區(qū)域為矩形區(qū)域,所述第一區(qū)域是相接的,并且所述第二區(qū)域是相接的。
12.如權利要求9或10所述的設備,其中,在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為二,所述第一區(qū)域是相接的并且所述第二區(qū)域是相接的情況下,所述第一軸和第二軸的交點在所述第一區(qū)域的連接線上或連接點的預定范圍內(nèi),并且在所述第二區(qū)域的連接線上或連接點的預定范圍內(nèi);在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為二,所述第一區(qū)域是間隔開的并且所述第二區(qū)域是間隔開的情況下,所述第一軸和第二軸的交點在所述第一區(qū)域的位置中心之間的中點和所述第二區(qū)域的位置中心之間的中點的預定范圍內(nèi);在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為三的情況下,所述第一軸和第二軸的交點分別在所述第一區(qū)域中居于中間的第一區(qū)域內(nèi)和所述第二區(qū)域中居于中間的第二區(qū)域內(nèi)。
13.如權利要求9或10所述的設備,其中至少兩個所述組合之間的差別包括下述中的一個或多個區(qū)域的相對位置關系、區(qū)域的數(shù)目、區(qū)域的形狀、區(qū)域的大小、區(qū)域的縱橫比。
14.如權利要求10所述的設備,其中與每個所述第二特征相對應的至少兩個組合能夠形成一個序列,該序列中相鄰組合的預定取向的偏差在預定范圍內(nèi),其各個區(qū)域的覆蓋范圍彼此接近并且所述至少兩個組合所覆蓋的像素彼此不完全相同。
15.如權利要求9所述的設備,其中所述多個預定取向相對于所述第一軸或第二軸旋轉(zhuǎn)的角度范圍為0度到180度或0度到360度。
16.如權利要求9或15所述的設備,其中所述多個預定取向中的相鄰預定取向間的角度相同。
17.—種生成用于區(qū)分對象圖像和非對象圖像的分類器的方法,包括從輸入圖像中提取特征向量,其中所述特征向量包括多個第一候選特征,每個所述第一候選特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的候選組合相對應,每個所述第一候選特征的提取包括獲得相應候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和相應候選組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在相應候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和,以作為所述第一候選特征;以及根據(jù)所述提取的特征向量訓練出所述分類器。
18.如權利要求17所述的方法,其中所述特征向量還包括至少一個第二候選特征,其中每個所述第二候選特征與沿第一軸的方向布置的多個第一區(qū)域、沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的至少兩個候選組合相對應, 每個所述第二候選特征的提取包括針對與所述第二候選特征相對應的至少兩個候選組合中的每個候選組合,獲得所述候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述候選組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在所述候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和;以及獲得與所述至少兩個候選組合對應的和的均值或總和,以作為所述第二候選特征。
19.如權利要求18所述的方法,還包括從與第一候選特征對應的候選組合中搜索至少一個集合,其中每個所述集合包含滿足下述條件的至少兩個所述候選組合所述候選組合能夠形成一個序列,該序列中相鄰候選組合的預定取向的偏差在預定范圍內(nèi)并且其各個區(qū)域的覆蓋范圍彼此接近,以及不同的所述候選組合所覆蓋的像素彼此不完全相同;以及將每個所述集合的各個候選組合作為所述第二候選特征之一的對應候選組合。
20.如權利要求19所述的方法,其中在將每個所述集合的各個候選組合作為所述第二候選特征之一的對應候選組合之前還包括通過以下述方式獲得對應于每個所述集合的第二候選特征,來評估所述第二候選特征的鑒別能力針對所述集合的每個候選組合,獲得所述候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述候選組合的所述多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在所述候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和;以及獲得所述集合的各個候選組合的相應和的均值或總和,以作為所述第二候選特征, 其中,在所述第二候選特征的鑒別能力不滿足預定要求的情況下,從搜索到的集合中排除所述集合。
21.如權利要求17或18所述的方法,其中所述區(qū)域為矩形區(qū)域,所述第一區(qū)域是相接的,并且所述第二區(qū)域是相接的。
22.如權利要求17或18所述的方法,其中,在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為二,所述第一區(qū)域是相接的并且所述第二區(qū)域是相接的情況下,所述第一軸和第二軸的交點在所述第一區(qū)域的連接線上或連接點的預定范圍內(nèi),并且在所述第二區(qū)域的連接線上或連接點的預定范圍內(nèi);在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為二,所述第一區(qū)域是間隔開的并且所述第二區(qū)域是間隔開的情況下,所述第一軸和第二軸的交點在所述第一區(qū)域的位置中心之間的中點和所述第二區(qū)域的位置中心之間的中點的預定范圍內(nèi);在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為三的情況下,所述第一軸和第二軸的交點分別在所述第一區(qū)域中居于中間的第一區(qū)域內(nèi)和所述第二區(qū)域中居于中間的第二區(qū)域內(nèi)。
23.如權利要求17或18所述的方法,其中至少兩個所述候選組合之間的差別包括下述中的一個或多個區(qū)域的相對位置關系、區(qū)域的數(shù)目、區(qū)域的形狀、區(qū)域的大小、區(qū)域的縱橫比。
24.如權利要求17所述的方法,其中所述多個預定取向相對于所述第一軸或第二軸旋轉(zhuǎn)的角度范圍為0度到180度或0度到360度。
25.如權利要求17或?qū)λ龅姆椒?,其中所述多個預定取向中的相鄰預定取向間的角度相同。
26.如權利要求18所述的方法,還包括根據(jù)與第一候選特征對應的候選組合生成至少一個集合,其中每個所述集合包含至少兩個所述候選組合;通過以下述方式獲得對應于每個所述集合的第二候選特征,來評估所述第二候選特征的鑒別能力針對所述集合的每個候選組合,獲得所述候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述候選組合的所述多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在所述候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和;以及獲得所述集合的各個候選組合的相應和的均值或總和,以作為所述第二候選特征,以及在所述第二候選特征的鑒別能力不滿足預定要求的情況下,從生成的集合中排除所述集合;以及將每個所述集合的各個候選組合作為所述第二候選特征之一的對應候選組合。
27.一種生成用于區(qū)分對象圖像和非對象圖像的分類器的設備,所述設備從輸入圖像中提取特征向量,其中所述特征向量包括多個第一候選特征,每個所述第一候選特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的候選組合相對應,并且所述設備包括差計算單元,其針對每個所述第一候選特征,獲得相應候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和相應候選組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量,并且獲得所述第一差向量和第二差向量在相應候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及特征計算單元,其獲得所述第一投影差向量和第二投影差向量的大小的和,以作為所述第一候選特征;以及訓練單元,根據(jù)所述提取的特征向量訓練出所述分類器。
28.如權利要求27所述的設備,其中所述特征向量還包括至少一個第二候選特征,其中每個所述第二候選特征與沿第一軸的方向布置的多個第一區(qū)域、沿與所述第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的至少兩個候選組合相對應,所述差計算單元進一步被配置為針對每個所述第二候選特征,獲得與所述第二候選特征相對應的至少兩個候選組合中的每個候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述候選組合的多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量,并且獲得所述第一差向量和第二差向量在所述候選組合的預定取向的直線上的第一投影差向量和第二投影差向量,并且所述特征計算單元進一步被配置為獲得所述第一投影差向量和第二投影差向量的大小的和,并且獲得與所述至少兩個候選組合對應的和的均值或總和,以作為所述第二候選特征。
29.如權利要求28所述的設備,還包括搜索單元,其從與第一候選特征對應的候選組合中搜索至少一個集合,其中每個所述集合包含滿足下述條件的至少兩個所述候選組合所述候選組合能夠形成一個序列,該序列中相鄰候選組合的預定取向的偏差在預定范圍內(nèi)并且其各個區(qū)域的覆蓋范圍彼此接近, 以及不同的所述候選組合所覆蓋的像素彼此不完全相同;和過濾單元,其將每個所述集合的各個候選組合作為所述第二候選特征之一的對應候選組合。
30.如權利要求四所述的設備,還包括評估單元,其通過以下述方式獲得對應于每個所述集合的第二候選特征,來評估所述第二候選特征的鑒別能力針對所述集合的每個候選組合,獲得所述候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述候選組合的所述多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在所述候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和;以及獲得所述集合的各個候選組合的相應和的均值或總和,以作為所述第二候選特征, 其中,所述過濾單元進一步被配置為在所述第二候選特征的鑒別能力不滿足預定要求的情況下,從搜索到的集合中排除所述集合。
31.如權利要求27或觀所述的設備,其中所述區(qū)域為矩形區(qū)域,所述第一區(qū)域是相接的,并且所述第二區(qū)域是相接的。
32.如權利要求27或觀所述的設備,其中,在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為二,所述第一區(qū)域是相接的并且所述第二區(qū)域是相接的情況下,所述第一軸和第二軸的交點在所述第一區(qū)域的連接線上或連接點的預定范圍內(nèi),并且在所述第二區(qū)域的連接線上或連接點的預定范圍內(nèi);在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為二,所述第一區(qū)域是間隔開的并且所述第二區(qū)域是間隔開的情況下,所述第一軸和第二軸的交點在所述第一區(qū)域的位置中心之間的中點和所述第二區(qū)域的位置中心之間的中點的預定范圍內(nèi);在所述第一區(qū)域的數(shù)目和所述第二區(qū)域的數(shù)目均為三的情況下,所述第一軸和第二軸的交點分別在所述第一區(qū)域中居于中間的第一區(qū)域內(nèi)和所述第二區(qū)域中居于中間的第二區(qū)域內(nèi)。
33.如權利要求27或觀所述的設備,其中至少兩個所述候選組合之間的差別包括下述中的一個或多個區(qū)域的相對位置關系、區(qū)域的數(shù)目、區(qū)域的形狀、區(qū)域的大小、區(qū)域的縱橫比。
34.如權利要求27所述的設備,其中所述多個預定取向相對于所述第一軸或第二軸旋轉(zhuǎn)的角度范圍為0度到180度或0度到360度。
35.如權利要求27或34所述的設備,其中所述多個預定取向中的相鄰預定取向間的角度相同。
36.如權利要求28所述的設備,還包括搜索單元,其根據(jù)與第一候選特征對應的候選組合生成至少一個集合,其中每個所述集合包含至少兩個所述候選組合;評估單元,其通過以下述方式獲得對應于每個所述集合的第二候選特征,來評估所述第二候選特征的鑒別能力針對所述集合的每個候選組合,獲得所述候選組合的多個第一區(qū)域的像素和或均值之間的差值,以得到所述第一軸方向上的第一差向量,和所述候選組合的所述多個第二區(qū)域的像素和或均值之間的差值,以得到所述第二軸方向上的第二差向量;獲得所述第一差向量和第二差向量在所述候選組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得所述第一投影差向量和第二投影差向量的大小的和;以及獲得所述集合的各個候選組合的相應和的均值或總和,以作為所述第二候選特征;和過濾單元,其在所述第二候選特征的鑒別能力不滿足預定要求的情況下,從生成的集合中排除所述集合,并且將每個所述集合的各個候選組合作為所述第二候選特征之一的對應候選組合。
全文摘要
對圖像進行分類的方法和設備。方法包含從圖像中提取特征向量,特征向量包括多個第一特征,每個第一特征與沿第一軸的方向布置的多個第一區(qū)域、和沿與第一軸方向相交的第二軸的方向布置的多個第二區(qū)域和多個預定取向之一的組合相對應,每個第一特征的提取包括獲得相應組合的多個第一區(qū)域的像素和或均值之間的差值,以得到第一軸方向上的第一差向量,和相應組合的多個第二區(qū)域的像素和或均值之間的差值,以得到第二軸方向上的第二差向量;獲得第一差向量和第二差向量在相應組合的預定取向的直線上的第一投影差向量和第二投影差向量;以及獲得第一投影差向量和第二投影差向量的大小的和,以作為第一特征;以及根據(jù)提取的特征向量,對圖像進行分類。
文檔編號G06K9/46GK102194122SQ20101012000
公開日2011年9月21日 申請日期2010年3月5日 優(yōu)先權日2010年3月5日
發(fā)明者吳偉國, 張倫 申請人:索尼公司