欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于比較圖像的方法和系統(tǒng)與流程

文檔序號:12603443閱讀:247來源:國知局
用于比較圖像的方法和系統(tǒng)與流程
本發(fā)明涉及圖像分析的領域。

背景技術:
在圖像分析領域,常見的操作提供在兩個圖像包括同一場景的至少一部分或同一對象的至少一部分的情況下將兩個圖像進行比較以便發(fā)現(xiàn)存在于它們之間的關系。在大量的應用當中,圖像比較對于校準屬于多照相機系統(tǒng)的視頻照相機、對于評估出現(xiàn)在視頻拍攝的兩個幀之間的移動、以及對于在圖像(例如,照片)內的對象的識別至關重要。后者的應用目前由于對象識別算法的最新發(fā)展而呈現(xiàn)越來越重要,對象識別算法具體地被設計用在所謂的可視搜索引擎中,即,從照片開始能識別在其中拍攝的對象并且提供與識別對象相關的信息的自動化服務。此類型的已知服務的例子包括GoogleGoggles、NokiaPoint&Find、和kooabaSmartVisuals。對象識別應用提供將描述被識別的對象的第一圖像--術語被稱為“查詢圖像”--與每個描述相應的已知對象的多個參考圖像進行比較;這允許在查詢圖像中描述的對象與在參考圖像中描述的對象當中執(zhí)行比較。通常將參考圖像布置在適當?shù)膮⒖紨?shù)據(jù)庫中。包括在數(shù)據(jù)庫中的參考圖像的數(shù)目越大,要被執(zhí)行的比較操作的數(shù)目越大。在某些情況下,參考數(shù)據(jù)庫可能變得非常大,負面影響對象識別處理的效率。例如,在在線購物情形中開發(fā)對象識別的情況中,其中每個參考圖像對應于由在線商店提供的項目(例如,書封面、DVD封面和/或CD封面的圖片),參考圖像的數(shù)目可能超過數(shù)百萬個個體。另外,為了有效地管理如此巨大量的數(shù)據(jù),應當由具備足夠的處理能力的處理單元執(zhí)行比較操作。在過去的十年中,已經(jīng)提出用于減少執(zhí)行對象識別所需的時間的不同的算法。這些算法提供大大減少作為包括查詢圖像中描述的對象的候選者的參考圖像的數(shù)目。用于執(zhí)行兩個圖像之間的比較操作的非常有效的方法提供在第一圖像中選擇一組點--術語被稱為關鍵點,并且然后將該組點的每個關鍵點匹配到第二圖像中的對應關鍵點。通過考慮圍繞點本身的圖像區(qū)域的局部特征進行第一圖像的哪些點必須變?yōu)殛P鍵點的選擇。在這方面,參見由DavidG.Lowe在InternationalJournalofcomputervision,2004上的“Distinctiveimagefeaturesfromscale-invariantkeypoints”。如果第一圖像的關鍵點和第二圖像的對應關鍵點之間的匹配正確,則在兩個關鍵點對應于同一對象(在兩個圖像都描述)的同一點的意義上,此類關鍵點匹配被稱為“內點(inlier)”。相反地,如果第一圖像的關鍵點和第二圖像的對應關鍵點之間的匹配不正確,則在兩個關鍵點不對應同一對象的同一點的意義上,此類關鍵點匹配被稱為“外點(outlier)”。因此,為了獲得可靠的結果,在已經(jīng)確定關鍵點匹配之后有利地執(zhí)行能夠將內點與外點區(qū)分的進程。在本領域中已知此類進程的若干示例。最常用的進程利用由MartinA.Fischler和RobertC.Bolles的“Randomsampleconsensus:Aparadigmformodelfittingwithapplicationstoimageanalysisandautomatedcartography'’,CommunicationsoftheACM,24(6):381-395,June1981中公開的RANSAC算法。然而,此算法是費時的,因為是基于迭代方法。在SamS.Tsai、DavideChen、GabrielTakacs、RamakrishnaVedantham、RadekGrzeszczuk、BerndGirod的“Fastgeometricre-rankingforimage-basedretrieval'’,InternationalConferenceonImageProcessing,October2010中以及在國際專利申請WO2009/130451中公開的算法是基于關鍵點的距離之間的比率在轉換、旋轉、和縮放下不變的事實。此外,此類型的算法也在ZhipengWu,QianqianXu,ShuqiangJiang,QingmingHuang,PengCui,LiangLi的“AddingAffineInvariantGeometricConstraintforPartial-DuplicateImageRetrieval”,InternationalConferenceonPatternRecognition,August2010,pages842-845中,以及在DanielFleck、ZoranDuric的“UsingLocalAffineInvariantstoImproveImageMatching”,20thInternationalConferenceonPatternRecognition,2010,pages1844-1847中公開。此外,US2010/0135527A1公開了包括基于關鍵點的比較和基于區(qū)域的顏色比較的圖像識別算法。利用該算法識別目標圖像的方法包括:在處理設備處接收輸入,該輸入包括目標圖像有關的數(shù)據(jù);執(zhí)行檢索步驟,包括從圖像數(shù)據(jù)庫中檢索圖像,以及直到圖像被接受或拒絕,指定圖像為候選者圖像;執(zhí)行圖像識別步驟,包括利用處理設備對目標圖像和候選者圖像執(zhí)行圖像識別算法以便獲得圖像識別算法輸出;以及執(zhí)行比較步驟,包括:如果圖像識別算法輸出在預先選擇的范圍之內,則接受候選者圖像為目標圖像;并且如果圖像識別算法輸出不在預先選擇的范圍之內,則拒絕候選者圖像然后重復檢索、圖像識別、和比較步驟。US2010/0183229A1是指用于匹配圖像的方法、系統(tǒng)和計算機程序產(chǎn)品。要被匹配的圖像由特征點和特征向量以及與特征點相關聯(lián)的定向表示。首先,通過利用特征向量確定推定對應。選擇推定對應的子集并且確定子集的拓撲等價。推定對應的拓撲等價的子集用于建立運動估計模型。對推定對應和確定的相應的運動估計轉換執(zhí)行定向一致性檢驗以避免不可實行的轉換。對滿足定向一致性檢驗的匹配執(zhí)行覆蓋檢驗。拒絕不覆蓋圖像中的一個的顯著部分的候選者匹配。在多個圖像滿足所有檢驗要求的情況下,按照匹配遞減的次序提供最終匹配圖像。

技術實現(xiàn)要素:
申請人已經(jīng)發(fā)現(xiàn)上述用于實現(xiàn)對象識別服務的已知方法受一些缺點的影響。具體來說,這些方法是耗時的、基于迭代進程和/或需要大量要被處理的數(shù)據(jù)。申請人已經(jīng)處理了如何改善這些方法在耗時和要被處理的數(shù)據(jù)量方面的問題。具體來說,申請人已經(jīng)處理了該問題以提供用于在數(shù)據(jù)處理方面可靠并在耗時方面具有良好性能的比較圖像的方法。申請人已經(jīng)發(fā)現(xiàn),通過從在第一圖像(查詢圖像)上生成并且關聯(lián)到在第二圖像(參考圖像)上生成的對應關鍵點集合的關鍵點集合開始以便形成關鍵點匹配的對應集合,根據(jù)本發(fā)明的用于比較圖像的方法可以包括主階段和兩個隨后的可選階段。主階段被應用于關鍵點匹配的生成之后,并且提供統(tǒng)計地處理關鍵點匹配并因此通過幾何一致性檢查來評估查詢圖像和參考圖像是否可以描述同一對象。更詳細地,在表示不正確的匹配(外點)的統(tǒng)計分布的模型函數(shù)的生成之后,進行擬合良好性檢驗以便決定參考圖像是否包含在查詢圖像中存在的對象的視圖。在肯定的情況下,該方法能夠計算要被用于排列在參考圖像中拍攝的對象和在查詢圖像中拍攝的對象之間的實際相似性的分數(shù)。第二階段允許評估在關鍵點匹配的整個集合當中有多少關鍵點匹配是內點。為了在可視搜索應用中增加精度,可以有利地執(zhí)行此階段。第三階段允許具體地識別哪些關鍵點匹配是內點,以及哪些關鍵點匹配是外點。在一些諸如增強逼真度之類的特定應用中可以有利地執(zhí)行此階段。更具體地,根據(jù)本發(fā)明的一方面涉及用于將第一圖像與第二圖像進行比較的方法。該方法包括識別第一圖像中的第一關鍵點和第二圖像中的第二關鍵點并且使每個第一關鍵點與對應的第二關鍵點相關聯(lián)以便形成對應的關鍵點匹配。對于每對第一關鍵點,該方法還包括計算它們之間的距離以獲得對應的第一長度。類似地,對于每對第二關鍵點,該方法包括計算它們之間的距離以獲得對應的第二長度。該方法還包括計算多個距離比率;每個距離比率基于分別在第一長度與第二長度之間選擇的一個長度和在第二長度與第一長度之間的對應選擇的一個長度之間的長度比率。該方法更進一步包括計算多個距離比率的統(tǒng)計分布并且生成表示與第一和第二圖像中的關鍵點的隨機選擇對應的進一步距離比率的統(tǒng)計分布的模型函數(shù)。該方法包括將所述多個距離比率的統(tǒng)計分布與所述模型函數(shù)進行比較,并且基于所述比較來評估第一圖像是否包含所述第二圖像中描述的對象的視圖。根據(jù)本發(fā)明的實施例,該方法包括以直方圖的形式布置多個距離比率的分布,該直方圖具有多個有序區(qū)間(bin),每個區(qū)間與距離比率值的相應間隔對應;直方圖為每個區(qū)間對具有包括在相應間隔之內的值的分布的距離比率的對應數(shù)目進行計數(shù)。對每個區(qū)間,該方法還包括生成與模型函數(shù)在所述區(qū)間內的積分對應的對應模型概率。所述比較多個距離比率的分布與所述模型函數(shù)包括比較直方圖與模型概率。優(yōu)選地,所述比較直方圖與模型概率包括執(zhí)行Pearson卡方(chi-square)檢驗。有利地,所述計算距離比率提供計算長度比率的對數(shù)。根據(jù)本發(fā)明的實施例,該方法還包括估計不正確的關鍵點匹配(不正確的關鍵點匹配是由不對應于第一和第二圖像中描述的同一對象的同一點的第一和第二關鍵點形成)的數(shù)目。所述估計不正確的關鍵點匹配的數(shù)目包括將權重參數(shù)初始化為初始值并且重復:a)利用權重參數(shù)對模型概率加權,和b)增大權重參數(shù)的值,直到至少一個加權的模型概率的值達到與所述模型概率對應的、由直方圖在區(qū)間中計數(shù)的距離比率的數(shù)目。該方法還包括基于由權重參數(shù)采用的最后一個值確定不正確的關鍵點匹配的數(shù)目。根據(jù)本發(fā)明的實施例,該方法還包括估計正確的關鍵點匹配(正確的關鍵點匹配由對應于第一和第二圖像中描述的同一對象的同一點的第一和第二關鍵點形成)的數(shù)目。所述估計正確的關鍵點匹配的數(shù)目基于第一關鍵點匹配的數(shù)目乘以等于一減去由權重參數(shù)采用的最后一個值得到的值的平方根的項。根據(jù)本發(fā)明的進一步的實施例,該方法還包括計算矩陣;矩陣的每個元素對應于相應的關鍵點匹配對,并且具有與由直方圖在包括相應的關鍵點匹配對的距離比率的區(qū)間處采用的值和與所述區(qū)間對應的加權的模型概率之間的差異對應的值。該方法還包括發(fā)現(xiàn)矩陣的主要特征向量,并且基于所述主要特征向量識別哪些關鍵點匹配最有可能是正確的關鍵點匹配。所述識別哪些關鍵點匹配最有可能是正確的關鍵點匹配包括識別具有最高絕對值的特征向量的元素。本發(fā)明的另一個方面提供用于比較第一圖像與第二圖像的裝置。該裝置包括被配置為識別第一圖像中的第一關鍵點和第二圖像中的第二關鍵點的第一識別單元,和被配置為將每個第一關鍵點與對應的第二關鍵點關聯(lián)以便形成對應的關鍵點匹配的關聯(lián)單元。第一計算單元被配置為對于每對第一關鍵點計算它們之間的距離以獲得對應的第一長度,而第二計算單元被配置為對于每對第二關鍵點計算它們之間的距離以獲得對應的第二長度。該裝置還包括被配置為計算多個距離比率的第三計算單元;每個距離比率分別基于第一長度和第二長度之間選擇的一個與第二長度和第一長度之間對應的選擇的一個之間的長度比率。該裝置更進一步包括被配置為計算多個距離比率的統(tǒng)計分布的第四計算單元,和被配置為生成表示與第一和第二圖像中的關鍵點的隨機選擇對應的進一步距離比率的統(tǒng)計分布的模型函數(shù)的第一生成單元。該裝置包括被配置為將所述多個距離比率的統(tǒng)計分布與所述模型函數(shù)進行比較的第一比較單元,和被配置為基于所述比較評估第一圖像是否包含第二圖像中描述的對象的視圖的評估單元。根據(jù)本發(fā)明的實施例,該裝置還包括被配置為以直方圖的形式布置多個距離比率的分布的布置單元,該直方圖具有多個有序區(qū)間,每個區(qū)間與距離比率值的相應間隔對應;直方圖為每個區(qū)間對具有包括在相應間隔之內的值的分布的距離比率的對應數(shù)目進行計數(shù)。該裝置還包括被配置為對每個區(qū)間生成與模型函數(shù)在所述區(qū)間內的積分對應的對應模型概率的第二生成單元。所述第一比較單元包括被配置為將直方圖與模型概率進行比較的第二比較單元。根據(jù)本發(fā)明的進一步的實施例,該裝置包括被配置為估計不正確的關鍵點匹配的數(shù)目的第一估計單元;不正確的關鍵點匹配由不對應于第一和第二圖像中描述的同一對象的同一點的第一和第二關鍵點形成。所述第一估計單元包括被配置為將權重參數(shù)初始化為初始值的初始化單元,和被配置為重復以下操作的加權單元:a)利用權重參數(shù)對模型概率加權,和b)增大權重參數(shù)的值,直到至少一個加權的模型概率的值達到與所述模型概率對應的、由直方圖在區(qū)間中計數(shù)的距離比率的數(shù)目。該裝置還包括被配置為基于由權重參數(shù)采用的最后一個值確定不正確的關鍵點匹配的數(shù)目的確定單元。優(yōu)選地,該裝置還包括被配置為估計正確的關鍵點匹配的數(shù)目的第二估計單元;所述第二估計單元被配置為基于第一關鍵點匹配的數(shù)目乘以等于一減去由權重參數(shù)采用的最后一個值得到的值的平方根的項來估計正確的關鍵點匹配的數(shù)目。根據(jù)本發(fā)明的更進一步實施例,該裝置還包括被配置為計算矩陣的第五計算單元;矩陣的每個元素對應于相應的關鍵點匹配對,并且具有與由直方圖在包括相應的關鍵點匹配對的距離比率的區(qū)間處采用的值和與所述區(qū)間對應的加權的模型概率之間的差異對應的值。該裝置還包括被配置為發(fā)現(xiàn)矩陣的主要特征向量的發(fā)現(xiàn)單元,和被配置為基于所述主要特征向量識別哪些關鍵點匹配最有可能是正確的關鍵點匹配的第二識別單元。本發(fā)明的更進一步方面提供了一種系統(tǒng),其包括被配置為接收查詢圖像并且識別所述圖像中的對應的第一關鍵點的關鍵點檢測單元和被配置為通過對應的第一局部描述符描述所述第一關鍵點的局部方面的特征計算單元。該系統(tǒng)還包括存儲多個參考圖像的參考數(shù)據(jù)庫;對于每個參考圖像,參考數(shù)據(jù)庫還存儲對應的第二關鍵點和第二關鍵點的對應的第二局部描述符。該系統(tǒng)還包括被配置為對于至少一組參考圖像的每個參考圖像,將第一局部描述符與所述參考圖像的第二局部描述符進行比較,并且因此使第一關鍵點與所述參考圖像的第二關鍵點關聯(lián)以生成對應的關鍵點匹配集合的特征匹配單元。該系統(tǒng)更進一步包括被配置為基于由特征匹配單元進行的比較來選擇參考圖的子集的選擇單元,和被配置為對于包括查詢圖像和子集的參考圖像的每一對,計算正確的關鍵點匹配的數(shù)目的優(yōu)化單元。根據(jù)本發(fā)明的實施例,該系統(tǒng)還包括可視搜索服務器和被配置為通過網(wǎng)絡與可視搜索服務器交換數(shù)據(jù)的多個終端。根據(jù)本發(fā)明的實施例,可視搜索服務器包括關鍵點檢測單元、特征計算單元、參考數(shù)據(jù)庫、特征匹配單元、選擇單元和優(yōu)化單元。根據(jù)本發(fā)明的另一個實施例,可視搜索服務器包括參考數(shù)據(jù)庫、特征匹配單元、選擇單元和優(yōu)化單元,以及每個終端包括相應的關鍵點檢測單元和相應的特征計算單元。根據(jù)本發(fā)明的更進一步實施例,可視搜索服務器包括參考數(shù)據(jù)庫,以及每個終端包括相應的關鍵點檢測單元、相應的特征計算部件、相應的特征匹配單元、相應的選擇單元、相應的優(yōu)化單元和相應的局部數(shù)據(jù)庫。每個終端被配置為從可視搜索服務器接收存儲在參考數(shù)據(jù)庫中的相應的第二關鍵點集合和第二關鍵點的對應的第二局部描述符,以及終端的局部數(shù)據(jù)庫被配置為存儲所述接收的第二關鍵點集合和第二局部描述符;所述存儲的第二關鍵點集合和第二局部描述符對應于至少一組參考圖像的參考圖像。附圖說明通過下列連同附圖閱讀的某些示范和非限定實施例的描述,將使得本發(fā)明的這些和其他特征和優(yōu)點明顯,其中:圖1A示出了其中兩個圖像的關鍵點彼此關聯(lián)以形成關鍵點匹配的示例;圖1B示出了圖1A的示例,其中僅僅描述內點;圖1C示出了與圖1A的示例對應的LDR直方圖;圖2示出了根據(jù)發(fā)明的實施例的外點模型函數(shù)的形狀;圖3A-3F示出了從取自Zurich建筑圖像數(shù)據(jù)庫中的一對圖像中生成的LDR直方圖的若干示例;圖4示出了其中查詢圖像和參考圖像描述從非常不同的角度觀看的同一平面對象的示范情況;圖5A和5B示出了其中顯示幾乎平面的對象的兩個示范情況,兩種情況具有觀察角度的適中差異;圖6顯示根據(jù)本發(fā)明的實施例的調整模型概率以估計內點的數(shù)目的示例;圖7A是示出了根據(jù)本發(fā)明的實施例的方法的第一階段的主要步驟的流程圖;圖7B是示出了根據(jù)本發(fā)明的實施例的方法的第二階段的主要步驟的流程圖;圖7C是示出了根據(jù)本發(fā)明的實施例的方法的第三階段的主要步驟的流程圖;圖8示意地示出了其中根據(jù)本發(fā)明的實施例的方法可以被用于實現(xiàn)可視搜索服務的可能情況;圖9A示出了根據(jù)本發(fā)明的實施例的實現(xiàn)可視搜索服務的系統(tǒng);圖9B示出了根據(jù)本發(fā)明的進一步的實施例的實現(xiàn)可視搜索服務的系統(tǒng);圖9C示出了根據(jù)本發(fā)明的更進一步的實施例的實現(xiàn)可視搜索服務的系統(tǒng);以及圖10是示出了根據(jù)本發(fā)明的實施例的自動攝像機校準方法的主要步驟的流程圖;具體實施方式如已經(jīng)在上面描述的,兩個圖像之間的比較提供將第一圖像的關鍵點與第二圖像的對應的關鍵點進行匹配。如果兩個圖像的對應關鍵點與同一對象的同一點(在兩個圖像中都描述)對應,則說明關鍵點匹配正確(內點);反之,如果兩個關鍵點與同一對象的同一點不對應,則說明關鍵點匹配不正確(外點)。在圖1A中示出的示例中,其中每個圖像是同一對象(教堂)的圖片,利用相應的實線描述每個關鍵點匹配。在圖1A的示范情況中示出的關鍵點匹配既包括內點又包括外點。而在圖1B中描述其中外點已經(jīng)被去除的相同示范情況的版本。在下面的描述中將呈現(xiàn)新穎的圖像比較方法。從在稱為查詢圖像或簡單地稱為查詢的第一圖像上生成的關鍵點集合開始,該關鍵點集合與在稱為參考圖像的第二圖像上生成的對應的關鍵點集合相關聯(lián),以便形成對應的關鍵點匹配集合,提出的方法包括主要階段和兩個后續(xù)的可選階段:1)主要階段在生成關鍵點匹配之后被應用,并且提供統(tǒng)計地處理關鍵點匹配并因此通過幾何一致性檢驗評估查詢圖像和參考圖像是否可以描述同一對象。更詳細地,在不正確的匹配(外點)的概率模型生成之后,進行擬合良好度檢驗以便決定參考圖像是否包含呈現(xiàn)在查詢圖像中的對象的視圖。在肯定的情況中,該方法能夠計算要用于排列在參考圖像中拍照的對象與在查詢圖像中拍照的對象之間的實際相似性的分數(shù)。2)第二(可選)階段允許評估在整個關鍵點匹配集合當中多少關鍵點匹配是內點。此階段可以被有利地執(zhí)行以增加可視搜索應用中的精度。3)第三階段(也可選)允許具體地識別哪些關鍵點匹配是內點、以及哪些關鍵點匹配是外點。可以在某些特定的應用(諸如增強逼真度)中有利地進行此階段。在本說明書的第1部分中將引進用于此方法的特定統(tǒng)計的性質,以及對數(shù)(log)距離比率的概念,這二者用于不正確的匹配和正確的匹配。下列三個部分(第2-4部分)公開了提出的方法的三個階段的數(shù)學和統(tǒng)計方面。第5部分公開了該方法的三個階段的主要步驟。最后部分(第6部分)針對提出的方法的示范應用。第1部分-距離比率統(tǒng)計考慮N個匹配的關鍵點的集合(x1,y1),...,(xi,yi),...,(xN,yN)(1)其中xi包含查詢圖像中的第i個關鍵點的坐標以及yi包含參考圖像中的它的匹配關鍵點的坐標。如果兩個關鍵點正確地匹配,則對(xi,yi)被稱為內點。反之,如果關鍵點不正確地匹配,則對被稱作外點。提出的方法使用在上面引用的Tsaietal的論文中提出的稱為對數(shù)距離比率(簡稱LDR)。關鍵點必須是不同的,即:xi≠xj,yi≠yj并且對于i=j,LDR未定義。LDR是長度比率的函數(shù),對于相似性是不變的。由于對數(shù)計算符的存在,如果查詢圖像與參考圖像交換(x變?yōu)閥并且反之亦然),則LDR符號反轉。給定包括查詢圖像上的N個關鍵點xi和參考圖像上的N個對應的關鍵點yi的N個匹配的關鍵點(xi,yi)的集合,存在數(shù)目個不同的對數(shù)距離比率。以對應的直方圖的形式表示此對數(shù)距離比率的統(tǒng)計分布,此處稱為“LDR直方圖”。LDR直方圖將由陣列h=[h1…h(huán)K]T表示。h是當對包含在以下稱為區(qū)間的K個預定義的間隔T1、…,Tk的每個之內的觀察的對數(shù)距離比率進行計數(shù)時出現(xiàn)的頻率的陣列。例如,這樣的區(qū)間可以是寬度等于下限值-2.5和上限值2.5之間的0.2的25個間隔,即:T1=[-2.5,-2.3>,T2=[-2.3,-2.1>,…,T25=[2.3,2.5]在圖1C中示出了與圖1A的情況對應的LDR直方圖的示例。LDR的主要優(yōu)點是它對于內點對和外點對的表現(xiàn)不同。對于許多圖像變換(支配內點怎樣表現(xiàn)),LDR只限于間隔。對于外點,LDR擴展到此類間隔外部并且它具有可以被用于擬合良好度檢驗的獨特的概率密度函數(shù)。LDR是兩個一般關鍵點對,即,(xi,yi)和(xj,yj)的函數(shù)。三個可能的條件可以存在:或者兩對是外點、兩對是內點,或者一個對是內點而另一個是外點。1.1-當兩對是外點時的LDR匹配處理不被關于圖像中場景的幾何的任何知識限制-因為這樣的知識在進行匹配前是不可用的。即使兩個圖像顯示相同的對象,也沒有防止錯誤匹配的機制。如果兩個圖像不顯示同一個或非常類似的對象,則任何匹配一定被認為不正確。即使匹配處理是確定性的,不正確地匹配的關鍵點的位置也是不可預測的。一般不可能發(fā)現(xiàn)用于外點的任何幾何模式,并且沒有可能推論此類模式的首要原則。因此,不正確的匹配被認為是隨機處理,并且通過恰當?shù)谋环Q為外點模型函數(shù)的密度函數(shù)建模外點的行為。外點模型函數(shù)的定義。設A和B是矩形。假設xi,xj∈A和yi,yj∈B是隨機繪制的與隨機變量Xi、Xj和Yi,Yj對應的點。設隨機變量C是LDRC=ldr(Xi,Xj,Yi,Yj)外點模型函數(shù)是C的概率密度函數(shù)fc(c)。外點模型函數(shù)可以被表示為兩個類型的關鍵點分布:正常和一致。正態(tài)分布的關鍵點坐標。正態(tài)分布關鍵點的假設導致外點模型函數(shù)的簡單公式,其是真實情況的良好近似。假設查詢圖像的關鍵點是獨立的并且被同等地分布(i.i.d.),表現(xiàn)的好像是利用平均值μ和方差(1/2)I正態(tài)分布的隨機變量X:假設已經(jīng)適當?shù)乜s放坐標以使得遍布整個圖像分布關鍵點(注意方差在水平方向和垂直方向是相同的)。然后,兩個關鍵點之間的差異也具有正態(tài)分布:Xi-Xj~N(0,I);i≠j(4)假設在參考圖像中的關鍵點{Yn}與{Xn}具有相同的統(tǒng)計,而且關鍵點Xn與關鍵點Yn相匹配。則,平方的距離比率具有(2,2)自由度的F分布如同所示,例如,在由R.J.Larsen和M.L.Marx于1986年第二版Prentice-Hall的第338頁的NewJersey提出的“數(shù)理統(tǒng)計和它的應用的入門”中。概率密度函數(shù)F(2,2)是其中為了簡化起見,用于等式5的隨機變量的符號已經(jīng)由S代替。因為考慮對數(shù)距離比率(而非平方距離比率),所以平方根和對數(shù)被用于隨機變量此外,為了解決兩個圖像的不同大小或兩個圖像中關鍵點的不同伸展,通過將隨機變量乘以由與兩個圖像中的關鍵點的標準偏差的比例對應的參數(shù)a,來將函數(shù)擴展至這樣的情況,即:對F(2,2)p.d.f.的這些修改產(chǎn)生下列外點模型函數(shù)。外點模型函數(shù)。設兩個圖像具有隨機關鍵點{Xn}和{Yn},它們全部具有二元正態(tài)分布,其中第一圖像中的方差為和第二圖像中的方差為設a2是方差的比例,申請人已經(jīng)確定對數(shù)距離比率具有概率密度函數(shù):等式7的外點模型函數(shù)在提出的方法的基礎。圖2示出了外點模型函數(shù)的方面。應該注意,因為水平和垂直方差應當相同,所以此外點模型函數(shù)不能說明矩形圖像的長寬比。圖3A-3F示出了若干示例,每個顯示取自Zurich建筑圖像數(shù)據(jù)庫(由1005個圖像組成,在5個視圖中,每個視圖有201個建筑)中的相應圖像對(查詢圖像-參考圖像)。通過圓圈指示關鍵點,而直線指向另一個圖像中匹配的關鍵點的位置。對每個圖像對,在等式7的公式中示出了LDR直方圖和對應的外點模型函數(shù)。應當注意,因為圖像顯示不同的建筑,所以全部關鍵點匹配必須被認為是外點。從這些示例中,可以看出無論何時所有匹配是外點,外點模型函數(shù)很好地近似LDR直方圖。1.2-當兩對是內點時的LDR一般地,對于所有關鍵點匹配是內點的情況的LDR直方圖常常很不同于對于外點的LDR直方圖。在許多實際的情況中,對于僅內點的LDR直方圖比對于僅外點的LDR直方圖窄,即,它在LDR外點直方圖是非零的許多區(qū)間(具體地,橫向區(qū)間)內等于零。因為在兩個圖像中關聯(lián)的關鍵點xi和yi而有關,所以考慮LDR直方圖的上下界限而不是使用概率模型是有利的。此處進行的研究限于在3D場景中的平面表面上的點,因為主要考慮的是利用深度的有限方差識別對象。平面表面近似圖像中的許多感興趣對象的可見部分,諸如建筑物、書和廣告牌。通過單應(homography)H使平面表面上的點的兩個圖像相關,其中x和y是兩個圖像中相同點的投影的坐標。因此通過同一個單應使在同一個平面表面上的內點對相關。現(xiàn)在將公開用于仿射變換和一般單應的LDR直方圖的特征。仿射變換。仿射變換是單應的特殊情況使得yn=Kxn+t。距離比率被限制在由2x2矩陣K的奇異值給定的間隔,σmin||xi-xj||≤||yi-yj||≤σmax||xi-xj||在這種情況下LDR處在以下間隔中l(wèi)dr(xi,xj,yi,yj)∈[-lnσmax,-lnσmin](10)LDR直方圖的非零部分的寬度因此取決于仿射變換使對象變形到什么程度。對相似性變換,兩個奇異值相等,因此LDR直方圖僅僅一個不同于零的區(qū)間。如果仿射變換將長度最多壓縮至三分之一并且最多擴大2倍,則兩個奇異值是1/3和2,并且用于LDR的非零值的間隔是單應。假設通過以下單應矩陣來使表述xi,xj和yi,yj相關,如在等式8和9中一樣。LDR在這種情況下也被限制在間隔ldr(xi,xj,yi,yj)∈[-lnb,-lna](11)其中a是最大的數(shù)且b是最小的數(shù),使得a||xi-xj||≤||yi-yj||≤b||xi-xj||(12)對單應的大多數(shù)實際情況,此間隔相對于用于外點的LDR的直方圖是窄的,主要是由于采用的特征的性質。像SIFT(尺度不變特征變換)和SURF(加速魯棒特征)這樣的特征對相似性變換是不變的而對仿射變換則不是,更不用說單應。這意味著如果透視畸變是嚴重的使得[-lnb,-lna]理論上可以是寬的,則可能生產(chǎn)極限LDR值的關鍵點不能被相關聯(lián),因為他們的特征將具有不同的描述符。所以,用于正確地關聯(lián)的關鍵點的內點直方圖很可能保持在相對窄的間隔中。圖4示出了查詢圖像和參考圖像描述從不同角度(在示例中,-75和0度)觀察的同一平面對象(矩形)的示范性情況。圖4的底部圖描述LDR直方圖和由所述圖像對計算的外點模型函數(shù)。圖5A和5B示出了顯示幾乎平面的物體(建筑物面)的兩個示范情況,其中觀察角度有中等差異。圖5A和5B的底部圖描述對應的LDR直方圖和外點模型函數(shù)。1.3-具有兩個類型的對的LDR第三替換方式提供配對xi,yi是內點并且xj,yj是外點(反之亦然)。也在這種情況下,假設在一個圖像中的關鍵點是隨機地分布的,因為人預先不知道限制包含在未知圖像中的關鍵點的位置的任何幾何模式或規(guī)則。因此每個關鍵點可以由例如利用如在等式3中的正態(tài)分布的隨機變量表示。如在等式4中建模兩個關鍵點之間的差異向量,由于一個是內點和另一個是外點,而且它們之間可以沒有相關性。但是,等式5的F分布不準確地成立,因為分子和分母不是獨立的,與F分布的假設相反。在內點/外點對的情況下的關鍵點是(xi,yi),(xj,π(xj))其中π是內點關鍵點在一個圖像到另一個圖像中的映射(雖然未知)。表示平方的距離比率的隨機變量在這種情況下將是其中分子和分母很清楚不是獨立的,由于二者是Xj的函數(shù)。得到等式13中的變量的概率密度是相當困難的,但是就考慮提出的方法而言,可能不是必需的。通過經(jīng)驗來假設,在小的誤差的情況下,可以利用相同的模型概率對這兩種情況(與內點/外點對相反的兩個內點對)的LDR的直方圖進行建模:等式7的外點模型函數(shù)。第二部分-非匹配圖像的拒絕(提出的方法的第1階段)LDR直方圖可以用于識別圖像(查詢圖像)中可見的對象。這里,′識別′意味著在參考集合(參考數(shù)據(jù)庫)的參考圖像當中發(fā)現(xiàn)包含查詢圖像中描述的對象的視圖的參考圖像。提出的方法的第1階段允許識別對象而不需要明確地檢測查詢圖像和參考圖像之間的內點關鍵點對。提出的方法的第1階段是幾何一致性檢驗,其提供做出假設之間的二元決定:H0:參考圖像不對應于查詢;H1:參考圖像對應于查詢。H0假設表示事物的期望狀態(tài):已知幾乎所有的參考圖像不包含查詢中的對象的視圖。為了拒絕H0并且接受H1必需一定量的證據(jù)(例外的事件)。在LDR直方圖和外點模型函數(shù)之間的關系中發(fā)現(xiàn)此證據(jù)。如果直方圖最佳地符合外點模型函數(shù),則接受H0假設;如果不符合,則接受H1假設。為了檢驗這樣的假設,提出的方法提供進行Pearson卡方檢驗(參見,例如R.J.Larsen等的已經(jīng)引用的研究的第402-403頁。)。在應用Pearson檢驗之前,引入“離散化的外點模型函數(shù)”的概念。設區(qū)間,即用于組成LDR直方圖的LDR值的間隔,由Tk,k=1,...,K表示。離散化的外點模型函數(shù)將概率值分配到K個區(qū)間的每一個,p:{1,...,K}→[0,1]以使得在每個第k個區(qū)間中,值等于外點模型函數(shù)在該區(qū)間內的積分,并且其中每個值p(k)稱為“模型概率”。為了符號的統(tǒng)一,模型概率將被認為是序列pk的元素。pk=p(k);k=l,...,K。將在LDR直方圖和離散化的外點模型函數(shù)之間執(zhí)行Pearson卡方檢驗。Pearson檢驗。在α顯著性級別,如果則H1假設被接受,其中n=N(N-l)/2是用于建立LDR直方圖的觀察的總數(shù),即,關鍵點匹配(xi,yi),(xj,yj)對的數(shù)目。閾值是具有K-1自由度的卡方分布的的100(1-α)百分比。H1假設的接受意味著參考圖像是用于表示查詢圖像中的對象的候選者。可以使用超出閾值的裕度作為兩個圖像之間的類似性的度量:見等式15。具有最大的ρ的參考圖像(的索引)可以被選擇為用于查詢圖像中的對象的身份。如果超過一個參考圖像具有大ρ,則或者查詢圖像顯示存在于全部所述參考圖像中的若干對象,或者所述參考圖像描述很相似的對象。此問題可以通過對參考集合的認識或相反通過對手邊的識別任務的認識而得到具體的解決方案。如果LDR直方圖實際上來源于具有外點模型函數(shù)作為概率密度的源,則參數(shù)α是接受錯誤的參考圖像的概率。第3部分-內點的數(shù)目的估計(提出的25方法的第2階段)通常有興趣知道存在于相關的關鍵點匹配集合中的內點的數(shù)目。此數(shù)目可以本身有用,或可以是將內點與外點分離所必需的,如在部分4中將示出??梢岳肔DR直方圖估計此數(shù)目。由于關鍵點匹配落入兩個不同的類別,因此直方圖由兩個稱為直方圖分量的項形成,一個用于每個類別。用于內點和外點的直方圖完全不同,并且實際上此差異用于分離兩個分量并表示它們的相對權重。如先前討論的,如果關鍵點匹配是外點,則直方圖看來像外點模型函數(shù)。此外,如果直方圖類似外點模型函數(shù),則對是外點。更通常,如果直方圖可以被分解成兩項,而一項看來像外點模型函數(shù),則該項應歸于外點。此原理將用于推測外點的數(shù)目并且甚至識別它們。如果正確地關聯(lián)(xi,yi)和(xj,yj),則關鍵點匹配對是內點。如果錯誤地關聯(lián)關鍵點匹配的一個或兩個,則關鍵點匹配對是外點。Pin表示關鍵點匹配對僅僅包含內點的概率,并且Pout表示對中的元素的至少一個是外點的概率。設z是用于關鍵點匹配對的LDR的值,并設p(z|in)和p(z|out)表示條件概率密度。用于外點的條件概率被假設為等式7的外點模型函數(shù),p(z|out)=fZ(z)則總體慨率密度具有形式pZ(z)=Pin··p(z|in)+Pout·fZ(z)(17)此等式相應于LDR直方圖分解成為兩項hk=dk+gk;k=l,...,K(18)其中hk表示LDR直方圖,dk是由于內點的它的分量,以及gk是由于外點的分量。用于估計內點的數(shù)目的方法基于外點分量gk非常近似于它的期望值的假設,其導致hk=dk+E(gk)=dk+n·Poutpk(19)其中模型概率pk是外點模型函數(shù)在第k個區(qū)間間隔內的積分并且n=N(N-l)/2是用于構造LDR直方圖的關鍵點匹配對的數(shù)目。等式19中有兩個未知量:外點概率Pout和內點分量dk。因為內點分量必須是非負的,因此等式19可以被重寫為hk-n·Poutpk≥0(20)其從等式中消除內點分量。我們假設內點分量在某些區(qū)間內是零,如第1部分中討論的,因此在那些區(qū)間內,外點分量必須等于直方圖值。這意味著外點概率Pout應該足夠大以使等式20中的差異達到具有指數(shù)k的某一區(qū)間的下界0。因此,執(zhí)行搜索以用于在預先定義的值的小集合中發(fā)現(xiàn)外點概率的最大可能的值。搜索外點概率。設hk,k=l,...,K表示LDR直方圖中的區(qū)間。設pk表示模型概率,并且設n表示用來構造直方圖的關鍵點匹配對的數(shù)目。設是Pout的預先定義的合格值的集合。申請人已經(jīng)確定,關鍵點匹配對至少包含外點的估計的概率是Pout=max{β:β∈B,hk≥nβpk;k=l,...,K}(21)概率1-Pout是在全部關鍵點匹配對(xi,yi),(xj,yj)之中的內點的相對分數(shù)。為了獲得內點對(xi,yi)的數(shù)目,不得不考慮關鍵點對的數(shù)目N和關鍵點匹配對的數(shù)目n=N(N-1)/2,因為通過對全部配對(xi,yi),(xj,yj)計數(shù)得出直方圖以使得i<j。如果內點對的數(shù)目由m表示,則由內點組成的關鍵點對配對的分數(shù)是基于關于分布的估計和假設,等式22具有低的精確度。因此,對m的近似解是優(yōu)選的。內點關鍵點對的估計的數(shù)目則是圖6顯示縮放模型概率以估計內點的數(shù)目的示例。在此示例中,在兩個圖像中描述同一對象(房子)。底部圖顯示LDR直方圖hk(實線標繪的)和估計的外點直方圖(點劃線標繪的)。在這種情況下,估計內點的數(shù)目是關鍵點的總數(shù)的三分之一。第4部分-最有可能的內點的識別(提出的方法的階段3)在前面的步驟已經(jīng)完成之后,全部必要的量可以用來確定內點直方圖分量,dk=hk-n·Poutpk(見等式19)。此分量可以用來分開內點和外點,如本節(jié)所示。每個關鍵點匹配對與對數(shù)距離比率值對應,并且內點直方圖分量表示該對包含內點是多大概率。此信息用來公式化具有每個關鍵點對的二元值作為參數(shù)的似然函數(shù);值1指對是內點,0指它是外點。利用內點的給定數(shù)目作為約束,最大化此似然函數(shù)的參數(shù)將指示最有可能的內點集合。設N是關鍵點匹配的數(shù)目,并且設u是N個元素的二元向量u∈{0,1}N(24)具有值1的元素指示對應的關鍵點對是內點,那些具有值0的元素指示外點。像在之前的部分中的進程的進程產(chǎn)生內點的數(shù)目m的估計(等式22),所以可以增加約束等式2的LDR對每個關鍵點匹配對是已知的,zij=ldr(xi,xj,yi,yj);i≠j(26)理想地,如果人們已經(jīng)知道用于內點的條件概率密度,則人們可以簡單地通過將全部用于內點的概率求和來向內點集合的任何一個假設分配似然值,因為u是二元的,所以此和可以被寫為在等式23和24的約束之下最大化等式27中的L的二元向量u表示最大可能的m個內點的集合。必須修改等式27以產(chǎn)生實用的算法。在不存在用于內點概率密度p(z|in)的閉合形式的情況下,它被等式19的內點直方圖分量d替代。為了理解此段落,有用的是引入量化器qq(z)=argmink=l,...,K||z-ζk||(29)其產(chǎn)生最接近于值z的對區(qū)間中心(在全部區(qū)間中心ζ1,...,ζK之中)的索引。這允許近似p(z|in)≈p(ζq(z)|in)(30)下列等式顯示概率的此近似值與用于LDR直方圖的內點分量的期望值成比例:其中比例常數(shù)是:n,關鍵點匹配對的總數(shù);Pin,在成對的兩個對是內點的概率;以及δ,區(qū)間的寬度。等式27中的理想似然函數(shù)現(xiàn)在可以被替代為其中已經(jīng)省略等式31的常數(shù)因子,因為它們未推動最大化G(u)的解。在矩陣形式上,以上等式變?yōu)椋篏(u)=uTDu(33)其中矩陣D包含來自于內點直方圖中的值,具有下式作為元素i,j內點識別問題現(xiàn)在可以被表示為:最大化uTDu(35)服從u∈{0,1}N當矩陣D具有滿秩時,最優(yōu)解很難計算。在A.Egozi,Y.Keller和H.Guterman在IEEETransactionsonImageProcessing,vol19,pages1319-1326,May2010上提出的“Improvingshaperetrievalbyspectralmatchingandmetsimilarity”中提供近似解的方法,其面對類似于等式33的問題。這里,二元優(yōu)化被更簡單的下式替代最大化wTDw(36)服從w∈RN,||w||=1其中解是D的主要本征向量(與最大的本征值對應的本征向量)。此向量的元素常?;蛘呓咏诹慊蛘呓咏谧畲笾?已經(jīng)選擇符號以使得最大值是正的)。然后,本征向量w用來按照下列關系,通過采用它的m個最大元素(m是等式22的內點的估計數(shù)目),來獲得二元向量u;[w*,i]=sort(w,′descend′)(37)其中sort(w,'descend’)是以遞減排列陣列w的元素的Matlab(屬于MathWorks)的函數(shù),生成對應的有序排列w。函數(shù)sort(w,'descend’)生成進一步的陣列i,它的元素是陣列w的元素的索引,如在陣列w*中一樣排序。結果u是內點集合的良好近似,因為可以在實際的實驗中驗證??焖俦菊飨蛄坑嬎?。估計的內點與D的主要本征向量中的m個最大元素對應。目標是盡可能快地保持本征向量計算,也以某些精確度為代價。在本領域已知用于發(fā)現(xiàn)主要本征向量的方法(參看例如由L.Tredethen和D.Bau在TheSocietyforIndustrialandAppliedMathematics,1997的“NumericalLinearAlgebra”中公開的乘方迭代和瑞利商迭代。兩個方法是迭代的并依靠主要本征向量的初始猜測,并且粗略估計的候選者是接近于對于像D的非負條目的矩陣的平均列。第5部分-方法的主要步驟現(xiàn)在將在圖7A-7C中示出之前描述的方法的主要步驟。具體地,圖7A是示出了根據(jù)本發(fā)明的實施例的方法的第一階段的主要步驟的流程圖。如上已經(jīng)描述的,方法的第一階段提供評估第一圖像和第二圖像是否描述同一對象與否。假設從被比較的圖像對開始,即,包括N關鍵點Xi的第一圖像(查詢圖像)和包括N關鍵點yi的第二圖像(參考圖像)。在查詢圖像上的每個關鍵點Xi被關聯(lián)到參考圖像上的對應的關鍵點yi以便定義相應的關鍵點匹配(xi,yi)。第一步驟提供利用對相似性不變的距離比率的函數(shù)由關鍵點匹配(xi,yi)生成距離比率直方圖。例如,利用等式2由關鍵點匹配(xi,yi)生成對數(shù)距離比率(LDR)直方圖(方塊702)。然后通過利用關聯(lián)到在第一步驟中使用的距離比率的函數(shù)的概率密度函數(shù)生成對應的外點模型函數(shù),例如在如等式2定義的對數(shù)距離比率(LDR)函數(shù)的情況下,通過利用等式7(方塊704)。下一步驟由離散化先前計算的外點模型函數(shù)組成(方塊706),例如通過將等式14應用到先前計算的外點模型函數(shù)以便獲得它的離散化的版本。然后通過利用用于評估所有關鍵點匹配是否被認為是隨機的Pearson檢驗(等式15),將LDR直方圖和離散化的外點模型函數(shù)進行比較(方塊708)。具體地,在Pearson檢驗的結果產(chǎn)生LDR直方圖與離散化的外點模型符合良好的情況下(方塊710的伸出分支Y),這意味著所有或幾乎所有的關鍵點匹配是外點,并且因此參考圖像不顯示在查詢圖像中描述的任意對象。然后,方法結束。反之,如果Pearson檢驗的結果暗示LDR直方圖與離散化的外點模型不符合(方塊710的伸出分支N),則這意味著許多關鍵點匹配很可能是內點,因此參考圖像可以大概顯示查詢圖像中已經(jīng)描述的對象。在此后一種情況中,如果期望,方法進行到第二階段。圖7B是示出了根據(jù)本發(fā)明的實施例的方法的第二階段的主要步驟的流程圖。基于先前描述的“搜索外點概率”,此階段允許評估在關鍵點匹配集合當中有多少關鍵點匹配是內點。第一步驟提供初始化等式21的因子β(方塊712);例如,β被初始化為零。因子β用于對離散化的外點模型函數(shù)加權以便與LDR直方圖相比較。此步驟的目的是通過等式21估計任何已知的關鍵點匹配對包含至少一個外點的概率。具體地,一旦對每個k計算nβpk(方塊714)并且通過將預先確定的量與先前假設的值相加來更新項β(方塊716),就做出先前計算的nβpk與對應的hk(每個k)之間的比較。如果,對于每個k,hk結果高于先前計算的nβpk(塊718的伸出分支Y),意味著加權的離散化的外點模型函數(shù)低于LDR直方圖,則通過利用β的更新的值進行nβpk的新的計算(返回到塊714)。當對于至少一個k,nβpk達到hk時(塊718的伸出分支N),這意味著加權的離散化的外點模型函數(shù)的部分(具體地,它的橫向尾部)已經(jīng)達到或超過LDR直方圖的對應的部分。因此,根據(jù)等式21,關鍵點匹配對包含至少一個外點的概率Pout被認為等于由β假設的最后一個值(塊720)。關鍵點匹配對包含至少一個內點的估計概率Pin因此被設置為等于1-Pout(塊722)。內點的數(shù)目m則利用等式23計算(塊724)。在這一點上,如果期望,方法進行到第三階段。圖7C是示出了根據(jù)本發(fā)明的實施例的方法的第三階段的主要步驟的流程圖。此階段允許具體地識別哪些關鍵點匹配是內點,以及哪些關鍵點匹配是外點,求解最大化問題36。第一步驟提供建立如關系34中描述的內點矩陣D(塊726)。最大化問題36則被求解以發(fā)現(xiàn)內點矩陣D的主要本征向量w(塊728)。最后,通過利用在關系37和38中先前發(fā)現(xiàn)的本征向量w計算內點集合的近似(塊730)??梢杂蛇m當?shù)奶幚韱卧M行本節(jié)中描述的方法的步驟,它的結構和功能取決于它們針對的應用的特定領域。例如,每個處理單元可以是具體地被設計為執(zhí)行方法的一個或多個步驟的硬件單元。此外,可以由可編程機器(例如計算機)在對應的指令集的控制下進行方法的步驟。第6部分-方法的一些示范性應用圖8示意地示出了其中先前描述的方法可以被用于實現(xiàn)根據(jù)本發(fā)明的實施例的可視搜索服務的可能的情形。根據(jù)客戶端-服務器配置建立利用參考800識別的圖8的情形,其中可視搜索服務器810被配置為通過諸如MAN、WAN、VPN、互聯(lián)網(wǎng)或電話網(wǎng)絡之類的外部網(wǎng)絡830與多個用于交換數(shù)據(jù)的終端820交互。每個終端820可以是個人計算機、筆記本、膝上計算機、個人數(shù)字助理、智能電話機、或能夠管理數(shù)目圖像的任何一個電子設備。根據(jù)在圖9A中示出的本發(fā)明的實施例,由可視搜索服務器810進行可視搜索服務的所有主要操作。請求與在圖片中描述的對象有關的信息的終端820的用戶將所述圖片(其變?yōu)椴樵儓D像)通過網(wǎng)絡830發(fā)送到可視搜索服務器810??梢曀阉鞣掌?10包括被適配為與網(wǎng)絡830交互以從/到終端820接收/發(fā)送數(shù)據(jù)的服務器接口902。通過服務器接口902,可視搜索服務器810接收要被分析的查詢圖像。將查詢圖像提供到被配置為識別包括在所述圖像中的關鍵點的關鍵點檢測單元904。一旦生成了關鍵點,就由特征計算單元906描述它的局部方面。由特征計算單元906利用已知的局部描述符進行此操作,諸如尺度不變特征變換(SIFT)和加速魯棒特征(SURF)。可視搜索服務器810還包括與存儲要被用于圖像識別的參考圖像的參考數(shù)據(jù)庫910耦接的特征匹配單元908。由特征匹配單元908利用已知的圖像特征比較技術進行從查詢圖像中提取的局部描述符與存儲在參考數(shù)據(jù)庫中的參考圖像的局部描述符之間的比較,例如基于描述符當中的歐幾里德距離。特征匹配單元908輸出包括對于參考數(shù)據(jù)庫的每個參考圖像的對應的關鍵點匹配集合的對應列表。在查詢圖像中描述的對象不對應于任何參考圖像中描述的任何對象的情況下,此列表可以是空的?;谟商卣髌ヅ鋯卧?08生成的列表,選擇單元912選擇與查詢圖像共享最大數(shù)目的關鍵點匹配的第一q個參考圖像。這些參考圖像應當是用于包括查詢圖像中描述的對象的最佳候選者。根據(jù)本發(fā)明的實施例,可視搜索服務器810還包括被配置為實現(xiàn)先前描述的方法的優(yōu)化單元914。優(yōu)化單元914將所述方法應用到與由選擇單元912選擇的q個參考圖像的集合對應的關鍵點匹配:對于包含查詢圖像和集合的參考圖像的每個對,優(yōu)化單元914計算正確的關鍵點匹配(內點)的數(shù)目。根據(jù)方法的第一階段進行此計算,優(yōu)選地根據(jù)方法的開頭兩個階段(即,在圖7A和7B中示出的那些階段)。如果也執(zhí)行在圖7C中示出的方法的第三階段(例如當期望獲得查詢圖像中描述的對象位于參考圖像中的指示時),優(yōu)化單元914能夠具體地識別哪些關鍵點匹配將要被認為是內點。導致包括與查詢圖像的對應關鍵點正確地匹配的足夠數(shù)目的關鍵點的集合的參考圖像被認為包括至少(一部分)查詢圖像中描述的同一對象。然后通過網(wǎng)絡830將這些后者參考圖像作為可視搜索請求的結果發(fā)送回終端820,可能基于計數(shù)的內點的數(shù)目而排序。根據(jù)圖9B中示出的本發(fā)明的進一步的實施例,關鍵點檢測單元904和特征計算單元906被包括在終端820中而不是被包括在可視搜索服務器810中。在這種情況下,不是將查詢圖像發(fā)送到可視搜索服務器810,而是每個終端820能夠直接發(fā)送由查詢圖像局部地生成的局部描述符。和前面實施例相比,這種解決方案需要更少量的數(shù)據(jù)的傳送(局部描述符而不是整個查詢圖像)。而且,根據(jù)此實施例,可視搜索服務器810管理的計算負載被降低,允許后者在同一時間內管理更多的圖像搜索請求。根據(jù)圖9C中示出的本發(fā)明的更進一步的實施例,由終端820進行可視搜索服務的幾乎所有的主要操作,其中可視搜索服務器810僅存儲參考圖像的關鍵點和局部描述符,并且基于由終端的用戶請求的特定可視搜索將它們的選擇的子集發(fā)送到終端。例如,在終端820是配備有GPS系統(tǒng)的智能機并且查詢圖像是由智能機本身的照相機拍攝的照片的情況下,可以基于終端820的實際位置選擇要由可視搜索服務器810發(fā)送哪些關鍵點和局部描述符;對于某些諸如紀念識別服務之類的可視搜索服務,可以有利地采用此解決方案。為了能夠管理圖像比較操作,終端820具備局部參考數(shù)據(jù)庫916和更新單元920,后者被適配為接收由可視搜索服務器810發(fā)送的關鍵點和局部描述符并且因此更新前者。應當理解,不是嚴格地需要在每次進行圖像比較時更新局部參考數(shù)據(jù)庫916,足以開發(fā)已經(jīng)存儲在其中的關鍵點和局部描述符。例如,局部參考數(shù)據(jù)庫916可以被可視搜索服務器810一天僅更新一次。和前面實施例相比,這種解決方案是快速的,因為被發(fā)送的數(shù)據(jù)量強烈地減少。因此,這種解決方案特別適合于增強逼真度應用。提出的方法的進一步可能的應用是屬于立體照相機系統(tǒng)的攝像機的自動校準。校準的目標是所謂的基本矩陣的生成,基本矩陣即描述采集系統(tǒng)的固有和外來參數(shù)的矩陣。固有參數(shù)描述照相機配置(例如,焦距),而外來參數(shù)描述照相機在空間內的位置。如在圖10的圖解流程圖中示出的,第一照相機1002獲取第一圖像(方塊1004),其被處理以便識別對應的第一關鍵點(方塊1006)。一旦識別第一關鍵點,就通過對應的第一局部描述符描述它的局部方面(方塊1008)。類似地,第二照相機1010獲取第二圖像(方塊1012),其被處理以便發(fā)現(xiàn)對應的第二關鍵點(方塊1014)。然后,通過對應的第二局部描述符描述那些關鍵點的局部方面(方塊1016)。通過比較第一局部描述符與第二局部描述符,生成第一和第二圖像之間的關鍵點匹配(方塊1018)。然后,通過應用在圖7A-7C中示出的方法的三個階段,識別作為內點的關鍵點匹配(方塊1020)。一旦已經(jīng)識別了內點后,進行用于估計基本矩陣的迭代過程(方塊1022)以便發(fā)現(xiàn)新的關鍵點匹配(方塊1024)??梢园凑誖.Hartley在IEEETransactionsonpatternanalysisandmachineintelligence,Vol19,No.6,June1997中的“IndefenseoftheEight-PointAlgorithm”描述的進程進行這些操作。然后再利用圖7A-7C中示出的方法的三個階段再次處理新的關鍵點匹配以便識別內點(方塊1026)。重復此進程(即,與方塊1022、1024和1026對應的進程)直到內點的數(shù)目穩(wěn)定。前面的說明書詳細地呈現(xiàn)并討論了本發(fā)明的一些實施例;然而,在不脫離附加的權利要求書定義的范圍內,對描述的實施例的一些改變以及不同的發(fā)明實施例是可能的。例如,盡管在本說明書中已經(jīng)提及對數(shù)距離比率(LDR),但是如果利用差異距離比率,諸如沒有對數(shù)的普通距離比率,來構造直方圖,則類似的考慮適用;而且,如果利用對數(shù)距離比率的倍數(shù)和/或冪構造直方圖,則類似的考慮適用。此外,毫不妨礙利用不同于直方圖的表示來表達距離比率的統(tǒng)計分布;在這種情況下,Pearson檢驗應該由與選擇的特定表示兼容的等效檢驗代替。而且,即使直方圖的區(qū)間的寬度彼此不同,也可以適用本發(fā)明的概念。
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
龙门县| 四子王旗| 大石桥市| 鹿邑县| 二手房| 天祝| 葫芦岛市| 白银市| 韶山市| 区。| 五莲县| 永和县| 玉山县| 新疆| 青河县| 孟村| 油尖旺区| 竹溪县| 丰顺县| 齐河县| 宜都市| 海城市| 玉龙| 叙永县| 土默特右旗| 新乡县| 历史| 枣庄市| 威信县| 巨野县| 清新县| 临湘市| 武汉市| 正阳县| 康平县| 若羌县| 西充县| 河西区| 句容市| 五家渠市| 新余市|