一種基于單張圖片的建筑物俯視輪廓的快速提取方法
【專利摘要】本發(fā)明公開一種基于單張圖片的建筑物俯視輪廓的快速提取方法,該方法無需事先進(jìn)行機(jī)器學(xué)習(xí)或者基于多張圖片的三維重構(gòu),僅通過單張圖片就可以提取出圖片內(nèi)目標(biāo)建筑物的俯視輪廓,在不失準(zhǔn)確度的情況下,極大地提高了提取的速度。
【專利說明】一種基于單張圖片的建筑物俯視輪廓的快速提取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)視覺領(lǐng)域,尤其涉及一種基于單張圖片的建筑物俯視輪廓的快 速提取方法。
【背景技術(shù)】
[0002] 三維重構(gòu)在計(jì)算機(jī)視覺領(lǐng)域一直以來是個(gè)被深入研究但依然還存在很多未解問 題的話題。三維重構(gòu)在各種應(yīng)用場合、生活場景中都起到了重要的作用,例如機(jī)器人的視覺 導(dǎo)航、城市三維地圖的重建等。從非俯視圖片中提取建筑物頂部輪廓在某種程度上可以視 為三維重構(gòu)的子問題。現(xiàn)有的某些基于多張圖片或者視頻(等價(jià)于多張圖片)的三維重構(gòu) 的技術(shù)方案是利用空間幾何關(guān)系的約束(例如三角定位法)來估算圖片里每個(gè)特征點(diǎn)的深 度來進(jìn)行三維重構(gòu)。而基于單張圖片的三維重構(gòu)往往需要復(fù)雜的機(jī)器學(xué)習(xí)或者基于一些假 設(shè)的求解線性規(guī)劃的方法。其中一種方法認(rèn)為大多數(shù)三維場景可以被分割為許多小塊的近 似平面,因此輸入一張圖片后,它先用超像素分割算法把圖片里的三維場景分割為許多近 似平面的超像素,然后對于每個(gè)超像素平面,它試圖推測其位置和朝向。對于人們來講,超 像素的位置信息可以從不同的視覺深度線索來判斷,比如草坪的材質(zhì)從近處看和從遠(yuǎn)處看 就不太一樣;綠色的部分更可能是地上的草;藍(lán)色的部分更可能是天空等等。因此文中通 過有指導(dǎo)學(xué)習(xí)的方法先事學(xué)習(xí)這些視覺線索和不同深度之間的關(guān)系。具體的學(xué)習(xí)算法采用 了馬爾科夫條件隨機(jī)場,這樣就可以考慮鄰近超像素平面之間相對深度的約束。例如兩塊 相鄰的圖塊更可能是同一個(gè)深度或者甚至是共平面的,而不是相距很遠(yuǎn)的。然后再根據(jù)事 先學(xué)習(xí)好的知識(shí)推斷圖片中每個(gè)超像素塊的三維關(guān)系。但是,這種方法的計(jì)算量大,常常需 要較大的時(shí)延來計(jì)算出結(jié)果,且精度低,需要事先進(jìn)行有指導(dǎo)學(xué)習(xí)。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明的目的在于通過一種基于單張圖片的建筑物俯視輪廓的快速提取方法,來 解決以上【背景技術(shù)】部分提到的問題。
[0004] 為達(dá)此目的,本發(fā)明采用以下技術(shù)方案:
[0005] -種基于單張圖片的建筑物俯視輪廓的快速提取方法,假設(shè)圖片中目標(biāo)建筑為最 高建筑,且圖片里的場景符合曼哈頓世界假設(shè),該方法步驟如下:
[0006] A、利用線段檢測算法從圖片中檢測出所有線段;
[0007] B、從圖片頂部開始,查找建筑物上最高的線段即目標(biāo)建筑頂部輪廓的線段,并選 取找到的第一根線段的端點(diǎn)作為根節(jié)點(diǎn);
[0008] C、依據(jù)線段相對水平面上兩個(gè)消點(diǎn)的位置,將從所述根節(jié)點(diǎn)起查找出的所有線段 分為兩類;
[0009] D、根據(jù)步驟C中的兩類線段生成兩條新線段,其中,所述兩條新線段的方向?yàn)槊?類線段的平均方向,兩條新線段的長度為每類線段中最長線段的長度;
[0010] E、把所述新線段鏈接到根節(jié)點(diǎn)上,并將新線段的另一個(gè)端點(diǎn)作為新的根節(jié)點(diǎn),重 新執(zhí)行步驟C,開始重復(fù)添加新的線段,直至從所述新的根節(jié)點(diǎn)起再也找不到新的線段,從 而得到所述目標(biāo)建筑頂部輪廓線段的鏈表;
[0011] F、根據(jù)線段所屬消點(diǎn)的類型以及線段的朝向校正它們之間的夾角,獲得目標(biāo)建筑 物的俯視輪廓。
[0012] 特別地,所述步驟F中根據(jù)線段所屬消點(diǎn)的類型以及線段的朝向校正它們之間的 夾角,具體包括:
[0013] 根據(jù)線段所屬消點(diǎn)的類型以及線段的朝向校正它們之間的夾角,計(jì)算公式如下:
[0014]
【權(quán)利要求】
1. 一種基于單張圖片的建筑物俯視輪廓的快速提取方法,其特征在于,假設(shè)圖片中目 標(biāo)建筑為最高建筑,且圖片里的場景符合曼哈頓世界假設(shè),該方法步驟如下: A、 利用線段檢測算法從圖片中檢測出所有線段; B、 從圖片頂部開始,查找建筑物上最高的線段即目標(biāo)建筑頂部輪廓的線段,并選取找 到的第一根線段的端點(diǎn)作為根節(jié)點(diǎn); C、 依據(jù)線段相對水平面上兩個(gè)消點(diǎn)的位置,將從所述根節(jié)點(diǎn)起查找出的所有線段分為 兩類; D、 根據(jù)步驟C中的兩類線段生成兩條新線段,其中,所述兩條新線段的方向?yàn)槊款惥€ 段的平均方向,兩條新線段的長度為每類線段中最長線段的長度; E、 把所述新線段鏈接到根節(jié)點(diǎn)上,并將新線段的另一個(gè)端點(diǎn)作為新的根節(jié)點(diǎn),重新執(zhí) 行步驟C,開始重復(fù)添加新的線段,直至從所述新的根節(jié)點(diǎn)起再也找不到新的線段,從而得 到所述目標(biāo)建筑頂部輪廓線段的鏈表; F、 根據(jù)線段所屬消點(diǎn)的類型以及線段的朝向校正它們之間的夾角,獲得目標(biāo)建筑物的 俯視輪廓。
2. 根據(jù)權(quán)利要求1所述的基于單張圖片的建筑物俯視輪廓的快速提取方法,其特征在 于,所述步驟F中根據(jù)線段所屬消點(diǎn)的類型以及線段的朝向校正它們之間的夾角,具體包 括:計(jì)算公式如下:
其中,分,·,Wi分別是第i根線段和第i+Ι根線段矯正之前和矯正之后的夾角,Vi是第i根線段所屬消點(diǎn)的類型,對于每次夾角的矯正都計(jì)算出一個(gè)相應(yīng)的旋轉(zhuǎn)矩陣Ri,當(dāng)計(jì)算完 所有夾角矯正的旋轉(zhuǎn)矩陣后,順序地把每根線段乘上相應(yīng)的旋轉(zhuǎn)矩陣,即對于第i根線段, 它的旋轉(zhuǎn)矩陣是ni.=() Rk'k+'。
【文檔編號(hào)】G06T7/00GK104240247SQ201410458631
【公開日】2014年12月24日 申請日期:2014年9月10日 優(yōu)先權(quán)日:2014年9月10日
【發(fā)明者】熊曦, 楊錚, 劉云浩, 孫家廣 申請人:無錫儒安科技有限公司