決策樹。在用于在每一個(gè)分叉節(jié)點(diǎn)處做出決定的過(guò)程中,圖像中的圖像元素可從根到葉節(jié) 點(diǎn)地被推動(dòng)通過(guò)決策森林中的各個(gè)樹。根據(jù)圖像元素的特性以及測(cè)試圖像元素的特性來(lái)做 出該決定,測(cè)試圖像元素從圖像元素位移達(dá)分叉節(jié)點(diǎn)處的參數(shù)所指定的空間偏移。在分叉 節(jié)點(diǎn)處,圖像元素沿著根據(jù)決定的結(jié)果來(lái)選擇的分支向下前進(jìn)至樹的下一層。在訓(xùn)練期間, 學(xué)習(xí)參數(shù)值以供在分叉節(jié)點(diǎn)處使用,并且在葉節(jié)點(diǎn)處累積數(shù)據(jù)。例如,經(jīng)標(biāo)記圖像元素的分 布在葉節(jié)點(diǎn)處被累積。
[0033] 糾纏的隨機(jī)決策森林是其中至少一個(gè)決策樹具有在指定層次的在訓(xùn)練期間累積 數(shù)據(jù)的分叉節(jié)點(diǎn)的隨機(jī)決策森林,該數(shù)據(jù)被用于導(dǎo)出特征以用于在該樹的至少一個(gè)更低層 次作出決策。如下所描述的某些示例中,所導(dǎo)出的特征可以是最短連線特征。
[0034] 多個(gè)隨機(jī)決策森林具有自動(dòng)上下文,其中來(lái)自一個(gè)隨機(jī)決策森林的輸出能夠允許 決策在至少一個(gè)其它隨機(jī)決策森林中的分叉節(jié)點(diǎn)處作出。
[0035] 圖4是包括三個(gè)隨機(jī)決策樹:樹0、樹1、樹2的糾纏的隨機(jī)決策森林的示意圖。實(shí) 踐中可能在森林中存在更多隨機(jī)決策樹。每個(gè)隨機(jī)決策樹包括兩個(gè)(或更多區(qū)段):區(qū)段 〇和區(qū)段1。一個(gè)區(qū)段包括兩個(gè)或更多節(jié)點(diǎn)層。在此示例中,每個(gè)區(qū)段具有兩個(gè)節(jié)點(diǎn)層,但 可以使用更多層。在訓(xùn)練期間,訓(xùn)練數(shù)據(jù)400可被用于并行訓(xùn)練樹。一旦訓(xùn)練數(shù)據(jù)到達(dá)區(qū) 段〇的最低層,它可被用來(lái)計(jì)算中間類概率和通用最短連線距離。除了原始特征400外, 這些導(dǎo)出的特征402可被用作輸入特征來(lái)訓(xùn)練樹的區(qū)段1。到達(dá)每棵樹的葉節(jié)點(diǎn)的訓(xùn)練數(shù) 據(jù)被標(biāo)記并且可跨樹按類聚集,從而給出最終類后驗(yàn)概率分布404,其可以以緊湊的形式存 儲(chǔ)。關(guān)于糾纏的隨機(jī)決策森林可如何針對(duì)圖像標(biāo)記被訓(xùn)練以及它可如何在測(cè)試時(shí)被使用的 更多細(xì)節(jié),下面參考圖5到7給出。
[0036] 圖5是訓(xùn)練用于圖像標(biāo)記任務(wù)的糾纏的隨機(jī)決策森林的方法的示例。經(jīng)標(biāo)記的訓(xùn) 練圖像被訪問(wèn)500。例如,在醫(yī)學(xué)圖像的應(yīng)用的情況下,這些是醫(yī)學(xué)圖像,其中每個(gè)圖像元素 用多個(gè)可能的類之一來(lái)標(biāo)記。在圖1的示例中,訓(xùn)練圖像可以是街景而可能的類可以是房 子、樹木、機(jī)動(dòng)車、背景。
[0037] 對(duì)于森林里的每棵樹502并行地,訓(xùn)練過(guò)程使用原始圖像數(shù)據(jù)(諸如亮度值或在 圖像元素處局部地計(jì)算的其它值)來(lái)訓(xùn)練504每棵樹的第一區(qū)段。一旦每棵樹的第一區(qū)段 被訓(xùn)練,到達(dá)處于每棵樹的第一區(qū)段的最低層的節(jié)點(diǎn)的訓(xùn)練數(shù)據(jù)被知曉。這個(gè)訓(xùn)練數(shù)據(jù)被 標(biāo)記并可被跨樹506按類聚集以給出類概率。類概率可被稱為中間類概率,因?yàn)樗鼈冊(cè)跇?的高于葉節(jié)點(diǎn)的層次處被計(jì)算。類概率可以以緊湊方式被存儲(chǔ)。
[0038] 訓(xùn)練過(guò)程使用原始圖像數(shù)據(jù)并且也使用中間類概率來(lái)并行訓(xùn)練508每棵樹的第 二區(qū)段,以在分叉節(jié)點(diǎn)處作出決策。一旦第二區(qū)段被訓(xùn)練,訓(xùn)練過(guò)程重新計(jì)算510并存儲(chǔ)類 概率。因?yàn)楝F(xiàn)在到達(dá)每棵樹的更低層次,中間類概率更具確定性。訓(xùn)練過(guò)程能夠使用中間 類概率來(lái)計(jì)算并存儲(chǔ)512通用最短連線映射(每個(gè)類一個(gè))。通用最短連線映射包括在圖 像元素位置處的指示那個(gè)圖像元素位置的距在概率上定義了的種子區(qū)域的最短連線距離 的數(shù)字值。該種子區(qū)域可以是可能描繪指定類對(duì)象的圖像元素??墒褂迷紙D像數(shù)據(jù)、中 間類概率和通用最短連線映射來(lái)訓(xùn)練每棵樹的第三區(qū)段514。
[0039] 給定灰值(grey-valued)圖像J和實(shí)際值(real-valued)對(duì)象"軟掩模"(其編碼 了像素可能性)M(p)
__ ^
[0040] 通用最短連線距離Q可定義為如下:
[0041 ]
[0042] 通用最短連線映射可使用如2011年6月16日公開的名為"Parallel processing for distance transforms (距離變換并行處理)"的美國(guó)專利申請(qǐng)US 2011/0145826中詳 細(xì)描述的并行處理來(lái)計(jì)算。然而,以此方式計(jì)算通用最短連線映射不是必須的??墒褂糜?jì) 算通用最短連線距離的任何方法。
[0043] 在森林里的樹中可使用其它數(shù)量的區(qū)段。例如,當(dāng)兩個(gè)區(qū)段被使用時(shí),訓(xùn)練過(guò)程在 步驟506處還計(jì)算516并存儲(chǔ)通用最短連線映射。樹的第二區(qū)段可接著使用原始圖像數(shù)據(jù)、 中間類概率和通用最短連線映射來(lái)訓(xùn)練518以在分叉節(jié)點(diǎn)處作出決策。
[0044] 圖6是示出圖5的訓(xùn)練過(guò)程的在步驟504、508、514、518期間在樹的指定區(qū)段被訓(xùn) 練時(shí)更多細(xì)節(jié)的流程圖。在那些步驟期間,樹區(qū)段以寬度優(yōu)先的次序逐個(gè)分叉節(jié)點(diǎn)地訓(xùn)練。 訓(xùn)練數(shù)據(jù)600從根節(jié)點(diǎn)或早先的分叉節(jié)點(diǎn)到達(dá)給定分叉節(jié)點(diǎn),并包括對(duì)于它而言類標(biāo)記為 已知的圖像元素。訓(xùn)練過(guò)程根據(jù)樹的哪個(gè)區(qū)段正被訓(xùn)練來(lái)選擇616可用特征通道602。特 征通道是使用指定圖像量計(jì)算的(描述圖像的特性的)一類特征。特征通道的示例現(xiàn)在給 出,盡管其它類型的特征通道可被使用。在RGB圖像的情況中,特征通道可以是從原始圖像 的R、G或B色彩通道的任何一個(gè)或多個(gè)獲得的原始圖像數(shù)據(jù)610。特征通道可包括每個(gè)類 的中間類概率612。特征通道可包括例如,從原始圖像的灰度亮度計(jì)算的通用最短連線映射 614。在樹的第一區(qū)段處的可用特征通道可以是紅、綠和藍(lán)通道的任一中的原始圖像數(shù)據(jù)。 在樹的第二區(qū)段處,可用特征通道可以是如針對(duì)第一區(qū)段的并且附加的,針對(duì)中間類概率。 在樹的第三區(qū)段處,可用特征通道還可包括針對(duì)每個(gè)可能類的通用最短連線映射。特征通 道的其它示例包括但不限于,紋理特征、在視頻情況下的時(shí)間偏差。這些僅僅是示例,且特 征通道的其它組合可根據(jù)樹區(qū)段可用。
[0045] 訓(xùn)練過(guò)程(使用隨機(jī)采樣過(guò)程或以其他方式)生成特征響應(yīng)、特征通道的組合和 參數(shù)值。可被使用的可能的特征響應(yīng)包括:在給定特征通道中的探測(cè)圖像元素位置對(duì)之間 的差、在給定特征通道中的探測(cè)圖像元素位置對(duì)之間的和、以及在給定特征通道中的探測(cè) 圖像元素位置對(duì)之間的絕對(duì)差。探測(cè)圖像元素位置根據(jù)參數(shù)值的至少一些偏離參考圖像元 素位置。不必要使用探測(cè)圖像元素對(duì);其它數(shù)量的探測(cè)圖像元素可被使用,包括與參考位置 相比的單個(gè)探測(cè)圖像元素。在深度圖像被使用的情況下,探測(cè)圖像元素距參考圖像元素的 空間偏移可選地通過(guò)縮放參考圖像元素的1/深度來(lái)使得深度不變。
[0046] 訓(xùn)練過(guò)程將訓(xùn)練數(shù)據(jù)應(yīng)用于620所生成的特征響應(yīng)、特征通道的組合和參數(shù)值。 某些參數(shù)可以是閾值,特征響應(yīng)針對(duì)該閾值進(jìn)行比較以確定訓(xùn)練數(shù)據(jù)將采用哪根樹枝。訓(xùn) 練過(guò)程使用優(yōu)化準(zhǔn)則來(lái)選擇622特征響應(yīng)、特征通道的優(yōu)化組合和參數(shù)值。所選組合被存 儲(chǔ)以供在測(cè)試時(shí)期間在分叉節(jié)點(diǎn)處使用。
[0047] 訓(xùn)練過(guò)程針對(duì)以寬度優(yōu)先的次序或其它合適的次序訓(xùn)練的樹的區(qū)段的分叉節(jié)點(diǎn) 重復(fù)圖6的過(guò)程。
[0048] 優(yōu)化準(zhǔn)則可以是信息增益測(cè)量、方差減小目標(biāo)、或另一訓(xùn)練目標(biāo)。
[0049] -旦糾纏的隨機(jī)決策森林已經(jīng)被訓(xùn)練,它就可被用于分類先前未看見圖像的圖像 元素(即,在訓(xùn)練期間未使用的圖像亦稱測(cè)試圖像)。測(cè)試圖像被訪問(wèn)700并且來(lái)自測(cè)試 圖像的圖像元素被推送702通過(guò)森林中的每棵樹的第一區(qū)段以標(biāo)識(shí)每棵樹的第一區(qū)段的 底部層次處的一個(gè)節(jié)點(diǎn)。在訓(xùn)練期間在所標(biāo)識(shí)的節(jié)點(diǎn)處累積的訓(xùn)練數(shù)據(jù)被訪問(wèn)并跨各樹聚 集704以計(jì)算類概率映射。這,在每個(gè)圖像元素處,具有每個(gè)類的中間概率值,以及可選地 那個(gè)概率的最短連線平滑版本。
[0050] 測(cè)試圖像元素被推送706通過(guò)每棵樹的下一個(gè)區(qū)段。類概率映射在合適的情況下 被用于查找特征響應(yīng)。測(cè)試圖像元素到達(dá)每棵樹的第二區(qū)段的底部層次的一個(gè)節(jié)點(diǎn)。在訓(xùn) 練期間在所標(biāo)識(shí)的節(jié)點(diǎn)處累積的訓(xùn)練數(shù)據(jù)被訪問(wèn)并跨各樹聚集708以計(jì)算經(jīng)更新的類概 率映射。使用該映射以提供軟的、概率種子區(qū)域或掩模,通用最短連線映射被計(jì)算710,每個(gè) 類一個(gè)。
[0051] 測(cè)試圖像元素使用類概率映射和通用最短連線映射被推送712通過(guò)每棵樹的第 三區(qū)段以查找特征響應(yīng)。最后,測(cè)試圖像元素達(dá)到每棵樹的