專利名稱:在高維空間中檢測對象的系統(tǒng)和方法
技術領域:
本發(fā)明涉及用于在高維空間中檢測對象的系統(tǒng)和方法,并且更特別地,涉 及用于^ffl,空間學習來在高維空間中檢測)^的系統(tǒng)和方法。
背景技術:
許多三維(3D)檢測和分割問題面臨在高維空間進行搜索。例如,3D相 似變換的特征在于九個參數(shù)三個,參數(shù),三個方向參數(shù)以^H個尺度參數(shù)。 搜索齡空間來檢測鄉(xiāng)非常昂貴。即使涉及由粗到精的策略,麟所有這些 參數(shù)在計算上被禁止。此外,j頓針對帶有如此多參數(shù)的膽的正例和反例來 訓練有鑒別能力的分類劉艮具有挑戰(zhàn)性,因為硬件柳艮制一次僅允許相對小的 數(shù)目的負數(shù)(negative)(大約106)。為了處理所有可能的反例,不得不使用多 級自舉,從而使^^h系統(tǒng)甚至更慢。但是,當所要檢測的膽以凝巾方式自然對準時,存在多種情況。例如, 圖片中的大多數(shù)面部都近1^7K平并且近似具有相同的膚色。類似地,CT掃描 中的大多數(shù)心臟近似具有相同的大小和方向。需要一種方法,用于在高維空間中快速檢測贈,其中該搜索空間可大大被減小而鵬^i確的結果。發(fā)明內(nèi)容公開了一種用于在高維圖像空間中檢測對象的系纟蘇卩方法。接tl^t象的三維圖像。第一分類器在所3zfem中'iMi置的職空間中被訓練,其產(chǎn)生預定數(shù)目的候M象中心位置。第二分類親皮訓練來從預定數(shù)目的候自象中'IM^置 中識別潛在的對象中^、位置和方向并且維持戶皿候皿象中心位置的子集。第三分類親皮訓練來從謝lM^象中^啦置的子集中識別所,象中心的潛在位置、方向和,。識別戶; ^tm的單個^^m姿態(tài)。
本發(fā)明的im實施方式將參照附圖在下文進行更加詳細的說^^,其中同樣的參,號指示相似的元件圖i是根據(jù)本發(fā)明的用于實te高維空間中'i^i檢測)^的示例性系統(tǒng)的 方框圖;圖2示出根據(jù)本發(fā)明的方面的用于4頓,空間學習來訓練分類器的投影分布;圖3是描繪根據(jù)本發(fā)明的實施方式的在計對幾斷層掃描圖像中檢測左心室 的流程圖;圖4是示出被執(zhí)行來根據(jù)本發(fā)明的方面4頓纖空間學習而檢測左心室的 步驟的功能方框圖;圖5示出作了被注解的(annotated)對象的例子;圖6示出根據(jù)本發(fā)明的方面的LV中心定位方法的功能OT圖;圖7是根據(jù)本發(fā)明的方面的LV中心和方向檢測方法的功能方框圖;以及圖8示出MSL在醫(yī)學成像的數(shù)個其4Mm檢測問題中的應用。
具體實施方式
本發(fā)明涉及一種用于在高維圖像空間中檢測)^的系統(tǒng)和方法。圖1示出根據(jù)本發(fā)明的示例性實施方式的用于在高維圖像空間中檢測m的系統(tǒng)100。在此說明的例子將涉及在三維醫(yī)學圖像中檢測解剖學結構。然而,本領域技術 人員應理解,所述方法和系統(tǒng)并不限于檢測解剖學結構,而是可^ffl于檢測諸 如面部、行人、車輛以及^I標志的其4Wa,而不偏離本發(fā)明的范圍和精神。 如圖1中戶標,系統(tǒng)100包括釆集設備105、個人計^m (PC) 110和操作者 控制臺115, ^H^iM有線或無線網(wǎng)絡120連接。采集設備105可以是計^m斷層掃描(CT)成像設備或諸如磁共振(MR) 掃描儀或超聲波掃描儀的任何其H維(3D)高分辨率成像設備??梢允潜銛y式 上型計算機、醫(yī)學診斷成像系統(tǒng)或影像存檔和通訊系統(tǒng)(pacs)數(shù)據(jù)管理站的pc 110包,接到輸入設備150和輸出設備155的中 央處理單元(cpu) 125和存儲器130。所述cpu 125包^Ji^空間學習模塊 145,該邊緣空間學習模決145包括將在此后討論的一種或多種用于在三維醫(yī) 學圖像中檢湖蠏剖學結構的方法。盡管戶;Mii^空間學習模塊145被示在cpu 125之內(nèi),但^^^ii^空間學習模塊145也可以位于cpu 125之外。存儲器130包括隨機存取存儲器(ram) 135和只皿儲器(rom) 140。 存儲器130也可以包括自庫、M驅動器、磁帶驅動器等等或者是它們的組 合。戶脫ram 135起艦存儲器的作用,iM^存儲器保存在執(zhí)行cpu 125 中的,旨期間的 并被用作工作區(qū)。所述rom 140起禾歸存儲器的作用, 該禾M0存儲器用于保存在cpu125中所執(zhí)行的禾歸。戶7M輸入150由M:、鼠 標等等構成,而戶腿輸出155貝岫液晶顯示器(lcd)、陰豐謝線管(crt) 顯示器、打印機等等構成。戶皿系統(tǒng)100的操作可由操作者控制臺115來控制,該操作者控制臺115 包括控制器165(例如離)和顯示器160。戶脫操作者控制臺115與戶腿pc 110 和戶艦采集設備105進《預信,使得由采集設備105所麟的圖像娜可由pc 110再現(xiàn)并在顯示器160上鄉(xiāng)見察。當缺少戶;f^作者控制臺115時,艦例 如《頓輸入設備150和輸出設備155頓行由控帶擺165和顯示器160所執(zhí)行 的某些任務,所述pc 110可被配置來操作和顯示由采集設備105所提供的信 息。戶;f^操作者控制臺m還可以包括倒可適當?shù)膱D像再現(xiàn)系嫩工j/應用程 序,這些圖像再mm嫩工具/應用,能處s^捕獲的圖像數(shù)據(jù)集(或其部分)的數(shù)字圖像數(shù)據(jù),以0示器160上生成并顯示圖像。更確切地說,圖像再現(xiàn)系統(tǒng)可以是提供醫(yī)學圖像數(shù)據(jù)的再現(xiàn)和可視化的應用程序,并且 用,在 通用或專用計^mi作站戰(zhàn)行。戶腿pc no也可以包括戰(zhàn)圖像再i縣敏工具/應用辦。職空間學習(msl)禾iJ用大多M^具有某^g不變的屬性(例如, ct圖像中的心臟近似具有相同的大小和方向)這一事實。同樣地,通過在其 中僅考詹某些參數(shù)而其余的參數(shù)被整合出去的,空間中進行檢測來排除大部 分空間。當要檢測的鄉(xiāng)以凝中方式自然對準時,也可能存在多種情況。這種 自然的對準可被用于以如圖2中所示的投影分布來訓練分類器,這種投影分布存在于較小維度的邊緣空間(例如,3參數(shù)的左心室中A必置空間,而不是9 參數(shù)的左心室相似變換空間)上。然后,基于訓練過的,空間分類器,搜索空間可被限制為其到m^i^空間的鄉(xiāng)具有高概率值的l^^物。在MSL中,分類M,空間上被訓練,在該,空間中,其中某 量被忽略。例如,在戶(y)上被訓練的分類器可快速排除大部分搜索空間。另一個分類驗其余空間上被訓練,以獲得最終的分類結果?,F(xiàn)在在其中執(zhí)行在計算機斷層掃描(CT)圖像中檢觀佐心室(LV)的例 子的上下文中對本發(fā)明的實M式進行說明。MSL被用于在3D CT圖像中檢 測LV直到相似變換。圖3示出描繪根據(jù)本發(fā)明的用于檢測LV的示例性方法 的流程圖。圖4是示出被執(zhí)行來根據(jù)本發(fā)明的方面j頓纖空間學習而檢測LV的步驟的功能方框圖。接收LV的圖像(402)。分類^ffi來找到LV中心的3D腿i-(x, y, z) (步驟302, 404)。該分類驗LV中,lM^g的職空間中被訓練。對^f^3D 輸入 ,最好的400個皿被保留用,一iHff古(步驟304)。本領域技術 人員應理解,在不偏離本發(fā)明的范圍和精神的情況下,為進一^iff古所保留的 ^g的數(shù)目可以變化。對于400個fl^i位置,另一分類^l細于保持LV的最有希望的3D腿和方向(x, e Mx, y, z, ep 92, e3)(步驟306, 406)。因此,這個分類 位置和方向的6維邊緣空間中被訓練。最佳的50個fl^^M和方向被保留用于進一對刊古。本領域技術人員應離,在不偏離本發(fā)明的范圍和衞中的情況下, 被保留用于進一^i平估的候選位置和方向的數(shù)目可以變化。最后,訓練過的分類親細于檢測LV鼓9維相似變換(也就是,健、方向和尺度)(步驟308, 408)7Mx, e , sXx, y, z, e,, 9 2, e3,Sl,s2,s3) (1)單個候選物是這個階段的輸出(步驟310)。訓練集包括多個圖像體積。訓練圖像^f只中的每個LV的皿都JOT包括 514個點的3D網(wǎng)格進行注解。圖5示出已經(jīng)利用3D網(wǎng)格502和相應的邊界框 504謝亍a^的LV的例子。LV頂點、A3C平面以^i軸l細于將M皿彼jt樹準。對所對準的皿執(zhí)行主成分分析(PCA),并且最佳的50個PCA 基點(base) l細來描述皿可變性?,F(xiàn)在將對圖3和圖4中所描述的方法進行更加詳細的說明。為了檢測LV 中心位置402,基于3D哈爾(Haar)特征來訓練分類器。針對更好的 對 準和性能,LV中心在被二7細樣(subsample)為3mm的體素大小的圖像體積 中進行檢測。在這一^f,率下,體積具有近似50X50X60個體素的大小。所 述訓練集包括多個圖像體積(例如,100個圖像^i口、),所有圖像M只的大小均 被調整為3mm體素大小。3D哈爾濾波器在以采樣位置為中心的、大小為31X31X31個體素的水平立方體之內(nèi)被選擇。大約ioooo個哈爾特征的集合ira擇用于訓練。通過增加由距其真實位置的l一2個體素干擾的正m^增加正數(shù)的數(shù)目,用于穩(wěn)定。這 允許大約6000個正數(shù)從100個訓練體積中獲得。超巨離真正中'tM體至少5 個體素的距離處,負數(shù)在圖像體積之內(nèi)隨機l雌擇。大約一百萬個負數(shù)禾細于 訓練。概率升高樹(Probabilistic Boosting Tree, PBT)被用于訓鄉(xiāng)斜口檢測,因為該 概率升高樹針對^樣本返回0到1之間的概率。所述PBT在于2006年3月 2日提交的、序列號為11/366,722并且標題為"Probabilistic Bossting Tree Framework for Learning Discriminative Models (用于學習W^別力的t,的概率升高樹框架)"的共同待決的專利申請中被詳細說明,該專利申請全文并入以 作參考。PBT利用五個級別訓練,這五個級別中的前兩個級別被實施為級聯(lián)。圖6圖解說明示出基本LV中心檢測方法的功能灘圖。輸入圖像^f只602 以3讓體素^fjf率來調整大小。LV中心檢測在圖像^^只604中f柳3D哈爾 特征。所述哈爾特征在通過以樣本位置為中心的虛線所示的、大小為31X31 X31個體素的框內(nèi)被選擇。檢測結果是圍繞真正的中心隨606的小斑±刺本 素。最佳的400個位置被保留用于進一斜啊古,而其余的錢貝做舍棄。這一級別的i啊古指示,所有真正的中'iMffl均在這400個^j^位置中。該方法夂m置的搜索空間從50X50X60=150000減少到400,這減少了大于300的量級。 第二分類器在位置和方向(x, e )的6維空間中工作。該空間被限制到值(x,9 ),針對該值(x, e),位置x在由所述^a檢測器獲得的400個候選物中,并且因此該6維空間已經(jīng)被縮小了 300多倍。圖7是其中發(fā)現(xiàn)了戶;M隨的方向的方法的功能灘圖。要針對其找到方向的位置艦中心檢測方 fefe確定,該方法得到一串檢測到的中心702。 LV方 向檢測4柳3D曲率特征來檢測方向704。 ^MT征被計算為大小為24 X 24X 24個體素的框內(nèi)的特定體素位置,被平移和鄉(xiāng)虔轉樣本的^1和方向。在戶腿 框之內(nèi),戶腿^g在9X9X9的點陣上被組纟尸應來,因此有其中齢十算特征的 729個不同的位置。在這雖置的齡位置處,有梯度、最小和最大曲率、主 方向和^IR娜的71種不同的組合(斜B、乘積、商、反三角函數(shù)等等)。這 給出729X71=51759 ,征。此外,存:^H個,3mm、 6mm和12 mm, 以這些尺度來計算這醜征,從而獲得總共大約150000偉征。正數(shù)和負數(shù) 豐雌擇為健x絲自第一階段的400個fi魏物中。最佳的50個》魏物^ W 被保留用于進一^iff古706。出現(xiàn)的重要問題是如何獲得樣本與真實瞎況之間的有意義的距離。誕巨離 將被用于產(chǎn)生所述正數(shù)和負數(shù),因為那些確實,于真實情況的樣本應當被視 為正數(shù),而那離出某個閾值的樣本貝提負數(shù)。為了計算距真實情況的距離,^樣本(x,e)被增加由所述訓練數(shù)據(jù)的統(tǒng) 計數(shù)字獲得的平均尺度V j柳得到的相似變換7Mx, 6 , So),獲得,被改變 的平均形狀。所述平均形狀在對98個訓練形狀執(zhí)行普羅克拉斯提斯 (Procrustes)分析時獲得。因此,在相應的尺度被改變的平均微之間的點到 點的平均距離為兩個樣本之間的距離。戶脫正數(shù) 擇為具有最多為6mm的距離,而戶腿負數(shù)超少為15mm 的距離處。由戶;^檢測器的輸出,最佳的50個候選物&e)被保持,而其余 的麟艦舍棄。搜索空間的維數(shù)再次被增加,以增加lv尺度。相似變換r=(x, e, s泡于9維空間中,但是前6維(x, 0 )被限制為僅僅取由上一階段獲得的50個值。相同的特征樣本庫如在lv方向檢測階段中那稱劍OT,而今的不同點在于,對 于針樣農(nóng)x, e, s),其中這醜征被計算的膨見在為& e , 4/3s)。在這個階段之后選擇單個織物。相似的對去可,細于檢測左心房(la)。為了在2D中檢測ia直到相似 變換,搜索5維空間健(x^y)、方向e和尺度(s,a)(鵬和縱橫比)。使 用msl方法,對三個分類器進行訓練。第一分類親皮訓練來檢測ia隨。因為超聲波數(shù)據(jù)中的LA在大小上展示出很;^度的^性,所以也以小、中 和大三個皿估計非常粗略的大小。最佳的iooo個候選物被保留用 —步 處理。第二分類:^皮訓練彩十對旨f^^物推斷LA方向和一個尺度參數(shù)。然 后,最佳的iooo個候選物被保留用于進一步處理。最后的分類辦皮訓練來針 對1000個l魏物中的每一個推斷縱橫比,并且最佳的20個^i!)的平均值樹艮 告為檢測結果。MSL魏用的方法并且可棚于醫(yī)學成像中的多個具有挑戰(zhàn)性的2D和3D X^m檢測和分割任務。圖8示出應用MSL在X射線圖像中檢測導管尖端(802)、 在腹部CT中檢測回盲瓣(804)和肝臟(806)、 ^g聲波圖像中檢測心室(808) 以及在MRI中檢測心室(810)。已經(jīng)說明了用于在高維空間中檢測,的系辦Q方法的實施方式,但是應 注意,本領域技術人員可以根據(jù)上述教導進行修改和變型。因此,應WS所 公開的本發(fā)明的特定實施方式中可進行改變,這些改變在如由所附權利要求所 定義的本發(fā)明的范圍和精神之內(nèi)。因此,已經(jīng)按專利法的要求詳細并具體地描 述了本發(fā)明,所要求保護的和需要專利證書保護的內(nèi)容在隨附的權利要求中被
權利要求
1. 一種用于在高維圖像空間中檢測對象的方法,其包括接收對象的三維圖像;在對象中心位置的邊緣空間中訓練第一分類器,其產(chǎn)生預定數(shù)目的候選對象中心位置;訓練第二分類器來從預定數(shù)目的候選對象中心位置中識別潛在的對象中心位置和方向并維持所述候選對象中心位置的子集;訓練第三分類器來從所述候選對象中心位置的子集中識別所述對象中心的潛在的位置、方向和尺度;以及識別對象的單個候選對象姿態(tài)。
2、 如權利要求l所述的方法,其中,1頓在戶腐圖像中被二7娜樣的3D 哈爾特W臓第—分類器進CT練。
3、 如權利要求2所述的方法,其中,使用概率升高樹來訓練所述3D哈爾特征。
4、 如權利要求1所述的方法,其中,《頓曲率特征棘戶脫第二分類器 謝刊條。
5、 如權利要求4所述的方法,其中,戶腐第二分類驗健和方向的六 維空間中工作。
6、 如權利要求1所述的方法,其中,戶脫第三分類驗健、方向和尺 度的九維空間中被訓練。
7、 如權利要求1所述的方法,其中,所艦象為左心室。
8、 如權利要求l所述的方法,其中,所艦象為左心房。
9、 如權利要求7戶腿的方法,其中,戶腿3D圖像為3D計對幾斷層掃描圖像。
10、 一種用于在高維圖像空間中檢測贈的系統(tǒng),其包括 用于捕W^的三維圖像的采集設備;接ilW象的所捕獲的三維圖像的處理器,所述處理器對每幅圖像執(zhí)行下述 歩驟^tm中心位置的邊緣空間訓練第一分類器,其產(chǎn)生預定數(shù)目的候選訓練第二分類器來從戶腿預定數(shù)目的候艦象中^必置中識別潛在的贈中《,和方向并維持戶;M^^tm中^vlig的子集訓練第三分類器來從戶脫候艦象中心位置的子集中識別戶; ^t^的潛在的位置、方向和尺度;以及 識別鄉(xiāng)的單^flM^姿態(tài);以及用于顯示所檢測到的對象的顯示器。
11、 如權利要求10戶脫的系統(tǒng),其中,j頓在戶脫圖像中被二次抽樣的3D哈爾特艦臓第一分類器進,練。
12、 如權利要求11所述的系統(tǒng),其中,4柳概率升高樹來訓練所述3D 哈爾特征。
13、 如權利要求io戶脫的系統(tǒng),其中,4頓曲率特征艦戶;Mm二分類器進ffl職。
14、 如權利要求13戶脫的系統(tǒng),其中,戶腿第二分類驗^S和方向的 六維空間中工作。
15、 如權利要求10戶腿的系統(tǒng),其中,0f^第三分類器在位置、方向和 尺度的九維空間中被訓練。
16、 如權利要求10戶腿的系統(tǒng),其中,戶;Mx^為左心室。
17、 如權利要求10戶脫的系統(tǒng),其中,鄉(xiāng)為左心房。
18、 如權利要求16戶脫的系統(tǒng),其中,戶脫3D圖像為3D if^t幾斷層掃描圖像。
全文摘要
公開了一種用于在高維圖像空間中檢測對象的系統(tǒng)和方法。接收對象的三維圖像。在對象中心位置的邊緣空間內(nèi)訓練第一分類器,其產(chǎn)生預定數(shù)目的候選對象中心位置。訓練第二分類器來從所述預定數(shù)目的候選對象中心位置中識別潛在的對象中心位置和方向并維持所述候選對象中心位置的子集。訓練第三分類器來從所述候選對象中心位置的子集中識別所述對象中心的潛在的位置、方向和尺度。識別出對象的單個候選對象姿態(tài)。
文檔編號G06K9/62GK101261735SQ20071019444
公開日2008年9月10日 申請日期2007年9月28日 優(yōu)先權日2006年9月28日
發(fā)明者A·巴布, B·喬治斯庫, D·科馬尼丘, J·楊, Y·鄭 申請人:美國西門子醫(yī)療解決公司