專(zhuān)利名稱(chēng):基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)-來(lái)自數(shù)字組織病理學(xué)的存活率和結(jié)果的預(yù)后預(yù)估的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計(jì)算機(jī)輔助預(yù)后(CAP)系統(tǒng)和方法,其采用定量導(dǎo)出的圖像信息預(yù)測(cè)病理過(guò)程、疾病結(jié)果和患者存活率。盡管數(shù)字病理學(xué)已經(jīng)使得可針對(duì)計(jì)算機(jī)輔助診斷 (CAD)修改組織標(biāo)本以檢測(cè)疾病,但本發(fā)明的CAP系統(tǒng)和方法預(yù)測(cè)疾病結(jié)果和患者存活率。
背景技術(shù):
當(dāng)前識(shí)別很多疾病狀態(tài)的黃金標(biāo)準(zhǔn)是對(duì)所涉及器官的固定組織切片的微觀(guān)組織學(xué)進(jìn)行主觀(guān)目視判釋。這種情況的范例包括癌癥以及很多炎癥性和退行性疾病的診斷。在過(guò)去十年間,化驗(yàn)基因組信息的能力越來(lái)越強(qiáng),導(dǎo)致利用基因表達(dá)和/或基因組變化的診斷性、預(yù)后模式對(duì)各種病理過(guò)程的分類(lèi)得到改進(jìn)。本發(fā)明詳細(xì)描述了用于分析組織病理學(xué)成像的自動(dòng)的計(jì)算機(jī)化系統(tǒng)和方法,其將產(chǎn)生定量和可再現(xiàn)的度量,即基于影像的風(fēng)險(xiǎn)分?jǐn)?shù),用于預(yù)測(cè)疾病結(jié)果和患者存活率。下面是本發(fā)明的兩個(gè)具體實(shí)施例,其使用乳腺癌作為模型疾病狀態(tài),其中經(jīng)良好驗(yàn)證的基于基因表達(dá)的分類(lèi)器帶來(lái)了顯著的臨床影響。乳腺癌(BC)是女性與癌癥相關(guān)的死亡的主要原因之一,2009年在美國(guó)估計(jì)年發(fā)生人數(shù)為192000(來(lái)源美國(guó)癌癥協(xié)會(huì))。本發(fā)明的一個(gè)實(shí)施例涉及BC的子集,包括未擴(kuò)散到淋巴結(jié)且具有雌激素受體蛋白(LN-,ER+BC)過(guò)表達(dá)的癌細(xì)胞。盡管LN-、ER+BC的病例是利用化學(xué)治療和輔助激素治療的組合來(lái)處理的,但具體的預(yù)后和治療常常是由Oncotype DX基因表達(dá)化驗(yàn)決定的[1]。 Oncotype DX基因表達(dá)化驗(yàn)生成介于0-100之間的再發(fā)生分?jǐn)?shù)(RS),其與遠(yuǎn)期再發(fā)生的可能性和化學(xué)治療的預(yù)期益處正相關(guān)[1]。組織病理學(xué)中BC細(xì)胞核的人工檢測(cè)是一個(gè)乏味且耗時(shí)的過(guò)程,在臨床環(huán)境中是不可行的。細(xì)胞劃分的早先方法-閾值化[2]、分群[3]和活動(dòng)輪廓模型W]-對(duì)于BC細(xì)胞核高度可變的形狀和大小,以及組織學(xué)固定、染色和數(shù)字化過(guò)程中的偽影不是非常魯棒。此前的工作[1]已經(jīng)表明,Oncotype DX RS與BC等級(jí)相關(guān)。癌癥等級(jí)反映了組織的架構(gòu)布置并與存活率相關(guān)(高等級(jí)意味著結(jié)果差)。病理學(xué)家常常對(duì)BC研究的等級(jí)意見(jiàn)不一。隨著近來(lái)出現(xiàn)了數(shù)字病理學(xué),研究人員開(kāi)始探索BC組織病理學(xué)的自動(dòng)圖像分析。 Wolberg等人[6]使用來(lái)自人工分割的BC細(xì)胞核的核特征來(lái)區(qū)分良性和惡性圖像。Bilgin 等人[7]研究了使用譜系圖對(duì)BC組織病理架構(gòu)建模。Hall等人使用紋理特征[8]檢查免疫組織化學(xué)染色中的變化。本發(fā)明的第二實(shí)施例涉及侵入性BC的子集,其包括淋巴細(xì)胞浸潤(rùn)(Li)的存在并表現(xiàn)出HER2基因(HER2+BC)的放大。當(dāng)前利用特異地以HER2蛋白質(zhì)為目標(biāo)的藥劑治療大部分HER2+BC。研究人員證明,組織病理中存在LI是各種癌癥(包括HER2+BC)的存在的預(yù)后標(biāo)志[13]_[15]。LI作為BC中潛在抗癌機(jī)制的功能首先是由Aaltomaa等人展示的 [14]。新近以來(lái),Alexe等人[15]論證了高水平LI的存在和早期HER2+BC中腫瘤再發(fā)生之間的相關(guān)性。病理學(xué)家不會(huì)例行報(bào)告LI的存在,尤其是在HER2+BC中。這種情況的可能原因是,病理學(xué)家當(dāng)前缺少自動(dòng)圖像分析工具來(lái)準(zhǔn)確地、有效率地和可再現(xiàn)地量化BC組織病理中LI的存在和程度。盡管一些研究人員[9]、[16]-[21]最近開(kāi)始開(kāi)發(fā)用于分析數(shù)字化BC組織病理的計(jì)算機(jī)輔助診斷(CADx)系統(tǒng)和方法,但他們大多關(guān)注于發(fā)現(xiàn)可疑研究區(qū)(ROI)或曾試圖從人工隔離的ROI確定癌癥等級(jí)。用于兩種應(yīng)用的方法使用基于圖像的特征在2個(gè)類(lèi)別之間進(jìn)行區(qū)分正常和良性區(qū)域或低等級(jí)和高等級(jí)R0I。具體而言,已經(jīng)有人展示了利用癌癥細(xì)胞核的尺寸和形狀來(lái)區(qū)分低等級(jí)和高等級(jí)組織結(jié)構(gòu)圖像[16]、[9]。也采用了紋理特征和濾波器庫(kù)[16]_[19]、[21]以對(duì)BC組織病理的表型外觀(guān)建模。盡管若干研究人員已經(jīng)開(kāi)發(fā)出在數(shù)字化組織病理學(xué)中檢測(cè)細(xì)胞核的算法[18]、 [23]-[四],但一直未試圖自動(dòng)檢測(cè)或量化BC組織病理上的LI程度。一些流行的自動(dòng)核檢測(cè)方法基于自適應(yīng)閾值[18]、[23]和模糊C-均值(c-means)分群[25]、[27]。這些技術(shù)依賴(lài)于染色差異來(lái)區(qū)分細(xì)胞核和周?chē)M織。不過(guò),由于BC和淋巴細(xì)胞細(xì)胞核之間外觀(guān)的相似性,它們不適于LI檢測(cè)的任務(wù)(圖4(a))。諸如活動(dòng)輪廓線(xiàn)的技術(shù)[24]、[28]、[29]利用梯度(邊緣)信息以自動(dòng)隔離組織學(xué)圖像中的細(xì)胞核。不過(guò),這些方法可能在其處理BC 細(xì)胞核外觀(guān)的變化(圖4(b)、(C))和圖像采集偽影(圖4(e)、(f))的能力方面受限。一些研究人員開(kāi)發(fā)了混合技術(shù)以便改善核檢測(cè)和分割結(jié)果。例如,Glotsos等人[28]使用的支持矢量機(jī)(Support Vector Machine)分群改善活動(dòng)輪廓模型的初始化。新近以來(lái),半自動(dòng)概率模型使用逐個(gè)像素的強(qiáng)度信息以在數(shù)字化BC組織病理中檢測(cè)癌癥[26]和淋巴細(xì)胞細(xì)胞核[30]。不過(guò),概率模型通常受到專(zhuān)家注釋的訓(xùn)練數(shù)據(jù)可用性的限制。不過(guò),僅僅檢測(cè)淋巴細(xì)胞不能完全刻畫(huà)出異常LI表型的特征,因?yàn)榛€(xiàn)水平的淋巴細(xì)胞存在于所有組織中。Gimduz等人[20]研究了自動(dòng)化癌癥診斷,利用譜系圖對(duì)組織架構(gòu)建模,由此將圖定義為一組頂點(diǎn)(細(xì)胞核),對(duì)應(yīng)的邊緣連接所有細(xì)胞核。
發(fā)明內(nèi)容
本發(fā)明涉及一種基于圖像的計(jì)算機(jī)輔助預(yù)后(CAP)系統(tǒng),其從數(shù)字化的組織病理學(xué)圖像預(yù)測(cè)疾病結(jié)果和患者存活率。本發(fā)明詳細(xì)描述了用于分析組織病理學(xué)影像的自動(dòng)計(jì)算機(jī)化系統(tǒng)和方法,其將產(chǎn)生定量和可再現(xiàn)的度量,即基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù),用于預(yù)測(cè)疾病結(jié)果和患者存活率。本發(fā)明涉及一種基于圖像的計(jì)算機(jī)輔助預(yù)后(CAP)系統(tǒng)和方法,其旨在復(fù)制組織病理學(xué)和病理過(guò)程(包括,但不限于癌癥)中分子化驗(yàn)的預(yù)后能力。在本發(fā)明的實(shí)施例中,開(kāi)發(fā)了一種基于圖像的計(jì)算機(jī)輔助預(yù)后(CAP)系統(tǒng)和方法,其旨在復(fù)制癌癥組織病理學(xué)中分子化驗(yàn)的預(yù)后能力。本發(fā)明的系統(tǒng)和方法涉及,首先通過(guò)期望值最大化驅(qū)動(dòng)算法來(lái)半自動(dòng)地檢測(cè)BC細(xì)胞核。利用核質(zhì)心,構(gòu)造兩個(gè)圖形(德洛內(nèi) (Delaunay)三角剖分和最小生成樹(shù)),從每幅圖像提取共12個(gè)特征。一種非線(xiàn)性維數(shù)縮減系統(tǒng)和方法,即,圖形嵌入,將從圖像導(dǎo)出的特征投射到低維空間中,支持矢量機(jī)在縮減的維度空間中對(duì)BC圖像分類(lèi)。僅使用組織載片樣本、用于數(shù)字載片掃描的機(jī)構(gòu)和計(jì)算機(jī),本發(fā)明基于圖像的CAP系統(tǒng)和方法旨在克服與Oncotype DX相關(guān)聯(lián)的很多缺點(diǎn),包括與化驗(yàn)相關(guān)聯(lián)的高成本;具有專(zhuān)用設(shè)備的實(shí)驗(yàn)室設(shè)施有限以及活檢和預(yù)后預(yù)測(cè)之間的持續(xù)時(shí)間。本發(fā)明涉及關(guān)鍵方法貢獻(xiàn)以及使用若干現(xiàn)有技術(shù)的機(jī)器學(xué)習(xí)系統(tǒng)和方法,包括, 但不限于自動(dòng)檢測(cè)BC細(xì)胞核的魯棒、有效方法;描述BC細(xì)胞核架構(gòu)布置并因此定量描述癌癥等級(jí)的圖像特征;以及使用非線(xiàn)性維數(shù)縮減對(duì)低維表達(dá)中的底層生物學(xué)數(shù)據(jù)結(jié)構(gòu)分類(lèi)和可視化。本發(fā)明的目的是提供一種基于期望值最大化(EM)算法的半自動(dòng)核檢測(cè)系統(tǒng)和方法。根據(jù)以上目的,本發(fā)明導(dǎo)出架構(gòu)特征以表征BC細(xì)胞核的布置并因此俘獲BC等級(jí)。在本發(fā)明的實(shí)施例中,公開(kāi)了一種計(jì)算機(jī)化系統(tǒng)和方法以在數(shù)字化HER2+BC組織病理學(xué)中自動(dòng)檢測(cè)LI的程度并對(duì)其評(píng)定等級(jí)。首先通過(guò)區(qū)域生長(zhǎng)和馬爾可夫(Markov)隨機(jī)場(chǎng)算法的組合自動(dòng)檢測(cè)淋巴細(xì)胞。使用獨(dú)立檢測(cè)的淋巴細(xì)胞的中心作為頂點(diǎn),構(gòu)造三個(gè)圖形(沃羅諾伊圖(Voronoi Diagram),德洛內(nèi)三角剖分和最小生成樹(shù)),并從每個(gè)樣本提取總共50個(gè)描述淋巴細(xì)胞布置的圖像導(dǎo)出的特征。然后使用非線(xiàn)性維數(shù)縮減系統(tǒng)和方法、 圖形嵌入將高維特征矢量投射到縮減的3D嵌入空間中。使用支持矢量機(jī)分類(lèi)器區(qū)分維度縮減的嵌入空間中具有高和低LI的樣本。本發(fā)明的實(shí)施例涉及基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)估(predictor)方法,用于測(cè)量癌癥程度,以利用數(shù)字化組織病理學(xué)來(lái)評(píng)估癌癥患者的疾病結(jié)果,該方法包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中;ii.利用基于期望值最大化的算法檢測(cè)癌癥細(xì)胞核;iii.利用獨(dú)立檢測(cè)的癌癥細(xì)胞核的中心作為頂點(diǎn)構(gòu)造德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述癌癥細(xì)胞核布置的圖像導(dǎo)出的特征; v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間;vi.將3D嵌入展開(kāi)到ID尺度中以定義針對(duì)不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù);vii.確定基于圖像的再發(fā)生分?jǐn)?shù),以通過(guò)揭示ID線(xiàn)上樣本的等級(jí)標(biāo)簽以及它們的相對(duì)位置來(lái)在低、中和高癌癥分?jǐn)?shù)之間進(jìn)行區(qū)分,以預(yù)測(cè)預(yù)后。本發(fā)明的實(shí)施例涉及基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)估方法,用于測(cè)量病理過(guò)程的程度, 以利用數(shù)字化組織病理學(xué)來(lái)評(píng)估患者的疾病結(jié)果,該方法包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中;ii.利用基于期望值最大化的算法來(lái)檢測(cè)病理細(xì)胞核;iii.利用獨(dú)立檢測(cè)的病理細(xì)胞核的中心作為頂點(diǎn)構(gòu)造德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述病理細(xì)胞核的布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間;vi.將3D嵌入展開(kāi)到ID尺度中以定義對(duì)于不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù);vii.確定基于圖像的再發(fā)生分?jǐn)?shù),以通過(guò)揭示ID線(xiàn)上樣本的等級(jí)標(biāo)簽以及它們的相對(duì)位置來(lái)在低、中和高癌癥分?jǐn)?shù)之間進(jìn)行區(qū)分,以預(yù)測(cè)預(yù)后。本發(fā)明的實(shí)施例涉及基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)估方法,用于測(cè)量癌癥程度,以利用數(shù)字化的組織病理學(xué)評(píng)估節(jié)點(diǎn)陰性、雌激素受體陽(yáng)性乳腺癌患者的疾病結(jié)果,該方法包括 i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中;ii.利用基于期望值最大化的算法檢測(cè)癌癥細(xì)胞核;iii.利用獨(dú)立檢測(cè)的癌癥細(xì)胞核的中心作為頂點(diǎn)構(gòu)造德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述癌癥細(xì)胞核的布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間;
vi.將3D嵌入展開(kāi)到ID尺度中以定義針對(duì)不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù);
vii.確定基于圖像的再發(fā)生分?jǐn)?shù),通過(guò)揭示ID線(xiàn)上樣本的等級(jí)標(biāo)簽以及它們的相對(duì)位置來(lái)在低、中和高癌癥分?jǐn)?shù)之間進(jìn)行區(qū)分,以預(yù)測(cè)預(yù)后。本發(fā)明的實(shí)施例涉及用于測(cè)量淋巴細(xì)胞浸潤(rùn)的程度的方法,以評(píng)估表達(dá)人類(lèi)上皮生長(zhǎng)因子受體2(HER2)的乳腺癌患者的疾病結(jié)果,包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中;ii.利用區(qū)域生長(zhǎng)和馬爾可夫隨機(jī)場(chǎng)算法的組合來(lái)檢測(cè)淋巴細(xì)胞核;iii.利用獨(dú)立檢測(cè)的淋巴細(xì)胞核的中心作為頂點(diǎn)構(gòu)造沃羅諾伊圖、 德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述淋巴細(xì)胞核的布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間。
圖1 (a)示出了 LN-、ER+BC組織病理學(xué)圖像。圖1 (b)示出了對(duì)應(yīng)的BC細(xì)胞核的基于EM的分割。圖1(b)中的分割被平滑化成圖1(c)以幫助檢測(cè)獨(dú)立的細(xì)胞核。圖1(d) 示出了用于特征提取的最終檢測(cè)的核質(zhì)心(黑點(diǎn))。圖2 (a)和圖2 (d)示出了低等級(jí)和高等級(jí)LN_、ER+BC樣本。圖2 (b)和圖2 (e)示出了德洛內(nèi)三角剖分。圖2(c)和圖2(f)示出了疊加的最小生成樹(shù)圖。圖3示出了架構(gòu)特征的圖形嵌入描記圖,示出了圖3不同部分的清晰分離。圖3(a) 示出了 BC等級(jí)。圖3(b)示出了 RS標(biāo)簽。嵌入被投射到ID線(xiàn)中,其中圖3(c)示出了 BC 等級(jí),圖3 (d)示出了由單一分?jǐn)?shù)定義的RS。圖4(a)示出了癌細(xì)胞核和淋巴細(xì)胞核之間外觀(guān)的相似性。通常,淋巴細(xì)胞核與癌細(xì)胞核的區(qū)別是它們的尺寸更小、更加圓形和更暗,均一染色。額外的挑戰(zhàn)包括圖4(b)中外觀(guān)的變化,圖4(c)示出了單一組織病理學(xué)載片之內(nèi)的BC細(xì)胞核,圖4(d)示出了癌組織之間存在脂肪,圖4(e)示出了組織學(xué)固定,圖4(f)示出了載片數(shù)字化偽影。圖5示出了圖示說(shuō)明用于HER2+BC組織病理學(xué)的基于LI的分層的CADx系統(tǒng)和方法中的4個(gè)主要步驟的流程圖。自動(dòng)化淋巴細(xì)胞檢測(cè)之后為架構(gòu)和形態(tài)特征的特征提取。 然后經(jīng)由圖形嵌入將高維度特征空間非線(xiàn)性嵌入維度縮減的空間中,其允許經(jīng)由SVM分類(lèi)器進(jìn)行數(shù)據(jù)可視化和后續(xù)的評(píng)估。圖6示出了圖示說(shuō)明自動(dòng)淋巴細(xì)胞檢測(cè)系統(tǒng)和方法中的主要步驟的流程圖。圖7示出了圖示說(shuō)明區(qū)域r的迭代生長(zhǎng)的示意圖。在當(dāng)前區(qū)域SCK、當(dāng)前邊界、和劃界框^的初始化(如圖7(a)所示)之后,迭代地增加新像素(如圖7(b)所示)。在向 Sck增加新像素(以白色勾勒出)時(shí),根據(jù)圖7(c)所示對(duì)應(yīng)調(diào)節(jié)邊界Scb和&B。圖8 (a)和圖8 (e)示出了兩種不同HER2+BC組織病理學(xué)研究的亮度信道。圖8 (b) 和圖8(f)示出了對(duì)應(yīng)的基于初始區(qū)域生長(zhǎng)的淋巴細(xì)胞檢測(cè)。圖8 (c)和圖8(g)示出了初步貝葉斯細(xì)化,示出了檢測(cè)到的BC核(亮圓)和檢測(cè)到的淋巴細(xì)胞核(暗圓)。圖8(d)和圖8(h)示出了 MRF修剪步驟之后最終的淋巴細(xì)胞檢測(cè)結(jié)果。圖9示出了從經(jīng)驗(yàn)訓(xùn)練數(shù)據(jù)估計(jì)并經(jīng)由伽馬分布的加權(quán)和建模的概率密度函數(shù) (PDF),其中,圖9(a)、圖9(c)為ω t類(lèi)而圖9 (b),圖9 (d)為類(lèi),并且對(duì)于每個(gè)r e R,圖9(a)、圖9(b)為區(qū)域平方根,圖9(c)、圖9(d)為亮度變化。在圖9(a)_(d)中所示的每種分布中,都疊加了估計(jì)的參數(shù)模型。圖10示出了兩種不同的HER2+乳腺癌組織病理學(xué)圖像,圖10 (a)的LI水平高,圖 10(b)的LI水平低。圖10((b)和圖10(f))示出了利用自動(dòng)檢測(cè)的淋巴細(xì)胞中心作為圖形頂點(diǎn)構(gòu)造的對(duì)應(yīng)沃羅諾伊圖。圖10((c)、(g))和10((d)、(h))中分別示出了對(duì)應(yīng)的德洛內(nèi)三角剖分和最小生成樹(shù)圖。圖11示出了全部41幅BC組織病理學(xué)圖像中自動(dòng)和人工檢測(cè)的淋巴細(xì)胞核之間部分、定向的豪斯道夫距離&(C^T Wl。虛線(xiàn)表示自動(dòng)淋巴細(xì)胞檢測(cè)系統(tǒng)和方法的誤差中值。圖12示出了 3重交叉確認(rèn)的100次試驗(yàn)中的平均(μ皿)分類(lèi)精確度,是針對(duì)經(jīng)圖形嵌入獲得的不同維數(shù)(2,3,...,10)示出的。誤差條線(xiàn)代表分類(lèi)精確度的標(biāo)準(zhǔn)偏差
(0 ACC)。圖13示出了針對(duì)從圖13(a)人工和圖13(b)自動(dòng)淋巴細(xì)胞檢測(cè)導(dǎo)出的架構(gòu)特征集在圖形嵌入減少的3維本征空間中繪示的所有41幅圖像。示出了 Varma-Zisserman特征的嵌入,對(duì)于圖13 (c) K = 3,對(duì)于圖13(d) K = 5。標(biāo)簽表示腫瘤學(xué)專(zhuān)家確定的低LI (圓)、 中LI (正方形)和高LI (三角形)的樣本。注意,具有架構(gòu)特征的GE揭示了底層流形結(jié)構(gòu)的存在,示出了具有低、中和高水平LI的BC樣本的平滑連續(xù)體。
具體實(shí)施例方式可以使用能夠再現(xiàn)地且定量地表征組織架構(gòu)的圖像分析系統(tǒng)來(lái)預(yù)測(cè)患者的結(jié)果。本發(fā)明涉及基于圖像的計(jì)算機(jī)輔助預(yù)后(CAP)系統(tǒng)和方法,其旨在復(fù)制組織病理學(xué)和病理過(guò)程(包括,但不限于癌癥)中分子化驗(yàn)的預(yù)后能力。本發(fā)明涉及關(guān)鍵方法貢獻(xiàn)以及使用若干現(xiàn)有技術(shù)的機(jī)器學(xué)習(xí)系統(tǒng)和方法,其包括,但不限于自動(dòng)檢測(cè)BC細(xì)胞核的魯棒、有效方法;描述組織學(xué)結(jié)構(gòu)的架構(gòu)布置的圖像特征;以及使用非線(xiàn)性維數(shù)縮減對(duì)低維表達(dá)中的底層生物學(xué)數(shù)據(jù)結(jié)構(gòu)分類(lèi)和可視化。本發(fā)明涉及一種基于期望值最大化(EM)算法的半自動(dòng)核檢測(cè)系統(tǒng)和方法。本發(fā)明涉及一種基于期望值最大化(EM)算法的半自動(dòng)核檢測(cè)系統(tǒng)和方法??梢栽谌缦挛墨I(xiàn)中找到關(guān)于期望值最大化算法的更多信息fatakdawala,H.,Basavanhally, A. Xu, J., Ganesan, S. , Feldman, Μ. , Tomaszewski, J. , Madabhushi, A. , Expectation Maximization driven Geodesic Active Contour with Overlap Resolution(EMaGACOR) !Application to Lymphocyte Segmentation on Breast Cancer Histopathology, IEEE Trans, on Biomedical Engineering,2010 (印刷中)”,在此通過(guò)引用將其并入本文。在本發(fā)明中,導(dǎo)出架構(gòu)特征以表征包括但不限于乳腺癌細(xì)胞核的癌癥細(xì)胞核的布置。在Doyle等人的文獻(xiàn)[9]中,利用BC細(xì)胞核作為頂點(diǎn)構(gòu)造不同的圖形,并使用從這些圖形導(dǎo)出的定量特征對(duì)BC等級(jí)成功進(jìn)行分層。在本發(fā)明中,采用圖形嵌入(GE)(—種非參數(shù)型非線(xiàn)性維數(shù)縮減[9])從每個(gè)BC組織標(biāo)本向縮減的3D空間投射圖像導(dǎo)出的特征,接下來(lái),向下投射到ID線(xiàn)。采用支持矢量機(jī)(SVM)分類(lèi)器[10]評(píng)估架構(gòu)特征相對(duì)于縮減的3D 空間中BC等級(jí)的可區(qū)分性。進(jìn)一步將圖像數(shù)據(jù)投射到ID線(xiàn)允許我們定義針對(duì)不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù),類(lèi)似于Oncotype DX RS0這種基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)測(cè)因子可能會(huì)取代Oncotype DX來(lái)預(yù)測(cè)BC結(jié)果和存活率。在本發(fā)明的一個(gè)實(shí)施例中,公開(kāi)了一種計(jì)算機(jī)化系統(tǒng)和方法以在數(shù)字化HER2+BC 組織病理學(xué)中自動(dòng)檢測(cè)LI程度并對(duì)其評(píng)定等級(jí)。首先通過(guò)區(qū)域生長(zhǎng)和馬爾可夫隨機(jī)場(chǎng)算法的組合來(lái)自動(dòng)檢測(cè)淋巴細(xì)胞。使用獨(dú)立檢測(cè)的淋巴細(xì)胞的中心作為頂點(diǎn),構(gòu)造三個(gè)圖形 (沃羅諾伊圖,德洛內(nèi)三角剖分和最小生成樹(shù)),并從每個(gè)樣本提取描述淋巴細(xì)胞布置的總共50個(gè)圖像導(dǎo)出的特征。然后使用非線(xiàn)性維數(shù)縮減系統(tǒng)和方法,圖形嵌入,將高維特征矢量投射到縮減的3D嵌入空間中。使用支持矢量機(jī)分類(lèi)器區(qū)分維度縮減的嵌入空間中具有高和低LI的樣本。本發(fā)明的一個(gè)實(shí)施例涉及基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)估方法,用于測(cè)量癌癥程度,以利用數(shù)字化組織病理學(xué)來(lái)評(píng)估癌癥患者的疾病結(jié)果,該方法包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中;ii.利用基于期望值最大化的算法檢測(cè)癌癥細(xì)胞核;iii.利用獨(dú)立檢測(cè)的癌癥細(xì)胞核的中心作為頂點(diǎn)構(gòu)造德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述癌癥細(xì)胞核布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間;vi.將3D嵌入展開(kāi)到ID尺度中以定義針對(duì)不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù);vii.確定基于圖像的再發(fā)生分?jǐn)?shù),以通過(guò)揭示ID線(xiàn)上樣本的等級(jí)標(biāo)簽以及它們的相對(duì)位置來(lái)在低、中和高癌癥等級(jí)之間進(jìn)行區(qū)分,以預(yù)測(cè)預(yù)后。本發(fā)明的一個(gè)實(shí)施例涉及基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)估方法,用于測(cè)量病理過(guò)程的程度,以利用數(shù)字化組織病理學(xué)來(lái)評(píng)估患者的疾病結(jié)果,該方法包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中;ii.利用基于期望值最大化的算法檢測(cè)病理細(xì)胞核;iii.利用獨(dú)立檢測(cè)的病理細(xì)胞核的中心作為頂點(diǎn)構(gòu)造德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述病理細(xì)胞核布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間;vi.將3D嵌入展開(kāi)到ID尺度中以定義針對(duì)不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù);vii.確定基于圖像的再發(fā)生分?jǐn)?shù),以通過(guò)揭示ID線(xiàn)上樣本的等級(jí)標(biāo)簽以及它們的相對(duì)位置來(lái)在低、中和高癌癥分?jǐn)?shù)之間進(jìn)行區(qū)分,以預(yù)測(cè)預(yù)后。本發(fā)明的一個(gè)實(shí)施例涉及基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)估方法,用于測(cè)量癌癥程度,以利用數(shù)字化組織病理學(xué)來(lái)評(píng)估節(jié)點(diǎn)陰性、雌激素受體陽(yáng)性乳腺癌患者的疾病結(jié)果,該方法包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中;ii.利用基于期望值最大化的算法檢測(cè)癌癥細(xì)胞核;iii.利用獨(dú)立檢測(cè)的癌癥細(xì)胞核的中心作為頂點(diǎn)構(gòu)造德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述癌癥細(xì)胞核的布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間;vi.將3D嵌入展開(kāi)到ID尺度中以定義針對(duì)不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù);vii.確定基于圖像的再發(fā)生分?jǐn)?shù),以通過(guò)揭示ID線(xiàn)上樣本的等級(jí)標(biāo)簽以及它們的相對(duì)位置來(lái)在低、中和高癌癥分?jǐn)?shù)之間進(jìn)行區(qū)分,以預(yù)測(cè)預(yù)后。本發(fā)明的實(shí)施例涉及用于測(cè)量淋巴細(xì)胞浸潤(rùn)的程度的方法,以評(píng)估表達(dá)人類(lèi)上皮生長(zhǎng)因子受體2(HER2)的乳腺癌患者的疾病結(jié)果,該方法包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中;ii.利用區(qū)域生長(zhǎng)和馬爾可夫隨機(jī)場(chǎng)算法的組合來(lái)檢測(cè)淋巴細(xì)胞核;iii.利用獨(dú)立檢測(cè)的淋巴細(xì)胞核的中心作為頂點(diǎn)構(gòu)造沃羅諾伊圖、德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述淋巴細(xì)胞核的布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間。
具體實(shí)施例方式示范性實(shí)施例1 使用基于EM的高斯混合自動(dòng)檢測(cè)細(xì)胞核本發(fā)明涉及一種基于圖像的計(jì)算機(jī)輔助預(yù)后(CAP)系統(tǒng)和方法,其旨在復(fù)制BC組織病理學(xué)中分子化驗(yàn)的預(yù)后能力,僅使用組織載片樣本、用于數(shù)字載片掃描的機(jī)構(gòu)和計(jì)算機(jī),我們基于圖像的CAP系統(tǒng)和方法旨在克服與Oncotype DX相關(guān)聯(lián)的很多缺點(diǎn),包括與化驗(yàn)相關(guān)聯(lián)的高成本;具有專(zhuān)用設(shè)備的實(shí)驗(yàn)室設(shè)施有限;以及活檢和預(yù)后預(yù)測(cè)之間的時(shí)間長(zhǎng)度。數(shù)據(jù)集 從一群17位患者收集總共37幅蘇木精和曙紅(H&E)染色的乳房組織病理學(xué)圖像并利用高分辨率整體載片掃描器以20倍光學(xué)放大率掃描到計(jì)算機(jī)中。對(duì)于所有方法而言,我們定義側(cè)幅圖像的數(shù)據(jù)集Z= (G,G,...,CW),其中圖像e(C,g)是像素的2D集合,而沒(méi)是相關(guān)聯(lián)的強(qiáng)度函數(shù)。每個(gè)c都與架構(gòu)特征集合 F(C)、Oncotype DX RS Lrs(C)E {1,2,100}以及 BC 等級(jí) Lgr(C) ^{LG, MG, HG丨相關(guān)聯(lián),其中LG、MG和HG分別代表低、中和高等級(jí)癌癥。還基于它們的RS對(duì)37個(gè)樣本分類(lèi),其中Lks被分入良好(RS < 22)、中等03 < RS彡30)和不良(31 < RS < 100)預(yù)后類(lèi)別。癌細(xì)胞核基于EM的分割為了分割BC細(xì)胞核,將每幅圖像C模型化為K = 5個(gè)分量的高斯混合,其中κ = {1,2,...,Κ}。優(yōu)化模型參數(shù)集γ1=丨μ'κ,σ'κ, p'K: ,包括迭代i次的均值μ κ,協(xié)方差ο κ和先驗(yàn)概率Pk。通過(guò)所有c e C上的RGB值的K平均分群,將該混合初始化到Y(jié) °。 期望值步驟計(jì)算后驗(yàn)概率
權(quán)利要求
1. 一種基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)估方法,用于利用數(shù)字化組織病理學(xué)來(lái)測(cè)量癌癥程度, 以評(píng)估癌癥患者的疾病結(jié)果,該方法包括1.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中; .利用基于期望值最大化的算法檢測(cè)癌癥細(xì)胞核;iii.利用獨(dú)立檢測(cè)的癌癥細(xì)胞核的中心作為頂點(diǎn)構(gòu)造德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述所述癌癥細(xì)胞核的布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間中;vi.將3D嵌入展開(kāi)到ID尺度中以定義針對(duì)不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù);vii.確定基于圖像的再發(fā)生分?jǐn)?shù),以通過(guò)揭示ID線(xiàn)上樣本的等級(jí)標(biāo)簽以及它們的相對(duì)位置來(lái)在低、中和高癌癥等級(jí)之間進(jìn)行區(qū)分,從而預(yù)測(cè)預(yù)后。
2.一種基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)估方法,用于利用數(shù)字化組織病理學(xué)來(lái)測(cè)量病理過(guò)程的程度,以評(píng)估患者的疾病結(jié)果,該方法包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中; .利用基于期望值最大化的算法來(lái)檢測(cè)病理細(xì)胞核;iii.利用獨(dú)立檢測(cè)的病理細(xì)胞核的中心作為頂點(diǎn)構(gòu)造德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述所述病理細(xì)胞核的布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間中;vi.將3D嵌入展開(kāi)到ID尺度中以定義針對(duì)不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù);vii.確定基于圖像的再發(fā)生分?jǐn)?shù),以通過(guò)揭示ID線(xiàn)上樣本的等級(jí)標(biāo)簽以及它們的相對(duì)位置來(lái)在低、中和高癌癥等級(jí)之間進(jìn)行區(qū)分,從而預(yù)測(cè)預(yù)后。
3.一種基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù)預(yù)估方法,用于利用數(shù)字化組織病理學(xué)來(lái)測(cè)量癌癥程度, 以評(píng)估節(jié)點(diǎn)陰性、雌激素受體陽(yáng)性的乳腺癌患者的疾病結(jié)果,該方法包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中; .利用基于期望值最大化的算法檢測(cè)癌癥細(xì)胞核;iii.利用獨(dú)立檢測(cè)的癌癥細(xì)胞核的中心作為頂點(diǎn)構(gòu)造德洛內(nèi)三角剖分和最小生成樹(shù)圖;iv.從每幅圖像提取描述所述癌癥細(xì)胞核的布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間中;vi.將3D嵌入展開(kāi)到ID尺度中以定義針對(duì)不良、中等和良好結(jié)果的基于圖像的風(fēng)險(xiǎn)分?jǐn)?shù);vii.確定基于圖像的再發(fā)生分?jǐn)?shù),以通過(guò)揭示ID線(xiàn)上樣本的等級(jí)標(biāo)簽以及它們的相對(duì)位置來(lái)在低、中和高癌癥分?jǐn)?shù)之間進(jìn)行區(qū)分,從而預(yù)測(cè)預(yù)后。
4.一種用于測(cè)量淋巴細(xì)胞浸潤(rùn)的程度以評(píng)估表達(dá)人類(lèi)上皮生長(zhǎng)因子受體2 (HER2)的乳腺癌患者的疾病結(jié)果的方法,該方法包括i.利用高分辨率整體載片掃描器將染色的組織病理學(xué)載片掃描到計(jì)算機(jī)中;ii.利用區(qū)域生長(zhǎng)和馬爾可夫隨機(jī)場(chǎng)算法的組合來(lái)檢測(cè)淋巴細(xì)胞核;iii.利用獨(dú)立檢測(cè)的淋巴細(xì)胞核的中心作為頂點(diǎn)構(gòu)造沃羅諾伊圖、德洛內(nèi)三角剖分和最小生成樹(shù);iv.從每幅圖像提取描述淋巴細(xì)胞核的布置的圖像導(dǎo)出的特征;v.經(jīng)由圖形嵌入將高維圖像導(dǎo)出的特征矢量投射到縮減的3D嵌入空間中。
全文摘要
本發(fā)明涉及一種基于圖像的計(jì)算機(jī)輔助預(yù)后(CAP)系統(tǒng)和方法,其旨在復(fù)制組織病理學(xué)和病理過(guò)程(包括,但不限于癌癥)中分子化驗(yàn)的預(yù)后能力。僅使用組織載片樣本、用于數(shù)字載片掃描的機(jī)構(gòu)和計(jì)算機(jī),本發(fā)明涉及一種基于圖像的CAP系統(tǒng)和方法,其旨在克服與預(yù)后分子化驗(yàn)(例如Oncotype DX)相關(guān)聯(lián)的很多缺點(diǎn),包括與化驗(yàn)相關(guān)聯(lián)的高成本、具有專(zhuān)用設(shè)備的實(shí)驗(yàn)室設(shè)施有限以及活檢和預(yù)后預(yù)測(cè)之間的持續(xù)時(shí)間。
文檔編號(hào)G06F17/10GK102388305SQ201080012959
公開(kāi)日2012年3月21日 申請(qǐng)日期2010年2月2日 優(yōu)先權(quán)日2009年2月2日
發(fā)明者A·巴薩萬(wàn)哈利, A·馬達(dá)布什, S·加內(nèi)桑 申請(qǐng)人:新澤西醫(yī)科大學(xué), 羅格斯新澤西州立大學(xué)