一種貝葉斯顯微成像方法
【專利摘要】本發(fā)明涉及一種貝葉斯顯微成像方法,包括以下內(nèi)容:1)提取單分子信息提取,并獲取單分子候選點;2)隨機從單分子候選點中選擇部分點作為初始點,建立用于構(gòu)建不同位置熒光分子出現(xiàn)概率分布圖的初始模型;3)采用聚類分析方法將初始模型中的熒光分子按位置信息進行聚類,對每一類熒光分子進行優(yōu)化處理得到擴展點;4)從候選點中刪除已經(jīng)分析過的熒光分子,并從步驟2)中剩下的候選點隨機選擇建立初始模型,重復步驟3)得到新的擴展點,直到所有的候選點分析完成;5)合并所有的擴展點作為新的候選點重復步驟3)和步驟4),直到相鄰兩次迭代重構(gòu)結(jié)果滿足設(shè)定要求,迭代停止;6)將迭代過程中得到的熒光分子位置信息進行重構(gòu),得到超高分辨率熒光分子的定位圖。本發(fā)明廣泛適用于大視野的活細胞及固定細胞的熒光顯微成像。
【專利說明】
-種貝葉斯顯微成像方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種貝葉斯顯微成像方法,屬于生物超高分辨顯微成像技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 超高分辨率巧光顯微鏡在生物學研究領(lǐng)域有著廣泛的應(yīng)用,使得人們能夠更好、 更深入地認識、理解細胞生物學。與電子顯微鏡一樣,超高分辨率巧光顯微鏡可W讓人們觀 察到W往無法觀察到的細胞內(nèi)部結(jié)構(gòu)及動態(tài)變化過程。并且,超高分辨率巧光顯微鏡還具 有連電子顯微鏡都無可比擬的優(yōu)勢一對活細胞成像,并能高特異性地標記多個分子。
[0003] 由于光學衍射的限制,傳統(tǒng)的光學顯微鏡不能識別200nmW下的結(jié)構(gòu)。超高分辨率 巧光顯微技術(shù)打破了運一限制,并在2014年獲得諾貝爾化學獎,該技術(shù)主要可W分為兩類, 結(jié)構(gòu)光照明技術(shù)(例如受激發(fā)射損耗顯微技術(shù)ST邸和飽和結(jié)構(gòu)照明顯微技術(shù)SIM)和單分子 巧光定位技術(shù)(例如隨機光學重構(gòu)顯微技術(shù)STORM和光激活定位顯微技術(shù)PALM)。其中,單分 子定位技術(shù)通過大量具有稀疏巧光分子的圖像擬合疊加得到超高分辨率圖像,但是該方法 要求圖像中的巧光分子密度足夠低W保證單個巧光分子之間不能重疊。為了獲得超高分辨 率圖像就需要大量的圖像,運樣長時間拍照就會導致樣品漂移和細胞損傷,時間分辨率低, 影響該技術(shù)在活細胞成像中的應(yīng)用。針對活細胞成像要求,當前有很多方法通過擬合多個 巧光分子來得到更高時間分辨率的結(jié)果。但是,隨著巧光密度的增加,很難確定真實的擬合 模型,定位精度大大下降,運限制了時間分辨率的進一步提高。
[0004] 近年來,研究發(fā)現(xiàn)一種利用統(tǒng)計貝葉斯解決高密度巧光圖像識別的方法 (Bayesian analysisof the blinking and bleaching,3B),3B利用巧光分子漂白和閃爍 的特性,通過分析整個圖像序列的變化得到巧光分子概率圖。作為細胞成像新的重要工具, 盡管它可W用簡單的光學設(shè)備實現(xiàn)活細胞動態(tài)結(jié)構(gòu)的超高分辨率成像,但是仍然有=個關(guān) 鍵的問題需要解決:1)在精度方面,存在嚴重的結(jié)構(gòu)缺失,定位精度不高;2)在速度方面,該 方法極其耗時,為了得到1. SwnX 1.5WI1的超分辨率結(jié)構(gòu),大約需要6小時,并且隨著圖像尺 寸的增加,計算時間急劇增長;3)在分析尺度方面,由于速度的限制,該方法很難獲得整個 活細胞大尺度長時間的動態(tài)變化。
【發(fā)明內(nèi)容】
[0005] 針對上述問題,本發(fā)明的其中一個發(fā)明目的是提供一種能夠加快高密度數(shù)據(jù)重構(gòu) 速度且能夠提高重構(gòu)精度的貝葉斯顯微成像方法。
[0006] 本發(fā)明的另一發(fā)明目的是提供一種基于單分子定位的貝葉斯顯微成像方法,能夠 確定細胞等生物樣品中用來標記蛋白等生物物質(zhì)的巧光分子在納米尺度的精確定位,W及 在活細胞中精確定位動態(tài)變化即活細胞中的超高分辨顯微成像。
[0007] 為實現(xiàn)上述其中一發(fā)明目的,本發(fā)明采取W下技術(shù)方案:一種貝葉斯顯微成像方 法,其特征在于包括W下內(nèi)容:1)建立用于構(gòu)建不同位置巧光分子出現(xiàn)概率分布圖的初始 模型;2)采用聚類分析方法、限定的前向算法和共輛梯度法優(yōu)化初始模型并進行模型選擇; 3)重復步驟2)直到相鄰兩次迭代重構(gòu)結(jié)果符合設(shè)定要求;4)將每次迭代過程中得到的巧光 分子位置信息進行重構(gòu),得到巧光分子的超分辨定位圖。
[0008] 進一步,所述步驟1)初始模型建立的具體過程為:連續(xù)采集一系列巧光圖像作為 原始圖像序列;利用巧光分子的轉(zhuǎn)移概率,隨機選擇分析區(qū)域中的某些位置作為初始位置, 并在初始位置處建立因子隱馬爾可夫初始模型。
[0009] 進一步,所述步驟2)優(yōu)化初始模型的具體過程為:采用聚類分析方法對初始模型 中巧光分子按照彼此相對距離的不同劃分成N個不同的類別;W每一個類別中的初始位置 出發(fā),采用混合MCMC和限定的前向算法計算某一位置出現(xiàn)巧光分子的概率;采用共輛梯度 法計算出現(xiàn)巧光分子概率的極值點,選取概率最高的位置作為優(yōu)化結(jié)果,合并N個類別,并 在獲得概率最高的位置建立新的隱馬爾可夫初始模型。
[0010] 進一步,所述步驟2)模型選擇的具體過程為:①采用聚類分析方法對得到的新的 初始模型中的巧光分子位置按照彼此相對距離的不同進行聚類分析,將其分為不同的類 另IJ;②隨機選擇某個位置作為待新增的巧光分子位置或者在新的初始模型中隨機選擇待刪 除巧光分子;③判斷步驟②新增或刪除的巧光分子與步驟①聚類后哪一個類別最近,在其 最近或所屬的類別中,使用混合MCMC、限定的前向算法和共輛梯度法計算在此位置增加一 個巧光分子或刪除一個已有巧光分子后對模型概率的影響,如果概率增加則保留該位置信 息,并將其加入到新的初始模型作為新的初始位置。
[0011] 為實現(xiàn)上述另一發(fā)明目的,本發(fā)明采取W下技術(shù)方案:一種貝葉斯顯微成像方法, 其特征在于包括W下內(nèi)容:1)提取單分子信息提取,并獲取單分子候選點;2)隨機從單分子 候選點中選擇部分點作為初始點,建立用于構(gòu)建不同位置巧光分子出現(xiàn)概率分布圖的初始 模型;3)采用聚類分析方法將初始模型中的巧光分子按位置信息進行聚類,對每一類巧光 分子進行優(yōu)化處理得到擴展點;4)從候選點中刪除已經(jīng)分析過的巧光分子,并從步驟2)中 剩下的候選點隨機選擇建立初始模型,重復步驟3)得到新的擴展點,直到所有的候選點分 析完成;5)合并所有的擴展點作為新的候選點重復步驟3)和步驟4),直到相鄰兩次迭代重 構(gòu)結(jié)果滿足設(shè)定要求,迭代停止;6)將迭代過程中得到的巧光分子位置信息進行重構(gòu),得到 超高分辨率巧光分子的定位圖。
[0012] 進一步,所述步驟1)提取單分子信息提取,并獲取單分子候選點通過雙通道巧光 顯微鏡采集兩通道采集單分子和高密度信息,或者通過單通道同時采集單分子和高密度信 息。
[0013] 進一步,所述步驟1)提取單分子信息提取,并獲取單分子候選點,具體過程為: 1.1)對于提供單分子信息的圖像序列,利用單分子定位方法,精確得到巧光分子的位置信 息;1.2)當采用雙通道進行數(shù)據(jù)采集時,在其中一通道圖像序列中選擇與待分析另一通道 圖像序列相同圖像帖數(shù)所包含的單分子作為候選點;當采用單通道進行數(shù)據(jù)采集時,選擇 所有圖像序列中的單分子作為候選點;1.3)當采用雙通道進行數(shù)據(jù)采集時需要進行漂移校 準:分別校準兩通道的圖像數(shù)據(jù),并將兩通道之間建立聯(lián)系,將其中一通道圖像的單分子候 選點校準到待分析另一通道對應(yīng)區(qū)域中。
[0014] 進一步,所述步驟3)采用聚類分析方法將初始模型中的巧光分子按位置信息進行 聚類,對每一類巧光分子進行優(yōu)化處理得到擴展點,包括W下內(nèi)容:3.1)用混合前向算法和 MCMC方法獲得初始模型的采樣圖;3.2)對類中的每一個巧光分子,用限定的前向算法和改 進的共輛梯度方法進行優(yōu)化獲得新的巧光分子;3.3)對每個新的巧光分子通過距離和強度 闊值進行判斷,確定是否將計算得到的新的巧光分子作為擴展點;3.4)計算擴展點的采樣 圖,并將運些采樣圖通過擴張采樣方法添加到初始模型的采樣圖中。
[0015]進一步,限定的前向算法是指當計算某個巧光分子的觀測概率時,不需要計算整 個圖像區(qū)域,而僅僅計算W該巧光分子中屯、坐標為中屯、,3個標準差的范圍內(nèi)的值,當超過 該范圍時,認為不會影響周圍的巧光分子。
[0016]進一步,所述聚類分析方法采用k-means方法。
[0017] 由于本發(fā)明采取W上技術(shù)方案,其具有W下優(yōu)點:1、在時間分辨率方面,本發(fā)明與 單分子定位標準方法PALM相比,時間分辨率提高100~1000倍,與高密度定位顯微3B相比, 重構(gòu)需要圖像帖數(shù)從至少200帖降低到100帖,時間分辨率提高兩倍;在空間分辨率方面,本 發(fā)明與PALM相比,重構(gòu)結(jié)構(gòu)基本相同;與3B相比,結(jié)構(gòu)連續(xù)性更好,不會出現(xiàn)結(jié)構(gòu)的缺失,定 位精度高;在運行速度方面,相比3B有幾個數(shù)量級的提高,針對50 X 50的像素區(qū)域,加速比 將近100倍,并且隨著分析區(qū)域的增大,加速效果更加明顯,可W在普通PC機對整個成像視 野進行超高分辨顯微成像;在分析尺度方面,由于圖像連續(xù)性改善和運行速度大幅提高,使 得計算全細胞大尺度動態(tài)變化成為可能。2、本發(fā)明基于限定的前向算法和聚類分析方法實 現(xiàn)了貝葉斯顯微成像方法,大大加快了高密度超分辨率成像技術(shù)的運行速度和定位精度。 3、本發(fā)明提出基于單分子定位的貝葉斯顯微成像方法是結(jié)合單分子定位顯微技術(shù) (SIMBA),利用雙通道巧光顯微鏡或單通道巧光顯微鏡進行實現(xiàn),進一步提高了運行速度 和時空分辨率,使得全細胞大尺度長時間動態(tài)變化分析成為可能。本發(fā)明廣泛適用于大視 野的活細胞及固定細胞的巧光顯微成像。
【附圖說明】
[0018] 圖1是不同圖像尺寸下,本發(fā)明執(zhí)行一次前向算法的運行時間示意圖,其中,虛線 為3B前向算法運行時間,實線為采用限定的前向算法后的運行時間;
[0019 ]圖2是本發(fā)明的貝葉斯顯微成像方法流程示意圖;
[0020] 圖3是本發(fā)明巧光分子的狀態(tài)轉(zhuǎn)移示意圖;
[0021] 圖4是本發(fā)明的3B、quick-3B和SIMBA運行時間和重構(gòu)結(jié)果對比效果示意圖,圖(a) ~(d)分析區(qū)域均為38X50的像素區(qū)域,圖(a)為200帖原始圖像疊加,圖(b)為3B重構(gòu)結(jié)果, 圖(c)quick-3B重構(gòu)結(jié)果,圖(d)SIMBA重構(gòu)結(jié)果,圖(e)為3B、quick-3B和SIMBA運行時間對 比示意圖,運行時間分別為19.02小時、1.13小時和ll分鐘,quick-3B加速比為16.8,SIMBA 加速比約為100;
[0022] 圖5是本發(fā)明的巧光蛋白模型示意圖,采用因子的隱馬爾可夫模型(FHMM)表示多 個巧光蛋白共同作用;
[0023] 圖6是本發(fā)明的SIMBA方法流程示意圖;
[0024] 圖7是本發(fā)明肌動蛋白全細胞超分辨率重構(gòu)結(jié)果,共包含紅綠兩個通道數(shù)據(jù)集,其 中2萬帖紅通道數(shù)據(jù)用于PALM成像,200帖綠通道數(shù)據(jù)用于3B和SIMBA成像,其中,圖(a)是綠 通道SIMBA數(shù)據(jù)集200帖原始圖像的疊加,顯示了衍射現(xiàn)象的影響,圖(bl)~化3)是(a)方框 區(qū)域PALM(bl)、3B(b2)和SIMBA(b3)重構(gòu)結(jié)果比較,圖(b4)是用NCC(歸一化相關(guān)系數(shù))比較 了3B與PALM、SIMBA與PALM的相似性,NCC值分別為0.509和0.744,圖(Cl)是不同圖像尺寸下 3B和SIMBA運行時間對比,對于圖像尺寸從10X10像素區(qū)域到50X50像素區(qū)域的數(shù)據(jù)集,3B的 運行時間分別為0.81小時、3.17小時、8.05小時、13.87小時和23.4小時,如虛線所示;SIMBA 的運行時間分別為3分鐘、7分鐘、10分鐘、13分鐘和16分鐘,如實線所示,圖(c2)是相對3B, SIMBA加速比曲線,不同尺寸下加速比分別為16.2、27.2、48.3、64和87.7,圖((11)、((12)分別 PALM分析、SIMBA分析全細胞重構(gòu)結(jié)果比較區(qū)域放大圖,圖(d3)是PALM分析、SIMBA分析全細 胞重構(gòu)結(jié)果局部區(qū)域放大圖,圖(el)、(e2)是圖(dl)和圖(d2)線條的屬性圖,顯示其分辨率 曲線長虛線是PALM結(jié)果,實線是SIMBA結(jié)果,圖(e3)是圖(d3)線條分辨率曲線,分辨率為 49nm;
[0025] 圖8(a)~(C)是本發(fā)明實施例肌動蛋白全細胞大尺度長時間動態(tài)變化。
【具體實施方式】
[0026] W下結(jié)合附圖來對本發(fā)明進行詳細的描繪。然而應(yīng)當理解,附圖的提供僅為了更 好地理解本發(fā)明,它們不應(yīng)該理解成對本發(fā)明的限制。
[0027] 為了加快高密度數(shù)據(jù)重構(gòu)的速度,提高重構(gòu)精度,本發(fā)明提出了一種快速的貝葉 斯顯微成像方法(quick-3B),包括兩方面內(nèi)容:1)限定的前向算法用于快速的計算巧光分 子的觀測概率,加快分析速度;2)聚類分析方法用于減少不相關(guān)的巧光分子影響,提高重構(gòu) 精度,下面對上述兩方面內(nèi)容的原理進行詳細闡述。
[002引1)限定的前向算法
[0029] 當采用3B方法分析巧光數(shù)據(jù)時,需要選擇巧光分子的初始數(shù)目,但是隨著圖像分 析區(qū)域的增大,即使選擇相同初始數(shù)目的巧光分子,計算時間也會急劇增長,甚至到無法計 算的地步。為了高效地確定巧光分子的參數(shù),3B使用了一種混合前向算法和MCMC(馬爾科夫 蒙特卡洛)的方法。在運個過程中,3B利用前向算法計算了某一位置是否是巧光分子的概 率。如圖1所示,通過虛線可W看出,在選擇相同初始數(shù)目的巧光分子情況下,前向算法的運 行時間和圖像的尺寸成正比。進一步分析發(fā)現(xiàn),前向算法在計算過程中需要確定某一數(shù)據(jù) 區(qū)域的觀測概率,即求某一帖圖像某一個區(qū)域包含巧光分子或者不含巧光分子的概率,在 運個過程中3B需要計算整個圖像區(qū)域。因此,3B的時間復雜度與巧光分子數(shù)目和圖像像素 數(shù)目的乘積成正比。然而,圖像系統(tǒng)是受點擴散函數(shù)(PSF)的影響,PSF可W假設(shè)是服從正態(tài) 分布,N(u,〇2)(均值是U,標準差是0)。巧光分子產(chǎn)生的高斯斑是W坐標原點為中屯、,呈指數(shù) 下降的趨勢,并且99.7%的置信區(qū)間是W巧光分子中屯、坐標為中屯、3個標準差范圍W內(nèi),因 此本發(fā)明提出了一種限定的前向算法,對巧光分子的作用范圍加 W限制。當計算某個巧光 分子的觀測概率時,不需要計算整個圖像區(qū)域,而僅僅計算W該巧光分子中屯、坐標為中屯、, 3個標準差的范圍內(nèi)的值,當超過該范圍時,認為不會影響周圍的巧光分子。如圖1所示的實 線表示在使用限定的前向算法時不同圖像尺寸的運行時間,可W看出,選擇相同初始數(shù)目 的巧光分子,隨著圖像尺寸的增大,計算時間基本不變。在優(yōu)化初始模型中使用限定的前向 算法,使得時間復雜度從巧光分子數(shù)目與圖像像素數(shù)目乘積成正比,變成巧光分子數(shù)目與 常數(shù)的乘積成正比。
[0030] 2)聚類分析方法
[0031] 3B通過因子的隱馬爾科夫模型(FHMM)對模型中所有巧光分子進行建模,在該方法 中,某個巧光分子位置的確定需要考慮其他所有的巧光分子的影響。然而,由于PSF作用范 圍的影響,如果一個巧光分子遠離其他的巧光分子一定距離W上,那么該巧光分子幾乎不 會對其他巧光分子產(chǎn)生影響,而將所有巧光分子引入會導致計算誤差的增大。從上述分析 可W看出,為了消除不相關(guān)巧光分子的影響,把相鄰的、可能會相互作用的巧光分子聚在 一起,然后分別進行計算。運樣,自然的引入了聚類的概念,聚類是將一系列對象組成的集 合進行劃分,具有相似屬性的對象劃分成一類。在同一類別中,對象之間彼此相似,但與其 他類別中的對象相異。聚類分析將最有可能相互作用的對象聚合在一起,考慮了對象之間 的固有屬性,正好可W解決當前的問題。本發(fā)明采用k-means算法對巧光分子進行聚類,對 于包含M個巧光分子的模型,將其劃分成k個類別,并用巧光分子之間的位置關(guān)系來衡量是 否分在同一類別中,計算如公式(1)所示:
[0032]
(1)
[0033] 式中,刮為巧光分子j的位置信息,Ui為類別i的中屯、位置,k-means算法使得巧光分 子都被分配到最近的類別Si中,M X廣Ui M 2表示巧光分子刮和類別中屯化的距離。k-means方 法目的是要最小化每個巧光分子到它對應(yīng)類別中屯、的距離之和。
[0034] 在每輪新的計算過程中都采用k-means算法將巧光分子重新劃分成不同的類別, 然后運些巧光分子分別在各自的類中優(yōu)化,最后合并結(jié)果,進一步降低了計算量。
[0035] 綜上所述,如圖2所示,基于限定的前向算法和聚類分析方法,本發(fā)明提出了一種 快速的貝葉斯顯微成像方法(quick-3B),通過對連續(xù)多張采樣圖像序列進行分析,在納米 尺度確定每個發(fā)光的巧光分子在細胞中的精確定位,包括W下步驟:
[0036] 1、初始模型建立,具體過程為:
[0037] 1.1)采集原始圖像序列,即連續(xù)采集一系列一定曝光時間的巧光圖像作為原始圖 像序列,本發(fā)明實施例中獲取200帖曝光時間為10毫秒的巧光圖像,但是W此為例,不限于 此。
[0038] 1.2)利用巧光分子的轉(zhuǎn)移概率(如圖3所示),隨機選擇分析區(qū)域中的某些位置作 為初始位置,并在初始位置處建立因子隱馬爾可夫(factorial hidden Markov models)初 始模型,用來最終構(gòu)建不同位置巧光分子出現(xiàn)的概率分布圖。
[0039] 2、優(yōu)化初始模型,即W初始模型中的初始位置出發(fā),計算初始位置周圍巧光分子 可能出現(xiàn)的概率,選擇概率最高的位置重新建立新的初始模型,具體過程為:采用k-means 算法對初始模型中的巧光分子按照彼此相對距離的不同劃分成N個不同的類別,W每一個 類別中的初始位置出發(fā),采用混合MCMC和限定的前向算法計算某一位置出現(xiàn)巧光分子的概 率,并用共輛梯度法計算出現(xiàn)巧光分子概率的極值點(梯度的步長是0.5),選取概率最高的 位置作為優(yōu)化結(jié)果,合并N個類別,并在獲得概率最高的位置建立新的隱馬爾可夫初始模 型。
[0040] 3、模型選擇,具體過程為:
[0041] 3.1)采用k-means算法,對步驟2)得到的新的初始模型中的巧光分子位置按照彼 此相對距離的不同進行聚類分析,將其分為不同的類別;
[0042] 3.2)隨機選擇某個位置作為待新增的巧光分子位置或者在新的初始模型中隨機 選擇待刪除巧光分子;
[0043] 3.3)判斷步驟3.2)新增或刪除的巧光分子與步驟3.1)聚類后哪一個類別最近。在 其最近或所屬的類別中,使用混合MCMC、限定的前向算法和共輛梯度計算在此位置增加一 個巧光分子或刪除一個已有巧光分子后對模型概率的影響,如果概率增加則保留該位置信 息,并將其加入到新的初始模型作為新的初始位置。
[0044] 4、重復步驟2和步驟3,直到相鄰兩次迭代重構(gòu)結(jié)果沒有明顯的變化,可W用迭代 過程中新增巧光點的數(shù)目占總巧光點數(shù)目的百分比作為截止條件,例如1%。本發(fā)明實施例 中迭代次數(shù)約200次,但是僅W此為例,不限于此。
[0045] 5、將每次迭代過程中得到的位置信息重構(gòu)為一張概率分布圖,得到巧光分子的超 分辨定位圖。
[0046] 圖4對比了 3B和quick-3B運行時間和超分辨率重構(gòu)結(jié)果,在運行速度方面,對于 200帖38X50像素分析區(qū)域的數(shù)據(jù)集,運行時間從19.02小時縮短到了 1.13小時,加速比為 16.8;在重構(gòu)效果方面,quick-3B結(jié)構(gòu)連續(xù)性更好,與原始疊加圖更加一致。
[0047] 為了進一步提高時空分辨率和運行速度,使得全細胞大尺度長時間動態(tài)變化分析 成為可能,結(jié)合單分子定位顯微技術(shù),利用單通道巧光顯微鏡或雙通道巧光顯微鏡(本發(fā)明 實施例是基于是雙通道巧光顯微鏡進行說明,但是不限于此),本發(fā)明提出了一種基于單分 子定位的貝葉斯顯微成像方法(SIMBA),本發(fā)明使用一種光轉(zhuǎn)換巧光蛋白mEos3.2,該蛋白 在不同波長的激光照射下會發(fā)出紅綠兩種不同巧光,其中,發(fā)出紅色巧光的通道稱之為紅 通道,該通道巧光分子相互不重疊,發(fā)出綠色巧光的通道稱之為綠通道,該通道巧光分子信 號相互之間是重疊的,通過二分鏡進行分光,運樣針對同一細胞結(jié)構(gòu)就可W在不同通道觀 測到不同的巧光狀態(tài),運是SIMBA方法的基礎(chǔ)。首先通過單分子定位方法從紅通道提取出單 分子,運些單分子是用于指導對應(yīng)綠通道巧光分子位置優(yōu)化的,利用雙通道圖像校準技術(shù) 將紅通道的單分子數(shù)據(jù)準確的校準到對應(yīng)的綠通道區(qū)域。然后,在綠通道中基于運些單分 子組成的候選點,利用貝葉斯分析方法得到新的巧光分子位置,稱之為擴展點,運些擴展點 繼續(xù)擴張,得到更多新的巧光分子。在運個擴張的過程中,隨機選擇已經(jīng)得到的部分巧光分 子作為初始模型,然后優(yōu)化運個初始模型得到新的巧光分子,不斷重復模型優(yōu)化和擴張,最 終得到超高分辨率的重構(gòu)結(jié)果。
[004引SIMBA方法主要包括四個方面:1)紅通道單分子定位用于得到紅通道真實的巧光 分子定位信息;2)雙通道圖像校準用于將紅通道的單分子數(shù)據(jù)準確的校準到對應(yīng)的綠通道 中;3)擴張采樣和改進的共輛梯度用于結(jié)合單分子來計算未獲得的巧光分子,減少結(jié)構(gòu)信 息的缺失;4)距離和密度闊值用于去除錯誤的巧光分子,下面對上述四方面的原理進行詳 細闡述。
[0049] 1)紅通道單分子定位
[0050] 為了精確的獲得巧光分子的位置信息,SIMBA使用了一種光轉(zhuǎn)換巧光蛋白mEos3.2 來標記細胞結(jié)構(gòu),該巧光蛋白在波長561nm的激光照射下發(fā)出紅色的巧光,呈現(xiàn)的是單分子 的形態(tài),巧光分子之間互不重疊,每一帖圖像的巧光密度低,在波長488nm的激光照射下發(fā) 出綠色的巧光,巧光蛋白之間互相重疊,每一帖圖像的巧光密度很高,通過二分鏡進行分 光,同時采集兩個通道的數(shù)據(jù)。對于紅通道的數(shù)據(jù),利用單分子定位的方法精確的得到巧光 蛋白的位置信息,運些單分子用于指導綠通道巧光蛋白位置的優(yōu)化。
[0051] 2)雙通道圖像校準
[0052] 由于拍攝過程中,實驗設(shè)備會存在一定漂移,紅綠兩個通道是通過用二分鏡進行 分光,其位置和形變程度也不同。因此,需要將每個通道產(chǎn)生的圖像序列和紅綠通道之間進 行校準。對于單個通道的圖像序列校準,通過追蹤序列里某個巧光珠的軌跡,定位該巧光 珠,然后計算圖像序列和第一帖圖像之間的位移差就可W校準序列間的位置漂移。對于紅 綠通道之間的校準,將整個樣品區(qū)域灑滿了雙色巧光珠(beads),此巧光可同時被波長為 488nm和561nm的激光激發(fā),在兩個通道中就顯示了相同的beads信息,采用仿射變換 (Affine化ansformation)對兩個通道進行校準。仿射變換是一種二維坐標到二維坐標之 間的線性變換,公式如(2)所示,它能實現(xiàn)圖像的平移(Translation)、縮放(Scale)、旋轉(zhuǎn) (Rotation)、翻轉(zhuǎn)(Flip)和錯切(Shear)。首先利用雙色巧光珠計算出仿射變換的變換參 數(shù),然后用運一參數(shù)將紅通道得到的單分子數(shù)據(jù)準確的校準到對應(yīng)的綠通道區(qū)域。
[0化3] C2)
[0054] 式中,(x,y)為變換前的坐標,(u,v)為變換后的坐標,(日2,日1,日日,62,131,13日)為變換 參數(shù)。
[0055] 3)擴張采樣和改進的共輛梯度
[0056] 3B方法利用因子的馬爾可夫模型(raMM)對整個數(shù)據(jù)集進行建模,模型如圖5所 示。FHMM的求解過程是期望最大化化M)的過程,E過程為采樣,即已知模型中巧光分子的參 數(shù)信息,得到符合原圖的采樣圖,M過程為最大化的過程,通過共輛梯度來優(yōu)化模型,捜尋更 可能的巧光分子參數(shù)信息,使得模型中新的巧光分子采樣圖更符合原圖,不斷重復運個過 程,最終得到更精確的FHMM模型參數(shù),如公式3所示:
[0057] Q(d)new| 4)二E{l〇 評(iPt'Dt} I (})new)| 4,化}} (3)
[0058] 式中,{Dt}表示巧光分子的觀測值,即我們可W看到的巧光圖像,t = l,...T,共T帖 圖像,{Ft}表示巧光分子的隱狀態(tài)。
[0059] 巧光分子獨立的在不同狀態(tài)進行轉(zhuǎn)換:發(fā)光、不發(fā)光、漂白,如圖3所示。Q為模型參 數(shù)的優(yōu)化函數(shù),通過給定當前巧光分子參數(shù)4和觀測序列{Dt}來逐步優(yōu)化得到模型中巧光 分子新的參數(shù)&new。由于SIMBA已經(jīng)知道了部分真實的巧光分子定位信息,改變了E過程和M 過程來進一步得到周圍可能的巧光分子,減少了結(jié)構(gòu)缺失,主要包括兩個方面:1、擴張采樣 用于計算未獲得的巧光分子,減少結(jié)構(gòu)信息的缺失;2、改進的共輛梯度用于防止距離相近 的巧光分子計算到相同的局部極值。
[0060] 擴張采樣:首先用混合前向算法和MCMC方法得到初始模型的采樣圖,然后在該采 樣圖的基礎(chǔ)上得到周圍的巧光分子,當?shù)玫揭粋€新的巧光分子時,先計算運個巧光分子的 采樣圖,再將該巧光分子的采樣圖添加到整個模型的采樣圖中,不斷擴張運個模型的采樣。 運個過程相當于"拼圖游戲",先把部分輪廓填充,然后在子圖中優(yōu)化模型,不斷執(zhí)行該操 作,得到了周圍的巧光分子信息,最終得到整張圖像的超分辨率結(jié)構(gòu)。運樣就避免了亮區(qū)域 巧光分子的重復計算,使得更多的巧光分子計算到未獲得的巧光分子區(qū)域,使重構(gòu)結(jié)構(gòu)更 加平滑,擴充了結(jié)構(gòu)信息。而且,在運個過程中僅僅計算新獲得巧光分子的采樣圖,標記其 變化,然后將該巧光分子的采樣圖添加到整體模型的采樣圖中。運樣就避免了每次需要確 定一個巧光分子時,都要重新計算模型中所有巧光分子的采樣圖,降低了計算量。
[0061] 改進的共輛梯度:之前提到的擴張采樣方法,當?shù)玫揭粋€新的巧光分子時,首先計 算運個巧光分子的采樣圖,然后將該巧光分子的采樣圖添加到整個模型的采樣圖中。但是 在計算模型周圍的巧光分子時,如果還是W模型中的巧光分子的位置信息作為初始位置來 優(yōu)化,那么不僅計算耗時而且鄰近的巧光分子還容易跳進相同的局部極值點。因此,為了更 準確的優(yōu)化模型周圍的巧光分子,改變了優(yōu)化的初始位置。假設(shè)巧光蛋服從正態(tài)分布,N(u, O2K均值是U,標準差是0)。為了保證原來模型中的巧光分子會對新優(yōu)化的巧光分子產(chǎn)生影 響,不能將新優(yōu)化的初始位置移動過遠,經(jīng)過實驗,W模型中待優(yōu)化的巧光分子坐標原點U 為中屯、,化半徑內(nèi),隨機選擇一個坐標作為新優(yōu)化的初始位置。
[0062] 4)距離和強度闊值,使用距離和強度闊值來去除計算過程中錯誤的巧光分子,主 要包含兩個方面:(1)距離闊值來避免相同位置巧光分子的重復計算;(2)強度闊值來平衡 巧光分子的強度分布。
[0063] 距離闊值:SIMBA使用共輛梯度得到新的巧光分子,如果優(yōu)化前后兩個巧光分子位 置幾乎相同,那么在迭代計算過程中,相同的位置就會重復計算多次,運會導致局部亮點的 出現(xiàn)。特別的,當需要計算的巧光分子落入到背景區(qū)域中,由于周圍臨近區(qū)域沒有其他巧光 分子,運就使得周圍是巧光分子的概率并沒有比該位置更高。按照共輛梯度計算極值的方 式,就有可能一直計算到相同的區(qū)域。因此,使用距離闊值來進行篩選,當優(yōu)化前后兩點位 置相差不超過0.01像素,認為是同一個巧光分子,舍棄該巧光分子。
[0064] 強度闊值:使用擴張采樣的方式得到新的巧光分子,如果某個區(qū)域有大量的巧光 分子,那么運個區(qū)域?qū)U張出更多新的巧光分子,由于某個圖像區(qū)域的巧光強度是固定 的,所W每個巧光分子所具有的強度值就會越來越小,但是巧光分子的強度值不會一直小 下去,其強度值服從對數(shù)正態(tài)分布,Log-NU,O2),運里采用作為強度闊值的下界來平衡巧 光分子的亮度。
[0065] 綜上所述,如圖6所示,結(jié)合單分子定位顯微技術(shù),本發(fā)明提出了一種基于單分子 定位的貝葉斯顯微成像方法(SIMBA),可W在活細胞進行超高時空分辨率的顯微成像,具體 步驟為:
[0066] 1、單分子信息提取。
[0067] 單分子信息提取可W包括兩種情況,取決于巧光分子的性質(zhì),一種是單分子信息 和高密度信息不在同一通道,基于雙通道巧光顯微鏡采集兩通道原始圖像序列,如光轉(zhuǎn)化 巧光分子mEos3.2、mEos2W及其他相同功能的巧光染料或蛋白。另一種情況是單通道同時 采集單分子和高密度信息,使用光開關(guān)巧光分子,例如8471311-5、1116603、化0噸£1^及其他相 同功能的巧光染料或蛋白,一個通道就能同時提供單分子和高密度信息,本發(fā)明實施例中 使用光轉(zhuǎn)化巧光蛋白mEos3.2利用雙通道成像,并對獲取的兩通道圖像序列數(shù)據(jù)進行預處 理,包括:
[0068] 1.1)對于提供單分子信息的圖像序列(對于雙通道情況,此通道為紅通道),利用 PALM\ST0RM\dST0RM\壓縮感知等單分子定位方法,精確得到巧光分子的位置信息;
[0069] 1.2)對于雙通道情況,在紅通道圖像序列中選擇與待分析綠通道圖像序列相同圖 像帖數(shù)所包含的單分子作為候選點;對于單通道情況,選擇所有圖像序列中的單分子作為 候選點;
[0070] 1.3)對雙通道圖像進行漂移校準:分別校準紅通道和綠通道的圖像數(shù)據(jù),并將紅 綠通道之間建立聯(lián)系,將紅通道圖像的單分子候選點校準到綠通道圖像對應(yīng)區(qū)域中。單通 道情況此步省略。
[0071] 2、隨機從綠通道圖像的候選點中選擇部分點作為初始點,建立初始模型。
[0072] 3、優(yōu)化初始模型,即:采用聚類分析方法(本發(fā)明中使用的是k-means)將初始模型 中的巧光分子按位置信息進行聚類,對每一類巧光分子,進行如下操作:
[0073] 3.1)用混合前向算法和MCMC方法獲得初始模型的采樣圖;
[0074] 3.2)對類中的每一個巧光分子,用限定的前向算法和改進的共輛梯度方法沿著四 個方向優(yōu)化得到4個新的巧光分子;
[0075] 3.3)對每個新的巧光分子通過距離和強度闊值進行判斷,確定是否將計算得到的 新的巧光分子作為擴展點;
[0076] 3.4)計算擴展點的采樣圖,并將運些采樣圖通過擴張采樣方法添加到初始模型的 采樣圖中。
[0077] 4、從候選點中刪除已經(jīng)分析過的巧光分子,并從步驟2中剩下的候選點隨機選擇 建立初始模型,重復步驟3,得到新的擴展點,直到所有的候選點分析完成。
[0078] 5、合并所有的擴展點作為新的候選點重復步驟3和步驟4,直到相鄰兩次迭代重構(gòu) 結(jié)果中增加的新的巧光分子數(shù)量與總巧光分子數(shù)量的比值小于1%則迭代停止,本發(fā)明實 施例中迭代次數(shù)約120次,但是僅W此為例,不限于此。
[0079] 6、將綠通道圖像迭代過程中得到的位置信息重構(gòu)為一張概率分布圖,即為最終重 構(gòu)的超高分辨率巧光分子的定位圖。
[0080] 如圖4所示,對比了 3B、quick-3B和SIMBA運行時間和超分辨率重構(gòu)結(jié)果,在運行速 度方面,SIMBA性能繼續(xù)大幅提升,對于同樣200帖38 X 50像素分析區(qū)域的數(shù)據(jù)集,與原始3B 方法相比,運行時間從19.02小時縮短到了 11分鐘,加速比約為100倍;在重構(gòu)效果方面, SIMBA的連續(xù)性進一步改善,基本沒有間斷結(jié)構(gòu)出現(xiàn),與原始圖像疊加圖更加一致。
[0081] 如圖7所示,顯示了肌動蛋白全細胞超分辨率重構(gòu)結(jié)果,該數(shù)據(jù)集包含紅綠兩個通 道數(shù)據(jù),紅通道為2萬帖具有單分子性質(zhì)的圖像,用于PALM分析,綠通道為200帖巧光分子高 度重疊的圖像,用于3B和SIMBA分析。圖(a)顯示了200帖綠通道原始圖像的疊加圖,由于3B 不能計算大尺寸的圖像,選擇了圖(a)中方框的區(qū)域進行分析,分別比較了該區(qū)域2萬帖 PALM重構(gòu)結(jié)果、200帖3B和200帖SIMBA重構(gòu)結(jié)果,可W看出3B重構(gòu)結(jié)果有大量的結(jié)構(gòu)缺失, 200帖的SIMBA重構(gòu)結(jié)果與2萬帖的PALM重構(gòu)結(jié)果基本一致,時間分辨率提高100倍。接下來, 比較了不同尺寸下3B和SIMBA的運行時間,即使是50X50的像素區(qū)域,加速比也近似90倍, 而且隨著圖像尺寸的增大,加速效果更加明顯。
[0082] 由于速度和精度的提升,進一步計算了全細胞區(qū)域的結(jié)構(gòu),SIMBA重構(gòu)結(jié)果可W看 到肌動蛋白的絲、束和權(quán)邊等結(jié)構(gòu),與PALM重構(gòu)結(jié)果一致。進一步測量空間分辨率,如圖7 (e3)所示為49nm。
[0083] 如圖8所示,相機拍攝的帖率為18毫秒每帖,用100帖圖像進行SIMBA重構(gòu),時間分 辨率為1.8秒。重構(gòu)圖像之間間隔為20秒,共得到30幅SIMBA重構(gòu)圖,選擇其中的部分時間點 組成動態(tài)圖進行展示。重構(gòu)結(jié)果同樣可W看到肌動蛋白的絲狀和束狀結(jié)構(gòu),進一步從子結(jié) 構(gòu)動態(tài)圖可W看出,肌動蛋白的束狀結(jié)構(gòu)比絲狀結(jié)構(gòu)相對穩(wěn)定,如圖8(c)所示??蒞看出, SIMBA可W實現(xiàn)全細胞大尺度長時間動態(tài)變化分析。
[0084] 上述各實施例僅用于說明本發(fā)明,其中方法的各實施步驟等都是可W有所變化 的,凡是在本發(fā)明技術(shù)方案的基礎(chǔ)上進行的等同變換和改進,均不應(yīng)排除在本發(fā)明的保護 范圍之外。
【主權(quán)項】
1. 一種貝葉斯顯微成像方法,其特征在于包括以下內(nèi)容: 1) 建立用于構(gòu)建不同位置熒光分子出現(xiàn)概率分布圖的初始模型; 2) 采用聚類分析方法、限定的前向算法和共輒梯度法優(yōu)化初始模型并進行模型選擇; 3) 重復步驟2)直到相鄰兩次迭代重構(gòu)結(jié)果符合設(shè)定要求; 4) 將每次迭代過程中得到的熒光分子位置信息進行重構(gòu),得到熒光分子的超分辨定位 圖。2. 如權(quán)利要求1所述的一種貝葉斯顯微成像方法,其特征在于,所述步驟1)初始模型建 立的具體過程為: 連續(xù)采集一系列熒光圖像作為原始圖像序列; 利用熒光分子的轉(zhuǎn)移概率,隨機選擇分析區(qū)域中的某些位置作為初始位置,并在初始 位置處建立因子隱馬爾可夫初始模型。3. 如權(quán)利要求1所述的一種貝葉斯顯微成像方法,其特征在于,所述步驟2)優(yōu)化初始模 型的具體過程為: 采用聚類分析方法對初始模型中熒光分子按照彼此相對距離的不同劃分成N個不同的 類別;以每一個類別中的初始位置出發(fā),采用混合MCMC和限定的前向算法計算某一位置出 現(xiàn)焚光分子的概率; 采用共輒梯度法計算出現(xiàn)熒光分子概率的極值點,選取概率最高的位置作為優(yōu)化結(jié) 果,合并N個類別,并在獲得概率最高的位置建立新的隱馬爾可夫初始模型。4. 如權(quán)利要求3所述的一種貝葉斯顯微成像方法,其特征在于,所述步驟2)模型選擇的 具體過程為: ① 采用聚類分析方法對得到的新的初始模型中的熒光分子位置按照彼此相對距離的 不同進行聚類分析,將其分為不同的類別; ② 隨機選擇某個位置作為待新增的熒光分子位置或者在新的初始模型中隨機選擇待 刪除焚光分子; ③ 判斷步驟②新增或刪除的熒光分子與步驟①聚類后哪一個類別最近,在其最近或所 屬的類別中,使用混合MCMC、限定的前向算法和共輒梯度法計算在此位置增加一個熒光分 子或刪除一個已有熒光分子后對模型概率的影響,如果概率增加則保留該位置信息,并將 其加入到新的初始模型作為新的初始位置。5. -種貝葉斯顯微成像方法,其特征在于包括以下內(nèi)容: 1) 提取單分子信息提取,并獲取單分子候選點; 2) 隨機從單分子候選點中選擇部分點作為初始點,建立用于構(gòu)建不同位置熒光分子出 現(xiàn)概率分布圖的初始模型; 3) 采用聚類分析方法將初始模型中的熒光分子按位置信息進行聚類,對每一類熒光分 子進行優(yōu)化處理得到擴展點; 4) 從候選點中刪除已經(jīng)分析過的熒光分子,并從步驟2)中剩下的候選點隨機選擇建立 初始模型,重復步驟3)得到新的擴展點,直到所有的候選點分析完成; 5) 合并所有的擴展點作為新的候選點重復步驟3)和步驟4),直到相鄰兩次迭代重構(gòu)結(jié) 果滿足設(shè)定要求,迭代停止; 6) 將迭代過程中得到的熒光分子位置信息進行重構(gòu),得到超高分辨率熒光分子的定位 圖。6. 如權(quán)利要求5所述的一種基于單分子定位的貝葉斯顯微方法,其特征在于,所述步驟 1)提取單分子信息提取,并獲取單分子候選點通過雙通道熒光顯微鏡采集兩通道采集單分 子和高密度信息,或者通過單通道同時采集單分子和高密度信息。7. 如權(quán)利要求6所述的一種貝葉斯顯微方法,其特征在于,所述步驟1)提取單分子信息 提取,并獲取單分子候選點,具體過程為: 1.1) 對于提供單分子信息的圖像序列,利用單分子定位方法,精確得到熒光分子的位 置信息; 1.2) 當采用雙通道進行數(shù)據(jù)采集時,在其中一通道圖像序列中選擇與待分析另一通道 圖像序列相同圖像幀數(shù)所包含的單分子作為候選點;當采用單通道進行數(shù)據(jù)采集時,選擇 所有圖像序列中的單分子作為候選點; 1.3) 當采用雙通道進行數(shù)據(jù)采集時需要進行漂移校準:分別校準兩通道的圖像數(shù)據(jù), 并將兩通道之間建立聯(lián)系,將其中一通道圖像的單分子候選點校準到待分析另一通道對應(yīng) 區(qū)域中。8. 如權(quán)利要求5所述的一種貝葉斯顯微方法,其特征在于,所述步驟3)采用聚類分析方 法將初始模型中的熒光分子按位置信息進行聚類,對每一類熒光分子進行優(yōu)化處理得到擴 展點,包括以下內(nèi)容: 3.1) 用混合前向算法和MCMC方法獲得初始模型的采樣圖; 3.2) 對類中的每一個熒光分子,用限定的前向算法和改進的共輒梯度方法進行優(yōu)化獲 得新的焚光分子; 3.3) 對每個新的熒光分子通過距離和強度閾值進行判斷,確定是否將計算得到的新的 焚光分子作為擴展點; 3.4) 計算擴展點的采樣圖,并將這些采樣圖通過擴張采樣方法添加到初始模型的采樣 圖中。9. 如權(quán)利要求1或5所述的一種貝葉斯顯微成像方法,其特征在于,限定的前向算法是 指當計算某個熒光分子的觀測概率時,不需要計算整個圖像區(qū)域,而僅僅計算以該熒光分 子中心坐標為中心,3個標準差的范圍內(nèi)的值,當超過該范圍時,認為不會影響周圍的熒光 分子。10. 如權(quán)利要求1或5所述的一種貝葉斯顯微成像方法,其特征在于,所述聚類分析方法 采用k-means方法。
【文檔編號】G06K9/62GK106023121SQ201610282305
【公開日】2016年10月12日
【申請日】2016年4月29日
【發(fā)明人】徐平勇, 張法, 徐帆, 張名姝, 賀文婷
【申請人】中國科學院生物物理研究所, 中國科學院計算技術(shù)研究所