欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

融合基因微陣列的制作方法

文檔序號(hào):570476閱讀:684來源:國(guó)知局
專利名稱:融合基因微陣列的制作方法
融合基因微陣列 背景 癌基因組通常含有融合基因,這些融合基因產(chǎn)生于染色體結(jié)構(gòu)重排之后,例如易 位、缺失和倒位。融合基因通常發(fā)現(xiàn)于血液癌癥。目前已經(jīng)發(fā)現(xiàn),與檢測(cè)到大量的基因組拷 貝數(shù)失衡對(duì)比,融合基因僅僅很少地與實(shí)體瘤相關(guān)。然而,最近報(bào)道顯示,可以證實(shí)融合轉(zhuǎn) 錄本通常也對(duì)實(shí)體瘤的發(fā)生做出貢獻(xiàn)(米特爾曼等人,2007(Mitelman et al. ,2007)、特謝 拉,2006 (Teixeira, 2006)、特姆林斯等人,2005 (Tomlins et al. ,2005))。主要的問題已經(jīng) 是檢測(cè)實(shí)體瘤中的融合基因的技術(shù)限制。 最近,為了對(duì)血液癌癥和一些罕見的實(shí)體瘤類型做出鑒別診斷或治療決策而 對(duì)某些的融合基因進(jìn)行了鑒定。目前,實(shí)驗(yàn)室常規(guī)診斷采用繁瑣卻效率低下的分析用 來檢測(cè)臨床樣本中的融合基因。這些測(cè)試是通常的細(xì)胞遺傳學(xué)染色體分析(核型分析 (karyotyping)——通常通過吉姆薩(Giemsa)顯帶)和/或?qū)€(gè)體新轉(zhuǎn)錄本中覆蓋了最多 斷裂點(diǎn)的最普遍融合基因進(jìn)行選擇的逆轉(zhuǎn)錄聚合酶鏈?zhǔn)椒磻?yīng)(RT-PCR)。為了獲得用于核型 分析的中期染色體,大量的新鮮組織材料是必須的,這些組織材料還必須含有活的且正在 分裂的細(xì)胞。該方法也是耗時(shí)且勞動(dòng)密集,而成功率僅為約70%。此外,必須請(qǐng)經(jīng)驗(yàn)豐富 且稱職的人員對(duì)染色體進(jìn)行視覺的檢測(cè),提供分辨度仍然低的主觀結(jié)果。RT-PCR是受到關(guān) 注的方法,它能一次對(duì)一個(gè)或多個(gè)候選融合基因在這些基因內(nèi)預(yù)先定義的融合斷點(diǎn)處進(jìn)行 分析。此方法的主要限制在于,它不是全基因組范圍的,因而得到的陰性結(jié)果也無法令人信 服。
背景技術(shù)
已有少數(shù)報(bào)道嘗試通過由靶向特異性的連接序列的寡核苷酸微陣列 (oligomicroarrays)來鑒定預(yù)定的融合基因。這些依賴于在先一步通過RT-PCR對(duì)探針進(jìn) 行擴(kuò)增,特異性地靶向預(yù)定義的融合基因和該融合基因上的單個(gè)連接序列的小的選擇。類 似地,同一基因內(nèi)的外顯子間的連接寡核苷酸已經(jīng)被用于檢測(cè)選擇性剪接。
那謝德金娜等人,2002(Nasedkina et al. ,2002)利用多重RT-PCR后通過微陣列 來對(duì)含有特異性融合轉(zhuǎn)錄本的PCR產(chǎn)物進(jìn)行鑒定。他們的微陣列中含有用來對(duì)4種已知融 合基因中每一種的最多兩種融合變體進(jìn)行檢測(cè)的探針。PCR擴(kuò)增是通過特異性引物進(jìn)行嵌 套的兩輪多重反應(yīng)完成的。因此,他們?cè)O(shè)計(jì)的方法和微陣列僅能用于鑒定少數(shù)預(yù)定的基因 融合。 那謝德金娜等人,2003(Nasedkina et al. ,2003)對(duì)上述發(fā)現(xiàn)進(jìn)行了擴(kuò)展,從而將 靶向一種額外的融合基因的探針囊括進(jìn)來,并對(duì)247例兒童白血病進(jìn)行了篩選。作者們目 的仍然僅在于鑒定預(yù)定的融合基因,更具體地說,是與兒童白血病有臨床相關(guān)性的融合基 因。 史等人,2003(Shi et al. , 2003)利用了多重RT-PCR對(duì)7種融合基因進(jìn)行擴(kuò)增, 然后用寡核苷酸(oligo)微陣列來鑒定PCT產(chǎn)物,S卩,寡核苷酸靶向每個(gè)融合基因上的一個(gè) 或兩個(gè)位點(diǎn)。與那謝德金娜等人,2002、那謝德金娜等人,2003相似的是,史等人的分析局限于非常少量的已知與白血病有關(guān)的預(yù)定融合基因。作者聲稱,與那謝德金娜等人,2002、 那謝德金娜等人,2003相反,他們的方法是定量的。而且,史等人,2003在第1069頁上提 到"雖然多重RT-PCR具有10-20個(gè)引物對(duì)是理想的,但是我們的初步數(shù)據(jù)表明可以通過大 量實(shí)驗(yàn)優(yōu)化的努力而完成引物對(duì)超過20個(gè)的多重RT-PCR。然而,形成非特異性的PCR產(chǎn) 物和引物二聚體的可能性將隨著引物數(shù)量的增加而增加,這使引物對(duì)的最大數(shù)量受到了限 制。"因此,他們意識(shí)到了在更高通量的分析中還沒有被滿足的需求,并提出能設(shè)計(jì)出多于 一個(gè)的多重RT-PCR來涵括超過40種融合轉(zhuǎn)錄本。另外,作者們?cè)诘?072頁指出"因?yàn)橐?位融合剪接位點(diǎn)(translocation fusion splice-junction sites)可以在mRNA上與3'聚 (A)尾部相距數(shù)千堿基對(duì),所以在該階段不能僅使用微陣列進(jìn)行分析,這是由于逆轉(zhuǎn)錄酶不 能產(chǎn)生長(zhǎng)度足以達(dá)到所述融合剪接位點(diǎn)的cDNA。"換而言之,序列特異性的RT-PCR是分析 功能所必需的,而上述理由又反過來限制了該方法的通量。 在例如賓漢等人,2006 (Bingham et al. , 2006)、約翰遜等人2003 (Johnsonet al. ,2003)中,已經(jīng)在先地描述了寡核苷酸微陣列在前體mRNA(pre-mRNA)剪接模式分析中 的使用。 US 2006/0084105描述了含有多套的用來檢測(cè)通過前體mRNA對(duì)選擇的基因進(jìn)行 剪接產(chǎn)生的基因產(chǎn)物的探針的微陣列。該微陣列在含有位于64個(gè)基因內(nèi)的372個(gè)剪接位 點(diǎn)。 US 2006/012952和WO 03/014295也涉及了使用微陣列來檢測(cè)前體mRNA剪接變 體。 本發(fā)明的詳細(xì)描述


圖l為陽性融合基因沖擊(hit)的微陣列數(shù)據(jù)模式。A)它闡述了基因A中內(nèi)含子2 與基因B中內(nèi)含子3的序列之間發(fā)生雜交事件的融合基因的實(shí)例?;蜷g的外顯子-到-外 顯子連接A2-B4探針(寡核苷酸)對(duì)融合轉(zhuǎn)錄本進(jìn)行檢測(cè)。B)如果基因A和基因B均具 有IO個(gè)外顯子,則微陣列需要含有10X10 = 100個(gè)探針(寡核苷酸)才能覆蓋全部對(duì)于 特定融合基因的外顯子-到-外顯子連接組合。A2-B4探針(寡核苷酸)對(duì)來自A部分的
融合轉(zhuǎn)錄本進(jìn)行檢測(cè)。c)對(duì)于各個(gè)外顯子和外顯子-到-外顯子連接的基因內(nèi)探針的縱向
曲線將對(duì)融合基因的真事件(true event)提供支持。 圖2為含有TMPRSS2 :ERG融合基因的前列腺癌樣本的微陣列數(shù)據(jù)模式。最左側(cè)
的圖顯示了使用嵌合的外顯子-到-外顯子連接探針而得到的結(jié)果。該圖中,X軸表示
TMPRSS2基因中的每一個(gè)外顯子而Y軸表示了 ERG基因中的每一個(gè)外顯子。因此,最左側(cè)的 圖顯示了與TMPRSS2的外顯子1和ERG的外顯子4之間的融合轉(zhuǎn)錄本相對(duì)應(yīng)的嵌合的外顯 子-到-外顯子探針產(chǎn)生了強(qiáng)烈的信號(hào)。最右側(cè)的圖反應(yīng)了用基因內(nèi)探針進(jìn)行檢測(cè)時(shí),ERG 基因內(nèi)的每一個(gè)外顯子的表達(dá)水平。 圖3為細(xì)胞系RCH-ACV的微陣列數(shù)據(jù),已知RCH-ACV細(xì)胞系含有TCF3 :PBX1融合 基因。與圖2相似地,該圖顯示了使用能與TCF3 :PBX1融合基因進(jìn)行雜交的嵌合的外顯 子-到-外顯子探針而得到的結(jié)果(上圖),以及使用分別針對(duì)這兩種基因的基因內(nèi)探針進(jìn) 行檢測(cè)時(shí),TCF3基因和PBX1基因中的各個(gè)外顯子的相對(duì)表達(dá)水平(分別為下方的左圖和右圖)。

發(fā)明內(nèi)容
本發(fā)明的第一方面提供了一種含有針對(duì)融合基因的外顯子-到-外顯子連接的嵌 合探針的微陣列。 本發(fā)明的第二方面為用于融合基因檢測(cè)的方法。本發(fā)明的第三方面為含有本發(fā)明 的微陣列的試劑盒。
具體實(shí)施例方式
本發(fā)明的第一方面是含有針對(duì)融合基因的外顯子-到-外顯子連接的嵌合探針的 微陣列。 特別地,本發(fā)明的微陣列還可以更進(jìn)一步地包括至少兩個(gè)基因內(nèi)探針,該基因內(nèi) 探針是針對(duì)融合基因的融合基因配偶體(fusion gene partner)的。 包含基因內(nèi)探針的優(yōu)點(diǎn)在于假陽性結(jié)果的可能性得到降低。基因內(nèi)探針在基因表 達(dá)方面提供了外顯子水平數(shù)據(jù),從而能對(duì)潛在的融合基因配偶體的疑似斷點(diǎn)的上游和下游 的表達(dá)水平進(jìn)行比較。外顯子表達(dá)水平發(fā)生了如圖IC所示變化(shift)的點(diǎn)就是一個(gè)融 合基因配偶體與另一個(gè)融合基因配偶體發(fā)生融合的點(diǎn)。因此,基因內(nèi)探針的結(jié)果可以用來 確證嵌合探針?biāo)l(fā)現(xiàn)的結(jié)果,從而減少從嵌合的外顯子_到_外顯子連接探針中挑選出假 陽性的可能性。 使用基因內(nèi)探針的另一優(yōu)勢(shì)在于,這些基因內(nèi)探針可以用來指示在之前未被鑒定 的融合基因。 特別地,基因內(nèi)探針可以與融合基因的融合基因配偶體的內(nèi)-外顯子序列、外顯 子_到_外顯子連接、外顯子_內(nèi)含子連接和內(nèi)含子_外顯子連接相對(duì)應(yīng)。這種基因內(nèi)探 針可以用于測(cè)定融合基因和/或融合基因配偶體的表達(dá)水平。在一種優(yōu)選的實(shí)施方式中, 使用基因內(nèi)探針來改變獨(dú)立部位(s印arate spot)的數(shù)量或長(zhǎng)度以協(xié)助進(jìn)行定量和比較。
在一個(gè)具體的實(shí)施方式中,至少兩個(gè)基因內(nèi)探針能靶向融合斷點(diǎn)兩側(cè)的每一側(cè); 所述融合斷點(diǎn)即一個(gè)融合配偶體與另一個(gè)融合配偶體在該處進(jìn)行融合的基因內(nèi)的點(diǎn)。
具體來說,本發(fā)明的微陣列可以含有至少2個(gè)基因內(nèi)探針,例如,至少3個(gè)基因內(nèi) 探針、或至少4個(gè)基因內(nèi)探針、或至少5個(gè)基因內(nèi)探針、或至少6個(gè)基因內(nèi)探針、或至少7個(gè) 基因內(nèi)探針、或至少8個(gè)基因內(nèi)探針、或至少9個(gè)基因內(nèi)探針、或至少10個(gè)基因內(nèi)探針、或 至少20個(gè)基因內(nèi)探針、或至少30個(gè)基因內(nèi)探針、或至少40個(gè)基因內(nèi)探針、或至少50個(gè)基 因內(nèi)探針、或至少75個(gè)基因內(nèi)探針、或至少100個(gè)基因內(nèi)探針、或至少500個(gè)基因內(nèi)探針、 或至少1000個(gè)基因內(nèi)探針。 特別地,本發(fā)明的微陣列還含有針對(duì)融合基因的融合基因配偶體的每一個(gè)的至少 兩個(gè)基因內(nèi)探針。如果本發(fā)明的微陣列能夠檢測(cè)超過1個(gè)融合基因,則所述微陣列可以含 有針對(duì)每個(gè)融合基因而含有不同數(shù)目的基因內(nèi)探針。例如,所述微陣列可以包括針對(duì)一個(gè) 融合基因中的兩個(gè)融合基因配偶體的至少兩個(gè)基因內(nèi)探針,以及僅針對(duì)另一個(gè)融合基因中 的一個(gè)融合基因配偶體的至少兩個(gè)基因內(nèi)探針。 具體來說,本發(fā)明的微陣列含有靶向相同的融合基因的嵌合探針和至少兩個(gè)基因內(nèi)探針。更具體地說,本發(fā)明的微陣列可以含有針對(duì)各個(gè)包括在內(nèi)的融合基因的至少兩個(gè) 基因內(nèi)探針。更具體地說,本發(fā)明的微陣列可以含有針對(duì)各個(gè)包括在內(nèi)的融合基因配偶體 的至少兩個(gè)基因內(nèi)探針。本文中,術(shù)語"包括在內(nèi)的"指的是融合基因或融合基因配偶體, 所述微陣列通過含有針對(duì)上述融合基因或融合基因配偶體的嵌合探針而預(yù)期能對(duì)上述融 合基因或融合基因配偶體進(jìn)行檢測(cè)。 在本發(fā)明的一個(gè)實(shí)施方式中,本發(fā)明的微陣列含有針對(duì)各個(gè)包括在內(nèi)的融合基因 配偶體的基因內(nèi)探針。具體來說,本發(fā)明的微陣列可以包含3個(gè)基因內(nèi)探針每外顯子,特別 地,所述基因內(nèi)探針可以耙向外顯子_到_外顯子連接。 優(yōu)選地,所述微陣列含有與該微陣列的各個(gè)融合基因配偶體(individual fusion gene partners)的全部外顯子、外顯子_到_外顯子連接、外顯子_內(nèi)含子連接和內(nèi)含 子_外顯子連接相對(duì)應(yīng)的基因內(nèi)探針。 更優(yōu)選地,所述微陣列含有2個(gè)、3個(gè)、4個(gè)或5個(gè)與微陣列的各個(gè)融合基因配偶體 的每一個(gè)外顯子相對(duì)應(yīng)的基因內(nèi)探針。 本發(fā)明所用的基因內(nèi)探針指的是能進(jìn)行序列特異性的堿基配對(duì)的核酸或核酸類 似物?;騼?nèi)探針可以含有或由天然核苷酸或非天然核苷酸組成,例如LNA單體(鎖核酸 單體)、INA單體(嵌合核酸(intercalating皿cleic acid)單體)或PNA單體(肽核酸單 體)。 優(yōu)選地,本發(fā)明的微陣列含有靶向超過1個(gè)融合基因的融合基因配偶體的基因內(nèi) 探針。例如說,本發(fā)明的微陣列可以含有針對(duì)至少2個(gè)融合基因的基因內(nèi)探針,例如至少5 個(gè)融合基因、或至少10個(gè)融合基因、或至少20個(gè)融合基因、或至少30個(gè)融合基因、或至少 50個(gè)融合基因、或至少75個(gè)融合基因、或至少100個(gè)融合基因、或至少250個(gè)融合基因、或 至少500個(gè)融合基因、或至少1000個(gè)融合基因。因此,在一種優(yōu)選的實(shí)施方式中,本發(fā)明的 微陣列包括針對(duì)多個(gè)表1所列融合基因的基因內(nèi)探針,選自由至少5個(gè)融合基因、至少10 個(gè)融合基因、至少20個(gè)融合基因、至少30個(gè)融合基因、至少40個(gè)融合基因、至少50個(gè)融合 基因、至少75個(gè)融合基因、至少100個(gè)融合基因、至少150個(gè)融合基因、至少200個(gè)融合基 因、至少250個(gè)融合基因、至少275個(gè)融合基因和至少316個(gè)融合基因所組成的組中。
基因內(nèi)探針可以是與mRNA或雙鏈cDNA進(jìn)行雜交的反義探針,或是與融合基因的 cDNA進(jìn)行雜交的正義探針。因此,本文使用的術(shù)語"相應(yīng)于"指的是相同的序列或互補(bǔ)序 列。 微陣列可以含有反義基因內(nèi)探針和正義基因內(nèi)探針二者,S卩,該微陣列可以用于 與cDNA和mRNA 二者或者PCR產(chǎn)物的兩條鏈進(jìn)行雜交。 基因內(nèi)探針可以是能夠與外顯子序列進(jìn)行雜交的探針,或者該基因內(nèi)探針可以能 夠與基因內(nèi)連接序列(例如外顯子_到_外顯子連接、外顯子_內(nèi)含子連接或內(nèi)含子_外 顯子連接)進(jìn)行雜交。如果基因內(nèi)探針是針對(duì)基因內(nèi)連接序列的,則優(yōu)選該基因內(nèi)探針具 有等溫性(isothermic),即,在對(duì)微陣列進(jìn)行雜交所用的條件下與互補(bǔ)DNA序列雜交時(shí),可 以調(diào)節(jié)針對(duì)連接兩側(cè)每一側(cè)的基因內(nèi)連接序列探針的長(zhǎng)度以使其具有差異至多2(TC的解 鏈溫度(Tm值)。在其他實(shí)施方式中,Tm值的差異分別至多4(TC、35t:、3(rC、25t:、15t:、 和1(TC。等溫探針有助于確保微陣列上的整套探針(寡核苷酸)的良好雜交條件。
此外,優(yōu)選調(diào)節(jié)這種基因內(nèi)連接序列探針的第一部分和第二部分的長(zhǎng)度,以使它們?cè)谖㈥嚵羞M(jìn)行雜交所用條件下具有差異至多l(xiāng)(TC的Tm值。在其他實(shí)施方式中,Tm值的 差異至多16。C、14。C、12。C、8。C、6。C和4°C。 按下文所描述與嵌合外顯子_到_外顯子探針有關(guān),可以達(dá)到對(duì)探針或探針的部 分的Tm值的調(diào)節(jié)。 優(yōu)選基因內(nèi)探針的Tm值可以選自由大于45t:、大于5(rC、大于55t:、大于6(rC、 大于65t:、大于7(TC和大于75t:所組成的組中。 優(yōu)選基因內(nèi)探針的長(zhǎng)度選自由小于60個(gè)核苷酸、小于55個(gè)核苷酸、小于50個(gè)核 苷酸、小于45個(gè)核苷酸、小于40個(gè)核苷酸和小于35個(gè)核苷酸所組成的組中。
特別地,本發(fā)明的微陣列可以用于融合基因的檢測(cè)。 所述融合基因可以是任意融合基因。優(yōu)選地,事先已經(jīng)含有至少一個(gè)融合基因配 偶體,該融合基因配偶體作為已經(jīng)得到證實(shí)的融合基因的一部分。更優(yōu)選地,所述融合基因 選自由以下已知融合基因所組成的組中。 表1融合基因,316對(duì)融合基因配偶體的每一個(gè)帶有恩山姆博基因登錄號(hào) (Ensembl gene ID)
基因A
基因B
ENSG00000009709 ENSG00000010404 ENSG00000015133 ENSG00000015133 ENSG00000023445 ENSG00000029725 ENSG00000047410 ENSG00000047410 ENSG00000047932 ENSG00000054118 ENSG00000066455 ENSG00000066629 ENSG00000067369 ENSG00000067955 ENSG00000069399 ENSG00000071564 ENSG00000071564 ENSG00000071564 ENSG00000072274 ENSG00000072864 ENSG00000073921 ENSG00000077150
ENSG00000150907 ENSG00000197021 ENSG00000113721 ENSG00000134853 ENSG00000172175 ENSG00000113721 ENSG00000105976 ENSG0(3000198400 ENSG00000047936 ENSG00000129204 ENSG00000165731 ENSG00000097007 ENSG00000113721 ENSG00000133392 ENSG00000136997 ENSG00000105619 ENSG00000108924 ENSG00000185630 ENSG00000113916 ENSG00000113721 ENSG00000078403 ENSG00000059377ENSG00000078674
ENSG00000078674
ENSG00000080824
ENSG00000082805
ENSG00000083168
ENSG00000083168
ENSG00000083168
ENSG00000083168
ENSG0000008g280
ENSG00000089280
ENSG00000089280
ENSG00000089280
ENSG00000089280
ENSG00000089280
ENSG00000,280
ENSG00000096384
ENSG00000100345
ENSG00000100503
ENSG00000100815
ENSG00000103522
ENSG00000105662
ENSG00000105810
ENSG00000105810
ENSG00000105810
ENSG00000105810
ENSG00000108091
ENSG00000108091
ENSG00000108821
ENSG00000108821
ENSG00000108946
ENSG00000109220
ENSG00000109471
ENSG00000109906
ENSG00000110092
ENSGQ000CmtD619
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000"0713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000110713
ENSG00000096968
ENSG00000165731
ENSG00000113916
ENSG00000怖731
ENSG00000005339
ENSG00000100393
ENSG00000140396
ENSG00000143970
ENSG00000123268
ENSG00000157554
ENSG00000157613
ENSG00000166986
ENSG00000175197
ENSG00000175197
ENSG00000182158
ENSG00000113916
ENSG00000171094
ENSG00000113721
ENSG00000113721
ENSG00000113916
ENSG00000184384
ENSG00000078403
ENSG00000085276
ENSG00000118058
ENSG00000164438
ENSG00000113721
ENSG00000165731
ENSG00000100311
ENSG00000129204
ENSG00000165731
ENSG00000139083
ENSG00000048462
ENSG00000131759
ENSG00000070404
ENSG00000171094
ENSG00000005073
ENSG00000024862
ENSG00000040633
ENSG00000073614
ENSG00000078399
ENSG00000106031
ENSG00000116132
ENSG00000119335
ENSG00000123364
ENSG00000123388
ENSG00000128713
ENSG00000128714
ENSG00000138698
ENSG00000147548
ENSG00000148700
ENSG00000164985
ENSG00000165671
ENSG00000167157
ENSG00000178105
ENSG00000198900ENSG00000110777
ENSG00000110987
ENSG00000111640
ENSG00000111790
ENSG00000112081
ENSG00000112486
ENSG00000112701
ENSG00000113263
ENSG00000113594
ENSG00000114354
ENSG00000114354
ENSG00000114354
ENSG00000114999
ENSG000001165印
ENSG00000116604
ENSG00000117000
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000"8058
ENSG00000118058
ENSG00000118058
ENSG00000"8058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG0O000"8058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000"8058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000118058
ENSG00000113916 ENSG00000136997 ENSG00000113916 ENSG,00077782 ENSG00000113916 ENSG00000077782 ENSG00000188580 ENSG00000165025 ENSG00000181690 ENSG00000119508 ENSG00000171094 ENSG00000198400 ENSG00000139083 ENSG00000068323 ENSG00000071626 ENSG00000116990 ENSG00000002834 ENSG00000005339 ENSG00000007237 ENSG00000008300 ENSG00000072364 ENSG00000073921 ENSG00000075539 ENSG00000078403 ENSG00000079102 ENSG00000085832 ENSG00000100393 ENSG00000101367 ENSG00000105656 ENSG00000108292 ENSG00000110395 ENSG00000112305 ENSG00000118058 ENSG00000118689 ENSG00000125354 ENSG00000130382 ENSG00000130396 ENSG00000131759 ENSG00000132142 ENSG00000132394 ENSG00000136754 ENSG00000136848 ENSG00000137812 ENSG00000138336 ENSG00000138758 ENSG00000141985 ENSG00000142347 ENSG00000143443 ENSG00000144218 ENSG00000145012 ENSG00000145819 ENSG00000150455 ENSG00000154556 ENSG00000163655 ENSG00000166140ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000118058 ENSG00000"8058 ENSG00000118058 ENSG00000118058 ENSG00000119397 ENSG00000120616 ENSG00000121741 ENSG00000122025 ENSG00000122566 ENSG00000122779 ENSG00000122779 ENSG00000124243 ENSG00000125618 ENSG00000126777 ENSG00000126883 ENSG00000126883 ENSG00000126883 ENSG00000127083 ENSG00000127152 ENSG00000127152 ENSG00000127914 ENSG00000127946 ENSG00000128487 ENSG00000133639 ENSG00000135903 ENSG00000135903 ENSG00000136167 ENSG00000136997 ENSG00000136997 ENSG00000137193 ENSG00000137309 ENSG00000137497 ENSG00000137727 ENSG00000138293 ENSG00000138363 ENSG00000138594 ENSG000Q0138674 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083
ENSG00000168385
ENSG00000171723
ENSG00000171843
ENSG00000172409
ENSG00000172493
ENSG00000184384
ENSG00000184481
ENSG00000184640
ENSG00000184702
ENSG00000187239
ENSG00000196914
ENSG00000077782
ENSG00000112511
ENSG00000077782
ENSG00000139083
ENSG00000006468
ENSG00000077782
ENSG00000131759
ENSGG0000141376
ENSG00000132170
ENSG00000165731
ENSG00000097007
ENSG00000119335
ENSG00000124795
ENSG00000129204
ENSG00000164438
ENSG00000211829
ENSG00000157764
ENSG00000113721
ENSG00000113721
ENSG00000136997
ENSG00,084676
ENSG00Q00150907
ENSG00000113916
ENSG00000110987
ENSG00000133639
ENSG00000113916
ENSG00000112769
ENSG0000Q131759
ENSG00000165288
ENSG00000165731
ENSG00000171094
ENSG00000101977
ENSG00000171094
ENSG00000068078
ENSG00000085276
ENSG00000096968
ENSG00000097007
ENSG00000111816
ENSG00000113721
ENSG00000114999
ENSG00000122025
ENSG00000130675
ENSG00000140538
ENSG00000143322ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000139083 ENSG00000140262 ENSG00000140262 ENSG00000140464 ENSG00000140937 ENSG00000141367 ENSG00000141367 ENSG00000141380 ENSG00000141380 ENSG00000141380 ENSG00000141867 ENSG00000142611 ENSG00000143294 ENSG00000143549 ENSG00000143549 ENSG00000143549 ENSG00000143924 ENSG00000145216 ENSG00000147065 ENSG00000147140 ENSG00000147889 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000149948 ENSG00000153201 ENSG00000153814 ENSG00000153814 ENSGO0OQO153944 ENSG00000156650 ENSG00000156976 ENSG00000158715 ENSG00000158715 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSG00000159216 ENSGOOOOO^I 59216 ENSG00000159216 ENSG00000159216
ENSG00000143437 ENSG00000153233 ENSG00000159216 ENSG00000164398 ENSG00000165025 ENSG00000165556 ENSG00000169184 ENSG00000179094 ENSG00000188580 ENSG00000197880 ENSG00000119508 ENSG00000135605 ENSG00000131759 ENSGD0000129204 ENSG00000068323 ENSG00000171094 ENSG00000126752 ENSG00000187754 ENSG00000204645 ENSG,00184507 ENSG00000085276 ENSG00000068323 ENSG00000113721 ENSG,00171094 ENSG00000198400 ENSG00000171094 ENSG00000134853 ENSG00000171094 ENSG00000068323 ENSG00000147889 ENSG00000100814 ENSG00000144476 ENSG00000145012 ENSG00000164919 ENSG00000182185 ENSGOOOO0183722 ENSG00000189283 ENSG00000171094 ENSG00000112511 ENSG00000178691 ENSG00000078399 ENSG00000005339 ENSG00000113916 ENSG00000006468 ENSG00000171656 ENSG00000022556 ENSG0000007謂2 ENSG00000085276 ENSG00000106346 ENSG00000109686 ENSG00000116251 ENSG00000129993 ENSG00000143373 ENSG00000155313 ENSG00000169946ENSG00000159216 ENSG00000159216 ENSG00000162367 ENSG00000162775 ENSG00000163902 ENSG00000164692 ENSG00000165288 ENSG00000167460 ENSG00000168036 ENSG00000168421 ENSG00000柳306 ENSG00000169696 ENSG00000169714 ENSG00000170791 ENSG00000170881 ENSG00000170961 ENSG00000172660 ENSG00000172660 ENSG00000172660 ENSG00000172660 ENSG00000173757 ENSG00000178104 ENSG00000179362 ENSG00000179583 ENSG00000180843 ENSG00000181163 ENSG00000181163 ENSG00000181163 ENSG00000182158 ENSG00000182944 ENSG00000182944 ENSGGOOOCn 82944 ENSG00000"l8—2944 ENSG00000182944 ENSGOOOOCM 82944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000182944 ENSG00000184012 ENSG00000184012 ENSG0000Q184012 ENSG00000184012 ENSG00000184402 ENSG00000184507 ENSG0。0001858" ENSG00000186716 ENSG00000186716 ENSG00000186716 ENSG00000186716
ENSG00000198492 ENSG00000206115 ENSG00000123473 ENSG00000196588 ENSG00000085276 ENSG00000181690 ENSG00000137727 ENSG00000171094 ENSG00000181690 ENSG00000113916 ENSG00000198947 ENSG00000068323 ENSG00000129204 ENSG00000181690 ENSG00000189283 ENSG00000181690 ENSG00000119508 ENSGOOOO0126746 ENSG00000128656 ENSG00000135605 ENSG00000131759 ENSG00000113721 ENSG00000006468 ENSG00000113916 ENSG00000171094 ENSG00000131759 ENSG00000171094 ENSG00000178053 ENSG00000132170 ENSG00000006468 ENSG00000100105 ENSG00000118260 ENSG00000119508 ENSG00000123268 ENSG00000126746 ENSG00000135605 ENSG00000151702 ENSG00000157554 ENSG00000163497 ENSG00000166986 ENSG00000175197 ENSG00000175832 ENSG00000184937 ENSG00000204531 ENSG00000006468 ENSG00000157554 ENSG00000171656 ENSG00000175832 ENSG00000126752 ENSG00000141867 ENSG00000113916 ENSG00000077782 ENSG00000096968 ENSG00000097007 ENSG00000134853ENSG00000187735 ENSG00000181690
ENSG00000188580 ENSG00000139083
ENSG00000189283 ENSG00000149948
ENSG00000189283 ENSG00000170881
ENSG00000196092 ENSG000Q0139083
L(X)47」 ENSG00000196531 ENSG00000113916
ENSG00000196535 ENSG00000077782
ENSG00000197323 ENSG00000165731
ENSG00000197711 ENSG00000048544
ENSG00000198339 ENSG00000113916
ENSG00000204691 ENSG00000112561 其中,基因A是融合基因的上游融合基因配偶體,而基因B是融合基因的下游融合 基因配偶體。 此處所用的嵌合探針指的是能進(jìn)行序列特異性的堿基配對(duì)的核酸或核酸類似物, 該嵌合探針包括與第一基因的外顯子相對(duì)應(yīng)的第一序列和與第二基因的外顯子相對(duì)應(yīng)的 第二序列。重要的是,第一基因與第二基因不同,S卩,該探針覆蓋了基因間外顯子_到_外 顯子連接。本文使用的術(shù)語外顯子_到_外顯子連接指的是基因間外顯子_到_外顯子連 接。嵌合探針可以含有或者由非天然核苷酸組成,例如LNA單體(鎖核酸單體)、INA單體 (嵌合核酸單體)、或PNA單體(肽核酸單體)。 本文使用的術(shù)語融合基因指的是由于基因畸變而產(chǎn)生的結(jié)果,例如染色體的易
位、缺失或倒位,這種畸變帶來自兩種不同基因的序列。也就說,融合基因含有至少一個(gè)融
合基因的上游基因配偶體外顯子和至少一個(gè)融合基因的下游基因配偶體外顯子。 本文的術(shù)語融合基因還表示還未經(jīng)實(shí)驗(yàn)證實(shí)的假定融合基因。 例如哈恩等人,2004(Hahn et al, 2004)描述了用來對(duì)所述潛在的融合基因進(jìn)行
鑒定的生物信息學(xué)策略??梢栽O(shè)想,由本發(fā)明檢測(cè)出的融合基因可以成為被Hahn等人,
2004描述的方法或其他能夠鑒定潛在的融合基因的方法所鑒定的候選融合基因。 本文中所用的融合基因配偶體指的是為融合基因貢獻(xiàn)了至少一個(gè)外顯子的基因。
上游融合基因配偶體的外顯子位于融合基因中另一個(gè)融合基因配偶體的外顯子的上游,反
之亦然。 本發(fā)明所特別關(guān)注的是在先已表示出與癌癥有關(guān)的融合基因配偶體和融合基因。 表1列舉了優(yōu)選的融合基因,其中基因A為融合基因的上游融合基因配偶體并且基因B為 融合基因的下游融合基因配偶體。 絕大多數(shù)的融合基因配偶體在內(nèi)含子區(qū)域內(nèi)發(fā)生融合以產(chǎn)生融合基因(諾沃等 人,2007 (Novo et al. , 2007)),且對(duì)前體mRNA融合轉(zhuǎn)錄本的剪接將連接外顯子,從而在融 合轉(zhuǎn)錄本內(nèi)產(chǎn)生基因間外顯子_到_外顯子連接。 當(dāng)假定的融合基因的兩個(gè)融合基因配偶體的外顯子_內(nèi)含子結(jié)構(gòu)為已知的時(shí)候, 能對(duì)假定的基因間外顯子_到_外顯子連接進(jìn)行預(yù)測(cè)。能從各種基于互聯(lián)網(wǎng)的基因組數(shù)據(jù) 庫(例如麗w. biomart. org)中檢索到潛在的融合基因配偶體的外顯子。
在優(yōu)選的實(shí)施方式中,本發(fā)明的微陣列含有針對(duì)融合基因的至少20%的全部可能 的外顯子_到_外顯子連接的嵌合探針。 在另一種優(yōu)選的實(shí)施方式中,本發(fā)明的微陣列包括針對(duì)至少30%的全部可能的外 顯子_到_外顯子連接的嵌合探針,例如針對(duì)至少40%、至少50%、至少60%、至少70%、至少80%、或至少90%的全部可能的外顯子-到-外顯子連接的嵌合探針。 在另一種實(shí)施方式中,本發(fā)明的微陣列含有針對(duì)相同或不同的融合基因的至少20
個(gè)外顯子_到_外顯子連接的嵌合探針。 在另一種實(shí)施方式中,所述微陣列含有針對(duì)相同或不同的融合基因的至少30個(gè) 外顯子_到_外顯子連接、至少40個(gè)外顯子_到_外顯子連接、至少50個(gè)外顯子_到_外 顯子連接、至少60個(gè)外顯子_到_外顯子連接、至少70個(gè)外顯子_到_外顯子連接、至少 80個(gè)外顯子_到_外顯子連接、例如至少100個(gè)外顯子_到_外顯子連接的嵌合探針。
本發(fā)明的發(fā)明人意識(shí)到,對(duì)在先已經(jīng)進(jìn)行過表征(經(jīng)實(shí)驗(yàn)證實(shí))的具有預(yù)定外顯 子_到_外顯子連接的融合基因進(jìn)行測(cè)試是不夠的,還需要對(duì)特定融合基因的全部可能外 顯子_到_外顯子連接進(jìn)行測(cè)試。非常通常地,外顯子_到_外顯子連接的確切位置并不 是判斷融合基因是否致瘤、或者與癌癥或其它病況有關(guān)或者對(duì)癌癥或其他病況進(jìn)行預(yù)測(cè)的 決定因子。 例如說,最近在前列腺癌中得到鑒定的TMPRSS2-ERG融合基因(Tomlins et al., 2005),已經(jīng)用在TMPRSS2的外顯子1、2、3、4和5之后且在ERG的外顯子2、3、4、5和6之前 的連接以多種組合測(cè)定了融合轉(zhuǎn)錄本(克拉克等人,2006 (Clark et al. ,2006))。因此,選 擇一個(gè)或少數(shù)最普遍的連接將產(chǎn)生相當(dāng)大的假陰性結(jié)果的可能性。該特定的融合基因也是 由于相對(duì)較小的染色體片段(3Mbp)發(fā)生缺失,隨后加入了兩個(gè)融合基因配偶體而產(chǎn)生的 融合基因的實(shí)例。鑒于分辨水平,這種小畸變?cè)诩?xì)胞遺傳學(xué)分析中是無法觀察到的。
致癌性可能簡(jiǎn)單地由所述融合基因下游部分的過表達(dá)而引起。因此,本發(fā)明的一 個(gè)優(yōu)點(diǎn)在于,本發(fā)明不依賴于單個(gè)或少數(shù)預(yù)定的外顯子_到_外顯子連接,而是能對(duì)給定融 合基因的全部可能外顯子_到_外顯子連接進(jìn)行檢測(cè)。 另一個(gè)優(yōu)點(diǎn)在于,本發(fā)明不像在背景技術(shù)部分中描述的例如核型分析那樣需要新 鮮細(xì)胞。此外,對(duì)微陣列分析的結(jié)果的解釋比對(duì)核型分析的結(jié)果進(jìn)行解釋更直觀,后者需要 受過高度訓(xùn)練的人員。從原則上來說,微陣列上成套的基因間外顯子_到_外顯子連接探 針將僅在相應(yīng)于融合基因轉(zhuǎn)錄本內(nèi)存在外顯子_到_外顯子連接的部位產(chǎn)生強(qiáng)信號(hào)。
此外,與細(xì)胞遺傳學(xué)方法相比,在測(cè)量中包括了來自生物學(xué)樣本的所有細(xì)胞的 RNA,因此本發(fā)明對(duì)細(xì)胞進(jìn)行選擇時(shí)不存在風(fēng)險(xiǎn)。 在一種優(yōu)選的實(shí)施方式中,本發(fā)明的微陣列含有針對(duì)融合基因的每一個(gè)可能外顯 子_到_外顯子連接的嵌合探針。 優(yōu)選地,本發(fā)明的微陣列含有針對(duì)超過1個(gè)融合基因的嵌合探針。舉例來說,本發(fā) 明的微陣列可以包括針對(duì)至少2個(gè)融合基因的嵌合探針,例如至少5個(gè)融合基因、或至少10 個(gè)融合基因、或至少20個(gè)融合基因、或至少30個(gè)融合基因、或至少50個(gè)融合基因、或至少 75個(gè)融合基因、或至少100個(gè)融合基因、或至少250個(gè)融合基因、或至少500個(gè)融合基因、 或至少IOOO個(gè)融合基因。因此,在一種優(yōu)選的實(shí)施方式中,本發(fā)明的微陣列含有針對(duì)多個(gè) 列于表1的融合基因的嵌合探針,選自由至少5個(gè)融合基因、至少10個(gè)融合基因、至少20 個(gè)融合基因、至少30個(gè)融合基因、至少40個(gè)融合基因、至少50個(gè)融合基因、至少75個(gè)融合 基因、至少100個(gè)融合基因、至少150個(gè)融合基因、至少200個(gè)融合基因、至少250個(gè)融合基 因、至少275個(gè)融合基因和至少316個(gè)融合基因所組成的組中。 在更優(yōu)選的實(shí)施方式中,本發(fā)明的微陣列含有針對(duì)列于表1的許多個(gè)融合基因的每一個(gè)可能基因間外顯子_到_外顯子連接的嵌合探針,選自由至少5個(gè)融合基因、至少10 個(gè)融合基因、至少20個(gè)融合基因、至少30個(gè)融合基因、至少40個(gè)融合基因、至少50個(gè)融合 基因、至少75個(gè)融合基因、至少100個(gè)融合基因、至少150個(gè)融合基因、至少200個(gè)融合基 因、至少250個(gè)融合基因、至少275個(gè)融合基因和至少316個(gè)融合基因所組成的組。
最優(yōu)選地,本發(fā)明的微陣列含有針對(duì)表1所列全部融合基因的每一個(gè)可能基因間 外顯子_到_外顯子連接的嵌合探針。甚至更優(yōu)選地,本發(fā)明的微陣列含有嵌合探針和至 少兩個(gè)針對(duì)表1所列全部融合基因的基因內(nèi)探針。這種微陣列用于有效地鑒定任意樣本中 的融合基因,并且不要求在例如癌癥類型或患者病史的基礎(chǔ)上事先獲知對(duì)特定融合基因的 易感性。 微陣列的嵌合探針的序列含有第一部分和第二部分,其中,所述第一部分與上游 融合基因配偶體的外顯子序列的3'端相對(duì)應(yīng),第二部分與下游融合基因配偶體的外顯子序 列的5'端相對(duì)應(yīng),其中,所述嵌合探針是與mRNA或雙鏈cDNA進(jìn)行雜交的反義探針,或是與 融合基因的cDNA進(jìn)行雜交的正義探針。因此,本文使用的術(shù)語"相應(yīng)于"指的是相同的序 列或互補(bǔ)序列。 微陣列可以包括針對(duì)每個(gè)外顯子-到-外顯子連接的反義探針和正義探針,S卩,該 微陣列可以通過cDNA和mRNA或者PCR產(chǎn)物的兩條鏈進(jìn)行雜交。 優(yōu)選地,所述嵌合探針具有等溫性,即,在對(duì)微陣列進(jìn)行雜交所用的條件下與互 補(bǔ)DNA序列雜交時(shí),可以調(diào)整嵌合探針的長(zhǎng)度以使它們具有差異至多2(TC的解鏈溫度(Tm 值)。在其他實(shí)施方式中,Tm值的差異分別至多40。C、35。C、3(TC、25。C、15。C、和l(TC。等 溫探針有助于使所述微陣列上的整套探針具有良好的雜交條件。 此外,優(yōu)選調(diào)整所述嵌合探針的第一部分和第二部分的長(zhǎng)度,以使它們?cè)谖㈥嚵?進(jìn)行雜交所用條件下具有差異至多l(xiāng)(TC的Tm值。在一種實(shí)施方式中,Tm值的差異至多 16。C、14。C、12。C、8。C、6。C和4°C。 由于Tm值依賴于長(zhǎng)度和探針或探針的部分的核苷酸序列中鳥嘌呤和胞嘧啶的百 分比,因此可以實(shí)現(xiàn)對(duì)探針或探針的部分的Tm值進(jìn)行調(diào)節(jié)??梢詻Q定,嵌合探針應(yīng)該具有 例如約6『C的Tm值。針對(duì)第一部分和第二部分的lO個(gè)核苷酸的嵌合探針的Tm值可以使 用作為起始。如果該探針的Tm值低于68°C ,可以以平衡的方式加核苷酸至第一部分和第二 部分二者直到嵌合探針的整體Tm值達(dá)到約68t:。因此,如果第一部分比第二部分含有更多 的A、 T或U核苷酸,則需要向第一部分中加入更多的核苷酸。利用寡核苷酸設(shè)計(jì)算法來執(zhí) 行該操作。 在本發(fā)明的一種優(yōu)選實(shí)施方式中,嵌合探針的Tm高于進(jìn)行雜交所用的溫度,且嵌 合探針的上游和/或下游部分的Tm低于進(jìn)行雜交所用的溫度。 嵌合探針的Tm值優(yōu)選選自由大于45t:、大于5(TC、大于55t:、大于6(TC、大于 65t:、大于7(TC和大于75t:所組成的組。 嵌合探針的長(zhǎng)度優(yōu)選選自由小于60個(gè)核苷酸、小于55個(gè)核苷酸、小于50個(gè)核苷 酸、小于45個(gè)核苷酸、小于40個(gè)核苷酸和小于35個(gè)核苷酸所組成的組。
在另一種優(yōu)選實(shí)施方式中,所述微陣列還含有靶向外顯子_到_外顯子連接的單 核苷酸多態(tài)性(SNP)變體的嵌合探針。這種SNP可以從包括表1中全部融合基因配偶體的 基因組數(shù)據(jù)庫(例如麗w.biomart. org)得到。SNP定位于外顯子-到-外顯子連接的側(cè)部(flanking)序列中,構(gòu)成了包含每一個(gè)SNP變體的嵌合探針。通過將外顯子_到_外顯子 連接的多態(tài)性變體包含在內(nèi),確保了不會(huì)由于嵌合探針和外顯子_到_外顯子連接之間核 苷酸序列的錯(cuò)配而導(dǎo)致融合基因的丟失。 本發(fā)明的微陣列可以商購自多家制造商,例如安捷倫(Agilent)、伊魯米娜 (Illumina)和尼布爾基因(Nimblegen)。微陣列上的正信號(hào)通常是通過測(cè)量熒光或化學(xué)發(fā) 光而檢測(cè)得到,這些熒光或化學(xué)發(fā)光直接或間接獲得自樣本中mRNA或cDNA被標(biāo)記的核苷酸。 制備探針或寡核苷酸的方法以及將所述探針應(yīng)用于微陣列的方法是本領(lǐng)域技術(shù) 人員公知的。 外顯子-到-外顯子連接探針的評(píng)分相對(duì)直觀。這是由于成千上萬的位置中的大 多數(shù)呈陰性,且僅由具有陽性的外顯子_到-外顯子連接探針的特征產(chǎn)生了顯著的正信號(hào)。 融合基因的存在使從嵌合探針產(chǎn)生了正信號(hào),這可以由兩個(gè)融合基因配偶體的基因內(nèi)探針 制得的標(biāo)準(zhǔn)縱向表達(dá)水平曲線上相應(yīng)的變化而得到支持。 為了便于對(duì)樣本(特別是不知道是否存在融合基因的樣本)進(jìn)行數(shù)據(jù)分析,可以 計(jì)算各個(gè)可能的內(nèi)含子的融合斷點(diǎn)的"融合得分(fusionscore)",且這些融合得分反映了 融合事件的可能性??梢葬槍?duì)各個(gè)嵌合連接探針計(jì)算出兩個(gè)所述融合得分。這使來自嵌合 探針的值與通過基因內(nèi)探針獲得的值(即,上游融合基因配偶體或下游融合基因配偶體各 自的縱向曲線)結(jié)合起來。按以下公式計(jì)算融合得分
[融合得分=嵌合連接得分*p (轉(zhuǎn)錄本態(tài))*P (外顯子態(tài))] 其中,所述嵌合連接得分是嵌合探針信號(hào)的標(biāo)準(zhǔn)化值,P(轉(zhuǎn)錄本態(tài)) (p (transcript-wise))是在預(yù)測(cè)融合斷點(diǎn)前后的獨(dú)立群體(s印arat印opulations)中融 合基因配偶體的外顯子表達(dá)值的概率,以及P(外顯子態(tài))(p(exoniise))是在獨(dú)立群體中 緊接著融合基因配偶體上游外顯子和下游外顯子的外顯子表達(dá)值的概率。術(shù)語"獨(dú)立群體" 在本文指的是相同的基因,但是該基因已經(jīng)與另一基因發(fā)生融合從而導(dǎo)致在所述基因的個(gè) 體外顯子的表達(dá)水平發(fā)生改變。 對(duì)基因內(nèi)表達(dá)值與可能融合斷點(diǎn)的上游和下游得到的值相比,在t-測(cè)試的基礎(chǔ) 上計(jì)算P(轉(zhuǎn)錄本態(tài))和(外顯子態(tài)),從而測(cè)試在縱向曲線的給定位置上是否存在斷點(diǎn)。
對(duì)融合得分的計(jì)算提供了一種簡(jiǎn)單的方式對(duì)給定的外顯子_外顯子連接處發(fā)生 融合事件的可能性的值進(jìn)行解釋,因此能由非專業(yè)人士對(duì)結(jié)果進(jìn)行分析和解釋。為了將數(shù) 值保持在范圍內(nèi),需要使用下列閾值。當(dāng)嵌合探針的標(biāo)準(zhǔn)化值大于10時(shí),可以將它們?cè)O(shè)定 為10。類似地,當(dāng)縱向曲線上斷點(diǎn)的概率<0. IO時(shí),可以將所述值設(shè)為O. 10。也可以在下 游融合基因配偶體外顯子得到的數(shù)值小于上游融合基因配偶體外顯子得到的數(shù)值時(shí),將概 率設(shè)為0. 10。 本發(fā)明的第二方面是檢測(cè)融合基因的方法,該方法包括以下步驟 a.提供樣本; b.從所述樣本中分離RNA ; c.用本發(fā)明的微陣列對(duì)來自樣本的mRNA的外顯子_到_外顯子連接進(jìn)行檢測(cè);
d.從而對(duì)存在于樣本中的融合基因進(jìn)行鑒定。 在本發(fā)明的一種實(shí)施方式中,該方法可以還包括使用本發(fā)明的微陣列對(duì)融合基因的融合基因配偶體的表達(dá)水平進(jìn)行檢測(cè)的步驟。該步驟通常在上述方法的步驟c)中進(jìn)行, 即,在利用本發(fā)明的微陣列對(duì)來自樣本的mRNA的外顯子_到_外顯子連接進(jìn)行檢測(cè)的時(shí) 候。 因此,更具體地說,步驟c)可以為 c.使用含有針對(duì)融合基因的基因間外顯子-到-外顯子里連接的嵌合探針的微陣
列和含有針對(duì)所述融合基因的配合基因配偶體的至少兩個(gè)基因內(nèi)探針的微陣列對(duì)來自樣 本的mRNA的外顯子_到_外顯子連接進(jìn)行檢測(cè)。 步驟c)的另一種實(shí)施方式中,所述嵌合探針和至少兩個(gè)基因內(nèi)探針可以存在于 單個(gè)微陣列上,或存在于同一微陣列上。 本發(fā)明的方法還包括使用本發(fā)明的微陣列對(duì)嵌合探針檢測(cè)的融合基因的外顯 子_到_外顯子連接與基因內(nèi)探針檢測(cè)得到的外顯子_到_外顯子檢測(cè)進(jìn)行比較的步驟。
在本發(fā)明的方法的步驟c)中,對(duì)微陣列的圖像進(jìn)行測(cè)量時(shí),可以通過觀察到以下 而對(duì)陽性融合基因進(jìn)行評(píng)分 1、針對(duì)嵌合融合基因探針的高強(qiáng)度指示了存在特定融合基因,且特定的嵌合外顯 子_到_外顯子連接位于融合轉(zhuǎn)錄本中。 2、另外,我們可以通過基因內(nèi)探針發(fā)現(xiàn)通常基因標(biāo)準(zhǔn)表達(dá)水平與針對(duì)兩個(gè)融合基 因配偶體之一或二者的上游和下游部分的轉(zhuǎn)錄本之間的差別。通常地,基因內(nèi)探針(也 被稱為縱向探針或寡核苷酸)針對(duì)每個(gè)包括在內(nèi)的融合基因配偶體,可以例如包括3個(gè) 內(nèi)_外顯子探針(寡核苷酸)/外顯子,和外顯子_到_外顯子連接探針(寡核苷酸)。通 常地,從這些轉(zhuǎn)錄本的5'端向3'端移動(dòng)時(shí),可以發(fā)現(xiàn)上游融合基因配偶體(基因A)的表 達(dá)水平下降,且下游融合基因配偶體(基因B)的信號(hào)增強(qiáng)。根據(jù)第1點(diǎn)所述,在標(biāo)準(zhǔn)表達(dá) 水平中的變化應(yīng)該發(fā)生于基因內(nèi)的與陽性基因間/嵌合連接探針(寡核苷酸)相對(duì)應(yīng)的位 置。 3 、此外,可以按以上所描述地對(duì)各個(gè)嵌合連接探針的"融合得分"進(jìn)行計(jì)算。所述
融合得分結(jié)合了嵌合融合基因探針的分?jǐn)?shù)和基因內(nèi)探針的分?jǐn)?shù)。這種融合分?jǐn)?shù)提供了一種
簡(jiǎn)單的方式來表示在融合基因轉(zhuǎn)錄本內(nèi)存在特定外顯子_外顯子連接的可能性。 對(duì)于具有融合轉(zhuǎn)錄本的RNA樣本,可以觀察到上述1和2的結(jié)合(如圖l至圖3
所示)。然而,本發(fā)明也能預(yù)測(cè)到將1和3、2和3或者1、2和3的結(jié)合。 本方法可以包括使用寡dT引物或隨機(jī)引物(如六聚體)從步驟b)中的RNA制備
cDNA。在該實(shí)施方式中,在cDNA水平上對(duì)外顯子-到-外顯子連接進(jìn)行檢測(cè)。 本發(fā)明的方法還包括對(duì)樣品進(jìn)行標(biāo)記。對(duì)mRNA或cDNA進(jìn)行標(biāo)記的方法是本領(lǐng)域
技術(shù)人員已知的,根據(jù)實(shí)施例2的描述,該方法包括通過夾雜例如花青3 (Cy3)和/或花青
5 (Cy5)修飾的dNTPs對(duì)cDNA進(jìn)行標(biāo)記。 通常地,本發(fā)明方法的步驟c)中通過使獲得自樣本的mRNA或cDNA與微陣列進(jìn)行 雜交而對(duì)外顯子_外顯子連接進(jìn)行檢測(cè)。使mRNA或cDNA與微陣列進(jìn)行雜交的方法是本領(lǐng) 域技術(shù)人員所公知的。 所述樣本可以為任何生物學(xué)材料,例如來自癌癥患者或疑似患有癌癥的人的血液 或骨髓。另一種樣本是獲得自實(shí)體瘤的組織。 本發(fā)明的一個(gè)特別的優(yōu)點(diǎn)在于,用微陣列對(duì)融合基因進(jìn)行檢測(cè)前,本發(fā)明無需要在RNA上進(jìn)行RT-PCR或無需在步驟b)得到的cDNA上進(jìn)行PCR就可以進(jìn)行檢測(cè)。
本發(fā)明的第三個(gè)方面是含有本發(fā)明的微陣列以及用于cDNA合成的隨機(jī)引物和/ 或用于cDNA合成的寡脫氧胸苷酸(oligo-dT)引物的試劑盒。優(yōu)選地,所述試劑盒還含有 逆轉(zhuǎn)錄酶和合成cDNA所必需的試劑。 在一個(gè)具體的實(shí)施方式中,所述試劑盒具有包括針對(duì)融合基因的基因間外顯 子_到_外顯子連接的嵌合探針的微陣列、含有針對(duì)融合基因配偶體的至少兩個(gè)基因內(nèi)探 針的微陣列和用于cDNA合成的隨機(jī)引物和/或用于cDNA合成的寡脫氧胸苷酸(oligo-dT) 引物。 所述試劑盒的嵌合探針和至少兩個(gè)基因內(nèi)探針可以存在于單個(gè)微陣列上,或者它
們也可以存在于同一微陣列上。
實(shí)施例
實(shí)施例l 制備連接探針(寡核苷酸)和微陣列 為了產(chǎn)生連接探針(寡核苷酸(oligos)),我們制作了能自動(dòng)處理公共基因組數(shù) 據(jù)的計(jì)算機(jī)腳本(computer script)(用中蟒(Python)程序語言編寫)。我們利用www. biomart. org互聯(lián)網(wǎng)入口得到對(duì)于全部的基因和它們的轉(zhuǎn)錄本的外顯子序列。對(duì)于每種融 合基因的組合,在全部組合中將全部基因A的外顯子的末端序列(最后30個(gè)核苷酸)和全 部基因B的外顯子的起始序列(30nt)結(jié)合。接著,使用寡核苷酸計(jì)算算法來從這些可能 融合基因外顯子_到_外顯子連接中產(chǎn)生探針(寡核苷酸)。在此,我們使Tm最佳地處于 6『C,并保持連接兩側(cè)每一側(cè)的Tm相等。在我們的實(shí)施例中,我們產(chǎn)生了長(zhǎng)度為33-46個(gè) 核苷酸的外顯子_到_外顯子連接探針(寡核苷酸)。 通過這種方式設(shè)計(jì)了針對(duì)275個(gè)融合基因的47427個(gè)連接探針(寡核苷酸)。
為了提高靈敏度和特異性,還設(shè)計(jì)了基因內(nèi)探針(縱向寡核苷酸)的。這些是測(cè) 量個(gè)體融合基因配偶體的沿轉(zhuǎn)錄本表達(dá)水平的成套的探針(寡核苷酸)。得到的三個(gè)探針 (寡核苷酸)從內(nèi)部在起點(diǎn)、中間和末端靶向各個(gè)外顯子序列,且還得到了靶向基因內(nèi)外顯 子-到-外顯子連接的探針(寡核苷酸)。而且由于前體mRNA加工機(jī)器可以在除去或引入 順式作用剪接調(diào)控序列之后改變剪接模式,因此還可以包括外顯子_到_內(nèi)含子連接和內(nèi) 含子-到-外顯子連接。 為了降低探針的"半粘結(jié)劑(half-binder)"效應(yīng),原型(prototype)中使用的探 針(寡核苷酸)非常短(34-40體(mer)),并且我們將它們構(gòu)建為在連接兩側(cè)的每一側(cè)具有 相等的解鏈溫度。由于短序列在連接兩側(cè)的每一側(cè),可以使粘結(jié)對(duì)單核苷酸多態(tài)性(SNP) 變得敏感。因此,在已知的SNP位置處我們制造了用于各個(gè)SNP變體的額外的成套的探針。 我們還得到了第二版的陣列,該陣列中探針(寡核苷酸)較長(zhǎng)(44-55mer)。
得到了所描述的微陣列,包括靶向275個(gè)已知融合基因的全部可能連接序列的嵌 合探針(寡核苷酸)、和針對(duì)100個(gè)這些基因的基因內(nèi)探針(縱向探針)。對(duì)于7個(gè)融合基 因,包括那些作為陽性對(duì)照的融合基因,所述嵌合探針(寡核苷酸)包括了一式四份。它們 所屬的融合基因配偶體也在100個(gè)基因的列表之中,針對(duì)這100種基因制得了基因內(nèi)探針 (寡核苷酸)??偠灾?,試驗(yàn)融合基因微陣列包括具有69729個(gè)在Nimblegen微陣列載片 上合成的探針(寡核苷酸)的設(shè)計(jì),目前在每個(gè)微陣列上含有2. 1百萬(million)個(gè)不同的寡核苷酸序列。 實(shí)施例2 起作用的微陣列 在原理論證的實(shí)驗(yàn)中,我們對(duì)已知每個(gè)存在一種融合基因的一組陽性對(duì)照樣本進(jìn) 行了分析。試驗(yàn)樣本包括4份前列腺癌組織樣本,對(duì)TMPRSS2 :ERG融合基因陽性和2種白 血病細(xì)胞系,已知它們每種攜帶了 TCF3 :PBX1融合基因和ETV6 :RUNX1融合基因中的一種。
對(duì)于試驗(yàn)樣本,通過使用快而精(Qiagen)旋轉(zhuǎn)離心柱將總RNA進(jìn)行分離。此外,用 核糖體RNA減少試劑盒(RiboMi皿sTM轉(zhuǎn)錄分離試劑盒;英杰(Invitrogen))使mRNA富集。 由此,用隨機(jī)引物(六聚體)進(jìn)行第一鏈cDNA合成,接著得到雙鏈cDNA并運(yùn)輸至尼布爾基 因公司(Nimblegen Inc.)進(jìn)行標(biāo)記、雜交、洗滌并對(duì)微陣列進(jìn)行掃描。通過包含Cy3-和 Cy5-修飾的dNTPs而對(duì)cDNA進(jìn)行標(biāo)記。
結(jié)論 為了可視化測(cè)量陽性對(duì)照基因,我們使用嵌合探針套或基因內(nèi)(縱向)探針套分 別進(jìn)行了兩組獨(dú)立的路徑。全部六組樣本具有清晰的融合基因圖案進(jìn)而證實(shí)了本發(fā)明想 法。 為了評(píng)價(jià)給定融合基因的易變性,我們采用前列腺癌中的TMPRSS2 :ERG融合基因 作為模型。這里,我們對(duì)來自4個(gè)個(gè)體腫瘤的惡性前列腺組織樣本進(jìn)行分析。圖2顯示了從 這些樣本之一得到的結(jié)果。圖2最左側(cè)的圖反應(yīng)了與嵌合外顯子_到_外顯子探針進(jìn)行雜 交得到的結(jié)果。單獨(dú)的TMPRSS2基因和ERG基因的外顯子分別描繪于X軸和Y軸上,因此 通過陰影密度可以觀察到與嵌合外顯子_到_外顯子探針雜交的樣本的量。從該圖上可以 看出,相應(yīng)于TMPRSS2外顯子1和ERG外顯子4的嵌合探針產(chǎn)生了高密度。這反映了樣本 材料中TMPRSS2外顯子1和ERG外顯子4之間發(fā)生融合的TMPRSS2 :ERG融合基因的存在。 圖2最右側(cè)的圖反應(yīng)了用基因內(nèi)ERG探針檢測(cè)得到的個(gè)體ERG基因外顯子的表達(dá)水平。從 圖上可以發(fā)現(xiàn),外顯子l-3的平均表達(dá)水平低于外顯子4-ll,這反映ERG基因做為融合基因 被表達(dá)并且僅該基因的外顯子4-11包含在融合轉(zhuǎn)錄本中。因此,通過嵌合探針和基因內(nèi)探 針得到的結(jié)果相符,并且它們的結(jié)合有力地證明了前列腺癌樣本含有TMPRSS2 :ERG基因, 其中融合連接位于TMPRSS2外顯子1和ERG外顯子4之間。通過cDNA測(cè)序,我們還確認(rèn)了 在核苷酸水平上這種精確的融合連接(數(shù)據(jù)未示出)。 如圖2所示,用嵌合探針得到的結(jié)果也表現(xiàn)出了在其他部位的信號(hào)雖然其強(qiáng)度弱 于TMPRSS2外顯子1和ERG外顯子4部位。這些部位是,例如TMPRSS2外顯子1至ERG外 顯子1和TMPRSS2外顯子2至ERG外顯子2。但是,我們發(fā)現(xiàn)這些候選融合連接沒有在ERG 的縱向曲線上得到反映。因此,這說明了包含的基因內(nèi)探針(寡核苷酸)是如何降低假陽 性評(píng)分的可能性的。 圖3反映了得到的結(jié)果,且數(shù)據(jù)與圖2所描述的相似。所述通過嵌合探針獲得的 結(jié)果顯示于上圖中,而通過基因內(nèi)探針針對(duì)TCF3和PBX1的外顯子得到的結(jié)果示于下側(cè)的 左圖和右圖中。通過根據(jù)上游融合基因配偶體或下游融合基因配偶體的外顯子數(shù)量所描繪 的它們的強(qiáng)度(下側(cè)的左圖和右圖),我們看到的圖與使用嵌合外顯子-到-外顯子探針獲 得的相同(上圖)??v向曲線(通過基因內(nèi)探針得到)支持了與嵌合探針?biāo)鶛z測(cè)到的存在 同樣的融合斷點(diǎn),即,該細(xì)胞系中的TCF3 :PBX1融合基因含有與PBX1外顯子4-8進(jìn)行融合的TCF3外顯子1-15。此外,對(duì)該細(xì)胞系進(jìn)行的cDNA測(cè)序證實(shí)了由融合基因微陣列測(cè)定的 融合轉(zhuǎn)錄本斷點(diǎn)直至在單個(gè)核苷酸水平上是正確的。 RUNX1是人類白血病中染色體重排頻率最高的靶之一。到目前為止,已經(jīng)報(bào)道 了 21種類型的易位與RUNX1有關(guān),且已經(jīng)對(duì)它的12個(gè)配偶體基因進(jìn)行克隆和鑒定(14)。 在此進(jìn)行分析的樣品之一REH細(xì)胞系攜帶有ETV6 :RUNX1融合基因。通過使用嵌合外顯 子-到-外顯子探針和基因內(nèi)探針靶向ETV6基因外顯子,與TMPRSS2 :ERG和TCF3 :PBX1基 因描述相似地對(duì)其進(jìn)行檢測(cè)。數(shù)據(jù)顯示REH細(xì)胞系含有ETV6 :RUNX1融合基因,其中ETV6 基因的外顯子5的末端與RUNX1基因外顯子2的起始端發(fā)生融合。 為了測(cè)定我們不需要事先了解它們的存在或身份就能檢測(cè)融合基因的能力,我們 還進(jìn)行了無監(jiān)督數(shù)據(jù)分析,其中,計(jì)算全部潛在的融合基因連接發(fā)生融合事件的概率。針對(duì) 這些分析,由嵌合探針得到的標(biāo)準(zhǔn)化值計(jì)算的融合得分與從它們的縱向曲線觀察到的上游 融合基因配偶體或下游融合基因配偶體的融合斷點(diǎn)的概率相乘。 針對(duì)每個(gè)在融合配偶體基因的縱向曲線上的外顯子-外顯子連接計(jì)算兩個(gè)概率。 轉(zhuǎn)錄本態(tài)概率建立在針對(duì)是否來自全部上游外顯子和全部下游外顯子的值能屬于獨(dú)立群 體的基礎(chǔ)上的t測(cè)試。外顯子態(tài)概率是建立在針對(duì)是否來自緊接上游外顯子和下游外顯子 的值能屬于獨(dú)立群體的概率的基礎(chǔ)上的t測(cè)試。 針對(duì)每個(gè)嵌合連接探針,計(jì)算兩個(gè)所述的融合得分。它們是將嵌合探針(寡核苷 酸)得到的值與上游融合基因配偶體或下游融合基因配偶體的縱向曲線得到的值進(jìn)行結(jié)合。[融合得分=嵌合連接得分*P (轉(zhuǎn)錄本態(tài))*P (外顯子態(tài))] 對(duì)于圖2和圖3進(jìn)行可視化測(cè)量的樣品,得到證實(shí)的融合事件在試驗(yàn)數(shù)據(jù)中被查 證的10297份融合轉(zhuǎn)錄本概率融合得分中最高。 為了將數(shù)值保持在范圍內(nèi),需要使用下列閾值。當(dāng)嵌合探針的標(biāo)準(zhǔn)化值大于10 時(shí),可以將它們?cè)O(shè)定為10。類似地,當(dāng)縱向曲線上斷點(diǎn)的概率< 0. 10時(shí),可以將概率設(shè)為 0. 10。也可以在下游融合基因配偶體外顯子得到的數(shù)值小于上游融合基因配偶體外顯子得 到的數(shù)值時(shí),將概率也設(shè)為0. 10。
參考文獻(xiàn) 賓漢 J,桑德薩拉姆 S和斯里尼瓦桑 S(2006),對(duì)人類磷酸二酯酶基因和剪接 異構(gòu)體的描繪,生物化學(xué)與生物物理學(xué)研究通訊,350(1) :25-32 (Bingham J, Sudarsanam S, and Srinivasan S (2006). Profiling humanphosphodiesterase genes and splice isoforms. Biochem. Biophys. ResComm皿.,350 (1) :25-32); 克拉克 J,默森 S、吉哈瓦 S、弗洛赫 P、愛德華 S、福斯特 CS、埃里斯 R、 馬丁 FL、菲利普 DH、克朗德威爾 M、克里斯馬斯 T、湯普森 A、費(fèi)謝爾 C、科瓦奇 G 和庫珀 CS(2006) , TMPRSS2-ERG融合轉(zhuǎn)錄本在人類前列腺中的多樣性,致癌基因,[收稿 日在印刷前](Clark J, Merson S, Jhavar S, Flohr P, Edwards S, Foster CS, Eeles R, Martin FL, Phillips DH, Cr皿dwell M, Christmas T, Thompson A, Fisher C, Kovacs G, and Cooper CS(2006). Diversity of TMPRSS2-ERG fusiontranscripts in the human prostate. Oncogene, [Epub ahead of print]) 5 約翰遜 JM、卡斯特爾 J、蓋瑞特_恩格爾 P、坎 Z、勒爾希 PM、阿穆爾 CD、桑托斯'R、夏德特'EE、斯托頓*EE和蘇梅克爾'DD(2003),用外顯子連接微陣列進(jìn)行人類 選擇性前體mRNA剪接的全基因組分析,科學(xué),302 (5653) :2141-2144 (Johnson JM, Castle J, Garrett-Engele P, Kan Z, Loerch PM, Armour CD, Santos R, Schadt EE, Stoughton R, and Shoemaker DD(2003). Genome-wide survey of humanalternative pre-mRNA splicing with exon junction microarrays. Science,302(5653) :2141-2144);
米特爾曼 F、約翰森 B和梅爾騰斯 F(2007),易位和基因融合對(duì)癌癥形成的影 口向,自然癌癥綜述,7(4) :233-245(Mitelman F, Johansson B, and Mertens F(2007).The impact of translocations and genefusions on cancer causation. Nat. Rev. Cancer., 7(4) :233-245); 那謝德金娜"T、多摩"P、扎瑞那弗"V、霍伯格"J、雷索夫"Y和米扎貝科
夫 A(2002),通過與寡核苷酸微陣列進(jìn)行雜交來鑒定白血病中的染色體易位,血液 學(xué) 矛艮,87(4) :363—372(Nasedkina T, Domer P, ZharinovV, Hoberg J, Lysov Y, and Mirzabekov A(2002). Identification ofchromosomal translocations in leukemias by hybridization witholigo皿cleotide microarrays. Haematologica. , 87 (4) :363-372)
那謝德金娜 T、扎瑞那弗 V、伊莎伊娃 EA、米塔亞伊娃 0N、尤拉索夫 RN、 蘇華茨基科夫 SA、特瑞金 AY、魯比那 AY、卡拉春斯基 AI、加頓豪斯 RB和米扎貝 科夫 A(2003),通過使用多重聚合酶鏈?zhǔn)椒磻?yīng)-微陣列法對(duì)兒童白血病中的基因重排進(jìn) 行臨床篩選,臨床癌癥通訊,9(15) :5620-5629 (Nasedkina TV, Zharinov VS, Isaeva EA, Mityaeva 0N, Yurasov RN, Surzhikov SA, Turigin AY, Rubina AY, Karachunskii AI, Gartenhaus RB,and Mirzabekov AD(2003). Clinical screening of generearrangements in childhood leukemia by using a multiplex polymerasechain reaction-microarray approach. Clin. Cancer Res. ,9(15) :5620-5629); 諾沃 FJ、德蒙蒂比爾 IO和比斯馬諾斯 幾(2007), TICdb :癌癥中易位斷點(diǎn) 映射集,英國(guó)醫(yī)學(xué)研究理事會(huì)基因組學(xué),8 :33(Novo FJ, deMendibil 10, and Vizmanos 幾(2007). TICdb :a collection of m即pedtranslocation breakpoints in cancer. BMC Genomics,8 :33); 史 RZ、莫里西 JM和羅利 JD(2003),對(duì)人類白血病中的多重染色體易位的 篩選和定量,臨床化學(xué),49 (7) :1066-1073 (Shi RZ, MorrisseyJM, and Rowley JD(2003). Screening and quantification of multiplechromosome易位s in human leukemia. Clin. Chem. ,49(7) :1066-1073.) 特謝拉,MR(2006),癌癥中的最新融合致癌基因,致癌基因重要通訊,12(3-4): 257-271 (Teixeira MR(2006). Recurrent fusion oncogenes incarcinomas. Critical Rev. Oncogen. , 12(3-4) :257-271); 特姆林斯 SA、羅茲 DR、佩爾奈 S、但漢拿瑟卡蘭 SM、梅拉 R、孫 XW、瓦拉 姆巴利 S、曹 X、欽達(dá) J、庫爾弗 R、李 C、蒙蒂 JE、沙赫 RM、皮耶塔 KJ、魯賓 MA 和秦娜燕 AM(2005),目前對(duì)前列腺癌中TMPRSS2和ETS轉(zhuǎn)錄本因子基因中的融合,科 學(xué),310 (5748) :644-648 (Tomlins SA, Rhodes DR, Per證S, Dhanasekaran SM, Mehra R, S皿XW, Varambally S, Cao X, Tchinda J, Kuefer R, Lee C, Montie JE, Shah RB, Pienta KJ, Rubin MA, and Chi麗iyan AM (2005). Recurrentfusion of TMPRSS2 and ETStranscription factor genes in prostate cancer. Science,310(5748) :644-648);
哈恩 Y、貝拉 TK、葛赫爾豪斯 K、契爾斯 IR、帕斯坦 IH和李 B(2004),通 過分析得到表達(dá)的序列數(shù)據(jù)庫對(duì)由染色體重排造成的基因融合的發(fā)現(xiàn),美國(guó)國(guó)家科學(xué)院 院刊,101 (36) :13257-13261 (Hahn Y, Bera TK, Gehlhaus K, Kirsch IR, Pastan IH and Lee B (2004). Finding sresulting from chromosome rearrangement by analyzing the expressedsequence databases. PNAS,101 (36) :13257—13261)。
權(quán)利要求
一種微陣列,該微陣列含有針對(duì)融合基因的基因間外顯子-到-外顯子連接的嵌合探針和至少兩個(gè)針對(duì)該融合基因的融合基因配偶體的基因內(nèi)探針。
2. 根據(jù)權(quán)利要求1所述的微陣列,其中,所述基因內(nèi)探針的靶選自由所述融合基因配偶體的內(nèi)_外顯子序列、外顯子_到_外顯子連接、外顯子_內(nèi)含子連接或內(nèi)含子_外顯子連接所組成的組中。
3. 根據(jù)權(quán)利要求l所述的微陣列,其中,所述融合基因選自由以下基因所組成的組中基因A基因BENSG00000009709ENSG00000010404ENSG00000015133ENSG00000015133ENSG00000023445ENSG00000029725ENSG00000047410ENSG00000047410ENSG00000047932ENSG00000054118ENSG00000066455ENSG00000066629ENSG00000067369ENSG00000067955ENSG00000069399ENSG00000071564ENSG00000071564ENSG00000071564ENSG00000072274ENSG00000072864ENSG00000073921ENSG00000077150ENSG00000078674ENSG00000078674ENSG00000080824ENSG00000082805ENSG00000083168ENSG00000083168ENSG00000083168ENSG00000083168ENSG00000089280ENSG00000089280ENSG00000089280ENSG00000089280ENSG00000089280ENSG00000089280ENSG00000150907ENSG00000197021ENSG00000113721ENSG00000134853ENSG00000172175ENSG00000113721ENSG00000105976ENSG00000198400ENSG00000047936ENSG00000129204ENSG00000165731ENSG00000097007ENSG00000113721ENSG00000133392ENSG00000136997ENSG00000105619ENSG00000108924ENSG00000185630ENSG00000113916ENSG00000113721ENSG00000078403ENSG00000059377ENSG00000096968ENSG00000165731ENSG00000113916ENSG00000165731ENSG00000005339ENSG00000100393ENSG00000140396ENSG00000143970ENSG00000123268ENSGO0000157554ENSG00000157613ENSG00000166986ENSG00000175197ENSG00000175197ENSG00000089280 ENSG00000096384 ENSG00000100345 ENSG000001叩503 ENSG00000100815 ENSG00000103522 ENSG00000105662 ENSG00000105810 ENSG00000105810 ENSG00000105810 ENSG00000105810 ENSG00000108091 ENSG00000108091 ENSG00000108821 ENSG00000108821 ENSGOOOO0108946 ENSG00000109220 ENSG00000109471 ENSG00000109906 ENSG00000110092 ENSG00000110619 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000"0713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000"0713 ENSG00000110713 ENSG00000110713 ENSG00000"0713 ENSG00000110713 ENSG00000110713 ENSG00000110713 ENSG00000110777 ENSG00000110987 ENSG00000111640 ENSG00000111790 ENSG00000112081 ENSG00000112486 ENSG00000112701 ENSG00000113263 ENSG00000113594 ENSG00000114354 ENSG00000114354 ENSG00000114354 ENSG00000114999 ENSG00000116560ENSG00000182158ENSG00000113916ENSG00000171094ENSG00000113721ENSG00000113721ENSG00000"39化ENSG00000化4384ENSG00000078403ENSG00000085276ENSG00000118058ENSG00000164438ENSG00000113721ENSG00000165731ENSG00000100311ENSG00000129204ENSG00000165731ENSG00000139083ENSG00000048462ENSG00000131759ENSG00000070404ENSG00000171094ENSG00000005073ENSG00000024862ENSG00000040633ENSG00000073614ENSG00000078399ENSG00000106031ENSG00000116132ENSG00000119335ENSG00000123364ENSG00000123388ENSG00000128713ENSG00000128714ENSGOOOO0138698ENSG00000147548ENSG00000148700ENSG00000164985ENSG00000165671ENSG00000167157ENSG00000178105ENSG00000198900ENSG000001139化ENSG00000136997ENSG00000113916ENSG00000077782ENSG00000113916ENSG00000077782ENSG00000188580ENSG00000165025ENSG00000181690ENSG00000119508ENSG00000171094ENSG00000198400ENSG00000139083ENSG00000068323ENSG00000"6604ENSG00000117000ENSG00000118058ENSG00000118058ENSG00000118058ENSG0000Cm8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000"8058ENSG00000118058ENSG00000"8058ENSG00000"8058ENSGOO0OO"8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG,D0"8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000"8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000"8058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000118058ENSG00000119397ENSG00000120616ENSG00000121741ENSG00000071626ENSG00000116990ENSG00000002834ENSG00000005339ENSG00000007237ENSG00000008300ENSG00000072364ENSG00000073921ENSG00000。75539ENSG00000078403ENSG00000079102ENSG00000085832ENSG00000100393ENSG00000101367ENSG00000105656ENSG00000108292ENSG00000110395ENSG00000112305ENSG00000118058ENSG00000118689ENSG00000125354ENSG00000130382ENSG00000130396ENSG00000131759ENSG00000132142ENSG00000132394ENSG00000136754ENSG00000136848ENSG00000137812ENSG00000138336ENSG00000138758ENSG00000141985ENSG00000142347ENSGOOOO0143443ENSG00000144218ENSG00000145012ENSG00000145819ENSG00000150455ENSGOOOO0154556ENSG00000163655ENSG00000156140ENSG00000168385ENSG00000171723ENSG00000171843ENSGOOOO0172409ENSG00000172493ENSG00000184384ENSG00000184481ENSGOOOO0184640ENSG00000184702ENSG00000187239ENSG00000196914ENSG00000077782ENSG00000"2511ENSG00000077782ENSG00000122025ENSG00000122566ENSG00000122779ENSG00000122779ENSG00000124243ENSG00000125618ENSG00000126777ENSG00000126883ENSG00000126883ENSG00000126883ENSG00000127083ENSG00000127152ENSG00000127152ENSG00000127914ENSG00000127946ENSG00000128487ENSG00000133639ENSG00000135903ENSG00000135903ENSG00000136167ENSG00000136997ENSG00000136997ENSG00000137193ENSG00000137309ENSG00000137497ENSG00000137727ENSG00000138293ENSG00000138363ENSG0D000138594ENSG00000138674ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000139083ENSG00000140262ENSG00000140262ENSG00000140464ENSG00000140937ENSG00000139083ENSG00000006468ENSG00000077782ENSG00000131759ENSG00000141376ENSG00000132170ENSG00000165731ENSG00000097007ENSG00000119335ENSG00000124795ENSG00000129204ENSG00000164438ENSG00000211829ENSG00000157764ENSG00000113721ENSG00000113721ENSG00000136997ENSG00000084676ENSG00000150907ENSG00000113916ENSG00000110987ENSG00000133639ENSG00000113916ENSG00000112769ENSG00000131759ENSG00000165288ENSG00000165731ENSG00000171094ENSG00000101977ENSG00000171094ENSG00000068078ENSG00000085276ENSG00000096968ENSG00000097007ENSG00000111816ENSG00000113721ENSG00000114999ENSG00000122025ENSG00000130675ENSG00000140538ENSG00000143322ENSG00000143437ENSG00000153233ENSG00000159216ENSG00000164398ENSG00000165025ENSG00000165556ENSG00000169184ENSG00000179094ENSG00000188580ENSG00000197880ENSG00000119508ENSGOOOO0135605ENSG00000131759ENSG00000129204ENSG00000141367ENSG00000141367ENSG00000141380ENSG00000141380ENSG00000141380ENSG00000141867ENSG00000142611ENSG00000143294ENSG00000143549ENSG00000143549ENSG00000143549ENSG00000143924ENSG00000145216ENSG00000147065ENSG00000147140ENSG00000147889ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000149948ENSG00000153201ENSG00000153814ENSG00000153814ENSG00000153944ENSG00000156650ENSG00000156976ENSG00000158715ENSG00000158715ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000159216ENSG00000162367ENSG00000162775ENSG00000163902ENSG00000164692ENSG00000165288ENSG00000167460ENSG00000168036ENSG00000168421ENSG00000169306ENSG00000169696ENSG00000169714ENSG00000170791ENSG00000068323ENSG00000171094ENSG00000126752ENSG00000187754ENSG00000204645ENSG00000184507ENSG00000085276ENSG00000068323ENSG00000113721ENSG0D000171094ENSG00000198400ENSG00000171094ENSG00000134853ENSG00000171094ENSG00000068323ENSG00000147889ENSG00000100814ENSG00000144476ENSG00000145012ENSG00000164919ENSG00000182185ENSG00000183722ENSG00000189283ENSG00000171094ENSG00000112511ENSG00000178691ENSG00000078399ENSG00000005339ENSG00000113916ENSG00000006468ENSG00000171656ENSG00000022556ENSG00000079102ENSG00000085276ENSG0000。106346ENSG00000109686ENSG00000116251ENSG00000129993ENSG00000143373ENSG00000155313ENSG00000169946ENSG00000198492ENSG00000206"5ENSG00000123473ENSG00000196588ENSG00000085276ENSG00000181690ENSG00000137727ENSG00000171094ENSG00000181690ENSG00000113916ENSG00000198947ENSG00000068323ENSG00000129204ENSG00000181690ENSG00000170881ENSG00000170961ENSG00000172660ENSG00000172660ENSG00000172660ENSG00000172660ENSG00000173757ENSG00000178104ENSG00000179362ENSG00000179583ENSG00000180843ENSG0000018"63ENSG00000181163ENSG00000181163ENSG00000182158ENSGOOOOO"182944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000化2944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000182944ENSGOOOO0182944ENSG00000182944ENSG00000182944ENSG00000182944ENSG00000184012ENSG00000184012ENSG00000184012ENSG00000184012ENSG00000184402ENSG00000184507ENSG000001858"ENSG00000186716ENSG00000186716ENSG00000186716ENSG00000186716ENSG00000187735ENSG00000188580ENSG00000189283ENSG00000189283ENSG00000196092ENSG00000196531ENSG00000196535ENSG00000197323ENSG00000197711ENSG00000198339ENSG00000204691其中,基因A是所述融合基因的上游融合:融合基因配偶體。ENSG00000189283ENSG00000181690ENSG00000119508ENSG00000126746ENSG00000128656ENSG00000135605ENSG00000131759ENSG00000113721ENSG00000006468ENSG00000113916ENSG00000171094ENSG00000131759ENSG00000171094ENSG00000178053ENSG00000132170ENSG00000006468ENSG00000100105ENSG00000118260ENSG00000119508ENSG00000123268ENSG00000126746ENSG00000135605ENSG00000151702ENSG00000157554ENSG00000163497ENSG00000166986ENSG00000175197ENSG00000175832ENSG00000184937ENSG00000204531ENSG00000006468ENSG00000157554ENSG00000171656ENSG00000175832ENSG00000126752ENSG00000141867ENSG00000113916ENSG00000077782ENSG00000096968ENSG00000097007ENSG00000134853ENSG00000181690ENSG00000139083ENSG00000149948ENSG00000170881ENSG00000139083ENSG00000113916ENSG00000077782ENSG00000165731ENSG00000048544ENSG00000113916ENSG00000112561因配偶體,而基因B是所述融合基因的下游
4. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,該微陣列含有針對(duì)所述融合基因 的至少20%的可能的基因間外顯子-到-外顯子連接的嵌合探針。
5. 根據(jù)權(quán)利要求1或2所述的微陣列,其中,該微陣列含有針對(duì)所述融合基因的至少 20個(gè)基因間外顯子-到-外顯子連接的嵌合探針。
6. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,該微陣列含有針對(duì)每一個(gè)可能的 所述融合基因的基因間外顯子_到_外顯子連接的嵌合探針。
7. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,該微陣列含有至少20個(gè)如權(quán)利要 求2中所列舉的融合基因。
8. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,該微陣列含有如權(quán)利要求2中所 列舉的全部融合基因。
9. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,所述嵌合探針含有第一部分和第 二部分,其中,所述第一部分與上游融合基因配偶體外顯子的3'端相對(duì)應(yīng),所述第二部分與 下游融合基因配偶體的5'端相對(duì)應(yīng),并且其中,所述嵌合探針是與mRNA或cDNA進(jìn)行雜交 的反義探針,或是與融合基因的cDNA進(jìn)行雜交的正義探針。
10. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,該微陣列同時(shí)含有針對(duì)每一個(gè)基 因間外顯子_到_外顯子連接的反義探針和正義探針。
11. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,調(diào)節(jié)所述嵌合探針的長(zhǎng)度以使它 們具有差異至多5t:的Tm值。
12. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,調(diào)節(jié)所述嵌合探針的第一部分和 第二部分的長(zhǎng)度以使它們具有差異至多5t:的Tm值。
13. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,所述嵌合探針的Tm值高于用于 雜交的溫度,并且其中所述嵌合探針的上游部分或下游部分的Tm低于用于雜交的溫度。
14. 根據(jù)前述任意一項(xiàng)權(quán)利要求所述的微陣列,其中,該微陣列還含有靶向外顯 子-到-外顯子連接的單核苷酸多態(tài)性(SNP)變體的嵌合探針。
15. —種檢測(cè)融合基因的方法,該方法包括以下步驟a. 提供樣本;b. 從所述樣本中分離RNA ;c. 用含有針對(duì)所述融合基因的基因間外顯子-到-外顯子連接的嵌合探針的微陣列和 含有針對(duì)融合基因配偶體的至少兩個(gè)基因內(nèi)探針的微陣列對(duì)來自所述樣本的mRNA或cDNA 的外顯子_到_外顯子連接進(jìn)行檢測(cè);d. 從而對(duì)存在于所述樣本中的融合基因進(jìn)行鑒定。
16. 根據(jù)權(quán)利要求15所述的方法,其中,所述步驟c)中的嵌合探針和至少兩個(gè)基因內(nèi) 探針存在于同一個(gè)微陣列上。
17. 根據(jù)權(quán)利要求15或16所述的方法,其中,該方法還包括使用寡脫氧胸苷酸引物或 隨機(jī)引物來制備cDNA,所述隨機(jī)引物為例如隨機(jī)六聚體。
18. —種試劑盒,該試劑盒含有包括針對(duì)融合基因的基因間外顯子-到-外顯子連接的 嵌合探針的微陣列、含有針對(duì)融合基因配偶體的至少兩個(gè)基因內(nèi)探針的微陣列,以及用于 cDNA合成的隨機(jī)引物和/或用于cDNA合成的寡脫氧胸苷酸引物。
19. 根據(jù)權(quán)利要求18所述的試劑盒,其中,步驟c)中所述嵌合探針和至少兩個(gè)基因內(nèi)探針存在于同一個(gè)微陣列上'
全文摘要
本發(fā)明涉及一種微陣列,該微陣列含有針對(duì)融合基因的基因間外顯子-到-外顯子連接的嵌合探針和至少兩個(gè)針對(duì)該融合基因的融合基因配偶體的基因內(nèi)探針。本發(fā)明還涉及檢測(cè)融合基因的方法和適于檢測(cè)融合基因的試劑盒。
文檔編號(hào)C12Q1/68GK101743323SQ200880022010
公開日2010年6月16日 申請(qǐng)日期2008年6月27日 優(yōu)先權(quán)日2007年6月27日
發(fā)明者古羅·E.·林德, 托馬森·加德.O.S., 朗希爾德·A.·洛特, 羅爾夫·I.·舍特海姆, 羅格納斯·托爾比約恩 申請(qǐng)人:奧斯陸大學(xué)醫(yī)院Hf
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
罗山县| 巩义市| 绥阳县| 盐城市| 连平县| 重庆市| 无为县| 昆山市| 邯郸县| 香格里拉县| 石渠县| 枣强县| 扶风县| 天津市| 南召县| 长兴县| 林口县| 鄯善县| 山丹县| 紫阳县| 遂溪县| 收藏| 临猗县| 文昌市| 涞水县| 瑞昌市| 江安县| 喜德县| 北碚区| 东乡族自治县| 西林县| 玉门市| 阿拉善右旗| 兴义市| 广饶县| 大埔区| 邵东县| 津南区| 收藏| 故城县| 新竹县|