欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

融合基因的制作方法

文檔序號:439550閱讀:993來源:國知局
專利名稱:融合基因的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及腫瘤中,特別是乳腺腫瘤中分離的融合基因。本發(fā)明還提供了一種用 于受試者腫瘤診斷和/或預(yù)后的檢測融合基因的試劑盒。
背景技術(shù)
染色體畸變(包括缺失,復(fù)制,倒位,插入和易位)是多種類型的癌癥的典型特征。 癌癥基因組分析的首要任務(wù)是確定癌癥發(fā)展中起到干擾或者發(fā)揮作用的基因。通過克隆惡 性血液病和軟組織肉瘤中染色體易位的斷裂點已經(jīng)鑒定出許多失調(diào)的融合基因。染色體易 位會引起斷裂交叉點處的基因失調(diào)從而導(dǎo)致腫瘤性的轉(zhuǎn)化。染色體易位主要有兩種相關(guān)的 分子結(jié)果第一,基因的啟動子和/或增強子元件被置于致癌基因附近從而導(dǎo)致致癌基因 的過表達(dá);第二,通過兩個基因內(nèi)含子中的斷裂和連接產(chǎn)生的融合基因?qū)е氯诤系鞍椎谋?達(dá)。在染色體畸變的諸多類型中,復(fù)發(fā)性易位已被證實普遍存在于惡性血液病中。盡 管許多實體腫瘤癌中存在的多種結(jié)構(gòu)畸變(大多數(shù)是不平衡易位),由于現(xiàn)有技術(shù)的局限, 腫瘤特異性復(fù)發(fā)性易位仍然難以表征。近來使用生物信息學(xué)分析基因表達(dá)微陣列數(shù)據(jù)對前 列腺癌的復(fù)發(fā)性融合基因的克隆(Tomlins等,2005),創(chuàng)立了理解實體腫瘤的分子復(fù)雜性 的新范例。實體腫瘤癌基因組分析中最常見的問題是不能成功鑒定不平衡拷貝數(shù)變化和復(fù) 雜重排?;虮磉_(dá)微陣列和低分辨拷貝數(shù)目分析方法不提供基因組重排的信息。截至2007 年5月16日,對惡性血液病和實體腫瘤的常規(guī)細(xì)胞遺傳學(xué)染色體核型分析共檢出52,172 種異常染色體核型(http://cgap. nci. nih. gov/Chromosomes/Mitelman)。各種染色體重排 完整的分子特征使得超過358個融合基因得以鑒定(Mitelman等,2007)。特異性染色體易 位可引起基于染色體畸變的腫瘤的亞分類。至今,已鑒定了約500種這種腫瘤特異性易位。 盡管與惡性血液病(10% )相比,實體腫瘤癌(80% )引起更高的癌癥死亡率,但是其可用 的細(xì)胞遺傳學(xué)信息比例卻比在惡性血液病中的多。惡性血液病中的細(xì)胞遺傳學(xué)變化即使在 晚期癌癥中都非常少且針對特定的組織學(xué)類型具有特有的染色體變化的類型。實體腫瘤中 的染色體畸變即使在早期或診斷時都是高度復(fù)雜的,從而導(dǎo)致不可能正確鑒定所有異常的 染色體。在各種變化中,不可能區(qū)分與腫瘤相關(guān)的原始異常和與發(fā)展相關(guān)的改變。復(fù)雜的 原因還有一部分是源于克隆異質(zhì)性,其存在于不到5%的血液癌癥中,但在實體腫瘤中卻非 常常見。在多種實體腫瘤類型中,乳腺癌的染色體異常是尚未徹底研究的腫瘤類型之一。 根據(jù)美國癌癥協(xié)會最近的估計,2006年約有212920名女性將被診斷患有乳腺癌以及40970 名女性被預(yù)計死于乳腺癌(美國癌癥協(xié)會,2006)。目前對于乳腺癌的遺傳基礎(chǔ)的理解僅限 于部分乳腺癌患者中突變和擴(kuò)增的基因。乳腺癌基因組的特征是出現(xiàn)復(fù)雜結(jié)構(gòu)重排和數(shù)目 畸變的高度不平衡的非整倍體核型。根據(jù)文獻(xiàn)綜述,顯然以現(xiàn)有的細(xì)胞遺傳學(xué)和分子方法 幾乎不可能鑒定復(fù)發(fā)性畸變。
5
盡管在惡性血液病和軟組織肉瘤中,通過用G帶染色體核型分析鑒定的染色體易 位的分子特征來克隆融合基因是可行的方法,但是由于實體腫瘤中染色體形態(tài)不良以及克 隆異質(zhì)性,對高度復(fù)雜的基因組重排的鑒定和通過G帶染色體核型分析對復(fù)發(fā)性染色體易 位的鑒定往往是困難的。MCF7的數(shù)據(jù)顯示超過60%的拷貝數(shù)邊界處于已知基因中,可被直 接選出以便進(jìn)一步證實。目前尚未在乳腺癌中鑒定出產(chǎn)生融合基因的復(fù)發(fā)性易位,有鑒于此,本發(fā)明提供 一種基于分析不平衡拷貝數(shù)變化來鑒定融合基因的新方法。

發(fā)明內(nèi)容
本發(fā)明旨在解決上述問題,且特別提供用以鑒定其中包含融合基因的拷貝數(shù)改變 (CNT)區(qū)域的新的和/或改進(jìn)的比較基因組雜交(CGH)法。本發(fā)明還提供采用本發(fā)明鑒定 的新融合基因作為生物標(biāo)記物應(yīng)用于診斷實體腫瘤。根據(jù)本發(fā)明的一個方面,提供一種分離的融合基因,所述融合基因包含至少一個 第一基因和/或其片段,其與至少一個第二基因和/或其片段融合。所述至少一個的第一 基因和/或第二基因可獨立地選自以下基因組成的組RCC2、CENPF、ARFGEF2、SULF2、MTAP、 ATXN7、BCAS3、RPS6KB1、TMEM49、EAP30、具有核苷酸序列SEQ ID NO 1的基因和具有核酸序 列SEQ ID NO :2的基因,或其片段?;虻娜诤鲜侵富蚪M易位,插入,倒位,擴(kuò)增和/或缺 失。融合基因可選自以下融合基因組成的組RCC2/CENPF、ARFGEF2/SULF2、MTAP/包含核苷 酸序列SEQ ID NO 2的基因、ATXN7/包含核苷酸序列SEQ IDNO 1的基因、BCAS3/ATXN7、 RPS6KB1/TMEM49和RPS6KB1/EAP30,或其片段。表1中總結(jié)了本發(fā)明的融合基因的非排他 性列表。特別地,根據(jù)本發(fā)明的一個融合基因是包含核酸序列SEQ ID N0:16和/或其片段 的ARFGEF2/SULF2融合基因。根據(jù)本發(fā)明的另一個融合基因是包含核酸序列SEQ ID NO 17和/或其片段的RPS6KB1/TMEM49融合基因。根據(jù)本發(fā)明的另一個融合基因是ATXN7/具 有核苷酸序列SEQ ID NO 1的基因。該融合基因包含核酸序列SEQ ID NO :18和/或其片 段。根據(jù)本發(fā)明的另一個融合基因是包含核酸序列SEQ ID N0:19和/或其片段的ATXN7/ BCAS3融合基因。融合的也可以是MTAP/具有核苷酸序列SEQ ID NO :2的基因,所述基因 融合包含核酸序列SEQ ID N0:20和/或其片段。任何所述融合基因可被包含于載體中。根據(jù)本發(fā)明的另一個方面,提供了一種分離的核酸,其包含核苷酸序列SEQID NO 1和/或SEQ ID NO :2,或其片段。所述分離的核酸可被包含于載體中。根據(jù)本發(fā)明的另一個方面,還提供一種診斷和/或預(yù)后試劑盒,其用于在受試者 中診斷和/或預(yù)后腫瘤,所述試劑盒包括檢測至少一種融合基因,其中,所述融合基因的存 在用于指示腫瘤的存在和/或病期。所述診斷和/或預(yù)后試劑盒可包含至少一種能夠與所述融合基因和/或其片段雜 交和/或互補的核酸分子,其中,雜交指示腫瘤的存在和/或病期。本發(fā)明還提供一種診斷和/或預(yù)后試劑盒以在,其用于在受試者中診斷和/或預(yù) 后腫瘤,其中,所述試劑盒包含一個或多個片段,所述片段代表能夠與從至少一個受試者的 腫瘤組織和對照組織中分離的差異性標(biāo)記的基因組DNA雜交的基因組,其中,與對照組織 相比,腫瘤組織中雜交強度和/或標(biāo)記信號的增加或者減少檢測腫瘤組織中的拷貝數(shù)改變 (CNT)區(qū)域,其指示腫瘤的存在和/或病期。
6
通過診斷和/或預(yù)后試劑盒檢測到的CNT區(qū)域可包含融合基因。在受試者中診斷和/或預(yù)后腫瘤時檢測到的融合基因可選自以下融合基因組成 的組RCC2/CENPF、ARFGEF2/SULF2、MTAP/ 包含核苷酸序列 SEQ IDNO 2 的基因、ATXN7/ 包 含核苷酸序列 SEQ ID NO 1 的基因、BCAS3/ATXN7、RPS6KB1/TMEM49 和 RPS6KB1/EAP30,或 其片段。所述融合基因還可通過熒光原位雜交(FISH)和/或cDNA末端快速擴(kuò)增聚合酶鏈 式反應(yīng)(RACE-PCR)技術(shù)檢測。所述腫瘤可以是III期腫瘤。特別地,所述腫瘤可為實體腫 瘤。更特別地,所述腫瘤可為乳腺腫瘤。根據(jù)本發(fā)明的又一方面,提供了一種診斷和/或預(yù)后腫瘤的存在和/或病期的方 法,其用于在受試者中診斷和/或預(yù)后腫瘤的存在和/或病期,所述方法包括檢測至少一個 融合基因,其中,所述融合基因的存在指示腫瘤的存在和/或病期。所述方法可包括提供至少一種能夠與所述融合基因和/或其片段雜交和/或互補 的核酸分子,其中,雜交指示腫瘤的存在和/或病期。根據(jù)另一方面,提供了一種診斷和/或預(yù)后腫瘤的存在和/或病期的方法,其用于 受試者中診斷和/或預(yù)后腫瘤的存在和/或病期,其中,所述方法包括提供一個或多個片 段,所述片段代表能夠與從至少一個受試者的腫瘤組織和對照組織中分離的差異性標(biāo)記的 基因組DNA雜交的基因組,其中,與對照組織相比,腫瘤組織中雜交強度和/或標(biāo)記信號的 增加或者減少檢測腫瘤組織中的拷貝數(shù)改變(CNT)區(qū)域,其指示腫瘤的存在和/或病期。所述CNT區(qū)域可包含本發(fā)明所述的任意融合基因。在受試者中診斷和/或預(yù)后腫 瘤中檢測到的融合基因可選自以下融合基因組成的組RCC2/CENPF、ARFGEF2/SULF2、MTAP/ 包含核苷酸序列SEQ ID N0:2的基因、ATXN7/包含核苷酸序列SEQ ID NO :1的基因、BCAS3/ ATXN7、RPS6KB 1/TMEM49 和 RPS6KB1/EAP30,或其片段。 所述融合基因還可通過FISH和/或RACE技術(shù)檢測。所述腫瘤可以為III期腫瘤。 特別地,所述腫瘤可為實體腫瘤。更特別地,所述腫瘤可為乳腺腫瘤。進(jìn)一步,提供一種試劑盒,其用以檢測融合基因的存在,其中,所述試劑盒包含一 個或多個片段,所述片段代表能夠與差異性標(biāo)記的對照和測試基因組DNA雜交的基因組, 其中,與對照基因組相比,測試基因組的雜交強度和/或信號的增加或者減少用以檢測測 試基因組中的拷貝數(shù)改變(CNT)區(qū)域,其中,所述CNT區(qū)域包含融合基因。根據(jù)另一個方面,本發(fā)明提供了一種檢測融合基因存在的方法,其中,所述方法包 括提供一個或多個片段,所述片段代表能夠與差異性標(biāo)記的對照和測試基因組DNA雜交的 基因組,其中,與對照基因組相比,測試基因組的雜交強度和/或信號的增加或減少用以檢 測測試基因組中的拷貝數(shù)改變(CNT)區(qū)域,其中,所述CNT區(qū)域包含融合基因。在受試者中診斷和/或預(yù)后腫瘤檢測到的融合基因可以選自以下融合基因組成 的組RCC2/CENPF、ARFGEF2/SULF2、MTAP/ 包含核苷酸序列 SEQ IDNO 2 的基因、ATXN7/ 包 含核苷酸序列 SEQ ID NO 1 的基因、BCAS3/ATXN7、RPS6KB1/TMEM49 和 RPS6KB1/EAP30,或 其片段。


圖1 :CGH陣列方法。腫瘤和對照DNA與寡核苷酸陣列雜交,掃描圖像和比率特征譜分析提供不平衡拷貝數(shù)改變區(qū)域。圖2. (A) =CNT位點的檢測。(B)比較44K,185K和244k陣列設(shè)計。圖3 :MCF7基因組的光譜核型分析和多種結(jié)構(gòu)性不平衡重排的鑒定。圖4 從拷貝數(shù)改變區(qū)域中分離融合基因。圖5 確認(rèn)CENPF基因中的CNT區(qū)域。(A) 1號染色體的CGH特征譜和在lq41鑒定 CNT區(qū)域。(B)高分辨率視圖顯示在10,827bp中的CNT區(qū)域。綠色或淺灰和紅色或深灰垂 直柱表示自CENPF基因5’和3’的BAC克隆的位置,分別顯示缺失和增加。(C)光譜核型分 析顯示MCF7中1號染色體的基因組構(gòu)成。(D)通過FISH確認(rèn)重排,兩個正常信號(共定位 的紅色或深灰信號和綠色或淺灰色信號_淺灰色箭頭)和三個紅色或深灰信號在不同的染 色體上(白色箭頭)。圖6 (A) CENPF基因的基因組構(gòu)成,CNT位點以虛線盒顯示。箭頭表示RACEPCR的 方向。(B) 3’和5’ RACE PCR顯示5’ RACE中270bp的擴(kuò)增產(chǎn)物。(C)處理和未處理的細(xì)胞 中的基因表達(dá)分析,對于每個時間點有三組重復(fù)的實驗。(D)PCR產(chǎn)物的序列顯示外顯子9、 10 禾Π 11 ;以及 RCC2 中 46bp 的序列,其顯示 RCC2/CENPF (SEQ ID NO 15)。圖7 乳腺癌細(xì)胞系中CENPF的RT PCR驗證。圖8 原發(fā)乳腺癌腫瘤中CENPF的RT PCR驗證。圖9 原發(fā)乳腺癌腫瘤中正常CENPF轉(zhuǎn)錄物的表達(dá)。圖10 :17q23上擴(kuò)增區(qū)域的FISH分析,其顯示在MCF7基因組的多個位置中插入擴(kuò) 增序列。(A)分裂間期細(xì)胞核。(B)分裂中期的染色體。圖11 (A) IOmb的擴(kuò)增區(qū)域,其顯示基因內(nèi)的許多CNT。(B)在ARFGEF2和SULF2基 因中1. Imb區(qū)域的倒位。(C)由3,RACE PCR擴(kuò)增2. 7kb的PCR產(chǎn)物。(D)ARFGEF2和SULF2 融合基因的序列(SEQ ID N0:16)。圖12 :MCF7的FISH分析顯示ARFGEF2和SULF2基因的擴(kuò)增和融合。(A)分裂中 期的染色體。(B)分裂間期細(xì)胞核。圖13 (A,B)在乳腺癌腫瘤中對ARFGF2/SULF2融合基因的RT PCR分析。圖14 (A)BLAST搜索顯示SULF2序列與外顯子3_6的比對。(B)在SULF2基因中 略過外顯子5的變異融合基因。(C)與ARFGEF2第一個外顯子的比對。圖15 使用BAC RP11-111G18進(jìn)行的FISH分析顯示MCF7中RPS6KB1基因的高水 平擴(kuò)增。圖16A 基因中帶有CNT區(qū)域的17q23擴(kuò)增子。圖16B :3,RACE PCR擴(kuò)增1. 2kb的PCR產(chǎn)物。道1顯示HindIII消化后的產(chǎn)物, 道3-6顯示在細(xì)胞系0(^159(道3),]\ ^7(道4),]\ ^10(道5)和HCTl 16 (道6)中的擴(kuò)增產(chǎn)物。圖17 :RPS6Kbl的3,RACE PCR在所有細(xì)胞系中擴(kuò)增出正常轉(zhuǎn)錄物和在BT474細(xì) 胞系中擴(kuò)增出小帶。圖18 分裂中期FISH分析顯示基因RPS6Kbl (白點)和EAP30 (淺灰)的融合。圖19 (A)基因ATXN7的5’和3’片段的差異性擴(kuò)增形成兩個CNT區(qū)域。(B)有 兩個CNT區(qū)域的BCAS3基因。圖20:(A)用BAC 1143K18進(jìn)行FISH分析顯示MCF7中ATXN7基因序列在多個位置的擴(kuò)增和插入。(B)自所述兩個CNT區(qū)域的3’和5’RACE擴(kuò)增了不同的PCR產(chǎn)物。(C)FISH 分析顯示在染色體1ρ21處基因ATXN7和BCAS3的融合。(D)ATXN7和新基因SEQID NO :1的 融合基因序列(SEQ ID NO 18) (E) ATXN7和新基因的BLAST搜索比對。(F,G)BCAS3 ;ATXN7 的BLAST搜索比對。圖21 (A) aCGH鑒定出具有變化的拷貝數(shù)的254kb區(qū)域的缺失,所述變化的拷貝數(shù) 歸因于MCF7細(xì)胞中的缺失的克隆異質(zhì)性。(B). 3’ RACE PCR顯示728bp的擴(kuò)增產(chǎn)物。(C) 圖解顯示內(nèi)含子4中有CNT區(qū)域的MTAP基因的基因組構(gòu)成。(D)基因表達(dá)分析顯示包括 MTAP在內(nèi)的所有基因均沒有表達(dá)。(E). 9q21中的缺失區(qū)域的基因組構(gòu)成。BLAST搜索顯示 MTAP的外顯子4與所述缺失的相鄰側(cè)翼區(qū)域EST的融合。(F)MTAP/SEQ ID NO 2的EST融 合基因的序列(SEQ ID NO 20)。序列簡述SEQ ID NO :1 新基因5’ CGGGAAGGTTAAGGTACCAAAAATGCAACATCCTGAAATAAGGAGGTGTTCAAACAATCCAGGTGGC GTTCTTCATTACTTGGGGACCAGATGTGCTGTGACAATTGTGCTCAGGTGATTGAAGTGACACCCAGGTCATATATA CCCAGGGTGGAGGGGTTCTGGGGTCCTTCATTTGAAGTGTGATATGGGACAAGAGCAGAGGAGACTCCATCCACCCT AGCCAGCTTTCCTGAGACTTGAGGACCAACTTGACATGAATCCTAGGCTTCTGCTTATCTTTGATGCCTCACTGTGA GTAGTAGACCTGCTTTATGTAACTTGTGATTGTTTTGTCTCATCAGATTTATGCAATTGGGAGAGATACTGGGGTTC CTCTTTGGCTCCTCTCTACTGTCTTCATTATGTTAGAATGACTGCAGCAGCCAGTTCTACTCTAAGCCCCCACTAAA CTTGTGAACCTTTGCAAGAAGCTACTGGGATAAGTGACTTTTGCAAAATTTCAAGATATGACATCAATATACAAATA TCAATTATACTATATCTTTAACAATAAATAGCAAGAAAATTGATTTAAAAGTAATATTTTCATAGAATAAAAATAGA ATTTGCTTTGAGACAGATATAACAGAATATACGCAAGATCTGCACATTTAAAACTATGAAAAATTGCTGACAGTATT TAAAGATC3’SEQ ID NO 2 新基因 5 ’ CTATGTCTCACAGTCCAGACTTGGAGTACAAGTAATAAGAAGAATAAAACTTGATCCCTTAAGTAGA TTCACCATAAGTTAGCTCAGAGCAATTCCAGTGCAAGTATGGTCTGTGATCCAGTAGTATCTTACAGACAGCAAGTT GAACATTGTGGGATGCATGAGCTATTGAGGCCTTTGCAGCTTTCTGCTACATGGAGGCTAGGGCCAGAGTCAAGATT TATGCTTTGCAGCACACTGGTCAGCTGTTTTTGCAAATCAGATTAAATGATTTTTAAATGAGGCTGAGAGCATGGGA GATACTAATGTGTGTTTCCTTGTGAGCTACTGCATAAGTTAGGAAATTGAAATACAGAAAGATGAAAAGTGATTTGC CCAAGCATATAGATCAAAGCTGTGGCAGAAGCAGGACTGGAACCTATATCTCTCTACTAATGGTTTTTTTAAAAAAA TAACCTTGTTTCAAAAATATTAAAAAGTCACAAGAAAGGTAAACATGTGGATAAACAAAATGAAGAAAATAAAAATT ATCCAGTAAAAAAAAAAAAACCTATAGTGAGTCGTATTAATTCGGATCCGC3'SEQ ID NO 3 =CENPF 外顯子 6 引物序列5’ GTGTTCTCATGGCAGCAAGA 3’SEQ ID NO 4 =CENPF 外顯子 6 引物序列5, CTGTTTGATGTTCTTGAGTTCTGC3,SEQ ID NO 5 :RCC2 引物序列5, TGCGTTTGCTGGCTTTGAT3,SEQ ID NO 6 :ARFGEF2 外顯子 1 引物序列5' TAGCCGACAAGGTGAAG 3'
SEQ ID NO 7 :ARFGEF2 外顯子 6 引物序列5' GTGTAGCGCATGATCCAGTG 3'SEQ ID NO 8 :RPS6KB1 正向引物5’ GCTGAAC TTTAGGAGCCAG3’SEQ ID NO 9 :TMEM49 反向引物5, TTTTCCTCCCAAGCAAAACA3‘SEQ ID NO 10 :ATXN7 外顯子 3 弓丨物 3,RACE 引物55 ‘ CTGAAGTGATGCTGGGACAGT3‘SEQ ID NO 11 :ATXN7 外顯子 4 巢式 3,RACE 引物5' ACAGAATTGGACGAAAGTTTCAA3‘SEQ ID NO 12 :ATXN7 外顯子 12 引物 5,RACE 引物5 ’ GGTACTGCTACTGGCATTTTGAC3’SEQ ID NO 13 :ATXN7 外顯子 12 引物 5,巢式 RACE 引物5, ATTTGCTGGATTTCAATTTCTGA3,SEQ ID NO 14 =MTAP 外顯子 4 引物:5, ATCATGCCTTCAAAGGTCAACTA3,SEQ ID NO 15 :RCC2/CENPF融合基因序列。RCC2序列(加下劃線的)融合至CENPF 序列5, CGCGGATCCAGACGCTGCGTTTGCTGGCTTTGATGAAATGCACAACGTCCTGCAGGCTGAACTGGAT AAACTCACATCAGTAAAGCAACAGCTAGAAAACAATTTGGAAGAGTTTAAGCAAAAGTTGTGCAGAGCTGAACAGGC GTTCCAGGCGAGTCAGATCAAGGAGAATGAGCTGAGGAGAAGCATGGAGGAAATGAAGAAGGAAAACAACCTCCTTA AGAGTCACTCTGAGCAAAAGGCCAGAGAAGTCTGCCACCTGGAGGCAGAATCAAGAACATCAAATA3'SEQ ID NO 16 :SULF2/ARFGEF2融合基因序列。SULF2序列(加下劃線的)融合至 ARFGEF2 序列5, GCTCGGCGTGATGTGCTGAGATGCGTTTGGGAAGAGGCGTGAATATTGTGGGGCTGAATCCTCAGGG CCGTGGGGGGCTGCATGGCTGATGACCATGAGGACTGGCCTGTGCGGGTACATCTTCTTGGACGTGCGGAAGAAGCT CACGCTGTCATTGGTGATGAGGTCTGTGAGGTAATCCTTGGAGTAGTCGGAGCCGTGCTTCTCTTTCACCCCGTTCC GACACAGCGTGTAGTTATAAAAGCGGGAGTTTTTAAGGAGTCCGACCCACTCCTTCCAGCCGGGTGGCACGTAGGAG CCGTTGTATTCATTAAGATACTTCCCGAAGAAAGCTGTCCGGTAGCCAGTGCTATTGAGGTACACGGCAAAGGTGCG GCTCTCGTGCTGTGCCTGCCGGGAGGGCGAGGAGCAGTTCTCATTGTTGGTGTAGGTGTTGTGGTTGTGGACGTACT TGCCGGTGAGGATGGAGGAGCGTGAGGGGCAGCACATGGGTGTGGTCACGAAGGCGTTGATGAAGTGCGTCCCGCCC TGCTCCATGATGCGCCGGGTCTTGTTCATCACCTGCATGGAACCGAGCGCCACCTGGCAGGCCCTGCGCAGCTGGGA GTGCTGGGGCCGCTTCACCTCCTTGTCGGCTAGGA3’SEQ ID NO 17 :RPS6KB1/TMEM49融合基因序列。RPS6KB1序列(加下劃線的)融 合至TMEM49序列5’ AGACAGGGAAGCTGAGGACATGGCAGGAGTGTTTGACATAGACATAGACCTGGACCAGCCAGAGGAC GCGGGCTCTGAGGATGAGCTGGAGGAGGGGGGTCAGTTAAATGAAAGCATGGACCATGGGGGAGTTGGACCATATGA ACTTGGCATGGAACATTGTGAGAAATTTGAAATCTCAGAAACTAGTGTGAACAGAGGGCCAGAAAAAATCAGACCAG AATGTTTTGAGCTACTTCGGGCTGGGAAAATATTTGCCATGAAGGTGCTTAAAAAGGGAGAAAACTGGTTGTCCTGG
10ATGTTTGAAAAGTTGAACTCAGAGGAGAAAACTAAATAAGTAGAGAAAGTTTTAACTGCAGAAATTGGAGTGGATGG GTTCTGCCTTAAATTGGGAGGACTCCAAGCTGGGAAGGAAAATTCCCTTTTCCAACCTGTATCAATTTTTACAACTT TTTTCCTGAAAAGCAGTTTAGTCCAIACTTTGCACTGACATACTTTTTCCTTCTGTGCTAAGGTAAGGTATCCACCC TCGGATGCAATCCACCTTGTGTTTTCTTAGGGTGGAATGTGATGTTCAGCAGCAAACTTGCAACAGACTGGCCTTCT GTTTGTTACTTTCAAAAGGCCCACATGAIACAATTAGAGAATTCATCAAAATGTATATAAATTATCTAGATTGGATA ACAGTCTTGCATGTTTATCATGTTACAATTTAATATTCCATCCTGCCCAACCCTTCCTCTCCCATCCTCAAAAAGGG CCATTTTATGATGCATTGCACACCCT3’SEQ ID NO 18 :ATXN7/新基因SEQ ID NO 1的序列。ATXN7序歹丨丨(加下劃線的) 融合至新基因SEQ ID NO 1 5, CAGAATTGGACGAAAGTTTCAAGGAGTTTGGGAAAAACCGCGAAGTCATGGGGCTCTGTTCGGGAAG GTTAAGGTACCAAAAATGCAACATCCTGAAATAAGGAGGTGTTCAAACAATCCAGGTGGCGTTCTTCATTACTTGGG GACCAGATGTGCTGTGACAATTGTGCTCAGGTGATTGAAGTGACACCCAGGTCATATATACCCAGGGTGGAGGGGTT CTGGGGTCCTTCATTTGAAGTGTGATATGGGACAAGAGCAGAGGAGACTCCATCCACCCTAGCCAGCTTTCCTGAGA CTTGAGGACCAACTTGACATGAATCCTAGGCTTCTGCTTATCTTTGATGCCTCACTGTGAGTAGTAGACCTGCTTTA TGTAACTTGTGATTGTTTTGTCTCATCAGATTTATGCAATTGGGAGAGATACTGGGGTTCCTCTTTGGCTCCTCTCT ACTGTCTTCATTATGTTAGAATGACTGCAGCAGCCAGTTCTACTCTAAGCCCCCACTAAACTTGTGAACCTTTGCAA GAAGCTACTGGGATAAGTGACTTTTGCAAAATTTCAAGATATGACATCAATATACAAATATCAATTATACTATATCT TTAACAATAAATAGCAAGAAAATTGATTTAAAAGTAATATTTTCATAGAATAAAAATAGAATTTGCTTTGAGACAGA TATAACAGAATATACGCAAGATCTGCACATTTAAAACTATGAAAAATTGCTGACAGTATTTAAAGATC3'SEQ ID NO 19 :ATXN7/BCAS3融合基因序列。ATXN7序列(加下劃線的)融合至 BCAS3序列5, TTTGCTGGATTTCAATTTCTGAGGTTTCCTGGACATGGGGGAGGAAGGAACCGAGGAAAGGCCAGAG GGCGTGGAAGGGGATGAGGATGAAGAGGACACTTGTCTGGATTGCATACTGCACACAGGATCCATCGCCCCTGAAGC AGCAGGCTGTGCATTTAGTGTGTTTCCATGAGCTGGTACCGATTTGCTATTTGGGGAGATGCAGGTAGATGAGAGCA GGACTGGGGATGTAGAGACGGTGGCTGCTGCCAGATAGCTGACTCCACATTGTGATGTCGGCACAGAGTTTGTCCGG TGAGGAATACGTGTGGAGATGGGTGAGGTGGTACTGGGCACTGGTGGGATTTTCCAAACTGTGGAGCAGGCAAGATT TTAGCCGCTCGAATTGGGCCATGTCGGACAGAGAAGAGCTCTTGTGCTTCGCCACTGATAGGGATGCTCCAGACCTG CATTCCATCACTGTAGCCAATCATAATCAACAAAGGCGGTTCACTCCCAGTACTATGTATTTCATGAAATTCCAGAT TTCTTGATGTATCATTTAAATCTGCATTTTCAAATCTGACCCAGACTATTTTCTCCTTTTCTTCTGTTAGAGGTGTT CCACTGTAAGCCTGTGGCACAACATCCTGCAGAAAAGTCACAACACTTTCCATGTAGGACTGCTCTGTGACAGCCTG GGGGCGAACCACAACTCCACCAGTACAACGACTGGGTCTTCTTGGGGAATCTGTAGCCATAGCTTCATTCATAAAAC CGGCCGCCCCGCCGTTAACTTTCATCAAAGCCAGCAAACGCAGTGTTCGGATCCGCGA3’SEQ ID NO 20 =MTAP/新基因SEQ ID NO 2融合序列。MIAE序列(加下劃線的) 融合至新基因SEQ ID NO 2 5 ’ TCATGCCTTCAAAGGTCAACTACCAGGCGAACATCTGGGCTTTGAAGGAAGAGGGCTGTACACATGT CATAGTGACCACAGCTTGTGGCTCCTTGAGGGAGGAGATTCAGCCCGGCGATATTGTCATTATTGATCAGTTCATTG ACAGCTATGTCTCACAGTCCAGACTTGGAGTACAAGTAATAAGAAGAATAAAACTTGATCCCTTAAGTAGATTCACC ATAAGTTAGCTCAGAGCAATTCCAGTGCAAGTATGGTCTGTGATCCAGTAGTATCTTACAGACAGCAAGTTGAACAT TGTGGGATGCATGAGCTATTGAGGCCTTTGCAGCTTTCTGCTACATGGAGGCTAGGGCCAGAGTCAAGATTTATGCT
11TTGCAGCACACTGGTCAGCTGTTTTTGCAAATCAGATTAAATGATTTTTAAATGAGGCTGAGAGCATGGGAGATACT AATGTGTGTTTCCTTGTGAGCTACTGCATAAGTTAGGAAATTGAAATACAGAAAGATGAAAAGTGATTTGCCCAAGC ATATAGATCAAAGCTGTGGCAGAACCAGGACTGGAACCTATATCTCTCTACTAATGGTTTTTTTAAAAAAATAACCT TGTTTCAAAAATATTAAAAAGTCACAAGAAAGGTAAACATGTGGATAAACAAAATGAAGAAAATAAAAATTATCCAG TAAAAAAAAAAAAACCTATAGTGAGTCGTATTAATTCGGATCCGC3'
具體實施例方式為了方便,本說明書中提及的參考文獻(xiàn)以文獻(xiàn)列表的形式列出并且附于實施例的 后面。這些參考文獻(xiàn)的全部內(nèi)容在本申請中通過援引而并入。在本發(fā)明中,作者使用比較基因組雜交(a-CGH) (Agilent technologies)這一全 新的方法識別了癌癥(特別是乳腺癌)的分子生物標(biāo)志物,所述a-CGH是基于高分辨率寡 核苷酸陣列的方法。在CGH技術(shù)中,差異標(biāo)記的腫瘤(或待測)和參照DNA與正常人分裂 中期染色體雜交,隨后通過分析沿染色體全長的測試DNA和參照DNA的熒光強度差異來鑒 定增加、缺失和擴(kuò)增的區(qū)域?;诟呙芏裙押塑账岬腶-CGH不要求直接的染色體分析、構(gòu)建 基因組或eDNA文庫。基于這個方法,發(fā)明者分離和鑒定了涉及11個基因的7個新的融合 基因(表1)。表1 克隆自確認(rèn)的CNT區(qū)域的融合基因列表。融合基因基因組畸變
RCC2/CENPF擴(kuò)增/易位
ARFGEF2/SULF2擴(kuò)增/倒位
MTAP/新基因(SEQ ID NO 2)缺失/框內(nèi)融合
ATXN7/新基因(SEQ ID NO 1)擴(kuò)增/易位
BCAS3/ATXN7擴(kuò)增/易位
RPS6KB1/TMEM49擴(kuò)增/插入
RPS6KB1/EAP30擴(kuò)增/倒位a-CGH技術(shù)以2. 7kb至23kb以及2. 7kb至4_75kb的基因組區(qū)間分別在已知基因 和基因間區(qū)域中鑒定了許多拷貝數(shù)改變(CNT)區(qū)域。利用細(xì)胞遺傳學(xué)和分子生物學(xué)方法 的整合分子分析(包括光譜核型分析(SKY)、FISH和RACE-PCR)以及克隆方法來驗證影響 MCF7中已知基因的83個CNT位點中的48個。這一研究是該類研究中首次僅僅基于以空前 的分辨率來分析不平衡拷貝數(shù)變化而分離融合基因。在諸多商業(yè)化的基于寡核苷酸的CGH陣列中,本研究選擇了 244K陣列(Agilent Technologies),這是由于其獨特的陣列設(shè)計——在基因和基因間區(qū)域中分別提供約6. 4kb 和16. 5kb的平均分辨率。由于244K陣列的基因中心的性質(zhì),可以鑒定已知基因中2. 7kb 至23kb內(nèi)及基因間區(qū)域中4kb至75kb內(nèi)的所有CNT區(qū)域(表2)。表2 :MCF7中拷貝數(shù)改變區(qū)域列表
12 因此,本發(fā)明提供了利用CGH技術(shù)鑒定包含融合基因的CNT區(qū)域。所有在本研究 中鑒定的融合基因都是拷貝數(shù)改變(CNT)區(qū)域或者擴(kuò)增和缺失的邊界處基因中基因組擾 動的產(chǎn)物,檢測到的所述融合基因的大小范圍為30kb至lmb,這一分辨率是通過基于染色 體的方法和其他CGH方法不能達(dá)到的。使用244K陣列對CNT區(qū)域的詳細(xì)分析揭示出對已 知基因中重排的精確鑒定。通過FISH和RACE-PCR方法對CNT區(qū)域的進(jìn)一步表征鑒定了上 面表1中所列的新的融合轉(zhuǎn)錄體。因此,本發(fā)明提供了一種分離的融合基因,所述融合基因包含至少一個第一基因 和/或其片段,其與至少一個第二基因和/或其片段融合,其中,至少所述第一和/或所述 第二基因獨立地選自下列基因組成的組RCC2、CENPF、ARFGEF2、SULF2、MTAP、ATXN7、BCAS3、 RPS6KB1、TMEM49、EAP30、具有SEQ ID NO :1的核苷酸序列的基因、和具有SEQ ID N0:2的核 酸的基因,或其片段。所述第一和第二基因獨立地可選自下列基因組成的組RCC2、CENPF、 ARFGEF2、SULF2、MTAP, ATXN7、BCAS3、RPS6KB 1、TMEM49、EAP30、具有 SEQ ID NO 1 的核苷 酸序列的基因和具有SEQ ID NO :2的核酸的基因,或其片段。根據(jù)本發(fā)明的一個特定的方 面,所述第一基因和所述第二基因可在融合基因中位置顛倒。根據(jù)一個特定的方面,所述第 一基因可選自下列基因組成的組RCC2、ARFGEF2、MTAP, ATXN7、BCAS3和RPS6KB1,或其片 段。根據(jù)一個特定的方面,所述第二基因可選自下列基因組成的組CENPF、SULF2、具有核 苷酸序列SEQ ID NO 1的基因、具有SEQ ID NO 2的核苷酸序列的基因、ATXN7、TMEM49和 EAP30,或其片段。根據(jù)一個或多個實施例,所述第一和/或所述第二基因是ATXN7。根據(jù) 另一個實施例,所述第一和/或所述第二基因是ARFGEF2。根據(jù)另一個實施例,所述第一和/或所述第二基因是SULF2。所述第一和/或第二基因可以是RPS6KB1。根據(jù)另一個實施 例,所述第一和/或第二基因是包含核苷酸序列SEQ ID NO 1或SEQ ID NO 2或其片段的 基因。基因的融合是指基因組易位、插入、倒位、擴(kuò)增和/或缺失。本申請中使用的“融合基因”指由兩個以前分開的基因形成的雜交基因并以此導(dǎo) 致基因重排?;蛘?,所述分開的基因可在彼此融合前獨立地經(jīng)歷重排。因此,可據(jù)此解釋 “融合基因”,以指任何此類重排事件。突變(諸如易位、缺失、倒位、擴(kuò)增和/或插入)可導(dǎo) 致融合基因的產(chǎn)生?;颉耙孜弧睂?dǎo)致非同源染色體間部分重排引起的染色體異常。其在細(xì)胞遺傳學(xué) 或受影響細(xì)胞的染色體核型分析中被檢測到。染色體中的“缺失”可能是整個基因或者僅 基因的一部分。遺傳的“插入”是在遺傳序列中增加一個或多個核苷酸堿基對。這由于DNA 聚合酶的滑動常發(fā)生在微衛(wèi)星區(qū)域。“倒位”是染色體上基因順序重排,其中基因的一段首 尾翻轉(zhuǎn)?!皵U(kuò)增”的結(jié)果是DNA被擴(kuò)增,拷貝數(shù)目從而增加。融合基因可選自下列的融合基因的組RCC2/CENPF、ARFGEF2/SULF2、MTAP/包含 核苷酸序列SEQ ID NO 2的基因、ATXN7/包含核苷酸序列SEQ IDNO 1的基因、BCAS3/ ATXN7、RPS6KB1/TMEM49和RPS6KB1/EAP30,或其片段。特別地,融合基因可以是包含SEQ ID NO 16的核酸序列的ARFGEF2/SULF2融合基因和/或其片段。更特別地,融合基因可以是 包含SEQID NO 17的核酸序列的RPS6KB1/TMEM49融合基因,和/或其片段。所述融合基因 還可以是包含SEQ ID NO 18的核酸序列的ATXN7/具有核苷酸序列SEQ ID NO :1的基因 融合,和/或其片段。所述融合基因可以是包含SEQ IDN0:19的核酸序列的ATXN7/BCAS3 融合基因和/或其片段。所述融合基因還可以是MTAP/具有核苷酸序列SEQ ID NO :2的基 因,該融合基因包含SEQ IDNO 20的核酸序列和/或其片段。融合的基因以基因“X” /基因“y”的形式寫在一起。因此,貫穿本申請,所述的融 合的基因的表示均參照這種形式。融合的基因可在任何包含所述融合基因的適合的載體、噬菌體、質(zhì)粒、或片段中。 對于核酸構(gòu)建體和融合基因的大小沒有限制。還提供了包含核苷酸序列SEQ ID NO :1和/或SEQ ID NO 2的分離的核酸分子, 或其片段。分離的核酸可包含在載體中。所述載體可以是任何包含SEQID N0:1和/或SEQ ID NO :2的核酸分子的適合的載體、噬菌體、質(zhì)粒、或核酸片段。對于核酸構(gòu)建體和核酸分 子的大小沒有限制。根據(jù)本發(fā)明的另一個方面,提供了一種診斷和/或預(yù)后試劑盒,其用于在受試者 中診斷和/或預(yù)后腫瘤,所述診斷和/或預(yù)后腫瘤包括檢測至少一個融合基因,其中,所述 融合基因的存在用于指示腫瘤的存在和/或病期。還提供了一種診斷和/或預(yù)后試劑盒,其中,所述試劑盒包含至少一種能夠與所 述融合基因和/或其片段雜交和/或互補的核酸分子,其中,雜交指示腫瘤的存在和/或病期。本發(fā)明還提供一種診斷和/或預(yù)后試劑盒,其用于在受試者中腫瘤的診斷和/或 預(yù)后腫瘤,其中,所述試劑盒包含一個或多個片段,所述片段代表能夠與從至少一個受試者 的腫瘤組織和對照組織中分離的差異性標(biāo)記的基因組DNA雜交的基因組,其中,與對照組 織相比,腫瘤組織中雜交強度和/或標(biāo)記信號的增加或者減少檢測腫瘤組織中的拷貝數(shù)改
16變(CNT)區(qū)域,其指示腫瘤的存在和/或病期。所述CNT區(qū)域可包含融合基因。本申請中使用的“診斷”或“確診”指確定病況(疾病)的性質(zhì)或特性。確診多半 伴隨關(guān)于疾病嚴(yán)重性的確定。本申請中使用的“預(yù)后的”或“預(yù)后”指預(yù)測疾病的結(jié)果或確 診(例如,基于觀察和臨床測試結(jié)果給出存活的幾率)。本申請中使用的“傾向”指被診斷 為具有特定疾病的可能性,或?qū)μ囟膊〉囊赘行浴!翱截悢?shù)改變(CNT)區(qū)”指由上文所述的缺失、插入、倒位、擴(kuò)增引起的基因組擾動 的邊界,這導(dǎo)致了其中存在的基因的拷貝數(shù)目變異。本發(fā)明是基于分析這些拷貝數(shù)改變而 分離融合基因的首次研究。本發(fā)明使用了 CGH技術(shù)來鑒定已知基因中的CNT區(qū)域。本發(fā)明 中使用的“CGH或比較基因組雜交”方法分析DNA含量中的拷貝數(shù)變化(增加/缺失)。此 方法是本領(lǐng)域技術(shù)人員所熟知的。CGH能夠在染色體水平檢測拷貝數(shù)的缺失、增加和擴(kuò)增。 使用陣列CGH克服了 CGH的局限,不僅提高了分辨率和動態(tài)范圍,而且直接將畸變定位在基 因組序列上,同時實現(xiàn)了高通量分析。從腫瘤組織和對照組織中分離DNA可通過本領(lǐng)域已 知的標(biāo)準(zhǔn)方法實現(xiàn)。對DNA進(jìn)行標(biāo)記也是本領(lǐng)域的公知技術(shù)。CNT區(qū)域中包含的融合基因 可通過FISH和/或RACE技術(shù)檢測。融合基因可以是前文所述的任一融合基因。“核酸”是本領(lǐng)域公知的的術(shù)語,通常用來指DNA、RNA或包含核苷堿基的它們的衍 生物或類似物分子(單鏈或多鏈)。例如,核苷堿基包括,DNA(例如,腺嘌呤“A”、鳥嘌呤 “G”、胸腺嘧啶“T”或胞嘧啶“C”)或RNA(例如,A、G、尿嘧啶“U”或C)中發(fā)現(xiàn)的嘌呤或嘧 啶堿基。術(shù)語核酸包含術(shù)語“寡核苷酸”和“多核苷酸”,均是術(shù)語“核酸”的亞屬。在核酸 的語境中,術(shù)語“互補的”指一條核酸鏈非共價附著于另一條鏈的核酸鏈,其中,兩條鏈的互 補性由堿基的互補性決定。例如,一條鏈上的堿基A與另一條鏈上的堿基T或U配對,且一 條鏈上的堿基G與另一條鏈上的堿基C配對。當(dāng)在需要特異性結(jié)合的條件下,所述寡核苷 酸或類似物應(yīng)當(dāng)有“牢固的互補性”,即有足夠程度的互補性而避免寡核苷酸或類似物與非 靶序列非特異性結(jié)合。在合適的溫度和溶液離子強度的條件下,單鏈形式的核酸分子能夠與另一核 酸分子一起退火,則該核酸分子與另一核酸分子(如本發(fā)明中的miR183)是“可雜交 的”(Sambrook和Russell,2001)。溫度和溶液離子強度決定雜交的嚴(yán)緊度。雜交要求所述 兩個核酸包含互補的序列。雜交的嚴(yán)緊程度決定了堿基間的是否會錯配。核酸雜交合適的 嚴(yán)緊度取決于核酸的長度和互補的程度,這些是本領(lǐng)域公知的變量。兩個核苷酸序列之間 的相似性或同源性程度越高,用于具有這些序列的核酸雜交的Tm值越大。核酸雜交的相對 穩(wěn)定性(對應(yīng)于較高的Tm)依下列順序減少RNA :RNA, DNA :RNA,DNA :DNA。對于長度超過 100個核苷酸的雜交體,Tm可根據(jù)公式計算(Sambrook和Russell,2001)。對于具有較短 核酸(即寡核苷酸)的雜交而言,錯配的位置更為重要,同時寡核苷酸的長度決定其特異性 (Sambrook和 Russell,2001)。DNA可從腫瘤組織中分離。所述腫瘤是III期腫瘤,其中,所述腫瘤是實體腫瘤。 特別地,所述腫瘤可以是乳腺腫瘤。所述腫瘤組織可來自患有所述腫瘤的受試者?!笆茉囌摺笨梢允腔加兴瞿[瘤,特別是實體腫瘤(例如,乳腺腫瘤)的患者。本領(lǐng) 域技術(shù)人員將知道如何基于受試者對特定治療的適應(yīng)性或他們對特定疾病的易感性選擇 受試者。
“對照”例,不能患有腫瘤。所述對照可顯示來自被標(biāo)記的DNA的對照水平的標(biāo)記 強度和/或信號?!皩φ罩怠币部梢允亲运x群體表達(dá)的平均值。腫瘤的病期是癌癥擴(kuò)散程度的描述符號(通常為數(shù)字I至IV)。所述時期通???慮到腫瘤的大小、其穿透的深度、其是否侵襲了鄰近的器官、其是否轉(zhuǎn)移至淋巴結(jié)及轉(zhuǎn)移到 多少個淋巴結(jié)、以及其是否擴(kuò)散到遠(yuǎn)處的器官。癌癥的分期是非常重要的,因為確診的病期 是存活的最有力的預(yù)測值,且治療通?;谒霾∑诙兓?。正確分期是關(guān)鍵所在,因為治 療與疾病病期直接相關(guān)。因此,不正確的分期可能導(dǎo)致不適當(dāng)?shù)闹委?,以及患者存活度的?質(zhì)性減少。然而,正確的分期往往是難以判斷的。分期系統(tǒng)對于每種類型的癌癥(例如乳 腺癌)都是特定的。綜合時期分組也被稱為羅馬數(shù)字分期。這一系統(tǒng)使用數(shù)字I,II,III,和IV(加上 0)來描述癌癥的發(fā)展。0期癌癥是原位癌。I期腫瘤只局限于身體一部分。II期腫瘤是局 部晚期,III期腫瘤同樣也是。癌癥被稱為II期或III期可取決于癌癥的特定類型,例如 在霍奇金病(Hodgkin' s disease)中,II期表示僅在橫膈膜的一側(cè)侵入淋巴結(jié),而III期 表示在橫膈膜上側(cè)和下側(cè)侵入淋巴結(jié)。因此,對于II期和III期的判斷標(biāo)準(zhǔn)根據(jù)生物特征 而不同。IV期癌癥通常已轉(zhuǎn)移或擴(kuò)散到其它器官或整個身體。根據(jù)另一個方面,本發(fā)明提供了一種診斷和/或預(yù)后腫瘤的存在和/或病期方法, 其用于在受試者中診斷和/或預(yù)后腫瘤的的存在和/或病期,所述方法包括檢測至少一種 融合基因,其中,所述融合基因的存在指示腫瘤的存在和/或病期。所述方法可包括提供至少一種能夠與所述融合基因和/或其片段雜交和/或互補 的核酸分子,其中,雜交指示腫瘤的存在和/或病期。根據(jù)另一方面,提供了一種診斷和/或預(yù)后腫瘤的存在和/或病期的方法,其用于 受試者中診斷和/或預(yù)后腫瘤的存在和/或病期,其中,所述方法包括提供一個或多個片 段,所述片段代表能夠與從至少一個受試者的腫瘤組織和對照組織中分離的差異性標(biāo)記的 基因組DNA雜交的基因組,其中,與對照組織相比,腫瘤組織中雜交強度和/或標(biāo)記信號的 增加或者減少用以檢測腫瘤組織中的拷貝數(shù)改變(CNT)區(qū)域,其指示腫瘤的存在和/或病 期。特別地,所述CNT區(qū)域包含融合基因。所述融合基因可通過FISH和/或RACE技術(shù)檢 測。所述診斷和/或預(yù)后方法可用于III期腫瘤,特別是實體腫瘤。特別地,所述腫瘤 可為乳腺腫瘤。進(jìn)一步提供了一種試劑盒,其用于檢測融合基因的存在,其中,所述試劑盒包含一 個或多個片段,所述片段代表能夠與差異性標(biāo)記的對照和測試基因組DNA雜交的基因組, 其中,與對照基因組相比,測試基因組的雜交強度和/或信號的增加或者減少用以檢測測 試基因組中的拷貝數(shù)改變(CNT)區(qū)域,其中,所述CNT區(qū)域包含融合基因。根據(jù)又一方面,本發(fā)明提供了一種檢測融合基因存在的方法,其中,所述方法包括 提供一個或多個片段,所述片段代表能夠與差異性標(biāo)記的對照和測試基因組DNA雜交的基 因組,其中,與對照基因組相比,測試基因組的雜交強度和/或信號的增加或減少用以檢測 測試基因組中的拷貝數(shù)改變(CNT)區(qū)域,其中,所述CNT區(qū)域包含融合基因。本申請中使用的“測試基因組DNA ”指欲與對照DNA相比較的被標(biāo)記的基因組DNA。 所述測試基因組DNA與從受試者腫瘤組織中分離的DNA被理解為具有相同的含義。
18
現(xiàn)已對本發(fā)明作出一般性描述,為使本發(fā)明更容易理解,同樣的內(nèi)容將通過參考 下面的實施例進(jìn)一步闡述,此處描述的實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。實施例本領(lǐng)域已知且未特別描述的標(biāo)準(zhǔn)分子生物學(xué)技術(shù)通常是依照Sambrook和 Russel, Molecular Cloning :A Laboratory Manual, Cold Springs Harbor Laboratory, New York (2001)中的描述。陣列比較基因組雜交(a-CGH)基于寡核苷酸的陣列比較基因組雜交是為了高精度定位不平衡拷貝數(shù)變化而設(shè) 計的新興技術(shù)(Barrett等,2004)?;诜至阎衅谌旧w的CGH、cDNA陣列CGH和BAC克隆 陣列CGH的具有較低的分辨率,其只能檢測出大于IOOkb至幾兆堿基的大的基因組距離中 的拷貝數(shù)變化的界限。來自Affymetrix的具有高密度探針的SNP陣列可被用于拷貝數(shù)分 析,但是所述探針大多是選自基因間區(qū)域的,而需要進(jìn)一步的驗證研究以定位基因中的斷 點。本研究中使用了來自Agilent Technologies, USA的最近引進(jìn)的寡核苷酸CGH陣列版 本(244K陣列),其含有244,000個探針,提供了基因組約6. 4kb至16. 5kb的平均分辨率, 以及基因中甚至更高的分辨率(<3-10kb)。陣列的特征主要包括來自公知的且與癌癥相 關(guān)的基因探針,其中很少數(shù)量的探針來自基因間區(qū)域。由于此方法的獨特設(shè)計和可重復(fù)性, 以顯著的特異性獲得了基因組重排和拷貝數(shù)變化的高精度定位。雖然此方法是商業(yè)資源利 用和發(fā)展,但是它允許我們針對目的基因組區(qū)域選擇甚至更高密度的探針而進(jìn)行用戶定制 設(shè)計,從而允許我們設(shè)計自己的陣列,以達(dá)到對于給定區(qū)域小于Ikb范圍的分辨率。鑒定拷貝數(shù)改變區(qū)域(CNT)寡核苷酸比較基因組雜交是在全基因組水平上檢測不平衡拷貝數(shù)變化的高 分辨方法。差異標(biāo)記的腫瘤DNA和參照DNA與以陣列形式印出的寡核苷酸(Agilent Technologies,USA)的競爭雜交,通過對每個探針的熒光強度的分析,檢測腫瘤樣本相對于 正常參照基因組的拷貝數(shù)變化(圖1)。使用這一方法,本發(fā)明的當(dāng)前的發(fā)明人鑒定了全染 色體增加、缺失,以及更重要地,鑒定了許多在亞顯微水平(< 30kb范圍)的增加和缺失的 區(qū)域。起初,測試了對于MCF7的寡核苷酸陣列的三種不同的陣列設(shè)計(43K、185K和244K)。 244K陣列對基因和基因間區(qū)域分別提供了 6. 5kb和16. 5kb的平均分辨率,因此以前所未有 的分辨率定位了拷貝數(shù)改變(CNT)區(qū)域。CNT區(qū)域是基于拷貝數(shù)的變化,其包括選擇側(cè)翼 區(qū)域至少兩個或更多探針篩選至少一個拷貝的缺失或增加。比較不同的陣列設(shè)計,分別在 44KU85K和244K陣列中的49. 8kb、16. 3kb和6. 3kb內(nèi)檢測出ARFGEF2基因中的CNT區(qū)域 (圖 2)。檢測不平衡染色體變化的高分辨率方法基于在244K陣列中檢測的最佳分辨率,分析了含有眾多不平衡的結(jié)構(gòu)畸變和數(shù) 量畸變的MCF7細(xì)胞系(圖3)。從CNT區(qū)域中分離融合基因的策略(圖4)·在基因中選擇CNT區(qū)域·通過熒光原位雜交證實基因組重排·鑒定CNT區(qū)域的基因組區(qū)間·由在至少一個拷貝中存在的區(qū)域設(shè)計引物
19
·避開純合性缺失中涉及的區(qū)域·由鄰近CNT區(qū)域的外顯子設(shè)計引物·根據(jù)基因的方向決定5’或3’ RACE 克隆PCR產(chǎn)物并測序·使用來自已知基因和新基因的引物通過RT PCR證實RACE PCR結(jié)果使用上述策略,當(dāng)前的發(fā)明人驗證了 MCF7細(xì)胞系中含有CNT區(qū)域的48個基因并 分離了在下述部分中描述的七個新的融合基因?;? 在 1 (q41)重排的 RCC2/CENPF(SEQ ID NO 15)^m^mmm^^.mm^MAm CENPF 某因鑒定了 CENPF基因中的CNT區(qū)域,其具有5,211190840和3,211201667間 的10,827bp的基因組區(qū)間,并含有外顯子9、10和11。所述基因的5’端存在于至少 一個拷貝中,且3’區(qū)域擴(kuò)增至至少三個拷貝。使用BAC克隆(RP11-281J12,3’端和 RP11-370I5,5,端)的FISH分析證實了在至少三個位置上而不是在同一染色體上連續(xù) 重復(fù)的CENPF重排。光譜染色體核型分析揭示了一個拷貝的正常染色體1和與染色體X 重排的第二個拷貝,還有插入至少五個不同位置的染色體1的小片段(圖5)。通過FISH 分析進(jìn)一步證實重排,根據(jù)外顯子6(5,GTGTTCTCATGGCAGCAAGA 3,)(SEQ ID NO 3)和 11 (CTGTTTGATGTTCTTGAGTTCTGC3' ) (SEQ ID NO 4)設(shè)計引物,同時對雌二醇(E2)處理的 MCF7和未處理的細(xì)胞的總RNA分別進(jìn)行了 3’和5’ RACE。因為基因表達(dá)分析用E2處理后 僅在24小時顯示CENPF基因的表達(dá),所以我們選擇了 E2細(xì)胞的RNA。3’ RACE的PCR結(jié)果 顯示陰性,證實沒有正常的CENPF轉(zhuǎn)錄物,這與a-CGH數(shù)據(jù)是一致的,其顯示的所述基因5’ 端至少兩個拷貝的缺失。5’RACE PCR僅在以E2處理的細(xì)胞的RNA中擴(kuò)增了 270bp的產(chǎn)物, 這與基因表達(dá)數(shù)據(jù)一致(圖 6B)。使用來自 RCC2(5,TGCGTTTGCTGGCTTTGAT3,) (SEQ IDNO 5)和 CENPF 外顯子 115,(CTGTTTGATGT TCTTGAGTTCTGC3,) (SEQID NO 4)的引物,通過 RT PCR 證實了 5,RACE PCR 結(jié)果。使用TA克隆試劑盒(Invitrogen,USA)將所述PCR產(chǎn)物克隆至質(zhì)粒載體,同時序 列分析顯示了外顯子9中的斷點和與RCC2基因5’端匹配的46bp的上游序列。奇怪的是所 述46bp的RCC2序列經(jīng)過BLAST搜索僅與GENBANK中的mRNA序列匹配,而不與RCC2的基 因組序列匹配。針對證實RCC2與CENPF融合的FISH驗證是陰性的。對于始于CENPF外顯 子9中斷點的序列以及其余3’端序列的進(jìn)一步分析證實了一個完美的開放閱讀框(ORF), 其始于外顯子9中ATG序列直接上游的斷點。雖然兩種RNA中的3’RACE PCR都是陰性的, 但是我們使用來自CENPF的外顯子7和11的引物進(jìn)行了 RT PCR證實沒有正常轉(zhuǎn)錄物,這 意味著僅表達(dá)截短形式的CENPF。對來自細(xì)胞系和原發(fā)乳腺癌腫瘤的RNA,通過RTPCR的進(jìn) 一步證實T47D細(xì)胞株(E2處理后72小時)、和正常條件下的MDAMB436 (圖7)、以及約50% (17/35)原發(fā)乳腺癌腫瘤(圖8)中的出現(xiàn)擴(kuò)增。發(fā)明人還使用來自外顯子7和11的引物, 鑒定了所有原發(fā)腫瘤樣本中正常CENPF轉(zhuǎn)錄物的存在,并發(fā)現(xiàn)35種腫瘤中僅12種呈陽性, 這表示在大多數(shù)腫瘤中僅表達(dá)截短形式的CENPF。對于其它腫瘤中的進(jìn)一步驗證仍在進(jìn)展 中(圖9)。上述結(jié)果為從CNT區(qū)域中分離重排的基因提供證據(jù),而沒有任何來自常規(guī)染色體 核型分析的直接證據(jù)。此外,所述結(jié)果顯示CENPF的表達(dá)受E2調(diào)控且在大多數(shù)乳腺癌腫瘤中,CENPF以截短的形式表達(dá)。上述結(jié)果還顯示細(xì)胞分裂中CENPF在著絲粒動粒組裝中的 作用。重要地,本發(fā)明提出在3級原發(fā)乳腺癌腫瘤看到了截短的CENPF的高水平表達(dá)且異 常的CENPF蛋白質(zhì)可能是有絲分裂中導(dǎo)致非整倍性的異常染色體分離的引發(fā)因素。從乳腺癌中共同擴(kuò)增區(qū)分離融合基因乳腺癌中擴(kuò)增的表征不同乳腺癌腫瘤之間大多數(shù)染色體的隨機(jī)重排可能不會產(chǎn)生特定反復(fù)的染色體 畸變,可是已證明在20-39%的具有不同臨床結(jié)果的原發(fā)乳腺癌中,17q23和20ql3區(qū)域被 反復(fù)擴(kuò)增。對這兩個擴(kuò)增子的深入表征揭示了許多CNT區(qū)域,其影響在乳腺癌中過表達(dá)的 基因,但是它們中除了 BCAS4和BCAS3,都沒有被鑒定為融合基因(Barlund等,2002)。采用 當(dāng)前發(fā)明人的新方法,利用所述擴(kuò)增子中的CNT分離了三個新的融合基因。在MCF7中,整個 基因組存在從3個拷貝到超過40個拷貝的許多擴(kuò)增的區(qū)域,特別在17q23和20ql3區(qū)域。 20%原發(fā)乳腺腫瘤中記載了 17q23的擴(kuò)增,包括RPS6KB1,MUL,APPBP2,和TRAP240的許多 基因也都是過表達(dá)的。同樣,12-39%的原發(fā)乳腺腫瘤中記載了 20ql3擴(kuò)增中的基因AIB1, ZNF217, BTAK,禾口 NABCl 過表達(dá)(Kallioniemi 等,1994,Muleris,等,1994)。20ql3 的高水 平擴(kuò)增可能是結(jié)陰性乳腺癌中不良臨床結(jié)果的指示。所述17q23擴(kuò)增子揭示了可能具有致 癌潛力同時也可能在乳腺癌患者中更激進(jìn)的臨床過程做出貢獻(xiàn)的基因。此擴(kuò)增子中的所有 基因表達(dá)水平的變化以及PRKCBP1基因的不同探針中發(fā)現(xiàn)的表達(dá)的進(jìn)一步變化,都表明擴(kuò) 增子中另外的重排沒有表現(xiàn)出明顯的CNT。與傳統(tǒng)的解釋相反,這些結(jié)果表明了擴(kuò)增子是重 排的豐富來源,而且在擴(kuò)增的區(qū)域中鑒定出新的融合基因的幾率要大一些。在下面的部分 中,詳細(xì)描述了對擴(kuò)增子中所有基因的進(jìn)一步詳細(xì)分析。當(dāng)前的發(fā)明人還試圖了解MCF7中所述擴(kuò)增的區(qū)域的基因組構(gòu)成,為此我們使用 BAC克隆對17q23處擴(kuò)增區(qū)域內(nèi)的BRIP1(RP11-482H10)基因進(jìn)行FISH分析。FISH結(jié)果表 明擴(kuò)增的序列插入在基因組內(nèi)的許多位置上(圖10),證實了重排的疊加復(fù)雜性。不同位置 處擴(kuò)增信號的信號強度的不平均分布表示進(jìn)一步的重排。此類隱蔽重排即使使用高分辨率 陣列CGH也不能檢測到?;? :ARFGEF2/SULF2 (SEQ ID NO 16) inv (20ql3. 13)分離通過擴(kuò)增子內(nèi)的倒位產(chǎn)牛的融合基因在基因中已鑒定的83個CNT區(qū)域中,選擇了來自乳腺癌中共同擴(kuò)增區(qū)的基因。在 20-39%的原發(fā)乳腺癌中已證明20ql3處的擴(kuò)增與激進(jìn)的臨床表現(xiàn)相關(guān)。20ql3處的IOmb 區(qū)域的非相鄰擴(kuò)增鑒定了影響基因EYA2,ARFGEF2, SLC9A8, BCAS4, ZNF217和D0K5的九個 CNT區(qū)域,以及三個在基因間區(qū)域(圖11A)。在我們對其它CNT區(qū)域的進(jìn)一步驗證中,當(dāng)前 發(fā)明者發(fā)現(xiàn)位于46972419和46978778bp之間具有6,359bp基因組區(qū)間的其中一個CNT鑒 定了一個在ARFGEF2基因的內(nèi)含子1中的重排。外顯子1的3’ RACE擴(kuò)增出含有與SULF2 的第三外顯子融合的ARFGEF2的第一外顯子的2. 7kb的片段(圖11C),其位于ARFGEF2上 游大約1. Imb處。ARFGEF2和SULF2基因分別在正鏈和負(fù)鏈上的基因結(jié)構(gòu)表明了導(dǎo)致融 合基因的形成的1. Imb中的倒位事件(圖11B)。本研究進(jìn)一步指出擴(kuò)增區(qū)域內(nèi)可能影響 擴(kuò)增子內(nèi)的其它基因的許多此類亞顯微重排。使用BAC克隆RP11-644F19(ARFGEF2)和 RP11-1133B15 (SULF2)的FISH分析,構(gòu)成了證實ARFGEF2和SULF2基因融合的共定位信號 (圖12)。這是第一個通過對擴(kuò)增子的高分辨分析從CNT區(qū)域中分離新的融合基因的報導(dǎo)。 擴(kuò)增子內(nèi)復(fù)雜的重排表明沒有一個確切的CNT,擴(kuò)增子內(nèi)的其它基因也可能經(jīng)歷重排并可能產(chǎn)生融合基因。乳腺癌中ARFGEF2/SULF2基因的反復(fù)融合證實MCF7中的ARFGEF2/SULF2融合基因之后,當(dāng)前的發(fā)明人進(jìn)而將我們的分析 擴(kuò)展至評估原發(fā)乳腺癌腫瘤和乳腺癌細(xì)胞系中的發(fā)生率。使用下列來自ARFGEF2外顯 子 1(5' TAGCCGACAAGGTGAAG 3' ) (SEQ ID NO :6)的引物和來自 SULF2 基因的外顯子 6 的反向引物(5 ‘ GTGTAGCGCATGATCCAGTG 3' ) (SEQ ID NO 7)的 RT PCR 分析顯示在 17/35(49% )的原發(fā)腫瘤中(圖13)存在融合基因,但11個細(xì)胞系都不是陽性的。在經(jīng) 由RT PCR為陽性的17例中,11例顯示對應(yīng)于MCF7中擴(kuò)增的大小的帶;三例在第一條帶之 外,還顯示小的第二條帶;及三例僅顯示所述的小帶。序列分析在所有實例中證實了融合, 且所述第二條小帶是含有除外顯子5外的SULF2基因的所有外顯子的變體融合基因(圖 14B)。此結(jié)果表明使用低分辨率的CGH方法得到了擴(kuò)增子的高分辨率視圖。本研究還鑒定 了產(chǎn)生不同CNT區(qū)域的相鄰基因組擴(kuò)增并表明分段擴(kuò)增產(chǎn)生許多影響已知基因的CNT。由 于擴(kuò)增的區(qū)域是基因組重排的豐富來源,因此它們具有產(chǎn)生新的融合基因的能力。此外,由 于ARFGEF2是在大量乳腺癌腫瘤中發(fā)現(xiàn)的反復(fù)出現(xiàn)的融合基因,表明它可以作為此類癌癥 的新的分子標(biāo)志物。RPS6KB1基因的反復(fù)混雜重排基因3 :RPS6KB1/TMEM49(SEQ ID NO 17) ins (17) (q23. 2)躺囊禾口搬一輸混鐘絲_隨著從20ql3擴(kuò)增子中成功地克隆融合基因,當(dāng)前的發(fā)明者將我們的分析擴(kuò)展至 17q23處約3. 3mb的非相鄰擴(kuò)增,其含有影響TEX14,F(xiàn)AM33A, DHX40, TMEM49, INTS2基因的 七個CNT區(qū)域,以及影響B(tài)CAS3基因的兩個CNT區(qū)域(圖16,A)。在此擴(kuò)增子內(nèi)鑒定和分 離了 三個融合基因 BCAS4/BCAS3,BCAS3/ATXN7(SEQ ID NO :19),和 RPS6Kbl/TMEM49 (SEQ ID NO 17)。基因RPS6Kbl和TMEM49在所述3. 3mb擴(kuò)增子內(nèi)17q23處相距52kb。在TMEM49的 3,端鑒定的CNT區(qū)域始于5,55260272至552628993,,其具有2627bp的基因組區(qū)間。對于 所有MCF7內(nèi)基因中的CNT區(qū)域,這是在TMEM49中鑒定出的最小的基因組區(qū)間。雖然基因 RPS6Kb 1不含有CNT區(qū)域,但是如FISH分析所證實的,它在分布于MCF7基因組內(nèi)許多位置 的高度擴(kuò)增區(qū)域中(圖15)?;谶@一觀察,通過配對端點雙標(biāo)記方法(Rimn等,2007)對 MCF7轉(zhuǎn)錄體組的分析顯示出TagO簇,其5’標(biāo)記對應(yīng)于RPS6KB1且3’標(biāo)記對應(yīng)于TMEM49。 起初我們使用 RPS6KB1 正向引物(5,GCTGAAC TTTAGGAGCCAG3,) (SEQ ID NO 8)和 TMEM49 反向引物(5,TTTTCCTCCCAAGCAAAACA3,) (SEQ ID NO 9)進(jìn)行 RT PCR 分析,擴(kuò)增出 1. 2kb 的PCR產(chǎn)物。序列分析證實了 RPS6KbBl的前四個外顯子與TMEM49的最后一個外顯子的 融合。GIS的克隆和測序組獨立地驗證了這一觀察并已在最近的出版物中報導(dǎo)(Ruan等, 2007)。我們進(jìn)一步使用來自RPS6KB1的第一個外顯子(圖16,B)的引物通過3,RACE PCR 證實了這一發(fā)現(xiàn),所述3’ RACE PCR擴(kuò)增了類似大小的產(chǎn)物。當(dāng)前的發(fā)明人將所述驗證研 究擴(kuò)展到評估此融合基因的發(fā)生率并在11個乳腺癌細(xì)胞系和35種原發(fā)乳腺癌腫瘤中進(jìn)行 了 RT PCR篩選。在所有的樣本中都擴(kuò)增出了對應(yīng)于正常轉(zhuǎn)錄體的PCR產(chǎn)物,但是沒有樣 本對于RPS6Kbl/TMEM49融合基因是陽性的。RPS6KB1重排沒有明顯的CNT,同時通過FISH 顯示在多個位置存在RPS6KB1序列,表明了擴(kuò)增子中的基因經(jīng)歷重排而形成融合基因,但 是在所有的樣本中并不是必然與相同的伙伴基因形成融合基因。為了證實RPS6Kbl的混雜重排的可能性,通過3,RACE PCR而不是RT PCR進(jìn)行了對RPS6KB1基因的進(jìn)一步評估。鑒 定出RPS6KB1基因中一個新的斷點與除TMEM49之外的一個伙伴基因融合。BLAST分析中 RPS6Kbl的前四個外顯子與TMEM49的最后一個外顯子的序列比對代表RPS6Kbl/TMEM49融 合基因(SEQ ID NO 17)的比對。RPS6KB1基因的激酶結(jié)構(gòu)域在融合基因中被部分保留并且融合轉(zhuǎn)錄體中未包含 TMEM49的編碼序列。由于貼近處mir-21的存在,這一易位可以以過表達(dá)mir 21被靶向。 由蛋白激酶活化mir-21是未來研究的新途徑,因為已知大多數(shù)microRNA基因位于癌癥中 經(jīng)常重排的染色體斷點處。同樣需要著重說明的是mircoRNA (mir-21)位于距TMEM49基因 最后一個未翻譯外顯子向端粒端245bp處及RPS6KB1第一個外顯子上游51745bp處。已有 Mir-21在乳腺癌和成膠質(zhì)細(xì)胞瘤中過表達(dá)報道。由于融合基因僅含有TMEM49的最后一個未翻譯外顯子,本研究表明除了形成 RPS6KB1/TMEM49融合基因之外,此易位以過表達(dá)mir-21被靶向。基因4 :RPS6Kbl/EAP30inv(17) (q23. 2_q21. 32)通過3’ RACE檢測的RPS6KB1的混雜重排如在前面的部分所討論的,RPS6Kbl的擴(kuò)增序列在MCF7基因組中許多位置的分布 暗示了擴(kuò)增序列中混雜重排的可能性。自RPS6KB1第一個外顯子的3’ RACE PCR揭示了在 所有的細(xì)胞系和原發(fā)乳腺腫瘤中正常RPS6KB1轉(zhuǎn)錄體的存在。在BT474細(xì)胞系中,約900bp 的第二條帶顯示了(圖17A,B)RPS6KB1的第一個外顯子與EAP30 (SNF8)基因的第二個外顯 子的融合,所述EAP30(SNF8)基因位于相反方向上游約IOmb處,這表明擴(kuò)增區(qū)域中的倒位 導(dǎo)致了類似于在20ql3處所鑒定的ARFGEF2/SULF2(SEQ ID NO 16)融合的融合。當(dāng)前的發(fā) 明人通過RT PCR和FISH分析驗證了他們的發(fā)現(xiàn),所述FISH分析使用自RPS6Kbl5,端的BAC 克隆RP11-111G18和自EAP30基因3,端的BAC克隆RP11-622D16。FISH分析證實了兩個 基因在重排的染色體上的共定位。在BT474中,擴(kuò)增的序列位于相同的染色體上(圖18)。 在擴(kuò)增區(qū)域內(nèi)通過倒位形成ARFGEF2/SULF2(SEQID NO 16)和RPS6Kbl/EAP30融合基因表 明即使沒有明顯的CNT,擴(kuò)增子內(nèi)的基因仍然進(jìn)行重排而形成新的融合基因。BLAST分析 中RPS6Kbl的第一個外顯子與EAP30的第2_9個外顯子的序列比對代表RPS6Kbl/EAP30融 合基因的比對。從基因中的兩個CNT區(qū)域中分離兩個融合基因在鑒定出含有CNT區(qū)域的83個基因中,BCAS3和ATXN7基因顯示出兩個CNT區(qū)域, 所述兩個CNT區(qū)域是由位于3’和5’端小區(qū)域的高水平擴(kuò)增和中間片段的低水平擴(kuò)增形成 的(圖 19A,B)?;? 和 6 :ATXN7/新基因 SEQ ID NO 1 (SEQ ID NO :18) t (1 ;3) (p21. 1 ;14. 1)和 BCAS3/ATXN7 (SEQ ID NO :19)t(3 ;17) (q23. 2 ;ρ21· 1)。ΑΤΧΝ7 基因位于從 63,825,273bp 至 63, 961,367bp的基因組區(qū)間的染色體3上。在MCF7中,始自5,61579369至649377253,的 3. 35mb的擴(kuò)增包括ATXN7,其中始自5,63901813至639555843,的53,771bp區(qū)域的小區(qū) 域未與ATXN7基因其余5’和3’端以相同的水平被擴(kuò)增,導(dǎo)致兩個不同CNT區(qū)域的形成,使 外顯子1-4位于5,端而外顯子11和12位于3,端。使用BAC克隆RP11-1143K18的FISH 分析顯示在基因組的多個位置插入ATXN7序列(圖20,A)。當(dāng)前的發(fā)明人使用下列引物進(jìn) 行了 3,和 5,RACE :3,RACE,來自外顯子 3 的 5 ‘ CTGAAGTGATGCTGGGACAGT3 ‘ (SEQ ID NO
2310)和來自外顯子 4 的巢式引物 5 ‘ ACAGAATTGGACGAAAGTTTCAA3 ‘ (SEQ ID NO 11);和 5,RACE,使用來自外顯子 12 的引物(5,GGTACTGCTACTGGCATTTTGAC3,) (SEQ ID NO 12)和 來自外顯子12的巢式引物5,ATTTGCTGGATTTCAATTTCTGA3,(SEQ ID NO 13)。有趣地是兩 種RACE PCR反應(yīng)擴(kuò)增出不同的PCR產(chǎn)物(圖20B)。3’RACE產(chǎn)物的序列分析鑒定出染色體 1ρ21上ATXN7與新基因(SEQ ID NO 1)的融合(圖20C)且5,RACE產(chǎn)物鑒定出ATXN7的 3,端與BCAS3基因的外顯子6在17q23. 2上的融合。使用BAC克隆RP11-1143K18 (AXTN7,) 和RP11-1081E4-BCAS35,的FISH分析證實了擴(kuò)增和融合(圖20C)。在BCAS3基因的兩個 CNT區(qū)域中,5’ CNT區(qū)域位于內(nèi)含子6內(nèi),使前6個外顯子與ATXN7融合。BCAS3的內(nèi)含子 23中發(fā)現(xiàn)的BCAS3內(nèi)的3’ CNT使最后兩個外顯子與BCAS4融合。此為前所未有的重要發(fā) 現(xiàn),在一個基因中很少發(fā)生兩個重排而導(dǎo)致兩個不同的融合基因的形成。這是首個顯示出 與不平衡拷貝數(shù)變化相關(guān)的亞顯微重排的研究。從多種癌癥類型的共同缺失區(qū)域中的CNT區(qū)域分離的新的融合基因基因7 :MTAP/新基因 SEQ ID NO :2(SEQ ID NO 20) (del (9) (p21)大的基因組缺失在各種癌癥類型中是常見的。經(jīng)FISH和其它分子方法證實的 9p21處的缺失已被報導(dǎo)在各種癌癥類型中,所述癌癥類型包括神經(jīng)膠質(zhì)瘤、間皮瘤、兒童期 癌癥、急性淋巴性細(xì)胞白血病(ALL)、肺癌和白血病。在不同的樣本中缺失區(qū)域的長度變化 很大,但是仍然已有跨越內(nèi)含子4反復(fù)出現(xiàn)的缺失邊界的報道(Batova等,1996)。盡管取決 于缺失的大小,位于所述缺失內(nèi)的基因被認(rèn)為丟失了,但是值得注意的是缺失的邊界也可 能落在形成獨特的CNT區(qū)域的已知基因中。當(dāng)前的發(fā)明人觀察到MTAP基因中的CNT位于 254kb的缺失區(qū)域中,所述缺失包括在內(nèi)含子4中開始的部分MTAP基因及⑶KN2A和⑶KN2B 基因,使MTAP基因的前4個外顯子的至少一個拷貝是完整的。我們使用來自外顯子4的引 物(5,ATCATGCCTTCAAAGGTCAACTA3,) (SEQ ID NO: 14)實施 了我們的巢式 RACE PCR 策略, 且進(jìn)行了 3’ RACE并發(fā)現(xiàn)了 728bp的融合基因的PCR產(chǎn)物,所述融合基因含有MTAP基因的 前四個外顯子和來自位于所述缺失5’端的缺失近鄰側(cè)翼區(qū)的EST序列,這意味著缺失事件 之后框架融合的形成。針對包括MTAP基因的缺失區(qū)域內(nèi)的基因所包括的所有探針的基因 表達(dá)數(shù)據(jù)顯示沒有表達(dá),因為新融合基因(SEQ ID NO 2)的所有分離均來自在各種癌癥類 型中共同缺失的區(qū)域。結(jié)論自MCF7細(xì)胞系的陣列CGH數(shù)據(jù)的分析顯示了超過100個拷貝數(shù)增加和缺失的區(qū) 域,其大小范圍從30kb至30MB。這包括具有低水平拷貝數(shù)增加、缺失和高水平擴(kuò)增(3至> 40個拷貝)的區(qū)域。除了鑒定增加和缺失的區(qū)域之外,對于拷貝數(shù)變化限界的仔細(xì)分析揭 示了已知的和癌癥相關(guān)基因中的124個斷點。在所述124個斷點中,33%的斷點發(fā)生在基 因間區(qū)域而67%被鑒定在基因的3’或5’端,這提供了在小的基因組區(qū)間內(nèi)的基因中定位 斷點的直接線索。此外,強調(diào)了基因中斷點集中度而不是基因間區(qū)域內(nèi)隨機(jī)斷裂的重要性。 這表明即使不是全部,也是大多數(shù)重排被靶向以通過異常調(diào)節(jié)或形成融合基因而影響基因 的功能。因此,本研究通過提供方法學(xué)上的手段而發(fā)現(xiàn)新的融合基因,對理解實體腫瘤基因 組中的不平衡拷貝數(shù)變化而言是觀念上的跨越。本發(fā)明使用陣列CGH技術(shù),通過分析各種癌癥類型中的不平衡拷貝數(shù)變化得以鑒 定新的融合基因,由于現(xiàn)有的基因組表征技術(shù)自身的限制,例如,BAC,cDNA和低密度嵌合陣列(tiling array),都不能提供足夠的分辨率以鑒定短的基因組區(qū)間中的拷貝數(shù)轉(zhuǎn)移。其 它的方法,包括末端序列序型分析(ESP)、代表寡核苷酸微陣列(ROMA)的能夠檢測大基因 組區(qū)間(> IOOkb)處的重排。本研究中使用的陣列設(shè)計以低至2. 7kb到最大為23kb的分 辨率鑒定了斷點間隔的起始位置(表1)。參考文獻(xiàn)1. Batova A, Diccianni MB, Nobori Τ, Vu Τ, Yu J, Bridgeman L, Yu AL. Frequent deletion in the methylthioadenosine phosphorylase gene in T—cell acutelymphoblastic leukemia strategies for enzyme-targeted therapy. Blood. 1996 0ctl5 ;88(8) :3083-90.2. Chan JA,Krichevsky AM,Kosik KS. MicroRNA-21is an an tiapoptoticfactor in human glioblastoma cells. Cancer Res. 2005Jul 15 ;65 (14) :6029_33·3. Iorio MV, Ferracin Μ, Liu CG, Veronese A, Spizzo R, Sabbioni S, Magri Ε, Pedriali Μ, Fabbri Μ, Campiglio Μ, Menard S, Palazzo JP, Rosenberg A, Musiani P, Volinia S, Nenci I, Calin GA, Querzoli P, Negrini Μ, Croce CM. MicroRNA geneexpression deregulation in human breast cancer. Cancer Res. 2005 Augl5 ; 65(16) :7065-70.4. Mitelman F, Johansson B, Mertens F. The impact of translocations and genefusions on cancer causation. Nat Rev Cancer.2007Apr ;7 (4) :233_45· Epub 2007 Mar15. Review5. Ruan Y, Ooi HS, Choo Sff, Chiu KP, Zhao XD, Srinivasan KG, Yao F, ChooCY, Liu J, Ariyarame P, Bin WG, Kuznetsov VA, Shahab A, Sung WK, Bourque G, Palanisamy N, Wei CL. Fusion transcripts and transcribed retrotransposed locidiscovered through comprehensive transcriptome analysis using Paired-End diTags(PETs). Genome Res.2007Jun ; 17 (6) :828_38·6. Sambrook and Russell ;2001. Molecular cloning :A Laboratort manual, ColdSpring Harbour Laboratory press, New York.7. Tomlins SA, Rhodes DR, Perner S, Dhanasekaran SM, Mehra R,Sun Xff, Varambally S,Cao X,Tchinda J,Kuefer R,Lee C,Montie JE,Shah RB,Pienta KJ,Rubin MA,Chinnaiyan AM. Recurrent fusion of TMPRSS2 and ETS transcriptionfactor genes in prostate cancer. Science. 20050ct 28 ;310 (5748) :644_8·
權(quán)利要求
一種分離的融合基因,所述融合基因包含至少一個第一基因和/或其片段,其與至少一個第二基因和/或其片段融合,其中,所述至少第一基因和/或第二基因獨立地選自下列基因組成的組RCC2、CENPF、ARFGEF2、SULF2、MTAP、ATXN7、BCAS3、RPS6KB1、TMEM49、EAP30、具有核苷酸序列SEQ ID NO1的基因和具有核酸SEQ ID NO2的基因,或其片段。
2.如權(quán)利要求1所述的融合基因,其中,所述第一基因選自下列基因組成的組RCC2、 ARFGEF2、MTAP, ATXN7、BCAS3 和 RPS6KB1,或其片段。
3.如前述任一項權(quán)利要求所述的融合基因,其中,所述第二基因選自下列基因組成的 組CENPF、SULF2、具有核苷酸序列SEQ ID NO=I的基因、具有核酸序列SEQ ID NO 2的基 因、ATXN7、TMEM49 和 EAP30,或其片段。
4.如前述任一項權(quán)利要求所述的融合基因,其中,所述第一和/或第二基因是ATXN7。
5.如前述任一項權(quán)利要求所述的融合基因,其中,所述第一和/或第二基因是 ARFGEF2。
6.如前述任一項權(quán)利要求所述的融合基因,其中,所述第一和/或第二基因是SULF2。
7.如前述任一項權(quán)利要求所述的融合基因,其中,所述第一和/或第二基因是 RPS6KB1。
8.如前述任一項權(quán)利要求所述的融合基因,其中,所述第一和/或第二基因是包含核 苷酸序列SEQ ID NO :1或SEQ ID NO 2的基因,或其片段。
9.如前述任一項權(quán)利要求所述的融合基因,其中,所述融合是指基因組易位、插入、倒 位、擴(kuò)增和/或缺失。
10.如前述任一項權(quán)利要求所述的融合基因,其中,所述融合基因選自下列融合基因組 成的組RCC2/CENPF、ARFGEF2/SULF2、ATXN7/包含核苷酸序列 SEQ ID NO 1 的基因、MTAP/ 包含核苷酸序列 SEQ ID NO 2 的基因、BCAS3/ATXN7,RPS6KB1/TMEM49 和 RPS6KB1/EAP30, 或其片段。
11.如前述任一項權(quán)利要求所述的融合基因,其中,所述融合基因是ARFGEF2/SULF2融 合基因,其包含核酸序列SEQ ID NO :16和/或其片段.
12.如前述任一項權(quán)利要求所述的融合基因,其中,所述融合基因是RPS6KB1/TMEM49 融合基因,其包含核酸序列SEQ ID NO 17和/或其片段。
13.如前述任一項權(quán)利要求所述的融合基因,其中,所述融合基因是ATXN7/具有核苷 酸序列SEQ ID NO 1的基因融合,其包含核酸序列SEQ IDNO :18和/或其片段。
14.如前述任一項權(quán)利要求所述的融合基因,其中,所述融合基因是ATXN7/BCAS3融合 基因,其包含核酸序列SEQ ID NO 19和/或其片段。
15.如前述任一項權(quán)利要求所述的融合基因,其中,所述融合基因是MTAP/具有核苷酸 序列SEQ ID NO 2的基因融合,其包含核酸序列SEQ ID NO 20和/或其片段。
16.一種載體,其包含如前述任一項權(quán)利要求所述的融合基因。
17.一種分離的核酸,其包含核苷酸序列SEQ ID N0:1和/或SEQ IDNO :2,或其片段。
18.—種載體,其包含如權(quán)利要求17所述的分離的核酸。
19.一種診斷和/或預(yù)后試劑盒,其用于在受試者中診斷和/或預(yù)后腫瘤,其中,所述試 劑盒包括檢測至少一種根據(jù)權(quán)利要求1-15中任一項所述的融合基因,其中,所述融合基因 的存在用于指示腫瘤的存在和/或病期。
20.如權(quán)利要求19所述的診斷和/或預(yù)后試劑盒,其中,所述試劑盒包括至少一種能夠 與所述融合基因和/或其片段雜交和/或互補的核酸分子,其中,雜交指示腫瘤的存在和/ 或病期。
21.—種診斷和/或預(yù)后試劑盒,其用于在受試者中診斷和/或預(yù)后腫瘤,其中,所述試 劑盒包含一個或多個片段,所述片段代表能夠與從至少一個受試者的腫瘤組織和對照組織 中分離的差異性標(biāo)記的基因組DNA雜交的基因組,其中,與對照組織相比,腫瘤組織中雜交 強度和/或標(biāo)記信號的增加或減少用以檢測腫瘤組織中的拷貝數(shù)改變區(qū)域,其指示腫瘤的 存在和/或病期。
22.如權(quán)利要求21所述的診斷和/或預(yù)后試劑盒,其中,所述拷貝數(shù)改變區(qū)域包含融合基因。
23.如權(quán)利要求22所述的診斷和/或預(yù)后試劑盒,其中,所述融合基因的檢測通過熒光 原位雜交和/或cDNA末端快速擴(kuò)增技術(shù)。
24.如權(quán)利要求22或23所述的診斷和/或預(yù)后試劑盒,其中,所述融合基因是根據(jù)權(quán) 利要求1至15的至少一個融合基因。
25.如權(quán)利要求19至24所述的診斷和/或預(yù)后試劑盒,其中,所述腫瘤是III期腫瘤。
26.如權(quán)利要求19至25所述的診斷和/或預(yù)后試劑盒,其中,所述腫瘤是實體腫瘤。
27.如權(quán)利要求19至26的診斷和/或預(yù)后試劑盒,其中,所述腫瘤是乳腺腫瘤。
28.—種診斷和/或預(yù)后腫瘤的存在和/或病期的方法,其用于在受試者中診斷和/或 預(yù)后腫瘤的存在和/或病期,所述方法包括檢測至少一種根據(jù)權(quán)利要求1至15中任一項所 述的融合基因,其中,所述融合基因的存在指示腫瘤的存在和/或病期。
29.如權(quán)利要求28所述的方法,其中,所述方法包括提供至少一種能夠與所述融合基 因和/或其片段雜交和/或互補的核酸分子,其中,雜交指示腫瘤的存在和/或病期。
30.一種診斷和/或預(yù)后腫瘤的存在和/或病期的方法,其用于在受試者中診斷和/或 預(yù)后腫瘤的存在和/或時期,其中,所述方法包括提供一個或多個片段,所述片段代表能夠 與從至少一個受試者的腫瘤組織和對照組織中分離的差異性標(biāo)記的基因組DNA雜交的基 因組,其中,與對照組織相比,腫瘤組織中雜交強度和/或標(biāo)記信號的增加或者減少用以檢 測腫瘤組織中的拷貝數(shù)改變區(qū)域,其指示腫瘤的存在和/或病期。
31.如權(quán)利要求30所述的方法,其中,所述CNT區(qū)域包含融合基因。
32.如權(quán)利要求31所述的方法,其中,所述融合基因的檢測通過熒光原位雜交和/或 cDNA末端快速擴(kuò)增技術(shù)。
33.如權(quán)利要求31或32所述的方法,其中,所述融合基因是根據(jù)權(quán)利要求1至15的至 少一個融合基因。
34.如權(quán)利要求28至33所述的方法,其中,所述腫瘤是III期腫瘤。
35.如權(quán)利要求28至34所述的方法,其中,所述腫瘤是實體腫瘤。
36.如權(quán)利要求28至35所述的方法,其中,所述腫瘤是乳腺腫瘤。
37.一種試劑盒,其用于檢測融合基因的存在,其中,所述試劑盒包含一個或多個片段, 所述片段代表能夠與差異性標(biāo)記的對照和測試基因組DNA雜交的基因組,其中,與對照基 因組相比,測試基因組的雜交強度和/或信號的增加或者減少用以檢測測試基因組中的拷 貝數(shù)改變區(qū)域,其中,所述CNT區(qū)域包含融合基因。
38.如權(quán)利要求37所述的試劑盒,其中,所述融合基因是根據(jù)如權(quán)利要求1至15中所 述的的至少一個融合基因。
39.一種檢測融合基因存在的方法,其中,所述方法包括提供一個或多個片段,所述片 段代表能夠與差異性標(biāo)記的對照和測試基因組DNA雜交的基因組,其中,與對照基因組相 比,測試基因組的雜交強度和/或信號的增加或減少用以檢測測試基因組中的拷貝數(shù)轉(zhuǎn)換 (CNT)區(qū)域,其中,所述CNT區(qū)域包含融合基因。
40.如權(quán)利要求39所述的方法,其中,所述融合基因是根據(jù)權(quán)利要求1至15的至少一 個融合基因。
全文摘要
本發(fā)明提供了至少一種分離的融合基因,所述融合基因包含至少一個第一基因和/或其片段,其與至少一個第二基因和/或其片段融合,其中,所述至少第一基因和/或第二基因獨立地選自下列基因組成的組RCC2、CENPF、ARFGEF2、SULF2、MTAP、ATXN7、BCAS3、RPS6KB1、TMEM49、EAP30、具有核苷酸序列SEQ ID NO1的基因和具有核酸SEQ ID NO2的基因,或其片段。本發(fā)明還提供了檢測受試者中腫瘤的易感性和/或預(yù)后的診斷方法和/或試劑盒。
文檔編號C12N15/11GK101918586SQ200780102088
公開日2010年12月15日 申請日期2007年10月22日 優(yōu)先權(quán)日2007年10月22日
發(fā)明者卡爾帕納·瑞姆納瑞阿南, 埃迪森·T·劉, 那拉斯瓦姆·帕拉尼薩米 申請人:新加坡科技研究局
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
崇文区| 吉水县| 牡丹江市| 灵宝市| 丹江口市| 武汉市| 门源| 洛南县| 绍兴市| 赣州市| 威远县| 罗江县| 房产| 临桂县| 岐山县| 株洲县| 宁乡县| 睢宁县| 白水县| 九龙坡区| 延长县| 公主岭市| 博野县| 贵州省| 五家渠市| 龙门县| 措美县| 合作市| 正蓝旗| 南通市| 阳新县| 温州市| 阳高县| 万荣县| 佳木斯市| 浪卡子县| 永安市| 常德市| 祁连县| 太白县| 高台县|