一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法
【專利摘要】本發(fā)明提供了一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法,包括以下步驟:1)整合Read計(jì)數(shù)矩陣,得到每個(gè)基因的差異表達(dá)程度的統(tǒng)計(jì)量文件;2)識(shí)別差異表達(dá)基因,比較腫瘤原發(fā)和轉(zhuǎn)移條件下的功能的差異程度;3)分析基因表達(dá)模式,進(jìn)行表達(dá)模式的分類及分析;4)標(biāo)記腫瘤轉(zhuǎn)移基因。本發(fā)明用于解決從高通量的數(shù)據(jù)中挖掘腫瘤轉(zhuǎn)移相關(guān)的基因,分析原發(fā)與轉(zhuǎn)移癌癥中轉(zhuǎn)錄組的異常變化以及轉(zhuǎn)移過程中腫瘤轉(zhuǎn)移標(biāo)記基因表達(dá)模式的動(dòng)態(tài)改變。
【專利說明】
一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于基因信息數(shù)據(jù)處理領(lǐng)域,特別是涉及到一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基 因檢測(cè)方法。
【背景技術(shù)】
[0002] 癌癥相關(guān)的死亡個(gè)體中,90%都是由于腫瘤轉(zhuǎn)移造成的。這就強(qiáng)調(diào)了腫瘤轉(zhuǎn)移對(duì) 于病人的巨大危害性,同時(shí)也說明了通過預(yù)測(cè)腫瘤轉(zhuǎn)移的風(fēng)險(xiǎn)以及提早預(yù)防腫瘤轉(zhuǎn)移來降 低癌癥的死亡率的重要性。但是我們目前對(duì)于癌癥轉(zhuǎn)移的分子機(jī)制了解還是很少的。基于 芯片的研究表明通過分析標(biāo)志基因的表達(dá)(gene expression signatures)可以在腫瘤的 早期診斷中預(yù)測(cè)病人的臨床表型。同樣利用標(biāo)志基因的表達(dá)可以幫助分析病人的轉(zhuǎn)移風(fēng) 險(xiǎn)。這些標(biāo)志基因可以作為轉(zhuǎn)移的標(biāo)記(metastatic signature)。但是人們對(duì)于腫瘤轉(zhuǎn)移 的機(jī)制和腫瘤轉(zhuǎn)移相關(guān)的基因的了解還不夠深入。
[0003] 轉(zhuǎn)錄組測(cè)序是近些年開發(fā)的高通量測(cè)序技術(shù)的方法,用于刻畫特定條件下的轉(zhuǎn)錄 組。通過轉(zhuǎn)錄組分析,可以精確地識(shí)別可變剪切、發(fā)現(xiàn)新的啟動(dòng)子、識(shí)別基因的融合、檢測(cè)和 定量新穎的轉(zhuǎn)錄本及亞型等。因此,通過轉(zhuǎn)錄組分析刻畫腫瘤的轉(zhuǎn)錄組的異常,可以幫助人 們理解腫瘤的發(fā)病機(jī)制。目前轉(zhuǎn)錄組分析已經(jīng)廣泛的應(yīng)用于腫瘤相關(guān)領(lǐng)域的分析。所以通 過刻畫原發(fā)癌癥與轉(zhuǎn)移癌癥的轉(zhuǎn)錄組的差異可以幫我們尋找轉(zhuǎn)移的標(biāo)記基因,進(jìn)而用于預(yù) 測(cè)腫瘤的轉(zhuǎn)移。相比于基因芯片和EST技術(shù)用于研究基因的表達(dá),轉(zhuǎn)錄組分析覆蓋的基因更 多、更全面,可以發(fā)現(xiàn)與腫瘤轉(zhuǎn)移相關(guān)的新基因,并且同時(shí)可以精確的定量腫瘤轉(zhuǎn)移基因的 表達(dá)水平的改變。但是現(xiàn)在還沒有專門的方法用于基于高通量測(cè)序技術(shù)的產(chǎn)生的海量數(shù)據(jù) 中來挖掘腫瘤轉(zhuǎn)移相關(guān)的標(biāo)記基因并且刻畫這些基因在腫瘤轉(zhuǎn)移過程中表達(dá)水平的改變。
【發(fā)明內(nèi)容】
[0004] 有鑒于此,本發(fā)明提出一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法,用于解決從高 通量的數(shù)據(jù)中挖掘腫瘤轉(zhuǎn)移相關(guān)的基因,分析原發(fā)與轉(zhuǎn)移癌癥中轉(zhuǎn)錄組的異常變化以及轉(zhuǎn) 移過程中腫瘤轉(zhuǎn)移標(biāo)記基因表達(dá)模式的動(dòng)態(tài)改變。
[0005] 為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移 基因檢測(cè)方法,包括以下步驟:
[0006] 1)整合Read計(jì)數(shù)矩陣,得到每個(gè)基因的差異表達(dá)程度的統(tǒng)計(jì)量文件;
[0007] 2)識(shí)別差異表達(dá)基因,比較腫瘤原發(fā)和轉(zhuǎn)移條件下的功能的差異程度;
[0008] 3)分析基因表達(dá)模式,進(jìn)行表達(dá)模式的分類及分析;
[0009] 4)標(biāo)記腫瘤轉(zhuǎn)移基因。
[0010] 進(jìn)一步的,所述步驟1)的具體方法為:
[0011] 101)合并HTseq輸出的每個(gè)基因在一個(gè)樣本中的read計(jì)數(shù)矩陣;
[0012] 102)進(jìn)行基因在腫瘤與正常狀態(tài)下的表達(dá)改變的程度的計(jì)算;基于步驟101)的 read計(jì)數(shù)矩陣,首先將上述矩陣標(biāo)準(zhǔn)化,然后利用標(biāo)準(zhǔn)化的矩陣計(jì)算在腫瘤和正常兩種狀 態(tài)下基因的表達(dá)改變程度的顯著性;
[0013] 103)得到每個(gè)基因的差異表達(dá)程度的統(tǒng)計(jì)量文件。
[0014] 進(jìn)一步的,所述步驟2)的具體方法為:
[0015] 201)利用步驟1)得到的每個(gè)基因的差異表達(dá)程度的統(tǒng)計(jì)量文件,從中篩選出具有 統(tǒng)計(jì)學(xué)意義的差異表達(dá)的基因;
[0016] 從每個(gè)基因的差異表達(dá)程度的統(tǒng)計(jì)量文件中,提取出表達(dá)改變程度fold change 大于2,并且FDR小于0.05的基因,這些基因是具有統(tǒng)計(jì)學(xué)意義的差異表達(dá)基因。
[0017] 202)基于已知的基因注釋對(duì)差異表達(dá)基因進(jìn)行分類和表達(dá)改變程度的可視化;
[0018] 203)利用得到的差異表達(dá)基因列表進(jìn)行功能的富集分析,以及比較腫瘤原發(fā)和轉(zhuǎn) 移條件下的功能的差異程度。
[0019] 進(jìn)一步的,所述步驟3)的具體方法為:
[0020] 301)利用腫瘤原發(fā)和轉(zhuǎn)移條件下的差異的編碼基因的并集進(jìn)行表達(dá)模式的分類;
[0021] 302)對(duì)每一類基因進(jìn)行功能富集分析。
[0022]進(jìn)一步的,所述步驟4)的具體方法為:
[0023] 401)通過標(biāo)記轉(zhuǎn)移腫瘤和原發(fā)腫瘤中,轉(zhuǎn)移腫瘤獨(dú)有的差異表達(dá)基因來進(jìn)行篩選 轉(zhuǎn)移中的標(biāo)記基因;
[0024] 402)可視化轉(zhuǎn)移基因的動(dòng)態(tài)表達(dá);
[0025] 403)對(duì)這些基因進(jìn)行功能的注釋分析。
[0026] 相對(duì)于現(xiàn)有技術(shù),本發(fā)明所述的一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法具有以 下優(yōu)勢(shì):
[0027] 本發(fā)明以常見轉(zhuǎn)錄組測(cè)序流程處理的輸出結(jié)果(例如read計(jì)數(shù)文件)作為輸入,完 成數(shù)據(jù)read計(jì)數(shù)的整合,差異基因的篩選,分析基因表達(dá)模式,比較原發(fā)與轉(zhuǎn)移的轉(zhuǎn)錄組差 異,給出潛在腫瘤轉(zhuǎn)移基因候選集。本發(fā)明基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)結(jié)果,承接轉(zhuǎn)錄 組測(cè)序流程處理,輸出潛在腫瘤轉(zhuǎn)移基因候選集,完成腫瘤轉(zhuǎn)移標(biāo)記基因挖掘工作中重要 的一環(huán),用于解決從高通量的數(shù)據(jù)中挖掘腫瘤轉(zhuǎn)移相關(guān)的基因,分析原發(fā)與轉(zhuǎn)移癌癥中轉(zhuǎn) 錄組的異常變化以及轉(zhuǎn)移過程中腫瘤轉(zhuǎn)移標(biāo)記基因表達(dá)模式的動(dòng)態(tài)改變。
【附圖說明】
[0028] 構(gòu)成本發(fā)明的一部分的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí) 施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0029] 圖1為本發(fā)明的流程示意圖。
[0030] 圖2為本發(fā)明實(shí)施例的乳腺癌轉(zhuǎn)錄組基因的分類柱狀圖。
[0031] 圖3為本發(fā)明實(shí)施例的乳腺癌不同差異表達(dá)基因的交集的韋恩圖。
[0032] 圖4為本發(fā)明實(shí)施例的乳腺癌不同差異表達(dá)基因的功能富集分析比較。
[0033] 圖5為本發(fā)明實(shí)施例的不同類別的基因富集到的功能的共享熱圖。
[0034] 圖6為本發(fā)明實(shí)施例的腫瘤轉(zhuǎn)移的標(biāo)記基因在樣本中的表達(dá)值。
[0035] 圖7為本發(fā)明實(shí)施例的上調(diào)的腫瘤轉(zhuǎn)移的標(biāo)記基因富集到的G0功能和KEGG通路。
【具體實(shí)施方式】
[0036] 需要說明的是,在不沖突的情況下,本發(fā)明的實(shí)施例及實(shí)施例中的特征可以相互 組合。
[0037] 下面將參考附圖并結(jié)合實(shí)施例來詳細(xì)說明本發(fā)明。
[0038] 如圖1所示,本發(fā)明的方法步驟如下:
[0039] l、Read計(jì)數(shù)矩陣的整合
[0040] 合并HTseq輸出read計(jì)數(shù)矩陣,并且進(jìn)行基因表達(dá)改變計(jì)算。得到計(jì)算的每個(gè)基因 的差異表達(dá)程度的統(tǒng)計(jì)量文件,每個(gè)基因的read計(jì)數(shù)經(jīng)過文庫標(biāo)準(zhǔn)化以后的表達(dá)值文件以 及過濾了在所有樣本read計(jì)數(shù)都是0的基因的新的read計(jì)數(shù)文件。
[0041] 值得注意的是,read計(jì)數(shù)矩陣文件中有些基因的表達(dá)在所有樣本都是0,這種在后 續(xù)的差異表達(dá)計(jì)算的過程中需要過濾。
[0042] 2、差異表達(dá)基因的識(shí)別
[0043] 利用上述步驟得到的每個(gè)基因的差異表達(dá)程度的統(tǒng)計(jì)量文件,從中篩選出具有統(tǒng) 計(jì)學(xué)意義的差異表達(dá)的基因,并且基于已知的基因注釋對(duì)差異表達(dá)基因進(jìn)行分類和表達(dá)改 變程度的可視化,得到差異表達(dá)的基因列表,不同類別的差異表達(dá)基因,差異程度的可視化 熱圖。
[0044] 利用上述得到的差異表達(dá)基因列表進(jìn)行功能的富集分析,以及比較腫瘤原發(fā)和轉(zhuǎn) 移條件下的功能的差異程度,即腫瘤原發(fā)和轉(zhuǎn)移的差異基因共享和特異的G0功能和通路。
[0045] 3、基因表達(dá)模式的分析
[0046] 利用腫瘤原發(fā)和轉(zhuǎn)移條件下的差異的編碼基因的并集進(jìn)行表達(dá)模式的分類,并且 對(duì)每一類基因進(jìn)行功能富集分析。
[0047] 輸入的信息為上述產(chǎn)生的差異表達(dá)的編碼基因文件,標(biāo)準(zhǔn)化以后的基因的表達(dá) 值,以及基因在原發(fā)和轉(zhuǎn)移過程中的差異改變的程度。
[0048] 分析得到每一類別的基因在腫瘤原發(fā)與轉(zhuǎn)移中fc,每一類基因在樣本中的表達(dá)水 平,每一類基因富集到的功能和通路,以及功能之間的比較和聚類圖。
[0049] 具體原理及說明:
[0050] 原發(fā)腫瘤到轉(zhuǎn)移的過程中涉及到復(fù)雜的基因表達(dá)的改變,但是通過比較原發(fā)腫瘤 和轉(zhuǎn)移的異常的轉(zhuǎn)錄組可以刻畫不同基因的表達(dá)模式的改變,進(jìn)而分析轉(zhuǎn)移過程中基因的 動(dòng)態(tài)的表達(dá)。表達(dá)模式的動(dòng)態(tài)性刻畫可以分為以下幾個(gè)步驟來完成:
[0051] 首先獲原發(fā)的差異基因的fc和轉(zhuǎn)移與原發(fā)的差異基因的fc。在篩選差異表達(dá)基因 的過程中要求基因在正常和腫瘤狀態(tài)下的fc大于2,差異的顯著性fdr小于0.05。此外,還需 要獲得轉(zhuǎn)移腫瘤與原發(fā)腫瘤的基因表達(dá)的改變的fc值。
[0052] 其次,合并原發(fā)和轉(zhuǎn)移的差異表達(dá)基因,按照基因在原發(fā)中的fc和轉(zhuǎn)移腫瘤與原 發(fā)腫瘤的基因表達(dá)的改變的f c值將基因分成9類,分別為:up_up,up_invar,up_down,down_ up,down_invar,down_down,invar_up,invar_down,invar_invar 〇每種類別的基因的意義 如下:
[0053] up_up:表示在轉(zhuǎn)移過程中呈現(xiàn)出持續(xù)上調(diào)的基因。這些基因在原發(fā)與轉(zhuǎn)移中持續(xù) 上調(diào),是致癌基因,并且在轉(zhuǎn)移中表達(dá)更加強(qiáng)烈,是轉(zhuǎn)移的強(qiáng)促癌基因。
[0054] up_inVar:這種類型的基因在原發(fā)與轉(zhuǎn)移中都上調(diào),但是二者的上調(diào)幅度相當(dāng),是 中度的癌基因;
[0055] up_d〇wn:這些基因在原發(fā)中上調(diào),在轉(zhuǎn)移中下調(diào),應(yīng)該是原發(fā)中具有促進(jìn)的功能, 但是轉(zhuǎn)移中不需要高表達(dá)的基因;
[0056] down_up:類別的基因在原發(fā)中下調(diào),轉(zhuǎn)移中上調(diào);
[0057] down_invar:這種基因在原發(fā)與轉(zhuǎn)移中都呈現(xiàn)出下調(diào)趨勢(shì);
[0058 ] down_down:這些基因在原發(fā)與轉(zhuǎn)移過程中持續(xù)下調(diào),是抑制癌基因
[0059] invar_up:這些基因在轉(zhuǎn)移中呈現(xiàn)上調(diào)模式。
[0060] invar_down:這些基因在轉(zhuǎn)移中呈現(xiàn)下調(diào)模式。
[0061 ] invar_invar:是只在轉(zhuǎn)移中呈現(xiàn)出差異,而原發(fā)中不差異的基因。
[0062] 然后,獲得每一類別中所有基因的表達(dá)值,可視化這些類別的基因在腫瘤轉(zhuǎn)移過 程中的表達(dá)水平的動(dòng)態(tài)性改變。
[0063] 最后,對(duì)每一類基因分別進(jìn)行功能的分析,主要是利用類內(nèi)的基因進(jìn)行G0功能和 KEGG富集分析,進(jìn)而從功能層面證明每一類別的基因在腫瘤的轉(zhuǎn)移過程中的功能上的改 變。
[0064] 4、腫瘤轉(zhuǎn)移的標(biāo)記基因
[0065]通過標(biāo)記轉(zhuǎn)移腫瘤和原發(fā)腫瘤中,轉(zhuǎn)移腫瘤獨(dú)有的差異表達(dá)基因來進(jìn)行篩選轉(zhuǎn)移 中的標(biāo)記基因。輸入信息為原發(fā)腫瘤和轉(zhuǎn)移腫瘤的差異表達(dá)基因的列表以及基因標(biāo)準(zhǔn)化以 后的表達(dá)值。
[0066] 具體原理及說明:
[0067] 為了找出腫瘤轉(zhuǎn)移相關(guān)的標(biāo)記基因,從而探索腫瘤轉(zhuǎn)移的過程,這里借助于利用 原發(fā)腫瘤和轉(zhuǎn)移腫瘤的數(shù)據(jù)進(jìn)行分析。
[0068] 首先分別獲得腫瘤原發(fā)和轉(zhuǎn)移腫瘤相對(duì)于正常組織的差異基因的列表。
[0069] 其次,要求腫瘤轉(zhuǎn)移相關(guān)的標(biāo)記基因不在原發(fā)樣本差異,只在轉(zhuǎn)移腫瘤中呈現(xiàn)出 差異的基因。
[0070] 隨后,根據(jù)這些候選的腫瘤轉(zhuǎn)移的標(biāo)記基因在轉(zhuǎn)移腫瘤中的表達(dá)改變的fc分成上 調(diào)的腫瘤轉(zhuǎn)移標(biāo)記基因和下調(diào)的標(biāo)記基因。并且獲得這些基因在原發(fā)腫瘤,和轉(zhuǎn)移腫瘤中 的表達(dá)值??梢暬@些基因的表達(dá)的動(dòng)態(tài)性改變。
[0071] 最后,分別對(duì)上下調(diào)的腫瘤轉(zhuǎn)移基因進(jìn)行G0功能和KEGG富集分析。
[0072] 下面通過一個(gè)乳腺癌病人的癌旁,原發(fā),以及轉(zhuǎn)移樣本的轉(zhuǎn)錄組數(shù)據(jù)測(cè)序數(shù)據(jù)為 應(yīng)用實(shí)例,展示軟件運(yùn)行結(jié)果。這里使用Normal表示病人的癌旁組織,Primary表示病人的 原發(fā)腫瘤,Metastatic表示病人的轉(zhuǎn)移腫瘤。該數(shù)據(jù)的測(cè)序流程處理結(jié)果統(tǒng)計(jì)表4.1。
[0073]表4.1轉(zhuǎn)錄組測(cè)序流程處理結(jié)果統(tǒng)計(jì)
[0074]
[0075] 根據(jù)本發(fā)明的方法,得到如下結(jié)果: 1 (1)將所有的樣本的合在一起分析乳腺癌組織的轉(zhuǎn)錄組,要求基因上面至少具有 一個(gè)read。乳腺癌組織的轉(zhuǎn)錄組共包括31948個(gè)基因,其中,編碼基因占據(jù)最大的比例57%, 其次是IncRNA 23%。值得注意的是,1415個(gè)smRNA也呈現(xiàn)出表達(dá)(有可能是smRNA的前體,因 為smRNA的長(zhǎng)度較短)。對(duì)于IncRNA來說,基因間區(qū)的比例最大43%。圖2展示了乳腺癌轉(zhuǎn)錄 組基因的分類柱狀圖;
[0077] (2)對(duì)于原發(fā)腫瘤與轉(zhuǎn)移腫瘤分別與癌旁組織進(jìn)行差異表達(dá),這里統(tǒng)一要求fold change大于等于2。圖3展示了不同癌癥部位之間的差異因交集展示;圖4不同癌癥部位之間 的差異因的富集到的G0功能的展示;可以發(fā)現(xiàn)這些部位的差異表達(dá)基因具有很大的交集, 但是同時(shí)他們都有自己獨(dú)特表達(dá)的基因。功能的分析也是類似的結(jié)論,轉(zhuǎn)移腫瘤中具有獨(dú) 特的功能。這暗示了轉(zhuǎn)移具有自己獨(dú)特的標(biāo)記基因的表達(dá)。
[0078] (3)分析轉(zhuǎn)移過程中基因表達(dá)的模式。使用原發(fā)與轉(zhuǎn)移所有的差異基因,利用原發(fā) 的差異基因的fc和轉(zhuǎn)移與原發(fā)的差異基因的fc進(jìn)行分類。同一類基因在不同的樣本中具有 動(dòng)態(tài)的表達(dá)。圖5展示不同類別的基因富集到的功能的共享熱圖,白色表示該類別的基因沒 有富集到該功能,深色的表示富集到該功能。
[0079] (4)識(shí)別腫瘤轉(zhuǎn)移的標(biāo)記基因,這里共找到了47個(gè)腫瘤轉(zhuǎn)移的候選標(biāo)記基因。圖6 展示的是找到的腫瘤轉(zhuǎn)移的標(biāo)記基因在樣本中的表達(dá)值,左邊是上調(diào)的基因,右邊是下調(diào) 的基因;圖7展示的是上調(diào)的腫瘤轉(zhuǎn)移的標(biāo)記基因富集到的G0功能和KEGG通路。
[0080] 由表達(dá)可知,這些轉(zhuǎn)移相關(guān)的基因在轉(zhuǎn)移的樣本中呈現(xiàn)出高度的失調(diào)。
[0081] 對(duì)這些差異基因進(jìn)行功能富集分析,上調(diào)基因富集到迀移粘附的功能和通路,下 調(diào)的基因富集到免疫等功能。這說明了這些腫瘤轉(zhuǎn)移的標(biāo)記基因在腫瘤轉(zhuǎn)移的過程中具有 很重要的功能。也證明了他們?cè)谵D(zhuǎn)移過程中的動(dòng)態(tài)的表達(dá)模式以及其與轉(zhuǎn)移的密切關(guān)系。
[0082] 以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法,其特征在于,包括以下步驟: 1) 整合Read計(jì)數(shù)矩陣,得到每個(gè)基因的差異表達(dá)程度的統(tǒng)計(jì)量文件; 2) 識(shí)別差異表達(dá)基因,比較腫瘤原發(fā)和轉(zhuǎn)移條件下的功能的差異程度; 3) 分析基因表達(dá)模式,進(jìn)行表達(dá)模式的分類及分析; 4) 標(biāo)記腫瘤轉(zhuǎn)移基因。2. 根據(jù)權(quán)利要求1所述的一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法,其特征在于,所述 步驟1)的具體方法為: 101) 合并HTseq輸出的每個(gè)基因在一個(gè)樣本中的read計(jì)數(shù)矩陣; 102) 進(jìn)行基因在腫瘤與正常狀態(tài)下的表達(dá)改變的程度的計(jì)算;基于步驟101)的read計(jì) 數(shù)矩陣,首先將上述矩陣標(biāo)準(zhǔn)化,然后利用標(biāo)準(zhǔn)化的矩陣計(jì)算在腫瘤和正常兩種狀態(tài)下基 因的表達(dá)改變程度的顯著性; 103) 得到每個(gè)基因的差異表達(dá)程度的統(tǒng)計(jì)量文件。3. 根據(jù)權(quán)利要求1所述的一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法,其特征在于,所述 步驟2)的具體方法為: 201) 利用步驟1)得到的每個(gè)基因的差異表達(dá)程度的統(tǒng)計(jì)量文件,從中篩選出具有統(tǒng)計(jì) 學(xué)意義的差異表達(dá)的基因; 所述具有統(tǒng)計(jì)學(xué)意義即要求差異表達(dá)的基因的表達(dá)改變程度大于2,并且FDR小于 0.05〇 202) 基于已知的基因注釋對(duì)差異表達(dá)基因進(jìn)行分類和表達(dá)改變程度的可視化; 203) 利用得到的差異表達(dá)基因列表進(jìn)行功能的富集分析,以及比較腫瘤原發(fā)和轉(zhuǎn)移條 件下的功能的差異程度。4. 根據(jù)權(quán)利要求1所述的一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法,其特征在于,所述 步驟3)的具體方法為: 301) 利用腫瘤原發(fā)和轉(zhuǎn)移條件下的差異的編碼基因的并集進(jìn)行表達(dá)模式的分類; 302) 對(duì)每一類基因進(jìn)行功能富集分析。5. 根據(jù)權(quán)利要求1所述的一種基于轉(zhuǎn)錄組的腫瘤轉(zhuǎn)移基因檢測(cè)方法,其特征在于,所述 步驟4)的具體方法為: 401) 通過標(biāo)記轉(zhuǎn)移腫瘤和原發(fā)腫瘤中,轉(zhuǎn)移腫瘤獨(dú)有的差異表達(dá)基因來進(jìn)行篩選轉(zhuǎn)移 中的標(biāo)記基因; 402) 可視化轉(zhuǎn)移基因的動(dòng)態(tài)表達(dá); 403) 對(duì)這些基因進(jìn)行功能的注釋分析。
【文檔編號(hào)】G06F19/24GK105975812SQ201610318602
【公開日】2016年9月28日
【申請(qǐng)日】2016年5月13日
【發(fā)明人】薛成海, 王曉君, 劉宇, 鄭文輝
【申請(qǐng)人】萬康源(天津)基因科技有限公司