一種心肌病基因數(shù)據(jù)處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種心肌病基因數(shù)據(jù)處理方法及裝 置。
【背景技術(shù)】
[0002] 心肌病是一組由于心臟下部分腔室(即心室)的結(jié)構(gòu)改變和心肌壁功能受損導(dǎo) 致心臟功能進(jìn)行性障礙的病變,其發(fā)病機(jī)理至今尚未完全明確。缺血性心肌病(ischemic cardiomyopathy,ICM),是指由于冠狀動(dòng)脈粥樣硬化引起長(zhǎng)期心肌缺血,導(dǎo)致心肌局限性 或彌漫性纖維化,產(chǎn)生與原發(fā)性擴(kuò)張型心肌病類似的臨床綜合征,如心臟收縮或舒張功能 受損、心臟擴(kuò)大或僵硬、心絞痛、心力衰竭或心律失常等一系列臨床表現(xiàn)。特發(fā)性心肌病 (idiopathic cardiomyopathy),可分為擴(kuò)張性心肌病、肥厚性心肌病以及縮窄性心肌病, 主要是由于左心室擴(kuò)張,心室舒張末期容量增加,導(dǎo)致心肌收縮功能障礙。該病的臨床表現(xiàn) 有心臟擴(kuò)大,心力衰竭,常有心律失常及栓塞發(fā)生等。
[0003] 目前,生物標(biāo)志物對(duì)心肌病的診斷具有重要意義。人類心肌病轉(zhuǎn)錄組的研宄表明, 有一系列的基因與心臟衰竭有關(guān)。Hannenhalli等人研宄表明,與正常人相比,有1020個(gè)基 因在缺血性心肌病(ischemic cardiomyopathy)病人中差異表達(dá),有1002個(gè)基因在特發(fā)性 心肌?。╥diopathic cardiomyopathies)病人中差異表達(dá)。但是已有生物標(biāo)記物之間是獨(dú) 立的,沒(méi)有考慮基因之間的相互聯(lián)系。然而,生物體本身是一個(gè)完整的系統(tǒng),各個(gè)基因之間 是存在聯(lián)系的。不考慮基因之間的聯(lián)系,很難反映心肌病患者的真實(shí)情況。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實(shí)施例提供一種心肌病基因數(shù)據(jù)處理方法及裝置,將共表達(dá)基因?qū)?shù)據(jù)確 定為心肌病生物標(biāo)志物,可以提高心肌病患者的識(shí)別精準(zhǔn)度。
[0005] 本發(fā)明實(shí)施例提供了一種心肌病基因數(shù)據(jù)處理方法,包括:
[0006] 獲取樣本基因表達(dá)譜;
[0007] 對(duì)所述樣本基因表達(dá)譜進(jìn)行分析,以獲取對(duì)應(yīng)的基因數(shù)據(jù),各個(gè)所述基因數(shù)據(jù)包 括若干基因的基因表達(dá)量;
[0008] 獲取預(yù)先設(shè)定的篩選算法;
[0009] 通過(guò)所述篩選算法,在所述基因數(shù)據(jù)中篩選出共表達(dá)基因?qū)?shù)據(jù);
[0010] 確定所述共表達(dá)基因?qū)?shù)據(jù)為心肌病生物標(biāo)志物。
[0011] 相應(yīng)地,本發(fā)明實(shí)施例還提供了一種心肌病基因數(shù)據(jù)處理裝置,包括:
[0012] 第一獲取單元,用于獲取樣本基因表達(dá)譜;
[0013] 分析單元,用于對(duì)所述樣本基因表達(dá)譜進(jìn)行分析,以獲取對(duì)應(yīng)的基因數(shù)據(jù),各個(gè)所 述基因數(shù)據(jù)包括若干基因的基因表達(dá)量;
[0014] 第二獲取單元,用于獲取預(yù)先設(shè)定的篩選算法;
[0015] 篩選單元,用于通過(guò)所述篩選算法,在所述基因數(shù)據(jù)中篩選出共表達(dá)基因?qū)?shù) 據(jù);
[0016] 確定單元,用于確定所述共表達(dá)基因?qū)?shù)據(jù)為心肌病生物標(biāo)志物。
[0017] 實(shí)施本發(fā)明實(shí)施例,對(duì)樣本基因表達(dá)譜進(jìn)行分析,以獲取對(duì)應(yīng)的基因數(shù)據(jù),各個(gè)基 因數(shù)據(jù)包括若干基因的基因表達(dá)量,通過(guò)預(yù)先設(shè)定的篩選算法,在基因數(shù)據(jù)中篩選出共表 達(dá)基因?qū)?shù)據(jù),確定共表達(dá)基因?qū)?shù)據(jù)為心肌病生物標(biāo)志物,可以提高心肌病患者的識(shí)別 精準(zhǔn)度。
【附圖說(shuō)明】
[0018] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用 的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域 普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0019] 圖1是本發(fā)明第一實(shí)施例中提供的一種心肌病基因數(shù)據(jù)處理方法的流程示意圖;
[0020] 圖2是本發(fā)明第二實(shí)施例中提供的一種心肌病基因數(shù)據(jù)處理方法的流程示意圖;
[0021] 圖3是本發(fā)明第三實(shí)施例中提供的一種心肌病基因數(shù)據(jù)處理方法的流程示意圖;
[0022] 圖4是本發(fā)明第四實(shí)施例中提供的一種心肌病基因數(shù)據(jù)處理方法的流程示意圖;
[0023] 圖5A是本發(fā)明實(shí)施例中提供的一種非心肌病患者對(duì)應(yīng)的共表達(dá)基因?qū)Φ男Ч?意圖;
[0024] 圖5B是本發(fā)明實(shí)施例中提供的一種特發(fā)性心肌病患者對(duì)應(yīng)的共表達(dá)基因?qū)Φ男?果示意圖;
[0025] 圖6A是本發(fā)明實(shí)施例中提供的另一種非心肌病患者對(duì)應(yīng)的共表達(dá)基因?qū)Φ男Ч?示意圖;
[0026] 圖6B是本發(fā)明實(shí)施例中提供的另一種特發(fā)性心肌病患者對(duì)應(yīng)的共表達(dá)基因?qū)Φ?效果不意圖;
[0027] 圖7是本發(fā)明實(shí)施例中提供的一種心肌病基因數(shù)據(jù)處理裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0028] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā) 明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施 例,都屬于本發(fā)明保護(hù)的范圍。
[0029] 本發(fā)明實(shí)施例公開(kāi)了一種心肌病基因數(shù)據(jù)處理方法,對(duì)樣本基因表達(dá)譜進(jìn)行分 析,以獲取對(duì)應(yīng)的基因數(shù)據(jù),各個(gè)基因數(shù)據(jù)包括若干基因的基因表達(dá)量,通過(guò)預(yù)先設(shè)定的篩 選算法,在基因數(shù)據(jù)中篩選出共表達(dá)基因?qū)?shù)據(jù),確定共表達(dá)基因?qū)?shù)據(jù)為心肌病生物標(biāo) 志物,可以提高心肌病患者的識(shí)別精準(zhǔn)度。
[0030] 本發(fā)明實(shí)施例中的心肌病基因數(shù)據(jù)處理裝置可以運(yùn)行在PC(personal computer, 個(gè)人計(jì)算機(jī))、穿戴式智能設(shè)備或者醫(yī)療設(shè)備等電子設(shè)備中。
[0031] 請(qǐng)參見(jiàn)圖1,圖1是本發(fā)明第一實(shí)施例中提供的一種心肌病基因數(shù)據(jù)處理方法的 流程示意圖,如圖所示本發(fā)明實(shí)施例中的心肌病基因數(shù)據(jù)處理方法可以包括:
[0032] S101,獲取樣本基因表達(dá)譜。
[0033] 心肌病基因數(shù)據(jù)處理裝置可以獲取樣本基因表達(dá)譜。例如,可以通過(guò)平臺(tái)GPL96, 從GEO(gene expression omnibus,高通量基因表達(dá))數(shù)據(jù)庫(kù)中獲取數(shù)據(jù)集GSE5406,數(shù)據(jù) 集GSE5406可以包括樣本基因表達(dá)譜。其中平臺(tái)GPL96是人類基因芯片平臺(tái)。又如,可以 在本地的基因表達(dá)譜數(shù)據(jù)庫(kù)中獲取樣本基因表達(dá)譜,其中基因表達(dá)譜數(shù)據(jù)庫(kù)中存儲(chǔ)了若干 基因表達(dá)譜。
[0034] 可選的,心肌病基因數(shù)據(jù)處理裝置獲取到的樣本基因表達(dá)譜可以包括缺血性心肌 病患者、特發(fā)性心肌病患者以及非心肌病患者的基因表達(dá)譜。示例性的,樣本基因表達(dá)譜可 以包括108個(gè)缺血性心肌病患者、86個(gè)特發(fā)性心肌病患者以及16個(gè)非心肌病患者的基因表 達(dá)譜。
[0035] S102,對(duì)樣本基因表達(dá)譜進(jìn)行分析,以獲取對(duì)應(yīng)的基因數(shù)據(jù),各個(gè)基因數(shù)據(jù)包括若 干基因的基因表達(dá)量。
[0036] 心肌病基因數(shù)據(jù)處理裝置獲取到樣本基因表達(dá)譜之后,可以對(duì)樣本基因表達(dá)譜進(jìn) 行分析,以獲取對(duì)應(yīng)的基因數(shù)據(jù),各個(gè)基因數(shù)據(jù)包括若干基因的基因表達(dá)量。例如,心肌病 基因數(shù)據(jù)處理裝置可以對(duì)樣本基因表達(dá)譜進(jìn)行RMA(Robust Multichip Average,魯棒的 多芯片平均)標(biāo)準(zhǔn)化處理,以獲取對(duì)應(yīng)的基因數(shù)據(jù)。RMA標(biāo)準(zhǔn)化處理,即通過(guò)Expression Console軟件將樣本基因表達(dá)譜經(jīng)RMA算法預(yù)處理,轉(zhuǎn)化成基因數(shù)據(jù)的過(guò)程。
[0037] 例如,心肌病基因數(shù)據(jù)處理裝置對(duì)108個(gè)缺血性心肌病患者、86個(gè)特發(fā)性心肌病 患者以及16個(gè)非心肌病患者的基因表達(dá)譜進(jìn)行分析,以獲取各個(gè)基因表達(dá)譜對(duì)應(yīng)的基因 數(shù)據(jù)。
[0038] S103,獲取預(yù)先設(shè)定的篩選算法。
[0039] 心肌病基因數(shù)據(jù)處理裝置可以獲取預(yù)先設(shè)定的篩選算法。示例性的,篩選算法可 以為:
[0040] max (T (i, j))-min (T (i, j)) < 8 ;
[0041] 其中,T(i,j) =X(i,k)/X(j,k),k= l,2-N,X(i,k)表示基因 i 的第 k 個(gè)樣本的 基因表達(dá)量,X (j,k)表示基因j的第k個(gè)樣本的基因表達(dá)量,S表示基因i和基因j的近 似程度。
[0042] S104,通過(guò)篩選算法,在基因數(shù)據(jù)中篩選出共表達(dá)基因?qū)?shù)據(jù)。
[0043] 心肌病基因數(shù)據(jù)處理裝置可以通過(guò)篩選算法,在基因數(shù)據(jù)中篩選出共表達(dá)基因?qū)?數(shù)據(jù)。可選的,可以通過(guò)篩選算法,在包括非心肌病患者的基因表達(dá)譜的樣本基因表達(dá)譜對(duì) 應(yīng)的基因數(shù)據(jù)中篩選出第一共表達(dá)基因?qū)?shù)據(jù);通過(guò)篩選算法,在包括缺血性心肌病患者 的基因表達(dá)譜的樣本基因表達(dá)譜對(duì)應(yīng)的基因數(shù)據(jù)中篩選出第二共表達(dá)基因?qū)?shù)據(jù);通過(guò)篩 選算法,在包括特發(fā)性心肌病患者的基因表達(dá)譜的樣本基因表達(dá)譜對(duì)應(yīng)的基因數(shù)據(jù)中篩選 出第三共表達(dá)基因?qū)?shù)據(jù)。
[0044] 例如,當(dāng)S = 〇. 03時(shí),心肌病基因數(shù)據(jù)處理裝置可以在16個(gè)非心肌病患者的基 因表達(dá)譜對(duì)應(yīng)的基因數(shù)據(jù)中篩選出第一共表達(dá)基因?qū)?shù)據(jù),其中第一共表達(dá)基因?qū)?shù)據(jù)包 括85326個(gè)共表達(dá)基因?qū)?。心肌病基因?shù)據(jù)處理裝置可以在108個(gè)缺血性心肌病患者的基 因表達(dá)譜對(duì)應(yīng)的基因數(shù)據(jù)中篩選出第二共表達(dá)基因?qū)?shù)據(jù),其中第二共表達(dá)基因?qū)?shù)據(jù)包 括72個(gè)共表達(dá)基因?qū)ΑP募〔』驍?shù)據(jù)處理裝置可以在86個(gè)缺血性心肌病患者的基因 表達(dá)譜對(duì)應(yīng)的基因數(shù)據(jù)中篩選出第三共表達(dá)基因?qū)?shù)據(jù),其中第三共表達(dá)基因?qū)?shù)據(jù)包括 368個(gè)共表達(dá)基因?qū)Α?br>[0045] 示例性的,心肌病基因數(shù)據(jù)處理裝置獲取到16個(gè)非心肌病患者的基因表達(dá) 譜對(duì)應(yīng)的基因數(shù)據(jù)之后,可以獲取基因i的第k個(gè)樣本的基因表達(dá)量,即X(i,k),獲 取基因j的第k個(gè)樣本的基因表達(dá)量,即X(j,k),并獲取第k個(gè)樣本中基因i的基因 表達(dá)量與基因j的基因表達(dá)量的比值,即T(i,j),其中k = 1,2- 16,進(jìn)而獲取數(shù)值最 大的T(i,j),即max(T(i,j)),數(shù)值最小的T(i,j),即min(T(i,j)),若滿足篩選算法 max(T(i,j))-min(T(i,j)) < 8,則基因?qū)Γ╥,j)為共表達(dá)基因?qū)Α?yōu)選的,6 =0.03。
[0046] S105,確定共表達(dá)基因?qū)?shù)據(jù)為心肌病生物標(biāo)志物。
[0047] 心肌病基因數(shù)據(jù)處理裝置篩選出共表達(dá)基因?qū)?shù)據(jù)之后,可以確定共表達(dá)基因?qū)?數(shù)據(jù)為心肌病生物標(biāo)志物。進(jìn)一步的,心肌病基因數(shù)據(jù)處理裝置可以將第二共表達(dá)基因?qū)?數(shù)據(jù)和第三共表達(dá)基因?qū)?shù)據(jù)確定為心肌病生物標(biāo)志物。例如,16個(gè)非心肌病患者的基因 表達(dá)譜對(duì)應(yīng)的基因數(shù)據(jù)中,存在85326個(gè)共表達(dá)基因?qū)Γ?6個(gè)特發(fā)性心肌病患者的基因表 達(dá)譜對(duì)應(yīng)的基因數(shù)據(jù)中,存在368個(gè)心肌病生物標(biāo)志物;108個(gè)缺血性心肌病患者的基因表 達(dá)譜對(duì)應(yīng)的基因數(shù)據(jù)中,存在72個(gè)心肌病生物標(biāo)志物。由此可見(jiàn),非心肌病患者、特發(fā)性心