可以為健康人的免疫組庫(kù)數(shù)據(jù)樣本,本發(fā)明實(shí)施例通過(guò)將第一樣本與第二樣本的免疫組庫(kù)數(shù)據(jù)進(jìn)行對(duì)比,有利于全面評(píng)估第一樣本的免疫組庫(kù)的狀況。
[0055]請(qǐng)參見(jiàn)圖3,圖3為本發(fā)明實(shí)施例公開(kāi)的另一種免疫組庫(kù)數(shù)據(jù)分析方法的流程示意圖。如圖3所示,該免疫組庫(kù)數(shù)據(jù)分析方法可以包括以下步驟。
[0056]S301、終端接收用戶輸入的用于對(duì)第一樣本的免疫組庫(kù)數(shù)據(jù)進(jìn)行注釋的注釋指令,該注釋指令攜帶包括該第一樣本的免疫組庫(kù)數(shù)據(jù)的數(shù)據(jù)文件。
[0057]本發(fā)明實(shí)施例中,免疫組庫(kù)數(shù)據(jù)包括多個(gè)TCR基因序列和/或多個(gè)BCR基因序列。
[0058]S302、終端判斷該注釋指令攜帶的數(shù)據(jù)文件是否為預(yù)設(shè)格式的文件。
[0059]本發(fā)明實(shí)施例中,終端接收注釋指令之后,將判斷注釋指令攜帶的數(shù)據(jù)文件是否為預(yù)設(shè)格式的文件;若是,則執(zhí)行步驟S303 ;若否,則終端輸出用于提示用戶包括第一樣本的免疫組庫(kù)數(shù)據(jù)的數(shù)據(jù)文件的格式有誤的提示信息??蛇x的,該預(yù)設(shè)格式包括fasta格式。
[0060]S303、若判斷結(jié)果為是,終端響應(yīng)該注釋指令,從該數(shù)據(jù)文件中提取該第一樣本的免疫組庫(kù)數(shù)據(jù)。
[0061]S304、終端將提取的該第一樣本的免疫組庫(kù)數(shù)據(jù)與預(yù)先存儲(chǔ)的預(yù)設(shè)免疫組庫(kù)數(shù)據(jù)進(jìn)行對(duì)比,從該預(yù)設(shè)免疫組庫(kù)數(shù)據(jù)中獲取與該第一樣本的免疫組庫(kù)數(shù)據(jù)相同的目標(biāo)免疫組庫(kù)數(shù)據(jù)。
[0062]本發(fā)明實(shí)施例中,舉例來(lái)說(shuō),若第一樣本的免疫組庫(kù)數(shù)據(jù)為多個(gè)TCR基因序列,則終端將提取的第一樣本的TCR基因序列與預(yù)先存儲(chǔ)的預(yù)設(shè)免疫組庫(kù)數(shù)據(jù)包含的TCR基因序列進(jìn)行對(duì)比,判斷序列是否相同。若第一樣本的一 TCR基因序列與預(yù)設(shè)免疫組庫(kù)數(shù)據(jù)包含的一 TCR基因序列相同,則終端確定預(yù)設(shè)免疫組庫(kù)數(shù)據(jù)包含的該TCR基因序列為目標(biāo)免疫組庫(kù)數(shù)據(jù)。
[0063]S305、終端根據(jù)預(yù)先存儲(chǔ)的與該目標(biāo)免疫組庫(kù)數(shù)據(jù)對(duì)應(yīng)的注釋數(shù)據(jù),生成該第一樣本的注釋文件。
[0064]本發(fā)明實(shí)施例中,終端預(yù)先儲(chǔ)存有預(yù)設(shè)免疫組庫(kù)數(shù)據(jù)的注釋文件,該注釋文件包括預(yù)設(shè)免疫組庫(kù)數(shù)據(jù)的各基因序列對(duì)應(yīng)的注釋數(shù)據(jù),該注釋數(shù)據(jù)包括V基因種類、D基因種類、J基因種類、CDR3序列和Ig鏈的類型。終端將根據(jù)與目標(biāo)免疫組庫(kù)數(shù)據(jù)對(duì)應(yīng)的注釋數(shù)據(jù),對(duì)第一樣本的免疫組庫(kù)數(shù)據(jù)進(jìn)行注釋,生成第一樣本的注釋文件。
[0065]舉例來(lái)說(shuō),若預(yù)設(shè)免疫組庫(kù)數(shù)據(jù)包括的TCR基因序列A為目標(biāo)免疫組庫(kù)數(shù)據(jù),若第一樣本的TCR基因序列B與TCR基因序列A相同,則終端將根據(jù)TCR基因序列A對(duì)應(yīng)的注釋數(shù)據(jù),對(duì)第一樣本的TCR基因序列B進(jìn)行注釋;具體地,終端將與TCR基因序列A對(duì)應(yīng)的注釋數(shù)據(jù)設(shè)置為第一樣本的TCR基因序列B的注釋數(shù)據(jù)。
[0066]S306、終端接收針對(duì)第一樣本的第一分析指令,該第一分析指令攜帶該第一樣本的注釋文件。
[0067]S307、終端響應(yīng)該第一分析指令,根據(jù)該第一樣本的注釋文件,生成并輸出針對(duì)該第一樣本的整體分析圖,該整體分析圖包括V基因頻率分布圖、D基因頻率分布圖、J基因頻率分布圖、高克隆CDR3序列的頻率分布圖、CDR3的長(zhǎng)度分布圖、免疫多樣性分析圖、VDJ基因組合分析圖、Ig鏈類型比例分布圖和多Ig鏈類型共同序列分析圖中的任意一種或多種分析圖。
[0068]在圖3所描述的方法中,終端可對(duì)第一樣本的免疫組庫(kù)數(shù)據(jù)進(jìn)行注釋,在得到注釋文件之后,可使用該注釋文件生成第一樣本的V基因頻率分布圖、D基因頻率分布圖和J基因頻率分布圖,高克隆CDR3序列的頻率分布圖,CDR3的長(zhǎng)度分布圖,免疫多樣性分析圖,VDJ基因組合分析圖,Ig鏈類型比例分布圖和多Ig鏈類型共同序列分析圖。可見(jiàn),實(shí)施本發(fā)明實(shí)施例有利于對(duì)免疫組庫(kù)的狀況進(jìn)行更全面的評(píng)估。
[0069]請(qǐng)參閱圖4,圖4是本發(fā)明實(shí)施例公開(kāi)的一種終端的結(jié)構(gòu)示意圖。其中,圖4所示的終端可以包括接收模塊401和輸出模塊402。其中:
[0070]接收模塊401,用于接收針對(duì)第一樣本的第一分析指令,所述第一分析指令攜帶所述第一樣本的注釋文件,所述注釋文件包括所述第一樣本的免疫組庫(kù)數(shù)據(jù)的V基因種類、D基因種類、J基因種類、CDR3序列和Ig鏈的類型,所述第一樣本的免疫組庫(kù)數(shù)據(jù)包括多個(gè)TCR基因序列和/或多個(gè)BCR基因序列。
[0071]本發(fā)明實(shí)施例中,終端的接收模塊401接收針對(duì)第一樣本的第一分析指令,該第一分析指令攜帶該第一樣本的注釋文件。其中,該終端可包括但不限于智能手機(jī)、平板電腦、筆記本電腦、臺(tái)式電腦等終端。該終端的操作系統(tǒng)可包括但不限于Android操作系統(tǒng)、1S操作系統(tǒng)、Symbian (塞班)操作系統(tǒng)、Black Berry (黑莓)操作系統(tǒng)和Windows操作系統(tǒng)等等,本發(fā)明實(shí)施例不做限定。
[0072]輸出模塊402,用于響應(yīng)所述第一分析指令,根據(jù)所述第一樣本的注釋文件,生成并輸出針對(duì)所述第一樣本的整體分析圖,所述整體分析圖包括V基因頻率分布圖、D基因頻率分布圖、J基因頻率分布圖、高克隆CDR3序列的頻率分布圖、CDR3的長(zhǎng)度分布圖、免疫多樣性分析圖、VDJ基因組合分析圖、Ig鏈類型比例分布圖和多Ig鏈類型共同序列分析圖中的任意一種或多種分析圖。
[0073]本發(fā)明實(shí)施例中,接收模塊401接收第一分析指令之后,輸出模塊402將響應(yīng)該第一分析指令,根據(jù)該第一樣本的注釋文件,生成并輸出針對(duì)該第一樣本的整體分析圖。
[0074]可選的,接收模塊401接收第一分析指令之后,輸出模塊402將響應(yīng)該第一分析指令,根據(jù)第一樣本的注釋文件中包括的V基因種類,生成并輸出第一樣本的V基因頻率分布圖;該¥基因頻率分布圖用于指示第一樣本包括的各V基因種類所具有的數(shù)量,即用于指示第一樣本的V基因有哪些種類,各種類的數(shù)量有多少。
[0075]可選的,接收模塊401接收第一分析指令之后,輸出模塊402將響應(yīng)該第一分析指令,根據(jù)第一樣本的注釋文件中包括的D基因種類,生成并輸出第一樣本的D基因頻率分布圖;該0基因頻率分布圖用于指示第一樣本包括的各D基因種類所具有的數(shù)量,即用于指示第一樣本的D基因有哪些種類,各種類的數(shù)量有多少。
[0076]可選的,接收模塊401接收第一分析指令之后,輸出模塊402將響應(yīng)該第一分析指令,根據(jù)第一樣本的注釋文件中包括的J基因種類,生成并輸出第一樣本的J基因頻率分布圖;該J基因頻率分布圖用于指示第一樣本包括的各J基因種類所具有的數(shù)量,即用于指示第一樣本的J基因有哪些種類,各種類的數(shù)量有多少。
[0077]可選的,接收模塊401接收第一分析指令之后,輸出模塊402將響應(yīng)該第一分析指令,根據(jù)第一樣本的注釋文件中包括的CDR3序列,統(tǒng)計(jì)第一樣本的高克隆CDR3序列以及各高克隆CDR3序列對(duì)應(yīng)的數(shù)量;終端根據(jù)第一樣本的高克隆CDR3序列以及各高克隆CDR3序列對(duì)應(yīng)的數(shù)量,生成并輸出第一樣本的高克隆CDR3序列的頻率分布圖,該高克隆CDR3序列的頻率分布圖用于指示第一樣本的各高克隆CDR3序列所具有的數(shù)量。
[0078]可選的,接收模塊401接收第一分析指令之后,輸出模塊402將響應(yīng)該第一分析指令,根據(jù)第一樣本的注釋文件中包括的各CDR3序列確定第一樣本的各CDR3的長(zhǎng)度,并統(tǒng)計(jì)第一樣本的各CDR3長(zhǎng)度對(duì)應(yīng)的數(shù)量;在終端確定第一樣本的各CDR3長(zhǎng)度對(duì)應(yīng)的數(shù)量之后,終端將生成并輸出第一樣本的CDR3的長(zhǎng)度分布圖,該CDR3的長(zhǎng)度分布圖用于指示第一樣本的各CDR3長(zhǎng)度的所具有數(shù)量。
[0079]可選的,接收模塊401接收第一分析指令之后,輸出模塊402將響應(yīng)該第一分析指令,根據(jù)第一樣本的注釋文件中包括的各CDR3序列確定第一樣本的香農(nóng)熵(定義為免疫多樣性度量);終端根據(jù)計(jì)算得到的香農(nóng)熵生成并輸出第一樣本的免疫多樣性分析圖,該免疫多樣性分析圖用于指示第一樣本的免疫多樣性,其中,香農(nóng)熵的值越接近于I說(shuō)明第一樣本的免疫多樣性越好,香農(nóng)熵的值越接近于O說(shuō)明第一樣本的免疫多樣性越差。
[0080]可選的,接收模塊401接收第一分析指令之后,輸出模塊402將響應(yīng)該第