欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

高通量測(cè)序突變檢測(cè)結(jié)果驗(yàn)證方法

文檔序號(hào):9887974閱讀:1224來(lái)源:國(guó)知局
高通量測(cè)序突變檢測(cè)結(jié)果驗(yàn)證方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明涉及高通量測(cè)序突變檢測(cè)結(jié)果驗(yàn)證方法。
【背景技術(shù)】
[0002] 惡性腫瘤是威脅人類健康的主要疾病之一,也是全球發(fā)病和死亡的主要原因。根 據(jù)世界衛(wèi)生組織公布的數(shù)據(jù)表明,2012年約有1400萬(wàn)新發(fā)癌癥病例和820萬(wàn)例癌癥相關(guān)死 亡。根據(jù)全國(guó)腫瘤登記中心發(fā)布的2012年數(shù)據(jù),中國(guó)每年新增病例約350萬(wàn),約占全球發(fā)病 的五分之一;癌癥死亡人數(shù)約為250萬(wàn),約占全球癌癥死亡人數(shù)的四分之一。盡管我國(guó)在腫 瘤的手術(shù)、化學(xué)藥物治療、放射治療和生物治療技術(shù)都取得了很大的進(jìn)展,但人口基數(shù)大使 我國(guó)成為世界上癌癥死亡數(shù)最高的國(guó)家。
[0003] 腫瘤本質(zhì)上是基因病。腫瘤的發(fā)生、發(fā)展、轉(zhuǎn)移、惡化都與基因突變有著密切聯(lián)系。 腫瘤的發(fā)生是各種遺傳和環(huán)境的致癌因素引起的基因突變和多種突變長(zhǎng)期積累的結(jié)果。突 變的發(fā)生和積累導(dǎo)致了原癌基因的激活和抑癌基因的失活,進(jìn)而引起DNA損傷修復(fù)和(或) 細(xì)胞周期和(或)編程性死亡機(jī)制的失調(diào),繼而引起細(xì)胞的轉(zhuǎn)化。轉(zhuǎn)化的細(xì)胞在與正常體細(xì) 胞生存競(jìng)爭(zhēng)的過(guò)程中,不斷進(jìn)化,最終變成具有無(wú)限增殖潛力的癌細(xì)胞,從而導(dǎo)致腫瘤的發(fā) 生。在癌細(xì)胞克隆性的無(wú)限擴(kuò)增過(guò)程中,其中一些克隆會(huì)獲得新的附加突變,選擇性地形成 具有不同特點(diǎn)的亞克隆(異質(zhì)化),從而獲得浸潤(rùn)和轉(zhuǎn)移的能力。
[0004]近年來(lái),隨著生物醫(yī)藥技術(shù)的不斷發(fā)展,以及"精準(zhǔn)醫(yī)學(xué)"概念的提出,癌癥的治療 觀念正在發(fā)生著由非特異性轉(zhuǎn)變?yōu)閭€(gè)體化的根本性轉(zhuǎn)變。該模式根據(jù)癌癥患者的個(gè)體信 息,提供個(gè)性化的高效治療方案。更有益于節(jié)省費(fèi)用、減少對(duì)病人的毒副作用和提高療效。 高通量測(cè)序技術(shù)的興起以及測(cè)序成本的大幅降低為個(gè)體化醫(yī)療的實(shí)現(xiàn)提供了極大的便利。 通過(guò)對(duì)癌癥患者活檢樣本提取的DNA進(jìn)行測(cè)序及后續(xù)生物信息分析,就可快速得出全面、準(zhǔn) 確的患者突變信息。根據(jù)突變信息對(duì)患者進(jìn)行分組,進(jìn)行針對(duì)性的治療及療效評(píng)估。
[0005] 從測(cè)序數(shù)據(jù)到病人突變的信息的獲得基本可通過(guò)序列比對(duì)和突變查找兩個(gè)步驟 實(shí)現(xiàn)。為了充分挖掘測(cè)序數(shù)據(jù)中的變異信息,科學(xué)家開(kāi)發(fā)了很多比對(duì)軟件和變異檢測(cè)軟件, 并將他們組合成各種分析流程。一個(gè)典型的流程包含比對(duì)軟件和變異檢測(cè)軟件:其中比對(duì) 軟件將測(cè)序結(jié)果比對(duì)到參考基因組上;突變檢測(cè)軟件把鑒定出的突變位點(diǎn)進(jìn)行基因型分 配。目前最常用的突變查找軟件包括SAMtools、glftools,、GATK和Atlas2。例如與Ion Torrent半導(dǎo)體測(cè)序系統(tǒng)配套的突變查找軟件VariantCaller v3.0是基于GATK的。已有研 究表明GATK軟件具有相對(duì)最高的重新發(fā)現(xiàn)率和特異性,且其Ti/Tv比值也最接近3.02的理 想值,在高通量測(cè)序數(shù)據(jù)分析上相對(duì)其他三個(gè)軟件具有明顯的優(yōu)勢(shì)。盡管如此,GATK軟件在 突變查找上仍然存在一些漏檢和假陽(yáng)性現(xiàn)象。

【發(fā)明內(nèi)容】

[0006] 本發(fā)明提供了高通量測(cè)序突變檢測(cè)結(jié)果的驗(yàn)證方法和利用高通量測(cè)序結(jié)果進(jìn)行 突變查找的方法,所述方法結(jié)合數(shù)學(xué)計(jì)算和統(tǒng)計(jì)公式,能夠給出準(zhǔn)確而全面的突變查找結(jié) 果,并能夠?qū)Ω咄繙y(cè)序突變檢測(cè)結(jié)果中感興趣突變進(jìn)行突變頻率的計(jì)算和真實(shí)性的驗(yàn) 證,。本發(fā)明的方法可以有效避免現(xiàn)有的數(shù)據(jù)分析方法中可能存在的漏檢和假陽(yáng)性現(xiàn)象。
[0007] 本發(fā)明利用下述三個(gè)公式中的一個(gè)或多個(gè),對(duì)高通量測(cè)序突變檢測(cè)結(jié)果中的感興 趣突變進(jìn)行驗(yàn)證,或者在高通量測(cè)序結(jié)果的基礎(chǔ)上進(jìn)行突變查找:
[0008] 公式 a:
[0009] 公式 b:
[0010] 公式 c:
[0011]在公式a中,mut_reads是高通量測(cè)序結(jié)果中所述感興趣的單個(gè)位點(diǎn)的特定堿基取 代的reads數(shù),cov_reads是高通量測(cè)序結(jié)果中所述單個(gè)位點(diǎn)的覆蓋度(coverage)。
[0012]在公式b中,del/mnp_readsi是高通量測(cè)序結(jié)果中所述感興趣的連續(xù)位點(diǎn)的堿基 缺失中第i個(gè)位點(diǎn)上堿基缺失的reads數(shù),或所述感興趣的連續(xù)位點(diǎn)的特定堿基取代中第i 個(gè)位點(diǎn)上特定堿基取代的reads數(shù);cov_readsi是高通量測(cè)序結(jié)果中所述的第i個(gè)位點(diǎn)相應(yīng) 的覆蓋度(coverage); m是高通量測(cè)序結(jié)果中所述感興趣的連續(xù)位點(diǎn)的堿基缺失中的突變 位點(diǎn)總數(shù),或所述感興趣的連續(xù)位點(diǎn)的特定堿基取代的突變位點(diǎn)總數(shù)。
[0013] 在公式〇中,std(del/mnp_reads)是高通量測(cè)序結(jié)果中感興趣的連續(xù)位點(diǎn)的堿基 缺失中所有位點(diǎn)上堿基缺失的reads數(shù)的標(biāo)準(zhǔn)差,或感興趣的連續(xù)位點(diǎn)的特定堿基取代中 所有位點(diǎn)上的特定堿基取代的reads數(shù)的標(biāo)準(zhǔn)差;ave(del/mnp_reads)是高通量測(cè)序結(jié)果 中感興趣的連續(xù)位點(diǎn)的堿基缺失中所有位點(diǎn)上堿基缺失的reads數(shù)的平均值,或感興趣的 連續(xù)位點(diǎn)的特定堿基取代中所有位點(diǎn)上的特定堿基取代的reads數(shù)的平均值;CV( de 1 /mnp) 為變異系數(shù)。
[0014] 其中公式a用于確定感興趣的單個(gè)位點(diǎn)的特定堿基取代是否存在,并且如果存在 的話,計(jì)算所述特定堿基取代的突變頻率。如果freq(snp) 2 0.5%,則存在所述感興趣的單 個(gè)位點(diǎn)的特定堿基取代,且其突變頻率等于計(jì)算得到的freq( snp)的值。
[0015] 其中公式b用于計(jì)算感興趣的連續(xù)位點(diǎn)的堿基缺失或感興趣的連續(xù)位點(diǎn)的特定堿 基取代的突變頻率,同時(shí)也可以驗(yàn)證感興趣的連續(xù)位點(diǎn)的堿基缺失或感興趣的連續(xù)位點(diǎn)的 特定堿基取代是否存在。如果freq(del/mnp) 2 0.5%,則可能存在所述感興趣的連續(xù)位點(diǎn) 的堿基缺失或感興趣的連續(xù)位點(diǎn)的特定堿基取代,且其突變頻率等于計(jì)算得到的freq (de 1 /mnp)的值。如果f req(de 1 /mnp)〈0.5 %,貝lj不存在所述感興趣的連續(xù)位點(diǎn)的堿基缺失 或感興趣的連續(xù)位點(diǎn)的特定堿基取代。
[0016] 其中公式c用于確定感興趣的連續(xù)位點(diǎn)的堿基缺失或感興趣的連續(xù)位點(diǎn)的特定堿 基取代是否真實(shí)存在。如果變異系數(shù)CV(del/mnp)〈15%,則所述感興趣的連續(xù)位點(diǎn)的堿基 缺失或所述感興趣的連續(xù)位點(diǎn)的特定堿基取代可能是真實(shí)存在的,如果變異系數(shù)CV(del/ mnp) 2 15%,則所述感興趣的連續(xù)位點(diǎn)的堿基缺失或所述感興趣的連續(xù)位點(diǎn)的特定堿基取 代不存在。
[0017]將公式b和公式c結(jié)合可以準(zhǔn)確確定所述感興趣的連續(xù)位點(diǎn)的堿基缺失或所述感 興趣的連續(xù)位點(diǎn)的特定堿基取代是否存在。當(dāng)freq(del/mnp) 2 0.5%且變異系數(shù)<^((161/ mnp)〈 15 %時(shí),可以確定所述感興趣的連續(xù)位點(diǎn)的堿基缺失或所述感興趣的連續(xù)位點(diǎn)的特 定喊基取代是真實(shí)存在的。
[0018] 運(yùn)用變異系數(shù)來(lái)確定感興趣的連續(xù)位點(diǎn)的堿基缺失或感興趣的連續(xù)位點(diǎn)的特定 堿基取代是否真實(shí)存在的原理是:對(duì)于已知或常見(jiàn)的連續(xù)位點(diǎn)的堿基缺失或連續(xù)位點(diǎn)的堿 基取代,在進(jìn)行二代高通量測(cè)序時(shí),若所測(cè)的DNA樣品存在所述類型的突變,則該突變區(qū)域 內(nèi)包含的各個(gè)位點(diǎn)所測(cè)出的缺失或被取代的reads數(shù)在絕大部分情況下應(yīng)是相同或相近 的,即這些位點(diǎn)的缺失或取代的突變頻率應(yīng)該基本一致,因此可以通過(guò)計(jì)算這些各個(gè)位點(diǎn) 上reads數(shù)的離散程度來(lái)評(píng)估它們的一致性或相近度,如果它們的離散程度過(guò)大,則說(shuō)明這 些位點(diǎn)的缺失或取代的reads數(shù)可能為隨機(jī)引進(jìn)的測(cè)序錯(cuò)誤,或者僅存在某單個(gè)位點(diǎn)的缺 失或取代;而如果它們的離散程度較小,則說(shuō)明該段區(qū)域位點(diǎn)可能確實(shí)存在統(tǒng)一的缺失或 取代情況,可以進(jìn)一步進(jìn)行計(jì)算或驗(yàn)證。CV值又稱變異系數(shù),統(tǒng)計(jì)學(xué)通常使用CV值來(lái)評(píng)估離 散程度,在統(tǒng)計(jì)學(xué)領(lǐng)域中,一般認(rèn)為當(dāng)CV值大于15%時(shí)說(shuō)明該系列數(shù)據(jù)的離散程度過(guò)大,而 當(dāng)CV值小于15%時(shí)則認(rèn)為該系列數(shù)據(jù)的離散程度在可接受范圍內(nèi)。
[0019] 因此,利用上述公式a、b和/或c可以確定高通量測(cè)序樣本中是否存在感興趣的單 個(gè)位點(diǎn)的特定堿基取代、感興趣的連續(xù)位點(diǎn)的堿基缺失、和/或感興趣的連續(xù)位點(diǎn)的特定堿 基取代,或者對(duì)高通量測(cè)序突變檢測(cè)結(jié)果中這些突變的存在或不存在的真實(shí)性進(jìn)行驗(yàn)證。
[0020] 因此,本發(fā)明的一方面提供高通量測(cè)序突變檢測(cè)結(jié)果的驗(yàn)證方法,包括對(duì)所述突 變檢測(cè)結(jié)果中感興趣的連續(xù)位點(diǎn)的堿基缺失或感興趣的連續(xù)位點(diǎn)的特定堿基取代的檢測(cè) 結(jié)果進(jìn)行驗(yàn)證,所述方法包括:
[0021] (1)對(duì)于所述突變檢測(cè)結(jié)果中確定為存在的感興趣的連續(xù)位點(diǎn)的堿基缺失或感興 趣的連續(xù)位點(diǎn)的特定堿基取代,按照下述公式計(jì)算所述感興趣的連續(xù)位點(diǎn)的堿基缺失或感 興趣的連續(xù)位點(diǎn)的特定堿基取代的變異系數(shù):
[0022]
[0023]其中:
[0024] std(del/mnp_reads)是高通量測(cè)序結(jié)果中所述感興趣的連續(xù)位點(diǎn)的堿基缺失中 所有位點(diǎn)上堿基缺失的reads數(shù)的標(biāo)準(zhǔn)差,或所述感興趣的連續(xù)位點(diǎn)的特定堿基取代中所 有位點(diǎn)上的特定堿基取代的reads數(shù)的標(biāo)準(zhǔn)差,
[0025] ave(del/mnp_reads)是高通量測(cè)序結(jié)果中所述感興趣的連續(xù)位點(diǎn)的堿基缺失中 所有位點(diǎn)上堿基缺失的reads數(shù)的平均值,或所述感興趣的連續(xù)位點(diǎn)的特定堿基取代中所 有位點(diǎn)上的特定堿基取代的reads數(shù)的平均值;
[0026]如果CV(del/mnp)〈15%,則所述感興趣的連續(xù)位點(diǎn)的堿基缺失或所述感興趣的連 續(xù)位點(diǎn)的特定堿基取代真實(shí)存在,如果CV(del/mnp) 2 15%,則所述感興趣的連續(xù)位點(diǎn)的堿 基缺失或所述感興趣的連續(xù)位點(diǎn)的特定堿基取代不存在。
[0027]在一些實(shí)施方案中,本發(fā)明的高通量測(cè)序突變檢測(cè)結(jié)果的驗(yàn)證方法包括驗(yàn)證突變 檢測(cè)結(jié)果中確定為不存在的感興趣的連續(xù)位點(diǎn)的堿基缺失或感興趣的連續(xù)位點(diǎn)的特定堿 基取代在高通量測(cè)序樣本中是否存在的步驟,該步驟可以是先計(jì)算突變頻率再驗(yàn)證變異系 數(shù),也可以是先計(jì)算變異系數(shù)再驗(yàn)證突變頻率。
[0028] 先計(jì)算突變頻率再驗(yàn)證變異系數(shù)的步驟是:
[0029] (2)對(duì)于所述突變檢測(cè)結(jié)果中確定為不存在的感興趣的連續(xù)位點(diǎn)的堿基缺失或感 興趣的連續(xù)位點(diǎn)的特定堿基取代,按照下述公式計(jì)算所述感興趣的連續(xù)位點(diǎn)的堿基缺失或 感興趣的連續(xù)位點(diǎn)的特定堿基取代的突變頻率:
[0030]
[0031] 其中:
[0032] del/mnp_readsi是高通量測(cè)序結(jié)果中所述感興趣的連續(xù)位點(diǎn)的堿基缺失中第i個(gè) 位點(diǎn)上堿基缺失的reads數(shù),或所述感興趣的連續(xù)位點(diǎn)的特定堿基取代中第i個(gè)位點(diǎn)上特定 堿基取代的reads數(shù),
[0033] cov_readsi是高通量測(cè)序結(jié)果中所述的第i個(gè)位點(diǎn)相應(yīng)的覆蓋度(coverage), [0034] m是高通量測(cè)序結(jié)果中所述感興趣的連續(xù)位點(diǎn)的堿基缺失中的突變位點(diǎn)總數(shù),或 所述感興趣的連續(xù)位點(diǎn)的特定堿基取代的突變位點(diǎn)總數(shù);
[0035]如果;^69((161/1]1即)〈0.5%,則所述感興趣的連續(xù)位點(diǎn)的堿基缺失或感興趣的連 續(xù)位點(diǎn)的特定堿基取代不存在,如果freq(del/mnp) 2 0.5%,則按下述步驟對(duì)所述感興趣 的連續(xù)位點(diǎn)的堿基缺失或感興趣的連續(xù)位點(diǎn)的特定堿基取代進(jìn)行進(jìn)一步驗(yàn)證:
[0036] 按照下述公式計(jì)算所述感興趣的連續(xù)位點(diǎn)的堿基缺失或感興趣的連續(xù)位點(diǎn)的特 定堿基取代的變異系數(shù):
[0037]
[0038] 其中:
[0039] std(del/mnp_reads)是高通量測(cè)序結(jié)
當(dāng)前第1頁(yè)1 2 3 4 5 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
得荣县| 南充市| 彰武县| 建阳市| 衡水市| 河池市| 睢宁县| 抚远县| 南开区| 微山县| 临猗县| 濮阳市| 卓尼县| 辽阳县| 漳平市| 广平县| 合山市| 巨鹿县| 新平| 鄄城县| 台安县| 安西县| 鱼台县| 平舆县| 屯门区| 黄骅市| 格尔木市| 施秉县| 临朐县| 临海市| 多伦县| 古交市| 千阳县| 井研县| 大埔县| 奎屯市| 宁晋县| 师宗县| 临城县| 南溪县| 定陶县|