測(cè)序數(shù)據(jù)分析工作站系統(tǒng)的制作方法
【專利摘要】一種高整合度的測(cè)序數(shù)據(jù)分析工作站系統(tǒng),由主機(jī),輸入輸出單元組成。所述的主機(jī)由系統(tǒng)模塊、電源管理模塊、并行流處理器以及高速存儲(chǔ)設(shè)備組成。使用全圖形操作界面,用戶所有操作均可以通過(guò)圖形界面完成,避免記憶舊式的繁瑣命令以及腳本和程序開(kāi)發(fā)方式,具有快速簡(jiǎn)便的測(cè)序分析功能,能夠?yàn)橛脩籼峁┍镜鼗?、定制化且方便快捷的測(cè)序分析功能及報(bào)告功能。
【專利說(shuō)明】測(cè)序數(shù)據(jù)分析工作站系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本實(shí)用新型涉及一種用于測(cè)序數(shù)據(jù)分析的工作站系統(tǒng)。
【背景技術(shù)】
[0002]基因是遺傳的物質(zhì)基礎(chǔ)。生物體的生老病死等一切生命現(xiàn)象都與基因有關(guān)?;驕y(cè)序是解讀生命的一種途徑,隨著第二代及第三代高通量測(cè)序技術(shù)的發(fā)展,測(cè)序結(jié)果往往是TB級(jí)別甚至更大的的序列數(shù)據(jù)。合理分析解讀這些大規(guī)模及高維度的數(shù)據(jù)成為獲取數(shù)據(jù)后一個(gè)更大的難點(diǎn),是當(dāng)前生物研究的關(guān)鍵步驟,具有巨大的現(xiàn)實(shí)意義。
[0003]海量高通量測(cè)序數(shù)據(jù)的存儲(chǔ)、處理和分析都極大地挑戰(zhàn)著當(dāng)前的計(jì)算機(jī)系統(tǒng)和計(jì)算模式?,F(xiàn)有的系統(tǒng)面臨運(yùn)算量不夠,人工干預(yù)可靠度較低,云架構(gòu)對(duì)底層硬件控制力較低及用戶隱私擔(dān)憂等問(wèn)題。
[0004]因此,現(xiàn)有的大數(shù)據(jù)測(cè)序信息對(duì)數(shù)據(jù)分析工具的挑戰(zhàn)需要存儲(chǔ)、管理、傳輸、調(diào)度和計(jì)算分析全面協(xié)調(diào),需要生物領(lǐng)域、計(jì)算機(jī)領(lǐng)域、數(shù)據(jù)統(tǒng)計(jì)分析等多方密切配合,長(zhǎng)久積累深入,針對(duì)高通量測(cè)序數(shù)據(jù)及其分析使用特點(diǎn),才能開(kāi)發(fā)出更高效實(shí)用的系統(tǒng)模式。
實(shí)用新型內(nèi)容
[0005]本實(shí)用新型的目的是提供一種高整合度的測(cè)序數(shù)據(jù)分析工作站系統(tǒng)。
[0006]所述的測(cè)序數(shù)據(jù)分析工作站系統(tǒng)由主機(jī),輸入輸出單元組成。
[0007]所述主機(jī)可以工作在單節(jié)點(diǎn)模式下,也可以根據(jù)運(yùn)算需求進(jìn)行平滑彈性擴(kuò)容。
[0008]所述的主機(jī)由系統(tǒng)模塊、電源管理模塊、并行流處理器以及高速存儲(chǔ)設(shè)備組成。
[0009]所述的系統(tǒng)模塊由高性能處理器及大容量?jī)?nèi)存組成,用于支撐操作系統(tǒng)及基礎(chǔ)數(shù)據(jù)交換,電源管理模塊用于優(yōu)化系統(tǒng)功耗;
[0010]所述的并行流處理器采用為科學(xué)運(yùn)算流處理器,單位運(yùn)算能力功耗比高于18.05TFlops/sKwo匹配使用專門針對(duì)流處理器的測(cè)序數(shù)據(jù)優(yōu)化算法,實(shí)現(xiàn)對(duì)測(cè)序數(shù)據(jù)的匹配及運(yùn)算等處理,在相同條件下對(duì)測(cè)序數(shù)據(jù)處理能力是傳統(tǒng)組裝工具的5倍以上。
[0011]所述的高速存儲(chǔ)設(shè)備以ssd作為關(guān)鍵數(shù)據(jù)緩存,輔以大容量存儲(chǔ)設(shè)備進(jìn)行海量存儲(chǔ)。
[0012]所述的測(cè)序數(shù)據(jù),直接來(lái)源于illumina公司的Hiseq系列的測(cè)序儀、ThermoFisher公司的PGM及Proton系列測(cè)序儀,數(shù)據(jù)級(jí)別為Mb?Gb大小,基礎(chǔ)長(zhǎng)度10?lOOObp,數(shù)據(jù)格式為FastQ或SFF格式。
[0013]所述的存儲(chǔ)設(shè)備內(nèi)置完整的人類及微生物基因數(shù)據(jù)庫(kù),與系統(tǒng)模塊無(wú)縫銜接。根據(jù)用戶需求調(diào)整數(shù)據(jù)庫(kù)類型,本地化的內(nèi)置數(shù)據(jù)庫(kù)將大大減少用戶的數(shù)據(jù)上傳和下載時(shí)間,并同時(shí)減少用戶數(shù)據(jù)泄密的風(fēng)險(xiǎn)。
[0014]所述的輸入單元可以是直接輸入數(shù)據(jù)源的外接硬盤,也可以使用千兆以太網(wǎng)卡進(jìn)行直接數(shù)據(jù)傳輸,或是可以直接偶聯(lián)測(cè)序儀的輸出單元。
[0015]所述的輸出單元包括具備單一顯示功能的顯示單元、或是集成了人機(jī)交互功能的顯示單元、或是直接輸出結(jié)果報(bào)告的顯示單元、或是千兆以太網(wǎng)直接輸出三種方式。
[0016]工作站系統(tǒng)使用全圖形操作界面,用戶所有操作均可以通過(guò)圖形界面完成,避免記憶舊式的繁瑣命令以及腳本和程序開(kāi)發(fā)方式。通過(guò)可視化圖形開(kāi)發(fā)環(huán)境創(chuàng)建業(yè)務(wù)和工作流可以大大簡(jiǎn)化用戶的應(yīng)用創(chuàng)建成本。主機(jī)平臺(tái)提供整個(gè)應(yīng)用產(chǎn)品生命周期管理,供用戶使用。
[0017]本實(shí)用新型所述的工作站系統(tǒng)設(shè)計(jì)結(jié)構(gòu)緊湊,高度整合各個(gè)功能模塊后,整個(gè)測(cè)序數(shù)據(jù)分析的工作站系統(tǒng)具有快速簡(jiǎn)便的測(cè)序分析功能,能夠?yàn)橛脩籼峁┍镜鼗?、定制化且方便快捷的測(cè)序分析功能及報(bào)告功能。
【專利附圖】
【附圖說(shuō)明】
[0018]圖1、測(cè)序數(shù)據(jù)分析工作站系統(tǒng)主機(jī)結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0019]實(shí)施例1
[0020]測(cè)序數(shù)據(jù)分析工作站系統(tǒng),該系統(tǒng)由主機(jī),顯示輸出設(shè)備,輸入設(shè)備組成。
[0021]附圖1所示的主機(jī),由系統(tǒng)模塊(1)、電源管理模塊(3)、并行流處理器⑵以及高速存儲(chǔ)設(shè)備(4)組成。針對(duì)二代測(cè)序的大數(shù)據(jù)實(shí)現(xiàn)復(fù)原、分析、及統(tǒng)計(jì)等功能。所述的系統(tǒng)模塊用于支撐操作系統(tǒng)及基礎(chǔ)數(shù)據(jù)交換,電源管理模塊用于優(yōu)化系統(tǒng)功耗,并行流處理器實(shí)現(xiàn)對(duì)測(cè)序數(shù)據(jù)的匹配及運(yùn)算等處理,所述的流處理器單位運(yùn)算能力功耗比大于18.05TFlops/sKw,優(yōu)選采用Tesla系列科學(xué)運(yùn)算流處理器,匹配使用專門開(kāi)發(fā)的針對(duì)流處理器的測(cè)序數(shù)據(jù)優(yōu)化算法,在相同條件下對(duì)測(cè)序數(shù)據(jù)處理能力是傳統(tǒng)組裝工具的5倍以上。使用高速ssd作為關(guān)鍵數(shù)據(jù)緩存,輔以大容量存儲(chǔ)設(shè)備進(jìn)行海量存儲(chǔ)。
[0022]所述的輸出單元是單一顯示功能的顯示單元。
[0023]所述的輸入單元是通過(guò)偶聯(lián)外部硬盤作為輸入數(shù)據(jù)來(lái)源,實(shí)現(xiàn)測(cè)序數(shù)據(jù)的輸入。
[0024]以上實(shí)施例僅作為對(duì)本實(shí)用新型的一個(gè)實(shí)例幫助本領(lǐng)域技術(shù)人員理解實(shí)用新型的實(shí)質(zhì),并不用作對(duì)保護(hù)范圍的限定。
【權(quán)利要求】
1.一種高整合度的測(cè)序數(shù)據(jù)分析工作站系統(tǒng),其特征在于,由主機(jī),輸入輸出單元組成,所述主機(jī)可以工作在單節(jié)點(diǎn)模式下,也可以根據(jù)運(yùn)算需求進(jìn)行平滑彈性擴(kuò)容。
2.根據(jù)權(quán)利要求1所述的測(cè)序數(shù)據(jù)分析工作站系統(tǒng),其特征在于,所述的主機(jī)由系統(tǒng)模塊、電源管理模塊、并行流處理器以及高速存儲(chǔ)設(shè)備組成, 所述的系統(tǒng)模塊由高性能處理器及大容量?jī)?nèi)存組成,用于支撐操作系統(tǒng)及基礎(chǔ)數(shù)據(jù)交換,電源管理模塊用于優(yōu)化系統(tǒng)功耗; 所述的并行流處理器采用科學(xué)運(yùn)算流處理器,單位運(yùn)算能力功耗比高于18.051^101)8/ 匹配使用專門針對(duì)流處理器的測(cè)序數(shù)據(jù)優(yōu)化算法,實(shí)現(xiàn)對(duì)測(cè)序數(shù)據(jù)的匹配及運(yùn)算等處理; 所述的高速存儲(chǔ)設(shè)備以88(1作為關(guān)鍵數(shù)據(jù)緩存,輔以大容量存儲(chǔ)設(shè)備進(jìn)行海量存儲(chǔ)。
3.根據(jù)權(quán)利要求2所述的測(cè)序數(shù)據(jù)分析工作站系統(tǒng),其特征在于,所述的測(cè)序數(shù)據(jù),直接來(lái)源于1111111111181公司的11186(1系列的測(cè)序儀、也一!"公司的及系列測(cè)序儀,數(shù)據(jù)級(jí)別為她?(?大小,基礎(chǔ)長(zhǎng)度10?1000如,數(shù)據(jù)格式為化8切或3??格式。
4.根據(jù)權(quán)利要求2所述的測(cè)序數(shù)據(jù)分析工作站系統(tǒng),其特征在于,所述的存儲(chǔ)設(shè)備內(nèi)置完整的人類及微生物基因數(shù)據(jù)庫(kù)。
5.根據(jù)權(quán)利要求1所述的測(cè)序數(shù)據(jù)分析工作站系統(tǒng),其特征在于,所述的輸入單元是直接輸入數(shù)據(jù)源的外接硬盤,或使用千兆以太網(wǎng)卡進(jìn)行直接數(shù)據(jù)傳輸,或直接偶聯(lián)測(cè)序儀的輸出單兀。
6.根據(jù)權(quán)利要求1所述的測(cè)序數(shù)據(jù)分析工作站系統(tǒng),其特征在于,所述的輸出單元為具備單一顯示功能的顯示單元、或是集成了人機(jī)交互功能的顯示單元、或是直接輸出結(jié)果報(bào)告的顯示單元、或是千兆以太網(wǎng)直接輸出三種方式。
7.根據(jù)權(quán)利要求1-6任一所述的工作站系統(tǒng),其特征在于,所述的系統(tǒng)使用全圖形操作界面。
【文檔編號(hào)】G06F19/22GK204129738SQ201420617529
【公開(kāi)日】2015年1月28日 申請(qǐng)日期:2014年10月24日 優(yōu)先權(quán)日:2014年10月24日
【發(fā)明者】吳翀, 王瑜, 李國(guó)強(qiáng), 項(xiàng)博, 閆威 申請(qǐng)人:北京微旋基因技術(shù)有限公司