1.一種長鏈非編碼RNA的高通量芯片處理及分析流程控制方法,其特征在于:包括如下步驟:
步驟1,自定義參數(shù)配置文件的生成:導(dǎo)入長鏈非編碼RNA高通量原始芯片數(shù)據(jù),經(jīng)過信號(hào)值篩選和標(biāo)準(zhǔn)化得到理論上有效的長鏈非編碼RNA,在此基礎(chǔ)上進(jìn)行生物信息學(xué)參數(shù)分析;
步驟2,輸入步驟:用戶根據(jù)需要,輸入設(shè)定的各參數(shù)配置文件;
步驟3,分析步驟:根據(jù)上述步驟輸入設(shè)定的參數(shù)配置文件,通過長鏈非編碼RNA高通量數(shù)據(jù)處理流程模塊生成對(duì)應(yīng)的自動(dòng)化分析流程;
步驟4,執(zhí)行及輸出步驟:執(zhí)行上述步驟所生成的自動(dòng)化分析流程,獲得并輸出長鏈非編碼RNA分析結(jié)果報(bào)告。
2.根據(jù)權(quán)利要求1所述的長鏈非編碼RNA的高通量芯片處理及分析流程控制方法,其特征在于:所述的步驟1具體包括如下步驟:
步驟1.1,導(dǎo)入長鏈非編碼RNA高通量芯片原始信號(hào)值文件;
步驟1.2,對(duì)上述步驟導(dǎo)入的長鏈非編碼RNA高通量芯片原始信號(hào)文件進(jìn)行質(zhì)量分析并剔除低質(zhì)量信號(hào)數(shù)據(jù),獲得經(jīng)過篩選的信號(hào)數(shù)據(jù);
步驟1.3,將上述步驟獲得的經(jīng)過篩選的數(shù)據(jù)進(jìn)行前景值和背景值校正,得到消除噪音污染的長鏈非編碼RNA信號(hào)數(shù)據(jù);
步驟1.4,將上述步驟得到的信號(hào)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,并去除極值,得到理論上有效的長鏈非編碼RNA表達(dá)值。
3.根據(jù)權(quán)利要求2所述的長鏈非編碼RNA的高通量芯片處理及分析流程控制方法,其特征在于:所述的步驟1.2中,所述低質(zhì)量信號(hào)數(shù)據(jù)是指掃描 微陣列芯片熒光強(qiáng)度作為RNA表達(dá)信號(hào)值且熒光強(qiáng)度小于30的數(shù)據(jù),同一探針的重復(fù)信號(hào)數(shù)據(jù)采用中位數(shù)計(jì)算法取中位值作為該探針的表達(dá)值。
4.根據(jù)權(quán)利要求2所述的長鏈非編碼RNA的高通量芯片處理及分析流程控制方法,其特征在于:所述的步驟1.3中,使用針對(duì)Affymetrix芯片原理設(shè)計(jì)的Affy軟件包中的MAS5或者RMA方法根據(jù)不同的芯片類型進(jìn)行芯片數(shù)據(jù)預(yù)處理,不同的芯片類型是指單、雙色通道;MAS5得到的數(shù)據(jù)是原始信號(hào)強(qiáng)度,RMA得到的是經(jīng)過對(duì)數(shù)變換的信號(hào)值。
5.根據(jù)權(quán)利要求2所述的長鏈非編碼RNA的高通量芯片處理及分析流程控制方法,其特征在于:所述的步驟1.4中,使用limma軟件包進(jìn)行芯片間歸一化,得到標(biāo)準(zhǔn)化的長鏈非編碼RNA表達(dá)譜數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的長鏈非編碼RNA的高通量芯片處理及分析流程控制方法,其特征在于:所述的步驟1中,生物信息學(xué)參數(shù)分析包括差異表達(dá)長鏈非編碼RNA的篩選,長鏈非編碼RNA的功能性分析和對(duì)長鏈非編碼RNA的調(diào)控機(jī)制分析。
7.根據(jù)權(quán)利要求6所述的長鏈非編碼RNA的高通量芯片處理及分析流程控制方法,其特征在于:所述的差異表達(dá)長鏈非編碼RNA的篩選包括輸入指令選取1.5倍或者2倍的差異倍數(shù),選用三個(gè)標(biāo)準(zhǔn)Benjamini–Hochberg方法、FDR方法或者Bonforroni方法校正P-value得到差異表達(dá)的長鏈非編碼RNA。
8.根據(jù)權(quán)利要求6所述的長鏈非編碼RNA的高通量芯片處理及分析流程控制方法,其特征在于:所述的對(duì)長鏈非編碼RNA的功能性分析包括長鏈 非編碼RNA和基因數(shù)據(jù)的共表達(dá)分析,基因本體分析,代謝通路分析,化學(xué)反應(yīng)分析和調(diào)控網(wǎng)絡(luò)的構(gòu)建;
其中,所述的長鏈非編碼RNA和基因數(shù)據(jù)的共表達(dá)分析采用Pearson相關(guān)系數(shù)法或Spearman相關(guān)系數(shù)法,相關(guān)系數(shù)>=0.9,Benjamini–Hochberg方法、FDR方法或者Bonforroni方法校正P-value;
所述的基因本體分析采用g:Profiler法從生物過程、分子功能和細(xì)胞組分三個(gè)成分進(jìn)行注釋和富集分析;
所述的代謝通路分析和化學(xué)反應(yīng)分析采用g:Profiler法通過KEGG和Reactive數(shù)據(jù)庫信息進(jìn)行分析。
9.根據(jù)權(quán)利要求6所述的長鏈非編碼RNA的高通量芯片處理及分析流程控制方法,其特征在于:對(duì)長鏈非編碼RNA的調(diào)控機(jī)制分析包括intergenic類型的長鏈非編碼RNA的篩選,長鏈非編碼RNA的microRNA結(jié)合位點(diǎn)預(yù)測,microRNA靶基因預(yù)測和競爭性內(nèi)源RNA調(diào)控網(wǎng)絡(luò)的構(gòu)建;
其中,所述的intergenic類型的長鏈非編碼RNA的篩選整合國際權(quán)威數(shù)據(jù)庫RefSeq、UCSC、GENCODE、RNAdb、NRED和UCR數(shù)據(jù)庫信息;
所述的長鏈非編碼RNA的microRNA結(jié)合位點(diǎn)預(yù)測采用miRWalk和DIANA-lncbase數(shù)據(jù)庫信息;
所述的microRNA靶基因預(yù)測采用miRWalk和TargetScan數(shù)據(jù)庫信息。