本發(fā)明涉及油氣項目地質(zhì)及油氣藏評價,尤其涉及一種油氣參數(shù)確定方法及裝置。
背景技術(shù):
1、本部分旨在為本發(fā)明實施例提供背景或上下文。此處的描述不因為包括在本部分中就承認是現(xiàn)有技術(shù)。
2、油公司開展油氣項目交易時,需要對目標(biāo)區(qū)塊和目標(biāo)油氣田進行評估和評價。在油氣新項目的技術(shù)經(jīng)濟評價過程中,由于獲取的區(qū)塊勘探程度不同、獲取的油氣田數(shù)據(jù)不全、數(shù)據(jù)格式不統(tǒng)一、標(biāo)準(zhǔn)不一致、數(shù)據(jù)項缺失以及數(shù)據(jù)解讀難度大等等問題。在所有問題中,參數(shù)的缺失對評價影響巨大。對于缺失的參數(shù),目前主要由石油地質(zhì)和油氣藏工程專家的經(jīng)驗判斷,不僅耗時長,和真實情況偏離度高,且受主觀因素影響比較大,難以滿足高效、精確的評價需求。
技術(shù)實現(xiàn)思路
1、本發(fā)明實施例提供一種油氣參數(shù)確定方法,用以提高缺失油氣參數(shù)確定的準(zhǔn)確度及效率,該方法包括:
2、獲取多種歷史油氣參數(shù)數(shù)據(jù)及待確定樣本;待確定樣本為至少一個數(shù)據(jù)值缺失的實時油氣參數(shù)數(shù)據(jù);
3、根據(jù)待確定樣本,利用相關(guān)性分析算法,在多種歷史油氣參數(shù)數(shù)據(jù)中篩選第一油氣參數(shù)數(shù)據(jù),將第一油氣參數(shù)數(shù)據(jù)確定為訓(xùn)練樣本;所述第一油氣參數(shù)數(shù)據(jù)為與待確定樣本的相關(guān)性高于預(yù)設(shè)相關(guān)性閾值的多種油氣參數(shù)數(shù)據(jù);
4、根據(jù)訓(xùn)練樣本中數(shù)據(jù)的類別給訓(xùn)練樣本添加標(biāo)簽;
5、利用預(yù)設(shè)的高斯核距離關(guān)聯(lián)關(guān)系,計算待確定樣本與添加標(biāo)簽后的訓(xùn)練樣本的距離;
6、將按照距離從小到大進行排序后的前預(yù)設(shè)數(shù)量的訓(xùn)練樣本確定為鄰居樣本;
7、根據(jù)鄰居樣本、待確定樣本及預(yù)設(shè)的高斯核標(biāo)準(zhǔn)差,利用knn(k?nearestneighbors,k鄰近)算法確定待確定樣本中缺失的數(shù)據(jù)值。
8、本發(fā)明實施例還提供一種油氣參數(shù)確定裝置,用以提高缺失油氣參數(shù)確定的準(zhǔn)確度及效率,該裝置包括:
9、獲取模塊,用于獲取多種歷史油氣參數(shù)數(shù)據(jù)及待確定樣本;待確定樣本為至少一個數(shù)據(jù)值缺失的實時油氣參數(shù)數(shù)據(jù);
10、訓(xùn)練樣本確定模塊,用于根據(jù)待確定樣本,利用相關(guān)性分析算法,在多種歷史油氣參數(shù)數(shù)據(jù)中篩選第一油氣參數(shù)數(shù)據(jù),將第一油氣參數(shù)數(shù)據(jù)確定為訓(xùn)練樣本;所述第一油氣參數(shù)數(shù)據(jù)為與待確定樣本的相關(guān)性高于預(yù)設(shè)相關(guān)性閾值的多種油氣參數(shù)數(shù)據(jù);
11、標(biāo)簽添加模塊,用于根據(jù)訓(xùn)練樣本中數(shù)據(jù)的類別給訓(xùn)練樣本添加標(biāo)簽;
12、距離確定模塊,用于利用預(yù)設(shè)的高斯核距離關(guān)聯(lián)關(guān)系,計算待確定樣本與添加標(biāo)簽后的訓(xùn)練樣本的距離;
13、鄰居樣本確定模塊,用于將按照距離從小到大進行排序后的前預(yù)設(shè)數(shù)量的訓(xùn)練樣本確定為鄰居樣本;
14、缺失數(shù)據(jù)確定模塊,用于根據(jù)鄰居樣本、待確定樣本及預(yù)設(shè)的高斯核標(biāo)準(zhǔn)差,利用knn算法確定待確定樣本中缺失的數(shù)據(jù)值。
15、本發(fā)明實施例與現(xiàn)有技術(shù)中由石油地質(zhì)和油氣藏工程專家進行經(jīng)驗判斷的技術(shù)方案相比,通過獲取多種歷史油氣參數(shù)數(shù)據(jù)及待確定樣本;待確定樣本為至少一個數(shù)據(jù)值缺失的實時油氣參數(shù)數(shù)據(jù);根據(jù)待確定樣本,利用相關(guān)性分析算法,在多種歷史油氣參數(shù)數(shù)據(jù)中篩選第一油氣參數(shù)數(shù)據(jù),將第一油氣參數(shù)數(shù)據(jù)確定為訓(xùn)練樣本;所述第一油氣參數(shù)數(shù)據(jù)為與待確定樣本的相關(guān)性高于預(yù)設(shè)相關(guān)性閾值的多種油氣參數(shù)數(shù)據(jù);根據(jù)訓(xùn)練樣本中數(shù)據(jù)的類別給訓(xùn)練樣本添加標(biāo)簽;利用預(yù)設(shè)的高斯核距離關(guān)聯(lián)關(guān)系,計算待確定樣本與添加標(biāo)簽后的訓(xùn)練樣本的距離;將按照距離從小到大進行排序后的前預(yù)設(shè)數(shù)量的訓(xùn)練樣本確定為鄰居樣本;根據(jù)鄰居樣本、待確定樣本及預(yù)設(shè)的高斯核標(biāo)準(zhǔn)差,利用knn算法確定待確定樣本中缺失的數(shù)據(jù)值,能夠提高缺失油氣參數(shù)確定的準(zhǔn)確度及效率。
1.一種油氣參數(shù)確定方法,其特征在于,包括:
2.如權(quán)利要求1所述的方法,其特征在于,根據(jù)待確定樣本,利用相關(guān)性分析算法,在多種歷史油氣參數(shù)數(shù)據(jù)中篩選第一油氣參數(shù)數(shù)據(jù),將第一油氣參數(shù)數(shù)據(jù)確定為訓(xùn)練樣本,包括:
3.如權(quán)利要求1所述的方法,其特征在于,預(yù)設(shè)的高斯核距離關(guān)聯(lián)關(guān)系為:
4.如權(quán)利要求1所述的方法,其特征在于,在獲取多種歷史油氣參數(shù)數(shù)據(jù)之后,還包括:
5.如權(quán)利要求1所述的方法,其特征在于,所述相關(guān)性分析算法包括方差分析算法和/或卡方檢驗算法。
6.一種油氣參數(shù)確定裝置,其特征在于,包括:
7.如權(quán)利要求6所述的裝置,其特征在于,訓(xùn)練樣本確定模塊,具體用于:
8.如權(quán)利要求6所述的裝置,其特征在于,預(yù)設(shè)的高斯核距離關(guān)聯(lián)關(guān)系為:
9.如權(quán)利要求6所述的裝置,其特征在于,還包括:標(biāo)準(zhǔn)化處理模塊,用于:
10.如權(quán)利要求6所述的裝置,其特征在于,所述相關(guān)性分析算法包括方差分析算法和/或卡方檢驗算法。
11.一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執(zhí)行所述計算機程序時實現(xiàn)權(quán)利要求1至5任一所述方法。
12.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至5任一所述方法。
13.一種計算機程序產(chǎn)品,其特征在于,所述計算機程序產(chǎn)品包括計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)權(quán)利要求1至5任一所述方法。