基于貝葉斯分類(lèi)器的股票中長(zhǎng)期趨勢(shì)預(yù)測(cè)方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及專(zhuān)門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng) 或方法,尤其是一種基于貝葉斯分類(lèi)器的股票中長(zhǎng)期趨勢(shì)預(yù)測(cè)方法及系統(tǒng)。
【背景技術(shù)】
[0002] 股市是資本資源優(yōu)化配置的一個(gè)重要場(chǎng)所,掌握其變化規(guī)律不僅是投資者夢(mèng)寐以 求的事,也對(duì)宏觀國(guó)民經(jīng)濟(jì)的研宄和管理有著重要的現(xiàn)實(shí)意義。由于影響股價(jià)的因素包括 企業(yè)內(nèi)部因素、經(jīng)濟(jì)因素、制度因素、人們的心理因素等等,各種因素的影響程度和方式各 不相同,股價(jià)的準(zhǔn)確預(yù)測(cè)難度很大。
[0003] 時(shí)間序列分析在理論和經(jīng)驗(yàn)上已成為股票市場(chǎng)研宄的不可缺少的部分。科學(xué)地預(yù) 測(cè)股票市場(chǎng)的波動(dòng)特征,掌握股票市場(chǎng)的波動(dòng)規(guī)律及其結(jié)構(gòu)對(duì)風(fēng)險(xiǎn)的規(guī)避防范與管理監(jiān)控 有著重要意義。目前已有的方法主要是對(duì)股票時(shí)間序列預(yù)測(cè)進(jìn)行短期預(yù)測(cè),利用短期預(yù)測(cè) 的準(zhǔn)確性選擇最優(yōu)的策略。與之相比,中長(zhǎng)期預(yù)測(cè)更著重于研宄市場(chǎng)要素的長(zhǎng)期發(fā)展趨勢(shì), 為企業(yè)、經(jīng)濟(jì)等的長(zhǎng)期發(fā)展方向提供決策依據(jù),使投資者獲得更高的投資收益,因此,中、長(zhǎng) 期預(yù)測(cè)也具有非常重要的意義。
[0004] 目前已有股票的中長(zhǎng)期預(yù)測(cè)方法主要有:利用前一步的預(yù)測(cè)結(jié)果向后迭代遞推 而獲得后面的中長(zhǎng)期預(yù)測(cè)(參考例文:楊一文,藺玉佩.模糊時(shí)間序列建模及股票市場(chǎng) 多步預(yù)測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2014,(5) :252-256.),但此方法存在累積誤差,并且 累積誤差隨著預(yù)測(cè)步長(zhǎng)的增長(zhǎng)而增長(zhǎng);利用移動(dòng)窗口算法在建模序列中刪除一部分舊 數(shù)據(jù)、納入一部分新數(shù)據(jù)的方式遞推更新預(yù)測(cè)模型(參考例文:簡(jiǎn)清明,曾黃麟,葉曉 彤.基于移動(dòng)窗口和動(dòng)態(tài)優(yōu)化的支持向量回歸在指數(shù)預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟 件,2011,(12) :83-85.),該方法中移動(dòng)窗長(zhǎng)度對(duì)建模精度有很大影響,而且只能展現(xiàn)預(yù)測(cè) 區(qū)間的股票均價(jià),不能展現(xiàn)出在該預(yù)測(cè)區(qū)間的股票趨勢(shì)的細(xì)節(jié)變化。另外,目前的方法都是 直接采用均值作為股票趨勢(shì)預(yù)測(cè)的特征值,對(duì)于波動(dòng)變化大的時(shí)間序列,均值會(huì)弱化時(shí)間 段的波動(dòng)特征,降低中長(zhǎng)期預(yù)測(cè)的準(zhǔn)確度。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種基于貝葉斯分類(lèi)器的股票中長(zhǎng)期趨勢(shì)預(yù) 測(cè)方法及系統(tǒng),可以更為準(zhǔn)確地描述區(qū)間內(nèi)股票的走勢(shì)特征,使用該走勢(shì)特征對(duì)未來(lái)走勢(shì) 進(jìn)行分段預(yù)測(cè),既不產(chǎn)生累積誤差,又可以展現(xiàn)出在預(yù)測(cè)區(qū)間內(nèi)的股票變化趨勢(shì)。
[0006] 本發(fā)明解決上述技術(shù)問(wèn)題的技術(shù)方案如下:一種基于貝葉斯分類(lèi)器的股票中長(zhǎng)期 趨勢(shì)預(yù)測(cè)方法,包括以下步驟:
[0007] 步驟1 :選取一段時(shí)間內(nèi)的股票數(shù)據(jù),并確定學(xué)習(xí)區(qū)間起始點(diǎn)、置信度判斷區(qū)間起 始點(diǎn)、預(yù)測(cè)區(qū)間起始點(diǎn)及區(qū)間長(zhǎng)度dj。
[0008] 步驟2 :對(duì)所述學(xué)習(xí)區(qū)間起始點(diǎn)到所述預(yù)測(cè)區(qū)間起始點(diǎn)之間的歷史數(shù)據(jù)以所述區(qū) 間長(zhǎng)度4進(jìn)行劃分,得到多個(gè)區(qū)間,對(duì)每個(gè)所述區(qū)間進(jìn)行特征提取,計(jì)算出歷史數(shù)據(jù)區(qū)間斜 率。
[0009] 步驟3 :使用貝葉斯分類(lèi)器對(duì)所述歷史數(shù)據(jù)區(qū)間斜率進(jìn)行學(xué)習(xí)和預(yù)測(cè),得到以所 述置信度判斷區(qū)間起始點(diǎn)為起點(diǎn)的多個(gè)交易日的股票均價(jià)。
[0010] 步驟4 :通過(guò)所述以所述置信度判斷區(qū)間起始點(diǎn)為起點(diǎn)的多個(gè)交易日的股票均價(jià) 來(lái)計(jì)算以所述置信度判斷區(qū)間起始點(diǎn)為起點(diǎn)、所述預(yù)測(cè)區(qū)間起始點(diǎn)為終點(diǎn)的置信度判斷區(qū) 間的置信度,將所述置信度與預(yù)先設(shè)定好的閾值進(jìn)行比較,若所述置信度大于所述閾值,則 執(zhí)行步驟5 ;若所述置信度小于所述閾值,則進(jìn)入等待環(huán)節(jié),等待取得新數(shù)據(jù)后再返回所述 步驟1 ;
[0011] 步驟5 :利用當(dāng)前交易日之前的相鄰兩個(gè)區(qū)間的前一區(qū)間與后一區(qū)間的區(qū)間斜率 概率統(tǒng)計(jì)關(guān)系來(lái)預(yù)測(cè)未來(lái)區(qū)間斜率,將所述未來(lái)區(qū)間斜率進(jìn)行轉(zhuǎn)化得到以所述預(yù)測(cè)區(qū)間 起始點(diǎn)為起點(diǎn)的多個(gè)交易日的股票均價(jià)。
[0012] 步驟6 :將所述以所述預(yù)測(cè)區(qū)間起始點(diǎn)為起點(diǎn)的多個(gè)交易日的股票均價(jià)的漲跌進(jìn) 行歸一化,得到股票的漲跌值。
[0013]步驟7 :更換不同的股票數(shù)據(jù),重復(fù)所述步驟1至所述步驟6,篩選出可進(jìn)行預(yù)測(cè)的 股票數(shù)據(jù),并對(duì)所述可進(jìn)行預(yù)測(cè)的股票數(shù)據(jù)進(jìn)行漲跌幅度標(biāo)記,形成股票池。
[0014] 在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進(jìn)。
[0015] 進(jìn)一步,所述步驟2的具體實(shí)現(xiàn)為:
[0016] 步驟A1 :對(duì)所述歷史數(shù)據(jù)以所述區(qū)間長(zhǎng)度七進(jìn)行區(qū)間劃分,得到多個(gè)區(qū)間。
[0017] 步驟A2 :將一個(gè)所述區(qū)間中不同時(shí)刻的所有價(jià)格構(gòu)成價(jià)格向量,表示為:
[0018] e - (e1; e2, . . . , sd)
[0019] 其中,d = dj,表示所述區(qū)間中價(jià)格點(diǎn)的數(shù)量& (i = d)表示所述價(jià)格向量中的 每個(gè)值。
[0020] 步驟A3:計(jì)算所述價(jià)格向量的平均值,表示為:
[0021]
【主權(quán)項(xiàng)】
1. 一種基于貝葉斯分類(lèi)器的股票中長(zhǎng)期趨勢(shì)預(yù)測(cè)方法,其特征在于,包括以下步驟: 步驟1 :選取一段時(shí)間內(nèi)的股票數(shù)據(jù),并確定學(xué)習(xí)區(qū)間起始點(diǎn)、置信度判斷區(qū)間起始 點(diǎn)、預(yù)測(cè)區(qū)間起始點(diǎn)及區(qū)間長(zhǎng)度dj; 步驟2 :對(duì)所述學(xué)習(xí)區(qū)間起始點(diǎn)到所述預(yù)測(cè)區(qū)間起始點(diǎn)之間的歷史數(shù)據(jù)以所述區(qū)間長(zhǎng) 度4進(jìn)行劃分,得到多個(gè)區(qū)間,對(duì)每個(gè)所述區(qū)間進(jìn)行特征提取,計(jì)算出歷史數(shù)據(jù)區(qū)間斜率; 步驟3 :使用貝葉斯分類(lèi)器對(duì)所述歷史數(shù)據(jù)區(qū)間斜率進(jìn)行學(xué)習(xí)和預(yù)測(cè),得到以所述置 信度判斷區(qū)間起始點(diǎn)為起點(diǎn)的多個(gè)交易日的股票均價(jià); 步驟4 :通過(guò)所述以所述置信度判斷區(qū)間起始點(diǎn)為起點(diǎn)的多個(gè)交易日的股票均價(jià)來(lái)計(jì) 算以所述置信度判斷區(qū)間起始點(diǎn)為起點(diǎn)、所述預(yù)測(cè)區(qū)間起始點(diǎn)為終點(diǎn)的置信度判斷區(qū)間的 置信度,將所述置信度與預(yù)先設(shè)定好的閾值進(jìn)行比較,若所述置信度大于所述閾值,則執(zhí)行 步驟5 ;若所述置信度小于所述閾值,則進(jìn)入等待環(huán)節(jié),等待取得新數(shù)據(jù)后再返回所述步驟 1 ; 步驟5 :利用當(dāng)前交易日之前的相鄰兩個(gè)區(qū)間的前一區(qū)間與后一區(qū)間的區(qū)間斜率概率 統(tǒng)計(jì)關(guān)系來(lái)預(yù)測(cè)未來(lái)區(qū)間斜率,將所述未來(lái)區(qū)間斜率進(jìn)行轉(zhuǎn)化得到以所述預(yù)測(cè)區(qū)間起始 點(diǎn)為起點(diǎn)的多個(gè)交易日的股票均價(jià); 步驟6 :將所述以所述預(yù)測(cè)區(qū)間起始點(diǎn)為起點(diǎn)的多個(gè)交易日的股票均價(jià)的漲跌進(jìn)行歸 一化,得到股票的漲跌值; 步驟7:更換不同的股票數(shù)據(jù),重復(fù)所述步驟1至所述步驟6,篩選出可進(jìn)行預(yù)測(cè)的股票 數(shù)據(jù),并對(duì)所述可進(jìn)行預(yù)測(cè)的股票數(shù)據(jù)進(jìn)行漲跌幅度標(biāo)記,形成股票池。
2. 根據(jù)權(quán)利要求1所述一種基于貝葉斯分類(lèi)器的股票中長(zhǎng)期趨勢(shì)預(yù)測(cè)方法,其特征在 于,所述步驟2的具體實(shí)現(xiàn)為: 步驟Al :對(duì)所述歷史數(shù)據(jù)以所述區(qū)間長(zhǎng)度4進(jìn)行區(qū)間劃分,得到多個(gè)區(qū)間; 步驟A2 :將一個(gè)所述區(qū)間中不同時(shí)刻的所有價(jià)格構(gòu)成價(jià)格向量,表示為: e = (ei,e2, · · ·,ed) 其中,d = dj,表示所述區(qū)間中價(jià)格點(diǎn)的數(shù)量^iQ = d)表示所述價(jià)格向量中的每個(gè) 值; 步驟A3 :計(jì)算所述價(jià)格向量的平均值,表示為:
其中,mear^表示將所述歷史數(shù)據(jù)按所述區(qū)間長(zhǎng)度h劃分區(qū)間的每個(gè)區(qū)間均值; 步驟A4 :計(jì)算將所述歷史數(shù)據(jù)按所述區(qū)間長(zhǎng)度&劃分的每個(gè)所述區(qū)間的歷史數(shù)據(jù)區(qū) 間斜率,具體為:使用y = kx+b對(duì)所述區(qū)間中的樣本進(jìn)行擬合,表示為: Ineanj= k jdj+lastpricej-i (2) 其中,h表示將所述歷史數(shù)據(jù)中按所述區(qū)間長(zhǎng)度劃分區(qū)間的每個(gè)區(qū)間的歷史數(shù)據(jù)區(qū) 間斜率;Iastpricivi表示將所述歷史數(shù)據(jù)中按所述區(qū)間長(zhǎng)度屯劃分的區(qū)間的前一個(gè)區(qū)間 的最后一個(gè)值; 對(duì)公式(2)進(jìn)行推導(dǎo),得到:
(3)。
3. 根據(jù)權(quán)利要求1所述一種基于貝葉斯分類(lèi)器的股票中長(zhǎng)期趨勢(shì)預(yù)測(cè)方法,其特征在 于,所述步驟3的具體實(shí)現(xiàn)為: 步驟Bl :使用貝葉斯分類(lèi)器對(duì)不同所述區(qū)間長(zhǎng)度Clj上的所述歷史數(shù)據(jù)區(qū)間斜率進(jìn)行 學(xué)習(xí),得到所述歷史數(shù)據(jù)中相鄰兩個(gè)區(qū)間的前一區(qū)間與后一區(qū)間的區(qū)間斜率概率統(tǒng)計(jì)關(guān) 系; 步驟B2 :通過(guò)所述區(qū)間斜率概率統(tǒng)計(jì)關(guān)系計(jì)算得到以所述置信度判斷區(qū)間起始點(diǎn)為 起點(diǎn)、按所述區(qū)間長(zhǎng)度4進(jìn)行區(qū)間劃分的置信度判斷區(qū)間斜率,將所述置信度判斷區(qū)間斜 率轉(zhuǎn)化為所述區(qū)間長(zhǎng)度4的股票均價(jià); 步驟B3 :所述區(qū)間長(zhǎng)度Clj分別取值為2、4、8、16、32,重復(fù)所述步驟2至所述步驟B2,獲 得以所述置信度判斷區(qū)間起始點(diǎn)為起點(diǎn)的0-2、0_4、0-8、0-16、0-32個(gè)交易日的股票均價(jià); 步驟M :對(duì)所述步驟B3中得到的以所述置信度判斷區(qū)間起始點(diǎn)為起點(diǎn)的0-2、0-4、 0-8、0-16、0-32個(gè)交易日的股票均價(jià)進(jìn)行進(jìn)一步的劃分,得到以置信度判斷區(qū)間起始點(diǎn)為 起點(diǎn)的0-2、2-4、4-8、8-16、16-32個(gè)交易日的股票均價(jià)。
4. 根據(jù)權(quán)利要求3所述一種基于貝葉斯分類(lèi)器的股票中長(zhǎng)期趨勢(shì)預(yù)測(cè)方法,其特征在