本發(fā)明涉及股票金融預(yù)測(cè)的技術(shù)領(lǐng)域,具體涉及一種基于雙聚類挖掘及模糊推理的股票交易規(guī)則預(yù)測(cè)方法。
背景技術(shù):
股票交易規(guī)則的預(yù)測(cè)是股票金融領(lǐng)域十分關(guān)注的一個(gè)研究熱點(diǎn),很多專家和投資人都在研究如何確定最佳的買入和賣出的時(shí)機(jī),但是有時(shí)不可避免地會(huì)得到錯(cuò)誤的結(jié)果。因?yàn)楣善眱r(jià)格存在高維度和非穩(wěn)定性的原因,這導(dǎo)致股票交易規(guī)則的預(yù)測(cè)是存在很大難度的。同時(shí)股票價(jià)格容易受到經(jīng)濟(jì)環(huán)境以及政治形式等多方面因素的影響,這又在一定程度上提高了股票交易規(guī)則預(yù)測(cè)的難度。最初的股票預(yù)測(cè)的代表是以早期發(fā)展的技術(shù)分析理論為基礎(chǔ)的,如平均線理論、K線圖分析法、柱狀圖分析法等,隨著計(jì)算機(jī)技術(shù)和數(shù)據(jù)挖掘在證券領(lǐng)域的應(yīng)用,股票預(yù)測(cè)的方法也越來(lái)越多,但是大多數(shù)方法僅僅是分析手段,還不能直接預(yù)測(cè)股票市場(chǎng)的動(dòng)態(tài)。而且利用傳統(tǒng)的預(yù)測(cè)技術(shù)來(lái)預(yù)測(cè)股票市場(chǎng)的變換需要面對(duì)的最大的問(wèn)題就是待處理的數(shù)據(jù)量非常大,在這些海量的數(shù)據(jù)匯總往往隱含著各種各樣的交易規(guī)則的信息,這些信息單純僅憑人們的直覺(jué)和經(jīng)驗(yàn)是難以發(fā)現(xiàn)的。如何從大量數(shù)據(jù)中獲得有價(jià)值的信息,將是金融預(yù)測(cè)領(lǐng)域的挑戰(zhàn)性研究課題。
目前在股票預(yù)測(cè)領(lǐng)域比較常用的方法有BP神經(jīng)網(wǎng)絡(luò),支持向量機(jī),遺傳計(jì)算以及模糊推理等,比如,Wing W.Y.Ng et al利用遺傳算法最小化一個(gè)新的加權(quán)局部泛化誤差去預(yù)測(cè)交易點(diǎn),比如,Luo and Chen提出一種基于分段線性表示方法和加權(quán)支持向量機(jī)的方法預(yù)測(cè)股票的交易信號(hào),比如,Q.H.Huang et al使用雙聚類挖掘算法和K最近鄰分類算法去預(yù)測(cè)交易規(guī)則。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于避免了傳統(tǒng)上根據(jù)專家經(jīng)驗(yàn)構(gòu)建模糊規(guī)則存在的規(guī)則不夠客觀,專家經(jīng)驗(yàn)難以獲取的問(wèn)題,提供一種基于雙聚類挖掘及模糊推理的股票交易規(guī)則預(yù)測(cè)方法,該預(yù)測(cè)方法能夠從大量的股票歷史數(shù)據(jù)中挖掘出有意義的交易規(guī)則信息,并且利用挖掘出的有價(jià)值的信息構(gòu)建模糊規(guī)則,使得模糊規(guī)則更具有針對(duì)性,并獲得較好的利潤(rùn)結(jié)果。
本發(fā)明的目的可以通過(guò)采取如下技術(shù)方案達(dá)到:
一種基于雙聚類挖掘及模糊推理的股票交易規(guī)則預(yù)測(cè)方法,所述預(yù)測(cè)方法包括下列步驟:
S1、計(jì)算歷史股票數(shù)據(jù)中第i個(gè)交易日的未來(lái)收益率FRi;
S2、將所述未來(lái)收益率FRi進(jìn)行量級(jí)劃分,若第i個(gè)交易日的平均收盤價(jià)比當(dāng)天收盤價(jià)要高,則未來(lái)收益率FRi≥0,若第i個(gè)交易日的平均價(jià)比當(dāng)天收盤價(jià)低,則未來(lái)收益率FRi≤0;
S3、構(gòu)造指標(biāo)矩陣A=(aij)m×n,選取m個(gè)交易日的歷史股票數(shù)據(jù),計(jì)算每個(gè)交易日的n個(gè)指標(biāo)特征值aij,其中i=1,2,…,m;j=1,2,…,n,aij表示第i交易日對(duì)應(yīng)的第j列指標(biāo)上的特征值;
S4、對(duì)指標(biāo)矩陣A使用雙聚類算法,通過(guò)雙聚類的挖掘,將所有得到的雙聚類放入一個(gè)雙聚類集合,集合中的每個(gè)雙聚類都對(duì)應(yīng)一種交易規(guī)則模式的信息;
S5、提取交易規(guī)則模式,從雙聚類集合中取出一個(gè)雙聚類,計(jì)算雙聚類中每一列的總和的平均值,并且計(jì)算雙聚類中每一行對(duì)應(yīng)的FRi的總和的平均值,得到一個(gè)行向量D=[Y1,Y2,…,Yc,FRav],Y1,Y2,…,Yc是雙聚類中包含的指標(biāo)列的平均值,F(xiàn)Rav是雙聚類中包含的未來(lái)收益率的平均值,行向量D是雙聚類中對(duì)應(yīng)的交易規(guī)則模式信息的量化表示;
S6、劃分模糊規(guī)則中前提條件和結(jié)論的量級(jí),將所述行向量D中Y1,Y2,…,Yc對(duì)應(yīng)的指標(biāo)列用來(lái)構(gòu)建模糊規(guī)則的前提條件,將所述行向量D中平均未來(lái)收益率FRav用來(lái)構(gòu)建模糊規(guī)則的結(jié)論;
S7、構(gòu)建模糊規(guī)則,通過(guò)對(duì)行向量D包含的指標(biāo)列和平均未來(lái)回報(bào)率在量級(jí)上的劃分則可得到構(gòu)建模糊規(guī)則如下:
假如Y1∈O1并且Y2∈O2并且…Yc∈Oc,則FRav∈Ox,其中O1,…,Oc表示指標(biāo)列的平均值的所屬量級(jí),Ox表示平均未來(lái)收益率FRav的值所屬量級(jí),然后對(duì)雙聚類集合中的所有雙聚類進(jìn)行計(jì)算,依次得到每個(gè)雙聚類對(duì)應(yīng)的模糊規(guī)則;
S8、將所有的模糊規(guī)則進(jìn)行整合,得到模糊規(guī)則庫(kù)R,通過(guò)所得的模糊規(guī)則庫(kù)R構(gòu)造模糊預(yù)測(cè)模型;
S9、對(duì)于需要預(yù)測(cè)的某一個(gè)交易日Dayi,計(jì)算Dayi的n個(gè)股票技術(shù)指標(biāo)的值,然后輸入到該方法構(gòu)建的模糊預(yù)測(cè)模型中,可得到交易日Dayi的交易規(guī)則的預(yù)測(cè),其中所述交易規(guī)則包括買入、賣出和持有。
進(jìn)一步地,所述步驟S1、計(jì)算歷史股票數(shù)據(jù)中第i個(gè)交易日的未來(lái)收益率FRi具體包括:
S11、選取過(guò)去m天的股票歷史數(shù)據(jù)作為挖掘股票歷史數(shù)據(jù)中雙聚類的數(shù)據(jù)集;
S12、根據(jù)技術(shù)指標(biāo)公式計(jì)算出股票歷史數(shù)據(jù)中第i個(gè)交易日相對(duì)應(yīng)的股票技術(shù)指標(biāo)值,其中,所示技術(shù)指標(biāo)公式如下:
其中,ACli表示第i個(gè)交易日的平均收盤價(jià),Clx表示第x個(gè)交易日的收盤價(jià),t表示投資時(shí)間周期;
S13、計(jì)算第i個(gè)交易日的未來(lái)收益率FRi,計(jì)算公式如下:
FRi代表第i個(gè)交易日對(duì)應(yīng)的未來(lái)收益率。
進(jìn)一步地,所述股票歷史數(shù)據(jù)包括開(kāi)盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)和交易量。
進(jìn)一步地,所述步驟S2、將所述未來(lái)收益率FRi進(jìn)行量級(jí)劃分的規(guī)則具體如下:
將交易日股價(jià)上漲分為小、中、大三種情況,對(duì)應(yīng)地選取閾值Tr將未來(lái)收益率按照以下規(guī)則劃分:如果Tr≤FRi<2Tr,則置FRi=1;如果2Tr≤FRi<3Tr,則置FRi=2;如果FRi≥3Tr,則置FRi=3;
同理,將交易日股價(jià)下跌分為小、中、大三種情況,對(duì)應(yīng)地選取閾值Tr將未來(lái)收益率按照以下規(guī)則劃分:如果-2Tr≤FRi<-Tr,則置FRi=-1;如果-3Tr≤FRi<-2Tr,則置FRi=-2;如果FRi≤-3Tr,則置FRi=-3。
進(jìn)一步地,所述步驟S6具體包括:
S61、對(duì)所述行向量D中Y1,Y2,…,Yc對(duì)應(yīng)的指標(biāo)列使用隸屬度函數(shù)對(duì)每個(gè)指標(biāo)列的值進(jìn)行一個(gè)語(yǔ)言變量的量級(jí)上的劃分,將指標(biāo)值的大小劃分成small(對(duì)應(yīng)μ0,σ0),medium(對(duì)應(yīng)μ1,σ1),big(對(duì)應(yīng)μ2,σ2),large(對(duì)應(yīng)μ3,σ3)四個(gè)量級(jí);
S62、對(duì)行向量D中包含平均未來(lái)收益率對(duì)應(yīng)的值FRav,使用隸屬的函數(shù)對(duì)FR的值進(jìn)行一個(gè)語(yǔ)言變量的量級(jí)上的劃分,將FR值的大小劃分成negative small(對(duì)應(yīng)w0,t0),negative large(對(duì)應(yīng)w1,t1),positive small(對(duì)應(yīng)w2,t2),positive large(對(duì)應(yīng)w3,t3)四個(gè)量級(jí)。
進(jìn)一步地,所述步驟S7中的所述指標(biāo)列的平均值的所屬量級(jí)包括small、medium、big和large,所述平均未來(lái)收益率FRav的值所屬量級(jí)包括negative small、negative large、positive small和positive large。
進(jìn)一步地,所述步驟S3還包括:
對(duì)指標(biāo)矩陣A中每一列進(jìn)行歸一化處理,把指標(biāo)矩陣A中的技術(shù)指標(biāo)值aij保持在相同范圍(0,1)內(nèi)。
本發(fā)明相對(duì)于現(xiàn)有技術(shù)具有如下的優(yōu)點(diǎn)及效果:
1、將雙聚類算法巧妙地應(yīng)用在了股票數(shù)據(jù)挖掘中,可以從大量的股票數(shù)據(jù)中挖掘出股票的交易規(guī)則模式,避免受到大量噪聲信息的影響,提取出有價(jià)值的信息。
2、可解決傳統(tǒng)上根據(jù)專家經(jīng)驗(yàn)構(gòu)建模糊規(guī)則存在的規(guī)則不夠客觀,專家經(jīng)驗(yàn)難以獲取的問(wèn)題,使得構(gòu)建出的規(guī)則更具有針對(duì)性,提升模糊預(yù)測(cè)模型的預(yù)測(cè)性能。
3、基于雙聚類挖掘及模糊推理的股票交易規(guī)則預(yù)測(cè)方法能夠更好地預(yù)測(cè)股票的交易規(guī)則,在較好的時(shí)機(jī)進(jìn)行股票的買入或者賣出,獲得更大的利潤(rùn)。通過(guò)該算法,驗(yàn)證獲取的交易規(guī)則中的買入和賣出的時(shí)間點(diǎn)是靠近股票價(jià)格曲線的波谷和波峰,說(shuō)明預(yù)測(cè)的交易規(guī)則是準(zhǔn)確和有價(jià)值的。
附圖說(shuō)明
圖1為本發(fā)明公開(kāi)的基于雙聚類挖掘及模糊推理的股票交易規(guī)則預(yù)測(cè)方法的流程步驟圖;
圖2為本發(fā)明方法中構(gòu)造指標(biāo)矩陣的示意圖;
圖3為本發(fā)明方法中每個(gè)指標(biāo)列使用的隸屬度函數(shù)IndicatorF(x);
圖4為本發(fā)明方法中FR標(biāo)記列使用隸屬度函數(shù)FetureRF(x);
圖5為本發(fā)明方法對(duì)西藏藥業(yè)(600211)股票的預(yù)測(cè)結(jié)果示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
實(shí)施例一
附圖1是本發(fā)明公開(kāi)的的基于雙聚類挖掘及模糊推理的股票交易規(guī)則預(yù)測(cè)方法的流程步驟圖,如附圖1所示,本實(shí)施例中公開(kāi)的股票交易規(guī)則預(yù)測(cè)方法具體包括下列步驟:
S1、計(jì)算歷史股票數(shù)據(jù)中第i個(gè)交易日的未來(lái)收益率FRi。
選取一段時(shí)間的股票數(shù)據(jù)作為挖掘雙聚類的數(shù)據(jù)集,根據(jù)不同技術(shù)指標(biāo)的公式計(jì)算出每一天的股票原始數(shù)據(jù)(開(kāi)盤價(jià),最高價(jià),最低價(jià),收盤價(jià),交易量)相對(duì)應(yīng)的技術(shù)指標(biāo)值,計(jì)算歷史股票數(shù)據(jù)中第i個(gè)交易日的未來(lái)收益率FRi,未來(lái)收益率反應(yīng)股票價(jià)格的變動(dòng)趨勢(shì),其中i表示交易日,F(xiàn)Ri表示第i個(gè)交易日的未來(lái)收益率。
S11、選取過(guò)去m天的股票歷史數(shù)據(jù)(開(kāi)盤價(jià),最高價(jià),最低價(jià),收盤價(jià),交易量)作為挖掘股票歷史數(shù)據(jù)中雙聚類的數(shù)據(jù)集;
S12、根據(jù)技術(shù)指標(biāo)公式計(jì)算出股票歷史數(shù)據(jù)中第i個(gè)交易日相對(duì)應(yīng)的股票技術(shù)指標(biāo)值,其中,所示技術(shù)指標(biāo)公式如下:
其中,ACli表示第i個(gè)交易日的平均收盤價(jià),Clx表示第x個(gè)交易日的收盤價(jià),t表示投資時(shí)間周期;
S13、計(jì)算第i個(gè)交易日的未來(lái)收益率FRi,計(jì)算公式如下:
FRi代表第i個(gè)交易日對(duì)應(yīng)的未來(lái)收益率。
S2、將所述未來(lái)收益率FRi進(jìn)行量級(jí)劃分,若第i個(gè)交易日的平均收盤價(jià)比當(dāng)天收盤價(jià)要高,則未來(lái)收益率FRi≥0,若第i個(gè)交易日的平均價(jià)比當(dāng)天收盤價(jià)低,則未來(lái)收益率FRi≤0;
其中,未來(lái)收益率代表股價(jià)的變化趨勢(shì),如果第i個(gè)交易日來(lái)說(shuō),未來(lái)t個(gè)交易日內(nèi)的收盤價(jià)有所上漲,則第i個(gè)交易日的平均收盤價(jià)比當(dāng)天收盤價(jià)要高,未來(lái)收益率FRi≥0。同理,如果第i個(gè)交易日后的未來(lái)t個(gè)交易日的收盤價(jià)下跌,第i個(gè)交易日的平均價(jià)比當(dāng)天收盤價(jià)低,未來(lái)收益率FRi≤0。因此,根據(jù)交易日股價(jià)上漲分為小,中,大三種情況,對(duì)應(yīng)地選取閾值Tr將未來(lái)收益率按照以下規(guī)則劃分:如果Tr≤FRi<2Tr,則置FRi=1;如果2Tr≤FRi<3Tr,則置FRi=2;如果FRi≥3Tr,則置FRi=3;同理,根據(jù)交易日股價(jià)下跌分為小,中,大三種情況。如果-2Tr≤FRi<-Tr,則置FRi=-1;如果-3Tr≤FRi<-2Tr,則置FRi=-2;如果FRi≤-3Tr,則置FRi=-3。
S3、構(gòu)造指標(biāo)矩陣A=(aij)m×n,選取m個(gè)交易日的歷史股票數(shù)據(jù),計(jì)算每個(gè)交易日的n個(gè)指標(biāo)特征值aij,其中i=1,2,…,m;j=1,2,…,n,aij位于矩陣A的第i行第j列,表示第i交易日對(duì)應(yīng)的第j列指標(biāo)上的特征值。
在本實(shí)施例中,設(shè)n=32,即選取32個(gè)技術(shù)指標(biāo)值,分別是SMA[周期6,10,12,24,30]、RSI[周期6,12,18,24,30]、WMS[周期6,14,20],ROC[周期6,12,24,28]、CCI[周期6,12,14,28]、EMV[周期6,12,14,28]、UO[周期7,14,28]、ARBR[周期26,26]、KDJ[周期9,9,9]、MTM[周期6]。其中,每個(gè)指標(biāo)對(duì)應(yīng)的每個(gè)周期可以計(jì)算得到一個(gè)技術(shù)指標(biāo)值,但在UO指標(biāo)中,三個(gè)周期共同計(jì)算得到一個(gè)指標(biāo)值。定義指標(biāo)矩陣其中i=1,2,…,m;j=1,2,…,32。aij表示第i交易日對(duì)應(yīng)的第j列技術(shù)指標(biāo)的指標(biāo)特征值aij。相應(yīng)地,定義矩陣其中i=1,2,…,m。B矩陣是由m個(gè)交易日中每個(gè)交易日的未來(lái)回報(bào)率構(gòu)成的。
構(gòu)建指標(biāo)矩陣A需要選取n個(gè)技術(shù)指標(biāo)作為特征,通過(guò)計(jì)算這些特征在不同周期下的指標(biāo)值,則可得到每一天的n個(gè)技術(shù)指標(biāo)的技術(shù)指標(biāo)值,這些特征是判斷股票價(jià)格變換趨勢(shì)有利的依據(jù)。同時(shí)對(duì)指標(biāo)矩陣A中每一列進(jìn)行歸一化處理,把指標(biāo)矩陣A中的技術(shù)指標(biāo)值aij保持在相同范圍(0,1)內(nèi)。
S4、對(duì)指標(biāo)矩陣A使用雙聚類算法,通過(guò)雙聚類的挖掘,將所有得到的雙聚類放入一個(gè)雙聚類集合,集合中的每個(gè)雙聚類都對(duì)應(yīng)一種交易規(guī)則模式的信息。
S5、提取交易規(guī)則模式,從雙聚類集合中取出一個(gè)雙聚類,計(jì)算雙聚類中每一列的總和的平均值,并且計(jì)算雙聚類中每一行對(duì)應(yīng)的FRi的總和的平均值,得到一個(gè)行向量D=[Y1,Y2,…,Yc,FRav],Y1,Y2,…,Yc是雙聚類中包含的指標(biāo)列的平均值,F(xiàn)Rav是雙聚類中包含的未來(lái)收益率的平均值,行向量D是雙聚類中對(duì)應(yīng)的交易規(guī)則模式信息的量化表示。
由于每個(gè)雙聚類都是一個(gè)二維矩陣,因此對(duì)雙聚類取列平均,則可得到一個(gè)行向量D=[Y1,Y2,…,Yc,FRav]。而且通過(guò)列平均的方法對(duì)雙聚類中的數(shù)據(jù)進(jìn)行降維處理,可以對(duì)雙聚類中包含的少量噪聲數(shù)據(jù)起到平衡的作用。
S6、劃分模糊規(guī)則中前提條件和結(jié)論的量級(jí)。因?yàn)橐粋€(gè)模糊規(guī)則由前提條件和結(jié)論構(gòu)成,行向量D中Y1,Y2,…,Yc對(duì)應(yīng)的指標(biāo)列用來(lái)構(gòu)建模糊規(guī)則的前提條件,平均未來(lái)收益率用來(lái)構(gòu)建模糊規(guī)則的結(jié)論。對(duì)行向量D中Y1,Y2,…,Yc對(duì)應(yīng)的指標(biāo)列使用隸屬度函數(shù)對(duì)每個(gè)指標(biāo)列的值進(jìn)行一個(gè)語(yǔ)言變量的量級(jí)上的劃分,將指標(biāo)值的大小劃分成small(對(duì)應(yīng)μ0,σ0),medium(對(duì)應(yīng)μ1,σ1),big(對(duì)應(yīng)μ2,σ2),large(對(duì)應(yīng)μ3,σ3)的四個(gè)量級(jí)。同理,對(duì)行向量D中包含平均未來(lái)收益率對(duì)應(yīng)的值FRav,使用隸屬的函數(shù)對(duì)FR的值也進(jìn)行一個(gè)語(yǔ)言變量的量級(jí)上的劃分,將FR值的大小劃分成negative small(對(duì)應(yīng)w0,t0),negative large(對(duì)應(yīng)w1,t1),positive small(對(duì)應(yīng)w2,t2),positive large(對(duì)應(yīng)w3,t3)四個(gè)量級(jí)。
S7、構(gòu)建模糊規(guī)則。通過(guò)對(duì)行向量D包含的指標(biāo)列和平均未來(lái)回報(bào)率在量級(jí)上的劃分則可得到構(gòu)建模糊規(guī)則如下:
假如Y1∈O1并且Y2∈O2并且…Yc∈Oc,則FRav∈Ox,其中O1,…,Oc表示指標(biāo)列的平均值的所屬量級(jí)(small,medium,big,large其中之一),Ox表示平均未來(lái)收益率FRav的值所屬量級(jí)(negative small,negativelarge,positive small,positive large其中之一),然后對(duì)雙聚類集合中的所有雙聚類進(jìn)行計(jì)算,依次得到每個(gè)雙聚類對(duì)應(yīng)的模糊規(guī)則。
將由挖掘出的雙聚類轉(zhuǎn)化為成的行向量D,以其作為依據(jù)構(gòu)建模糊規(guī)則,避免了傳統(tǒng)上構(gòu)建模糊規(guī)則根據(jù)專家經(jīng)驗(yàn)構(gòu)建模糊規(guī)則存在的規(guī)則不夠客觀,專家經(jīng)驗(yàn)難以獲取的問(wèn)題,而且構(gòu)建出的模糊規(guī)則更具有針對(duì)性,是基于數(shù)據(jù)本身蘊(yùn)含的規(guī)律構(gòu)建的。
S8、將所有的模糊規(guī)則進(jìn)行整合,得到模糊規(guī)則庫(kù)R,通過(guò)所得的模糊規(guī)則庫(kù)R構(gòu)造模糊預(yù)測(cè)模型。
S9、對(duì)于需要預(yù)測(cè)的某一個(gè)交易日Dayi,計(jì)算Dayi的n個(gè)股票技術(shù)指標(biāo)的值,然后輸入到該方法構(gòu)建的模糊預(yù)測(cè)模型中,可得到交易日Dayi的交易規(guī)則的預(yù)測(cè),其中所述交易規(guī)則包括買入、賣出和持有。
綜上所述,本實(shí)施例公開(kāi)了一種基于雙聚類挖掘及模糊推理的股票交易規(guī)則預(yù)測(cè)方法,通過(guò)使用雙聚類算法去挖掘交易規(guī)則的模式,然后利用上述交易規(guī)則的模式構(gòu)更有針對(duì)性的模糊規(guī)則,很好地解決了傳統(tǒng)方法中根據(jù)專家經(jīng)驗(yàn)構(gòu)建模糊規(guī)則存在的規(guī)則不夠客觀,專家經(jīng)驗(yàn)難以獲取的問(wèn)題。
實(shí)施例二
如圖1至圖5,本實(shí)施例選擇具體的股票--西藏藥業(yè)(600211),采用基于雙聚類挖掘及模糊推理的股票交易規(guī)則預(yù)測(cè)方法進(jìn)行交易規(guī)則的預(yù)測(cè),包括以下步驟:
1)選取m=1320天的西藏藥業(yè)(600211)股票數(shù)據(jù)(開(kāi)盤價(jià),最高價(jià),最低價(jià),收盤價(jià),交易量)作為挖掘股票歷史數(shù)據(jù)中的交易規(guī)則模式的數(shù)據(jù)集,選取32個(gè)股票技術(shù)指標(biāo)作為評(píng)價(jià)每一天的交易信息的特征,同時(shí)給m天的數(shù)據(jù)集中的每一天標(biāo)記一個(gè)未來(lái)收益率FRi,首先需要計(jì)算t個(gè)交易日的平均收盤價(jià)ACli,
其中,Clx表示第i個(gè)交易日的收盤價(jià),t表示投資周時(shí)間周期。
代表第i個(gè)交易日對(duì)應(yīng)的未來(lái)收益率,ACli代表平均收盤價(jià)。FRi在一定程度上反映了股票價(jià)格變換的趨勢(shì)。
2)計(jì)算m個(gè)的交易日中每一天的未來(lái)收益率FRi,將其作為訓(xùn)練集的標(biāo)記,設(shè)閾值為Tr=0.15%。如果Tr≤FRi<2Tr,則置FRi=1;如果2Tr≤FRi<3Tr,則置FRi=2;如果FRi≥3Tr,則置FRi=3;如果-2Tr≤FRi<-Tr,則置FRi=-1;如果-3Tr≤FRi<-2Tr,則置FRi=-2;如果FRi≤-3Tr,則置FRi=-3。
3)根據(jù)選取的1320天股票數(shù)據(jù)以及32個(gè)指標(biāo)的技術(shù)公式,計(jì)算1320天中每一天的32個(gè)技術(shù)指標(biāo)的值,如圖2所示,設(shè)指標(biāo)矩陣為A,行數(shù)為1320表示數(shù)據(jù)集中的每一天,列數(shù)為33表示32個(gè)技術(shù)指標(biāo)以及FRi標(biāo)記,即指標(biāo)矩陣的大小為1320×33,同時(shí)對(duì)矩陣中的每一列進(jìn)行歸一化處理。
4)對(duì)指標(biāo)矩陣A使用雙聚類算法,進(jìn)行雙聚類的挖掘,將所有得到的雙聚類放入一個(gè)名為Bicluster_Set的集合,集合中的每個(gè)雙聚類都蘊(yùn)含一定的交易規(guī)則模式的信息。
5)從Bicluster_Set的集合中取出一個(gè)雙聚類,需要將雙聚類中蘊(yùn)含的交易規(guī)則模式信息提取出來(lái),從而構(gòu)建模糊規(guī)則。因?yàn)槊總€(gè)雙聚類都是一個(gè)二維矩陣,因此對(duì)雙聚類取列平均,則可得到一個(gè)行向量D=[Y1,Y2,…,Yc,FRav],Y1,Y2,…,Yc是雙聚類中包含的指標(biāo)列的平均值,F(xiàn)Rav是雙聚類中包含標(biāo)記列。行向量D是雙聚類中蘊(yùn)含的交易規(guī)則模式信息的量化表示。
5)因?yàn)橐粋€(gè)模糊規(guī)則由前提條件和結(jié)論構(gòu)成,因此需要將行向量D轉(zhuǎn)化成模糊規(guī)則,D包含的指標(biāo)列用來(lái)構(gòu)建模糊規(guī)則的前提條件,包含的FRav標(biāo)記列用來(lái)構(gòu)建模糊規(guī)則的結(jié)論。如圖3所示,對(duì)D包含的每個(gè)指標(biāo)列使用隸屬度函數(shù)對(duì)每個(gè)指標(biāo)列的值進(jìn)行一個(gè)語(yǔ)言變量的量級(jí)上的劃分,將指標(biāo)值的大小劃分成small(對(duì)應(yīng)μ0=0,),medium(對(duì)應(yīng)),big(對(duì)應(yīng)),large(對(duì)應(yīng)μ3=1,)的四個(gè)量級(jí)。如圖4所示,對(duì)Average_Bic包含的FR標(biāo)記列使用隸屬的函數(shù)對(duì)FR的值也進(jìn)行一個(gè)語(yǔ)言變量的量級(jí)上的劃分,將FR值的大小劃分成negative small(對(duì)應(yīng)w0=-1,t0=1),negative large(對(duì)應(yīng)w1=-3,t1=1),positive small(對(duì)應(yīng)w2=1,t2=1),positive large(對(duì)應(yīng)w3=3,t3=1)四個(gè)量級(jí)。
6)通過(guò)對(duì)行向量D包含的指標(biāo)列的平均值以及標(biāo)記列FR的平均值在量級(jí)上的劃分則可構(gòu)建模糊規(guī)則。
假如Y1∈O1并且Y2∈O2并且…Yc∈Oc,則FRav∈Ox.其中,Y1…Yc表示指標(biāo)列的平均值的所屬量級(jí)(small,medium,big,large其中之一),Ox表示標(biāo)記列FRav的平均值所屬量級(jí)(negative small,negativelarge,positive small,positive large其中之一),然后對(duì)雙聚類集合Bicluster_Set中的所有雙聚類進(jìn)行計(jì)算,依次得到每個(gè)雙聚類對(duì)應(yīng)的模糊規(guī)則。
7)將所有的模糊規(guī)則進(jìn)行整合,得到模糊規(guī)則庫(kù)R。通過(guò)所得的模糊規(guī)則庫(kù)R構(gòu)造模糊預(yù)測(cè)模型。
8)對(duì)于需要預(yù)測(cè)的西藏藥業(yè)(600211)中的某個(gè)交易日Dayi,計(jì)算Dayi的32個(gè)股票技術(shù)指標(biāo)的值,然后輸入到該方法構(gòu)建的模糊預(yù)測(cè)模型中,可得到Dayi該天的價(jià)格變化趨勢(shì)的預(yù)測(cè),若該天的價(jià)格預(yù)測(cè)是上漲趨勢(shì),則應(yīng)該買入,反之則應(yīng)該賣出,則可對(duì)股票的交易規(guī)則進(jìn)行預(yù)測(cè)。如圖5所示,運(yùn)用該方法對(duì)西藏藥業(yè)(600211)在2010/08/30-2011/08/11這段時(shí)間交易規(guī)則預(yù)測(cè)的結(jié)果。
綜上所述,本發(fā)明公開(kāi)的一種基于雙聚類挖掘及模糊推理的股票交易規(guī)則預(yù)測(cè)方法提出的預(yù)測(cè)模型能夠?qū)善眱r(jià)格曲線中的交易規(guī)則進(jìn)行預(yù)測(cè),為投資者在最好的時(shí)機(jī)買入或者賣出股票提供參考,通過(guò)從大量的股票歷史數(shù)據(jù)中挖掘出有意義的交易規(guī)則信息,并且利用挖掘出的有價(jià)值的信息構(gòu)建模糊規(guī)則,使得模糊規(guī)則更具有針對(duì)性,并獲得較好的利潤(rùn)結(jié)果。
上述實(shí)施例為本發(fā)明較佳的實(shí)施方式,但本發(fā)明的實(shí)施方式并不受上述實(shí)施例的限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、替代、組合、簡(jiǎn)化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。