金融時(shí)間序列分段分布特征計(jì)算方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種金融時(shí)間序列數(shù)據(jù)分布特征提取方法,屬于計(jì)算機(jī)數(shù)據(jù)處理技術(shù) 領(lǐng)域。
【背景技術(shù)】
[0002] 時(shí)間序列分析在理論和經(jīng)驗(yàn)上已成為金融市場(chǎng)研宄的不可缺少的部分。時(shí)間序列 分析方法已是金融定量分析的主流方法之一。近代計(jì)量經(jīng)濟(jì)和金融市場(chǎng)的許多研宄成果都 建立在時(shí)間序列分析的基礎(chǔ)之上。Engle和Grange因?yàn)樗麄兊臅r(shí)間序列模型在經(jīng)濟(jì)金融中 的廣泛應(yīng)用而獲得2003年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng),就是時(shí)間序列分析方法的重要性在世界上 被廣泛認(rèn)可的有力證明。
[0003] 金融時(shí)間序列分析研宄的是資產(chǎn)價(jià)值隨時(shí)間演變的理論與實(shí)踐。對(duì)于金融資產(chǎn)收 益率序列,波動(dòng)率往往不能被觀察到,此時(shí)統(tǒng)計(jì)技術(shù)與方法起到了很重要的作用。時(shí)間序列 預(yù)測(cè)就是利用統(tǒng)計(jì)技術(shù)與方法,從預(yù)測(cè)指標(biāo)的時(shí)間序列中找出演變模式,建立數(shù)學(xué)模型,對(duì) 預(yù)測(cè)指標(biāo)的未來發(fā)展趨勢(shì)做出定量估計(jì)。時(shí)間序列預(yù)測(cè)主要是以連續(xù)性原理作為依據(jù)的, 連續(xù)性原理是指客觀事物的發(fā)展具有合乎規(guī)律的連續(xù)性,事物發(fā)展是按照它本身固有的規(guī) 律進(jìn)行的。在一定條件下,只要規(guī)律賴以發(fā)生作用的條件不產(chǎn)生質(zhì)的變化,則事物的基本發(fā) 展趨勢(shì)在未來就還會(huì)延續(xù)下去。
[0004] 程序化交易方法在專業(yè)投資領(lǐng)域被廣泛采用,近年來呈現(xiàn)高速發(fā)展趨勢(shì),金融時(shí) 間序列分析方法在程序化交易設(shè)計(jì)等等量化投資領(lǐng)域給出有效的解決方案??梢詾橥顿Y機(jī) 構(gòu)在進(jìn)行算法交易與投資組合管理時(shí)提供模型依據(jù),并且可以提供風(fēng)險(xiǎn)分析的數(shù)據(jù)源。
[0005] 但是,金融時(shí)間序列實(shí)時(shí)數(shù)據(jù)隨市場(chǎng)波動(dòng)性強(qiáng),每交易日的TICK數(shù)據(jù)量大,在分 析處理過程中的計(jì)算復(fù)雜度較大,增加了數(shù)據(jù)特征提取的難度。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明所要解決的技術(shù)問題是針對(duì)金融時(shí)間序列數(shù)據(jù)分段分布特征提取難度大 的現(xiàn)狀,提出一種金融時(shí)間序列數(shù)據(jù)分段分布特征計(jì)算方法。
[0007] 本發(fā)明為解決上述技術(shù)問題采用以下技術(shù)方案:
[0008] 一種金融時(shí)間序列分段分布特征計(jì)算方法,包括如下步驟:
[0009] 步驟A、對(duì)獲取的金融交易數(shù)據(jù)按照價(jià)格-時(shí)間序列進(jìn)行差分處理,去除數(shù)據(jù)中的 直流成分,得到差分序列;
[0010] 步驟B、對(duì)差分序列按照時(shí)間順序進(jìn)行連續(xù)分段,得到若干個(gè)W元向量,W為分段窗 口的大小;
[0011] 步驟C、進(jìn)行連續(xù)分段的分布特性統(tǒng)計(jì),篩選出不同種類的分段,對(duì)于同一種分段 統(tǒng)計(jì)其出現(xiàn)的次數(shù);然后對(duì)于不同種類的分段進(jìn)行排序構(gòu)成分段特征矩陣,其中:矩陣中 每行的第一列至第W列構(gòu)成的行向量代表每個(gè)分段,第W+1列代表對(duì)應(yīng)分段出現(xiàn)的次數(shù);第 w+2列到最末列為分段特征向量;
[0012] 步驟D、根據(jù)分段特征矩陣,在已知差分序列第i位取值的條件下,得到差分序列 第i+1至第i+w-i位取值的概率分布,具體操作過程是:首先確定差分序列第i位取值Vi, 然后從分段特征矩陣中挑選出第一列元素等于Vi的所有行構(gòu)成新的子矩陣'_,將子矩陣Mj 的第二至w列作為子向量按照升序排列,然后以第二至第w列的升序子向量作為橫軸,各子 向量對(duì)應(yīng)出現(xiàn)的次數(shù)為縱軸,得到第i+1至第i+w-1位的取值頻度分布情況。
[0013] 進(jìn)一步的,本發(fā)明所提出的金融時(shí)間序列分段分布特征計(jì)算方法,步驟A所述的 差分處理為一階差分處理,得到一階差分序列。
[0014] 進(jìn)一步的,本發(fā)明所提出的金融時(shí)間序列分段分布特征計(jì)算方法,步驟B所述分 段窗口W= 2、3、4、5、6、7。
[0015] 進(jìn)一步的,本發(fā)明所提出的金融時(shí)間序列分段分布特征計(jì)算方法,步驟C中分段 特征矩陣中的列排序是按照各分段的w元向量的第一元至第w元從小到大進(jìn)行排列,先以 分段向量第一元素的大小從小往大進(jìn)行升序排列,如果分段向量第一元素的大小相同時(shí), 再以分段向量第二元素的大小從小到大進(jìn)行升序排列,依此類推。
[0016] 進(jìn)一步的,本發(fā)明所提出的金融時(shí)間序列分段分布特征計(jì)算方法,分段特征向量 代表對(duì)應(yīng)分段在步驟A所述差分序列中的位置,分段特征向量中出現(xiàn)1的位置代表對(duì)應(yīng)分 段在序列中出現(xiàn)的位置,其余位置用0元素表示。
[0017] 進(jìn)一步的,本發(fā)明所提出的金融時(shí)間序列分段分布特征計(jì)算方法,步驟B所述分 段窗口W= 2。
[0018] 進(jìn)一步的,本發(fā)明所提出的金融時(shí)間序列分段分布特征計(jì)算方法,步驟D中將子 矩陣%的第二至w列作為子向量按照升序排列,是按照各子向量第一元素的大小從小往大 進(jìn)行升序排列,如果第一元素的大小相同時(shí),再以第二元素的大小從小到大進(jìn)行升序排列, 依此類推。
[0019] 進(jìn)一步的,本發(fā)明所提出的金融時(shí)間序列分段分布特征計(jì)算方法,步驟A所述的 差分處理,是采用量子熵分布模糊哈希算法以確定差分階數(shù):
[0020] (1)分析原始金融時(shí)間序列的各階差分序列的量子廣義信息熵及其相似性:
[0021] 將各階差分序列表示成量子序列形式,給定一個(gè)具有t個(gè)數(shù)據(jù)元素的量子數(shù)據(jù)序 列I 每個(gè)數(shù)據(jù)元素表示為quatrit態(tài),quatrit態(tài)的一系列正交基表示為|〇>,|1>與 2>,純態(tài)Iy>為10>,11>與I2>的疊加態(tài),量子態(tài)Iy>表示為:
【主權(quán)項(xiàng)】
1. 一種金融時(shí)間序列分段分布特征計(jì)算方法,其特征在于,包括如下步驟: 步驟A、對(duì)獲取的金融交易數(shù)據(jù)按照價(jià)格-時(shí)間序列進(jìn)行差分處理,去除數(shù)據(jù)中的直流 成分,得到差分序列; 步驟B、對(duì)差分序列按照時(shí)間順序進(jìn)行連續(xù)分段,得到若干個(gè)W元向量,W為分段窗口的 大?。? 步驟C、進(jìn)行連續(xù)分段的分布特性統(tǒng)計(jì),篩選出不同種類的分段,對(duì)于同一種分段統(tǒng)計(jì) 其出現(xiàn)的次數(shù);然后對(duì)于不同種類的分段進(jìn)行排序構(gòu)成分段特征矩陣,其中:矩陣中每行 的第一列至第W列構(gòu)成的行向量代表每個(gè)分段,第W+1列代表對(duì)應(yīng)分段出現(xiàn)的次數(shù);第W+2 列到最末列為分段特征向量; 步驟D、根據(jù)分段特征矩陣,在已知差分序列第i位取值的條件下,得到差分序列第i+1 至第i+w-1位取值的概率分布。
2. 根據(jù)權(quán)利要求1所述的一種金融時(shí)間序列分段分布特征計(jì)算方法,其特征在于,步 驟D具體操作過程是;首先確定差分序列第i位取值Vi,然后從分段特征矩陣中挑選出第一 列元素等于Vi的所有行構(gòu)成新的子矩陣Mj.,將子矩陣Mj.的第二至W列作為子向量按照升序 排列,然后W第二至第W列的升序子向量作為橫軸,各子向量對(duì)應(yīng)出現(xiàn)的次數(shù)為縱軸,得到 第i+1至第i+w-1位的取值頻度分布情況。
3. 根據(jù)權(quán)利要求1所述的一種金融時(shí)間序列分段分布特征計(jì)算方法,其特征在于,步 驟A所述的差分處理為一階差分處理,得到一階差分序列。
4. 根據(jù)權(quán)利要求1所述的一種金融時(shí)間序列分段分布特征計(jì)算方法,其特征在于,步 驟B所述分段窗口W為2或3或4或5或6或7中的任意一個(gè)。
5. 根據(jù)權(quán)利要求1所述的一種金融時(shí)間序列分段分布特征計(jì)算方法,其特征在于,步 驟C中分段特征矩陣中的列排序是按照各分段的W元向量的第一元至第W元從小到大進(jìn)行 排列,先W分段向量第一元素的大小從小往大進(jìn)行升序排列,如果分段向量第一元素的大 小相同時(shí),再W分段向量第二元素的大小從小到大進(jìn)行升序排列,依此類推。
6. 根據(jù)權(quán)利要求1所述的一種金融時(shí)間序列分段分布特征計(jì)算方法,其特征在于,分 段特征向量代表對(duì)應(yīng)分段在步驟A所述差分序列中的位置,分段特征向量中出現(xiàn)1的位置 代表對(duì)應(yīng)分段在序列中出現(xiàn)的位置,其余位置用0元素表示。
7. 根據(jù)權(quán)利要求1或4所述的一種金融時(shí)間序列分段分布特征計(jì)算方法,其特征在于, 步驟B所述分段窗口w= 2。
8. 根據(jù)權(quán)利要求2所述的一種金融時(shí)間序列分段分布特征計(jì)算方法,其特征在于,步 驟D中將子矩陣Mj.的第二至W列作為子向量按照升序排列,是按照各子向量第一元素的大 小從小往大進(jìn)行升序排列,如果第一元素的大小相同時(shí),再W第二元素的大小從小到大進(jìn) 行升序排列,依此類推。
9. 根據(jù)權(quán)利要求1所述的一種金融時(shí)間序列分段分布特征計(jì)算方法,其特征在于,步 驟A所述的差分處理,是采用量子滴分布模糊哈希算法W確定差分階數(shù): (1)分析原始金融時(shí)間序列的各階差分序列的量子廣義信息滴及其相似性: 將各階差分序列表示成量子序列形式,給定一個(gè)具有t個(gè)數(shù)據(jù)元素的量子數(shù)據(jù)序列4〉"每個(gè)數(shù)據(jù)元素表示為quatrit態(tài),quatrit態(tài)的一系列正交基表示為|〇〉,|1〉與|2〉, 純態(tài)Iy〉為I0〉,11〉與I2〉的疊加態(tài),量子態(tài)Iy〉表示為;
其中,e代表自然對(duì)數(shù)的底,i代表單位純虛數(shù),0 < ?,片<f' 0^M,A^ 2八; 似設(shè)量子quatrit態(tài)基的表現(xiàn)形式是SU做生成子,將SU做生成子的矩陣形式表示 如下:
(3)根據(jù)(2)的矩陣形式來得到各階差分序列的基態(tài)分布概率P,進(jìn)一步求得各階差分 序列對(duì)應(yīng)的量子廣義信息滴為:
按照從大到小順序排列,取最大的量子廣義信息滴Ht(| 對(duì)應(yīng)的序列的階數(shù)為差 分階數(shù)。
10. -種金融時(shí)間序列分段分布特征計(jì)算系統(tǒng),其特征在于,包括: 數(shù)據(jù)處理模塊,對(duì)獲取的金融交易數(shù)據(jù)按照價(jià)格-時(shí)間序列進(jìn)行差分處理,去除數(shù)據(jù) 中的直流成分,得到差分序列; 分段模塊,對(duì)差分序列按照時(shí)間順序進(jìn)行連續(xù)分段,得到若干個(gè)W元向量; 分段特征矩陣構(gòu)建模塊,進(jìn)行連續(xù)分段的分布特性統(tǒng)計(jì),篩選出不同種類的分段,對(duì)于 同一種分段統(tǒng)計(jì)其出現(xiàn)的次數(shù),然后對(duì)于不同種類的分段進(jìn)行排序構(gòu)成分段特征矩陣; 分布統(tǒng)計(jì)模塊,根據(jù)分段特征矩陣,在已知差分序列第i位取值的條件下,得到差分序 列第i+1至第i+w-1位取值的概率分布。
【專利摘要】本發(fā)明公開了一種金融時(shí)間序列分段分布特征計(jì)算方法。所述方法基于交易價(jià)格的TICK數(shù)據(jù),采用差分去直流的數(shù)據(jù)預(yù)處理方法,構(gòu)造一種新的分段序列數(shù)據(jù)結(jié)構(gòu),對(duì)差分序列進(jìn)行連續(xù)分段,統(tǒng)計(jì)分段序列先驗(yàn)概率分布,實(shí)現(xiàn)金融交易數(shù)據(jù)趨勢(shì)分布計(jì)算。本發(fā)明還提供一種金融時(shí)間序列分段分布特征計(jì)算系統(tǒng),相比于其他金融時(shí)間序列特征提取算法,本發(fā)明具有更簡(jiǎn)潔的數(shù)據(jù)處理結(jié)構(gòu),更優(yōu)的識(shí)別性能和良好的數(shù)據(jù)一致性;同時(shí),本發(fā)明的數(shù)據(jù)處理方法得到的序列分布特性明顯,在模糊估計(jì)方面相比于其他同類算法具有更優(yōu)性能。
【IPC分類】G06F17-30, G06Q40-04
【公開號(hào)】CN104794235
【申請(qǐng)?zhí)枴緾N201510227872
【發(fā)明人】曹東
【申請(qǐng)人】曹東
【公開日】2015年7月22日
【申請(qǐng)日】2015年5月6日