專(zhuān)利名稱(chēng):一種基于量子力學(xué)和社交網(wǎng)絡(luò)的股票價(jià)格趨勢(shì)預(yù)測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及量子力學(xué)、社交網(wǎng)絡(luò)分析和股票價(jià)格趨勢(shì)預(yù)測(cè)領(lǐng)域,具體涉及通過(guò)收集和分析社交網(wǎng)絡(luò)中的海量股票相關(guān)信息,采用量子力學(xué)模型預(yù)測(cè)股票價(jià)格變化趨勢(shì)。
背景技術(shù):
對(duì)股票價(jià)格趨勢(shì)的分析和預(yù)測(cè)活動(dòng)歷史悠久?;久娣治?、技術(shù)分析等都是經(jīng)典的分析方法,其中包括CAPM、APT模型、平均線理論,K線圖分析法等。在股票分析結(jié)果的基礎(chǔ)上,研究者主要采用回歸分析等統(tǒng)計(jì)手段建立數(shù)學(xué)模型來(lái)預(yù)測(cè)股票價(jià)格變化趨勢(shì)。通過(guò)分析新聞媒體(如金融文章、財(cái)經(jīng)雜志、地方報(bào)紙等)中相關(guān)消息與股票價(jià)格變化趨勢(shì)之間的關(guān)系是2000年以來(lái)一個(gè)新的研究方向。其中比較著名的是亞利桑納州立大學(xué)研發(fā)的亞利桑納金融文本系統(tǒng)(The Arizona Financial Text system),該系統(tǒng)對(duì)財(cái)經(jīng)新聞和有關(guān)股票價(jià)格的文章進(jìn)行分析,通過(guò)離散性數(shù)值預(yù)測(cè)股票價(jià)格變化趨勢(shì)。具體來(lái)說(shuō),系統(tǒng)首先獲取大量財(cái)經(jīng)類(lèi)新聞報(bào)道并進(jìn)行文本分析,然后結(jié)合當(dāng)前股票指數(shù)的變化預(yù)測(cè)未來(lái)20分鐘內(nèi)某支給定股票的價(jià)格變化趨勢(shì)。研究人員采用2005年某段時(shí)間內(nèi)的實(shí)際股票價(jià)格數(shù)據(jù)對(duì)系統(tǒng)的有效性進(jìn)行了測(cè)試,結(jié)果顯示采用該系統(tǒng)進(jìn)行股票交易后,其收益超過(guò)了同期半數(shù)華爾街交易商的實(shí)際交易收益。近年來(lái),隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展和社交網(wǎng)絡(luò)的廣泛流行,大量與股票相關(guān)的信息在互聯(lián)網(wǎng)上傳播,這些實(shí)時(shí)信息規(guī)模巨大,其中隱含著重要的、與股票市場(chǎng)相關(guān)的信息?!盎诨ヂ?lián)網(wǎng)和社交網(wǎng)絡(luò)信息的股票價(jià)格趨勢(shì)預(yù)測(cè)”逐漸成為主流研究方向。與此同時(shí),傳統(tǒng)的股票價(jià)格趨勢(shì)分析與預(yù)測(cè)方法由于沒(méi)有考慮數(shù)據(jù)的規(guī)模和時(shí)效性,已經(jīng)無(wú)法適應(yīng)網(wǎng)絡(luò)環(huán)境中、海量數(shù)據(jù)規(guī)模下的股票市場(chǎng)分析和預(yù)測(cè)要求?;谏鲜鲅芯克悸罚赖聝蓢?guó)大學(xué)的最新研究發(fā)現(xiàn),通過(guò)對(duì)社交網(wǎng)絡(luò)Twitter中發(fā)布的大量微博消息進(jìn)行分析可預(yù)測(cè)個(gè)股的漲跌情況。美國(guó)佩斯大學(xué)在追蹤了星巴克、可口可樂(lè)和耐克這三家公司的股價(jià)之后,得出研究結(jié)果,認(rèn)為通過(guò)一家公司在社交媒體上的受歡迎程度,可預(yù)測(cè)該公司股價(jià)日常走勢(shì)。德國(guó)慕尼黑科技大學(xué)的研究人員根據(jù)Twitter消息中包含的信息預(yù)測(cè)個(gè)股走勢(shì)。該大學(xué)之前曾實(shí)施了一項(xiàng)研究,研究所采用的情感分析方法被用于分析與某些股票相關(guān)的Twitter消息,以及這些消息是否包含“看漲”、“看跌”或“持有”等信息。慕尼黑科技大學(xué)的研究對(duì)2010年上半年與標(biāo)準(zhǔn)普爾500指數(shù)所有公司有關(guān)的近25萬(wàn)條Twitter消息進(jìn)行了分析,衡量了這些消息同股票收益率、交易量和股價(jià)波動(dòng)的關(guān)系。這項(xiàng)研究表明,Twitter消息所反映的用戶情緒可用于追蹤個(gè)股的股市回報(bào)率,甚至能提前一天預(yù)測(cè)這些股票漲跌情況。如果投資者在2010年上半年以Twitter消息上的用戶情緒為導(dǎo)向購(gòu)買(mǎi)股票,那么他們的平均收益率最高可達(dá)15%。另外,印第安納大學(xué)研究表明利用微博內(nèi)容來(lái)預(yù)測(cè)股市走向成為可能,研究人員分析了 2008年3月到12月間270萬(wàn)Twitter用戶發(fā)布的970萬(wàn)條Twitter消息,發(fā)現(xiàn)可以預(yù)測(cè)之后2至6天的道瓊斯工業(yè)指數(shù)的漲跌。他們利用Google-Profile of Mood States(GPOMS)算法去評(píng)估六種狀態(tài)快樂(lè)、友好、警覺(jué)、沉穩(wěn)、活力和冷靜,通過(guò)觀察GPOMS指數(shù)和每天道瓊斯工業(yè)平均指數(shù)上下波動(dòng)之間是否有相關(guān)性,最終發(fā)現(xiàn)可以預(yù)測(cè)隨后三天內(nèi)的變化,并且準(zhǔn)確度高達(dá)86. 7%。隨著Twitter的發(fā)展和廣泛使用,相關(guān)的第三方工具也隨之大量產(chǎn)生,其中不乏與股票和金融市場(chǎng)有著緊密聯(lián)系的開(kāi)發(fā)工具。StockTwits. com被《時(shí)代周刊》評(píng)為2010年度最佳網(wǎng)站,利用該網(wǎng)站,投資者就可以對(duì)Twitter的各個(gè)群組進(jìn)行過(guò)濾并且獲得那些涉及某個(gè)股票市場(chǎng)或某支股票的Twitter信息。網(wǎng)站跟蹤每種股票的實(shí)時(shí)討論,可以選取幾個(gè)值得關(guān)注的對(duì)象,這樣就可以第一時(shí)間獲取相關(guān)信息,從而幫助個(gè)人對(duì)股票市場(chǎng)的分析和判斷。根據(jù)行為金 融學(xué)理論,股票市場(chǎng)的宏觀整體波動(dòng)性往往依托于微觀主體的投資行為,而作為微觀主體的個(gè)人投資者的投資行為則直接受到其情感因素影響,因此可通過(guò)分析大量個(gè)人投資者的情感,預(yù)測(cè)其投資行為,進(jìn)而對(duì)整個(gè)股票市場(chǎng)的變化趨勢(shì)進(jìn)行預(yù)測(cè)。目前基于社交網(wǎng)絡(luò)中大量個(gè)人投資者發(fā)布的股票交易信息進(jìn)行股票價(jià)格預(yù)測(cè)是一個(gè)新興的研究領(lǐng)域,還處于起步階段,已有研究沒(méi)有考慮社交網(wǎng)絡(luò)中個(gè)人投資者的情感因素和投資者之間的關(guān)系。同時(shí),盡管目前出現(xiàn)了一些應(yīng)用社交網(wǎng)絡(luò)分析股票價(jià)格趨勢(shì)的研究和方法,但這些方法都只是單一的分析數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)股票走勢(shì),忽略了社交網(wǎng)絡(luò)中個(gè)人的股票交易決策遵循海森堡測(cè)不準(zhǔn)原理,即個(gè)體在時(shí)間和決策的兩維坐標(biāo)中,時(shí)間和決策不可能同時(shí)被精確預(yù)測(cè)。量子力學(xué)研究微觀粒子的運(yùn)動(dòng)規(guī)律,經(jīng)典力學(xué)中一個(gè)物理系統(tǒng)的位置和動(dòng)量,可以無(wú)限精確地被確定和預(yù)言。但是由海森堡測(cè)不準(zhǔn)原理可知,微觀粒子具有不確定性,它的位置和動(dòng)量不可能同時(shí)被確定,因此只能以概率的方式描述。薛定諤方程是量子力學(xué)的基本方程,它揭示了微觀世界粒子運(yùn)動(dòng)的基本規(guī)律,求解薛定諤方程得到的波函數(shù)描述了微觀粒子的運(yùn)動(dòng)軌跡。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于量子力學(xué)和社交網(wǎng)絡(luò)的股票價(jià)格趨勢(shì)預(yù)測(cè)方法。I)搜索和采集社交網(wǎng)絡(luò)中與某支股票相關(guān)的海量數(shù)據(jù),海量數(shù)據(jù)包含兩部分內(nèi)容a)社交網(wǎng)絡(luò)中與股票相關(guān)的微博;b)發(fā)表微博的投資者信息;將收集到的海量數(shù)據(jù)整理并存入數(shù)據(jù)庫(kù)中;2)對(duì)步驟I)中收集到的微博進(jìn)行情感分析,情感分為“看漲”和“看跌”兩類(lèi),根據(jù)發(fā)表微博的情感,將投資者分為發(fā)表看漲情感的投資者以及發(fā)表看跌情感的投資者;3)計(jì)算某一時(shí)刻單個(gè)投資者u在社交網(wǎng)絡(luò)中所受到的勢(shì)場(chǎng)強(qiáng)度,勢(shì)場(chǎng)強(qiáng)度的計(jì)算方法如式(I)和式(2)所示
權(quán)利要求
1.一種基于量子力學(xué)和社交網(wǎng)絡(luò)的股票價(jià)格趨勢(shì)預(yù)測(cè)方法,其特征在于包括以下步驟1)搜索和采集社交網(wǎng)絡(luò)中與某支股票相關(guān)的海量數(shù)據(jù),海量數(shù)據(jù)包含兩部分內(nèi)容a) 社交網(wǎng)絡(luò)中與股票相關(guān)的微博;b)發(fā)表微博的投資者信息;將收集到的海量數(shù)據(jù)整理并存入數(shù)據(jù)庫(kù)中;2)對(duì)步驟I)中收集到的微博進(jìn)行情感分析,情感分為“看漲”和“看跌”兩類(lèi),根據(jù)發(fā)表微博的情感,將投資者分為發(fā)表看漲情感的投資者以及發(fā)表看跌情感的投資者;3)計(jì)算某一時(shí)刻單個(gè)投資者u在社交網(wǎng)絡(luò)中所受到的勢(shì)場(chǎng)強(qiáng)度,勢(shì)場(chǎng)強(qiáng)度的計(jì)算方法如式(I)和式(2)所示
2.根據(jù)權(quán)利要求1所述一種基于量子力學(xué)和社交網(wǎng)絡(luò)的股票價(jià)格趨勢(shì)預(yù)測(cè)方法,其特征在于所述情感分析的具體步驟如下2.1)過(guò)濾濾掉微博中不含情感的部分;.2.2)分詞將經(jīng)過(guò)過(guò)濾的微博分割成多個(gè)詞匯,將分詞后的結(jié)果存入詞匯庫(kù)中;.2.3)對(duì)詞匯庫(kù)中的詞匯進(jìn)行處理,處理包括a)去除停止詞;b)綁定否定詞,將否定詞出現(xiàn)位置的前一個(gè)詞和后一個(gè)詞組成兩種組合;.2.4)對(duì)比情感詞典對(duì)經(jīng)過(guò)步驟2. 3)處理后的詞匯庫(kù)中的詞匯,依次和情感詞典中的表示情感的詞匯進(jìn)行比對(duì),記錄匹配程度,進(jìn)而得到微博的情感,若經(jīng)過(guò)比對(duì),發(fā)現(xiàn)微博不具有“看漲”或“看跌”兩種情感,則該微博屬于噪聲數(shù)據(jù),需要從數(shù)據(jù)庫(kù)中刪除。
3.根據(jù)權(quán)利要求1所述一種投資者情感分析方法,其特征在于所述情感影響概率的計(jì)算方法為令投資者V發(fā)出的微博的集合為Av,投資者u受到投資者V影響而發(fā)出的微博的集合為Av2u,則投資者V對(duì)投資者u的情感影響概率表示為
4.根據(jù)權(quán)利要求3所述一種投資者情感分析方法,其特征在于所述Creditv,u(a)的獲取方法為假設(shè)投資者u在tu(a)時(shí)發(fā)出微博a,且在其所有發(fā)出相同微博a的友鄰?fù)顿Y者集合S 中有
全文摘要
本發(fā)明公開(kāi)了一種基于量子力學(xué)和社交網(wǎng)絡(luò)的股票價(jià)格趨勢(shì)預(yù)測(cè)方法,本發(fā)明充分考慮社交網(wǎng)絡(luò)中個(gè)人投資者情感決策的微觀粒子特性,定義網(wǎng)絡(luò)中個(gè)人決策的波函數(shù)以及運(yùn)算符,以分段的無(wú)限深方勢(shì)阱來(lái)模擬社交網(wǎng)絡(luò)中個(gè)體之間的影響關(guān)系,采用薛定諤方程預(yù)測(cè)單個(gè)投資者的情感,并通過(guò)對(duì)社交網(wǎng)絡(luò)中的情感進(jìn)行疊加,描述股票價(jià)格變化趨勢(shì),社交網(wǎng)絡(luò)的量子力學(xué)模型能夠有效提高股票價(jià)格趨勢(shì)預(yù)測(cè)的準(zhǔn)確率,具有重要的理論意義和經(jīng)濟(jì)價(jià)值。
文檔編號(hào)G06Q10/04GK103049804SQ20131001454
公開(kāi)日2013年4月17日 申請(qǐng)日期2013年1月15日 優(yōu)先權(quán)日2013年1月15日
發(fā)明者李倩 申請(qǐng)人:西安交通大學(xué)