專利名稱:彩信用戶行為模型及預(yù)測仿真系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種通訊技術(shù)領(lǐng)域內(nèi)的預(yù)測及仿真系統(tǒng),尤其是一種彩信用戶行為模型及預(yù)測仿真系統(tǒng)。
背景技術(shù):
在對數(shù)據(jù)網(wǎng)絡(luò)維護(hù)和質(zhì)量分析過程中,維護(hù)人員迫切需要對彩信數(shù)據(jù)業(yè)務(wù)建立科學(xué)、完善的分析體系,并為彩信擴(kuò)容、業(yè)務(wù)開展提供準(zhǔn)確的數(shù)據(jù)和科學(xué)的預(yù)測。然而,目前國內(nèi)外并沒有對彩信業(yè)務(wù)用戶行為分析的相關(guān)論述及相應(yīng)的分析預(yù)測及仿真系統(tǒng)。
因而,提供一種彩信用戶行為模型及預(yù)測仿真系統(tǒng)實為必要。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種彩信用戶行為模型及預(yù)測仿真系統(tǒng),以研究彩信業(yè)務(wù)流的特性及其趨勢為切入點,提出了一整套的科學(xué)的分析體系和解決方案。首先對彩信業(yè)務(wù)的流量預(yù)測方法和用戶行為進(jìn)行了分析,并在此基礎(chǔ)上采用網(wǎng)絡(luò)仿真軟件作為輔助手段,得到準(zhǔn)確反映彩信業(yè)務(wù)性能的參數(shù)及數(shù)據(jù),為彩信擴(kuò)容和業(yè)務(wù)開展提供了依據(jù)。
為了實現(xiàn)上述目的,本發(fā)明提供了一種彩信用戶行為模型及預(yù)測仿真系統(tǒng),包括數(shù)據(jù)業(yè)務(wù)預(yù)測模塊、用戶行為分析模塊及仿真模塊,所述數(shù)據(jù)業(yè)務(wù)預(yù)測模塊對未來業(yè)務(wù)的發(fā)展趨勢進(jìn)行預(yù)測,并計算出未來某一天每小時的業(yè)務(wù)總量;所述用戶行為模塊用戶發(fā)起業(yè)務(wù)的特點進(jìn)行分析,并給出了數(shù)學(xué)描述手段;所述業(yè)務(wù)總量及用戶發(fā)起業(yè)務(wù)結(jié)合在一起而生成當(dāng)日業(yè)務(wù)流量,并作為網(wǎng)絡(luò)拓?fù)浞抡娴臉I(yè)務(wù)流量輸入而被所述仿真模塊進(jìn)行仿真。
本發(fā)明的優(yōu)點在于系統(tǒng)設(shè)備簡單,彩信用戶行為預(yù)測準(zhǔn)確、快速,仿真效果良好。
下面將結(jié)合附圖,通過優(yōu)選實施例詳細(xì)描述本發(fā)明。
圖1為本發(fā)明彩信用戶行為模型及預(yù)測仿真系統(tǒng)的結(jié)構(gòu)框圖。
圖2為本發(fā)明彩信用戶行為模型及預(yù)測仿真系統(tǒng)的數(shù)據(jù)業(yè)務(wù)預(yù)測模塊對2004年8月18日的業(yè)務(wù)數(shù)據(jù)進(jìn)行預(yù)測后得到的該日業(yè)務(wù)總量時序圖。
圖3為對圖2所示的業(yè)務(wù)總量時序圖中的業(yè)務(wù)量縮小為1/10后的業(yè)務(wù)總量時序圖。
圖4為本發(fā)明的用戶行為分析模塊對圖3所示當(dāng)日業(yè)務(wù)量進(jìn)行分析后得到的部分業(yè)務(wù)流量。
圖5為本發(fā)明彩信用戶行為模型及預(yù)測仿真系統(tǒng)的仿真模塊詳細(xì)結(jié)構(gòu)圖。
圖6為本發(fā)明仿真模塊仿真后得到的各個網(wǎng)絡(luò)節(jié)點的CPU利用率情況。
圖7為各個網(wǎng)絡(luò)節(jié)點的業(yè)務(wù)量和CPU利用率的關(guān)系曲線。
圖8仿真后得到的mo、ao、fo三種業(yè)務(wù)的業(yè)務(wù)延時情況。
圖9仿真后得到的mo、ao、fo業(yè)務(wù)的流量與業(yè)務(wù)延時的關(guān)系曲線。
具體實施例方式
參考圖1,本發(fā)明彩信用戶行為模型及預(yù)測仿真系統(tǒng)包括數(shù)據(jù)業(yè)務(wù)預(yù)測模塊1、用戶行為分析模塊2及仿真模塊3。其中,所述數(shù)據(jù)業(yè)務(wù)預(yù)測模塊1用于預(yù)測未來業(yè)務(wù)的發(fā)展趨勢,并計算出未來某一天每小時的業(yè)務(wù)總量;所述用戶行為分析模塊2精確地描述了用戶發(fā)起業(yè)務(wù)的特點,并給出了數(shù)學(xué)描述手段;這兩部分結(jié)合在一起,可以生成這一天的業(yè)務(wù)流量,作為網(wǎng)絡(luò)拓?fù)浞抡娴臉I(yè)務(wù)流量輸入;所述仿真模塊3用于對上述業(yè)務(wù)流量進(jìn)行仿真。從仿真后獲得的數(shù)據(jù)中可以發(fā)現(xiàn)現(xiàn)有網(wǎng)絡(luò)拓?fù)渑渲檬欠裉峁┝俗銐虻姆?wù)性能。如果無法提供滿意的服務(wù)質(zhì)量,可以斷定哪個節(jié)點是網(wǎng)絡(luò)瓶頸所在。當(dāng)網(wǎng)絡(luò)瓶頸位置獲得后,再將該有問題的網(wǎng)絡(luò)瓶頸節(jié)點的參數(shù)改變或者增加該節(jié)點的個數(shù),從而解決了該瓶頸問題。所述數(shù)據(jù)業(yè)務(wù)預(yù)測模塊1、用戶行為分析模塊2及仿真模塊3三者互相配合能夠用于指導(dǎo)未來業(yè)務(wù)的開展以及網(wǎng)絡(luò)的維護(hù)和優(yōu)化工作。
首先對彩信業(yè)務(wù)的用戶行為分析。
目前國內(nèi)外并沒有對彩信業(yè)務(wù)用戶行為分析的相關(guān)論述或相關(guān)技術(shù)。傳統(tǒng)電信網(wǎng)絡(luò)業(yè)務(wù)模型為泊松模型。一直以來人們圍繞泊松模型作了大量的研究和分析,并得到了眾多寶貴的結(jié)論。在本文中通過分析彩信業(yè)務(wù)的特有特性,發(fā)現(xiàn)由用戶發(fā)起的彩信發(fā)送服從Poisson分布,這個發(fā)現(xiàn)和其他由用戶行為決定的隨機(jī)過程(傳統(tǒng)的電信業(yè)務(wù))是一致的。因此本項研究借鑒前人分析Poisson分布的方法和經(jīng)驗,對彩信業(yè)務(wù)的用戶行為進(jìn)行了分析研究,下面以廣東省全球通用戶為例來說明。
(1)廣東省全球通用戶的每分鐘彩信發(fā)起的分布由于一天中不同的時刻,彩信的發(fā)送量差別很大。在白天和深夜,工作時間和休息時間等,發(fā)送量的變化形成了鮮明的對比。因此,本項研究不可能用一個簡單的具有固定到達(dá)率λ的Poisson模型去描述彩信發(fā)送的用戶行為。但是為了更好地對彩信的發(fā)送這種用戶行為進(jìn)行描述,本項研究將把一天分成24個時間段,即每一個時間段的時間間隔為一個小時。在每一個時間段中本項研究將用具有固定到達(dá)率λ的Poisson模型去描述。這樣本項研究將可以避免使用具有隨時間變化的到達(dá)率λ(t)的復(fù)雜Poisson模型。
在每一個時間段里,本項研究對數(shù)據(jù)進(jìn)行柯爾莫哥洛夫—斯米諾夫檢驗,從而驗證彩信發(fā)送是服從何種分布。下表為檢驗數(shù)據(jù)。
表2-1
從上表2-1本項研究可以看到在忙時,彩信的發(fā)送更趨近于服從正態(tài)分布,只有在閑時彩信的發(fā)送才明顯地服從泊松分布,這與本項研究原來的分析不符。但本項研究注意到本項研究采用的時間單位是分鐘,統(tǒng)計的范圍是廣東省全省全球通用戶的彩信發(fā)送情況,并且根據(jù)中心極限定理,大量獨立同分布的隨機(jī)變量之和的分布服從正態(tài)分布。這樣,本項研究得到上面的檢驗結(jié)果是合理的,為了進(jìn)一步分析彩信發(fā)送是否服從泊松分布,本項研究把時間單位細(xì)化為一秒,由于數(shù)據(jù)采集的問題,本項研究根據(jù)預(yù)先設(shè)定的抽樣方案,對廣東省全省全球通用戶進(jìn)行隨機(jī)抽樣,得到了5000個抽樣用戶的2004年11月29日——2005年1月3日的話費單。
(2)5000個抽樣用戶的每秒彩信發(fā)起的分布在這里本項研究只提取了1月1日5000個抽樣用戶的彩信發(fā)送情況進(jìn)行分析。本項研究把一天分成24個時間段進(jìn)行分析。由于本項研究把時間間隔細(xì)化到秒,故每個時間段有數(shù)據(jù)3600個,用X(i)(i=1,2,...,3600)表示每一時刻5000個抽樣用戶發(fā)送的彩信量。在每一個時間段里,本項研究對這些數(shù)據(jù)進(jìn)行柯爾莫哥洛夫—斯米諾夫檢驗,從而驗證彩信發(fā)送是服從何種分布。得到了下表2-2表2-2
從上面的結(jié)果本項研究可以看到5000個抽樣用戶發(fā)送彩信的情況基本服從泊松分布,只是在00:00:00-00:59:59這個時間段里出現(xiàn)異常,經(jīng)過分析,1月1日是元旦日,零時零刻是新的一年到來的時刻,人們會以發(fā)送信息的方式向親朋好友祝福,故在這個時間段里產(chǎn)生了很多突發(fā)數(shù)據(jù),故驗證結(jié)果異常,這是合理的。由此,本項研究可以知道彩信用戶發(fā)送彩信的行為服從泊松分布。
(3)小結(jié)經(jīng)過上面的一系列分析,本項研究可以得到一個把一天分成24個時間段,每一個時間段用具有固定到達(dá)率λi(i=1,2,...,24)的Poisson模型去描述彩信發(fā)送行為的一個用戶行為模型。這個模型是合理的。模型的具體參數(shù)的確定可以根據(jù)實際數(shù)據(jù)來確定。
其次利用數(shù)據(jù)業(yè)務(wù)預(yù)測模塊對彩信業(yè)務(wù)預(yù)測。
數(shù)據(jù)業(yè)務(wù)預(yù)測部分描述了未來業(yè)務(wù)的發(fā)展趨勢,給出了未來某一天每小時的業(yè)務(wù)總量;用戶行為分析精確了描述了用戶發(fā)起業(yè)務(wù)的特點,并給出了數(shù)學(xué)描述手段;這兩部分結(jié)合在一起,可以產(chǎn)生這一天的業(yè)務(wù)流量,作為網(wǎng)絡(luò)拓?fù)浞抡娴臉I(yè)務(wù)流量輸入,仿真后得到的數(shù)據(jù)可以回答在現(xiàn)有的網(wǎng)絡(luò)拓?fù)渑渲檬欠裉峁┝俗銐虻姆?wù)性能。如果無法提供滿意的服務(wù)質(zhì)量,哪個節(jié)點是網(wǎng)絡(luò)瓶頸所在。將網(wǎng)絡(luò)瓶頸節(jié)點的參數(shù)改變或者增加該節(jié)點的個數(shù),是否解決了該瓶頸。因此,將三部分結(jié)合在一起,能夠用于指導(dǎo)未來業(yè)務(wù)的開展以及網(wǎng)絡(luò)的維護(hù)和優(yōu)化工作。
圖2所示為數(shù)據(jù)業(yè)務(wù)預(yù)測模塊1預(yù)測得到的2004年9月1目的彩信業(yè)務(wù),包括mo、fo、ao(eo的流量非常小,這里沒有畫出)在這一天里每小時的業(yè)務(wù)總量的時序圖。
從上圖中可以看出,mo、ao、fo的業(yè)務(wù)量比較大。在這里為便于上述業(yè)務(wù)量在網(wǎng)絡(luò)拓?fù)渲械玫接行У姆抡妫瑢⑾鄳?yīng)的業(yè)務(wù)量縮小為原來業(yè)務(wù)量的1/10,以使仿真能更快地完成。eo的業(yè)務(wù)量本來很小,縮小后可以忽略不計。圖3所示為縮小為1/10后得到的業(yè)務(wù)量。
再根據(jù)彩信業(yè)務(wù),用戶行為分析的結(jié)論,業(yè)務(wù)流量服從possion分布,將上圖的每小時業(yè)務(wù)量生成業(yè)務(wù)流量。圖4所示是生成的業(yè)務(wù)流量中一部分。
圖4中的直線表示業(yè)務(wù)發(fā)起時刻,直線的疏密程度反映了業(yè)務(wù)量的大小。圖4的上半副圖是5:00~5:06這一段時間內(nèi)業(yè)務(wù)流量;下半副圖是15:00~15:06這一段時間內(nèi)業(yè)務(wù)流量。
最后彩信業(yè)務(wù)進(jìn)行網(wǎng)絡(luò)拓?fù)浞抡妗?br>
將2004年9月1日生成的業(yè)務(wù)流量加載到如圖5所示的仿真場景中,經(jīng)過仿真得到以下數(shù)據(jù)(1)網(wǎng)絡(luò)節(jié)點的關(guān)鍵性能指標(biāo)即CPU利用率和重傳率。
圖6是仿真后得到的各個網(wǎng)絡(luò)節(jié)點的CPU利用率。從中可以看出,節(jié)點的負(fù)荷隨著圖3所示的業(yè)務(wù)量的變化趨勢而變化。忙時的負(fù)荷遠(yuǎn)遠(yuǎn)大于閑時的負(fù)荷。從各個節(jié)點的負(fù)荷對比可以看出,網(wǎng)關(guān)的負(fù)荷最重,某些時刻達(dá)到了100%。另外,所有節(jié)點的CPU利用率大部分時間都沒有到達(dá)滿負(fù)荷,即在該網(wǎng)絡(luò)配置情況下,節(jié)點的處理能力足以保證該業(yè)務(wù)流量下的服務(wù)質(zhì)量,不會出現(xiàn)網(wǎng)絡(luò)瓶頸。
根據(jù)上圖所示的節(jié)點CPU利用率,以及采集各節(jié)點的流量到達(dá)情況,可以統(tǒng)計分析得到網(wǎng)關(guān)、dns、重定向器、彩信c、iod、smsc的業(yè)務(wù)量與CPU利用率之間的關(guān)系,如圖7所示。
圖7所示的曲線是從圖6統(tǒng)計得到的。橫軸每分鐘的業(yè)務(wù)量是指相應(yīng)節(jié)點到達(dá)的業(yè)務(wù)量。從中可以看出,網(wǎng)關(guān)、dns、重定向器、彩信c、iod、smsc的CPU利用率隨著業(yè)務(wù)量的增大而大致呈現(xiàn)線性變化關(guān)系。并且,從圖2-6也可以初略地看出網(wǎng)關(guān)、dns、重定向器、彩信c、iod、smsc這6個節(jié)點的業(yè)務(wù)量關(guān)系,網(wǎng)關(guān)每分鐘最大業(yè)務(wù)量高達(dá)330,而dns的每分鐘最大業(yè)務(wù)量不超過100??梢?,網(wǎng)關(guān)的負(fù)荷是最重的。
采集得到的重傳率為0%,沒有出現(xiàn)重傳現(xiàn)象。這是因為在節(jié)點尚未到達(dá)滿負(fù)荷,即沒有出現(xiàn)瓶頸的情況下,不會出現(xiàn)重傳。如果業(yè)務(wù)流量過大,超出節(jié)點的處理能力,包就會在節(jié)點的緩存區(qū)排隊。如果緩存沒有足夠的緩存空間來存儲包,則會將多余的數(shù)據(jù)包丟掉,從而引起重傳。
(2)業(yè)務(wù)延時。
如圖8所示,仿真后得到mo、ao、fo三種業(yè)務(wù)的業(yè)務(wù)延時。從上述的延時變化來看,業(yè)務(wù)延時的變化趨勢也隨著圖3所示的業(yè)務(wù)量變化而變化,在忙時,節(jié)點處理能力到達(dá)滿負(fù)荷的時候,業(yè)務(wù)延時變得很大,如mo業(yè)務(wù),空閑狀態(tài)下業(yè)務(wù)延時為5秒,忙時某些時刻甚至到達(dá)23秒。在一定的節(jié)點參數(shù)下,延時隨著業(yè)務(wù)流量的增大而變大。
根據(jù)圖8所示的數(shù)據(jù),可以分析mo、ao、fo業(yè)務(wù),流量與業(yè)務(wù)延時的關(guān)系曲線,如圖9所示。
從圖9可以看出,業(yè)務(wù)延時也隨著流量的變大而增大,并且隨著業(yè)務(wù)量的增長,一開始比較平穩(wěn)的變化,業(yè)務(wù)量增長到一定程度后,業(yè)務(wù)延時呈指數(shù)增長符合實際業(yè)務(wù)情況。
總結(jié)本發(fā)明,首先進(jìn)行彩信用戶行為建模用具有不同到達(dá)率的Poisson模型去描述彩信發(fā)送行為的一個用戶行為模型,模型具體參數(shù)的確定可以根據(jù)采樣的實際數(shù)據(jù)來確定;然后建立數(shù)據(jù)業(yè)務(wù)預(yù)測系統(tǒng);最后基于模型和系統(tǒng),實現(xiàn)彩信業(yè)務(wù)和流量的仿真分析。
本發(fā)明以研究彩信業(yè)務(wù)流的特性及其趨勢為切入點,提出了一整套的科學(xué)的分析體系和解決方案。首先對彩信業(yè)務(wù)的流量預(yù)測方法和用戶行為進(jìn)行了分析,并在此基礎(chǔ)上采用網(wǎng)絡(luò)仿真軟件作為輔助手段,得到準(zhǔn)確反映彩信業(yè)務(wù)性能的參數(shù)及數(shù)據(jù),為彩信擴(kuò)容和業(yè)務(wù)開展提供了依據(jù)。
以上所揭露的僅為本發(fā)明的優(yōu)選實施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明申請專利范圍所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。
權(quán)利要求
1.一種彩信用戶行為模型及預(yù)測仿真系統(tǒng),其特征在于包括數(shù)據(jù)業(yè)務(wù)預(yù)測模塊、用戶行為分析模塊及仿真模塊,所述數(shù)據(jù)業(yè)務(wù)預(yù)測模塊對未來業(yè)務(wù)的發(fā)展趨勢進(jìn)行預(yù)測,并計算出未來某一天每小時的業(yè)務(wù)總量;所述用戶行為模塊用戶發(fā)起業(yè)務(wù)的特點進(jìn)行分析,并給出了數(shù)學(xué)描述手段;所述業(yè)務(wù)總量及用戶發(fā)起業(yè)務(wù)結(jié)合在一起而生成當(dāng)日業(yè)務(wù)流量,并作為網(wǎng)絡(luò)拓?fù)浞抡娴臉I(yè)務(wù)流量輸入而被所述仿真模塊進(jìn)行仿真。
2.根據(jù)權(quán)利要求1所述的彩信用戶行為模型及預(yù)測仿真系統(tǒng),其特征在于所述用戶行為分析模塊分析時用具有不同到達(dá)率的Poisson模型去建立彩信發(fā)送行為的一個用戶行為模型。
3.根據(jù)權(quán)利要求1所述的彩信用戶行為模型及預(yù)測仿真系統(tǒng),其特征在于所述模型具體參數(shù)的確定可以根據(jù)采樣的實際數(shù)據(jù)來確定。
全文摘要
本發(fā)明公開了一種彩信用戶行為模型及預(yù)測仿真系統(tǒng),包括數(shù)據(jù)業(yè)務(wù)預(yù)測模塊、用戶行為分析模塊及仿真模塊,數(shù)據(jù)業(yè)務(wù)預(yù)測模塊對未來業(yè)務(wù)的發(fā)展趨勢進(jìn)行預(yù)測,并計算未來某一天每小時的業(yè)務(wù)總量;用戶行為模塊用戶發(fā)起業(yè)務(wù)的特點進(jìn)行分析,并給出了數(shù)學(xué)描述手段;業(yè)務(wù)總量及用戶發(fā)起業(yè)務(wù)結(jié)合在一起而生成當(dāng)日業(yè)務(wù)流量,并作為網(wǎng)絡(luò)拓?fù)浞抡娴臉I(yè)務(wù)流量輸入而被所述仿真模塊進(jìn)行仿真。
文檔編號H04L12/26GK1870535SQ20061003534
公開日2006年11月29日 申請日期2006年4月30日 優(yōu)先權(quán)日2006年4月30日
發(fā)明者舒波, 馮佩珍, 孫劍駿, 王峻, 陳東明, 黃昭文, 邱嶺, 陳曦, 范曉強(qiáng), 鄭浩彬, 李志鋒, 馮穗力 申請人:廣東移動通信有限責(zé)任公司