本發(fā)明涉及計算機(jī)科學(xué),特別是一種銷售數(shù)據(jù)的可視化處理方法及系統(tǒng)。
背景技術(shù):
1、隨著信息技術(shù)的飛速發(fā)展,大數(shù)據(jù)分析技術(shù)已經(jīng)成為企業(yè)決策的重要依據(jù),特別是在零售行業(yè),通過對銷售數(shù)據(jù)的有效分析,可以提高運營效率、優(yōu)化庫存管理、增強顧客體驗并促進(jìn)銷售額的增長,傳統(tǒng)的銷售數(shù)據(jù)分析主要依靠人工報表和簡單的統(tǒng)計軟件,這種方法耗時且效率低下,難以應(yīng)對海量數(shù)據(jù)的挑戰(zhàn),近年來,隨著云計算、大數(shù)據(jù)處理框架以及高級數(shù)據(jù)分析工具的出現(xiàn),企業(yè)能夠更高效地處理和分析大量銷售數(shù)據(jù),此外,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的進(jìn)步使得自動化和智能化的數(shù)據(jù)分析成為可能,這不僅極大地提高了數(shù)據(jù)處理的速度和精度,還能夠揭示隱藏在數(shù)據(jù)背后的復(fù)雜模式和趨勢。
2、盡管現(xiàn)有技術(shù)在銷售數(shù)據(jù)分析領(lǐng)域取得了顯著進(jìn)步,但仍存在一些不足之處,首先,傳統(tǒng)的數(shù)據(jù)聚合方法通常是靜態(tài)的,即聚合級別和粒度固定不變,這限制了數(shù)據(jù)靈活性和用戶定制化的可能性,例如,在分析不同時間段的銷售趨勢時,用戶可能希望查看不同粒度的數(shù)據(jù),但現(xiàn)有的系統(tǒng)往往不能很好地滿足這種需求,其次,大多數(shù)系統(tǒng)在預(yù)測未來銷售趨勢時僅依賴于單一模型,如時間序列分析或簡單的回歸模型,而這些模型往往無法捕捉到復(fù)雜的非線性關(guān)系和長期依賴性,導(dǎo)致預(yù)測準(zhǔn)確度不高,此外,現(xiàn)有系統(tǒng)在展示預(yù)測結(jié)果時往往缺乏靈活性和交互性,難以根據(jù)用戶的個性化需求進(jìn)行自適應(yīng)調(diào)整。
技術(shù)實現(xiàn)思路
1、鑒于上述現(xiàn)有存在的問題,提出了本發(fā)明。
2、因此,本發(fā)明提供了一種銷售數(shù)據(jù)的可視化處理方法及系統(tǒng)解決現(xiàn)有技術(shù)中數(shù)據(jù)聚合不靈活、預(yù)測模型單一以及用戶界面調(diào)整不自適應(yīng)的問題。
3、為解決上述技術(shù)問題,本發(fā)明提供如下技術(shù)方案:
4、第一方面,本發(fā)明提供了一種銷售數(shù)據(jù)的可視化處理方法,其包括,從pos系統(tǒng)、在線商店、crm系統(tǒng)的數(shù)據(jù)源中收集原始銷售數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理,集存儲到銷售數(shù)據(jù)庫中;基于銷售數(shù)據(jù)庫中的數(shù)據(jù),利用數(shù)據(jù)聚合和機(jī)器學(xué)習(xí),構(gòu)建自適應(yīng)動態(tài)數(shù)據(jù)聚合算法;通過自適應(yīng)動態(tài)數(shù)據(jù)聚合算法,自動識別數(shù)據(jù)中的模式,同時根據(jù)用戶的使用習(xí)慣和查詢條件動態(tài)調(diào)整數(shù)據(jù)的聚合級別和粒度,生成聚合后的數(shù)據(jù);結(jié)合長短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),構(gòu)建融合預(yù)測模型并基于歷史銷售數(shù)據(jù)預(yù)測未來的銷售趨勢;利用聚合后的數(shù)據(jù)對融合預(yù)測模型進(jìn)行訓(xùn)練,優(yōu)化融合預(yù)測模型捕捉數(shù)據(jù)特征類型的能力;將未來的銷售趨勢結(jié)果進(jìn)行自適應(yīng)布局與動態(tài)調(diào)整,并以圖表的形式直觀地展示給用戶。
5、作為本發(fā)明所述銷售數(shù)據(jù)的可視化處理方法的一種優(yōu)選方案,其中:所述從pos系統(tǒng)、在線商店、crm系統(tǒng)的數(shù)據(jù)源中收集原始銷售數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理,集存儲到銷售數(shù)據(jù)庫中,具體步驟為:
6、pos系統(tǒng)中收集的數(shù)據(jù),包括銷售交易記錄、庫存信息、退貨記錄和員工操作記錄;
7、在線商店中收集的數(shù)據(jù),包括訂單數(shù)據(jù)、用戶行為數(shù)據(jù)、評價與反饋和促銷活動數(shù)據(jù);
8、crm系統(tǒng)中收集的數(shù)據(jù),包括客戶基本信息、購買歷史、服務(wù)交互記錄和營銷活動響應(yīng);
9、對pos系統(tǒng)、在線商店、crm系統(tǒng)的數(shù)據(jù)源中收集到的數(shù)據(jù),進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)集成、數(shù)據(jù)歸約和數(shù)據(jù)質(zhì)量檢查處理;
10、根據(jù)預(yù)處理后的數(shù)據(jù)定義數(shù)據(jù)庫字段名、數(shù)據(jù)類型的表結(jié)構(gòu),并為每個表結(jié)構(gòu)設(shè)置訂單id主鍵字段和表之間的外鍵約束關(guān)系;
11、將設(shè)定好的數(shù)據(jù)表導(dǎo)入數(shù)據(jù)庫中,并對經(jīng)常作為查詢條件的字段創(chuàng)建索引。
12、作為本發(fā)明所述銷售數(shù)據(jù)的可視化處理方法的一種優(yōu)選方案,其中:所述基于銷售數(shù)據(jù)庫中的數(shù)據(jù),利用數(shù)據(jù)聚合和機(jī)器學(xué)習(xí),構(gòu)建自適應(yīng)動態(tài)數(shù)據(jù)聚合算法,具體步驟為:
13、引入動態(tài)調(diào)整因子α和動態(tài)權(quán)重函數(shù)w(t),對銷售數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行動態(tài)權(quán)重和聚合程度的調(diào)整;
14、定義動態(tài)權(quán)重函數(shù)w(t)表達(dá)式為:
15、;
16、其中,σ′t是在時間點t上銷售數(shù)據(jù)的標(biāo)準(zhǔn)差,β為控制著函數(shù)的陡峭程度的參數(shù),γ為決定了函數(shù)曲線中心位置的參數(shù);
17、定義動態(tài)調(diào)整因子α表達(dá)式為:
18、;
19、其中,di是第i個數(shù)據(jù)點的重要性度量,n是數(shù)據(jù)點的數(shù)量,δ為數(shù)據(jù)點重要性度量di的敏感度系數(shù),j和i為遍歷所有數(shù)據(jù)點的索引;
20、結(jié)合動態(tài)權(quán)重函數(shù)w(t)和動態(tài)調(diào)整因子α,構(gòu)建聚數(shù)函數(shù)p(x)表達(dá)式為:
21、;
22、;
23、其中,x為時間序列數(shù)據(jù),t為時間序列的長度;
24、引入深度神經(jīng)網(wǎng)絡(luò)優(yōu)化參數(shù)β,γ,和δ,并通過反向傳播算法來最小化預(yù)測的聚合值與實際聚合值之間的差異;
25、在不斷迭代優(yōu)化β,γ,和δ的值的過程中,直到達(dá)到預(yù)定的收斂標(biāo)準(zhǔn)的性能指標(biāo),完成對自適應(yīng)動態(tài)數(shù)據(jù)聚合算法的構(gòu)建。
26、作為本發(fā)明所述銷售數(shù)據(jù)的可視化處理方法的一種優(yōu)選方案,其中:所述通過自適應(yīng)動態(tài)數(shù)據(jù)聚合算法,自動識別數(shù)據(jù)中的模式,同時根據(jù)用戶的使用習(xí)慣和查詢條件動態(tài)調(diào)整數(shù)據(jù)的聚合級別和粒度,生成聚合后的數(shù)據(jù),具體步驟為:
27、記錄用戶查詢的頻率、查詢的時間段、查詢的具體內(nèi)容,并使用k-means聚類算法對用戶查詢進(jìn)行分組;
28、基于上述分組,使用apriori關(guān)聯(lián)規(guī)則學(xué)習(xí)來發(fā)現(xiàn)用戶查詢之間的關(guān)聯(lián)性;
29、若用戶頻繁查詢某一特定級別的數(shù)據(jù),則增加級別的權(quán)重;
30、若用戶經(jīng)常查看某一特定粒度的數(shù)據(jù),則減少其他粒度的數(shù)據(jù)計算;
31、引入一個用戶偏好函數(shù)u(p),衡量用戶對不同聚合級別p的偏好程度,表達(dá)式為:
32、;
33、其中,m為用戶查詢模式的總數(shù),fi(p)為第i個查詢模式對聚合級別p的偏好程度
34、基于用戶偏好函數(shù)對聚數(shù)函數(shù)p(x)進(jìn)行更新,表達(dá)式為:
35、;
36、其中,p′(x)表示更新后的聚數(shù)函數(shù),輸出聚合后的數(shù)據(jù);
37、融合用戶偏好函數(shù)u(p),構(gòu)建復(fù)合損失函數(shù)l′訓(xùn)練更新后的聚數(shù)函數(shù)p′(xt)過程中最小化預(yù)測值與實際之間的差異,表達(dá)式為:
38、;
39、其中,yt為實際聚合值在時間點t上的值,λ為正則化系數(shù);
40、使用adam梯度下降法來更新β,γ,δ的值;
41、設(shè)置一個均方誤差性能指標(biāo)作為收斂標(biāo)準(zhǔn),當(dāng)連續(xù)若干次迭代后性能指標(biāo)的變化小于閾值時,則認(rèn)為模型已收斂。
42、作為本發(fā)明所述銷售數(shù)據(jù)的可視化處理方法的一種優(yōu)選方案,其中:所述結(jié)合長短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),構(gòu)建融合預(yù)測模型并基于歷史銷售數(shù)據(jù)預(yù)測未來的銷售趨勢,具體步驟為:
43、從銷售數(shù)據(jù)庫中提取歷史銷售數(shù)據(jù),將整理成時間序列格式;
44、將cnn層中的卷積核將應(yīng)用于輸入時間序列的滑動窗口上,進(jìn)行多尺度局部特征的捕捉,表達(dá)式為:
45、;
46、其中,表示在時間點t處第j個卷積核的輸出,表示第j個卷積核的第i個權(quán)重,σ表示非線性激活函數(shù),b是偏差項,k表示卷積核的寬度,s表示卷積步長;
47、使用lstm層來處理cnn層的輸出,捕捉長期依賴關(guān)系;
48、通過全連接層來融合cnn和lstm層的輸出,生成預(yù)測未來的銷售趨勢表達(dá)式為:
49、;
50、其中,gt表示在時間點t的銷售趨勢預(yù)測值,w′g表示融合層的權(quán)重矩陣,bg表示融合層的偏差項;
51、采用均方誤差作為損失函數(shù),同時融入時間點t的銷售趨勢預(yù)測值,定義均方誤差損失函數(shù)l′′表達(dá)式為:
52、;
53、使用adam優(yōu)化器來最小化損失函數(shù)l,并更新模型參數(shù);
54、將預(yù)測結(jié)果以折線圖的形式展示給用戶。
55、作為本發(fā)明所述銷售數(shù)據(jù)的可視化處理方法的一種優(yōu)選方案,其中:所述利用聚合后的數(shù)據(jù)對融合預(yù)測模型進(jìn)行訓(xùn)練,優(yōu)化融合預(yù)測模型捕捉數(shù)據(jù)特征類型的能力,具體步驟為:
56、從經(jīng)過聚合的數(shù)據(jù)集中抽取訓(xùn)練樣本;
57、將抽取到的訓(xùn)練樣本為訓(xùn)練集、驗證集和測試集;
58、初始化cnn-lstm模型及卷積核、lstm單元狀態(tài)、全連接層權(quán)重和偏置項的參數(shù);
59、對于每個訓(xùn)練周期,遍歷訓(xùn)練集中的所有批次;
60、將聚合后將每批次的數(shù)據(jù)送入cnn層以捕捉局部特征,并將cnn輸出送入lstm層以捕捉長期依賴關(guān)系;
61、通過全連接層融合cnn和lstm層的輸出,計算損失函數(shù)并使用adam優(yōu)化器反向傳播以更新模型參數(shù);
62、在每個訓(xùn)練周期結(jié)束時,使用驗證集評估模型性能,監(jiān)控驗證集上的損失函數(shù)和性能指標(biāo),并應(yīng)用早停策略以防止過擬合;
63、使用網(wǎng)格搜索方法調(diào)整模型學(xué)習(xí)率、批量大小的超參數(shù),并基于驗證集的表現(xiàn)選擇最佳的超參數(shù)組合;
64、當(dāng)訓(xùn)練集上的損失不再降低時,且驗證集上的性能不再改善時,模型則已收斂。
65、作為本發(fā)明所述銷售數(shù)據(jù)的可視化處理方法的一種優(yōu)選方案,其中:所述將未來的銷售趨勢結(jié)果進(jìn)行自適應(yīng)布局與動態(tài)調(diào)整,并以圖表的形式直觀地展示給用戶,具體步驟為:
66、引入屏幕尺寸因子s和用戶偏好因子u定義用戶界面布局;
67、屏幕尺寸因子s表達(dá)式為:
68、;
69、其中,w和h分別代表屏幕寬度和高度;
70、結(jié)合屏幕尺寸因子s和用戶偏好因子u,構(gòu)建自適應(yīng)布局函數(shù)a(l)來計算布局元素的位置和大小,表達(dá)式為:
71、;
72、其中,β′為控制屏幕尺寸因子s影響強度的參數(shù),γ′為屏幕尺寸因子s的閾值,q為布局參數(shù)列表,(1?u)+u為用戶偏好因子u的線性插值;
73、引入數(shù)據(jù)量因子v和用戶關(guān)注因子f,定義動態(tài)調(diào)整參數(shù)d(f)進(jìn)行展示數(shù)據(jù)粒度和級別的調(diào)整,表達(dá)式為:
74、;
75、其中,δ′為控制數(shù)據(jù)量因子v影響強度的參數(shù),η為數(shù)據(jù)量因子v的閾值,dv為積分變量v的微小變化量,(1?f)+f為用戶關(guān)注因子f的線性插值;
76、結(jié)合自適應(yīng)布局函數(shù)a(l)和動態(tài)調(diào)整函數(shù)d(f),生成最終的圖表展示,表達(dá)式為:
77、;
78、其中,n′為布局元素的數(shù)量,hi和fi分別代表第i個布局元素的布局參數(shù)列表和用戶關(guān)注因子,a(hi)和d(fi)分別為第i個布局元素的自適應(yīng)布局函數(shù)和動態(tài)調(diào)整函數(shù)。
79、第二方面,本發(fā)明提供了一種銷售數(shù)據(jù)的可視化處理系統(tǒng),包括數(shù)據(jù)存儲模塊、自適應(yīng)動態(tài)數(shù)據(jù)聚合模塊、智能數(shù)據(jù)聚合模塊、預(yù)測模型構(gòu)建模塊,模型訓(xùn)練與優(yōu)化模塊和數(shù)據(jù)可視化模塊;所述數(shù)據(jù)存儲模塊用于從pos系統(tǒng)、在線商店、crm系統(tǒng)的數(shù)據(jù)源中收集原始銷售數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理,集存儲到銷售數(shù)據(jù)庫中;所述自適應(yīng)動態(tài)數(shù)據(jù)聚合模塊用于基于銷售數(shù)據(jù)庫中的數(shù)據(jù),利用數(shù)據(jù)聚合和機(jī)器學(xué)習(xí),構(gòu)建自適應(yīng)動態(tài)數(shù)據(jù)聚合算法;所述智能數(shù)據(jù)聚合模塊用于通過自適應(yīng)動態(tài)數(shù)據(jù)聚合算法,自動識別數(shù)據(jù)中的模式,同時根據(jù)用戶的使用習(xí)慣和查詢條件動態(tài)調(diào)整數(shù)據(jù)的聚合級別和粒度,生成聚合后的數(shù)據(jù);所述預(yù)測模型構(gòu)建模塊用于結(jié)合長短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò),構(gòu)建融合預(yù)測模型并基于歷史銷售數(shù)據(jù)預(yù)測未來的銷售趨勢;所述模型訓(xùn)練與優(yōu)化模塊用于利用聚合后的數(shù)據(jù)對融合預(yù)測模型進(jìn)行訓(xùn)練,優(yōu)化融合預(yù)測模型捕捉數(shù)據(jù)特征類型的能力;所述數(shù)據(jù)可視化模塊用于將未來的銷售趨勢結(jié)果進(jìn)行自適應(yīng)布局與動態(tài)調(diào)整,并以圖表的形式直觀地展示給用戶。
80、第三方面,本發(fā)明提供了一種計算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計算機(jī)程序,其中:所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如本發(fā)明第一方面所述的銷售數(shù)據(jù)的可視化處理方法的任一步驟。
81、第四方面,本發(fā)明提供了一種計算機(jī)可讀存儲介質(zhì),其上存儲有計算機(jī)程序,其中:所述計算機(jī)程序被處理器執(zhí)行時實現(xiàn)如本發(fā)明第一方面所述的銷售數(shù)據(jù)的可視化處理方法的任一步驟。
82、本發(fā)明有益效果為:本發(fā)明通過采用自適應(yīng)動態(tài)數(shù)據(jù)聚合算法、融合預(yù)測模型以及自適應(yīng)布局與動態(tài)調(diào)整機(jī)制等創(chuàng)新技術(shù)手段,有效地解決了現(xiàn)有技術(shù)中存在的聚合方法僵化、預(yù)測模型單一以及用戶界面不靈活等問題;顯著提升銷售數(shù)據(jù)處理的靈活性和預(yù)測準(zhǔn)確性,同時增強了用戶界面的友好性和個性化體驗,使得企業(yè)能夠在快速變化的市場環(huán)境中做出更加精準(zhǔn)的決策,進(jìn)而獲得競爭優(yōu)勢;此外,通過優(yōu)化數(shù)據(jù)聚合級別與粒度,以及利用長短期記憶網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的融合預(yù)測模型,進(jìn)一步提高了銷售趨勢預(yù)測的精度和可靠性,為企業(yè)的戰(zhàn)略規(guī)劃提供了強有力的支持。