欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于聚類的移動應(yīng)用下載量預(yù)測方法

文檔序號:8528607閱讀:197來源:國知局
一種基于聚類的移動應(yīng)用下載量預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于移動互聯(lián)網(wǎng)應(yīng)用領(lǐng)域。主要利用了余弦相似度與K中心聚類方法,實 現(xiàn)了一種針對移動應(yīng)用(app)下載量的預(yù)測機制。
【背景技術(shù)】
[0002] 隨著移動互聯(lián)網(wǎng)大潮的到來,近年來移動應(yīng)用(app)蓬勃發(fā)展,以谷歌市場為例 (GooglePlay)目前其app數(shù)目已超過100萬,而累計下載量則超過500億。不論android 還是ios的app應(yīng)用市場,其網(wǎng)頁或者應(yīng)用端的展示頁面都十分有限制,而大部分的app得 不到有效的展示。工業(yè)界將傳統(tǒng)電商中的推薦機制逐漸引入到app領(lǐng)域,以此作為用戶發(fā) 現(xiàn)感興趣優(yōu)質(zhì)app的一種途徑,同時也是一部分欠熱門優(yōu)質(zhì)app曝光的有效途徑。但目前 沒有一種對潛在的優(yōu)質(zhì)app的發(fā)掘方法。

【發(fā)明內(nèi)容】

[0003] 本發(fā)明所要解決的技術(shù)問題是提供一種基于聚類的移動應(yīng)用下載量預(yù)測方法,能 夠根據(jù)app的已知下載量對其后一段時間的總下載量進行預(yù)測。
[0004] 本發(fā)明解決技術(shù)問題所采用的技術(shù)方案是:一種基于聚類的移動應(yīng)用下載量預(yù)測 方法,包括以下步驟:
[0005] 1)從后臺數(shù)據(jù)中收集所有已知的app的歷史數(shù)據(jù)。
[0006] 2)源數(shù)據(jù)處理,對步驟1)中的數(shù)據(jù)進行處理,生成長度為L的離散時間序列X以 表示每一個app的下載曲線,至此所有app的下載曲線組成一個離散時間序列訓練數(shù)據(jù) 集;
[0007] 3)模式聚類,將步驟2)中生成的離散時間序列數(shù)據(jù)集進行聚類,得到k個下載模 式;
[0008] 4)下載量預(yù)測,給定一個app在m天內(nèi)的下載曲線,與k個下載模式進行匹配,計 算之后(L-m)天的總下載量,得到預(yù)測結(jié)果。
[0009] 在采用上述技術(shù)方案的同時,本發(fā)明還可以采用或者組合采用以下進一步的技術(shù) 方案:
[0010] 所述步驟2)具體包括以下步驟:
[0011] (1)給定下載閾值thr;thr為人為指定的參數(shù),默認thr= 0. 1.在thr確定的基 礎(chǔ)上可以計算得到整個訓練數(shù)據(jù)集的LdPL2,一般調(diào)節(jié)thr使得U+L2不小于原序列長度 的 2/3。
[0012] (2)為離散時間序列數(shù)據(jù)集中的每一條離散時間序列X,計算相應(yīng)的Q(x)和 L2 (x),其中U(x)表示從Lp開始往左數(shù)日下載量第一次下降到thr*vp所用的天數(shù),相應(yīng)的, L2(x)用表示從Lp開始往右數(shù)曰下載量第一次下降到thr*vp所用的天數(shù);Lp為序列中指定 的一天,vp為下載量的峰值。
[0013] (3)計算所有訓練數(shù)據(jù)集中1^〇〇 *L2(X)的平均值1^和1^2。加:截取每條離散序 列峰值所在日前U天和后L2天的下載數(shù)據(jù),左邊截取天數(shù)不足L:時,用右側(cè)數(shù)據(jù)填充。相 應(yīng)的,用左側(cè)數(shù)據(jù)填補右側(cè)數(shù)據(jù)的不足。以確保所有序列的長度均為L(L=Li+L2)。至此, 源數(shù)據(jù)被處理為長度均為L的離散時間序列。
[0014] 所述步驟3)具體包括以下步驟:
[0015] (1)設(shè)定訓練數(shù)據(jù)集中模式聚類的個數(shù)k;k為人工指定的參數(shù),默認k=6,其具 體值根據(jù)聚類效果進行調(diào)整。
[0016] (2)從訓練數(shù)據(jù)集中隨機指定k條曲線為k個聚類的中心,計算每個非中心離散時 間序列x到k個中心的曲線距離d(x,c);
[0017]d(x,c)表示x與某一個聚類中心的距離,c專門指代聚類中心(center),根據(jù) d(x,c)將該離散序列劃分到離它最近的聚類中心所在的類。
[0018] (3)更新聚類中心k,每次聚類中心更新的目標變?yōu)樽钚』疐;
[0019] 在給定的類劃分下,聚類更新的目標為最小化類中每一條離散時間序列到類中心 的距離平方的和。
【主權(quán)項】
1. 一種基于聚類的移動應(yīng)用下載量預(yù)測方法,其特征在于;所述方法包括w下步驟: 1) 從后臺數(shù)據(jù)中收集所有已知的app的歷史數(shù)據(jù)。 2) 源數(shù)據(jù)處理,對步驟1)中的數(shù)據(jù)進行處理,生成長度為L的離散時間序列XW表示 每一個app的下載曲線,至此所有app的下載曲線組成一個離散時間序列訓練數(shù)據(jù)集; 3) 模式聚類,將步驟2)中生成的離散時間序列數(shù)據(jù)集進行聚類,得到k個下載模式; 4) 下載量預(yù)測,給定一個app在m天內(nèi)的下載曲線,與k個下載模式進行匹配,計算之 后a-m)天的總下載量,得到預(yù)測結(jié)果。
2. 如權(quán)利要求1所述的一種基于聚類的移動應(yīng)用下載量預(yù)測方法,其特征在于:所述 步驟2)具體包括W下步驟: (1)給定下載闊值thr; 似為離散時間序列數(shù)據(jù)集中的每一條離散時間序列X,計算相應(yīng)的Li(x)和L,(x),其 中Li(x)表示從Lp開始往左數(shù)日下載量第一次下降到t虹*Vp所用的天數(shù),相應(yīng)的,L2(x)用 表示從Lp開始往右數(shù)日下載量第一次下降到thr*Vp所用的天數(shù); (3)計算所有訓練數(shù)據(jù)集中Li(X)和L2(X)的平均值Li和L2。
3. 如權(quán)利要求1所述的一種基于聚類的移動應(yīng)用下載量預(yù)測方法,其特征在于: 所述步驟3)具體包括W下步驟: (1) 設(shè)定訓練數(shù)據(jù)集中模式聚類的個數(shù)k; (2) 從訓練數(shù)據(jù)集中隨機指定k條曲線為k個聚類的中屯、,計算每個非中屯、離散時間序 列X到k個中屯、的曲線距離d(x,C); (3) 更新聚類中屯、k,每次聚類中屯、更新的目標變?yōu)樽钚』疐;
(1) 其中UkiCk分別為第k個類的中屯、W及歸屬于第k類的曲線。 根據(jù)公式(1)可W導出每次第k類更新的值:
(2) 其中為更新之后第k類中屯、的值。
進一步由公式3可W先后導出公式4 : (4) 4
'可W得到最終的計算方式:
因此,就是矩陣M最小特征值對應(yīng)的特征向量。
4.如權(quán)利要求1所述的一種基于聚類的移動應(yīng)用下載量預(yù)測方法,其特征在于: 所述步驟4)具體包括W下步驟: (1) 給定一個app,其前m天的下載曲線是長度為m的離散時間序列test,計算test和 每個中屯、(聚類中屯、本身就是一條長度為L的離散序列)前m天構(gòu)成的離散序列的余弦相 似度,選擇最相似的類中屯、C; (2) 該其后的km天的下載量總和pred預(yù)測如下:
其中,C表示選定的最相似的類中屯、,那么cj表示離散序列C的第j項。
【專利摘要】本發(fā)明提供一種基于聚類的移動應(yīng)用下載量預(yù)測方法,包括:1)從后臺數(shù)據(jù)中收集所有已知的app的歷史數(shù)據(jù),2)源數(shù)據(jù)處理,3)模式聚類,下載量預(yù)測。本發(fā)明創(chuàng)新性地進行app下載量預(yù)測,在app領(lǐng)域需求明顯,并且具有良好拓展性,在其他電商領(lǐng)域具有十分廣泛的應(yīng)用前景,并且,本發(fā)明在考慮app下載曲線特性的基礎(chǔ)上修改K-means算法,并優(yōu)化求解效率。整個聚類過程可以在線下完成,而下載量的預(yù)測值計算在線上完成,優(yōu)化了用戶體驗。
【IPC分類】G06Q30-00
【公開號】CN104850998
【申請?zhí)枴緾N201510178285
【發(fā)明人】吳健, 邱奇波, 陳亮, 鄧水光, 李瑩, 尹建偉, 吳朝暉
【申請人】浙江大學
【公開日】2015年8月19日
【申請日】2015年4月15日
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
阜康市| 华池县| 万宁市| 金塔县| 潼关县| 越西县| 尼玛县| 天津市| 隆昌县| 奉贤区| 阳新县| 新乡县| 藁城市| 泽普县| 子洲县| 定远县| 龙泉市| 安多县| 大方县| 靖边县| 如东县| 浪卡子县| 梁平县| 金坛市| 夹江县| 利川市| 黄浦区| 河池市| 镇安县| 团风县| 大冶市| 大城县| 永定县| 紫金县| 临清市| 若羌县| 黎川县| 新乡市| 迁西县| 阳曲县| 冷水江市|