欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用戶上網(wǎng)偏好數(shù)據(jù)識別方法

文檔序號:6634863閱讀:989來源:國知局
一種用戶上網(wǎng)偏好數(shù)據(jù)識別方法
【專利摘要】本發(fā)明公開一種用戶上網(wǎng)偏好數(shù)據(jù)識別方法,通過利用現(xiàn)有的中位數(shù)概念、H-index算法,根據(jù)用戶的上網(wǎng)行為特征,對用戶的偏好進行偏好、偏好度識別,提高數(shù)據(jù)識別的準(zhǔn)確度和識別效率。方法首先將獲取到的用戶上網(wǎng)行為日志數(shù)據(jù)根據(jù)不同應(yīng)用進行分別匯總,然后指定各應(yīng)用的指標(biāo)類型,并取出各指標(biāo)的最大值和最小值,再通過偏好挖掘算法根據(jù)最大值與最小值算出變異系數(shù),然后分別對各不同應(yīng)用的不同指標(biāo)值進行標(biāo)準(zhǔn)化指標(biāo)值,根據(jù)標(biāo)準(zhǔn)化的值計算各不同應(yīng)用偏好度,根據(jù)偏好度數(shù)值高低對各應(yīng)用進行排序,從排序后的各應(yīng)用中選取偏好度居中的應(yīng)用偏好度作為中位數(shù);將偏好度大于中位數(shù)的應(yīng)用添加至偏好度排名中,最后根據(jù)H-index算法給用戶打上偏好度標(biāo)簽。
【專利說明】一種用戶上網(wǎng)偏好數(shù)據(jù)識別方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘技術(shù),特別是一種可用于基于用戶上網(wǎng)偏好進行營銷目標(biāo)挖 掘的用戶上網(wǎng)偏好數(shù)據(jù)識別方法。

【背景技術(shù)】
[0002] 傳統(tǒng)方法在基于用戶上網(wǎng)偏好進行營銷目標(biāo)挖掘時,通常通過用戶上網(wǎng)行為日 志,從經(jīng)分?jǐn)?shù)據(jù)倉庫獲取用戶基礎(chǔ)信息以"規(guī)則限定"的方式給用戶打上偏好標(biāo)簽。
[0003] 例如:音樂網(wǎng)站偏好,本月通過手機上網(wǎng)訪問音樂網(wǎng)站次數(shù)大于10次的用戶就為 音樂網(wǎng)站偏好用戶;咪咕音樂偏好,本月通過手機使用咪咕音樂客戶端大于5次的用戶為 咪咕音樂偏好用戶。
[0004] 基于"規(guī)則限定"的方式,在傳統(tǒng)數(shù)據(jù)庫上識別用戶的偏好過程中,根據(jù)用戶手機 上網(wǎng)的記錄(例:網(wǎng)訪問音樂網(wǎng)站次數(shù)大于10次的用戶)打上偏好標(biāo)簽,無法保證較高的 識別精準(zhǔn)度,缺乏統(tǒng)一的、標(biāo)準(zhǔn)的算法,精確度無法保障。


【發(fā)明內(nèi)容】

[0005] 本發(fā)明要解決的技術(shù)問題為:通過利用現(xiàn)有的中位數(shù)概念、H-index算法,根據(jù)用 戶的上網(wǎng)行為特征,對用戶的偏好進行偏好、偏好度識別,提高數(shù)據(jù)識別的準(zhǔn)確度和識別效 率。
[0006] 本發(fā)明采取的技術(shù)方案具體為:用戶上網(wǎng)偏好數(shù)據(jù)識別方法,包括以下步驟:
[0007] 1)獲取用戶上網(wǎng)行為日志數(shù)據(jù),所述上網(wǎng)行為數(shù)據(jù)包括用戶使用的應(yīng)用、訪問的 內(nèi)容、上網(wǎng)的時段、上網(wǎng)的位置數(shù)據(jù);
[0008] 2)將用戶上網(wǎng)行為日志數(shù)據(jù)根據(jù)不同應(yīng)用進行分別匯總;
[0009] 3)指定用戶訪問各應(yīng)用的指標(biāo)類型包括訪問次數(shù)、流量、訪問頻次,從各不同應(yīng)用 對應(yīng)的匯總數(shù)據(jù)中分別取出各指標(biāo)的最大值和最小值;
[0010] 4)對于各不同應(yīng)用的不同指標(biāo),分別根據(jù)最大值與最小值進行指標(biāo)值標(biāo)準(zhǔn)化:定 義某指標(biāo)的最大值為a_max,最小值為a_min,標(biāo)準(zhǔn)化指標(biāo)值為index,則此指標(biāo)的標(biāo)準(zhǔn)化指 標(biāo)值為:
[0011] index =(當(dāng)前值 _a_min) / (a_max_a_min);
[0012] 5)對于各不同應(yīng)用,獲取步驟4)中所得到的各指標(biāo)對應(yīng)的標(biāo)準(zhǔn)化指標(biāo)值的權(quán)重 weight,并根據(jù)標(biāo)準(zhǔn)化的指標(biāo)值及相應(yīng)權(quán)重計算各應(yīng)用綜合所有指標(biāo)的偏好度score :
[0013] score (n) = index(I)^weight(I)+index(2)^weight(2)+index(3)^weight (3).. .index(n)^weight (n)
[0014] 式中:n代表指標(biāo)的數(shù)量;index (n)和weight (n)分別代表第n個指標(biāo)的標(biāo)準(zhǔn)化指 標(biāo)值和權(quán)重值;
[0015] 6)根據(jù)偏好度數(shù)值高低對各應(yīng)用進行排序;
[0016] 7)從排序后的各應(yīng)用中選取偏好度居中的應(yīng)用偏好度作為中位數(shù);
[0017] 8)將各應(yīng)用的偏好度與中位數(shù)進行比較,如一應(yīng)用偏好度小于中位數(shù)則丟棄此應(yīng) 用對應(yīng)的數(shù)據(jù);反之將此應(yīng)用添加至偏好度排名中;
[0018] 9)根據(jù)H-index算法給用戶打上偏好度標(biāo)簽:
[0019] 當(dāng)用戶偏好度的排名〈=使用該應(yīng)用的用戶數(shù)*5/6,和用戶偏好度的排名〉使用 用戶數(shù)*4/6為一般偏好應(yīng)用;
[0020] 當(dāng)用戶偏好度的排名〈=使用用戶數(shù)*4/6,和用戶偏好度的排名〉使用用戶數(shù) *2/6為強偏好應(yīng)用。
[0021] 本發(fā)明中,用戶上網(wǎng)日志可從服務(wù)器中獲取,如訪問次數(shù)、流量、訪問頻次這些主 要指標(biāo)等,將這些數(shù)據(jù)進行匯總輸入本發(fā)明的偏好挖掘模型中,模型輸入?yún)⒖急? :
[0022]表 1
[0023]

【權(quán)利要求】
1. 一種用戶上網(wǎng)偏好數(shù)據(jù)識別方法,其特征是,包括w下步驟: 1) 獲取用戶上網(wǎng)行為日志數(shù)據(jù),所述上網(wǎng)行為數(shù)據(jù)包括用戶使用的應(yīng)用、訪問的內(nèi)容、 上網(wǎng)的時段、上網(wǎng)的位置數(shù)據(jù); 2) 將用戶上網(wǎng)行為日志數(shù)據(jù)根據(jù)不同應(yīng)用進行分別匯總; 3) 指定用戶訪問各應(yīng)用的指標(biāo)類型包括訪問次數(shù)、流量、訪問頻次,從各不同應(yīng)用對應(yīng) 的匯總數(shù)據(jù)中分別取出各指標(biāo)的最大值和最小值; 4) 對于各不同應(yīng)用的不同指標(biāo),分別根據(jù)最大值與最小值進行指標(biāo)值標(biāo)準(zhǔn)化;定義某 指標(biāo)的最大值為a_max,最小值為a_min,標(biāo)準(zhǔn)化指標(biāo)值為index,則此指標(biāo)的標(biāo)準(zhǔn)化指標(biāo)值 為: index =(當(dāng)前值-a_min) / (a_max-a_min); 5) 對于各不同應(yīng)用,獲取步驟4)中所得到的各指標(biāo)對應(yīng)的標(biāo)準(zhǔn)化指標(biāo)值的權(quán)重 wei曲t,并根據(jù)標(biāo)準(zhǔn)化的指標(biāo)值及相應(yīng)權(quán)重計算各應(yīng)用的偏好度score ; score (n) = index(1)*weight(1)+index(2)*weight(2)+index(3)*weight (3). . . ind ex(n)柳eight (n) 式中;n代表指標(biāo)的種類數(shù)量;index(n)和wei曲t(n)分別代表第n類指標(biāo)的標(biāo)準(zhǔn)化指 標(biāo)值和權(quán)重值; 6) 根據(jù)偏好度數(shù)值高低對各應(yīng)用進行排序; 7) 從排序后的各應(yīng)用中選取偏好度居中的應(yīng)用偏好度作為中位數(shù); 8) 將各應(yīng)用的偏好度與中位數(shù)進行比較,如一應(yīng)用偏好度小于中位數(shù)則丟棄此應(yīng)用對 應(yīng)的數(shù)據(jù);反之將此應(yīng)用添加至偏好度排名中; 9) 根據(jù)H-index算法給用戶打上偏好度標(biāo)簽; 當(dāng)用戶偏好度的排名 <=使用用戶數(shù)*5/6,和用戶偏好度的排名〉使用用戶數(shù)*4/6為 一般偏好應(yīng)用; 當(dāng)用戶偏好度的排名 <=使用用戶數(shù)*4/6,和用戶偏好度的排名〉使用用戶數(shù)*2/6為 強偏好應(yīng)用。
【文檔編號】G06F17/30GK104462245SQ201410664717
【公開日】2015年3月25日 申請日期:2014年11月19日 優(yōu)先權(quán)日:2014年11月19日
【發(fā)明者】劉雷 申請人:亞信科技(南京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
柞水县| 普洱| 宣化县| 十堰市| 循化| 佛教| 孝感市| 河间市| 松溪县| 汕尾市| 屏山县| 乌恰县| 合江县| 台东市| 汽车| 许昌县| 永登县| 上饶市| 太谷县| 深水埗区| 利辛县| 方正县| 清远市| 乌苏市| 神木县| 武山县| 巨鹿县| 禄劝| 沈丘县| 金乡县| 泰州市| 正镶白旗| 阿拉善右旗| 泉州市| 贵定县| 安仁县| 汉源县| 连城县| 阿瓦提县| 东兰县| 乐至县|