欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種電影推薦方法及裝置與流程

文檔序號:12470713閱讀:397來源:國知局
一種電影推薦方法及裝置與流程

本發(fā)明屬于推薦算法應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種電影推薦方法及裝置。



背景技術(shù):

推薦系統(tǒng)在電子商務(wù)系統(tǒng)中具有良好的發(fā)展和應(yīng)用前景,逐漸成為電子商務(wù)IT技術(shù)的一個重要研究內(nèi)容。推薦系統(tǒng)最大的優(yōu)點在于收集用戶感興趣的資料,分析該資料得出用戶的興趣偏好并根據(jù)用戶的興趣偏好為用戶做出個性化推薦。目前,推薦系統(tǒng)己經(jīng)被廣泛的應(yīng)用到不同領(lǐng)域,如電影推薦。基于協(xié)同過濾的推薦算法由于容易挖掘出用戶的潛在新興趣而受到青睞,目前的電影推薦系統(tǒng)基本采用該基于協(xié)同過濾的單一推薦算法。然而基于協(xié)同過濾的單一推薦算法存在無法為新用戶或者電影評價數(shù)目較少的目標用戶推薦電影的問題。

故,有必要提出一種新的技術(shù)方案,以解決上述技術(shù)問題。



技術(shù)實現(xiàn)要素:

鑒于此,本發(fā)明實施例提供一種電影推薦方法及裝置,以解決現(xiàn)有技術(shù)中基于協(xié)同過濾的單一推薦算法存在無法為新用戶或者電影評價數(shù)目較少的目標用戶推薦電影的問題。

本發(fā)明實施例的第一方面,提供一種電影推薦方法,所述方法包括:

識別目標用戶,并判斷所述目標用戶是否為注冊用戶;

若是注冊用戶,則判斷所述目標用戶對電影的評價數(shù)目是否大于或等于預(yù)設(shè)評價閾值;

若所述評價數(shù)目大于或等于所述預(yù)設(shè)評價閾值,則基于電影特征的協(xié)同過濾推薦模型給所述目標用戶推薦電影;

若不是注冊用戶或者所述評價數(shù)據(jù)小于所述預(yù)設(shè)評價閾值,則基于WEB使用挖掘的推薦模型給所述目標用戶推薦電影。

本發(fā)明實施例的第二方面,提供一種裝置,所述裝置包括:

第一判斷模塊,用于識別目標用戶,并判斷所述目標用戶是否為注冊用戶;

第二判斷模塊,用于若是注冊用戶,則判斷所述目標用戶對電影的評價數(shù)目是否大于或等于預(yù)設(shè)評價閾值;

基于電影特征的協(xié)同過濾推薦模塊,用于若所述評價數(shù)目大于或等于所述預(yù)設(shè)評價閾值,則基于電影特征的協(xié)同過濾推薦模型給所述目標用戶推薦電影;

基于WEB使用挖掘的推薦模塊,用于若不是注冊用戶或者所述評價數(shù)據(jù)小于所述預(yù)設(shè)評價閾值,則基于WEB使用挖掘的推薦模型給所述目標用戶推薦電影。

本發(fā)明實施例與現(xiàn)有技術(shù)相比存在的有益效果是:本發(fā)明所提供的電影推薦方法及裝置中,識別目標用戶,并判斷所述目標用戶是否為注冊用戶;若是注冊用戶,則判斷所述目標用戶對電影的評價數(shù)目是否大于或等于預(yù)設(shè)評價閾值;若所述評價數(shù)目大于或等于所述預(yù)設(shè)評價閾值,則基于電影特征的協(xié)同過濾推薦模型給所述目標用戶推薦電影,該基于電影特征的協(xié)同過濾推薦模型是在一個群體中查找與目標用戶相似興趣的活動用戶,通過查找到與目標用戶最為相似的若干個活動用戶的喜好,從而為目標用戶進行推薦其所沒有關(guān)注、觀看或者評價過的電影,基于電影特征的協(xié)同過濾推薦模型具有很好的新穎性,可以推薦目標用戶以前所沒有關(guān)注、觀看或者評價過的電影;該推薦模型若不是注冊用戶或者所述評價數(shù)據(jù)小于所述預(yù)設(shè)評價閾值,則基于WEB使用挖掘的推薦模型給所述目標用戶推薦電影,基于WEB使用挖掘的推薦模型需要根據(jù)目標用戶以往的興趣來推測目標用戶以后的興趣,該推薦模型能夠為新注冊用戶或者電影評價數(shù)目較少的目標用戶推薦電影,很好地處理數(shù)據(jù)的“冷啟動”問題;因此,該電影推薦方法可針對不同的目標用戶使用相應(yīng)的推薦方法,使得推薦給目標用戶的電影最大化地符合目標用戶的興趣偏好。該電影推薦方法可解決現(xiàn)有技術(shù)中基于協(xié)同過濾的單一推薦算法存在無法為新用戶或者電影評價數(shù)目較少的目標用戶推薦電影的問題。

附圖說明

為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明實施例一提供的電影推薦方法的實現(xiàn)流程圖;

圖2是本發(fā)明實施例提供的電影推薦裝置的結(jié)構(gòu)框圖。

具體實施方式

為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。

實施例一

圖1示出了本發(fā)明實施例一提供的電影推薦方法的實現(xiàn)流程圖。如圖1所示,該電影推薦方法包括如下步驟:

S1:識別目標用戶,并判斷目標用戶是否為注冊用戶。

其中,目標用戶可以是指當(dāng)前在某網(wǎng)站進行網(wǎng)頁瀏覽的用戶。具體地,通過檢測目標用戶是否成功登錄網(wǎng)站來判斷目標用戶是否為注冊用戶。

S2:若是注冊用戶,則判斷目標用戶對電影的評價數(shù)目是否大于或等于預(yù)設(shè)評價閾值。

若在S1中已經(jīng)確定目標用戶為注冊用戶,則繼續(xù)判斷目標用戶對網(wǎng)站中的電影的評價數(shù)目是否大于或等于預(yù)設(shè)評價閾值??蛇x地,預(yù)設(shè)評價閾值可根據(jù)目標用戶進行自定義。如該預(yù)設(shè)評價閾值可以為15,則判斷已經(jīng)注冊的目標用戶對網(wǎng)站中的電影的評價數(shù)目是否大于或等于15。

S3:若評價數(shù)目大于或等于預(yù)設(shè)評價閾值,則基于電影特征的協(xié)同過濾推薦模型給目標用戶推薦電影。

如果監(jiān)聽到已經(jīng)注冊的目標用戶對電影的評價數(shù)目大于或等于預(yù)設(shè)評價閾值,則基于電影特征的協(xié)同過濾推薦模型給目標用戶推薦電影。例如,預(yù)設(shè)評價閾值為15,當(dāng)監(jiān)聽到已經(jīng)注冊的目標用戶對電影的評價數(shù)目大于或等于15時,基于電影特征的協(xié)同過濾推薦模型給目標用戶推薦電影。該基于電影特征的協(xié)同過濾推薦模型是在一個群體中查找與目標用戶相似興趣的活動用戶,通過查找到與目標用戶最為相似的若干個活動用戶的喜好,從而為目標用戶進行推薦其所沒有關(guān)注、觀看或者評價過的電影,基于電影特征的協(xié)同過濾推薦模型具有很好的新穎性,可以推薦目標用戶以前所沒有關(guān)注、觀看或者評價過的電影。

S4:若不是注冊用戶或者評價數(shù)據(jù)小于預(yù)設(shè)評價閾值,則基于WEB使用挖掘的推薦模型給目標用戶推薦電影。

如目標用戶不是注冊用戶,即以訪客的身份瀏覽網(wǎng)頁或者目標用戶是注冊用戶但是目標用戶對電影的評價數(shù)目小于預(yù)設(shè)評價閾值,則基于WEB使用挖掘的推薦模型給目標用戶推薦電影。例如,預(yù)設(shè)評價閾值為15,當(dāng)監(jiān)聽到目標用戶不是注冊用戶或者已經(jīng)是注冊用戶的目標用戶對電影的評價數(shù)目小于15時,基于WEB使用挖掘的推薦模型給目標用戶推薦電影。基于WEB使用挖掘的推薦模型需要根據(jù)目標用戶以往的興趣來推測目標用戶以后的興趣,該推薦模型能夠為新注冊用戶或者電影評價數(shù)目較少的目標用戶推薦電影,很好地處理數(shù)據(jù)的“冷啟動”問題。

在本發(fā)明實施例中,識別目標用戶,并判斷所述目標用戶是否為注冊用戶;若是注冊用戶,則判斷所述目標用戶對電影的評價數(shù)目是否大于或等于預(yù)設(shè)評價閾值;若所述評價數(shù)目大于或等于所述預(yù)設(shè)評價閾值,則基于電影特征的協(xié)同過濾推薦模型給所述目標用戶推薦電影,該基于電影特征的協(xié)同過濾推薦模型是在一個群體中查找與目標用戶相似興趣的活動用戶,通過查找到與目標用戶最為相似的若干個活動用戶的喜好,從而為目標用戶進行推薦其所沒有關(guān)注、觀看或者評價過的電影,基于電影特征的協(xié)同過濾推薦模型具有很好的新穎性,可以推薦目標用戶以前所沒有關(guān)注、觀看或者評價過的電影;該推薦模型若不是注冊用戶或者所述評價數(shù)據(jù)小于所述預(yù)設(shè)評價閾值,則基于WEB使用挖掘的推薦模型給所述目標用戶推薦電影,基于WEB使用挖掘的推薦模型需要根據(jù)目標用戶以往的興趣來推測目標用戶以后的興趣,該推薦模型能夠為新注冊用戶或者電影評價數(shù)目較少的目標用戶推薦電影,很好地處理數(shù)據(jù)的“冷啟動”問題;因此,該電影推薦方法可針對不同的目標用戶使用相應(yīng)的推薦方法,使得推薦給目標用戶的電影最大化地符合目標用戶的興趣偏好。該電影推薦方法可解決現(xiàn)有技術(shù)中基于協(xié)同過濾的單一推薦算法存在無法為新用戶或者電影評價數(shù)目較少的目標用戶推薦電影的問題。

基于圖1所示的實施例,進一步地,對步驟S3中基于電影特征的協(xié)同過濾推薦模型給目標用戶推薦電影的過程進行優(yōu)化,圖1中的步驟S3的具體實現(xiàn)流程優(yōu)化如下:

S31:采用聚類算法對活動用戶進行聚類,以形成多個活動用戶群。

活動用戶是指除了目標用戶之外的周圍用戶,采用聚類算法如K-means聚類算法對活動用戶進行聚類,形成多個活動用戶群。

S32:分別計算目標用戶與每一活動用戶群的中心的距離,選擇與目標用戶距離最近的活動用戶群作為目標活動用戶群。

首先找到每一個活動用戶群的中心,分別計算目標用戶與每一活動用戶群的中心的距離,選擇與目標用戶距離最近的活動用戶群作為目標活動用戶群。例如有20個用戶群,即有對應(yīng)的20個中心包括中心1、中心2、……和中心20,分別計算目標用戶與中心1、中心2、……和中心20的距離對應(yīng)得到距離1、距離2、……和距離20,比較距離1、距離2、……和距離20的大小,選取最小的距離對應(yīng)的用戶群作為目標活動用戶群。

S33:采用相似度測量方法計算目標用戶與目標活動用戶群中的活動用戶的相似度,根據(jù)相似度確定目標用戶最近鄰居集。

采用包括但不限于“用戶-電影”的特征相似測量方法,計算目標用戶與目標活動用戶群中的活動用戶的相似度,通過對計算出來的相似度值進行從大到小的排列,優(yōu)選地,選取相似度值排在前k位的活動用戶作為目標用戶最近鄰居集。

S34:根據(jù)目標用戶最近鄰居集中的活動用戶對目標用戶未評價電影的評價數(shù)據(jù),生成活動用戶評分矩陣。

目標用戶最近鄰居集中的活動用戶是與目標用戶對電影的品味最相似的用戶,根據(jù)這些目標用戶最近鄰居集中的活動用戶對目標用戶沒有評價過的影片的各個特征屬性包括導(dǎo)演、演員、類型、地區(qū)、時間和內(nèi)容的評分,生成活動用戶-電影特征評分矩陣。

S35:采用預(yù)測評分公式對活動用戶評分矩陣進行處理,以獲取目標用戶未評價電影的預(yù)測評分。

預(yù)測評分公式如下:

其中,Pu,i表示目標用戶u對電影i的評分,sim(i,n)表示電影i與最近鄰居n之間的綜合相似性,表示目標用戶最近鄰居集中的活動用戶對電影n的評分。

S36:選取預(yù)測評分最高的TOP-N部電影作為推薦結(jié)果推薦給目標用戶。

根據(jù)評分從高到低產(chǎn)生一個推薦列表,并根據(jù)預(yù)設(shè)的N,將列表的前N個電影推薦給目標用戶。例如N=10,則選取列表前10個電影推薦給目標用戶。

本實施例提供的方法不需要將目標用戶與所有活動用戶進行相似度計算,降低了相似度的計工作量,提高了工作效率。

基于圖1所示的實施例,進一步地,對步驟S4中提供的基于WEB使用挖掘的推薦模型給目標用戶推薦電影的過程進行優(yōu)化,圖1中的步驟S4的具體實現(xiàn)流程優(yōu)化如下:

S41:獲取網(wǎng)頁數(shù)據(jù),網(wǎng)頁數(shù)據(jù)包括WEB日志。

WEB日志是指網(wǎng)頁原始日志,未經(jīng)過預(yù)處理。

S42:對WEB日志進行預(yù)處理,形成事務(wù)數(shù)據(jù)。

預(yù)處理包括數(shù)據(jù)凈化、用戶識別、會話識別和事務(wù)識別。

為了清除WEB日志中與挖掘算法無關(guān)的數(shù)據(jù),對數(shù)據(jù)進行凈化。由于用戶會話只與日志中的HTML相關(guān),目標是獲取用戶的行為模式,因此需要刪除一些不相關(guān)的數(shù)據(jù),如:后綴名為GIF、JPEG、JPG等圖形文件、后綴名為CGI的腳本文件、被服務(wù)器拒絕的請求記錄等。

為了給用戶提供個性化服務(wù),對用戶進行識別。用戶識別同時也是與用戶會話識別的基礎(chǔ)。主要通過IP地址及用戶的Cookie來進行識別。

會話識別是對頁面瀏覽行為的信息提取過程。一個會話記錄著一個用戶在一段時間內(nèi),連續(xù)的頁面請求相關(guān)行為信息的集合。會話識別將系統(tǒng)或網(wǎng)站中屬于目標用戶的所有Web訪問記錄劃分為過個會話并形成會話序列。在Web日志中,不同IP地址的用戶請求記錄不會出現(xiàn)在同一個會話中,同一個用戶有可能多次訪問了該站點,如果每次訪問的時間跨度比較大,則認為不在同一個會話中。

事務(wù)識別是根據(jù)Web使用挖掘中模式發(fā)現(xiàn)的知識挖掘特性來確定與知識相對應(yīng)的事務(wù)定義,不同的會話分析可以確定不同的事務(wù),事務(wù)識別是對用戶會話進行語義分組的過程。挖掘算法實施之前通常要將用戶會話分割成更小的事務(wù),這樣就可以為每個用戶建立起有意義的頁面組合。

S43:采用基于WEB使用挖掘的推薦算法,獲取與事務(wù)數(shù)據(jù)相對應(yīng)的推薦結(jié)果。

根據(jù)事務(wù)數(shù)據(jù)以及目標用戶當(dāng)前的會話,采用基于WEB使用挖掘的推薦算法,獲取與事務(wù)數(shù)據(jù)相對應(yīng)的推薦結(jié)果。

基于上述實施例中步驟S43中基于WEB使用挖掘的推薦算法,進一步地,對步驟S43進行優(yōu)化,步驟S43的具體實現(xiàn)流程優(yōu)化如下:

S430:對事務(wù)數(shù)據(jù)進行聚類分析,得到m個事務(wù)聚類類簇。

對預(yù)處理后得到的事務(wù)數(shù)據(jù)進行聚類分析,聚類分析方法包括但不限于K-Means聚類算法,得到m個事務(wù)聚類類簇。聚類的結(jié)果可以表示為:TC={tc1,,tc2,,…,tcm,},其中每個事務(wù)聚類類簇tci,由一系列事務(wù)組成。

S431:創(chuàng)建滑動窗口動態(tài)保存目標用戶當(dāng)前會話中最后的k個頁面。

動態(tài)保存目標用戶當(dāng)前會話中最后的k個頁面相當(dāng)于刷新頁面,始終保存的是最新的k個頁面,k的值可根據(jù)需要進行預(yù)設(shè);創(chuàng)建滑動窗口動態(tài)保存目標用戶當(dāng)前會話中最后的k個頁面。

S432:將目標用戶當(dāng)前會話中最后的k個頁面轉(zhuǎn)換為頁面空間上的n維向量,n維向量表示為S={s1,s2,…,sn},其中si的取值根據(jù)頁面Pi在當(dāng)前會話中最后的k個頁面是否出現(xiàn)而確定,即:

s1的取值根據(jù)頁面P1在當(dāng)前會話中最后的k個頁面是否出現(xiàn)而確定,若P1出現(xiàn)在當(dāng)前會話中最后的k個頁面中則s1取1,P1不出現(xiàn)在當(dāng)前會話中最后的k個頁面中則s1取0,s2、s3、……和sn的取值過程與s1的取值過程類似,在此不再贅述。

S433:計算n維向量S與m個事務(wù)聚類類簇的使用特征Rtc之間的匹配度,采用余弦相似性函數(shù),公式如下:

S434:計算各頁面的推薦系數(shù),公式如下:

其中,Weight(p,tc)表示頁面所屬事務(wù)聚類類簇中的權(quán)重。

S435:根據(jù)頁面推薦系數(shù)將推薦系數(shù)最大且在目標用戶當(dāng)前會話中沒有出現(xiàn)的若干頁面作為推薦列表。

基于上述實施例中步驟S430中對事務(wù)數(shù)據(jù)進行聚類分析的實現(xiàn)流程,進一步地,對步驟S430進行優(yōu)化,步驟S430的具體實現(xiàn)流程優(yōu)化如下:

S4300:隨機選擇m個事務(wù)作為初始的簇中心。

隨機選擇m個事務(wù)作為初始的聚類類簇中心。

S4301:將事務(wù)賦給中心與之最近的類簇。

分別計算每個事務(wù)到初始的m個聚類類類簇中心的距離,選擇最近的中心作為其分類,直到所有的事務(wù)分類完畢。

S4302:計算每個事務(wù)類簇中事務(wù)的平均值,更新類簇的中心,公式如下:

其中,表示事務(wù)類簇中事務(wù)的平均值。

分別計算m個類簇中所有事務(wù)的質(zhì)心,更新類簇的中心。

S4303:計算準則函數(shù)E直到函數(shù)E不再明顯發(fā)生變化,公式如下:

其中p表示頁面,mi是事務(wù)聚類類簇tci的平均值,即事務(wù)聚類類簇tci的中心。

S4304:根據(jù)頁面在事務(wù)中的權(quán)重來計算該頁面所屬事務(wù)聚類類簇中的權(quán)重,公式如下:

其中,tc表示事務(wù)聚類類簇,t表示事務(wù)聚類類簇中的事務(wù)。

S4305:根據(jù)Weight(p,tc)來確定事務(wù)聚類類簇tc的使用特征Rtc,公式如下:

Rtc={<p,Weight(p,tc)>|p∈P,Weight(p,tc)≥μ},μ為顯著性閾值。

此步驟是根據(jù)預(yù)設(shè)的顯著性閾值將支持度小于指定顯著性閉值得頁面過濾掉來保證給目標用戶推薦的電影的精確性。

S4306:將事務(wù)聚類類簇的使用特征Rtc表示為如下的n維向量:

Rt={r1,r2,…,rn},其中ri取值為:

對應(yīng)于上文實施例的電影推薦方法,圖2示出了本發(fā)明實施例提供的電影推薦裝置的結(jié)構(gòu)框圖,詳述如下:

參考圖2,該電影推薦裝置包括第一判斷模塊、第二判斷模塊

第一判斷模塊21,用于識別目標用戶,并判斷目標用戶是否為注冊用戶;

第二判斷模塊22,用于若是注冊用戶,則判斷目標用戶對電影的評價數(shù)目是否大于或等于預(yù)設(shè)評價閾值;

基于電影特征的協(xié)同過濾推薦模塊23,用于若評價數(shù)目大于或等于預(yù)設(shè)評價閾值,則基于電影特征的協(xié)同過濾推薦模型給目標用戶推薦電影;

基于WEB使用挖掘的推薦模塊24,用于若不是注冊用戶或者評價數(shù)據(jù)小于預(yù)設(shè)評價閾值,則基于WEB使用挖掘的推薦模型給目標用戶推薦電影。

可選地,基于電影特征的協(xié)同過濾推薦模塊包括:

聚類子模塊,用于采用聚類算法對活動用戶進行聚類,以形成多個活動用戶群;

第一計算子模塊,用于分別計算目標用戶與每一活動用戶群的中心的距離,選擇與目標用戶距離最近的活動用戶群作為目標活動用戶群;

第二計算子模塊,用于采用相似度測量方法計算目標用戶與目標活動用戶群中的活動用戶的相似度,根據(jù)相似度確定目標用戶最近鄰居集;

生成子模塊,用于根據(jù)目標用戶最近鄰居集中的活動用戶對目標用戶未評價電影的評價數(shù)據(jù),生成活動用戶評分矩陣;

處理子模塊,用于采用預(yù)測評分公式對活動用戶評分矩陣進行處理,以獲取目標用戶未評價電影的預(yù)測評分;

第一推薦子模塊,用于選取預(yù)測評分最高的TOP-N部電影作為推薦結(jié)果推薦給目標用戶。

可選地,基于WEB使用挖掘的推薦模塊包括:

獲取子模塊,用于獲取網(wǎng)頁數(shù)據(jù),網(wǎng)頁數(shù)據(jù)包括WEB日志;

預(yù)處理子模塊,用于對WEB日志進行預(yù)處理,形成事務(wù)數(shù)據(jù);

第二推薦子模塊,采用基于WEB使用挖掘的推薦算法,獲取與事務(wù)數(shù)據(jù)相對應(yīng)的推薦結(jié)果。

可選地,第二推薦子模塊包括:

聚類分析單元,用于對事務(wù)數(shù)據(jù)進行聚類分析,得到m個事務(wù)聚類類簇;

創(chuàng)建單元,用于創(chuàng)建滑動窗口動態(tài)保存目標用戶當(dāng)前會話中最后的k個頁面;

轉(zhuǎn)換單元,用于將目標用戶當(dāng)前會話中最后的k個頁面轉(zhuǎn)換為頁面空間上的n維向量,n維向量表示為S={s1,s2,…,sn},其中si的取值根據(jù)頁面Pi在當(dāng)前會話中最后的k個頁面是否出現(xiàn)而確定,即:

第一計算單元,用于計算n維向量S與k個事務(wù)聚類類簇的使用特征Rtc之間的匹配度,采用余弦相似性函數(shù),公式如下:

第二計算單元,用于計算各頁面的推薦系數(shù),公式如下:

其中,Weight(p,tc)表示頁面所屬事務(wù)聚類類簇中的權(quán)重;

推薦單元,用于根據(jù)頁面推薦系數(shù)將推薦系數(shù)最大且在目標用戶當(dāng)前會話中沒有出現(xiàn)的若干頁面作為推薦列表。

可選地,對事務(wù)數(shù)據(jù)進行聚類分析單元包括:

初始子單元,用于隨機選擇k個事務(wù)作為初始的類簇中心;

賦給子單元,用于將事務(wù)賦給中心與之最近的類簇;

第一計算子單元,用于計算每個事務(wù)類簇中事務(wù)的平均值,更新類簇的中心,公式如下:

其中,表示事務(wù)類簇中事務(wù)的平均值;

第二計算子單元,用于計算準則函數(shù)E直到函數(shù)E不再明顯發(fā)生變化,公式如下:

其中p表示頁面,mi是事務(wù)聚類類簇tci的平均值,即事務(wù)聚類類簇tci的中心;

第三計算子單元,用于根據(jù)頁面在事務(wù)中的權(quán)重來計算該頁面所屬事務(wù)聚類類簇中的權(quán)重,公式如下:

其中,tc表示事務(wù)聚類類簇,t表示事務(wù)聚類類簇中的事務(wù);

確定子單元,用于根據(jù)Weight(p,tc)來確定事務(wù)聚類類簇tc的使用特征Rtc,公式如下:

Rtc={<p,Weight(p,tc)>|p∈P,Weight(p,tc)≥μ},μ為顯著性閾值;

表示子單元,用于將事務(wù)聚類類簇的使用特征Rtc表示為如下的n維向量:

Rtc={r1,r2,…,rn},其中ri取值為:

所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡潔,僅以上述各功能單元、模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能單元、模塊完成,即將所述裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能單元或模塊,以完成以上描述的全部或者部分功能。實施例中的各功能單元、模塊可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中,上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。另外,各功能單元、模塊的具體名稱也只是為了便于相互區(qū)分,并不用于限制本申請的保護范圍。上述系統(tǒng)中單元、模塊的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。

本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、或者計算機軟件和電子硬件的結(jié)合來實現(xiàn)。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認為超出本發(fā)明的范圍。

在本發(fā)明所提供的實施例中,應(yīng)該理解到,所揭露的裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的系統(tǒng)實施例僅僅是示意性的,例如,所述單元或單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通訊連接可以是通過一些接口,裝置或單元的間接耦合或通訊連接,可以是電性,機械或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。

另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明實施例的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明實施例各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和范圍,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
柘荣县| 新河县| 始兴县| 沧州市| 犍为县| 休宁县| 梅河口市| 大荔县| 临澧县| 兰考县| 乃东县| 磐石市| 武夷山市| 吴堡县| 迁西县| 遂昌县| 松江区| 南丰县| 池州市| 陕西省| 东安县| 镇远县| 师宗县| 衡南县| 巩义市| 信宜市| 桓台县| 晋宁县| 尤溪县| 梧州市| 岢岚县| 彰武县| 固原市| 汤原县| 昌江| 临安市| 贵德县| 合作市| 景东| 皮山县| 金寨县|