專利名稱:一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺的推薦算法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息安全技術(shù)領(lǐng)域的專業(yè)社交網(wǎng)絡(luò)平臺實現(xiàn)面向人才、交友、廠商、漏洞信息等推薦實現(xiàn)方法,尤其涉及一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺的推薦算法。
背景技術(shù):
社交網(wǎng)絡(luò)是在互聯(lián)網(wǎng)上與其他人相聯(lián)系的ー個平臺,社交網(wǎng)絡(luò)站點通常圍繞用戶的基本信息而運作,用戶基本信息是指有關(guān)用戶喜歡的事、不喜歡的事、興趣、愛好、學(xué)校、職業(yè)或任何其它共同點的集合,通常,這些站點提供不同級別的隱私控制。本專利的考慮,主要是采用改良的混合協(xié)同過濾和基于內(nèi)容過濾算法實現(xiàn)方法的創(chuàng)新。推薦系統(tǒng)或推薦引擎是根據(jù)用戶的興趣特點和行為,向用戶推薦用戶感興趣的信息和商品。隨著信息以及商品數(shù)量和種類快速增長,用戶需要花費大量的時間才能找到自己想要的信息或商品,這種瀏覽大量無關(guān)的信息和產(chǎn)品過程無疑會使淹沒在信息過載問題中的用戶不斷流失,為了解決這些問題,推薦系統(tǒng)應(yīng)運而生,推薦系統(tǒng)是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的ー種高級商務(wù)智能平臺,以幫助電子商務(wù)網(wǎng)站或社交網(wǎng)站為用戶提供完全個性化的決策支持和信息服務(wù)。推薦系統(tǒng)的算法一般有以下兩種方法:(I)集體智慧和協(xié)同過濾:集體智慧是指在大量的人群的行為和數(shù)據(jù)中收集答案,幫助你對整個人群得到統(tǒng)計意義上的結(jié)論,這些結(jié)論是我們在單個個體上無法得到的,它往往是某種趨勢或者人群中共性的部分;協(xié)同過濾是基于協(xié)同過濾方法收集和分析大量的信息,對用戶的行為,活動或喜好,并預(yù)測哪些用戶會喜歡的基礎(chǔ)上其他用戶的相似性,協(xié)同過濾方法的ー個主要優(yōu)點是它不依賴于機(jī)器分析的內(nèi)容,因此,它能夠準(zhǔn)確地推薦復(fù)雜的項目,如電影,而不需要“理解”的項目本身。協(xié)同過濾方法常常會出現(xiàn)三個問題:①冷啟動:這些系統(tǒng)通常需要大量的用戶數(shù)據(jù),以得到準(zhǔn)確的推薦性能:這些系統(tǒng)往往都有數(shù)以億計的用戶和產(chǎn)品,因此,往往需要大量的計算和高性能服務(wù)器支撐;③稀疏:在各大電子商務(wù)網(wǎng)站上銷售的物品的數(shù)量是非常大的,最活躍的用戶將只評價了數(shù)據(jù)庫的整體的一小部分。協(xié)同過濾算法常常采用矩陣分解,低秩矩陣近似技木。(2)基于內(nèi)容的過濾:推薦系統(tǒng)設(shè)計時,另ー個常用的方法是基于內(nèi)容的過濾,基于內(nèi)容的過濾方法是基于將要推薦項目的有關(guān)內(nèi)容的信息和特征,換言之,這些算法嘗試建議是相似的那些用戶喜歡在過去(或在本研究)的項目;特別是各種候選與先前評估項目是由用戶和推薦的最佳匹配的資料的資料進(jìn)行比較,基本上,這些方法使用表征資料系統(tǒng)內(nèi)的一個項目的配置文件(即,一組離散的屬性和特征);系統(tǒng)將創(chuàng)建一個基于內(nèi)容的用戶檔案,根據(jù)項目特點的加權(quán)矢量的權(quán)重表示給用戶的每個特征的重要性,可以計算從單獨評估的內(nèi)容使用的各種技術(shù)的載體。用戶的直接反饋,通常通過類似喜歡/不喜歡“按鈕的形式,可以使用較高或較低的權(quán)重分配某些屬性(使用Rocchio反饋分類技術(shù)或其他類似的技木)的重要性?;趦?nèi)容過濾的關(guān)鍵問題是系統(tǒng)是否能夠挖掘用戶對某ー種內(nèi)容的喜好和行為,擴(kuò)展到其他類型的內(nèi)容上做出正確的預(yù)測。信息安全領(lǐng)域的專業(yè)社交網(wǎng)絡(luò)由于推薦的信息有以下特點:
(I)推薦內(nèi)容之間錯綜復(fù)雜的關(guān)系,最重要的內(nèi)容是海量的信息安全內(nèi)容,而內(nèi)容本身又是具有較結(jié)構(gòu)化的數(shù)據(jù),各類數(shù)據(jù)之間本身就存在固有的錯綜復(fù)雜的關(guān)聯(lián)關(guān)系;(2)用戶的活躍程度低:在傳統(tǒng)的推薦系統(tǒng)中,用戶登錄ー個推薦系統(tǒng),就是為了選擇ー些他想要的資源,而在社交網(wǎng)絡(luò)推薦中,許多用戶上SNS,更多的時間處干“看信息”,因此很難直接獲得他們的顯式反饋信息,也難以對他們的興趣進(jìn)行學(xué)習(xí)和預(yù)測;(3)數(shù)據(jù)的稀疏性和不對稱性:在傳統(tǒng)的推薦問題中,用戶和資源一般是同ー個數(shù)量級的,但是在本推薦問題中,由于數(shù)據(jù)海量的特點,信息的數(shù)量和增長速度遠(yuǎn)遠(yuǎn)大于用戶的數(shù)量和增長速度。(4)用戶興趣的動態(tài)變化:用戶關(guān)注的漏洞或話題一直緊隨信息安全的發(fā)展,因此SNS上關(guān)注點不斷變化,用戶的興趣也隨之變化,在傳統(tǒng)推薦問題中,往往是用戶根據(jù)興趣選擇資源,在推薦中,則是不斷出現(xiàn)的關(guān)注漏洞改變著用戶的興趣,再由用戶選擇關(guān)注的漏洞,因此,用戶的興趣一直在動態(tài)變化,很難找到一個用戶長時間感興趣的話題。綜上所述,在信息安全的專業(yè)社交網(wǎng)絡(luò)中不能僅僅采用協(xié)同過濾的方法,而忽視推送內(nèi)容本身具有的固有的復(fù)雜關(guān)聯(lián)關(guān)系;也不能僅僅基于海量信息的內(nèi)容本身的推薦。因而,針對以上方面,本發(fā)明提出改良的這兩種算法結(jié)合的綜合算法。
發(fā)明內(nèi)容
針對以上缺陷,本發(fā)明提供一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺的推薦算法,主要是采用改良的混合協(xié)同過濾和基于內(nèi)容過濾算法實現(xiàn)方法的創(chuàng)新,在電子商務(wù)網(wǎng)站或社交網(wǎng)站平臺上,用戶和用戶之間,實現(xiàn)了建立更好的推薦模式,讓用戶體驗到他所關(guān)注的人才圈子內(nèi)推薦的內(nèi)容更加個性化。為實現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺的推薦算法,主要由以下步驟組成:(I)收集用戶偏好:從用戶的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦,收集用戶的偏好信息是系統(tǒng)推薦效果基礎(chǔ)的決定因素,用戶采用各種方式向系統(tǒng)提供自己的偏好信息;(2)分析內(nèi)容特性:當(dāng)已經(jīng)對用戶行為進(jìn)行分析得到用戶喜好后,根據(jù)用戶喜好計算相似用戶和物品,然后基于相似用戶或者物品進(jìn)行推薦,這兩種方法都要計算相似度;生成推薦的過程主要由設(shè)置的三個部件組成:內(nèi)容分析器:從漏洞信息中提取影響用戶關(guān)注度的重要信息用一種適當(dāng)?shù)臋?quán)重來表示,例如漏洞嚴(yán)重級別、攻擊復(fù)雜度、關(guān)聯(lián)產(chǎn)品、所屬廠商、關(guān)聯(lián)補(bǔ)丁、利用代碼、惡意代碼;文件學(xué)習(xí)器:該模塊收集、泛化代表用戶偏好的數(shù)據(jù),生成用戶概要信息,通常采用機(jī)器學(xué)習(xí)方法從用戶之前關(guān)注的漏洞信息中推出ー個表示用戶關(guān)注的模型;過濾部件:通過學(xué)習(xí)用戶概要信息,匹配用戶概要信息和商品信息,推薦相關(guān)的商品,結(jié)果是ー個二元的連續(xù)型的相關(guān)判斷,后者將生成一個用戶可能感興趣的潛在商品評分列表;(3)相似度的計算:在推薦的場景中,在用戶與物品偏好的ニ維矩陣中,將ー個用戶對所有物品的偏好作為ー個向量來計算用戶之間的相似度,或者將所有用戶對某個物品的偏好作為ー個向量來計算物品之間的相似度。本發(fā)明所述的基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺的推薦算法的有益效果為:實現(xiàn)了建立更好的推薦模式,讓用戶體驗到他所關(guān)注的人才圈子內(nèi)推薦的內(nèi)容更加個性化;本算法混合單純的協(xié)同過濾和基于內(nèi)容的方法,提升了性能,可以提供更準(zhǔn)確的推薦,也可以克服ー些推薦系統(tǒng)中,如冷啟動和稀疏性問題的常見問題。
下面根據(jù)附圖對本發(fā)明作進(jìn)ー步詳細(xì)說明。圖1是本發(fā)明實施例所述基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺的推薦算法部分流程示意圖。
具體實施例方式如圖1所示,本發(fā)明實施例所述的基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺的推薦算法,主要由以下步驟組成:(I)收集用戶偏好:從用戶的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦,如何收集用戶的偏好信息成為系統(tǒng)推薦效果最基礎(chǔ)的決定因素,用戶有很多方式向系統(tǒng)提供自己的偏好信息,如下表所示:
權(quán)利要求
1.一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺的推薦算法,其特征在于,主要由以下步驟組成: (1)收集用戶偏好:從用戶的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦,收集用戶的偏好信息是系統(tǒng)推薦效果基礎(chǔ)的決定因素,用戶采用各種方式向系統(tǒng)提供自己的偏好信息; (2)分析內(nèi)容特性:當(dāng)已經(jīng)對用戶行為進(jìn)行分析得到用戶喜好后,根據(jù)用戶喜好計算相似用戶和物品,然后基于相似用戶或者物品進(jìn)行推薦,這兩種方法都要計算相似度; 生成推薦的過程主要由設(shè)置的三個部件組成: 內(nèi)容分析器:從漏洞信息中提取影響用戶關(guān)注度的重要信息用一種適當(dāng)?shù)臋?quán)重來表示,例如漏洞嚴(yán)重級別、攻擊復(fù)雜度、關(guān)聯(lián)產(chǎn)品、所屬廠商、關(guān)聯(lián)補(bǔ)丁、利用代碼、惡意代碼;文件學(xué)習(xí)器:該模塊收集、泛化代表用戶偏好的數(shù)據(jù),生成用戶概要信息,通常采用機(jī)器學(xué)習(xí)方法從用戶之前關(guān)注的漏洞信息中推出ー個表示用戶關(guān)注的模型; 過濾部件:通過學(xué)習(xí)用戶概要信息,匹配用戶概要信息和商品信息,推薦相關(guān)的商品,結(jié)果是ー個二元的連續(xù)型的相關(guān)判斷,后者將生成一個用戶可能感興趣的潛在商品評分列表; (3)相似度的計算:在推薦的場景中,在用戶與物品偏好的ニ維矩陣中,將ー個用戶對所有物品的偏好作為ー個向量來計算用戶之間的相似度,或者將所有用戶對某個物品的偏好作為ー個向量來計算物品之間的相似度。
全文摘要
本發(fā)明涉及一種基于信息安全專業(yè)社交網(wǎng)絡(luò)平臺的推薦算法,主要由以下步驟組成(1)收集用戶偏好從用戶的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦,收集用戶的偏好信息是系統(tǒng)推薦效果基礎(chǔ)的決定因素,用戶采用各種方式向系統(tǒng)提供自己的偏好信息;(2)分析內(nèi)容特性當(dāng)已經(jīng)對用戶行為進(jìn)行分析得到用戶喜好后,根據(jù)用戶喜好計算相似用戶和物品,然后基于相似用戶或者物品進(jìn)行推薦;(3)相似度的計算。本發(fā)明有益效果為實現(xiàn)了建立更好的推薦模式,讓用戶體驗到他所關(guān)注的人才圈子內(nèi)推薦的內(nèi)容更加個性化;本算法混合單純的協(xié)同過濾和基于內(nèi)容的方法,提升了性能,可以提供更準(zhǔn)確的推薦,也可以克服一些推薦系統(tǒng)中,如冷啟動和稀疏性問題的常見問題。
文檔編號G06F17/30GK103106285SQ20131006810
公開日2013年5月15日 申請日期2013年3月4日 優(yōu)先權(quán)日2013年3月4日
發(fā)明者劉暉, 趙向輝, 易錦, 劉彥釗, 田雯, 葉林, 曾昭沛, 羅寧 申請人:中國信息安全測評中心, 上海三零衛(wèi)士信息安全有限公司