一種基于移動(dòng)App運(yùn)行列表的App冷啟動(dòng)推薦方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息檢索、圖計(jì)算及推薦系統(tǒng)領(lǐng)域,特別涉及一種通過(guò)關(guān)鍵詞計(jì)算及信息檢索和圖計(jì)算而完成的基于移動(dòng)App的運(yùn)行及內(nèi)容信息解決推薦系統(tǒng)中App推薦的冷啟動(dòng)問(wèn)題的方法。
【背景技術(shù)】
[0002]移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,為大眾提供了多種多樣的線上線下服務(wù),極大地豐富和方便了日常生活。同時(shí),面對(duì)社會(huì)生活中的大量需求,具有新功能的移動(dòng)應(yīng)用不斷涌現(xiàn),為人們的生活提供了更便捷的服務(wù)。在進(jìn)行App的推廣時(shí),為了能夠快速進(jìn)入大眾的視野中,一般App開發(fā)者均會(huì)制定一定的推送策略。但是在當(dāng)前的App推送方式中,對(duì)于新App推送的冷啟動(dòng)問(wèn)題一直未得到良好的解決。
[0003]現(xiàn)有的針對(duì)于冷啟動(dòng)的隨機(jī)推薦法、平均值法、眾數(shù)法和信息熵法等方法,是在很大程度上犧牲用戶的個(gè)性化需求為代價(jià),進(jìn)而在一定程度上緩解冷啟動(dòng)問(wèn)題。在給新用戶推送時(shí),一般策略是將使用最廣或者最火的App推送給新用戶,這樣在未知用戶特征的前提下會(huì)有一定的推送效果。在給用戶推送新App時(shí),將App推送給最活躍的或者下載App最多的用戶,這樣在未知App的特征內(nèi)容的前提下,可以比隨機(jī)推薦更好地提高推薦效果。但是以上的方法只能是在一定程度上緩解冷啟動(dòng)問(wèn)題,而不能根治。
[0004]同時(shí),基于原始評(píng)分矩陣擴(kuò)充的方法,直接利用用戶的人口統(tǒng)計(jì)信息和項(xiàng)目的內(nèi)容特征信息添加到原來(lái)的用戶一物品矩陣中。這樣在當(dāng)有新用戶或者新物品時(shí),也會(huì)使得矩陣中這些行或列不為空,進(jìn)而使得進(jìn)行矩陣計(jì)算時(shí)也可以實(shí)施,可以繼續(xù)計(jì)算相似用戶或者相似物品,最后完成推薦。此算法對(duì)新用戶和新物品的添加有效果,但是對(duì)于超高維的數(shù)據(jù),當(dāng)用戶或物品的維數(shù)遠(yuǎn)遠(yuǎn)大于擴(kuò)充的信息的維數(shù)時(shí),這些擴(kuò)充信息就不足以描述新用戶或新物品的特征,所以此時(shí)也不能好的解決冷啟動(dòng)問(wèn)題。
[0005]還有使用構(gòu)建概率統(tǒng)計(jì)模型和與機(jī)器學(xué)習(xí)相結(jié)合的方法。前者由于在搜集概率條件信息時(shí)要花費(fèi)很大的代價(jià),所以很少使用。后者對(duì)影響因素的比例選取沒(méi)有充分的數(shù)學(xué)依據(jù),所以只是用于特定的數(shù)據(jù)集。
[0006]對(duì)于App推薦來(lái)說(shuō),基于內(nèi)容的推薦雖然可以良好的解決冷啟動(dòng)問(wèn)題,但是經(jīng)過(guò)實(shí)際測(cè)試,其效果與隨機(jī)推薦相差無(wú)異,因此無(wú)法直接使用。
【發(fā)明內(nèi)容】
[0007]為了解決上述問(wèn)題,本發(fā)明提供了一種基于移動(dòng)App運(yùn)行列表的App冷啟動(dòng)推薦方法,用于在能夠使用用戶運(yùn)行列表進(jìn)行較好質(zhì)量的推薦的前提下,同時(shí)很好的解決對(duì)于新物品冷啟動(dòng)的問(wèn)題。
[0008]為實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案為:
一種基于移動(dòng)App運(yùn)行列表的App冷啟動(dòng)推薦方法,包括如下步驟:
S10.獲取大量App信息并進(jìn)行關(guān)鍵詞整理; S20.計(jì)算表示所述關(guān)鍵詞關(guān)系的加權(quán)無(wú)向圖;
S30.根據(jù)待推送App信息在所述加權(quán)無(wú)向圖中進(jìn)行計(jì)算并推送。
[0009]進(jìn)一步的,步驟SlO包括以下步驟:
5101.獲取大量App的信息,所述信息中包括App描述信息;
5102.獲取大量用戶的運(yùn)行列表,作為計(jì)算使用的數(shù)據(jù)訓(xùn)練庫(kù);
5103.對(duì)步驟SlOl中獲取的每個(gè)App及其描述信息,使用關(guān)鍵詞求解方法計(jì)算每個(gè)App描述信息的關(guān)鍵詞及權(quán)重。所述關(guān)鍵詞求解方法包括TF-1DF ( Term Frequency -1nverse Document Frequency,詞頻-逆文檔頻率)、TextRank 等方法。
[0010]進(jìn)一步的,步驟S20包括以下步驟:
5201.根據(jù)用戶的運(yùn)行列表,計(jì)算其中包含的所有的App頻繁項(xiàng)集;
5202.根據(jù)計(jì)算出的App頻繁項(xiàng)集,和每個(gè)App的關(guān)鍵詞,計(jì)算出所有的關(guān)鍵詞之間的相關(guān)性,得到關(guān)鍵詞頻繁項(xiàng)集;
5203.將計(jì)算得出的關(guān)鍵詞頻繁項(xiàng)集中的詞作為節(jié)點(diǎn),詞之間的關(guān)聯(lián)權(quán)重作為權(quán)重組成加權(quán)無(wú)向圖。
[0011]進(jìn)一步的,步驟S30包括以下步驟:
5301.計(jì)算待推送App的描述信息的關(guān)鍵詞及權(quán)重,在加權(quán)無(wú)向圖中計(jì)算該這些關(guān)鍵詞的最相關(guān)的關(guān)鍵詞集;
5302.根據(jù)計(jì)算得出的關(guān)鍵詞集映射出對(duì)應(yīng)的App集,根據(jù)關(guān)鍵詞的相關(guān)性對(duì)App進(jìn)行排序,得出最相關(guān)的App集,也即最可能出現(xiàn)的頻繁項(xiàng)App ;
5303.對(duì)安裝了所述頻繁項(xiàng)App的用戶推送所述待推送App。
[0012]本發(fā)明的有益效果:在訓(xùn)練數(shù)據(jù)訓(xùn)練出初始模型后,模型可以在使用運(yùn)行列表內(nèi)容進(jìn)行良好推薦的前提下,很好的解決冷啟動(dòng)問(wèn)題,且具有良好的可擴(kuò)展性,并一定程度上克服了基于內(nèi)容推薦的不足。具體主要包括以下內(nèi)容:
O當(dāng)推薦新App時(shí),可以依據(jù)此App的描述信息內(nèi)容,計(jì)算其潛在的頻繁項(xiàng)App,然后進(jìn)行推薦,可以克服傳統(tǒng)推薦系統(tǒng)中的冷啟動(dòng)問(wèn)題;
2)在對(duì)新App推薦的過(guò)程中,會(huì)逐步更新加權(quán)無(wú)向圖中的詞節(jié)點(diǎn),因此具有良好的可擴(kuò)展性。
[0013]3)基于App的運(yùn)行列表進(jìn)行加權(quán)無(wú)向圖的構(gòu)建,進(jìn)而提取運(yùn)行列表中的信息進(jìn)行進(jìn)一步的推薦,因此可以一定程度上克服僅僅基于內(nèi)容推薦的不足。
【附圖說(shuō)明】
[0014]圖1為本發(fā)明的一種基于移動(dòng)App運(yùn)行列表的App冷啟動(dòng)推薦方法的整體框架圖;
圖2為本發(fā)明的一種基于移動(dòng)App運(yùn)行列表的App冷啟動(dòng)推薦方法的流程框圖。
【具體實(shí)施方式】
[0015]為了進(jìn)一步理解本發(fā)明,下面結(jié)合實(shí)施例對(duì)本發(fā)明優(yōu)選實(shí)施方案進(jìn)行描述,但是應(yīng)當(dāng)理解,這些描述只是為進(jìn)一步說(shuō)明本發(fā)明的特征和優(yōu)點(diǎn),而不是對(duì)本發(fā)明權(quán)利要求的限制。
[0016]本發(fā)明提供了一種基于移動(dòng)App運(yùn)行列表的App冷啟動(dòng)推薦方法,依賴于用戶的App運(yùn)行列表和大量App的描述信息,進(jìn)行App頻繁項(xiàng)至關(guān)鍵詞頻繁項(xiàng)的轉(zhuǎn)換,并將關(guān)鍵詞及其關(guān)系權(quán)重轉(zhuǎn)換為加權(quán)無(wú)向圖,當(dāng)要推薦新App時(shí),首先提取App的關(guān)鍵詞集,并使用加權(quán)無(wú)向圖計(jì)算關(guān)鍵詞集的相關(guān)關(guān)系,最后