1.一種基于混合多種模式的個(gè)性化推薦方法,其特征在于,聚類計(jì)算相似商品過(guò)程主要包括:
A、創(chuàng)建一個(gè)實(shí)體類SimilarityData,設(shè)定三個(gè)字段row(行)、 column (列)、similarityValue(相似度),其中所述實(shí)體類SimilarityData主要作用是三元組,矩陣中的某一個(gè)元素,用來(lái)保存稀疏矩陣;
B、創(chuàng)建實(shí)例SimilarityData[][] allSimilarityData,用來(lái)保存的是所有的相似數(shù)據(jù);
C、創(chuàng)建數(shù)組int[] countArray,用來(lái)保存每一條數(shù)據(jù)相似的數(shù)據(jù)的總數(shù);
D、初始化矩陣;
E、計(jì)算兩兩之間的相似度;
F、和第row條數(shù)據(jù)相似的數(shù)據(jù)的總數(shù);
G、給相似數(shù)據(jù)賦值。
2.根據(jù)權(quán)利要求1所述的基于混合多種模式的個(gè)性化推薦方法,其特征在于,所述步驟A的相似度,具體為:在進(jìn)行聚類計(jì)算之前,通過(guò)訓(xùn)練集測(cè)試得出將最小相似度設(shè)定minSimilarity為0.8較為合適。
3.根據(jù)權(quán)利要求1所述的基于混合多種模式的個(gè)性化推薦方法,其特征在于,所述步驟E,具體為:相似度得計(jì)算使用Jaccard系數(shù)計(jì)算兩個(gè)向量的相似度。
4.根據(jù)權(quán)利要求1所述的基于混合多種模式的個(gè)性化推薦方法,其特征在于,所述步驟G,具體為:當(dāng)有一條新的數(shù)據(jù)的時(shí)候,如果所在行的數(shù)據(jù)還沒有填滿,則直接插入到最后一個(gè)元素的后面;如果所在行的數(shù)據(jù)已經(jīng)填滿,則用當(dāng)前數(shù)據(jù)和所在行的最小。
5.根據(jù)權(quán)利要求1所述的基于混合多種模式的個(gè)性化推薦方法,其特征在于,所述步驟A之前還需要制作相似數(shù)據(jù)訓(xùn)練集,具體為:
從數(shù)據(jù)庫(kù)讀取的數(shù)據(jù)進(jìn)行分詞,并將分詞之后的數(shù)據(jù)以空格形式存在默認(rèn)文件夾resys,其中在讀取數(shù)據(jù)之前還需要判斷是否需要更新訓(xùn)練集;
讀取分詞之后的訓(xùn)練數(shù)據(jù);
使用TF-IDF和LDA混合模型進(jìn)行特征抽取,用于聚類;
使用TF對(duì)商品進(jìn)行向量化,同時(shí)初始化LDA 主題模型,并輸出每一個(gè)主題對(duì)應(yīng)的所有詞;其中文本的特征,可能是topic,也可能是word。
6.一種基于混合多種模式的廢舊行業(yè)推薦系統(tǒng),其特征在于,該系統(tǒng)主要包括以下幾個(gè)模塊:A模塊、關(guān)聯(lián)推薦、熱點(diǎn)推薦、TopN推薦三種混合推薦模式,B模塊、初始化推薦結(jié)果,C模塊、過(guò)濾、結(jié)果排序、推薦解釋、最終的推薦結(jié)果。
7.根據(jù)權(quán)利要求5所述的基于混合多種模式的廢舊行業(yè)推薦系統(tǒng),其特征在于,所述A模塊,具體為:對(duì)網(wǎng)站常用用戶,關(guān)聯(lián)推薦和TopN推薦設(shè)置較高權(quán)重,熱點(diǎn)推薦次之;對(duì)無(wú)任何記錄用戶,將熱點(diǎn)推薦設(shè)置較高的權(quán)重,通過(guò)分析用戶所屬的適應(yīng)人群,也可進(jìn)行關(guān)聯(lián)推薦。
8.根據(jù)權(quán)利要求5所述的基于混合多種模式的廢舊行業(yè)推薦系統(tǒng),其特征在于,所述B模塊,具體為:返回的推薦結(jié)果為推薦解釋:resysExplain,供求編號(hào):M_gqinfo.gqid,產(chǎn)品分類: M_gqinfo.classid,供求分類:M_gqinfo.type,信息靜態(tài)頁(yè)面地址: M_gqinfo.htmlurl,圖片:M_gqinfo.photo,標(biāo)題:M_gqinfo.title,新舊程度: M_gqinfo.xjcd,供貨數(shù)量:M_gqinfo.pronum,型號(hào)規(guī)格:M_gqinfo.proxh,交易價(jià)格:M_gqinfo.proprice產(chǎn)品所在地:M_gqinfo.province,存放方式:M_gqinfo.cffs,權(quán)限:sys_user.rankid,會(huì)員編號(hào):sys_user.uid,用戶名:sys_user.uname,企業(yè)名稱:sys_user.comname,聯(lián)系人:sys_user.linkman,性別:sys_user.sex,公司所在地: sys_user.comaddress,德保指數(shù): czizhi_rz.frrz,是否通過(guò)德保認(rèn)證:czizhi_rz。
9.根據(jù)權(quán)利要求5所述的基于混合多種模式的廢舊行業(yè)推薦系統(tǒng),其特征在于,所述C模塊,具體為:推薦數(shù)據(jù)的過(guò)濾主要包括:過(guò)濾掉用戶已經(jīng)訪問(wèn)過(guò)的頁(yè)面,過(guò)濾掉用戶沒有訪問(wèn)權(quán)限的頁(yè)面,過(guò)濾掉重復(fù)數(shù)據(jù)。
10.根據(jù)權(quán)利要求5所述的基于混合多種模式的廢舊行業(yè)推薦系統(tǒng),其特征在于,所述C模塊,具體為:結(jié)果排序主要是對(duì)推薦的結(jié)果進(jìn)行排序,按照網(wǎng)頁(yè)的受歡迎程度排序,也就是網(wǎng)頁(yè)被點(diǎn)擊過(guò)的次數(shù)。