欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于問題引導(dǎo)的個(gè)性化推薦方法及系統(tǒng)的制作方法_3

文檔序號(hào):8258854閱讀:來源:國知局
行中文分詞和語義分析,獲取語義主題。
[0079] 其中,中文分詞是指利用中文分詞算法將自然語言描述文本中的段落句子拆分為 詞語。常用的中文分詞算法包括最大匹配算法、最長均詞算法和最小方差算法。
[0080] 語義分析是指統(tǒng)計(jì)匯總用戶輸入的段落句子中的每個(gè)詞語與物品主題的相似程 度。設(shè)用戶輸入的段落中通過中文分詞分析出段落包含n個(gè)詞語,同時(shí)設(shè)預(yù)之前整理的物 品主題(例如動(dòng)作片、驚悚片等等)有m個(gè),分別為[1' 1,1'2,一1'111],另外設(shè)詞語1與物品主題 j的相關(guān)性為Pu詞語與物品主題的相似性可以通過計(jì)算與物品主題在語料訓(xùn)練數(shù)據(jù)(例 如,電影的元數(shù)據(jù)劇情描述信息、用戶的影評(píng)文本數(shù)據(jù)等等)中共現(xiàn)概率而獲得,其公式表 示為:
[0081]
[0082] 其中,(^表示詞語i在語料中出現(xiàn)的次數(shù);Cj表示物品主題j在語料中出現(xiàn)的次 數(shù);Cu為詞語i與物品主題共同出現(xiàn)的次數(shù)。
[0083] 最終段落語句s與物品主題j的相似程度為:
[0084]
【主權(quán)項(xiàng)】
1. 一種基于問題引導(dǎo)的個(gè)性化推薦方法,包括兩個(gè)步驟; 第一步驟:獲取語義主題或行為主題W及構(gòu)建多個(gè)問題引導(dǎo)樹;其中, 根據(jù)用戶輸入的問題獲取語義主題, 根據(jù)用戶的瀏覽內(nèi)容獲取行為主題; 對(duì)用戶行為數(shù)據(jù)、用戶評(píng)分?jǐn)?shù)據(jù)和物品元數(shù)據(jù)進(jìn)行數(shù)據(jù)過濾,獲取用戶、物品和喜好程 度H元關(guān)系的多個(gè)物品主題,并基于遺傳算法構(gòu)建與所獲取的多個(gè)物品主題一一對(duì)應(yīng)的問 題引導(dǎo)樹; 第二步驟;通過主題匹配確定問題引導(dǎo)樹;其中, 根據(jù)所述語義主題或所述行為主題獲取喜好主題; 將所述喜好主題與所述問題引導(dǎo)樹進(jìn)行匹配,確定與所述喜好主題相匹配的問題引導(dǎo) 樹,根據(jù)所確定的問題引導(dǎo)樹向用戶進(jìn)行問題輸出,獲取用戶喜好數(shù)據(jù)從而進(jìn)行個(gè)性化推 薦。
2. 如權(quán)利要求1所述的基于問題引導(dǎo)的個(gè)性化推薦方法,其中,在根據(jù)用戶輸入的問 題獲取語義主題的過程中, 將用戶輸入的問題進(jìn)行中文分詞和語義分析,獲取語義主題;其中, 在所述中文分詞的過程中,利用中文分詞算法將自然語言描述文本中的段落句子拆分 為詞語;所述中文分詞算法包括最大匹配算法、最長均詞算法和最小方差算法; 在所述語義分析的過程中,統(tǒng)計(jì)用戶輸入的問題的段落句子中的每個(gè)詞語與物品主題 的相似程度; 在所述獲取語義主題的過程中,選取最大相似度主題為該語句的語義主題。
3. 如權(quán)利要求1所述的基于問題引導(dǎo)的個(gè)性化推薦方法,其中,在根據(jù)用戶的瀏覽內(nèi) 容獲取行為主題的過程中, 根據(jù)用戶的瀏覽內(nèi)容獲取用戶行為; 根據(jù)所述用戶行為獲取用戶對(duì)物品主題的喜好程度,并將用戶喜好程度最大并且超過 預(yù)設(shè)閥值的物品主題作為行為主題。
4. 如權(quán)利要求1所述的基于問題引導(dǎo)的個(gè)性化推薦方法,其中, 根據(jù)用戶對(duì)含有多個(gè)物品的列表中各物品的選擇,獲取用戶最喜好的物品。
5. 如權(quán)利要求4所述的基于問題引導(dǎo)的個(gè)性化推薦方法,其中,在基于遺傳算法構(gòu)建 與所獲取的多個(gè)物品主題一一對(duì)應(yīng)的問題引導(dǎo)樹的過程中, 對(duì)獲取的每個(gè)物品主題所對(duì)應(yīng)的用戶評(píng)價(jià)數(shù)據(jù)集進(jìn)行種群選擇運(yùn)算、交叉運(yùn)算、變異 運(yùn)算生成問題引導(dǎo)樹;其中, 在所述種群選擇運(yùn)算的過程中,從群體中選擇優(yōu)勝的個(gè)體,淘汰劣質(zhì)個(gè)體;其中,在所 述種群選擇運(yùn)算的初始的階段采用隨機(jī)生成N個(gè)物品集進(jìn)行所述交叉運(yùn)算,在每次完成所 述交叉運(yùn)算與所述變異運(yùn)算后,從候選物品集隨機(jī)選取N個(gè)物品集,并計(jì)算所述種群選擇 運(yùn)算中的物品集種群的平均適應(yīng)度,其中,N大于1 ; 在所述交叉運(yùn)算的過程中,每次隨機(jī)選取任意兩個(gè)物品集,并對(duì)任意兩個(gè)物品進(jìn)行交 換產(chǎn)生一個(gè)新的物品集,并且滿足新生成的物品集中沒有重復(fù)的物品; 在所述變異運(yùn)算的過程中,對(duì)所述交叉運(yùn)算后生成的任意物品集中的任意物品進(jìn)行隨 機(jī)選取更換,并且滿足變異后的物品集中沒有重復(fù)的物品,并獲取變異后的物品集種群的 平均適應(yīng)度。
6. 如權(quán)利要求5所述的基于問題引導(dǎo)的個(gè)性化推薦方法,其中, 根據(jù)所述交叉運(yùn)算與所述變異運(yùn)算生成的物品集種群的平均適應(yīng)度、所述種群選擇運(yùn) 算中的物品集種群的平均適應(yīng)度W及閥值,按照當(dāng)前物品主題進(jìn)行子節(jié)點(diǎn)用戶群組分配, 生成問題引導(dǎo)樹。
7. -種基于問題引導(dǎo)的個(gè)性化推薦系統(tǒng),包括: 語義主題獲取單元,用于根據(jù)用戶輸入的問題獲取語義主題; 行為主題獲取單元,用于根據(jù)用戶的瀏覽內(nèi)容獲取行為主題; 主題獲取單元,用于對(duì)用戶行為數(shù)據(jù)、用戶評(píng)分?jǐn)?shù)據(jù)和物品元數(shù)據(jù)進(jìn)行數(shù)據(jù)過濾,并獲 取用戶、物品和喜好程度H元關(guān)系的多個(gè)物品主題, 問題引導(dǎo)樹生成單元,用于基于遺傳算法構(gòu)建與所獲取的多個(gè)物品主題一一對(duì)應(yīng)的問 題引導(dǎo)樹; 喜好主題獲取單元,用于根據(jù)所述語義主題或所述行為主題,獲取喜好主題; 主題匹配單元,用于將所述喜好主題與所述問題引導(dǎo)森林進(jìn)行匹配,確定與所述喜好 主題相匹配的問題引導(dǎo)樹; 問題輸出單元,用于根據(jù)確定的問題引導(dǎo)樹向用戶進(jìn)行問題輸出,獲取用戶喜好數(shù)據(jù) 從而進(jìn)行個(gè)性化推薦。
8. 如權(quán)利要求7所述的基于問題引導(dǎo)的個(gè)性化推薦系統(tǒng),其中, 所述主題獲取單元根據(jù)用戶對(duì)含有多個(gè)物品的列表中各物品的選擇,獲取用戶最喜好 的物品。
9. 如權(quán)利要求8所述的基于問題引導(dǎo)的個(gè)性化推薦系統(tǒng),其中,所述問題引導(dǎo)樹生成 單元包括: 種群選擇運(yùn)算模塊,用于從群體中選擇優(yōu)勝的個(gè)體,淘汰劣質(zhì)個(gè)體;其中,在所述種群 選擇運(yùn)算的初始的階段采用隨機(jī)生成N個(gè)物品集進(jìn)行所述交叉運(yùn)算,在每次完成所述交叉 運(yùn)算與所述變異運(yùn)算后,從候選物品集隨機(jī)選取N個(gè)物品集,并計(jì)算所述種群選擇運(yùn)算中 的物品集種群的平均適應(yīng)度,其中,其中,N大于1 ; 交叉運(yùn)算模塊,用于隨機(jī)選取任意兩個(gè)物品集,并對(duì)任意兩個(gè)物品進(jìn)行交換產(chǎn)生一個(gè) 新的物品集,并且滿足新生成的物品集中沒有重復(fù)的物品; 變異運(yùn)算模塊,用于對(duì)所述交叉運(yùn)算后生成的任意物品集中的任意物品進(jìn)行隨機(jī)選取 更換,并且滿足變異后的物品集中沒有重復(fù)的物品,并獲取變異后的物品集種群的平均適 應(yīng)度。
10. 如權(quán)利要求9所述的基于問題引導(dǎo)的個(gè)性化推薦系統(tǒng),其中,所述問題引導(dǎo)樹生成 單元還包括: 用戶群組分配模組,用于根據(jù)所述交叉運(yùn)算與所述變異運(yùn)算生成的物品集種群的平均 適應(yīng)度、所述種群選擇運(yùn)算中的物品集種群的平均適應(yīng)度W及預(yù)設(shè)閥值,按照當(dāng)前物品主 題進(jìn)行子節(jié)點(diǎn)用戶群組分配,生成問題引導(dǎo)樹。
【專利摘要】本發(fā)明提供一種基于問題引導(dǎo)的個(gè)性化推薦方法及系統(tǒng),其中的方法包括:第一步驟:獲取語義主題或行為主題以及構(gòu)建多個(gè)問題引導(dǎo)樹;其中,根據(jù)用戶輸入的問題獲取語義主題;根據(jù)用戶的瀏覽內(nèi)容獲取行為主題;對(duì)用戶行為數(shù)據(jù)、用戶評(píng)分?jǐn)?shù)據(jù)和物品元數(shù)據(jù)進(jìn)行數(shù)據(jù)過濾,獲取多個(gè)物品主題,基于遺傳算法構(gòu)建與所獲取的多個(gè)物品主題一一對(duì)應(yīng)的問題引導(dǎo)樹;第二步驟:通過主題匹配,確定問題引導(dǎo)樹,根據(jù)語義主題或行為主題獲取喜好主題;將喜好主題與問題引導(dǎo)樹進(jìn)行匹配,選取出與喜好主題相匹配的問題引導(dǎo)樹,根據(jù)選取出的問題引導(dǎo)樹向用戶進(jìn)行問題輸出,獲取用戶喜好數(shù)據(jù)從而進(jìn)行個(gè)性化推薦。利用本發(fā)明,能夠解決用戶冷啟動(dòng)問題,提高用戶體驗(yàn)。
【IPC分類】G06F17-30, G06N3-12
【公開號(hào)】CN104572982
【申請(qǐng)?zhí)枴緾N201410856318
【發(fā)明人】鄒存璐, 王菊, 孟令勝, 劉長虹
【申請(qǐng)人】東軟集團(tuán)股份有限公司
【公開日】2015年4月29日
【申請(qǐng)日】2014年12月31日
當(dāng)前第3頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
田东县| 远安县| 祁东县| 若羌县| 蒲城县| 宝清县| 筠连县| 九龙坡区| 合阳县| 宜君县| 阜城县| 利川市| 上杭县| 静海县| 天峻县| 姚安县| 林芝县| 巴彦县| 江北区| 金阳县| 肥乡县| 亳州市| 贡觉县| 温宿县| 霍林郭勒市| 临泉县| 威信县| 鲁甸县| 枣强县| 宁陕县| 霍山县| 清丰县| 静乐县| 阿尔山市| 浪卡子县| 澳门| 香格里拉县| 都安| 牙克石市| 泊头市| 静宁县|