專利名稱:推薦信息評價裝置及推薦信息評價方法
技術領域:
本發(fā)明涉及進行內容評價的推薦信息評價裝置及推薦信息評價方法。
背景技術:
作為為了發(fā)布符合用戶特性的推薦信息而對該推薦信息進行提取的信息過濾方 式,可以考慮基于內容的過濾(Content-based Filtering)方式。該方式通過由用戶采取 網(wǎng)頁閱覽等行動,分析所閱覽的對象文件,并提取文件中包含的單詞(關鍵詞)。并且,按照 每個用戶來區(qū)分這些單詞,并作為所謂用戶概況(user profile)的興趣/嗜好信息進行記 錄。在用戶概況中表述了一個興趣的概念,利用該概念來向用戶提供信息。例如,公知有能 夠通過將對廣告商品等指派的關鍵詞與用戶概況(由關鍵詞表述的)匹配來進行適宜的廣 告推薦的系統(tǒng)。另外,作為與其相關聯(lián)的技術,可以列舉專利文獻1記述的技術。在該專利文獻1 中記述了如下技術,按照預先設定的推薦提取規(guī)則,確定發(fā)布推薦信息的發(fā)布目標及應該 發(fā)布的推薦信息,并進行發(fā)布。專利文獻專利文獻1 日本特開2007-148878號公報但是,在上述的背景技術中,在通過匹配處理來提取推薦信息的方式、或者專利文 獻1記述的技術中,根據(jù)預先設定的推薦提取規(guī)則來確定推薦信息,所以推薦信息有可能
產(chǎn)生遺漏。S卩,在專利文獻1的技術中,如果在推薦提取規(guī)則中登記了興趣/嗜好,則確定符 合該興趣/嗜好的推薦信息并進行發(fā)布,并且根據(jù)購買歷史等,在購買某個商品時發(fā)布與 該購買的商品相關聯(lián)的信息,但這些發(fā)布的信息是根據(jù)興趣/嗜好、購買歷史或者訪問歷 史等直接性信息而確定的,所以存在遺漏用戶潛在期望的內容的情況。尤其是在根據(jù)訪問歷史來發(fā)布、使用推薦信息的情況下,遺漏尤其嚴重。也就是 說,在用戶閱覽站點等的情況下,通常所閱覽的站點本身不是由一個關鍵詞來表述,而是由 多個關鍵詞來表述。例如,在用戶檢索與電影a相關的信息并進行閱覽的情況下,該所閱覽 的站點包括電影a的介紹、原著的介紹、上映電影院的介紹、演員介紹等各種信息(矢量信 息)。在這種情況下,用戶在查詢原著時希望進行特定為該原著的過濾處理,并發(fā)布僅針對 于此的推薦信息。但是,在上述專利文獻1記述的技術中,將看到正在閱覽的整個站點,并將近乎所 有的信息作為推薦信息進行發(fā)布,不能像上述那樣發(fā)布用戶潛在期望的信息。
發(fā)明內容
本發(fā)明的目的在于,提供一種推薦信息評價裝置及推薦信息評價方法,在進行評 價時能夠沒有遺漏地發(fā)布用戶潛在期望的內容等的推薦信息。為了解決上述問題,本發(fā)明的推薦信息評價裝置具有受理單元,其受理根據(jù)用戶操作從多個選擇對象項目中對一個選擇對象項目進行的選擇;存儲單元,其存儲由所述受 理單元受理的被選擇的選擇對象項目的矢量即滿意特征矢量、以及未被選擇的選擇對象項 目的矢量即不滿意特征矢量;用戶特性矢量生成單元,其將與分離平面正交的正交矢量作 為用戶特性矢量,該分離平面用于在特征空間內將由所述存儲單元存儲的被選擇的選擇對 象項目的滿意特征矢量與未被選擇的選擇對象項目的不滿意特征矢量分離開;以及評價單 元,其根據(jù)由所述用戶特性矢量生成單元生成的用戶特性矢量,進行未知的選擇對象項目 的評價。另外,本發(fā)明的推薦信息評價方法包括受理步驟,受理根據(jù)用戶操作從多個選擇 對象項目中對一個選擇對象項目進行的選擇;存儲步驟,存儲通過所述受理步驟受理的被 選擇的選擇對象項目的矢量即滿意特征矢量、以及未被選擇的選擇對象項目的矢量即不滿 意特征矢量;用戶特性矢量生成步驟,根據(jù)與分離平面正交的正交矢量來生成用戶特性矢 量,該分離平面用于在特征空間內將通過所述存儲步驟存儲的被選擇的選擇對象項目的滿 意特征矢量與未被選擇的選擇對象項目的不滿意特征矢量分離開;以及評價步驟,根據(jù)通 過所述用戶特性矢量生成步驟生成的用戶特性矢量,進行推薦信息的評價。根據(jù)本發(fā)明,受理根據(jù)用戶操作從多個選擇對象項目中對一個選擇對象項目進行 的選擇,并存儲被選擇的選擇對象項目的矢量即滿意特征矢量以及未被選擇的選擇對象項 目的矢量即不滿意特征矢量。生成與分離平面正交的正交矢量作為用戶特性矢量,該分離 平面用于在特征空間內將此處存儲的被選擇的選擇對象項目的滿意特征矢量與未被選擇 的選擇對象項目的不滿意特征矢量分離開,根據(jù)所生成的用戶特性矢量進行未知的選擇對 象項目的評價。由此,能夠按照表示用戶特性的矢量,進行未知的選擇對象項目、例如內容或者操 作菜單項目等推薦信息的評價,并能夠沒有遺漏地向用戶提供推薦信息,而無需根據(jù)用戶 的興趣/嗜好等或者訪問歷史等直接性信息來評價所應推薦的推薦信息。另外,優(yōu)選本發(fā)明的推薦信息評價裝置還具有生成分離平面的分離平面生成單 元,該分離平面用于在特征空間內將通過所述存儲單元存儲的被選擇的選擇對象項目的滿 意特征矢量與未被選擇的選擇對象項目的不滿意特征矢量分離開,所述用戶特性矢量生成 單元按照由所述分離平面生成單元生成的分離平面,生成用戶特性矢量。根據(jù)本發(fā)明,生成用于在特征空間內將被選擇的選擇對象項目的滿意特征矢量與 未被選擇的選擇對象項目的不滿意特征矢量分離開的分離平面,并根據(jù)該分離平面來生成 用戶特性矢量,由此能夠高精度地生成用戶特性矢量。另外,優(yōu)選在本發(fā)明的推薦信息評價裝置中,所述分離平面生成單元計算所有的 不滿意特征矢量與滿意特征矢量的相對位置關系,并且按照使其他不滿意特征矢量或者其 他滿意特征矢量與一個不滿意特征矢量或者一個滿意特征矢量一致的方式計算位置關系, 并根據(jù)該位置關系來生成分離平面。根據(jù)本發(fā)明,優(yōu)選針對所有的不滿意特征矢量計算與滿意特征矢量的相對位置關 系,根據(jù)該位置關系來生成分離平面。由此,能夠在表示相對位置關系的相對空間內生成分 離平面,并根據(jù)分離平面來生成用戶特性矢量,所以能夠進行精度更高的推薦信息的評價。另外,優(yōu)選在本發(fā)明的推薦信息評價裝置中,所述分離平面生成單元根據(jù)SVM法 生成分離平面。
另外,優(yōu)選在本發(fā)明的推薦信息評價裝置中,所述用戶特性矢量生成單元根據(jù)NN 法生成用戶特性矢量。另外,優(yōu)選在本發(fā)明的推薦信息評價裝置中,所述存儲單元將選擇對象項目的選 擇頻度與該選擇對象項目的滿意特征矢量一起存儲,將選擇對象項目的不選擇頻度與該選 擇對象項目的不滿意特征矢量一起存儲,所述用戶特性矢量生成單元對所述選擇頻度較高 的滿意特征矢量進行與其頻度對應的加權,同時對所述不選擇頻度較高的不滿意特征矢量 進行與其頻度對應的加權,根據(jù)包括該加權后的滿意特征矢量及不滿意特征矢量在內的滿 意特征矢量及不滿意特征矢量,生成用戶特性矢量。根據(jù)本發(fā)明,能夠將選擇對象項目的選擇頻度與該選擇對象項目的滿意特征矢量 一起存儲,將選擇對象項目的不選擇頻度與該選擇對象項目的不滿意特征矢量一起存儲, 對選擇頻度較高的滿意特征矢量進行與其頻度對應的加權,同時對不選擇頻度較高的不滿 意特征矢量進行與其頻度對應的加權,根據(jù)包括該加權后的滿意特征矢量及不滿意特征矢 量在內的滿意特征矢量及不滿意特征矢量,生成用戶特性矢量。由此,能夠根據(jù)頻度來計算 用戶特性矢量,能夠計算精度更好的用戶特性矢量,所以能夠更準確地進行推薦信息的評 價。另外,優(yōu)選在本發(fā)明的推薦信息評價裝置中,所述存儲單元將選擇對象項目的選 擇時期與該選擇對象項目的滿意特征矢量一起存儲,所述分離平面生成單元根據(jù)按照選擇 時期及不選擇時期的新近程度進行了加權的該選擇對象項目的滿意特征矢量,生成用戶特
性矢量。根據(jù)本發(fā)明,能夠將選擇對象項目的選擇時期與該選擇對象項目的滿意特征矢量 一起存儲,并根據(jù)按照選擇時期及不選擇時期的新近程度進行了加權的該選擇對象項目的 滿意特征矢量,生成分離平面。由此,能夠進行考慮了時間序列成分的加權,能夠進行精度 更好的推薦信息評價。另外,優(yōu)選本發(fā)明的推薦信息評價裝置還具有推薦信息發(fā)送單元,其發(fā)送按照所 述評價單元的評價結果而生成的推薦信息。根據(jù)本發(fā)明,通過發(fā)送按照所述內容評價單元的評價結果而生成的推薦信息,用 戶能夠獲取有用的信息。另外,優(yōu)選在本發(fā)明的推薦信息評價裝置中,所述選擇對象項目是用于閱覽網(wǎng)頁 的菜單畫面上的項目。另外,優(yōu)選在本發(fā)明的推薦信息評價裝置中,所述選擇對象項目是用于執(zhí)行裝置 的功能的操作菜單上的項目。根據(jù)本發(fā)明,能夠按照表示用戶特性的矢量,進行未知的選擇對象項目、例如內容 或者操作菜單項目等推薦信息的評價,并能夠沒有遺漏地向用戶提供推薦信息,而無需根 據(jù)用戶的興趣/嗜好等或者訪問歷史等直接性信息來評價所應推薦的推薦信息。
圖1是表示本實施方式的具有手機100及信息發(fā)布服務器200的推薦信息發(fā)布系 統(tǒng)的系統(tǒng)結構的系統(tǒng)結構圖。圖2是表示信息發(fā)布服務器200的功能結構的框圖。
圖3是信息發(fā)布服務器200的硬件結構圖。圖4是表示在手機100上顯示的菜單畫面的一例的說明圖。圖5是表示生成分離平面時的處理概念的示意圖。圖6是表示根據(jù)分離平面計算用戶特性矢量,再根據(jù)用戶特性矢量進行評價時的 概念的示意圖。圖7是表示內容管理表205a的存儲內容的說明圖。圖8是表示內容特性矢量管理表207b的存儲內容的說明圖。圖9是表示手機100的功能結構的框圖。圖10是表示根據(jù)手機100的請求來發(fā)布內容時的處理的時序圖。圖11是表示用戶特性矢量的計算處理的流程圖。圖12是表示發(fā)布推薦信息時的時序圖。圖13是表示內容的評價處理的流程圖。圖14是表示歷史事件a和歷史事件b的菜單畫面的說明圖。圖15是表示在菜單畫面中選擇的內容的特性矢量在特征空間中的位置關系的 圖。圖16是對于歷史事件a及b在相對空間內表示內容的特性矢量的圖。圖17是表示根據(jù)絕對空間中的各個內容的特性矢量進行評價時的概念的圖。圖18是表示在不能生成分離平面的情況下使用相對空間進行處理時的說明圖。圖19是表示考慮閱覽頻度來求出特性矢量的重心的處理的概念圖。圖20是表示按照被訪問的時間序列順序,利用NN法求出用戶特性矢量的過程的 概念圖。圖21是表示與操作相關的特征空間中的特性矢量的參數(shù)的說明圖。圖22是表示能夠顯示推薦操作信息的手機IOOa的功能的框圖。標號說明100手機;IOOa手機;101瀏覽器;10Ia操作部;102歷史發(fā)送部;103推薦請求發(fā) 送部;104發(fā)布信息顯示部;104a推薦操作顯示部;105歷史類分離部;106用戶特性矢量計 算部;107操作信息評價部;108操作信息存儲部;109歷史存儲部;200信息發(fā)布服務器; 201內容請求接收部;202推薦請求接收部;203歷史類分離部;204用戶特性矢量計算部; 205發(fā)布信息存儲部;205a內容管理表;206內容評價部;207歷史存儲部;207a用戶特性矢 量管理表;207b內容特性矢量管理表;207c閱覽歷史表;208內容發(fā)送部。
具體實施例方式下面,參照
本發(fā)明的實施方式。在可能的情況下,對相同的部分標注相同 的標號,并省略重復說明。圖1是表示本實施方式的具有手機100及信息發(fā)布服務器200的推薦信息發(fā)布系 統(tǒng)的系統(tǒng)結構的系統(tǒng)結構圖。信息發(fā)布服務器200根據(jù)來自手機100的請求,向手機100 發(fā)布預先存儲的作為推薦信息的內容。所發(fā)布的推薦信息是根據(jù)手機100的用戶的訪問歷 史而編輯的信息,是被認為用戶需要的信息。這里,關于作為推薦信息而發(fā)布的內容的優(yōu)選 內容,包括對于用戶而言未評價的內容,例如,除了還未查看的Web內容之外,還包括構成電視節(jié)目表的內容,包括介紹今后發(fā)售的新出書籍等的內容。另外,該信息發(fā)布服務器200 根據(jù)來自手機100的訪問請求,從其他內容提供商取得內容,并發(fā)布所取得的內容,訪問歷 史是在此時收集的。并且,也可以構成為手機100發(fā)送訪問歷史,信息發(fā)布服務器200取得 該訪問歷史。使用圖2說明這種信息發(fā)布服務器200的結構。圖2是表示信息發(fā)布服務器200 的功能結構的框圖。該信息發(fā)布服務器200構成為包括內容請求接收部201 (受理單元)、推 薦請求接收部202、歷史類分離部203 (分離平面生成單元)、用戶特性矢量計算部204 (用 戶特性矢量生成單元)、發(fā)布信息存儲部205、內容評價部206(評價單元)、歷史存儲部 207 (存儲單元)、及內容發(fā)送部208。圖3是信息發(fā)布服務器200的硬件結構圖。圖2所示的信息發(fā)布服務器200在物 理上構成為計算機系統(tǒng),該計算機系統(tǒng)如圖3所示包括CPU11、作為主存儲裝置的RAM 12及 ROM 13、作為輸入設備的鍵盤及鼠標等輸入裝置14、顯示器等輸出裝置15、網(wǎng)卡等作為數(shù) 據(jù)收發(fā)設備的通信模塊16、和硬盤等輔助存儲裝置17等。在圖2中說明的各個功能是這 樣實現(xiàn)的通過將預定的計算機軟件讀入到圖3所示的CPU IURAM 12等的硬件上,在CPU 11的控制下使輸入裝置14、輸出裝置15、通信模塊16工作,同時進行RAM 12和輔助存儲裝 置17中的數(shù)據(jù)讀取及寫入。下面,根據(jù)圖2所示的功能塊來說明各個功能塊。內容請求接收部201是根據(jù)來自手機100的內容請求,從網(wǎng)絡上的內容提供商取 得內容的部分,能夠通過從手機100接收內容請求及其URL來采集訪問歷史。所采集的訪 問歷史(URL等)被輸出給歷史存儲部207。另外,該內容請求接收部201將在某個菜單畫 面(事件)內實際訪問的內容(URL)、和雖然顯示在菜單畫面上但實際沒有訪問的內容進行 區(qū)分,并作為訪問歷史進行采集。并且,內容請求接收部201也可以不僅接收訪問請求,還接收在手機100中采集到 的訪問歷史信息,并將它們輸出給歷史存儲部207。在這種情況下,手機100同樣構成為將 在某個菜單畫面中選擇的內容、和未被選擇的內容進行區(qū)分,并作為訪問歷史信息發(fā)送給 信息發(fā)布服務器200。推薦請求接收部202是從手機100接收推薦信息發(fā)布請求、以及手機100的用戶 的用戶ID的部分。推薦請求接收部202在接收到該發(fā)布請求時,將該情況通知給內容評價 部206,并指示內容評價部206根據(jù)預先計算的用戶特性矢量,對發(fā)布信息存儲部205中存 儲的內容進行評價。另外,作為變形例,也可以向用戶特性矢量計算部204告知有了推薦請 求,使用戶特性矢量計算部204計算當前時刻的用戶特性矢量,并將其結果通知給內容評 價部206,使內容發(fā)送部208進行推薦信息的發(fā)布。歷史類分離部203是根據(jù)存儲于歷史存儲部207 (閱覽歷史表207c)的閱覽歷史 信息中所包含的內容的特性矢量,生成用于將某個用戶閱覽的內容分離為滿意類和不滿意 類的分離平面的部分。這里,滿意類是指只包含在用于訪問某個內容的菜單畫面中可選擇 地顯示的多個內容中、被實際選擇的內容的類,不滿意類是指只包含該菜單畫面中未被選 擇的內容的類。該歷史類分離部203使用SVM法或者NN法,生成能夠將各個內容的特性 矢量分離為滿意類和不滿意類的分離平面,由此能夠將這些類分離。這里,SVM(Support Vector Machine:支持向量機)法是將使各個類的節(jié)點間(特性矢量間)的最小距離最大 化的平面作為分離平面的方法,NN法是以推薦連接各個類的重心之間(即根據(jù)各個內容的特性矢量計算出的滿意類的重心與不滿意類的重心)的直線的平面作為分離平面的方法。 另外,在NN法中,不一定求出分離平面,也可以將從不滿意類的重心連接到滿意類的重心 的直線作為用戶特性矢量。這里說明生成分離平面的具體方法。圖4是表示在手機100上顯示的菜單畫面的 一例的說明圖。如圖4所示顯示有節(jié)點1 節(jié)點5。該節(jié)點表示選擇對象項目,例如是針對 網(wǎng)頁上的菜單畫面中的每個類別而區(qū)分的項目,是網(wǎng)頁的標題。例如,節(jié)點1是有關汽車的 內容,節(jié)點2是有關金融的內容等。用戶通過選擇節(jié)點1 節(jié)點5中的任意一個節(jié)點,即可 閱覽對應的內容。圖5是表示生成分離平面時的處理概念的示意圖。圖5表示關于用戶在上述圖4 所示的菜單畫面中選擇的內容及未選擇的內容,各個內容的特性矢量在特征空間中的位置 關系。如圖5所示,利用圓形示出的部分是滿意的內容(節(jié)點3、節(jié)點4),利用三角形示出 的部分是不滿意的內容(節(jié)點1、節(jié)點2及節(jié)點5),利用四邊形示出的部分是未知的未評價 內容(節(jié)點8、節(jié)點7)。按照將這些滿意內容與不滿意內容分離開的方式生成的平面就是 分離平面。這里,在進行分離處理時不考慮未評價內容。另外,在圖中,為了方便而將特征 空間表述為二維平面,但由于存在構成矢量的參數(shù)那么多的矢量軸,所以通常特征空間是 由20維以上的矢量構成的。用戶特性矢量計算部204是計算與歷史類分離部203所生成的分離平面正交的正 交矢量,并將其作為用戶特性矢量的部分。圖6示出了其具體示例。圖6是表示根據(jù)分離 平面計算用戶特性矢量,再根據(jù)用戶特性矢量進行評價時的概念的示意圖。如圖6所示,由 用戶特性矢量計算部204計算與分離平面正交的正交矢量即用戶特性矢量W。用戶特性矢 量計算部204每當采集了閱覽歷史時進行計算,更新用戶特性矢量管理表207a中存儲的用 戶特性矢量。發(fā)布信息存儲部205是存儲作為發(fā)布對象的內容(推薦信息)及其管理信息的部 分,存儲了內容管理表205a。圖7是表示內容管理表205a的存儲內容的說明圖。如圖7所 示,在該內容管理表205a中將內容ID、類別、標題及推薦正文相對應地存儲。內容ID是用 于唯一地確定內容的識別信息,類別表示信息類型,例如是用于表示與CD相關聯(lián)、與DVD相 關聯(lián)、與書籍相關聯(lián)、與電視節(jié)目相關聯(lián)等的信息。標題是用于作為推薦信息進行顯示的標 題信息。在發(fā)布推薦信息時,將顯示該標題部分。推薦正文是推薦信息的主體部分,是對用 戶有用的信息。在該內容管理表205a中存儲的信息可以是由操作者預先輸入的信息,也可 以是從內容提供商自動搜索/提取并利用預定的過濾器精選后的信息。在由推薦請求接收部202接收到推薦請求時,內容評價部206根據(jù)由用戶特性矢 量計算部204計算的用戶特性矢量,對發(fā)布信息存儲部205中存儲的內容進行評價,然后, 生成按照評價從高到低的順序對內容的標題進行排列后的推薦信息。具體地講,該內容評 價部206計算用戶特性矢量與各個內容的特性矢量的內積,由此計算評價值,并生成按照 該評價值從高到低的順序對內容的標題進行排列后的推薦信息。從概念上講如下所述。例如,在圖6中,節(jié)點7和節(jié)點8是在內容管理表205a中 存儲的信息,被當作未知的內容。這里,從節(jié)點7和節(jié)點8向用戶特性矢量w引垂線而得到 的點是相對于用戶特性矢量w的評價點。按照如下方式生成推薦信息按照該垂線與用戶 特性矢量的交點的位置從上到下的順序來顯示內容(標題部分)。另外,也可以將分離平面作為基準設為顯示或不顯示。例如,也可以是下述的推薦信息,在把分離平面作為基準的情 況下,與從節(jié)點8引出的垂線的交點位于基準之上,所以判定為對于用戶而言評價較高,選 擇為推薦信息。另一方面,節(jié)點7位于基準之下,所以評價較低,不選擇為推薦信息。歷史存儲部207是存儲各個歷史信息的部分,存儲了用戶特性矢量管理表207a、 內容特性矢量管理表207b和閱覽歷史表207c。用戶特性矢量管理表207a是將用戶特性矢量計算部204計算出的用戶特性矢量 與用于確定用戶的用戶ID相對應地存儲的部分。內容特性矢量管理表207b是將內容管理表205a中存儲的內容的特性矢量與用于 確定該內容的信息(例如內容ID、URL等)相對應地存儲的部分。在用戶進行訪問時,由內 容請求接收部201與該內容一起取得該內容特性矢量,該內容特性矢量是在登記推薦信息 時由其操作者設定的。例如,在內容特性矢量管理表207b中存儲了圖8所示的信息。如圖 8所示,與內容ID相對應地存儲有構成特性矢量的多個參數(shù)。在圖8中示出了 8個參數(shù), 但通常由更多的參數(shù)構成特性矢量。另外,除了規(guī)定的參數(shù)之外,也可以把針對每個內容按 照詞素分析提取的關鍵詞追加為參數(shù)。對構成特性矢量的每個參數(shù)記述了 0 1之間的數(shù) 值,用于表示使哪個特性矢量具有特征。閱覽歷史表207c是存儲由內容請求接收部201接收到的收件人或者采集到的訪 問歷史信息的部分,例如,是將內容ID(或者內容的URL)及該內容(各個被閱覽的內容、未 被閱覽的內容)的特性矢量相對應地存儲的部分。該內容的特性矢量是與由內容請求接收 部201取得的內容同時取得的。內容發(fā)送部208是根據(jù)由內容請求接收部201接收到的內容請求、或者由推薦請 求接收部202接收到的推薦請求,發(fā)送所取得的內容的部分。例如,內容發(fā)送部208根據(jù) 由內容請求接收部201接收到的內容請求,發(fā)送所取得的內容,并且根據(jù)推薦請求接收部 202,發(fā)送基于發(fā)布信息存儲部205中存儲的內容而按照內容評價部206的評價結果生成的
推薦信息。這樣構成的信息發(fā)布服務器200能夠按照來自手機100的請求,發(fā)布根據(jù)用戶特 性矢量而評價的推薦信息。因此,不需要登記嗜好/興趣等信息,并且不需僅提取與所訪問 的內容直接相關聯(lián)的內容,即可沒有遺漏地發(fā)布推薦信息。下面說明手機100。圖9是表示手機100的功能結構的框圖。如圖9所示,手機 100構成為包括瀏覽器101、歷史發(fā)送部102、推薦請求發(fā)送部103及發(fā)布信息顯示部104。 該手機100由CPU、RAM、ROM等硬件構成,CPU構成為按照所存儲的程序進行工作。具體地 講,手機100具有與信息發(fā)布服務器200相同的結構,利用圖3所示的硬件結構實現(xiàn)。下面 說明各個構成部分。瀏覽器101是用于與互聯(lián)網(wǎng)連接的應用部分,用于使用戶能夠訪問在互聯(lián)網(wǎng)上配 置的站點,并閱覽站點中所保存的內容。該瀏覽器101構成為保存訪問歷史。歷史發(fā)送部102是發(fā)送使用瀏覽器101訪問的內容的訪問歷史(表示在同一菜單 畫面上選擇的內容及未選擇的內容的信息)的部分。另外,在信息發(fā)布服務器200側具有 每當進行訪問時采集歷史信息的功能的情況下,該歷史發(fā)送部102不是必須的構成要素。推薦請求發(fā)送部103是通過由用戶操作未圖示的操作部,向信息發(fā)布服務器200 發(fā)送用戶ID和推薦信息請求的部分。
發(fā)布信息顯示部104是顯示通過瀏覽器101取得的菜單畫面及內容(網(wǎng)頁)的部 分。這樣構成的手機100能夠使用瀏覽器101訪問互聯(lián)網(wǎng),同時保存其訪問歷史,歷史 發(fā)送部102能夠按照來自信息發(fā)布服務器200的請求或者按照預定的定時發(fā)送訪問歷史。下面,說明這些手機100及信息發(fā)布服務器200的動作。圖10是表示根據(jù)手機 100的請求來發(fā)布內容時的、手機100及信息發(fā)布服務器200的處理的時序圖。如圖10所示,根據(jù)來自手機100的瀏覽器101的請求,通過內容發(fā)送部208從信 息發(fā)布服務器200發(fā)布菜單畫面(SlOl)。手機100的用戶從該菜單畫面選擇任意一個內容 (相當于上述節(jié)點),手機100的瀏覽器101受理該選擇(S102),按照內容的連接請求及其 收件人向信息發(fā)布服務器200發(fā)送URL(S103)。在信息發(fā)布服務器200中,URL被內容請求接收部201接收,并作為訪問歷史存 儲在閱覽歷史表207c中。并且,根據(jù)該訪問歷史進行用戶特性矢量的計算并進行存儲 (S104)。然后,由內容發(fā)送部208從內容提供商(未圖示)取得基于在S103中進行了請求 的收件人的內容,并進行發(fā)布(S105)。另外,用戶特性矢量計算處理和內容發(fā)布處理的順序 也可以顛倒。這里,說明S104的用戶特性矢量計算的具體處理。圖11是表示用戶特性矢量計 算處理的流程圖。如圖11所示,首先,將內容請求接收部201接收到的訪問請求或者由訪 問歷史表示的訪問歷史信息作為新追加的訪問歷史存儲到閱覽歷史表207c中(S201)。并且,由歷史類分離部203根據(jù)在該閱覽歷史表207c中存儲的訪問歷史信息,提 取屬于各個滿意類或者不滿意類的內容的特性矢量(S202)。并且,由歷史類分離部203根 據(jù)這些特性矢量,生成用于將滿意類和不滿意類分離開的分離平面(S202)。然后,由用戶特 性矢量計算部204計算與所生成的分離平面正交的正交矢量,求出用戶特性矢量(S204)。 這里求出的用戶特性矢量被保存在用戶特性矢量管理表207a中,在發(fā)布推薦信息時,當評 價存儲在發(fā)布信息存儲部205中的內容時使用該用戶特性矢量。下面,說明在本實施方式中發(fā)布推薦信息時的該內容評價處理。圖12是發(fā)布推薦 信息時的時序圖。如圖12所示,由手機100的推薦請求發(fā)送部103發(fā)送包含用戶ID的推 薦請求,該推薦請求被信息發(fā)布服務器200中的推薦請求接收部202接收(S301)。并且,在 信息發(fā)布服務器200中,對發(fā)布信息存儲部205中存儲的內容進行內容評價(S302)。這里, 由內容評價部206按照用戶特性矢量進行評價,并生成按照評價從高到低的順序將內容的 標題進行排列后的推薦信息。并且,由內容發(fā)送部208發(fā)送這樣生成的推薦信息(S303)。這里,針對S302的內容評價處理進行更詳細的說明。圖13是表示內容評價處理 的流程圖。如圖13所示,由內容評價部206根據(jù)與推薦請求一起發(fā)送的用戶ID,從用戶特 性矢量管理表207a取得對應的用戶特性矢量(S401)。然后,由內容評價部206從內容特性 矢量管理表207b取得各個內容的特性矢量(S402)。并且,由內容評價部206計算用戶特性矢量與內容特性矢量的內積(S403)。按照 由內容評價部206計算的內積從大到小的順序,提取與內容管理表205a中存儲的內容ID 對應的標題,將該標題按照評價從高到低的順序進行排列,由此生成推薦信息。并且,由內 容發(fā)送部208向手機100發(fā)送所生成的推薦信息(S404)。這樣,能夠按照用戶特性矢量來提供推薦信息,能夠沒有遺漏地將推薦信息提供給用戶。<相對空間中的分離平面的生成>以上的分離平面生成方法是按照絕對空間中的內容特性矢量來進行的,但作為精 度更高的方法,也可以考慮利用求出相對位置關系的相對空間的方法。下面,說明使用相對 空間來生成分離平面的方法。另外,此時的處理結構與上述情況相同,只是歷史類分離部 203的處理內容不同。 圖14表示歷史事件a和歷史事件b的菜單畫面的結構示例,圖14 (a)是表示歷史 事件a的菜單畫面的圖,該菜單畫面由節(jié)點1 節(jié)點3構成。另外,圖14(b)是表示歷史事 件b的菜單畫面的圖,該菜單畫面由節(jié)點6 節(jié)點9構成。在圖14(a)中表示選擇了節(jié)點 3,在圖14(b)中表示選擇了節(jié)點9。圖15是表示在圖14所示的各個菜單畫面中選擇的內容特性矢量在特征空間中的 位置關系的圖。圖15(a)是表示在歷史事件a中選擇的內容的特征空間(絕對空間)的圖, 圖15(b)是表示在歷史事件b中選擇的內容的特征空間(絕對空間)的圖。與上述情況相 同,可以將被選擇的內容定義為滿意內容,將未被選擇的內容定義為不滿意內容,并分別分 類為滿意類、不滿意類。圖16是對于各個歷史事件a及b在同一特征空間上表示內容特性矢量的圖,是表 示相對空間的圖,該相對空間表示在將不滿意內容的特性矢量取為原點時的滿意內容的特 性矢量的位置。例如,為了進行節(jié)點2與節(jié)點3的相對比較、節(jié)點1與節(jié)點3的相對比較, 將表示分別以節(jié)點1、節(jié)點2為原點時的節(jié)點3的位置的特征空間作為相對空間。更具體地 講,從節(jié)點3的特性矢量中減去節(jié)點1的特性矢量,由此形成相對空間。對于其他節(jié)點也相 同,可以通過進行減去作為對象的內容的特性矢量的處理,來形成相對空間。在該相對空間中,如圖16所示,由歷史類分離部203根據(jù)這種滿意內容的特性矢 量、不滿意內容的特性矢量,生成用于分離為滿意類和不滿意類的分離平面。并且,由用戶 特性矢量計算部204計算與該分離平面正交的正交矢量即用戶特性矢量W。這樣,在歷史事件不同的情況下,也能夠利用相對空間生成用戶特性矢量,并生成 識別性能更高的用戶特性矢量。圖17是表示根據(jù)絕對空間中的各個內容的特性矢量進行評價時的概念的圖,例 如,根據(jù)所生成的用戶特性矢量,評價在發(fā)布信息存儲部205中存儲的未知的內容即節(jié)點 6 節(jié)點8。這里,與上述情況相同,內容評價部206可以計算用戶特性矢量與各個內容的 特性矢量的內積,由此計算其評價值。從概念上講與上述情況相同,投影在用戶特性矢量上 的點(即引出垂線的點)在該矢量方向上從上到下的順序確定了內容的優(yōu)先順序??梢赃@樣使用相對空間來生成分離平面,由此生成用戶特性矢量。另外,關于圖 15 圖17,當作絕對空間也能生成分離平面,但也要考慮到由不能生成分離平面的特性矢 量構成的特征空間。在這種情況下,可以利用上述的相對空間來生成分離平面。下面說明 這種方法。圖18(a)是表示絕對空間中的內容特性矢量的圖。在該圖18(a)中,以節(jié)點1和 節(jié)點4是存在于相同事件(菜單畫面)中的內容,節(jié)點2和節(jié)點3是存在于相同事件(菜 單畫面)中的內容為前提。另外,圓點表示被選擇的內容的特性矢量(滿意類),三角形表 示未被選擇的內容的特性矢量(不滿意類)。
根據(jù)圖18(a)可知,在絕對空間中,針對形成這種位置關系的特性矢量的內容,不 能生成分離平面。分離平面是用于將滿意類和不滿意類分離開的平面,在圖18(a)的示例 中無法將兩者分離開。因此,需要轉換為以能夠生成分離平面的方式表示相對位置關系的 相對空間。圖18(b)是表示相對空間中的內容特性矢量的圖,在圖18(b)的示例中,由于按照 使節(jié)點1和節(jié)點2處于相同位置的方式使節(jié)點2平移,所以使與節(jié)點2對應的節(jié)點3平移。 通過這樣轉換為相對空間,能夠生成將不滿意內容即節(jié)點1(節(jié)點2)與滿意內容即節(jié)點3 和節(jié)點4分離開的分離平面ν。在以上所述的絕對空間中不能生成分離平面的情況下,也能夠通過轉換為相對空 間來生成分離平面,從而能夠計算用戶特性矢量。<考慮了閱覽頻度的分離平面生成方法>下面,針對進行使用了內容閱覽頻度的加權處理,并使用該加權處理后的特性矢 量來生成分離平面時的歷史類分離部203的處理進行說明。另外,這里說明使用NN法的分 離平面生成。圖19是表示考慮閱覽頻度來求出特性矢量的重心的處理的概念圖,是表示用于 表現(xiàn)與節(jié)點A C對應的內容C1 C3的特性矢量的位置的特征空間的概念圖。內容C1的 閱覽頻度是3次,內容C2的閱覽頻度是1次,內容C3的閱覽頻度是10次。另外,閱覽歷史 表207c優(yōu)選存儲被閱覽的內容的閱覽歷史、未被閱覽的內容的未閱覽歷史,并需要以能夠 保持或計算的方式存儲各個頻度。在這種情況下,這些內容C1 C3的重心根據(jù)下式(1)進行計算。[式1]
權利要求
1.一種推薦信息評價裝置,其具有受理單元,其受理根據(jù)用戶操作從多個選擇對象項目中對一個選擇對象項目進行的選擇;存儲單元,其存儲由所述受理單元受理的被選擇的選擇對象項目的矢量即滿意特征矢 量、以及未被選擇的選擇對象項目的矢量即不滿意特征矢量;用戶特性矢量生成單元,其將與分離平面正交的正交矢量作為用戶特性矢量,該分離 平面用于在特征空間內將由所述存儲單元存儲的被選擇的選擇對象項目的滿意特征矢量 與未被選擇的選擇對象項目的不滿意特征矢量分離開;以及評價單元,其根據(jù)由所述用戶特性矢量生成單元生成的用戶特性矢量,進行未知的選 擇對象項目的評價。
2.根據(jù)權利要求1所述的推薦信息評價裝置,其還具有生成分離平面的分離平面生成 單元,該分離平面用于在特征空間內將由所述存儲單元存儲的被選擇的選擇對象項目的滿 意特征矢量與未被選擇的選擇對象項目的不滿意特征矢量分離開,所述用戶特性矢量生成單元按照由所述分離平面生成單元生成的分離平面,生成用戶 特性矢量。
3.根據(jù)權利要求2所述的推薦信息評價裝置,其中,所述分離平面生成單元計算所有 的不滿意特征矢量與滿意特征矢量之間的相對位置關系,同時以使得其他不滿意特征矢量 或者其他滿意特征矢量與一個不滿意特征矢量或者一個滿意特征矢量一致的方式來計算 位置關系,并根據(jù)該位置關系來生成分離平面。
4.根據(jù)權利要求2或3所述的推薦信息評價裝置,其中,所述分離平面生成單元根據(jù) SVM法生成分離平面。
5.根據(jù)權利要求1所述的推薦信息評價裝置,其中,所述用戶特性矢量生成單元根據(jù) NN法生成用戶特性矢量。
6.根據(jù)權利要求1 5中任意一項所述的推薦信息評價裝置,其中,所述存儲單元將選 擇對象項目的選擇頻度與該選擇對象項目的滿意特征矢量一起存儲,將選擇對象項目的不 選擇頻度與該選擇對象項目的不滿意特征矢量一起存儲,所述用戶特性矢量生成單元對所述選擇頻度高的滿意特征矢量進行與其頻度對應的 加權,同時對所述不選擇頻度高的不滿意特征矢量進行與其頻度對應的加權,根據(jù)包括該 加權后的滿意特征矢量及不滿意特征矢量在內的滿意特征矢量及不滿意特征矢量,生成用 戶特性矢量。
7.根據(jù)權利要求1 5中任意一項所述的推薦信息評價裝置,其中,所述存儲單元將選 擇對象項目的選擇時期與該選擇對象項目的滿意特征矢量一起存儲,所述分離平面生成單元根據(jù)按照選擇時期及不選擇時期的新近程度進行了加權的該 選擇對象項目的滿意特征矢量,生成用戶特性矢量。
8.根據(jù)權利要求1 7中任意一項所述的推薦信息評價裝置,其還具有推薦信息發(fā)送 單元,該推薦信息發(fā)送單元發(fā)送按照所述評價單元的評價結果而生成的推薦信息。
9.根據(jù)權利要求1 8中任意一項所述的推薦信息評價裝置,其中,所述選擇對象項目 是用于閱覽網(wǎng)頁的菜單畫面上的項目。
10.根據(jù)權利要求1 8中任意一項所述的推薦信息評價裝置,其中,所述選擇對象項目是用于執(zhí)行裝置的功能的操作菜單上的項目。
11. 一種推薦信息評價方法,該方法包括受理步驟,受理根據(jù)用戶操作從多個選擇對象項目中對一個選擇對象項目進行的選擇;存儲步驟,存儲通過所述受理步驟受理的被選擇的選擇對象項目的矢量即滿意特征矢 量、以及未被選擇的選擇對象項目的矢量即不滿意特征矢量;用戶特性矢量生成步驟,根據(jù)與分離平面正交的正交矢量生成用戶特性矢量,該分離 平面用于在特征空間內將通過所述存儲步驟存儲的被選擇的選擇對象項目的滿意特征矢 量與未被選擇的選擇對象項目的不滿意特征矢量分離開;以及評價步驟,根據(jù)通過所述用戶特性矢量生成步驟生成的用戶特性矢量,進行推薦信息 的評價。
全文摘要
本發(fā)明的目的在于,提供一種內容評價裝置及內容評價方法,能夠沒有遺漏地發(fā)布用戶潛在期望的內容。歷史類分離部(203)生成分離平面,該分離平面用于在特征空間內將閱覽歷史表(207c)中存儲的被選擇的內容的特性矢量與未被選擇的內容的特性矢量分離開。并且,用戶特性矢量計算部(204)根據(jù)與所生成的分離平面正交的正交矢量,生成用戶特性矢量,并將其存儲在用戶特性矢量管理表(207a)中。然后,在推薦請求接收部(202)接收到推薦請求時,內容評價部(206)根據(jù)所存儲的用戶特性矢量進行內容的評價。
文檔編號G06F17/30GK101999121SQ20098011224
公開日2011年3月30日 申請日期2009年4月2日 優(yōu)先權日2008年4月10日
發(fā)明者上野英俊, 倉掛正治, 原未來, 大野木碧, 小野木雅, 深澤佑介, 長沼武史 申請人:株式會社Ntt都科摩