欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

模糊匹配的節(jié)目選擇裝置及方法

文檔序號(hào):7622557閱讀:152來(lái)源:國(guó)知局
專利名稱:模糊匹配的節(jié)目選擇裝置及方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種節(jié)目選擇裝置及方法,和更具體地說(shuō),本發(fā)明涉及一種模糊匹配的節(jié)目選擇裝置及方法。
背景技術(shù)
現(xiàn)今,網(wǎng)絡(luò)技術(shù)、無(wú)線技術(shù)和有線技術(shù)的發(fā)展使得能為人們提供數(shù)量繁多、各種各樣的節(jié)目。例如,隨著衛(wèi)星電視和有線電視的普及,電視節(jié)目可以通過(guò)衛(wèi)星或有線電視渠道獲得,相關(guān)技術(shù)發(fā)展使電視頻道日益增加,電視節(jié)目的數(shù)量在不斷攀升,這為人們提供了多彩生活,但同時(shí)也帶來(lái)了一些問(wèn)題,例如,如何從眾多的節(jié)目,如電視節(jié)目中選出與個(gè)人喜歡相關(guān)的節(jié)目,如何為用戶推薦適合其個(gè)人喜好的節(jié)目。因?yàn)椋瑢?duì)于個(gè)人而言,其時(shí)間是有限的,愛(ài)好又各有不同,用戶多是在自己有限時(shí)間內(nèi)選擇那些個(gè)人喜好的節(jié)目,現(xiàn)在選擇電視節(jié)目時(shí)一般是通過(guò)遙控器手工選擇頻道,具有一定的盲目性,也不能推薦節(jié)目,現(xiàn)有技術(shù)中雖然有一些向用戶推薦節(jié)目的技術(shù),但存在處理的信息量較大、速度較慢,不能有效地提供用戶喜好節(jié)目的缺點(diǎn),等。
因此,需要一種節(jié)目選擇裝置,它能克服現(xiàn)有技術(shù)中存在的缺點(diǎn),能夠快速、有效地為用戶提供其喜好的節(jié)目選擇,能夠向用戶推薦與其喜好相關(guān)的節(jié)目。

發(fā)明內(nèi)容
本發(fā)明的一個(gè)目的是提供一種節(jié)目選擇裝置,它能克服現(xiàn)有技術(shù)中存在的上述缺點(diǎn),能夠快速、有效地為用戶提供其喜好的節(jié)目選擇,能向用戶推薦與其喜好相關(guān)的節(jié)目。
本發(fā)明的一個(gè)目的是提供一種節(jié)目選擇方法,它能克服現(xiàn)有技術(shù)中存在的缺點(diǎn),能夠快速、有效地為用戶提供其喜好的節(jié)目選擇,能向用戶推薦與其喜好相關(guān)的節(jié)目。
本發(fā)明提供一種節(jié)目選擇裝置,所述裝置包括個(gè)人語(yǔ)料單元,包括個(gè)人語(yǔ)料庫(kù)制作單元,用于根據(jù)用戶所選節(jié)目?jī)?nèi)容制作用戶的個(gè)人語(yǔ)料庫(kù),和個(gè)人語(yǔ)料庫(kù)保存單元,用于保存所述個(gè)人語(yǔ)料庫(kù);媒體單元,包括媒體庫(kù)保存單元,用于保存媒體庫(kù),所述媒體庫(kù)包括媒體信息和內(nèi)容;公共語(yǔ)料單元,包括公共語(yǔ)料庫(kù)保存單元,用于保存公共語(yǔ)料庫(kù);人機(jī)交互單元,用于用戶輸入和取得信息;節(jié)目選擇單元,所述節(jié)目選擇單元與所述個(gè)人語(yǔ)料單元、媒體單元、公共語(yǔ)料單元和人機(jī)交互單元相連,根據(jù)從所述個(gè)人語(yǔ)料單元和/或人機(jī)交互單元輸入的信息,根據(jù)媒體單元和公共語(yǔ)料單元輸入的信息,從所述媒體庫(kù)抽取與所述個(gè)人語(yǔ)料庫(kù)中的信息和/或人機(jī)交互單元輸入的信息相關(guān)的信息,根據(jù)從所述媒體庫(kù)抽取的所述信息,從所述媒體庫(kù)中選出與所述個(gè)人語(yǔ)料庫(kù)和/或人機(jī)交互單元輸入信息相關(guān)的節(jié)目。
在本發(fā)明的節(jié)目選擇裝置,所述人機(jī)交互單元包括用戶關(guān)鍵字輸入單元,用戶在用戶關(guān)鍵字輸入單元輸入關(guān)鍵字,所述節(jié)目選擇單元根據(jù)輸入的關(guān)鍵字,從所述媒體庫(kù)中抽取與所述關(guān)鍵字相關(guān)的信息,并據(jù)此從所述媒體庫(kù)中選出相關(guān)的節(jié)目,推薦給用戶。
在本發(fā)明的節(jié)目選擇裝置,所述用戶關(guān)鍵字輸入單元與個(gè)人語(yǔ)料庫(kù)保存單元相連,用戶能輸入關(guān)鍵字對(duì)所述個(gè)人語(yǔ)料庫(kù)中的信息進(jìn)行更新,添加,和/或刪減。
在本發(fā)明的節(jié)目選擇裝置,所述人機(jī)交互單元包括匹配參數(shù)設(shè)定單元,與所述節(jié)目選擇單元相連,向所述節(jié)目選擇單元提供匹配參數(shù),所述節(jié)目選擇單元根據(jù)所述匹配參數(shù)從所述媒體庫(kù)抽取相關(guān)信息,進(jìn)而選出相關(guān)節(jié)目推薦給用戶。所述匹配參數(shù)包括匹配用詞的數(shù)目、和/或模糊匹配率,所述節(jié)目選擇單元根據(jù)匹配用詞的數(shù)目、和/或模糊匹配率調(diào)節(jié)所推薦節(jié)目的精度。
在本發(fā)明的節(jié)目選擇裝置,所述媒體單元還包括媒體庫(kù)制作單元,用于根據(jù)節(jié)目信息和內(nèi)容制作媒體庫(kù)。所述公共語(yǔ)料單元還包括公共語(yǔ)料庫(kù)制作單元,用于制作公共語(yǔ)料庫(kù),其中,所述公共語(yǔ)料庫(kù)包含定量計(jì)算的詞與詞的相似度。
在本發(fā)明的節(jié)目選擇裝置,所述個(gè)人語(yǔ)料庫(kù)制作單元對(duì)用戶所選節(jié)目的節(jié)目?jī)?nèi)容進(jìn)行切分,得到詞序列,計(jì)算詞的詞頻和詞的倒文檔頻率,并且根據(jù)所述詞頻和倒文檔頻率計(jì)算詞的特征權(quán)重,取特征權(quán)重較大的詞放入所述個(gè)人語(yǔ)料庫(kù)。
在本發(fā)明的節(jié)目選擇裝置,節(jié)目選擇單元,基于tf-idf方法計(jì)算在所述媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的詞相對(duì)于所述媒體庫(kù)中的節(jié)目的權(quán)重,計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下在所述媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的所述詞出現(xiàn)的概率,并以二者為基礎(chǔ)計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下所述媒體庫(kù)中的節(jié)目出現(xiàn)的概率,從而據(jù)此從所述媒體庫(kù)的節(jié)目中選出用戶喜好的節(jié)目。
本發(fā)明提供一種節(jié)目選擇的方法,所述方法包括步驟制作個(gè)人語(yǔ)料庫(kù),根據(jù)用戶所選節(jié)目的節(jié)目?jī)?nèi)容制作用戶的個(gè)人語(yǔ)料庫(kù);保存?zhèn)€人語(yǔ)料庫(kù),用來(lái)保存所述個(gè)人語(yǔ)料庫(kù);制作或訪問(wèn)媒體,所述媒體庫(kù)包含媒體信息和內(nèi)容;保存媒體庫(kù);制作或訪問(wèn)公共語(yǔ)料庫(kù);保存公共語(yǔ)料庫(kù);節(jié)目選擇,根據(jù)來(lái)自所述個(gè)人語(yǔ)料庫(kù)、媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入信息,從所述媒體庫(kù)中抽取與所述個(gè)人語(yǔ)料庫(kù)中的信息相關(guān)的信息,根據(jù)從所述媒體庫(kù)抽取的所述信息從所述媒體庫(kù)中選出用戶喜好的節(jié)目。
本發(fā)明的節(jié)目選擇方法,進(jìn)一步包括由用戶輸入信息的步驟,在所述節(jié)目選擇步驟,根據(jù)來(lái)自所述個(gè)人語(yǔ)料庫(kù)的信息和/或用戶輸入的信息,根據(jù)媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入信息,從所述媒體庫(kù)中抽取與所述個(gè)人語(yǔ)料庫(kù)中的信息和/或用戶輸入信息相關(guān)的信息,據(jù)此從所述媒體庫(kù)中選出用戶喜好的節(jié)目,推薦給用戶。
本發(fā)明的節(jié)目選擇方法,所述用戶輸入信息的步驟包括用戶輸入關(guān)鍵字的步驟,在所述節(jié)目選擇步驟,根據(jù)輸入的關(guān)鍵字,從所述媒體庫(kù)中抽取與所述關(guān)鍵字相關(guān)的信息,并據(jù)此從所述媒體庫(kù)中選出相關(guān)的節(jié)目,推薦給用戶。
本發(fā)明的節(jié)目選擇方法,所述用戶輸入關(guān)鍵字的步驟包括根據(jù)用戶輸入的關(guān)鍵字對(duì)所述個(gè)人語(yǔ)料庫(kù)中的信息進(jìn)行更新,添加,和/或刪減的步驟。
本發(fā)明的節(jié)目選擇方法,所述用戶輸入信息的步驟包括輸入匹配參數(shù)的步驟,在所述節(jié)目選擇的步驟,根據(jù)所述匹配參數(shù)從所述媒體庫(kù)抽取相關(guān)信息,進(jìn)而選出相關(guān)節(jié)目推薦給用戶。在輸入匹配參數(shù)的步驟,輸入的所述匹配參數(shù)包括匹配用詞的數(shù)目、和/或模糊匹配率,和在所述節(jié)目選擇步驟根據(jù)匹配用詞的數(shù)目、和/或模糊匹配率調(diào)節(jié)所推薦節(jié)目的精度。
在本發(fā)明的節(jié)目選擇方法,所述方法還包括制作媒體庫(kù)的步驟,在保存所述媒體庫(kù)的步驟之前,根據(jù)節(jié)目信息和內(nèi)容制作所述媒體庫(kù)。在所述保存公共語(yǔ)料庫(kù)步驟之前還包括制作公共語(yǔ)料庫(kù)的步驟,其中該步驟包括定量計(jì)算詞與詞相似度的步驟,所述公共語(yǔ)料庫(kù)包含詞與詞的相似度。
在本發(fā)明的節(jié)目選擇方法,所述制作個(gè)人語(yǔ)料庫(kù)的步驟進(jìn)一步包括對(duì)用戶所選節(jié)目?jī)?nèi)容進(jìn)行切分,得到詞序列,計(jì)算所述詞的詞頻和所述詞的倒文檔頻率,根據(jù)所述詞頻和倒文檔頻率計(jì)算所述詞的特征權(quán)重,取特征權(quán)重較大的詞放入所述個(gè)人語(yǔ)料庫(kù)的步驟。
在本發(fā)明的節(jié)目選擇方法,所述節(jié)目選擇步驟進(jìn)一步包括,基于if-idf方法計(jì)算在所述媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的詞相對(duì)于所述媒體庫(kù)中節(jié)目的權(quán)重,計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下在所述媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的所述詞出現(xiàn)的概率,進(jìn)而在此基礎(chǔ)上計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下所述媒體庫(kù)中的節(jié)目出現(xiàn)的概率,從而據(jù)此從所述媒體庫(kù)的節(jié)目中選出用戶喜好的節(jié)目的步驟。
與現(xiàn)有技術(shù)相比,本發(fā)明的節(jié)目選擇裝置及方法,能克服現(xiàn)有技術(shù)中存在的缺點(diǎn),快速、有效地為用戶提供其喜好的節(jié)目選擇,能向用戶推薦與其喜好相關(guān)的節(jié)目。尤其是本發(fā)明的節(jié)目選擇裝置和方法,包含了匹配用參數(shù)的設(shè)定,其效果表現(xiàn)為當(dāng)用戶設(shè)定數(shù)目比較少的關(guān)鍵字,同時(shí)設(shè)定的模糊匹配率低的情況下,節(jié)目選擇單元推薦的電視節(jié)目更接近于用戶的個(gè)人愛(ài)好,也即只有和用戶個(gè)人愛(ài)好關(guān)系密切的節(jié)目才會(huì)被推薦出來(lái)。當(dāng)用戶設(shè)定比較多的關(guān)鍵字,同時(shí)設(shè)定的模糊匹配率比較高的情況下,節(jié)目推薦的效果不如前者好,但節(jié)目涵蓋的范圍將會(huì)更大。因此,通過(guò)匹配參數(shù)的設(shè)定,我們可以通過(guò)節(jié)目選擇單元推薦不同匹配精度的電視節(jié)目。


圖1示出本發(fā)明的節(jié)目選擇裝置的示意圖;
圖2示出制作根據(jù)本發(fā)明一個(gè)實(shí)施方案的個(gè)人語(yǔ)料庫(kù)構(gòu)建流程的示意圖;圖3示出根據(jù)本發(fā)明的一個(gè)實(shí)施方案節(jié)目選擇單元基于貝葉斯網(wǎng)的拓樸結(jié)構(gòu)選擇節(jié)目的示意圖;圖4示意性地示出本發(fā)明節(jié)目選擇裝置的幾個(gè)實(shí)施例;圖5示出根據(jù)本發(fā)明一個(gè)實(shí)施例的節(jié)目選擇裝置的示意圖;和圖6示出本發(fā)明的節(jié)目選擇方法流程的示意圖。
具體實(shí)施例方式
圖1示出根據(jù)本發(fā)明一個(gè)實(shí)施方案的節(jié)目選擇裝置的示意圖。如圖1所示,本發(fā)明的節(jié)目選擇裝置100可包括個(gè)人語(yǔ)料單元1,媒體單元2,公共語(yǔ)料單元3和節(jié)目選擇單元4。其中,個(gè)人語(yǔ)料單元1可包括個(gè)人語(yǔ)料庫(kù)制作單元11,用于根據(jù)用戶所選節(jié)目?jī)?nèi)容制作用戶的個(gè)人語(yǔ)料庫(kù),和個(gè)人語(yǔ)料庫(kù)保存單元12,用于保存?zhèn)€人語(yǔ)料庫(kù);媒體單元2可包括保存媒體庫(kù)的媒體庫(kù)保存單元22;公共語(yǔ)料單元3可包括保存公共語(yǔ)料庫(kù)的公共語(yǔ)料庫(kù)保存單元32。個(gè)人語(yǔ)料單元1、媒體單元2和公共語(yǔ)料單元3與節(jié)目選擇單元4相連,節(jié)目選擇單元4根據(jù)從個(gè)人語(yǔ)料單元1、媒體單元2和公共語(yǔ)料單元3的輸入,從媒體庫(kù)抽取與個(gè)人語(yǔ)料庫(kù)中的信息相關(guān)的信息,包括與個(gè)人語(yǔ)料庫(kù)的詞相關(guān)的媒體庫(kù)的詞,并根據(jù)從媒體庫(kù)抽取的信息從媒體庫(kù)中選出與個(gè)人語(yǔ)料庫(kù)相關(guān)的節(jié)目。
繼續(xù)參照?qǐng)D1,本發(fā)明的節(jié)目選擇裝置100,還可包括人機(jī)交互單元5,用戶可通過(guò)人機(jī)交互單元5輸入和取得信息。節(jié)目選擇單元4與人機(jī)交互單元5相連,根據(jù)從個(gè)人語(yǔ)料單元1和/或人機(jī)交互單元5輸入的信息,并根據(jù)媒體單元2和公共語(yǔ)料單元3輸入的信息,從媒體庫(kù)抽取與個(gè)人語(yǔ)料庫(kù)中的信息和/或人機(jī)交互單元5輸入的信息相關(guān)的信息,進(jìn)而根據(jù)從媒體庫(kù)抽取的信息,從所述媒體庫(kù)中選出與所述個(gè)人語(yǔ)料庫(kù)和/或人機(jī)交互單元輸入信息相關(guān)的節(jié)目。
繼續(xù)參照?qǐng)D1,在本發(fā)明的一個(gè)實(shí)施方案,節(jié)目選擇裝置可包括人機(jī)交互單元5媒體單元2,公共語(yǔ)料單元3以及節(jié)目選擇單元4。其中,人機(jī)交互單元5可以包括用戶關(guān)鍵字輸入單元51,與節(jié)目選擇單元4相連,如圖1中“①”所示。用戶可在關(guān)鍵字輸入單元51中輸入用戶感興趣的關(guān)鍵字,這些關(guān)鍵字作為輸入信息直接進(jìn)入節(jié)目選擇單元,節(jié)目選擇單元4根據(jù)用戶輸入的關(guān)鍵字從媒體庫(kù)抽取與輸入的關(guān)鍵字相關(guān)的信息,包括與輸入關(guān)鍵字相關(guān)的媒體庫(kù)中的詞,并根據(jù)從媒體庫(kù)抽取的信息從媒體庫(kù)中選出與輸入關(guān)鍵字相關(guān)的節(jié)目,推薦給用戶。
繼續(xù)參照?qǐng)D1,在本發(fā)明另一個(gè)實(shí)施方案中,節(jié)目選擇裝置包括用戶關(guān)鍵字輸入單元51,個(gè)人語(yǔ)料單元1,媒體單元2,公共語(yǔ)料單元3,以及節(jié)目選擇單元4。其中,人機(jī)交互單元5的用戶關(guān)鍵字輸入單元51可與個(gè)人語(yǔ)料單元1的個(gè)人語(yǔ)料庫(kù)保存單元12相連,如圖1中“⑦”所示。用戶可從個(gè)人語(yǔ)料單元1獲取一些信息,如個(gè)人語(yǔ)料庫(kù)中的詞,然后通過(guò)用戶關(guān)鍵字輸入單元51可對(duì)個(gè)人語(yǔ)料庫(kù)中這些信息或詞進(jìn)行修改、修正,可將用戶輸入的關(guān)鍵字作為新詞添加進(jìn)個(gè)人語(yǔ)料保存單元12保存的個(gè)人語(yǔ)料庫(kù)中,也可刪除原來(lái)在個(gè)人語(yǔ)料保存單元12中的信息或詞。在本實(shí)施方案中,個(gè)人語(yǔ)料單元1、媒體單元2和公共語(yǔ)料單元3與節(jié)目選擇單元4相連,如圖1中“⑤”,“②”,和“③”所示,節(jié)目選擇單元4根據(jù)從個(gè)人語(yǔ)料單元1、媒體單元2和公共語(yǔ)料單元3的輸入,從媒體庫(kù)抽取與個(gè)人語(yǔ)料庫(kù)中的信息相關(guān)的信息,包括與更新后的個(gè)人語(yǔ)料庫(kù)的詞相關(guān)的媒體庫(kù)的詞,并根據(jù)從媒體庫(kù)抽取的信息從媒體庫(kù)中選出與個(gè)人語(yǔ)料庫(kù)相關(guān)的節(jié)目。
在本實(shí)施方案中,用戶可以將自己感興趣的電視節(jié)目的特征以關(guān)鍵字的形式輸入,取代個(gè)人語(yǔ)料單元1,為節(jié)目選擇單元4直接提供個(gè)人愛(ài)好信息。節(jié)目選擇單元4根據(jù)用戶輸入的關(guān)鍵字與媒體單元的輸入的節(jié)目進(jìn)行模糊匹配,推薦節(jié)目給用戶。
還參照?qǐng)D1,在本發(fā)明的另一個(gè)實(shí)施方案中,節(jié)目選擇裝置100的人機(jī)交互單元5還可包括匹配參數(shù)設(shè)定單元52,可與節(jié)目選擇單元4相連,如圖1的“④”所示。匹配參數(shù)設(shè)定單元52可用來(lái)設(shè)定節(jié)目選擇參數(shù),用戶通過(guò)該單元可以根據(jù)需要設(shè)定一些匹配參數(shù),如可由用戶輸入匹配參數(shù),提供給節(jié)目選擇單元4,節(jié)目選擇單元4根據(jù)輸入的匹配參數(shù),選擇節(jié)目向用戶推薦。
在本發(fā)明中,匹配參數(shù)設(shè)定單元52設(shè)定的匹配參數(shù)可以是匹配用單詞數(shù)目。在一個(gè)實(shí)施例中,節(jié)目選擇單元5根據(jù)用戶設(shè)定的匹配用單詞的數(shù)目可調(diào)節(jié)由個(gè)人語(yǔ)料單元1進(jìn)入節(jié)目選擇單元4的進(jìn)行節(jié)目選擇的單詞(查詢?cè)~)的數(shù)目,也就是說(shuō)節(jié)目選擇單元4從個(gè)人語(yǔ)料庫(kù)選取匹配用單詞數(shù)目這個(gè)參數(shù)所定數(shù)目的詞,來(lái)與媒體庫(kù)中的節(jié)目進(jìn)行匹配,從中選取用戶喜愛(ài)的節(jié)目。而在另一個(gè)實(shí)施例,在用戶直接輸入關(guān)鍵字,節(jié)目選擇單元4根據(jù)關(guān)鍵字進(jìn)行節(jié)目匹配的情況下,所設(shè)定的匹配用單詞的數(shù)目可用來(lái)調(diào)節(jié)用戶關(guān)鍵字輸入單元51輸入到節(jié)目選擇單元4的關(guān)鍵字中有多少個(gè)參與節(jié)目選擇。在本發(fā)明中,用戶可通過(guò)匹配用單詞數(shù)目設(shè)定了最后用于匹配的和個(gè)人愛(ài)好有關(guān)的單詞的數(shù)目,顯然,不同的匹配用單詞數(shù)目將會(huì)影響節(jié)目選擇的精度。
在本發(fā)明的另一實(shí)施例,匹配參數(shù)設(shè)定單元52設(shè)定的匹配參數(shù)可以是模糊匹配率,用戶可通過(guò)模糊匹配率設(shè)定模糊匹配和精確匹配的權(quán)重比例。如節(jié)目選擇單元可根據(jù)用戶輸入的模糊匹配率,從公共語(yǔ)料庫(kù)找出一些與個(gè)人語(yǔ)料庫(kù)中的詞或輸入的關(guān)鍵字相比符合要求的,作為查詢?cè)~,來(lái)從媒體庫(kù)中選擇匹配的節(jié)目進(jìn)行推薦。因此,可見(jiàn)模糊匹配率也可用來(lái)調(diào)整節(jié)目選擇單元選擇節(jié)目或進(jìn)行節(jié)目匹配的精度。在本發(fā)明中,模糊匹配率類似于詞的相關(guān)度。
顯然,在本發(fā)明中,匹配參數(shù)包括一些能調(diào)節(jié)所推薦節(jié)目的精度的參數(shù),如匹配用詞的數(shù)目、和/或模糊匹配率,等等。節(jié)目選擇單元可以根據(jù)匹配參數(shù)從個(gè)人語(yǔ)料庫(kù)、用戶輸入關(guān)鍵字,甚至從公共語(yǔ)料庫(kù)中選出作為查詢?cè)~的詞來(lái)進(jìn)行節(jié)目匹配,進(jìn)而推薦給用戶。
下面繼續(xù)結(jié)合圖1給出兩個(gè)例子。
例一,用戶可直接輸入關(guān)鍵字。由用戶關(guān)鍵字輸入單元51輸入用戶關(guān)鍵字;用戶關(guān)鍵字經(jīng)由①進(jìn)入節(jié)目選擇單元4;由媒體單元2提供媒體節(jié)目信息,經(jīng)由②作為節(jié)目單元4的候選節(jié)目;由公共語(yǔ)料單元3提供公共Corpus信息,經(jīng)由③進(jìn)入節(jié)目選擇單元4;節(jié)目選擇單元4根據(jù)用戶輸入單元輸入的關(guān)鍵字,從候選節(jié)目單(來(lái)自于媒體單元2)中選出推薦的節(jié)目;節(jié)目選擇單元4推薦的節(jié)目經(jīng)由⑥,進(jìn)入個(gè)人語(yǔ)料庫(kù)制作單元11,更新個(gè)人語(yǔ)料庫(kù)保存單元12。
例二,用戶輸入關(guān)鍵字和個(gè)人語(yǔ)料庫(kù)混和工作。個(gè)人語(yǔ)料庫(kù)制作單元11根據(jù)用戶看過(guò)的電視節(jié)目生成個(gè)人語(yǔ)料庫(kù),并保存在保存單元12;用戶在用戶輸入關(guān)鍵字單元中對(duì)個(gè)人語(yǔ)料庫(kù)保存單元12中的信息進(jìn)行修正(圖中⑦);添加新的關(guān)鍵字進(jìn)入個(gè)人語(yǔ)料保存單元12中和刪除個(gè)人語(yǔ)料保存單元12中的無(wú)用的關(guān)鍵字;個(gè)人語(yǔ)料保存單元12中關(guān)鍵字、詞或信息經(jīng)由⑤進(jìn)入節(jié)目選擇單元4;由媒體單元2提供媒體節(jié)目信息,經(jīng)由②作為節(jié)目單元4的候選節(jié)目;由公共語(yǔ)料單元3提供公共Corpus信息,經(jīng)由③進(jìn)入節(jié)目選擇單元4;節(jié)目選擇單元4根據(jù)用戶輸入單元輸入的關(guān)鍵字,從候選節(jié)目單(源于媒體單元2)中選出推薦的節(jié)目;節(jié)目選擇單元4推薦的節(jié)目經(jīng)由⑥,進(jìn)入個(gè)人語(yǔ)料庫(kù)制作單元11,更新個(gè)人語(yǔ)料庫(kù)保存單元12。
顯然,在這兩個(gè)例子中都可以通過(guò)匹配參數(shù)設(shè)定單元52設(shè)定節(jié)目選擇單元4中節(jié)目選擇或節(jié)目匹配的參數(shù),以改變節(jié)目選擇的精度。
在本發(fā)明的節(jié)目選擇裝置,媒體單元2還可包括制作媒體庫(kù)的媒體庫(kù)制作單元21,在媒體庫(kù)保存單元22之前,根據(jù)媒體信息和內(nèi)容制作,即構(gòu)建和更新媒體庫(kù);公共語(yǔ)料單元3還可包括構(gòu)建和更新公共語(yǔ)料庫(kù)的公共語(yǔ)料庫(kù)制作單元31,位于公共語(yǔ)料庫(kù)保存單元32之前。
在本發(fā)明的節(jié)目選擇裝置中,個(gè)人語(yǔ)料庫(kù)制作單元11可從個(gè)人經(jīng)常選擇的節(jié)目,如??吹碾娨暪?jié)目中,抽取節(jié)目信息和內(nèi)容來(lái)構(gòu)建個(gè)人愛(ài)好的個(gè)人語(yǔ)料庫(kù),換言之,個(gè)人語(yǔ)料保存單元12中保存的個(gè)人語(yǔ)料庫(kù)可包含個(gè)人經(jīng)常選擇的節(jié)目?jī)?nèi)容。媒體單元2中的媒體庫(kù)可主要包含節(jié)目信息,如節(jié)目名稱、時(shí)間和內(nèi)容,等等。媒體庫(kù)可由用戶從網(wǎng)上下載,也可由媒體庫(kù)制作單元21制作。媒體庫(kù)制作單元21首先對(duì)媒體信息的格式進(jìn)行定義,并對(duì)媒體內(nèi)容文本進(jìn)行切分,并以和公共Corpus相同的結(jié)構(gòu)組織進(jìn)媒體庫(kù)保存單元22。公共語(yǔ)料單元3中的公共語(yǔ)料庫(kù)可通過(guò)訓(xùn)練大量的文本、詞匯,包括節(jié)目,如電視節(jié)目文本來(lái)構(gòu)建的。在公共語(yǔ)料庫(kù)中,詞與詞之間可有兩種關(guān)系縱向關(guān)系和橫向關(guān)系,并且還可引入詞與詞之間的定量關(guān)系。在本發(fā)明的節(jié)目選擇裝置中,個(gè)人語(yǔ)料單元1,媒體單元2和公共語(yǔ)料單元3可并列處理,節(jié)目選擇單元4可包括貝葉斯網(wǎng)絡(luò)的匹配引擎,主要用于計(jì)算個(gè)人愛(ài)好庫(kù),如個(gè)人語(yǔ)料庫(kù)與媒體庫(kù)中每個(gè)電視節(jié)目的相關(guān)性,并根據(jù)計(jì)算所得的相關(guān)性選出用戶喜好的節(jié)目并為用戶推薦節(jié)目。
在本發(fā)明的節(jié)目選擇裝置,可包括自然語(yǔ)言處理引擎(未示出),主要用來(lái)對(duì)反映節(jié)目?jī)?nèi)容的文本進(jìn)行切分。例如節(jié)目?jī)?nèi)容為霍根班德(1978.3.14-)荷蘭男子游泳運(yùn)動(dòng)員,霍根班德在1999年土耳其伊斯坦布爾進(jìn)行的歐洲游泳錦標(biāo)賽上取得歷史性突破,堪稱霍根班德的成名戰(zhàn),在這次比賽中他一人獨(dú)得50米蝶泳、50米自由泳、10……。切分結(jié)果荷蘭男子游泳運(yùn)動(dòng)員土耳其伊斯坦布爾歐洲游泳錦標(biāo)賽歷史性突破成名比賽人蝶泳自由泳。在本發(fā)明的節(jié)目選擇裝置中,自然語(yǔ)言處理引擎既可實(shí)現(xiàn)對(duì)中文的切分又可支持對(duì)日文的切分,而且,自然語(yǔ)言處理引擎即可設(shè)置成一個(gè)獨(dú)立的單元,放置在三個(gè)并列的個(gè)人語(yǔ)料單元1、媒體單元2和公共語(yǔ)料單元3之前,也可分別設(shè)置成被包含在個(gè)人語(yǔ)料庫(kù)制作單元11、媒體庫(kù)制作單元21和公共語(yǔ)料庫(kù)制作單元31之中,以便可通過(guò)切分的詞來(lái)分別構(gòu)建個(gè)人語(yǔ)料庫(kù)、媒體庫(kù)和公共語(yǔ)料庫(kù)。另外,在本發(fā)明中,由于節(jié)目?jī)?nèi)容中經(jīng)常出現(xiàn)新詞,自然語(yǔ)言處理引擎還可設(shè)計(jì)包含基于概率模型的自學(xué)式“Self-Study”新詞切分系統(tǒng),以有效地支持新詞的識(shí)別,使個(gè)人語(yǔ)料庫(kù)制作單元11、媒體庫(kù)制作單元21和公共語(yǔ)料庫(kù)制作單元31可對(duì)構(gòu)建的個(gè)人語(yǔ)料庫(kù)、媒體庫(kù)和公共語(yǔ)料庫(kù)進(jìn)行更新。
在本發(fā)明的節(jié)目選擇裝置,個(gè)人語(yǔ)料庫(kù)制作單元1制作的個(gè)人語(yǔ)料(Corpus)庫(kù)可通過(guò)個(gè)人經(jīng)常選擇的節(jié)目,如??吹碾娨暪?jié)目來(lái)構(gòu)建和更新。例如,可通過(guò)節(jié)目文本,如在網(wǎng)上給出的電視節(jié)目名稱和一段有關(guān)電視節(jié)目的描述內(nèi)容來(lái)構(gòu)建和更新。
圖2示出制作個(gè)人語(yǔ)料庫(kù)的示意圖。如圖2所示,在本發(fā)明的節(jié)目選擇裝置,個(gè)人語(yǔ)料庫(kù)制作單元2可先對(duì)輸入的文本形式節(jié)目信息和內(nèi)容進(jìn)行自然語(yǔ)言處理(框101),再對(duì)節(jié)目文本進(jìn)行特征提取(框102),從用戶看過(guò)的節(jié)目中抽取出最能反映節(jié)目?jī)?nèi)容的關(guān)鍵單詞,然后用提取的特征來(lái)構(gòu)建個(gè)人語(yǔ)料庫(kù)。
在本發(fā)明的一個(gè)實(shí)施方案,個(gè)人語(yǔ)料庫(kù)制作單元1提取文本特征可通過(guò)tf-idf方法進(jìn)行,如通過(guò)tf-idf方法從用戶看過(guò)的節(jié)目中抽取出最能反映節(jié)目?jī)?nèi)容的關(guān)鍵詞,并用其構(gòu)建用戶的個(gè)人語(yǔ)料庫(kù)。
在本發(fā)明的一個(gè)的實(shí)施方案,個(gè)人語(yǔ)料庫(kù)制作單元1通過(guò)tf-idf方法進(jìn)行特征提取可包括(1)計(jì)算切分得到詞的詞頻tfij,在本說(shuō)明書(shū)中,詞頻指詞在文檔(文本)中的頻率,tfij表示第i個(gè)詞在第j篇文檔中出現(xiàn)的次數(shù);(2)計(jì)算詞的倒文檔頻率idfi,對(duì)在詞集合中的第i個(gè)詞,idfi被定義為idfi=1g(N/ni)+1,其中N是集合中的文檔數(shù),ni是包含第i個(gè)詞的文檔數(shù);(3)計(jì)算詞的特征權(quán)重,特征權(quán)重=tfij×idfi。然后,在個(gè)人語(yǔ)料庫(kù)制作單元1,可提取特征權(quán)重--tfij×idfi值較大的詞作為文本特征,將其放在一起來(lái)構(gòu)建個(gè)人語(yǔ)料庫(kù),也可以說(shuō)是將用戶看過(guò)的描述電視節(jié)目?jī)?nèi)容的文檔中那些tfij×idfi值較大的詞放在一起,來(lái)構(gòu)建個(gè)人語(yǔ)料庫(kù)。在本實(shí)施方案中,個(gè)人語(yǔ)料庫(kù)制作單元1可通過(guò)對(duì)用戶所選節(jié)目?jī)?nèi)容進(jìn)行切分得到詞序列,或稱詞集合,計(jì)算詞序列中詞的詞頻和倒文檔頻率,并根據(jù)詞的詞頻和倒文檔頻率計(jì)算詞的特征權(quán)重,將特征權(quán)重較大的詞放入個(gè)人語(yǔ)料庫(kù),從而構(gòu)建或更新個(gè)人語(yǔ)料庫(kù)。
繼續(xù)參照?qǐng)D2,在本發(fā)明的節(jié)目選擇裝置中,個(gè)人語(yǔ)料庫(kù)制作單元1還可進(jìn)一步包括對(duì)于所提取的特征判斷是否已包含在個(gè)人語(yǔ)料庫(kù)中,框104;如果為“是”,進(jìn)到框105,詞的權(quán)數(shù)加1,在框106在個(gè)人語(yǔ)料庫(kù)中修改,然后到框111后返回框103;如果結(jié)果是“否”,進(jìn)到框107,判斷該詞是否包含在公共語(yǔ)料庫(kù);“是”包含,進(jìn)到框109,將詞的權(quán)數(shù)設(shè)為1,在框110將其加入個(gè)人語(yǔ)料庫(kù);如果為“否”,即該詞沒(méi)有包含在公共語(yǔ)料庫(kù),進(jìn)到框108,加入公共語(yǔ)料庫(kù),然后進(jìn)行框109和110的處理,再到框111并返回框103。顯然,個(gè)人語(yǔ)料庫(kù)制作單元1也可僅包括框103、104、105、106,和在框103的結(jié)果為“否”的情況包括框109和110,再到框111,并返回框103的處理。
在本發(fā)明中,節(jié)目選擇單元可以根據(jù)匹配用單詞數(shù)目從個(gè)人語(yǔ)料庫(kù)中依權(quán)數(shù)大小序順選取詞,作為節(jié)目匹配或節(jié)目選擇用的查詢?cè)~。
在本發(fā)明的節(jié)目選擇裝置中,媒體庫(kù)制作單元2可對(duì)節(jié)目單進(jìn)行處理,對(duì)每一個(gè)電視節(jié)目的文本進(jìn)行切分,并由此構(gòu)建成媒體庫(kù)。在本發(fā)明的一個(gè)實(shí)施方案中,簡(jiǎn)單的情況是媒體庫(kù)制作單元2制作的媒體庫(kù)可包含許多詞的集合,每個(gè)詞帶有詞頻率和倒文檔頻率兩種信息,并可用上述的tf-idf方法計(jì)算出詞的特征權(quán)重,以此為基礎(chǔ)為每個(gè)電視節(jié)目抽取出一些關(guān)鍵詞或提取一些特征來(lái)代表電視節(jié)目,并用這些關(guān)鍵詞或特征來(lái)對(duì)媒體單元2的媒體庫(kù)進(jìn)行構(gòu)建和更新。另外,媒體庫(kù)制作單元21構(gòu)建的媒體庫(kù)還可包括其它一些節(jié)目信息,如節(jié)目名稱、時(shí)間,等等。
在本發(fā)明的節(jié)目選擇裝置中,公共語(yǔ)料庫(kù)制作單元3制作的公共語(yǔ)料庫(kù)可主要包含構(gòu)建語(yǔ)料庫(kù)的縱向關(guān)系和橫向關(guān)系??v向關(guān)系可通過(guò)學(xué)習(xí)現(xiàn)有字典中的義原實(shí)體上下位網(wǎng)絡(luò)和概念的第一特征來(lái)構(gòu)建,并可進(jìn)行適當(dāng)?shù)膬?yōu)化以更好的反映現(xiàn)實(shí)世界的分類和繼承關(guān)系。橫向關(guān)系可通過(guò)學(xué)習(xí)大量的電視節(jié)目文本語(yǔ)料來(lái)獲得,可存儲(chǔ)有詞語(yǔ)對(duì)之間的共現(xiàn)次數(shù)和共現(xiàn)平均距離等信息,并可給出詞相似度的定量計(jì)算。
在本發(fā)明的節(jié)目選擇裝置中,節(jié)目選擇單元4可基于貝葉斯網(wǎng)絡(luò)的節(jié)目匹配算法,根據(jù)從個(gè)人語(yǔ)料單元、媒體單元和公共語(yǔ)料單元輸入的信息,從媒體單元2的媒體庫(kù)抽取與個(gè)人語(yǔ)料單元1的個(gè)人語(yǔ)料庫(kù)中的信息相關(guān)的信息,并據(jù)此從媒體庫(kù)中選出與所述個(gè)人語(yǔ)料庫(kù)相關(guān)的節(jié)目。
在本發(fā)明的節(jié)目選擇裝置,節(jié)目選擇單元4計(jì)算在媒體單元2的媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的詞相對(duì)于媒體庫(kù)中的節(jié)目的權(quán)重,該計(jì)算可基于tf-idf方法進(jìn)行,節(jié)目選擇單元4計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下在媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的詞出現(xiàn)的概率,也就是計(jì)算媒體庫(kù)中的詞相對(duì)于個(gè)人語(yǔ)料庫(kù)中的詞出現(xiàn)的概率,然后計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下媒體庫(kù)中的節(jié)目出現(xiàn)的概率,即,計(jì)算媒體庫(kù)中的節(jié)目相對(duì)于給定的個(gè)人語(yǔ)料庫(kù)中的詞出現(xiàn)的概率,從而從媒體單元2中的媒體庫(kù)的節(jié)目中選出用戶喜好的節(jié)目,推薦給用戶。
圖3示出根據(jù)本發(fā)明的一個(gè)實(shí)施方案節(jié)目選擇單元基于貝葉斯網(wǎng)的拓樸結(jié)構(gòu)選擇節(jié)目的示意圖。如圖3所示,節(jié)目選擇單元4基于貝葉斯網(wǎng)絡(luò)模型,通過(guò)個(gè)人語(yǔ)料庫(kù)中的q1,q2,q3和媒體庫(kù)中的節(jié)目P1,P2,P3對(duì)媒體庫(kù)的T1,t2,...,TM的映射,對(duì)個(gè)人語(yǔ)料庫(kù)的查詢?cè)~與媒體庫(kù)中節(jié)目的進(jìn)行模糊匹配,選出與查詢?cè)~q1,q2,q3相關(guān)的節(jié)目P。其中,q1,q2,q3表示個(gè)人語(yǔ)料庫(kù)中的詞,或查詢?cè)~,T1,T2,...,TM表示媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容切分出的詞,或媒體庫(kù)中出現(xiàn)的關(guān)鍵詞,P1,P2,P3表示媒體庫(kù)中的電視節(jié)目。媒體單元的媒體庫(kù)可包含對(duì)所有電視節(jié)目?jī)?nèi)容的文檔切分得到的詞,這些詞的集合可表示為 ,其中,M表示媒體庫(kù)包含的所有文檔切分詞的個(gè)數(shù)。Ti可表示根據(jù)節(jié)目?jī)?nèi)容提取的媒體庫(kù)中的第i個(gè)詞,每一個(gè)詞Ti可以是一個(gè)二元變量 其中 可表示“詞Ti與查詢?cè)~是不相關(guān)的”,ti代表“詞Ti與查詢?cè)~是相關(guān)的”,或ti也可用來(lái)表示與個(gè)人語(yǔ)料庫(kù)中的詞是相關(guān)的媒體庫(kù)詞Ti。另外,媒體庫(kù)中還可包含所有的節(jié)目,如電視節(jié)目,其集合可表示為P={P1,P2,…,PN},Pj可表示媒體庫(kù)中的第j個(gè)電視節(jié)目。每一個(gè)節(jié)目Pj也可是一個(gè)二元變量{pj,pj},其中pj和pj分別表示“節(jié)目Pj與給定的查詢?cè)~是不相關(guān)的”和“節(jié)目Pj與給定的查詢?cè)~是相關(guān)的”,pj也可用來(lái)表示與給定的個(gè)人語(yǔ)料庫(kù)是相關(guān)的節(jié)目Pj。
在本發(fā)明的節(jié)目選擇裝置中,節(jié)目選擇單元4可計(jì)算媒體庫(kù)中切分的詞T的詞頻tfij,tfij為第i個(gè)詞在第j篇電視節(jié)目文檔中出現(xiàn)的次數(shù),計(jì)算詞的倒文檔頻率idfi,顯然,如前所述,這兩個(gè)計(jì)算也可在媒體單元2的媒體庫(kù)制作單元21完成。根據(jù)媒體庫(kù)中詞T1,T2,…,TM的詞頻和倒文檔頻率,節(jié)目選擇單元4可計(jì)算媒體庫(kù)中的詞Ti相對(duì)于媒體庫(kù)中的某個(gè)電視節(jié)目,如第j個(gè)電視節(jié)目的權(quán)重wij。
在本發(fā)明的節(jié)目選擇裝置中,節(jié)目選擇單元4可基于貝葉斯網(wǎng)絡(luò)模型對(duì)個(gè)人語(yǔ)料庫(kù)的查詢?cè)~與媒體庫(kù)中節(jié)目進(jìn)行模糊匹配,從而選出用戶喜好的節(jié)目,向推薦用戶。節(jié)目選擇單元4可計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下,也就是在給定查詢?cè)~的條件下,媒體單元2的媒體庫(kù)中的電視節(jié)目出現(xiàn)的概率,并根據(jù)計(jì)算出的概率選出與用戶個(gè)人喜好相關(guān)的電視節(jié)目,向用戶推薦。節(jié)目Pj相對(duì)于個(gè)人語(yǔ)料庫(kù)中的詞出現(xiàn)的概率p(pj|Q),可使用貝葉斯網(wǎng)絡(luò)條件概率計(jì)算公式求得,如可選用下式計(jì)算p(pj|Q)=ΣTi∈Pjwijp(ti|Q)---(1)]]>(1)式中的wij表示媒體庫(kù)中詞T1,T2,…,TM中的第i個(gè)詞相對(duì)于媒體單元2的媒體庫(kù)中的第j個(gè)電視節(jié)目的權(quán)重,即詞Ti相對(duì)于媒體庫(kù)中的節(jié)目的權(quán)重,wij可通過(guò)tf-idf方法實(shí)現(xiàn),如可由公式wij=α-1tfij·idfi2ΣTK∈Pjtfkj·idfk2]]>計(jì)算,α參數(shù)可由實(shí)驗(yàn)來(lái)確定。
(1)式中的P(ti|Q)表示在個(gè)人語(yǔ)料庫(kù)條件下,也就是在給定查詢?cè)~的條件下,媒體庫(kù)中的詞Ti出現(xiàn)的概率,即,P(ti|Q)表示詞ti相對(duì)于個(gè)人語(yǔ)料庫(kù)中的詞出現(xiàn)的概率。假設(shè)個(gè)人語(yǔ)料庫(kù)中結(jié)點(diǎn)是相互獨(dú)立的,如在個(gè)人語(yǔ)料庫(kù)中的詞q1,q2,q3是相互獨(dú)立的情況下,如果Ti∈Q,則P(ti|Q)=1。如果Ti/∈Q,即媒體庫(kù)中的詞Ti不屬于Q,不屬于個(gè)人語(yǔ)料庫(kù)的詞集合,則P(ti|Q)可按下列公式計(jì)算p(ti|Q)=p(ti|q1,q2,...,qm)=p(ti|q1)+p(ti|q2)+...+p(ti|qm)m---(2)]]>(2)式中的q1,q2,...,qm表示個(gè)人語(yǔ)料庫(kù)中的詞,或查詢?cè)~,Q為個(gè)人語(yǔ)料庫(kù)中的詞的集合和m為其中的詞的個(gè)數(shù)。p(ti|q1),p(ti|q2),...,p(ti|qm)表示媒體庫(kù)的詞T1與個(gè)人語(yǔ)料庫(kù)中的詞或查詢?cè)~q1,q2,q3的相關(guān)性。
在本發(fā)明的節(jié)目選擇裝置,節(jié)目選擇單元4可用詞ti與詞q1的相似度來(lái)代替p(ti|q1),用詞ti與詞q2的相似度來(lái)代替p(t1|q2),......,用詞ti與詞qm的相似度來(lái)代替p(ti|qm),以此類推,等等。顯然,可采用任何適當(dāng)?shù)默F(xiàn)有技術(shù)來(lái)計(jì)算詞的相似度。
在本發(fā)明的一個(gè)實(shí)施方案中,詞的相似度,如詞ti與詞q1的相似度,詞ti與詞q2的相似度,......,和詞ti與詞qm的相似度等可直接選用公共語(yǔ)料庫(kù)中的詞的相似度,也就是說(shuō)節(jié)目選擇單元4省去了p(ti|qm)的計(jì)算,可直接選用公共語(yǔ)料庫(kù)中已定量計(jì)算的詞的相似度來(lái)代替。這樣,由于利用了公共語(yǔ)料庫(kù)中已有的詞與詞之間的相似度,因而節(jié)約了處理時(shí)間,并且還可使節(jié)目選擇單元4計(jì)算出的p(pj|Q)能更好地反應(yīng)出查詢?cè)~與電視節(jié)目之間的相關(guān)性,更好地反映出個(gè)人語(yǔ)料庫(kù)中的詞與媒體庫(kù)中的節(jié)目之間的相關(guān)性,從而使節(jié)目選擇單元4能更有效地從媒體庫(kù)中選出與個(gè)人喜好相關(guān)的節(jié)目。
本發(fā)明的節(jié)目選擇裝置,使用用戶個(gè)人語(yǔ)料庫(kù),媒體庫(kù)和公共語(yǔ)料庫(kù),根據(jù)給定查詢?cè)~的條件下電視節(jié)目Pi出現(xiàn)的概率p(pj|Q)的大小,按順序選出用戶喜歡的節(jié)目,推薦給用戶,其中查詢?cè)~可以是個(gè)人語(yǔ)料庫(kù)中的詞或者是用戶輸入的關(guān)鍵字等。本發(fā)明的節(jié)目選擇裝置能快速、有效地選出用戶喜好的節(jié)目,為從詞的概念語(yǔ)義上準(zhǔn)確地向用戶推薦電視節(jié)目提供了保證。本發(fā)明的節(jié)目選擇裝置能隨時(shí)隨地、快速有效地向用戶推薦其個(gè)人喜歡的節(jié)目,并可給出節(jié)目預(yù)告,節(jié)省用戶查找節(jié)目的時(shí)間。顯然,本發(fā)明的節(jié)目選擇裝置可采用任何適當(dāng)?shù)默F(xiàn)有技術(shù),通過(guò)任何形式將其推薦的節(jié)目告知用戶,如采用或通過(guò)視頻、音頻、短信、有線、無(wú)線、遙控器、手機(jī)等向用戶推薦節(jié)目,如可通過(guò)前述的用戶關(guān)鍵字輸入單元51,如圖1中“⑥”所示。本發(fā)明的節(jié)目選擇裝置除了用于選擇推薦節(jié)目,還可以用于Internet網(wǎng)上搜尋用戶感興趣的新聞、文章、網(wǎng)頁(yè),等等。
本發(fā)明的節(jié)目選擇裝置也可利用在本裝置的外部存在的公共語(yǔ)料庫(kù)和/或媒體庫(kù)。公共語(yǔ)料庫(kù)和/或媒體庫(kù)可保存在本發(fā)明的節(jié)目選擇裝置之外,如保存在網(wǎng)絡(luò)上,或保存在服務(wù)商,電臺(tái)或電視臺(tái)處等等,在此情況下,本發(fā)明的節(jié)目選擇裝置可通過(guò)有線或無(wú)線網(wǎng)絡(luò)訪問(wèn)存儲(chǔ)在本裝置之外的公共語(yǔ)料庫(kù)和媒體庫(kù),根據(jù)個(gè)人語(yǔ)料庫(kù)、媒體庫(kù)和公共語(yǔ)料庫(kù)的信息,選出用戶喜歡的節(jié)目。公共語(yǔ)料庫(kù),和/媒體庫(kù)的內(nèi)容可由其管理者、電臺(tái)、電視臺(tái)等來(lái)更新和維護(hù),由此使本發(fā)明的節(jié)目選擇裝置能夠利用最新?tīng)顟B(tài)的公共語(yǔ)料庫(kù)和媒體庫(kù)的信息。例如,由于媒體庫(kù)可由電視廣播臺(tái)等維護(hù)更新,因此具有能夠利用最新的電視節(jié)目信息的效果。
參照?qǐng)D4,在家庭A,節(jié)目選擇裝置100可與家中的其它一些裝置,如數(shù)字電視、電視電腦一體機(jī)、home server等組成一個(gè)系統(tǒng),節(jié)目選擇裝置100有包括在個(gè)人語(yǔ)料單元中的個(gè)人語(yǔ)料庫(kù),并通過(guò)網(wǎng)絡(luò)訪問(wèn)位于裝置100之外的公共語(yǔ)料庫(kù)和媒體庫(kù)。在家庭B,有兩個(gè)節(jié)目選擇裝置100A和100B,在個(gè)人語(yǔ)料單元中包括個(gè)人語(yǔ)料庫(kù),通過(guò)網(wǎng)絡(luò)訪問(wèn)位于節(jié)目選擇裝置100A和100B之外的公共語(yǔ)料庫(kù)和媒體庫(kù)。但是,如果每次都訪問(wèn)外部的公共語(yǔ)料庫(kù)或媒體庫(kù),則會(huì)使網(wǎng)絡(luò)的通信量增加,增加為了接受、發(fā)送信息需要的處理時(shí)間。因此,本發(fā)明的節(jié)目選擇裝置可在媒體單元2和公共語(yǔ)料單元3配備有媒體庫(kù)保存單元22和公共語(yǔ)料庫(kù)保存單元32,如圖1所示,定期或者通過(guò)用戶的操作從本裝置之外下載或者拷貝部分或全部信息到本裝置中媒體庫(kù)保存單元22和公共語(yǔ)料庫(kù)保存單元32保存的媒體庫(kù)和公共語(yǔ)料庫(kù)中,以此獲得最新的公共語(yǔ)料庫(kù)和節(jié)目信息。這樣,既不會(huì)增在給網(wǎng)絡(luò)施加的負(fù)荷,也能利用得到良好維護(hù)的公共語(yǔ)料庫(kù)和有最新?tīng)顟B(tài)的電視節(jié)目信息。
另外,本發(fā)明的節(jié)目選擇裝置還可進(jìn)一步包括查詢輸入單元(未示出),與個(gè)人語(yǔ)料單元相并列,并與節(jié)目選擇單元相連。查詢輸入單元可包括能與用戶互動(dòng)的接口,如遙控器、手機(jī)等,用戶通過(guò)其能輸入一些查詢?cè)~,節(jié)目選擇單元根據(jù)用戶輸入的查詢?cè)~,和媒體單元和公共語(yǔ)料單元輸入的信息,可從媒體單元媒體庫(kù)的節(jié)目中選出與查詢?cè)~相關(guān)的節(jié)目,并可通過(guò)查詢輸入單元向用戶推薦。顯然,用戶輸入的查詢信息也可被放入個(gè)人語(yǔ)料單元中的個(gè)人語(yǔ)料庫(kù),供節(jié)目選擇單元選擇用戶喜歡的節(jié)目之用。
本發(fā)明還提供一種進(jìn)行節(jié)目選擇的方法,包括步驟制作個(gè)人語(yǔ)料庫(kù),根據(jù)用戶所選節(jié)目?jī)?nèi)容制作用戶的個(gè)人語(yǔ)料庫(kù),保存?zhèn)€人語(yǔ)料庫(kù);制作或訪問(wèn)媒體庫(kù),所述媒體庫(kù)包含媒體信息和內(nèi)容;保存媒體庫(kù);制作或訪問(wèn)公共語(yǔ)料庫(kù);保存公共語(yǔ)料庫(kù);節(jié)目選擇,根據(jù)來(lái)自個(gè)人語(yǔ)料庫(kù)、媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入信息,從媒體庫(kù)中抽取與個(gè)人語(yǔ)料庫(kù)內(nèi)的信息相關(guān)的信息,根據(jù)從媒體庫(kù)抽取的信息從媒體庫(kù)中選出用戶喜好的節(jié)目。
圖6示意性地示出本發(fā)明的節(jié)目選擇方法的流程圖。如圖6所示,在本發(fā)明的一個(gè)實(shí)施方案,本發(fā)明的方法包括在步驟101,根據(jù)用戶所選節(jié)目?jī)?nèi)容制作個(gè)人語(yǔ)料庫(kù),和在步驟102,保存所制作的個(gè)人語(yǔ)料庫(kù);在步驟201,制作或訪問(wèn)媒體庫(kù),在步驟202,保存媒體庫(kù),媒體庫(kù)包含媒體信息和內(nèi)容;在步驟301,制作或訪問(wèn)公共語(yǔ)料庫(kù),在步驟302,保存或訪問(wèn)公共語(yǔ)料庫(kù);在步驟401,進(jìn)行節(jié)目選擇,節(jié)目選擇步驟包括根據(jù)來(lái)自個(gè)人語(yǔ)料庫(kù)、媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入信息,從媒體庫(kù)中抽取與個(gè)人語(yǔ)料庫(kù)中的信息相關(guān)的信息,根據(jù)從媒體庫(kù)抽取的信息從媒體庫(kù)中選出用戶喜好的節(jié)目。
繼續(xù)參照?qǐng)D6,在本發(fā)明的另一個(gè)實(shí)施方案,本發(fā)明的方法還包括,在步驟500,由用戶輸入信息的步驟。節(jié)目選擇在步驟401,根據(jù)來(lái)自所述個(gè)人語(yǔ)料庫(kù)的信息和/或用戶輸入的信息,根據(jù)媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入信息,從所述媒體庫(kù)中抽取與所述個(gè)人語(yǔ)料庫(kù)中的信息和/或用戶輸入信息相關(guān)的信息,據(jù)此從所述媒體庫(kù)中選出用戶喜好的節(jié)目,推薦給用戶。
繼續(xù)參照?qǐng)D6,在本發(fā)明的另一個(gè)實(shí)施方案,用戶輸入信息的步驟可包括用戶輸入關(guān)鍵字步驟501。在節(jié)目選擇步驟401根據(jù)輸入的關(guān)鍵字,從媒體庫(kù)中抽取與關(guān)鍵字相關(guān)的信息,并據(jù)此從所述媒體庫(kù)中選出相關(guān)的節(jié)目,推薦給用戶。
繼續(xù)參照?qǐng)D6,在本發(fā)明的另一個(gè)實(shí)施方案,用戶輸入關(guān)鍵字的步驟501與保存?zhèn)€人語(yǔ)料庫(kù)的步驟102相接,如圖6中“⑦”所示,根據(jù)用戶輸入的關(guān)鍵字對(duì)所述個(gè)人語(yǔ)料庫(kù)中的信息進(jìn)行更新,添加,和/或刪減的步驟。
繼續(xù)參照?qǐng)D6,在本發(fā)明的另一個(gè)實(shí)施方案,用戶輸入信息的步驟包括輸入匹配參數(shù)的步驟502,在節(jié)目選擇步驟401,根據(jù)所述匹配參數(shù)從所述媒體庫(kù)抽取相關(guān)信息,進(jìn)而選出相關(guān)節(jié)目推薦給用戶。
繼續(xù)參照?qǐng)D6,由節(jié)目選擇401推薦出的電視節(jié)目,進(jìn)入制作個(gè)人語(yǔ)料庫(kù)101,更新保存?zhèn)€人語(yǔ)料庫(kù)102中的內(nèi)容。
在本發(fā)明的節(jié)目選擇或匹配方法中.輸入匹配參數(shù)步驟502輸入的所述匹配參數(shù)包括匹配用詞的數(shù)目、和/或模糊匹配率,和在所述節(jié)目選擇步驟根據(jù)匹配用詞的數(shù)目、和/或模糊匹配率調(diào)節(jié)所推薦節(jié)目的精度。
有關(guān)本發(fā)明節(jié)目選擇方法的其它具體細(xì)節(jié),可參照前面的相關(guān)說(shuō)明。
繼續(xù)參照?qǐng)D6,本發(fā)明的節(jié)目選擇方法可進(jìn)一步包括媒體庫(kù)制作步驟,201,在保存媒體庫(kù)的步驟202之前,根據(jù)節(jié)目信息和內(nèi)容制作媒體庫(kù)。本發(fā)明的節(jié)目選擇方法還可包括公共語(yǔ)料制作步驟,301,在保存公共語(yǔ)料庫(kù)步驟302之前,構(gòu)建和更新公共語(yǔ)料庫(kù)。在制作公共語(yǔ)料庫(kù)的步驟301,其中包括定量計(jì)算詞與詞相似度的步驟,使公共語(yǔ)料庫(kù)包含詞的相似度。
在本發(fā)明的節(jié)目選擇方法,制作個(gè)人語(yǔ)料庫(kù)的步驟進(jìn)一步包括對(duì)用戶所選節(jié)目?jī)?nèi)容進(jìn)行自然語(yǔ)言處理,進(jìn)行切分,得到詞序列,然后通過(guò)tf-idf方法對(duì)其進(jìn)行文本特征提取,將提取的特征放在一起構(gòu)建個(gè)人語(yǔ)料庫(kù)的步驟。在本發(fā)明的一個(gè)實(shí)施方案,通過(guò)tf-idf方法對(duì)其進(jìn)行文本特征提取的步驟包括計(jì)算每個(gè)詞的詞頻,計(jì)算詞的倒文檔頻率,根據(jù)詞頻和倒文檔頻率計(jì)算詞的特征權(quán)重,取特征權(quán)重較大的詞放入所述個(gè)人語(yǔ)料庫(kù)的步驟,詳情請(qǐng)參見(jiàn)前面有關(guān)用tf-idf方法進(jìn)行文本特征的提取的說(shuō)明。
在本發(fā)明的節(jié)目選擇方法,節(jié)目選擇步驟所包括的根據(jù)來(lái)自個(gè)人語(yǔ)料庫(kù)、媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入信息,從媒體庫(kù)中抽取與個(gè)人語(yǔ)料庫(kù)中的信息相關(guān)的信息,包括與個(gè)人語(yǔ)料庫(kù)中的詞相關(guān)的媒體庫(kù)的詞,根據(jù)從媒體庫(kù)抽取的信息從媒體庫(kù)中選出用戶喜好的節(jié)目。個(gè)人語(yǔ)料庫(kù)與媒體庫(kù)中的詞是否相關(guān),可依據(jù)詞的相似度來(lái)判斷,詞的相似度可直接取自公共語(yǔ)料庫(kù)中的詞的相似度。在本發(fā)明的一個(gè)實(shí)施方案,上述過(guò)程可通過(guò)以下步驟實(shí)現(xiàn)基于tf-idf方法計(jì)算在媒體單元的媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的詞相對(duì)于媒體庫(kù)中節(jié)目的權(quán)重,計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下在媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的詞出現(xiàn)的概率,即計(jì)算媒體庫(kù)中的詞相對(duì)于個(gè)人語(yǔ)料庫(kù)中的詞出現(xiàn)的概率,以及在此基礎(chǔ)上計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下媒體庫(kù)中的節(jié)目出現(xiàn)的概率,即計(jì)算出媒體庫(kù)中的節(jié)目相對(duì)個(gè)人語(yǔ)料庫(kù)中的查詢?cè)~出現(xiàn)的概率,從而據(jù)此從媒體單元的媒體庫(kù)節(jié)目中選出用戶喜好的節(jié)目。具體的計(jì)算公式和說(shuō)明請(qǐng)參見(jiàn)前面的詳細(xì)描述,如選用下式計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下所述媒體單元的媒體庫(kù)中的節(jié)目出現(xiàn)的概率p(pj|Q)=ΣTi∈Pjwijp(ti|Q),]]>選用公式wij=α-1tfij·idfi2ΣTK∈Pjtfkj·idfk2]]>計(jì)算媒體庫(kù)中的詞相對(duì)于媒體庫(kù)中節(jié)目的權(quán)重,和在Ti/∈Q,時(shí)選用下式計(jì)算媒體庫(kù)中的詞相對(duì)于個(gè)人語(yǔ)料庫(kù)中的詞出現(xiàn)的概率p(ti|Q)=p(ti|q1,q2,...,qm)=p(ti|q1)+p(ti|q2)+...+p(ti|qm)m,]]>以及p(ti|q1)可用詞ti與詞q1的相似度來(lái)代替,p(ti|q2)可用詞ti與詞q2的相似度來(lái)代替,...,p(ti|qm)可用詞ti與詞qm的相似度來(lái)代替,等等。
在本發(fā)明的節(jié)目選擇方法,可進(jìn)一步包括輸入查詢?cè)~的步驟,并且在節(jié)目選擇步驟,可根據(jù)輸入的查詢信息,以及媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入信息,從媒體庫(kù)中選出與所述查詢信息相關(guān)的節(jié)目,推薦給用戶。
下面給出一個(gè)推薦節(jié)目的例子I。
A.在個(gè)人語(yǔ)料單元,用戶看過(guò)的或輸入的三個(gè)電視節(jié)目如下

經(jīng)過(guò)個(gè)人語(yǔ)料庫(kù)制作單元制作個(gè)人語(yǔ)料庫(kù),包含的內(nèi)容如下直播,世界,女子排球,聯(lián)賽,中國(guó),意大利新聞?lì)^條,關(guān)注,國(guó)足中國(guó),超級(jí)聯(lián)賽,賽事,報(bào)道,賽車世界,達(dá)喀爾,越野車B.在媒體單元,包括或輸入如下十個(gè)電視節(jié)目


經(jīng)媒體庫(kù)制作單元,媒體庫(kù)包含與上述節(jié)目?jī)?nèi)容有關(guān)詞和節(jié)目信息P1重播,世界,女子排球,聯(lián)賽,中國(guó),巴西P2今日天氣,出行,道路狀況,百姓,身邊事P3籃球,季后賽,賽事,報(bào)道,溫布爾登,網(wǎng)球,公開(kāi)賽,決賽P4印度,發(fā)生,重大,交通事故,關(guān)注,中東局勢(shì),倫敦,爆炸案,相關(guān)報(bào)道P5現(xiàn)場(chǎng)直播,英國(guó),足球,超級(jí)聯(lián)賽,利物浦,切爾西P6現(xiàn)場(chǎng)直播,世界,一級(jí)方程式,賽車,馬來(lái)西亞,大獎(jiǎng)賽,排位賽P7探索頻道,終極探險(xiǎn),科學(xué)妙探,世界,神秘事件P8航空母艦,二戰(zhàn),回憶錄,中途島,戰(zhàn)役,斯大林格勒,保衛(wèi)戰(zhàn)P9新聞?lì)^條,中國(guó),圍棋,聯(lián)賽,經(jīng)典賽事P10全美,職業(yè)棒球,大聯(lián)盟,賽事,賽車世界,環(huán)法,自行車,大賽,報(bào)道C.在節(jié)目選擇單元,輸入個(gè)人語(yǔ)料庫(kù)、媒體庫(kù)和公共語(yǔ)料庫(kù),經(jīng)節(jié)目選擇單元處理,輸出推薦的電視節(jié)目如下
1.賽事轉(zhuǎn)播[重]CCTV-52005/06/1814:00-15:302.今日體育[重]OTV-12005/06/1912:00-12:303.英超賽事SHTV-22005/06/2023:45-1:30下面給出推薦節(jié)目的例子II用戶輸入關(guān)鍵字直播,世界,女子排球,聯(lián)賽,中國(guó),意大利新聞?lì)^條,關(guān)注,國(guó)足中國(guó),超級(jí)聯(lián)賽,賽事,報(bào)道,賽車世界,達(dá)喀爾,越野車與上述例的B和C相同。
下面給出通過(guò)設(shè)定匹配參數(shù)推薦節(jié)目的例子III與前面第I或第II例的A和B相同C.輸入匹配用單詞數(shù)目,如5,則參與匹配的跟個(gè)人愛(ài)好相關(guān)的關(guān)鍵字為直播,世界,女子排球,聯(lián)賽,中國(guó)D.節(jié)目選擇單元,根據(jù)匹配參數(shù),根據(jù)個(gè)人語(yǔ)料庫(kù)或用戶輸入的關(guān)鍵字,并根據(jù)媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入,經(jīng)節(jié)目選擇單元處理,輸出推薦節(jié)目如下1.賽事轉(zhuǎn)播[重]CCTV-52005/06/1814:00-15:302.英超賽事SHTV-22005/06/2023:45-1:303.賽事直播CCTV-12005/06/2419:45-20:45
雖然,以上通過(guò)實(shí)施方案對(duì)本發(fā)明的冷凍循環(huán)系統(tǒng)及其控制方法進(jìn)行了說(shuō)明。但是,應(yīng)能理解,本領(lǐng)域技術(shù)人員可在不偏離本發(fā)明的實(shí)質(zhì)精神和范圍的情況下對(duì)本發(fā)明進(jìn)行變化或改進(jìn)。這些變化和改進(jìn)都應(yīng)落入本發(fā)明的范圍內(nèi)。
權(quán)利要求
1.一種節(jié)目選擇裝置,所述裝置包括個(gè)人語(yǔ)料單元,包括個(gè)人語(yǔ)料庫(kù)制作單元,用于根據(jù)用戶所選節(jié)目?jī)?nèi)容制作用戶的個(gè)人語(yǔ)料庫(kù),和個(gè)人語(yǔ)料庫(kù)保存單元,用于保存所述個(gè)人語(yǔ)料庫(kù);媒體單元,包括媒體庫(kù)保存單元,用于保存媒體庫(kù),所述媒體庫(kù)包括媒體信息和內(nèi)容;公共語(yǔ)料單元,包括公共語(yǔ)料庫(kù)保存單元,用于保存公共語(yǔ)料庫(kù);人機(jī)交互單元,用于用戶輸入和取得信息,節(jié)目選擇單元,所述節(jié)目選擇單元與所述個(gè)人語(yǔ)料單元、媒體單元、公共語(yǔ)料單元和人機(jī)交互單元相連,根據(jù)從所述個(gè)人語(yǔ)料單元和/或人機(jī)交互單元輸入的信息,根據(jù)媒體單元和公共語(yǔ)料單元輸入的信息,從所述媒體庫(kù)抽取與所述個(gè)人語(yǔ)料庫(kù)中的信息和/或人機(jī)交互單元輸入的信息相關(guān)的信息,根據(jù)從所述媒體庫(kù)抽取的所述信息,從所述媒體庫(kù)中選出與所述個(gè)人語(yǔ)料庫(kù)和/或人機(jī)交互單元輸入信息相關(guān)的節(jié)目。
2.如權(quán)利要求1所述的節(jié)目選擇裝置,其特征在于所述人機(jī)交互單元包括用戶關(guān)鍵字輸入單元,用戶在用戶關(guān)鍵字輸入單元輸入關(guān)鍵字,所述節(jié)目選擇單元根據(jù)輸入的關(guān)鍵字,從所述媒體庫(kù)中抽取與所述關(guān)鍵字相關(guān)的信息,并據(jù)此從所述媒體庫(kù)中選出相關(guān)的節(jié)目,推薦給用戶。
3.如權(quán)利要求2所述的節(jié)目選擇裝置,其特征在于所述用戶關(guān)鍵字輸入單元與個(gè)人語(yǔ)料庫(kù)保存單元相連,用戶能輸入關(guān)鍵字對(duì)所述個(gè)人語(yǔ)料庫(kù)中的信息進(jìn)行更新,添加,和/或刪減。
4.如權(quán)利要求3所述的節(jié)目選擇裝置,其特征在于所述人機(jī)交互單元包括匹配參數(shù)設(shè)定單元,與所述節(jié)目選擇單元相連,向所述節(jié)目選擇單元提供匹配參數(shù),所述節(jié)目選擇單元根據(jù)所述匹配參數(shù)從所述媒體庫(kù)抽取相關(guān)信息,進(jìn)而選出相關(guān)節(jié)目推薦給用戶。
5.如權(quán)利要求4所述的節(jié)目選擇裝置,其特征在于所述匹配參數(shù)包括匹配用詞的數(shù)目、和/或模糊匹配率,所述節(jié)目選擇單元根據(jù)匹配用詞的數(shù)目、和/或模糊匹配率調(diào)節(jié)所推薦節(jié)目的精度。
6.如權(quán)利要求4所述的節(jié)目選擇裝置,其特征在于所述媒體單元還包括媒體庫(kù)制作單元,用于根據(jù)節(jié)目信息和內(nèi)容制作媒體庫(kù)。
7.如權(quán)利要求6所述的節(jié)目選擇裝置,其特征在于所述個(gè)人語(yǔ)料庫(kù)制作單元對(duì)用戶所選節(jié)目的節(jié)目?jī)?nèi)容進(jìn)行切分,得到詞序列,計(jì)算詞的詞頻和詞的倒文檔頻率,并且根據(jù)所述詞頻和倒文檔頻率計(jì)算詞的特征權(quán)重,取特征權(quán)重較大的詞放入所述個(gè)人語(yǔ)料庫(kù)。
8.如權(quán)利要求6所述的節(jié)目選擇裝置,其特征在于所述公共語(yǔ)料單元還包括公共語(yǔ)料庫(kù)制作單元,用于制作公共語(yǔ)料庫(kù),其中,所述公共語(yǔ)料庫(kù)包含定量計(jì)算的詞與詞的相似度。
9.如權(quán)利要求1-8所述的節(jié)目選擇裝置,其特征在于節(jié)目選擇單元,基于tf-idf方法計(jì)算在所述媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的詞相對(duì)于所述媒體庫(kù)中的節(jié)目的權(quán)重,計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下在所述媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的所述詞出現(xiàn)的概率,并以二者為基礎(chǔ)計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下所述媒體庫(kù)中的節(jié)目出現(xiàn)的概率,從而據(jù)此從所述媒體庫(kù)的節(jié)目中選出用戶喜好的節(jié)目。
10.如權(quán)利要求9所述的節(jié)目選擇裝置,其特征在于在節(jié)目選擇單元,計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下所述媒體庫(kù)中的節(jié)目出現(xiàn)的概率的公式為p(pj|Q)=ΣTi∈Pjwijp(ti|Q),]]>其中,wij=α-1tfij·idfi2ΣTK∈Pjtfkj·idfk2,]]>和,在個(gè)人語(yǔ)料庫(kù)中的詞q1,q2,..,qm相互獨(dú)立的情況下,如果Ti∈Q,取P(ti|Q)=1,如果Ti/∈Q,則p(ti|Q)=p(ti|q1,q2,...,qm)=p(ti|q1)+p(ti|q2)+...+p(ti|qm)m,]]>其中,Pj代表所述媒體庫(kù)中第j個(gè)節(jié)目,pj表示節(jié)目Pj與給定的個(gè)人語(yǔ)料庫(kù)是相關(guān)的,Ti表示根據(jù)節(jié)目?jī)?nèi)容從公共語(yǔ)料庫(kù)提取的第i個(gè)詞,ti代表詞Ti與個(gè)人語(yǔ)料庫(kù)中的詞是相關(guān)的,Q為個(gè)人語(yǔ)料庫(kù)中詞的集合和m為其中的詞的個(gè)數(shù),wij為詞Ti相對(duì)于所述媒體庫(kù)中的節(jié)目的權(quán)重,P(ti|Q)表示在個(gè)人語(yǔ)料庫(kù)條件下詞Ti出現(xiàn)的概率。
11.如權(quán)利要求10所述的節(jié)目選擇裝置,其特征在于,p(ti|q1)用詞ti與詞q1的相似度來(lái)代替,p(ti|q2)用詞ti與詞q2的相似度來(lái)代替,...,p(ti|qm)用詞ti與詞qm的相似度來(lái)代替。
12.如權(quán)利要求11所述的節(jié)目選擇裝置,其特征在于,詞ti與詞q1,詞ti與詞q2的相似度,...,詞ti與詞qm的相似度取自所述公共語(yǔ)料庫(kù)所包含的詞相似度。
13.一種節(jié)目選擇的方法,所述方法包括步驟制作個(gè)人語(yǔ)料庫(kù),根據(jù)用戶所選節(jié)目的節(jié)目?jī)?nèi)容制作用戶的個(gè)人語(yǔ)料庫(kù);保存?zhèn)€人語(yǔ)料庫(kù),用來(lái)保存所述個(gè)人語(yǔ)料庫(kù);制作或訪問(wèn)媒體,所述媒體庫(kù)包含媒體信息和內(nèi)容;保存媒體庫(kù);制作或訪問(wèn)公共語(yǔ)料庫(kù);保存公共語(yǔ)料庫(kù);節(jié)目選擇,根據(jù)來(lái)自所述個(gè)人語(yǔ)料庫(kù)、媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入信息,從所述媒體庫(kù)中抽取與所述個(gè)人語(yǔ)料庫(kù)中的信息相關(guān)的信息,根據(jù)從所述媒體庫(kù)抽取的所述信息從所述媒體庫(kù)中選出用戶喜好的節(jié)目。
14.如權(quán)利要求13所述的節(jié)目選擇方法,進(jìn)一步包括由用戶輸入信息的步驟,在所述節(jié)目選擇步驟,根據(jù)來(lái)自所述個(gè)人語(yǔ)料庫(kù)的信息和/或用戶輸入的信息,根據(jù)媒體庫(kù)和公共語(yǔ)料庫(kù)的輸入信息,從所述媒體庫(kù)中抽取與所述個(gè)人語(yǔ)料庫(kù)中的信息和/或用戶輸入信息相關(guān)的信息,據(jù)此從所述媒體庫(kù)中選出用戶喜好的節(jié)目,推薦給用戶。
15.如權(quán)利要求14所述的節(jié)目選擇方法,其特征在于,所述用戶輸入信息的步驟包括用戶輸入關(guān)鍵字的步驟,在所述節(jié)目選擇步驟,根據(jù)輸入的關(guān)鍵字,從所述媒體庫(kù)中抽取與所述關(guān)鍵字相關(guān)的信息,并據(jù)此從所述媒體庫(kù)中選出相關(guān)的節(jié)目,推薦給用戶。
16.如權(quán)利要求15所述的節(jié)目選擇方法,其特征在于,所述用戶輸入關(guān)鍵字的步驟包括根據(jù)用戶輸入的關(guān)鍵字對(duì)所述個(gè)人語(yǔ)料庫(kù)中的信息進(jìn)行更新,添加,和/或刪減的步驟。
17.如權(quán)利要求16所述的節(jié)目選擇方法,其特征在于,所述用戶輸入信息的步驟包括輸入匹配參數(shù)的步驟,在所述節(jié)目選擇的步驟,根據(jù)所述匹配參數(shù)從所述媒體庫(kù)抽取相關(guān)信息,進(jìn)而選出相關(guān)節(jié)目推薦給用戶。
18.如權(quán)利要求17所述的節(jié)目選擇方法,其特征在于,在輸入匹配參數(shù)的步驟,輸入的所述匹配參數(shù)包括匹配用詞的數(shù)目、和/或模糊匹配率,和在所述節(jié)目選擇步驟根據(jù)匹配用詞的數(shù)目、和/或模糊匹配率調(diào)節(jié)所推薦節(jié)目的精度。
19.如權(quán)利要求17所述的節(jié)目選擇方法,其特征在于所述制作個(gè)人語(yǔ)料庫(kù)的步驟進(jìn)一步包括對(duì)用戶所選節(jié)目?jī)?nèi)容進(jìn)行切分,得到詞序列,計(jì)算所述詞的詞頻和所述詞的倒文檔頻率,根據(jù)所述詞頻和倒文檔頻率計(jì)算所述詞的特征權(quán)重,取特征權(quán)重較大的詞放入所述個(gè)人語(yǔ)料庫(kù)的步驟。
20.如權(quán)利要求19所述的節(jié)目選擇方法,其特征在于所述制作公共語(yǔ)料庫(kù)的步驟,其中包括定量計(jì)算詞與詞相似度的步驟,所述公共語(yǔ)料庫(kù)包含詞與詞的相似度。
21.如權(quán)利要求13-20所述的節(jié)目選擇方法,其特征在于所述節(jié)目選擇步驟進(jìn)一步包括,基于tf-idf方法計(jì)算在所述媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的詞相對(duì)于所述媒體庫(kù)中節(jié)目的權(quán)重,計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下在所述媒體庫(kù)中根據(jù)節(jié)目?jī)?nèi)容提取的所述詞出現(xiàn)的概率,進(jìn)而在此基礎(chǔ)上計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下所述媒體庫(kù)中的節(jié)目出現(xiàn)的概率,從而據(jù)此從所述媒體庫(kù)的節(jié)目中選出用戶喜好的節(jié)目的步驟。
22.如權(quán)利要求21所述的節(jié)目選擇方法,其特征在于在所述節(jié)目選擇步驟中,計(jì)算在個(gè)人語(yǔ)料庫(kù)條件下所述媒體庫(kù)中的節(jié)目出現(xiàn)的概率的公式為p(pj|Q)=ΣTi∈Pjwijp(ti|Q),]]>其中,wij=α-1tfij·idfi2ΣTK∈Pjtfkj·idfk2,]]>和在個(gè)人語(yǔ)料庫(kù)中的詞q1,q2,...,qm相互獨(dú)立的情況下,如果Ti∈Q,取P(ti|Q)=1,如果Ti/∈Q,則p(ti|Q)=p(ti|q1,q2,...,qm)=p(ti|q1)+p(ti|q2)+...+p(ti|qm)m,]]>其中,Pj代表所述媒體庫(kù)中第j個(gè)節(jié)目,pj表示節(jié)目Pj與給定的個(gè)人語(yǔ)料庫(kù)是相關(guān)的,Ti表示根據(jù)節(jié)目?jī)?nèi)容從公共語(yǔ)料庫(kù)提取的第i個(gè)詞,ti代表詞Ti與個(gè)人語(yǔ)料庫(kù)中的詞是相關(guān)的,Q為個(gè)人語(yǔ)料庫(kù)中詞的集合和m為其中的詞的個(gè)數(shù),wij為詞Ti相對(duì)于所述媒體庫(kù)中的節(jié)目的權(quán)重,P(ti|Q)表示在個(gè)人語(yǔ)料庫(kù)條件下詞Ti出現(xiàn)的概率。
23.如權(quán)利要求22所述的節(jié)目選擇方法,其特征在于,p(ti|q1)用詞ti與詞q1的相似度來(lái)代替,p(ti|q2)用詞ti與詞q2的相似度來(lái)代替,...,p(ti|qm)用詞ti與詞qm的相似度來(lái)代替。
24.如權(quán)利要求23所述的節(jié)目選擇方法,其特征在于,詞ti與詞q1,詞ti與詞q2的相似度,...,詞ti與詞qm的相似度取自所述公共語(yǔ)料庫(kù)所包含的詞的相似度。
全文摘要
本發(fā)明提供一種節(jié)目選擇裝置,包括個(gè)人語(yǔ)料單元,它有個(gè)人語(yǔ)料庫(kù)制作單元和個(gè)人語(yǔ)料庫(kù)保存單元;媒體單元,包括保存媒體庫(kù)保存單元;公共語(yǔ)料單元,包括保存公共語(yǔ)料庫(kù)的公共語(yǔ)料庫(kù)保存單元;人機(jī)交互單元,用于用戶輸入和取得信息;和節(jié)目選擇單元,與個(gè)人語(yǔ)料單元、媒體單元、公共語(yǔ)料單元和人機(jī)交互單元相連,根據(jù)從個(gè)人語(yǔ)料單元和/或人機(jī)交互單元輸入的信息,并根據(jù)媒體單元和公共語(yǔ)料單元輸入的信息,從媒體庫(kù)抽取與個(gè)人語(yǔ)料庫(kù)中的信息和/或人機(jī)交互單元輸入的信息相關(guān)的信息,據(jù)此從媒體庫(kù)中選出相關(guān)的節(jié)目,推薦給用戶。本發(fā)明還提供一種節(jié)目選擇方法。本發(fā)明能快速、有效地為用戶提供其喜好的節(jié)目選擇,向用戶推薦喜歡的節(jié)目。
文檔編號(hào)H04N5/445GK1916893SQ20051009322
公開(kāi)日2007年2月21日 申請(qǐng)日期2005年8月19日 優(yōu)先權(quán)日2005年8月19日
發(fā)明者伊藤榮朗, 桑原禎司, 黑田昌芳, 虞立群, 陳奕秋, 陳林 申請(qǐng)人:株式會(huì)社日立制作所, 上海交通大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
翁牛特旗| 微博| 扶余县| 永定县| 驻马店市| 武冈市| 平江县| 子洲县| 金溪县| 大渡口区| 米林县| 衡阳县| 临猗县| 云霄县| 通许县| 阳泉市| 池州市| 德清县| 嘉善县| 嘉禾县| 芜湖市| 唐海县| 丽水市| 都昌县| 武宣县| 陈巴尔虎旗| 苍梧县| 延长县| 天水市| 弋阳县| 临泉县| 通城县| 于都县| 舞钢市| 安义县| 枝江市| 林州市| 高雄市| 峨眉山市| 太仆寺旗| 洛浦县|