欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

關聯(lián)內容檢索的制作方法

文檔序號:6553216閱讀:168來源:國知局
專利名稱:關聯(lián)內容檢索的制作方法
技術領域
本發(fā)明涉及內容檢索、管理和呈現(xiàn)的領域。
背景技術
存儲設備和數(shù)據(jù)庫的存儲容量,包括個人計算機上和其他類型存儲介質上的硬盤,近年來已經(jīng)快速地增大。存儲容量估計大約每12個月增大一倍,同時網(wǎng)絡帶寬也在非??焖俚卦龃?。結果,存儲設備存儲了較大量的內容,而用戶訪問這些內容必須變得更為方便。沒有按照對用戶透明的方式編索引或組織的內容可能被“丟失”,這與用戶所關心的需求相去甚遠,并且這些內容不太可能被檢索。另一方面,用戶可以由于存儲在存儲設備或數(shù)據(jù)庫上的內容而負擔過重,并且不能檢索網(wǎng)絡(例如,因特網(wǎng))上可用的內容,除非內容以某種方式進行管理或組織,以便為用戶提供便利的訪問。
存在各種數(shù)據(jù)檢索的方案。Platt的公開號為2003/0221541的美國專利公開了一種自動播放表發(fā)生器,其中,包括“不需要的種子”歌曲的多個種子歌曲被用于產(chǎn)生播放表上的歌曲。Cluts的第5,618,876號美國專利公開了基于編輯預先為每首歌曲編寫的“風格標簽”來選擇類似第一組歌曲的額外歌曲。然而,這些參考文獻沒有公開向用戶提供不同于用戶指定的已標識內容項目的內容類型的內容。
當然用戶也可以檢索內容項目,然而試圖確定相似的項目卻可以是費時且費力的工作,尤其如果用戶不知道或未指定需要的項目的內容類型。而且,因為內容項目在用戶控制的存儲設備或數(shù)據(jù)庫中持續(xù)堆積,所以檢索內容項目的工作曾經(jīng)變得更加困難。

發(fā)明內容
提供實施或實現(xiàn)檢索系統(tǒng)功能的方法、系統(tǒng)、設備、引擎、裝置、以及計算機可讀介質。提取包括用戶選擇的第一內容項目的維度數(shù)據(jù)的第一說明數(shù)據(jù)。然后,提取包括備選內容項目的對應維度數(shù)據(jù)的備選說明數(shù)據(jù),每個備選內容項目的內容類型不同于用戶選擇的內容項目的內容類型??梢陨擅總€備選內容項目的第一組矢量值,每個矢量值表示第一說明數(shù)據(jù)的維度的維度數(shù)據(jù)與備選說明數(shù)據(jù)的相應維度數(shù)據(jù)之間的相似度。然后可以基于生成的第一組矢量值所表示的相似度,從多個備選內容項目中選擇一備選內容項目。選擇的備選內容項目或多個備選內容項目然后通過檢索系統(tǒng)來提供,例如經(jīng)由用戶接口。
維度數(shù)據(jù)的維度表示項目的內容類型、項目的內容風格、項目的流派、項目的元數(shù)據(jù)、項目的使用歷史、項目中表演的表演者、與項目有關的導演、與項目有關的創(chuàng)建者、或項目的再現(xiàn)(rendering)要求。正如在此使用的,元數(shù)據(jù)可以包括項目的創(chuàng)建時間、項目的創(chuàng)建地點、項目的獲取時間、和/或項目的獲取地點。
可以只是在第一組矢量值所表示的總相似度超過最小閾值時才選擇備選內容項目。
可以選擇正如第一組矢量值所表示的具有最高總相似度的備選內容項目。
可以標識添加的內容項目。提取包括第二已標識內容的維度數(shù)據(jù)的說明數(shù)據(jù),所述第二已標識內容項目與第一已標識內容項目集合在一起。然后還基于第二組矢量值,選擇備選內容項目,所述第二組矢量值表示第二已標識內容項目的維度數(shù)據(jù)與相似備選內容項目的維度數(shù)據(jù)之間的相似度。因此,可以選擇備選內容項目,以便第一組矢量值和第二組矢量值被求平均值、求加權平均值、或相加。
還可以挑選公共矢量用于加權的結果。選擇公共矢量,即表示第一已標識內容項目的維度數(shù)據(jù)最接近第二已標識內容項目的維度的矢量,并且在選擇備選內容項目中,可以加權公共矢量的值,使其大于第一組矢量值和第二組矢量值的其余矢量值。
可以構造有效內容(virtual content)項目。提取包括用戶選擇的第一和第二內容項目的維度數(shù)據(jù)的說明數(shù)據(jù)。提取包括備選內容項目的對應維度數(shù)據(jù)的備選說明數(shù)據(jù),每個備選內容項目的內容類型不同于用戶選擇的內容項目的內容類型。然后通過平均或加權平均矢量值的有效項目組來構造有效項目,矢量值的有效項目組中的每個矢量值表示第一說明數(shù)據(jù)的維度數(shù)據(jù)的維度與第二說明數(shù)據(jù)的維度數(shù)據(jù)的對應維度之間的相似度??梢陨擅總€備選內容項目的第一組矢量值,每個矢量值表示有效內容項目的維度的維度數(shù)據(jù)與備選內容項目的相應維度數(shù)據(jù)之間的相似度。因此可以通過如下方式從這些備選內容項目中選擇一個備選內容項目,即通過計算這些備選內容項目的每組矢量值的平均值或加權平均值或總和作為測試值,以及確定其測試值超過閾值的備選內容項目作為被選擇的備選內容項目。提供選擇的備選內容項目或多個備選內容項目。


圖1是根據(jù)本發(fā)明實施例的檢索系統(tǒng)的總示意圖。
圖2A-2C是根據(jù)本發(fā)明的系統(tǒng)的工作流程圖。
圖3示出了根據(jù)本發(fā)明實施例的矢量值的數(shù)據(jù)圖表。
具體實施例方式
以下討論和前述附圖描述了發(fā)明人目前認為最易理解的申請人發(fā)明的實施例,然而將要理解的是,在不脫離本發(fā)明精神的前提下,本發(fā)明的許多修改是可能的,并且本發(fā)明可以體現(xiàn)為其他的形式,并可以用其他的方法來實現(xiàn)。而且,所述實施例的特征在不脫離本發(fā)明精神的前提下,可以被省略、有選擇地或整體上與其他實施例進行組合,或者用于代替其他實施例的特征或其部分特征。附圖和詳細說明因此被認為是對本發(fā)明各個方面的說明性解釋,而不應被認為限制本發(fā)明的范圍。
如圖1所示,檢索系統(tǒng)1-1包括多個模塊,這些模塊將在下面進行說明。檢索系統(tǒng)1-1的模塊,或者它的部分、和/或整個檢索系統(tǒng),可以由硬件、軟件、固件、或前述項目的組合組成,然而,一些模塊例如可以由硬件組成,而其他模塊可以由軟件、固件或其組合組成。
應該理解,檢索系統(tǒng)的模塊不必都與相同的設備布置在一起或集成為一體。還打算將分布式體系結構用于檢索系統(tǒng),其可以“背載(piggy-back)”由現(xiàn)有設備提供的適宜模塊。
下面的說明將參照檢索系統(tǒng)1-1,而所述檢索系統(tǒng)1-1在物理上與數(shù)據(jù)庫1-2集成為一體,或經(jīng)由有線或無線連接與數(shù)據(jù)庫1-2連接。數(shù)據(jù)庫1-2可以體現(xiàn)在存儲設備上,例如個人計算機、個人錄像機、娛樂系統(tǒng)、電子管理器、個人手持設備、Jaz驅動器的硬盤,或可以體現(xiàn)為商用存儲設備,例如磁盤驅動器。應該理解,數(shù)據(jù)庫1-2可以包括多個連接的存儲設備,從而可以在兩個或更多這種設備上管理或集合內容項目。還應理解的是,可以認為數(shù)據(jù)庫包括一個或多個存儲介質,例如盤,包括CD、DVD、zip盤、軟盤、盒式數(shù)據(jù)磁帶、或相似的東西,它們可以被加載到數(shù)據(jù)庫1-2上,并可以由數(shù)據(jù)庫1-2進行檢索。然而應該理解,檢索系統(tǒng)1-1還能夠經(jīng)由網(wǎng)絡1-9檢索內容,例如LAN、WAN、因特網(wǎng)等。
如圖1所示,檢索系統(tǒng)1-1包括說明數(shù)據(jù)提取器1-11,其是從內容項目中收集某些類型數(shù)據(jù)的模塊。該內容項目可以是視頻、或視頻片段、電影、照片、文本文件、音樂數(shù)據(jù)、音頻文件或其他類型的多媒體數(shù)據(jù)、JPEG文件、或XML數(shù)據(jù)。例如,視頻可以是數(shù)字錄像機拍攝的家庭錄像,電影可以是商業(yè)分配的影片數(shù)據(jù),例如編碼為MPEG(包括MPEG-2、MPEG-3等)的影片,照片可以是數(shù)字照片數(shù)據(jù)、或系列的照片或影集,文本文件可以是文字處理軟件形成的文件、電子表格、或計算機代碼文件,音樂數(shù)據(jù)可以是MP3文件等,以及其他等等。
說明數(shù)據(jù)提取器1-11提取的說明數(shù)據(jù)包括關于內容項目的信息。這種說明數(shù)據(jù)描述內容項目的維度。這種維度可以包括下列內容中的任何一項或多項內容內容類型,包括介質,例如視頻、音頻、照片、文本文件等;內容風格或流派,例如假期電影、個人風景攝影、爵士樂等;項目的元數(shù)據(jù),例如項目的創(chuàng)建時間和/或地點,項目的獲取時間和/或地點;項目的使用歷史(例如,播放和/或編輯的最后一次/第一次/倒數(shù)第二次等的時間和/或地點和/或環(huán)境),大多數(shù)使用的時間周期(例如,該項目主要在晚上使用,或在星期一下午使用,或在上午的6-8點鐘使用等),項目的獲取時間,項目的創(chuàng)建地點,項目的獲取地點,最后一次使用的地點,以及大多數(shù)使用的地點(例如,項目主要在客廳使用,或在用戶的家里使用等);這種使用歷史數(shù)據(jù)有時稱為元數(shù)據(jù),反之,多種元數(shù)據(jù)有時稱為使用歷史數(shù)據(jù);以及與內容項目有關的演員、導演、創(chuàng)建者、畫家、表演者、攝影師等。
應該理解,關于項目的這種說明數(shù)據(jù)可以用各種方法來確定和提取,包括從項目中、從索引或數(shù)據(jù)庫管理文件中、或從外部來源(例如,經(jīng)由到因特網(wǎng)1-9的有線或無線連接,從檢索系統(tǒng)1-1所連接的萬維網(wǎng))中確定和提取這種說明數(shù)據(jù)。
可以用多個方法中的一種方法標識已標識的內容項目。用戶可以指定檢索其他項目(有時稱為“備選內容項目”)所基于的項目??商鎿Q地,新添加或創(chuàng)建的內容項目可以被自動指定為已標識的內容項目,而基于該已標識內容項目來檢索其他項目。
基于說明數(shù)據(jù)提取器1-11提取的說明數(shù)據(jù)的這些編輯維度,內容項目標識符1-12通過網(wǎng)絡連接或從其他源,在數(shù)據(jù)庫中標識關于它們的說明數(shù)據(jù)的這些維度相似于第一已標識內容項目的備選內容項目。通過按照如下方式給很多矢量中的每一個矢量分配矢量值,矢量構造器1-13然后創(chuàng)建第一組矢量值每個矢量對應于一個維度,并且矢量的值反映第一已標識內容項目的維度與備選內容項目的相似度或匹配程度。
例如,如果已標識的內容項目和備選內容項目的流派都是相同的,例如都是“西班牙假期”,則對應于內容項目稱為風格或流派的維度的矢量將取高值。1或0的矢量值指示第一已標識內容項目與備選內容項目之間的具體維度幾乎沒有相關性或幾乎不匹配,而9或10的矢量值可以指示高的相似度或匹配程度。例如,當兩個內容項目都具有“西班牙假期”的流派時,則將為對應于流派維度的矢量分配9或10的值。可替換地,代替使用1-10的標度,矢量值可以僅僅表示維度的“強”、“正?!薄⒒颉叭酢逼ヅ?。應該理解,在不脫離本發(fā)明精神的前提下,可以使用這種矢量值的其他方案。然后將計算一對內容項目的這種一組矢量值的平均值或總和,作為兩個內容項目之間的總相似度。
如果第二已標識內容項目是可用的,則矢量構造器1-13可以基于說明數(shù)據(jù)提取器1-11提取的第二內容的說明數(shù)據(jù),類似地構造第二組矢量值,從而此第二組矢量值表示此第二已標識內容項目與備選內容項目的對應維度之間的相似度??梢源嬖谔砑拥目捎靡褬俗R內容項目。因此,提取說明數(shù)據(jù)和生成矢量值組的處理,可以針對任意數(shù)量的可用已標識內容項目1-N進行重復,N是大于1的正整數(shù)。然后,基于所有這種生成的矢量值組、或它們的平均值,執(zhí)行備選內容項目的選擇。
如果一個以上的已標識內容項目可用,則公共矢量發(fā)生器/閾值設置器1-14可以選擇第一組和第二組矢量值一貫高的一個或多個矢量。這種矢量值然后可以被加權,使表示兩個項目之間總相似度的這組矢量值的平均值或總和大于其他矢量的值。用這種方法,表示第一和第二已標識內容項目、或用于捕獲(capture)第一和第二已標識內容項目之間相似性并且因而是集合的特征的維度,將被加權,使其大于其他的矢量值。雖然顯示為單個模塊1-14的一部分,但是分離的模塊、公共矢量發(fā)生器模塊和閾值設置器模塊可以構造為檢索系統(tǒng)1-1的一部分,或者這些模塊可以并入其他模塊。
有效項目構造器1-15將在下面討論本發(fā)明實施例工作的環(huán)境中進行描述。
內容項目選擇器1-16選擇要提供給用戶的備選內容項目或多個備選內容項目。此模塊還可以處理檢索系統(tǒng)工作所必需的其他任務,例如全面控制和協(xié)調檢索系統(tǒng)1-1的模塊。
檢索結果輸出1-17與其他設備接口,并與外部進行通信,包括與用戶(未示出)接口。尤其是檢索結果輸出1-17發(fā)出關于檢索系統(tǒng)1-1所檢索的內容項目的用戶接口的信號。用戶接口1-3可以是分離的設備,或可以與另一設備或系統(tǒng)集成為一體,例如個人計算機或個人錄像機、或一個或多個存儲器和上面列舉的其他設備。
現(xiàn)在將參照圖1-3描述本發(fā)明實施例的工作。如上所述,通過用戶經(jīng)由圖1所示的用戶接口1-3,或通過系統(tǒng)自動地,例如,通過檢測數(shù)據(jù)庫1-2中新增的內容項目或隔離的內容項目,第一內容項目被標識。
檢索系統(tǒng)1-1的說明數(shù)據(jù)提取器1-11提取已標識的第一內容項目的第一說明數(shù)據(jù),如圖2A的S1所述。圖3示出的標注為6-11的方框指的是已標識的內容項目1。在S2,編輯第一已標識內容項目的每個維度的維度數(shù)據(jù)。應該理解,根據(jù)用戶的需要,多個或所有上述已標識的維度可以是更相關的,而其他的維度可以是完全不相關的,且不被根據(jù)本發(fā)明的檢索系統(tǒng)使用。而且,在此未明確敘述的其他維度具體可以是相關的,且可以被檢索系統(tǒng)1-1使用。
如果添加的第二已標識內容項目(在圖3中表示為6-12)可用或已經(jīng)被識別,則執(zhí)行步驟S3和S4在S3提取該已標識內容項目的說明數(shù)據(jù),并且在S4,編輯第二已標識內容項目的每個維度的維度數(shù)據(jù)。如圖3所示,很多內容項目可以被標識為內容檢索的基礎。圖3示出了第一已標識內容項目(6-11)、第二已標識內容項目(6-12)、以及已標識的內容項目N(6-14)。因此,此處理將針對第1個-第N個內容項目中的每個內容項目進行重復。
圖1的內容項目標識符1-12標識網(wǎng)絡上或其它地方的數(shù)據(jù)庫1-2中備選內容項目,而說明數(shù)據(jù)提取器1-11在S5(圖2A)提取每個備選內容項目的說明數(shù)據(jù),并且在S6編輯每個備選內容項目的維度數(shù)據(jù)。如果發(fā)現(xiàn)第二備選內容項目(表示為方框6-22),則在S7執(zhí)行提取第二備選內容項目的對應說明數(shù)據(jù)的處理,然后在S8執(zhí)行第二備選內容項目的維度數(shù)據(jù)的編輯。
根據(jù)本發(fā)明的一方面,在S9,根據(jù)系統(tǒng)的設置或根據(jù)用戶的設置或當前的命令,可以決定要構造有效項目作為確定備選內容項目的相似性的基礎,而在這樣情況下,將進行圖2C所示的處理。否則,將進行圖2B所示的處理。
基于每個已標識內容項目的每個維度與每個備選內容項目對應維度的相似性或匹配,矢量構造器1-13構造矢量值,如圖2B的S11所示。圖3示出了表6-1,其具有一組矢量6-3,該組矢量的值反映第一已標識內容項目6-11與第一備選內容項目6-21的對應維度的相似度。類似地,一組矢量值6-4反映第一已標識內容項目6-11與第二備選內容項目6-22的維度的相似性。就第二已標識內容項目6-12而言,矢量值組6-5反映了第一備選內容項目6-21的對應維度的相似度,矢量值組6-6反映了第二已標識內容項目6-12與備選內容項目6-22的維度之間的相似度。
每組矢量值還可以包括在S12基于這組矢量值的算術平均值、眾數(shù)(mode)、中值或總和的計算而確定的平均矢量值,其反映了一對內容項目的平均相似性。因此,例如,圖3的矢量值6-3可以包括第一矢量值、第二矢量值、和第h個矢量值,以及這組矢量值的平均值。
其他標識的內容項目也可以是可用的,并且將繼續(xù)進行基于與備選內容項目對應維度的相似性而提取維度數(shù)據(jù)并找到一組矢量值的過程。圖3的方框1-14示出了已標識的內容項目N。
而且,可以找到其他備選內容項目,并且對于每一個,可以為每個已標識的內容項目計算矢量值組。方框6-23指的是這種備選內容項目M。
根據(jù)本發(fā)明的實施例,在S13,基于已標識內容項目之間維度的相似性確定公共矢量值組。因此,大多數(shù)相似的維度被標識,并且代表性的矢量可以被加權,使其大于其他的矢量,或者可以被專門使用。用這種方法,表示第一和第二(以及添加的)已標識內容項目的、因而用于捕獲已標識內容項目之間相似性的、并且因此是正在形成的集合的特征的維度,將被加權,使其大于其他的矢量值,或將其專門用于確定相似的備選內容項目。
在S14,可以計算另一組矢量值6-8,其通過平均或相加備選內容項目6-21的對應矢量值反映了每個備選內容項目的每個維度的總體相似度。因此,例如通過相加或平均該備選內容項目(欄6-2)的每組矢量值的對應矢量值,獲得第一備選內容項目與該維度的已標識內容項目的總相似度。而且,組6-8的所有矢量值可以被相加或求平均值,以便獲取該備選內容項目的總相似性值。
應該理解,在此采用的平均值可以包括算術平均值、眾數(shù)、中值或提供所選值的組合視圖(composite view)而適合選擇的多個這種其他統(tǒng)計函數(shù)。而且,可以使用值的簡單總和以及多個這種統(tǒng)計函數(shù)。根據(jù)內容項目的類型,并根據(jù)數(shù)據(jù)庫和用戶的需要,該內容項目的某些維度都可以比其它的維度更重要,為此原因可以利于加權對應于某些維度的矢量,使其大于其它維度的對應矢量。這些因子被加權的程度取決于應用和用戶的需要。
一旦生成了總相似性組6-8的矢量值,則最小相似性閾值可被用來排除不相似的備選內容項目,如圖2B的S15所示。
另外,還應留意,可以根據(jù)用戶的需要和應用,針對各種矢量采用不同的閾值。因此,矢量值滿足或超過閾值的備選內容項目被組群管理器1-17與已標識的內容項目集合在一起,而拒絕其他的備選內容項目。可替換地,可以選擇最相似的備選內容項目或預定數(shù)量的最相似的備選內容項目與已標識的內容項目集合在一起,而可以拒絕其余的備選內容項目。
根據(jù)本發(fā)明的一個方面,檢索到的內容項目的內容類型不同于用戶選擇的內容項目的內容類型。例如,如果所述用戶選擇的內容項目的類型是音樂文件、或MP3,則檢索到的內容項目的內容類型可以是攝影數(shù)據(jù)。用這種方法,例如,某個流派的畫可以被檢索,以便匹配用戶選擇的同一流派的音樂。
這個(或這些)選擇的備選內容項目在S16被提供給用戶或用戶接口1-3??梢韵驍?shù)據(jù)庫1-2直接提供促使到該數(shù)據(jù)庫或到用戶接口1-3檢索選擇的備選項目的信號??梢韵蛴脩艚涌?-3提供通知,以便通知用戶(未示出)可檢索的內容項目。該通知可以包括要檢索的內容項目的標識、內容項目的說明、內容項目的URL或鏈接、對整個內容項目或部分內容項目的檢索、或前述事項的組合。在S17,過程結束。
圖2C示出了根據(jù)本發(fā)明一個方面的另一個過程,其使用有效內容項目。在S21,有效項目構造器1-15分析尋找集合所基于的已標識內容項目的維度。然后在S22,基于已標識內容項目的平均維度或加權平均維度,構造所有已標識內容項目的代表性內容項目(稱為有效內容項目6-15)。例如,如果所有已標識內容項目的流派都是“西班牙假期”,則有效內容項目將把“西班牙假期”作為它的流派。然后在S23,基于此有效內容項目與備選內容項目的維度的相似性,生成矢量值組6-7。在S24,在選擇中應用閾值,選擇相似的備選內容項目,或選擇得分最高的備選內容項目或多個備選內容項目。
在S25,基于使用閾值處理選擇作為相似的備選內容項目,或基于選擇的預定數(shù)量的最相似備選內容項目,如所述,檢索結果輸出1-17提供通知信號。在S26,處理結束。
例如,假定用戶正在編輯數(shù)據(jù)庫中表示最新西班牙假期的攝影的數(shù)字數(shù)據(jù),并想要檢索另一連接的存儲介質中的或因特網(wǎng)上可用的數(shù)據(jù)庫中可用的具有西班牙主題的其他內容項目。用戶可以經(jīng)由用戶接口1-3,選擇三個照片分別作為已標識的內容項目1、已標識的內容項目2和已標識的內容項目3。檢索系統(tǒng)于是將檢索作為所選備選內容項目而發(fā)現(xiàn)的表示西班牙音樂的數(shù)據(jù)文件。用戶未必記得西班牙音樂的存在,或到數(shù)據(jù)庫1-2的哪里尋找它,而實際上該數(shù)據(jù)文件已經(jīng)被訪問數(shù)據(jù)庫1-2的另一用戶添加了,或者可能已被檢索系統(tǒng)1-1從另一存儲設備或從萬維網(wǎng)檢索到。在任何情況下,用戶此刻將被告知檢索到的內容項目,和/或檢索到的內容項目將與用戶選擇的內容項目相關聯(lián)。用戶于是將能夠邊看西班牙假期的攝影,邊聽西班牙音樂。
在前述描述中提供的本發(fā)明實施例僅僅用于作為說明性的例子。然而應該理解,本發(fā)明的范圍在權利要求中提供。
權利要求
1.一種內容檢索方法,包括提取(S1)第一說明數(shù)據(jù),所述第一說明數(shù)據(jù)包括第一用戶選擇的內容項目的維度數(shù)據(jù);提取(S5)備選說明數(shù)據(jù),所述備選說明數(shù)據(jù)包括備選內容項目的對應維度數(shù)據(jù),每個備選內容項目的內容類型不同于用戶選擇的內容項目的內容類型;生成(S11)每個備選內容項目的第一組矢量值,每個矢量值表示第一說明數(shù)據(jù)的維度的維度數(shù)據(jù)與備選說明數(shù)據(jù)的對應維度數(shù)據(jù)之間的相似度;基于由生成的第一組矢量值所表示的相似度,從備選內容項目中選擇(S15)備選內容項目;以及提供(S16)選擇的備選內容項目。
2.權利要求1的方法,其中,維度數(shù)據(jù)的維度表示以下之一項目的內容類型、項目的內容風格、項目的流派、項目的使用歷史、項目中表演的表演者、與項目有關的導演、與項目有關的創(chuàng)建者、項目的再現(xiàn)要求、以及項目的任何元數(shù)據(jù)。
3.權利要求2的方法,其中,元數(shù)據(jù)表示以下之一項目的創(chuàng)建時間、最后一次使用的時間、大多數(shù)使用的時間周期、項目的獲取時間、項目的創(chuàng)建地點、項目的獲取地點、最后一次使用的地點、以及大部分使用的地點。
4.權利要求1的方法,其中,只有在由第一組矢量值所表示的總相似度超過最小閾值時才選擇備選內容項目。
5.權利要求1的方法,其中,選擇具有如第一組矢量值所表示的最高總相似度的備選內容項目。
6.權利要求1的方法,還包括提取(S3)說明數(shù)據(jù),所述說明數(shù)據(jù)包括第N個已標識內容項目的維度數(shù)據(jù),所述第N個已標識內容項目與第一已標識內容項目集合在一起,N是大于1的任何正整數(shù);以及還基于第N組矢量值自動選擇(S15)備選內容項目,所述第N組矢量值表示第N個已標識內容項目的維度數(shù)據(jù)與相似備選內容項目的維度數(shù)據(jù)之間的相似度。
7.權利要求6的方法,其中,選擇備選內容項目,以便第一組矢量值和第N組矢量值被執(zhí)行以下之一的操作求平均值、求加權平均值、和相加。
8.權利要求6的方法,包括選擇表示第一已標識內容項目的維度數(shù)據(jù)最接近第N個已標識內容項目的維度的矢量作為公共矢量,并且在選擇備選內容項目中,加權公共矢量的值,使其大于第一組矢量值和第N組矢量值的其余矢量值。
9.一種內容檢索方法,包括提取(S1)第一說明數(shù)據(jù),所述第一說明數(shù)據(jù)包括第一用戶選擇的內容項目的維度數(shù)據(jù);提取(S3)第N個說明數(shù)據(jù),所述第N個說明數(shù)據(jù)包括第N個用戶選擇的內容項目的維度數(shù)據(jù),N是大于1的正整數(shù);提取(S5)備選說明數(shù)據(jù),所述備選說明數(shù)據(jù)包括備選內容項目的對應維度數(shù)據(jù),每個備選內容項目的內容類型不同于用戶選擇的內容項目的內容類型;通過對矢量值的有效項目組執(zhí)行求平均值和求加權平均值其中之一,構造(S22)有效項目,矢量值的有效項目組中的每個矢量值表示第一說明數(shù)據(jù)的維度數(shù)據(jù)的維度與第N個說明數(shù)據(jù)的維度數(shù)據(jù)的對應維度之間的相似度;生成(S23)每個備選內容項目的一組矢量值,每個矢量值表示有效內容項目的維度的維度數(shù)據(jù)與備選內容項目的對應維度數(shù)據(jù)之間的相似度;通過如下方式從備選內容項目中選擇(S24)一個備選內容項目,即通過計算備選內容項目的每組矢量值的平均值、加權平均值和總和其中之一作為測試值,以及確定其測試值超過閾值的備選內容項目作為被選擇的備選內容項目;以及提供(S25)選擇的備選內容項目。
10.一種內容檢索系統(tǒng),包括說明數(shù)據(jù)提取器(1-11),被配置成提取包括第一用戶選擇的內容項目的維度數(shù)據(jù)的第一說明數(shù)據(jù);所述說明數(shù)據(jù)提取器(1-11)還被配置成提取包括備選內容項目的對應維度數(shù)據(jù)的備選說明數(shù)據(jù),每個備選內容項目的內容類型不同于用戶選擇的內容項目的內容類型;矢量發(fā)生器(1-13),被配置成生成每個備選內容項目的第一組矢量值,每個矢量值表示第一說明數(shù)據(jù)的維度的維度數(shù)據(jù)與備選說明數(shù)據(jù)的對應維度數(shù)據(jù)之間的相似度;內容項目選擇器(1-16),被配置成基于由生成的第一組矢量值所表示的相似度,從備選內容項目中選擇一個備選內容項目;以及檢索結果輸出(1-17),被配置成提供所選擇的備選內容項目。
11.權利要求10的系統(tǒng),其中,維度數(shù)據(jù)的維度表示以下之一項目的內容類型、項目的內容風格、項目的流派、項目的使用歷史、項目中表演的表演者、與項目有關的導演、與項目有關的創(chuàng)建者、項目的再現(xiàn)要求、以及項目的任何元數(shù)據(jù)。
12.權利要求11的系統(tǒng),其中,元數(shù)據(jù)表示以下之一項目的創(chuàng)建時間、最后一次使用的時間、大多數(shù)使用的時間周期、項目的獲取時間、項目的創(chuàng)建地點、項目的獲取地點、最后一次使用的地點、以及大部分使用的地點。
13.權利要求10的系統(tǒng),其中,所述內容項目選擇器(1-16)被配置成只有在由第一組矢量值所表示的總相似度超過最小閾值時才選擇備選內容項目。
14.權利要求10的系統(tǒng),其中,所述內容項目選擇器(1-16)被配置成選擇具有如第一組矢量值表示的最高總相似度的備選內容項目。
15.權利要求10的系統(tǒng),其中,所述說明數(shù)據(jù)提取器(1-11)被配置成提取包括第N個已標識內容項目的維度數(shù)據(jù)的說明數(shù)據(jù),所述第N個已標識內容項目與第一已標識內容項目集合在一起,N是大于1的正整數(shù),以及所述內容項目選擇器(1-16)被配置成還基于第N組矢量值,自動選擇備選內容項目,所述第N組矢量值表示第M個已標識內容項目的維度數(shù)據(jù)與相似備選內容項目的維度數(shù)據(jù)之間的相似度。
16.權利要求15的系統(tǒng),其中,所述內容項目選擇器(1-16)被配置成選擇備選內容項目,以便第一組矢量值和第N組矢量值被執(zhí)行以下之一的操作求平均值、求加權平均值、和相加。
17.權利要求15的系統(tǒng),還包括公共矢量發(fā)生器/閾值設置器(1-14),被配置成選擇表示第一已標識內容項目的維度數(shù)據(jù)的維度最接近第N個已標識內容項目的矢量作為公共矢量,其中,所述內容項目選擇器(1-16)被配置成基于加權公共矢量的值大于第一組矢量值和第N組矢量值的其余矢量值,來選擇備選內容項目。
全文摘要
提供了一種檢索系統(tǒng)。提取包括第一已標識內容項目的維度數(shù)據(jù)的第一說明數(shù)據(jù)。此處理可以對添加的可用已標識內容項目重復進行。提取備選說明數(shù)據(jù)。然后,可以生成每個備選內容項目的一組矢量值,每個矢量值表示第一說明數(shù)據(jù)的維度(例如,元數(shù)據(jù)、使用歷史、流派、內容類型)的維度數(shù)據(jù)與備選說明數(shù)據(jù)的對應維度數(shù)據(jù)之間的相似度??梢曰谟缮傻倪@組矢量值所表示的相似度,從備選內容項目中選擇相似的備選內容項目,并提供所述的相似備選內容項目。
文檔編號G06F17/30GK101069183SQ200580041418
公開日2007年11月7日 申請日期2005年11月30日 優(yōu)先權日2004年12月1日
發(fā)明者E·M·A·迪德里克斯, B·M·范德斯盧伊斯 申請人:皇家飛利浦電子股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
德令哈市| 舟山市| 民丰县| 武乡县| 永靖县| 彝良县| 旅游| 西宁市| 凌海市| 郯城县| 左贡县| 武清区| 青河县| 杂多县| 江油市| 阳谷县| 辽阳县| 吉木乃县| 遵义县| 常熟市| 盐源县| 车险| 滦南县| 鄂尔多斯市| 澳门| 景宁| 沽源县| 繁昌县| 墨脱县| 乐陵市| 许昌市| 玉田县| 晋中市| 新昌县| 改则县| 特克斯县| 抚宁县| 滨州市| 龙门县| 兴文县| 吴江市|