專利名稱:基于雜亂數(shù)據(jù)的多媒體對象元數(shù)據(jù)的快速檢索的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種為多媒體對象獲取元數(shù)據(jù)的方法,它通過把該多媒體對象的對象指紋與在基本數(shù)據(jù)庫中存儲的項相匹配而實(shí)現(xiàn)所述獲取。
本發(fā)明另外涉及一個系統(tǒng),它被安排用于為多媒體對象獲取元數(shù)據(jù),該系統(tǒng)包括匹配裝置,用于把多媒體對象的對象指紋與在基本數(shù)據(jù)庫中存儲的項相匹配。
背景技術(shù):
使用人的指紋來識別一個人已經(jīng)有一百多年了。從概念上說,可以把指紋視為是一個簡短的概括,它對于每一個人來說是唯一的。近來,在多媒體處理的領(lǐng)域中出現(xiàn)一種日漸增加的興趣,即計算諸如歌曲、音樂、圖片、或電影的多媒體對象的指紋。為證明兩個多媒體對象相同,不是比較多媒體對象自身,而只比較它們的指紋。多媒體對象的指紋是所涉及的對象的最相關(guān)的感性特征的表示。這種指紋有時也稱為“(強(qiáng)壯的)雜亂數(shù)據(jù)(hashes)”。
在使用指紋技術(shù)的大多數(shù)系統(tǒng)中,大量多媒體對象的指紋連同它們相關(guān)的各自的元數(shù)據(jù)都存儲在數(shù)據(jù)庫中。術(shù)語“元數(shù)據(jù)”指的是諸如標(biāo)題、藝術(shù)家、類型等的多媒體對象的信息。多媒體對象的無數(shù)據(jù)是通過計算它的指紋和使用計算的指紋作為查閱關(guān)鍵字或查詢參數(shù)在數(shù)據(jù)庫中執(zhí)行查閱或查詢來檢索的。然后該查閱返回與該指紋關(guān)聯(lián)的元數(shù)據(jù)。
在數(shù)據(jù)庫中存儲多媒體對象指紋來代替存儲多媒體內(nèi)容自身具有若干優(yōu)點(diǎn)?,F(xiàn)在列舉幾個1.減少對數(shù)據(jù)庫的內(nèi)存儲器(memory)/外存儲器(storage)的要求。
2.比較指紋要比比較多媒體對象自身更有效,因為指紋比對象小很多。
3.在數(shù)據(jù)庫中檢索來匹配指紋比檢索查找完整的多媒體對象更高效,因為它涉及匹配較短的項。
4.檢索匹配指紋更容易成功,因為多媒體對象的少量改變(諸如以不同格式編碼或者改變位速率)不影響指紋。
產(chǎn)生多媒體對象的指紋的一種方法的例子在國際專利申請WO02/065782(代理人卷宗號PHNL010110)中以及在Jaap Haitsma,TonKaller和Job Oostveen在2001年9月在Brescia舉行的Internationa1 Workshop on Content-Based Multimedia Indexing(關(guān)于基于內(nèi)容的多媒體索引的研討班)上發(fā)表的“Robust AudioHashing For Content Identification”(內(nèi)容識別用的強(qiáng)壯的音頻散列)中公開。
可以使用這一方法來提供音樂識別服務(wù)。假設(shè)一個人聽到一首歌,而且他希望知道這首歌的諸如標(biāo)題和藝術(shù)家的元數(shù)據(jù)。他拿出他的移動電話,建立起與服務(wù)器的連接。使用這一連接,該用戶然后使用他的電話的話筒對這首歌拾音,以便在另一端的服務(wù)器可以聽見它。服務(wù)器然后計算為這首歌的指紋,并執(zhí)行數(shù)據(jù)庫查閱來獲取與該指紋關(guān)聯(lián)的元數(shù)據(jù)。然后服務(wù)器例如通過SMS(短信息)給用戶的移動電話發(fā)送一個帶元數(shù)據(jù)的消息。
該元數(shù)據(jù)可以對該用戶的電子郵件地址進(jìn)行電子郵寄,或者通過消息速報服務(wù)以消息的形式發(fā)送給該用戶。以這種方式,可以比移動電話有限潛在的功能所能作的處理提供更廣泛的信息。然后移動電話可以例如收到表明標(biāo)題和藝術(shù)家的SMS消息,以及有關(guān)更多信息已發(fā)送到該用戶的電子郵件地址的一項聲明。
為能夠識別大量多媒體對象,帶有指紋和元數(shù)據(jù)的數(shù)據(jù)庫必須非常大,其數(shù)量級在幾十萬項。這使得管理數(shù)據(jù)庫非常復(fù)雜。經(jīng)常是在這種大規(guī)模的系統(tǒng)中,指紋數(shù)據(jù)庫必須被分散在相當(dāng)大數(shù)量的指紋服務(wù)器上以能夠處理所有的檢索請求和存儲所有指紋。此外,該數(shù)據(jù)庫必須保持為最新的。例如,在音頻指紋的場合,必須添加新發(fā)行的歌曲的指紋。所需要的服務(wù)器和保持?jǐn)?shù)據(jù)庫為最新狀態(tài)這兩者都使得系統(tǒng)非常昂貴。
另外,因為在數(shù)據(jù)庫中有大量的項,因此查詢響應(yīng)時間可能變得很長。
本發(fā)明的一個目的是提供一種根據(jù)導(dǎo)言的方法,其中要減少獲取元數(shù)據(jù)的平均時間。
根據(jù)本發(fā)明以一種方法可實(shí)現(xiàn)這一目的,該方法的特征在于,為在傳輸通道上傳輸?shù)牧硪粋€多媒體對象中的一部分計算傳輸指紋;將該傳輸指紋與在基本數(shù)據(jù)庫中存儲的指紋相匹配;在成功匹配時,把該另一個多媒體對象的項添加到輔助數(shù)據(jù)庫中;通過將該指紋與在輔助數(shù)據(jù)庫中存儲的項相匹配而獲得元數(shù)據(jù);并且如果所述與輔助數(shù)據(jù)庫的匹配失敗則只通過與基本數(shù)據(jù)庫的匹配來獲取元數(shù)據(jù)。
當(dāng)以這種方式填充時,輔助數(shù)據(jù)庫只包含少量項,所有的項都是通過被監(jiān)視的通道傳輸?shù)膶ο?。因此與輔助數(shù)據(jù)庫的匹配將比與基本數(shù)據(jù)庫的匹配快。只當(dāng)在輔助數(shù)據(jù)庫中未找到匹配時才在基本數(shù)據(jù)庫中執(zhí)行匹配。因為預(yù)期許多針對通過被監(jiān)視的傳輸通道傳輸?shù)亩嗝襟w對象的請求將會到來,其結(jié)果是許多請求可以僅使用較小的和較快的輔助數(shù)據(jù)庫得到回答。所以,平均說來,匹配一個指紋所需要的時間減少。
在一個實(shí)施例中,所述方法另外包括接收多媒體對象的至少一部分,和對接收的部分計算指紋。在許多場合,根據(jù)本發(fā)明的方法由一個希望識別他所得知的多媒體對象的遠(yuǎn)端的第三方啟動。因為該方法通過在數(shù)據(jù)庫中匹配多媒體對象的指紋來獲取元數(shù)據(jù),因此必須以某種方式獲得該多媒體對象的指紋。
在本實(shí)施例中,用戶提供一部分多媒體對象,以便可以對該部分計算指紋。例如,用戶可以記錄幾秒鐘音頻并傳輸這個記錄下的音頻,或者通過電話連接傳輸幾秒鐘音頻。另一種替代方案是用戶自己首先計算指紋,然后把該指紋傳輸?shù)綀?zhí)行匹配的服務(wù)器,不過這一替代方案需要較復(fù)雜的客戶機(jī)。
在另外一個實(shí)施例中,另外的多媒體對象的項包括傳輸指紋。在傳輸期間,多媒體對象將總是要作某些修改。這意味著傳輸指紋將總是與在基本數(shù)據(jù)庫中的指紋稍微不同,盡管尚未不同到足以阻止匹配。然而,對象指紋很可能是對多媒體對象的一個低質(zhì)量部分計算的,該多媒體對象的低質(zhì)量部分例如是從無線電傳輸中通過空中以差的接收質(zhì)量在移動電話中接收后通過移動電話連接而記錄的。顯然這將會在記錄中引入許多另外的錯誤,從而導(dǎo)致更加不同的對象指紋。這將增加對象指紋可能與在基本數(shù)據(jù)庫中的指紋過于不同以致不能成功匹配的風(fēng)險,這是因為在無線電傳輸中固有的錯誤和源于低質(zhì)量記錄的錯誤。
在本實(shí)施例中,把對象指紋與傳輸指紋匹配,而不是與駐留在基本數(shù)據(jù)庫中的指紋匹配。這至少消除了某些不成功匹配,因為對象指紋與輔助數(shù)據(jù)庫中的指紋比起與基本數(shù)據(jù)庫中的指紋來其差異要小。
在另一個實(shí)施例中,另外的多媒體對象的項包括在基本數(shù)據(jù)庫中與傳輸指紋的項相匹配的指紋。這一實(shí)施例具有這時不需對整個另外的多媒體對象計算傳輸指紋的優(yōu)點(diǎn)。在找到一個匹配后,在基本數(shù)據(jù)庫中的項至少部分被復(fù)制到輔助數(shù)據(jù)庫,以便對象指紋可以與其匹配。
在另一個實(shí)施例中,為在各傳輸通道上傳輸?shù)亩鄠€另外的多媒體對象計算傳輸指紋。通過監(jiān)視多個通道,增加了用戶也正在監(jiān)聽的一個通道被監(jiān)視的機(jī)會。在對輔助數(shù)據(jù)庫增加一個相應(yīng)的項以后,可以更快地回答由該用戶對元數(shù)據(jù)的請求。
在另外一個實(shí)施例中,所述方法另外包括在傳輸監(jiān)視記錄文件中記錄獲得的元數(shù)據(jù)中的至少一部分和該傳輸通道的標(biāo)識符。通過查詢輔助數(shù)據(jù)庫以查找與一個特別的傳輸通道關(guān)聯(lián)的所有項,可以得到在該通道上的一個傳輸列表。該列表可以由版權(quán)交易所用來決定有多少版稅應(yīng)該付給特定的版權(quán)擁有者。
這種版稅經(jīng)?;趯σ粋€特定的歌曲被廣播的次數(shù)的估計,而該列表由公平的第三方提供精確的估計。無線電臺可能高估或者低估它廣播一個特定的歌曲的次數(shù),或者不愿意提供足夠的細(xì)節(jié)。當(dāng)然這一列表對許多其他目的也能是有價值的。
在另外一個實(shí)施例中,本方法另外包括在向輔助數(shù)據(jù)庫中增加與一個特別傳輸通道關(guān)聯(lián)的另外的多媒體對象的項時,從該輔助數(shù)據(jù)庫中清除與該特別的傳輸通道關(guān)聯(lián)的先前的項。以這種方式,輔助數(shù)據(jù)庫只填入先前通過至少一個傳輸通道被傳輸?shù)亩嗝襟w對象的項。以這種方式保持輔助數(shù)據(jù)庫盡可能小。
另外的一個目的是提供根據(jù)導(dǎo)言的系統(tǒng),其中可減少獲取元數(shù)據(jù)的平均時間。
根據(jù)本發(fā)明,這一目的在下述系統(tǒng)中實(shí)現(xiàn),所述系統(tǒng)的特征在于傳輸監(jiān)視裝置,用于記錄在一個傳輸通道上傳輸?shù)牧硪粋€多媒體對象的一部分;取指紋裝置,用于為該部分計算傳輸指紋;該匹配裝置被配置為將傳輸指紋與在基本數(shù)據(jù)庫中存儲的指紋相匹配,在成功匹配時在輔助數(shù)據(jù)庫中增加該另一個多媒體對象的項,并通過將該指紋與輔助數(shù)據(jù)庫中存儲的項相匹配來獲取元數(shù)據(jù),而如果對所述輔助數(shù)據(jù)庫的匹配失敗則只通過對基本數(shù)據(jù)庫匹配來獲得元數(shù)據(jù)。
在一個實(shí)施例中,該系統(tǒng)另外包括接收裝置,用于接收多媒體對象的至少一部分,取指紋裝置被安排為就所接收的部分計算對象指紋。
本發(fā)明另外涉及計算機(jī)程序產(chǎn)品,它被安排用于使處理器執(zhí)行本發(fā)明的方法。
參考附圖中表示的實(shí)施例,本發(fā)明的這些以及其他方面將十分顯然并且被說明。
圖1原理表示安排用于識別多媒體對象的系統(tǒng);圖2較為詳細(xì)地原理表示用于本系統(tǒng)中的服務(wù)器和數(shù)據(jù)庫;圖3原理表示服務(wù)器的另一個實(shí)施例。
在全部附圖中,同樣的參考號碼指示相似的或相應(yīng)的特征。在附圖中指明的某些特征通常以軟件實(shí)現(xiàn),而作為這種代表的軟件實(shí)體,諸如軟件模塊或者對象。
具體實(shí)施例方式
圖1原理表示安排用于識別多媒體對象的系統(tǒng)。該系統(tǒng)包括一個源100、移動電話110、電話網(wǎng)絡(luò)115、服務(wù)器120和數(shù)據(jù)庫121。源100提供多媒體對象101。優(yōu)選地多媒體對象101包括音頻信號,但視頻信號也一樣適合。這里所使用的術(shù)語多媒體對象指的是音樂、歌曲、電影、電視節(jié)目、圖片等。
在圖1的實(shí)施例中,源100是揚(yáng)聲器,雖然它當(dāng)然可以是任何種類的信號源。例如,源100可以是音頻裝置,像無線電設(shè)備,或視頻信號源。源100通常從另一源獲得它所提供的多媒體對象101。例如,無線電設(shè)備從空中或者從電纜連接接收廣播傳輸,并從該廣播傳輸產(chǎn)生/提供音頻信號。
用戶收聽多媒體對象101和希望對它有更多的了解,亦即他希望獲得多媒體對象101的元數(shù)據(jù)。術(shù)語元數(shù)據(jù)指為多媒體對象的諸如標(biāo)題、藝術(shù)家、類別等的信息。在許多情況下,這一元數(shù)據(jù)不與多媒體對象101一起提供。例如,多媒體對象101可以是酒館或商場的背景音樂,或者是無線電臺上廣播傳輸?shù)囊徊糠?。在無線電的情況下,經(jīng)常很難確切地聽到由DJ(主持人)或無線電節(jié)目主持人提供的元數(shù)據(jù),即使這一元數(shù)據(jù)最終被發(fā)表的話。
為獲得這一元數(shù)據(jù),用戶因而拿起他的移動電話110呼叫一個用于將他連接到服務(wù)器120的特別的電話號碼。通常這涉及到諸如電話網(wǎng)絡(luò)115這樣的中間體。當(dāng)連接到服務(wù)器120后,用戶對準(zhǔn)他的移動電話110,使得它拾取音頻信號101。然后把信號101通過電話連接傳輸?shù)椒?wù)器120。
然后服務(wù)器120為接收的信號101產(chǎn)生一個指紋。存在幾種可以用來計算這種多媒體指紋的技術(shù)。國際專利WO 02/065782(代理人卷宗號PHNL010110)說明一種方法,它為多媒體對象例如音頻片段產(chǎn)生多媒體指紋。把該音頻片段在連續(xù)的(最好是重疊的)時間間隔內(nèi)進(jìn)行分割。對于每一個時間間隔,將頻譜分割成頻帶。計算每一頻帶的強(qiáng)壯特性(例如能量),并用各自的指紋比特表示。
這樣,多媒體對象由包括級聯(lián)的二進(jìn)制值的指紋所表示,每一級聯(lián)的值是對于一個時間間隔的。為識別該多媒體對象,當(dāng)接收到具有一定長度的一部分,通常大約是3秒時,就計算指紋。然后把這一較小的指紋與完整的多媒體對象的指紋匹配(例如使用滑動窗技術(shù))。注意,一個多媒體對象可以具有多個相關(guān)的指紋。
使用計算的指紋,服務(wù)器120然后執(zhí)行在數(shù)據(jù)庫121中的數(shù)據(jù)庫查閱,所述數(shù)據(jù)庫包含一些先前計算的指紋和相關(guān)的元數(shù)據(jù)組,以獲得與該指紋關(guān)聯(lián)的元數(shù)據(jù)。服務(wù)器120這樣做的操作將在下面參考圖2解釋。
然后服務(wù)器120給用戶的移動電話110發(fā)送一個帶元數(shù)據(jù)的消息,諸如SMS消息。該元數(shù)據(jù)也可以向該用戶的一個電子郵件地址進(jìn)行電子郵寄,或者通過消息速報服務(wù)作為消息給該用戶發(fā)送。以這種方式,可以比移動電話110有限潛在的功能所能處理的提供更廣泛的信息。然后移動電話110可以接收例如表明標(biāo)題和藝術(shù)家的SMS消息,以及有關(guān)更多信息已發(fā)送到該用戶的電子郵件地址的聲明。
當(dāng)然,移動電話110可以容易地用允許給服務(wù)器120傳輸音頻和/或視頻數(shù)據(jù)的其他設(shè)備所替換。例如,可以使用連接到個人計算機(jī)的話筒。然后計算機(jī)從該話筒記錄聲音,并例如通過因特網(wǎng)作為電子郵件消息或者使用FTP、HTTP文件上載或相似的機(jī)制把該記錄傳輸給服務(wù)器120。也可以使用帶有記錄裝置的便攜設(shè)備進(jìn)行這種記錄。然后可以把這種便攜設(shè)備通過電話線或者網(wǎng)絡(luò)連接與服務(wù)器相連。其他傳輸通道諸如因特網(wǎng)無線電允許直接記錄和傳輸多媒體對象的一部分,因為該對象然后是以電子格式傳輸?shù)摹?br>
圖2較為詳細(xì)地原理表示服務(wù)器120和數(shù)據(jù)庫121。這里的服務(wù)器120包括輸入模塊201、取指紋模塊202、數(shù)據(jù)庫管理系統(tǒng)(DBMS)后端模塊203、和響應(yīng)模塊204。
當(dāng)用戶與服務(wù)器120聯(lián)系以便獲取為一個特別的多媒體對象的元數(shù)據(jù)時輸入模塊201被激活。它優(yōu)選連接到電話網(wǎng)絡(luò)115,以便用戶只要在他們的移動電話110上呼叫某個號碼就能與服務(wù)器120聯(lián)系。
輸入模塊201通過與移動電話110建立的連接接收音頻片段并把該音頻片段供給取指紋模塊202。取指紋模塊202根據(jù)接收的音頻片段計算指紋。如上所述,用于計算多媒體指紋的一種方法在國際專利申請WO 02/065782(代理人卷宗號PHNL010110)中說明,但當(dāng)然也可以使用用于計算多媒體指紋的任何方法。取指紋模塊202然后把計算的指紋提供給DBMS后端模塊203。
DBMS后端模塊203對數(shù)據(jù)庫121執(zhí)行查詢,以便從數(shù)據(jù)庫121檢索與計算的指紋關(guān)聯(lián)的元數(shù)據(jù)組。如圖2所示,數(shù)據(jù)庫121包括指紋FP1、FP2、FP3、FP4和FP5和各相對應(yīng)的相關(guān)元數(shù)據(jù)組MDS1、MDS2、MDS3、MDS4和MDS5。上述國際專利申請WO 02/065782(代理人卷宗號PHNL010110)說明各種策略以便在帶有為完整的多媒體對象的數(shù)據(jù)庫中檢索對一個音頻片段所計算出的指紋。一種在數(shù)據(jù)庫中檢索指紋的公開的方法使用抽取的指紋比特的可靠性信息。指紋比特的確定是通過計算一個信息信號的特征并給所屬特征設(shè)定閾值(thresholding)以獲得指紋比特而實(shí)現(xiàn)的。如果一個特征具有非常接近該閾值的值,則在該信號中的一個小的改變可以導(dǎo)致指紋比特具有相反值。使用特征值和閾值之間的差的絕對值來標(biāo)記每一指紋比特為可靠或不可靠。隨后使用該可靠性來改善實(shí)際檢索過程。
可以以各種方式組織數(shù)據(jù)庫121來優(yōu)化查詢時間和/或數(shù)據(jù)組織。當(dāng)設(shè)計數(shù)據(jù)庫121中的表時應(yīng)該考慮取指紋模塊202的輸出。在圖2所示的實(shí)施例中,數(shù)據(jù)庫121包括一個單一的表,它具有包括各指紋和元數(shù)據(jù)組的項(記錄)。
實(shí)現(xiàn)數(shù)據(jù)庫121的另一種方式是建立幾個表。第一表包含多個唯一的標(biāo)識符(基本關(guān)鍵字),每一個與各元數(shù)據(jù)組關(guān)聯(lián)??梢愿鶕?jù)各種音樂識別源獲得這種表??梢园阉囆g(shù)家、標(biāo)題和發(fā)行年代等綜合起來的組合形成一個唯一的標(biāo)識符,但不能保證這個標(biāo)識符是唯一的,所以優(yōu)選地要使用真正是全局唯一的值。
然后用包括每一多媒體對象的它的指紋和來自第一表的它的唯一的標(biāo)識符的項建立第二表。如果一個元數(shù)據(jù)對象可以有多個指紋的話,則把所有這些指紋存儲在第二表內(nèi),所有的都與該多媒體對象的一個唯一的標(biāo)識符關(guān)聯(lián)。
然后DBMS后端模塊203把由取指紋模塊202計算的指紋與在第二表內(nèi)的指紋相匹配,得到一個標(biāo)識符并把該標(biāo)識符與第一表匹配以獲得元數(shù)據(jù)。如果數(shù)據(jù)庫211是SQL數(shù)據(jù)庫,則可以根據(jù)該標(biāo)識符“聯(lián)合”(用SQL術(shù)語)這兩個表。
DBMS后端模塊203把查詢結(jié)果提供給響應(yīng)模塊204,它把該結(jié)果例如作為SMS消息或者電子郵件消息傳輸給用戶。如果由輸入模塊201接收的音頻片段是由移動電話發(fā)送的,則可以通過呼叫者ID或者自動號碼識別或者相似方法獲得電話號碼。然后輸入模塊201把呼叫號碼供給響應(yīng)模塊204,以便把SMS消息發(fā)送到那個號碼。
另外可選擇的方案是,輸入模塊201可以接收其他的用于識別用戶的手段,諸如由用戶在與服務(wù)器120聯(lián)系時提供的用戶名或者電子郵件地址。為使用該服務(wù)可能需要登錄,然后可以通過例如基于由用戶提供的用戶名檢查用戶的登錄細(xì)節(jié)獲得目的地地址。
維護(hù)數(shù)據(jù)庫121的一個重要方面是如何收集足夠數(shù)量的指紋和相關(guān)的元數(shù)據(jù)組以便能夠正確識別可容許的數(shù)量的多媒體對象。
當(dāng)然可以購買大量像CD這樣的記錄載體,直接從CD計算指紋。這是一種昂貴而費(fèi)力的操作,因為計算指紋并把元數(shù)據(jù)添加到數(shù)據(jù)庫121中難于自動進(jìn)行。另外,人們不總是對CD的質(zhì)量感興趣,而也對降低的質(zhì)量感興趣,如果那對應(yīng)用來說更適合的話。這意味著在可以把指紋放到數(shù)據(jù)庫121中之前需要一個另外的預(yù)處理步驟。另外,還必須為在數(shù)據(jù)庫121中存儲有指紋的所有歌曲獲得元數(shù)據(jù)。這甚至是比獲取指紋自身更大的挑戰(zhàn)。
國際專利申請?zhí)柎aPCT/IB02/04467(代理人卷宗號PHNL010844)說明一種維護(hù)具有指紋和相關(guān)元數(shù)據(jù)組的數(shù)據(jù)庫的方法。從文件共享網(wǎng)絡(luò)的客戶中獲得多媒體對象和相關(guān)的元數(shù)據(jù)組。為該多媒體對象計算指紋,并且連同元數(shù)據(jù)組一起添加到數(shù)據(jù)庫中。以這種方式,可以從一個多媒體對象收集多個元數(shù)據(jù)組。使用諸如多數(shù)表決、決策樹修剪或交叉確認(rèn)等技術(shù),可以計算出確定的元數(shù)據(jù)組。
以這種方式,不再必須主動出去購買例如CD上的內(nèi)容或發(fā)現(xiàn)內(nèi)容的元數(shù)據(jù)。通過利用從網(wǎng)絡(luò)上文件共享的客戶機(jī)上可得到的對象和元數(shù)據(jù),可以以非常有效的方式收集簽名和元數(shù)據(jù)。這些客戶機(jī)已經(jīng)連同元數(shù)據(jù)使對象可為任何人下載使用,所以購買這些對象變得不必要。通過收集多個元數(shù)據(jù)組并且應(yīng)用過濾器或表決技術(shù),可以從各種也許是不可靠的集合來構(gòu)建精確的元數(shù)據(jù)組。
圖3原理表示服務(wù)器120的另一個實(shí)施例。在數(shù)據(jù)庫121(以下稱為基本數(shù)據(jù)庫121)旁邊,現(xiàn)在還有一個輔助數(shù)據(jù)庫122,也在DNMS模塊203的控制下。輔助數(shù)據(jù)庫122的組織優(yōu)選地和基本數(shù)據(jù)庫121相同。輔助數(shù)據(jù)庫122可以存儲在與基本數(shù)據(jù)庫121不同的存儲介質(zhì)上,雖然這不是嚴(yán)格必須的。
在該實(shí)施例中給服務(wù)器120裝備一個傳輸監(jiān)視模塊205,它連接到接收機(jī)301,接收機(jī)301安排用于從介質(zhì)接收傳輸,所述介質(zhì)諸如音頻廣播頻道(例如無線電)、視頻廣播頻道、流式因特網(wǎng)傳輸通道、或組播因特網(wǎng)傳輸通道。使用接收機(jī)301,傳輸監(jiān)視模塊205記錄正通過一種傳輸介質(zhì)傳輸?shù)亩嗝襟w對象的至少一部分。模塊205例如可以調(diào)諧到一個特定的無線電臺或者電視臺,或者連接到一個提供流式音頻的特定的因特網(wǎng)主機(jī)。
然后把該記錄的部分供給取指紋模塊202以便為該記錄的部分計算傳輸指紋。然后把傳輸指紋與在基本數(shù)據(jù)庫121中的項匹配。如果找到匹配,則在輔助數(shù)據(jù)庫122中為識別的傳輸建立一個項,有幾種方式實(shí)現(xiàn)這一點(diǎn)。
一種方式是在輔助數(shù)據(jù)庫122中建立一個項以復(fù)制在輔助數(shù)據(jù)庫122中匹配項的至少一部分。例如,如上所述,可以在輔助數(shù)據(jù)庫122中復(fù)制在基本數(shù)據(jù)庫121的第二表中的匹配項的指紋和唯一標(biāo)識符,以允許在必要時從第一表獲得元數(shù)據(jù)。這可以保持第二數(shù)據(jù)庫122盡可能地小,但是其缺點(diǎn)是后來的指紋仍然要與原來的指紋相匹配。
如果傳輸?shù)闹讣y表示基本上是作為一個整體來進(jìn)行傳輸?shù)脑?,則另一個實(shí)施例是可能的。為此在要添加到第二數(shù)據(jù)庫122中的項中包括該傳輸指紋。當(dāng)然,這意味著傳輸監(jiān)視模塊205必須記錄(幾乎)整個傳輸并將其供給取指紋模塊202。然后在第二數(shù)據(jù)庫122中把對象指紋與傳輸指紋匹配。
優(yōu)選地,在第二數(shù)據(jù)庫122中添加與一個特別的傳輸通道關(guān)聯(lián)的項時,從第二數(shù)據(jù)庫122中要去除與該傳輸通道關(guān)聯(lián)的先前的項。以這種方式,第二數(shù)據(jù)庫122只由當(dāng)前正經(jīng)由至少一個傳輸通道而傳輸?shù)亩嗝襟w對象的項所填充。這可以通過還在第二數(shù)據(jù)庫中存儲與這些項相關(guān)聯(lián)的傳輸通道的一個標(biāo)識符和去除具有和要被復(fù)制的項具有同樣標(biāo)識符的項來實(shí)現(xiàn)。
在圖3的實(shí)施例中,監(jiān)視著3個傳輸通道,并且FP1、FP2和FP3的匹配項已經(jīng)被復(fù)制到輔助數(shù)據(jù)庫122中。另外,傳輸通道標(biāo)識符TC1、TC2和TC3已經(jīng)被添加到在數(shù)據(jù)庫122中用于所涉及的傳輸通道的項上。
通過以這種方式給第二數(shù)據(jù)庫122收集多個項,就建立和保持正通過由傳輸監(jiān)視模塊205所監(jiān)視的一個(或多個)傳輸通道而傳輸?shù)亩嗝襟w對象的一個總覽。如果另外有該(或多個)傳輸通道的標(biāo)識符和可選地還有該項復(fù)制的時間印記連同這些項一起被存儲,則可能為每一被監(jiān)視的通道建立一個傳輸記錄簿(記錄文件)。
通過利用一個特定的傳輸通道查詢第二數(shù)據(jù)庫122中的所有項,可以得到在該通道上傳輸?shù)牧斜?。這一列表可以由版權(quán)交易所諸如美國作曲家、作者和出版商協(xié)會(ASCAP)或荷蘭BUMA/Stemra使用以決定有多少版稅應(yīng)該付給特別的版權(quán)擁有者。這種版稅常?;谝粋€特別的歌曲或電影被廣播的估計次數(shù),而這一列表提供了由公正的第三方給出的準(zhǔn)確估計。無線電臺或電視臺可能高估或者低估它播放一個特別的歌曲的次數(shù),或可能不愿意提供足夠的細(xì)節(jié)。
當(dāng)然這一列表也可以對許多其他目的有用。如果被監(jiān)視的多媒體對象包括廣告或者促銷消息,則可以使用該列表來證明(或否定)一個特別的廣告或消息在某一時間是否被廣播。以這種方式,無線電臺或電視臺可以證明它遵守對廣告商的合同責(zé)任。
現(xiàn)在稍微修改為由輸入模塊201接收到的多媒體對象的匹配過程。仍如上述計算指紋,但是在與基本數(shù)據(jù)庫121匹配前,該指紋由DBMS模塊203與在輔助數(shù)據(jù)庫122中存儲的項匹配。
當(dāng)然,如果在輔助數(shù)據(jù)庫122中找到匹配,則完全不再需要與基本數(shù)據(jù)庫121匹配,因為輔助數(shù)據(jù)庫122只包含從基本數(shù)據(jù)庫121復(fù)制的項。然而,如果在輔助數(shù)據(jù)庫122中未找到匹配,則(較大的)基本數(shù)據(jù)庫121仍可能包含匹配項。
優(yōu)選地,數(shù)據(jù)庫120要裝備高質(zhì)量接收機(jī)301,以使記錄的傳輸也具有高質(zhì)量。這使得傳輸指紋與基本數(shù)據(jù)庫121的匹配更可靠。在通過像無線電這樣的傳輸介質(zhì)傳輸期間,多媒體對象總是被稍微修改。這意味著傳輸指紋將與來自基本數(shù)據(jù)庫121中的指紋稍有不同,盡管沒有不同到足以阻止匹配的程度。
另一方面,對象指紋極有可能基于低到非常低的質(zhì)量的記錄而計算。如上所述,可以使用移動電話110向服務(wù)器120傳輸多媒體對象的記錄。因為移動電話傳輸?shù)姆浅5偷馁|(zhì)量,這將在記錄中引入許多外加的錯誤,從而對象指紋將具有與在基本數(shù)據(jù)庫121中的指紋很大程度的不同。這減少了與在基本數(shù)據(jù)庫121中項的成功匹配的機(jī)會。
如果如上所述,傳輸指紋被包含在添加到輔助數(shù)據(jù)庫中的項中的話,則對象指紋與傳輸指紋匹配,而不是與存放在基本數(shù)據(jù)庫121中的指紋匹配。這至少消除了部分的不成功匹配,因為對象指紋與在輔助數(shù)據(jù)庫中的指紋的不同要小于與在基本數(shù)據(jù)庫中的指紋的不同。
用低質(zhì)量記錄計算的指紋很可能包含許多錯誤,從而減少在像基本數(shù)據(jù)庫121這樣的大數(shù)據(jù)庫中的成功和正確的匹配。然而,如果使用像輔助數(shù)據(jù)庫122這樣的小數(shù)據(jù)庫來匹配指紋的話,則可以容忍匹配中的低可靠性。輔助數(shù)據(jù)庫122中的項不太可能是相似的,所以甚至當(dāng)在指紋中有大量不可靠比特時,也很有可能至少有一個項適合的匹配。
DBMS后端模塊203把查詢結(jié)果供給響應(yīng)模塊204,后者如上面參考圖2說明的那樣處理它。
應(yīng)該注意,上述實(shí)施例說明而不限制本發(fā)明,熟悉本技術(shù)領(lǐng)域的人將能夠設(shè)計許多可替換的實(shí)施例而不離開所附權(quán)利要求的范圍。
例如,多媒體對象101的指紋可選地由在移動電話110中的取指紋模塊計算而不是由在服務(wù)器120中的取指紋模塊202計算。以這種方式,只有指紋自身要傳輸給服務(wù)器120,而可以省略服務(wù)器120中的取指紋模塊202。因為指紋通常比它用于計算的多媒體對象101的該部分要小,這可以相當(dāng)顯著地減少帶寬。裝備有取指紋模塊的移動電話的構(gòu)造和操作在國際專利申請WO 02/17135(代理人卷宗號PHNL000469)中解釋。
數(shù)據(jù)庫121可以分布在多個物理計算機(jī)系統(tǒng)上,以減少每一單個系統(tǒng)的工作負(fù)載。數(shù)據(jù)庫121的內(nèi)容也可以分布在文件共享網(wǎng)絡(luò)中的多個客戶機(jī)上,這在國際專利申請PCT/IB02/04605(代理人卷宗號PHNL010874)中解釋。
數(shù)據(jù)庫121的內(nèi)容可以免費(fèi)使用,或者只由付費(fèi)訂戶使用。另外可選地,費(fèi)用可以根據(jù)對數(shù)據(jù)庫121進(jìn)行的每一查詢收取。響應(yīng)于遞交指紋而對客戶返回的元數(shù)據(jù)的數(shù)量也可以改變例如免費(fèi)服務(wù)只返回藝術(shù)家和標(biāo)題,并且基于訂閱的服務(wù)可返回數(shù)據(jù)庫中可用的全部元數(shù)據(jù)。
輔助數(shù)據(jù)庫122實(shí)際上可以作為基本數(shù)據(jù)庫121的一個或者多個表而實(shí)現(xiàn),盡管這可能使對數(shù)據(jù)庫的訪問時間較慢,因為這時數(shù)據(jù)庫的大小(優(yōu)選地保持在工作存儲器中)增加了。
在權(quán)利要求中,置于括號內(nèi)的任何參考符號不應(yīng)該被理解為是限制本發(fā)明。單詞“包括”不排除在權(quán)利要求中所列的元件或者步驟之外的元件或者步驟的存在。冠于元件前面的單詞“一個”不排除多個這種元件的存在。
本發(fā)明可以用包括幾個不同元件的硬件、和用一個適當(dāng)編程的計算機(jī)實(shí)現(xiàn)。在列舉幾種裝置的設(shè)備權(quán)利要求中,可以由同一硬件實(shí)現(xiàn)幾個這樣的裝置。不能僅以在相互不同的獨(dú)立權(quán)利要求中敘述的某些措施這一事實(shí)表明不能使用這些措施的組合。
權(quán)利要求
1.一種通過把多媒體對象的對象指紋與在基本數(shù)據(jù)庫中存儲的項相匹配而獲取多媒體對象的元數(shù)據(jù)的方法,其特征在于,為在傳輸通道上傳輸?shù)牧硪粋€多媒體對象的一部分計算傳輸指紋;將該傳輸指紋與在基本數(shù)據(jù)庫中存儲的指紋相匹配;在匹配成功時,在輔助數(shù)據(jù)庫中添加該另一個多媒體對象的一個項;以及通過將該指紋與在輔助數(shù)據(jù)庫中存儲的項相匹配來獲取元數(shù)據(jù),而如果所述與輔助數(shù)據(jù)庫的匹配失敗則只通過與基本數(shù)據(jù)庫的匹配來獲取元數(shù)據(jù)。
2.權(quán)利要求1所述的方法,另外包括接收多媒體對象的至少一部分和對所接收的部分計算對象指紋。
3.權(quán)利要求1所述的方法,其中,為所述另一個多媒體對象的項包括該傳輸指紋。
4.權(quán)利要求1所述的方法,其中,所述另一個多媒體對象的項包括在基本數(shù)據(jù)庫中的一個與該傳輸指紋相匹配的項的指紋。
5.權(quán)利要求1所述的方法,其中,為在各個傳輸通道上傳輸?shù)亩鄠€另外的多媒體對象計算傳輸指紋。
6.權(quán)利要求1所述的方法,還包括在傳輸監(jiān)視記錄文件中記錄所獲得的元數(shù)據(jù)的至少一部分和傳輸通道的標(biāo)識符。
7.權(quán)利要求1所述的方法,另外包括在向輔助數(shù)據(jù)庫中添加該另一個多媒體對象的與一個特定的傳輸通道關(guān)聯(lián)的項時,從輔助數(shù)據(jù)庫中清除與該特定傳輸通道關(guān)聯(lián)的一個先前的項。
8.一個配置成用于獲取多媒體對象的元數(shù)據(jù)的系統(tǒng),包括匹配裝置,用于將該多媒體對象的一個對象指紋與在基本數(shù)據(jù)庫中存儲的項相匹配,其特征在于,傳輸監(jiān)視裝置,用于記錄在一個傳輸通道上傳輸?shù)牧硪粋€多媒體對象的一部分,和取指紋裝置,用于為該部分計算傳輸指紋,所述匹配裝置被配置成將該傳輸指紋與在基本數(shù)據(jù)庫中存儲的指紋相匹配,在匹配成功時在輔助數(shù)據(jù)庫中添加該另一個多媒體對象的一個項,并通過將該指紋與在輔助數(shù)據(jù)庫中存儲的項相匹配來獲取元數(shù)據(jù),而如果與輔助數(shù)據(jù)庫的所述匹配失敗則只通過對基本數(shù)據(jù)庫的匹配來獲取元數(shù)據(jù)。
9.權(quán)利要求8所述的系統(tǒng),另外包括接收裝置,用于接收多媒體對象的至少一部分,所述取指紋裝置被配置成對所接收的部分計算對象指紋。
10.一種配置成用于為使處理器執(zhí)行權(quán)利要求1的方法的計算機(jī)程序產(chǎn)品。
全文摘要
當(dāng)客戶請求一個多媒體對象的元數(shù)據(jù)時,服務(wù)器(120)計算該多媒體對象的指紋,并將其與在基本數(shù)據(jù)庫(121)中存儲的項匹配。另外,服務(wù)器(120)監(jiān)視一個或者多個傳輸通道,諸如無線電廣播頻道,并計算在這些通道上傳輸?shù)膫鬏斨讣y。把這些傳輸指紋與在基本數(shù)據(jù)庫(121)中存儲的指紋匹配,如果找到一個匹配,則把該識別的傳輸項添加到輔助數(shù)據(jù)庫(122)中。優(yōu)選地該項包括傳輸指紋。隨后首先對輔助數(shù)據(jù)庫(122)執(zhí)行匹配,并僅在不成功時再對基本數(shù)據(jù)庫(121)進(jìn)行匹配。還包括這種方法和為執(zhí)行該方法的計算機(jī)程序產(chǎn)品。
文檔編號G06F12/00GK1628303SQ03803302
公開日2005年6月15日 申請日期2003年1月27日 優(yōu)先權(quán)日2002年2月6日
發(fā)明者J·A·海特斯馬 申請人:皇家飛利浦電子股份有限公司