欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于識(shí)別音頻流中的一首音樂(lè)的方法和裝置的制造方法

文檔序號(hào):10518099閱讀:276來(lái)源:國(guó)知局
用于識(shí)別音頻流中的一首音樂(lè)的方法和裝置的制造方法
【專(zhuān)利摘要】本發(fā)明揭示一種在電子裝置中執(zhí)行的用于跟蹤音頻流中的一首音樂(lè)的方法。所述方法可接收所述音頻流的第一部分,且基于所述音頻流的所述第一部分提取第一聲音特征。并且,所述方法可基于所述第一聲音特征來(lái)確定所述音頻流的所述第一部分是否指示音樂(lè)。響應(yīng)于確定所述音頻流的所述第一部分指示音樂(lè),可基于所述音頻流的所述第一部分來(lái)識(shí)別一首音樂(lè)。另外,在接收到所述音頻流的第二部分后,所述方法可即刻基于所述音頻流的所述第二部分來(lái)提取第二聲音特征,且確定所述音頻流的所述第二部分是否指示第一首音樂(lè)。
【專(zhuān)利說(shuō)明】用于識(shí)別音頻流中的一首音樂(lè)的方法和裝置
[0001 ] 相關(guān)申請(qǐng)案的交叉參考
[0002]本申請(qǐng)案主張2015年I月6日申請(qǐng)的標(biāo)題為“跟蹤音頻流中的音樂(lè)(TRACKINGMUSIC IN AUD1 STREAM)”的第14/590,662號(hào)美國(guó)專(zhuān)利申請(qǐng)案、2014年I月7日申請(qǐng)的標(biāo)題為“用于識(shí)別若干首音樂(lè)的方法和設(shè)備(METHOD AND APPARATUS FOR IDENTIFYING PIECESOF MUSIC)”的第61/924,556號(hào)美國(guó)臨時(shí)專(zhuān)利申請(qǐng)案,以及2014年9月17日申請(qǐng)的標(biāo)題為“用于跟蹤若干首音樂(lè)的方法和設(shè)備(METHOD AND APPARATUS FOR TRACKING PIECES OFMUSIC)”的第62/051,700號(hào)美國(guó)臨時(shí)專(zhuān)利申請(qǐng)案的優(yōu)先權(quán),上述各項(xiàng)的整個(gè)內(nèi)容以引入的方式并入本文中。
技術(shù)領(lǐng)域
[0003]本發(fā)明大體上涉及檢測(cè)音頻流中的音樂(lè),且更具體來(lái)說(shuō),涉及在電子裝置中跟蹤音頻流中的一首音樂(lè)。
【背景技術(shù)】
[0004]近年來(lái),例如智能電話、平板計(jì)算機(jī)、個(gè)人計(jì)算機(jī)等電子裝置的使用已變得廣泛。此類(lèi)電子裝置可包含用于從輸入聲音捕獲音樂(lè)并處理音樂(lè)的聲音處理能力。舉例來(lái)說(shuō),常規(guī)電子裝置可經(jīng)配置以捕獲例如電視機(jī)、無(wú)線電、個(gè)人計(jì)算機(jī)、聲音系統(tǒng)、揚(yáng)聲器等各種聲音源輸出的聲音。
[0005]此類(lèi)電子裝置可配備有經(jīng)配置以辨識(shí)所捕獲聲音中的歌曲的應(yīng)用程序。在此情況下,應(yīng)用程序可經(jīng)由通信網(wǎng)絡(luò)與外部服務(wù)器通信,以接收與所述歌曲相關(guān)聯(lián)的標(biāo)題和藝術(shù)家。在此類(lèi)電子裝置中,每當(dāng)聽(tīng)到未辨識(shí)的歌曲時(shí),用戶(hù)可選擇手動(dòng)運(yùn)行所述應(yīng)用程序。然而,每當(dāng)聽(tīng)到所關(guān)注的歌曲就手動(dòng)運(yùn)行所述應(yīng)用程序?qū)τ谟脩?hù)來(lái)說(shuō)可能不是非常方便。因此,用戶(hù)可將所述應(yīng)用程序設(shè)定成在背景模式下連續(xù)操作,以接收和辨識(shí)歌曲,使得用戶(hù)免于手動(dòng)操作所述應(yīng)用程序的任務(wù)。
[0006]然而,連續(xù)操作所述應(yīng)用程序通常需要大量的聲音處理和網(wǎng)絡(luò)通信,這可能導(dǎo)致相當(dāng)大的電力消耗,尤其是在具有受限電力供應(yīng)的移動(dòng)電子裝置中。舉例來(lái)說(shuō),即使移動(dòng)裝置未接收到聲音或歌曲,所述應(yīng)用程序也可連續(xù)地處理聲音并與外部服務(wù)器通信。此外,即使在已從輸入聲音辨識(shí)到歌曲之后,所述應(yīng)用程序也可持續(xù)接收和處理已經(jīng)辨識(shí)的所述歌曲的后續(xù)聲音,并與服務(wù)器通信,以辨識(shí)后續(xù)聲音中的同一歌曲,從而導(dǎo)致不需要的電力消耗。

【發(fā)明內(nèi)容】

[0007]本發(fā)明提供用于識(shí)別和跟蹤音頻流中的一首音樂(lè)的方法和裝置。
[0008]根據(jù)本發(fā)明的一個(gè)方面,揭示一種在電子裝置中執(zhí)行的用于跟蹤音頻流中的一首音樂(lè)的方法。所述方法可接收所述音頻流的第一部分,且基于所述音頻流的所述第一部分提取第一聲音特征。并且,所述方法可基于所述第一聲音特征來(lái)確定所述音頻流的所述第一部分是否指示音樂(lè)。響應(yīng)于確定所述音頻流的所述第一部分指示音樂(lè),可基于所述音頻流的所述第一部分來(lái)識(shí)別一首音樂(lè)。另外,在接收到所述音頻流的第二部分后,所述方法可即刻基于所述音頻流的所述第二部分來(lái)提取第二聲音特征,且確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)。本發(fā)明還描述了涉及此方法的設(shè)備、裝置、系統(tǒng)、裝置組合以及計(jì)算機(jī)可讀媒體。
[0009]根據(jù)本發(fā)明的另一方面,揭示一種用于跟蹤音頻流中的一首音樂(lè)的電子裝置。所述電子裝置可包含:音樂(lè)檢測(cè)單元,其經(jīng)配置以接收所述音頻流的第一部分,基于所述音頻流的所述第一部分提取第一聲音特征,且基于所述第一聲音特征來(lái)確定所述音頻流的所述第一部分是否指示音樂(lè);音樂(lè)識(shí)別單元,其經(jīng)配置以響應(yīng)于確定所述第一部分指示音樂(lè),基于所述音頻流的所述第一部分來(lái)識(shí)別第一首音樂(lè);以及音樂(lè)跟蹤單元,其經(jīng)配置以接收所述音頻流的第二部分;基于所述音頻流的所述第二部分來(lái)提取第二聲音特征;以及確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)。
【附圖說(shuō)明】
[0010]將在結(jié)合附圖閱讀時(shí)參照以下詳細(xì)描述中理解本發(fā)明的實(shí)施例。
[0011]圖1說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以當(dāng)在音頻流中識(shí)別到一首音樂(lè)時(shí)顯示關(guān)于所述首音樂(lè)的信息的電子裝置。
[0012]圖2說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例經(jīng)配置以經(jīng)由通信網(wǎng)絡(luò)與服務(wù)器通信來(lái)獲得與多首音樂(lè)相關(guān)聯(lián)的識(shí)別信息的多個(gè)電子裝置。
[0013]圖3說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以識(shí)別音頻流中的一首音樂(lè)以用于更新存儲(chǔ)單元中的音樂(lè)歷史數(shù)據(jù)庫(kù)的電子裝置的框圖。
[0014]圖4說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的所述電子裝置中經(jīng)配置以產(chǎn)生或獲得一首音樂(lè)的音樂(lè)模型并基于所述音樂(lè)模型來(lái)跟蹤所述首音樂(lè)的聲音處理單元的較詳細(xì)框圖。
[0015]圖5說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于通過(guò)聲音處理單元來(lái)跟蹤輸入聲音流中的一首音樂(lè)以確定所述首音樂(lè)是否已結(jié)束的時(shí)序圖。
[0016]圖6說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于對(duì)音頻流中額一首音樂(lè)的一部分進(jìn)行取樣且確定所述音頻流中的后續(xù)部分是否為所述首音樂(lè)的一部分的時(shí)序圖。
[0017]圖7是根據(jù)本發(fā)明的一個(gè)實(shí)施例的在電子裝置中執(zhí)行的用于識(shí)別和跟蹤音頻流中的一首音樂(lè)的方法的流程圖。
[0018]圖8說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于從音頻流的一部分提取的至少一個(gè)聲音特征來(lái)識(shí)別一首音樂(lè)的具體方法。
[0019]圖9說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于與一首音樂(lè)相關(guān)聯(lián)的音樂(lè)模型來(lái)跟蹤所述首音樂(lè)的具體方法。
[0020]圖10說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的電子裝置中經(jīng)配置以接收一首音樂(lè)的識(shí)別信息,管理音樂(lè)歷史數(shù)據(jù)庫(kù),且產(chǎn)生建議和通知的音樂(lè)管理單元的較詳細(xì)框圖。
[0021]圖11說(shuō)明根據(jù)一些實(shí)施例的其中可實(shí)施本發(fā)明的用于從音頻流識(shí)別一首音樂(lè)并跟蹤所述首音樂(lè)的方法和設(shè)備的無(wú)線通信系統(tǒng)中的移動(dòng)裝置的框圖。
[0022]圖12是說(shuō)明根據(jù)一些實(shí)施例實(shí)施的可為先前描述的服務(wù)器中的任一者的用于搜索和提供關(guān)于一首音樂(lè)的信息的服務(wù)器系統(tǒng)的框圖。
【具體實(shí)施方式】
[0023]現(xiàn)在將詳細(xì)參考各種實(shí)施例,在附圖中說(shuō)明所述實(shí)施例的實(shí)例。在以下詳細(xì)描述中,陳述眾多具體細(xì)節(jié)以便提供對(duì)本發(fā)明的透徹理解。然而,對(duì)于所屬領(lǐng)域的一般技術(shù)人員將是顯而易見(jiàn)的是可在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐本發(fā)明。在其它情況下,未詳細(xì)描述眾所周知的方法、程序、系統(tǒng)和組件,以便不會(huì)不必要地混淆各種實(shí)施例的各方面。
[0024]圖1說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以當(dāng)在音頻流中識(shí)別到一首音樂(lè)時(shí)顯示與所述首音樂(lè)相關(guān)聯(lián)的信息的電子裝置120。如本文所使用,術(shù)語(yǔ)“音樂(lè)”可指可由節(jié)奏(例如拍子、節(jié)拍和發(fā)音)、音調(diào)(例如旋律以及和聲)、力度(例如聲音或音符的音量)等的一或多個(gè)元素表征的任何類(lèi)型的聲音,且可包含樂(lè)器、話音等的聲音。另外,術(shù)語(yǔ)“一首音樂(lè)”在本文中可指唯一或不同音樂(lè)作品或作曲,且可包含以聲音或音頻形式(例如歌曲、曲調(diào)等)創(chuàng)建或再現(xiàn)此音樂(lè)作品或作曲。另外,術(shù)語(yǔ)“音頻流”可指表示聲音流的一或多個(gè)部分的一或多個(gè)電信號(hào)的序列,其可包含多首音樂(lè)、環(huán)境聲音、語(yǔ)音、噪聲等。
[0025]電子裝置120可為配備有聲音捕獲和處理能力和通信能力的任何電子裝置,例如蜂窩式電話、智能電話、可穿戴計(jì)算機(jī)、智能表、智能眼鏡、個(gè)人計(jì)算機(jī)、膝上型計(jì)算機(jī)、平板計(jì)算機(jī)、智能電視機(jī)、游戲裝置、多媒體播放器等。在所說(shuō)明的實(shí)施例中,將電子裝置120示出為智能電話,其可從揚(yáng)聲器150接收輸入聲音流,包含對(duì)應(yīng)于一首音樂(lè)的聲音,并將所述輸入聲音流轉(zhuǎn)換為音頻流。隨著輸入聲音流被接收到并轉(zhuǎn)換成音頻流,電子裝置120可檢測(cè)聲音和音樂(lè),并識(shí)別所述音頻流中的一首音樂(lè)。在一個(gè)實(shí)施例中,可基于預(yù)定閾值聲音強(qiáng)度來(lái)在音頻流中檢測(cè)聲音。在檢測(cè)到聲音后,電子裝置120可開(kāi)始檢測(cè)音頻流中的音樂(lè)。
[0026]—旦在音頻流中檢測(cè)到音樂(lè),電子裝置120就可獲得一首音樂(lè)的識(shí)別信息,其與所述檢測(cè)到的音樂(lè)相關(guān)聯(lián)。可從外部裝置(未圖示)接收或從電子裝置120的內(nèi)部數(shù)據(jù)庫(kù)(未圖示)檢索所述首音樂(lè)的識(shí)別信息。在獲得識(shí)別信息后,電子裝置120可即刻在顯示屏幕130上顯示所述識(shí)別信息。如本文所使用,術(shù)語(yǔ)“識(shí)別信息”可指可識(shí)別或描述一首音樂(lè)的任何信息,且可包含標(biāo)題、藝術(shù)家、持續(xù)時(shí)間、到音樂(lè)視頻的鏈接、評(píng)分、音樂(lè)封套、評(píng)論、下載狀態(tài)等中的至少一者。在一個(gè)實(shí)施例中,電子裝置120的用戶(hù)110可檢視揚(yáng)聲器150當(dāng)前正播放的所述首音樂(lè)的識(shí)別信息。
[0027]在所說(shuō)明的實(shí)施例中,電子裝置120可在顯示屏幕130上顯示所述首音樂(lè)已被識(shí)別的通知132,以及包含所識(shí)別的所述首音樂(lè)的標(biāo)題和藝術(shù)家名字的識(shí)別信息134。另外,電子裝置120可顯不所述首首樂(lè)的下載圖標(biāo)136、檢視Μ/V(首樂(lè)視頻)圖標(biāo)138和共孚圖標(biāo)140。用戶(hù)110可選擇圖標(biāo)136、138和140(例如在所述圖標(biāo)上觸摸)以分別下載所述首音樂(lè),檢視所述首音樂(lè)的音樂(lè)視頻,以及與他人共享所述首音樂(lè)。舉例來(lái)說(shuō),當(dāng)選定圖標(biāo)136時(shí),可將所識(shí)別的所述首音樂(lè)的音頻文件或數(shù)據(jù)下載到電子裝置120。在一些其它實(shí)例中,用戶(hù)110可檢視與所述首音樂(lè)相關(guān)聯(lián)的音樂(lè)視頻,其可通過(guò)選擇圖標(biāo)138從外部服務(wù)器流式傳輸,或可通過(guò)選擇圖標(biāo)140經(jīng)由電子郵件、社交網(wǎng)絡(luò)應(yīng)用、云存儲(chǔ)服務(wù)器等與朋友共享所述首音樂(lè)。
[0028]雖然所說(shuō)明的實(shí)施例示出在顯示屏幕130上顯示已識(shí)別所述首音樂(lè)的通知132,但本發(fā)明不限于此。在一些實(shí)施例中,電子裝置120可將與所識(shí)別的所述首音樂(lè)相關(guān)聯(lián)的識(shí)別信息134存儲(chǔ)在音樂(lè)歷史數(shù)據(jù)庫(kù)(其可在電子裝置120的存儲(chǔ)單元(未圖示)中提供)中,以保持所述首音樂(lè)的記錄。另外,電子裝置120可包含音樂(lè)歷史管理應(yīng)用,以顯示存儲(chǔ)在音樂(lè)歷史數(shù)據(jù)庫(kù)中的多首音樂(lè)列表,以及基于所述音樂(lè)歷史數(shù)據(jù)庫(kù)的建議。在此情況下,用戶(hù)110可激活音樂(lè)歷史管理應(yīng)用,以檢視若干首音樂(lè)和建議的列表。
[0029]除如上文所描述獲得所述首音樂(lè)的識(shí)別信息134之外,電子裝置120還可跟蹤所述音頻流中的所述首音樂(lè)以檢測(cè)所述首音樂(lè)的結(jié)束。換句話說(shuō),因?yàn)橐纛l流是從輸入聲音流產(chǎn)生,因此可監(jiān)視所述音頻流,以確定同一首音樂(lè)是否仍在播放。舉例來(lái)說(shuō),當(dāng)整首音樂(lè)的再現(xiàn)完成時(shí),或當(dāng)所述首音樂(lè)變?yōu)榱硪皇滓魳?lè)而所述整首音樂(lè)未再現(xiàn)時(shí),可檢測(cè)所述首音樂(lè)的結(jié)束。
[0030]根據(jù)一些實(shí)施例,可產(chǎn)生或獲得所述首音樂(lè)的音樂(lè)模型,以用于檢測(cè)所述首音樂(lè)的結(jié)束。如本文所使用,術(shù)語(yǔ)“音樂(lè)模型”可與“聲音模型”互換使用,且可指表示一首音樂(lè)的聲音特性的模型,包含(但不限于)此類(lèi)聲音特性的統(tǒng)計(jì)模型。在一個(gè)實(shí)施例中,可從所述音頻流的一部分提取至少一個(gè)聲音特征,且接著可基于所述至少一個(gè)聲音特征在電子裝置120中廣生所述首首樂(lè)的首樂(lè)_旲型。舉例來(lái)說(shuō),所述聲首特征可為首頻指紋、MFCC (梅爾頻率倒譜系數(shù))向量等,且所述音樂(lè)模型可為GMM(高斯混合模型)等。在另一個(gè)實(shí)施例中,電子裝置120可將至少一個(gè)聲音特征發(fā)射到外部裝置(未圖示),其可包含多個(gè)音樂(lè)模型,且從所述外部裝置接收所述多個(gè)音樂(lè)模型當(dāng)中確定為與所述至少一個(gè)聲音特征相關(guān)聯(lián)的音樂(lè)模型。電子裝置120還可從存儲(chǔ)在電子裝置120中的音樂(lè)模型數(shù)據(jù)庫(kù)(未圖示)檢索所述首音樂(lè)的音樂(lè)模型。另外或替代地,在本發(fā)明的一些實(shí)施例中,所提取的至少一個(gè)聲音特征(例如音頻指紋、MFCC向量等)本身可用作音樂(lè)模型。
[0031]為了檢測(cè)所述首音樂(lè)的結(jié)束,電子裝置120可對(duì)所述音頻流的至少一個(gè)部分進(jìn)行取樣,并基于所述音樂(lè)模型來(lái)確定所取樣的部分是否指示所述首音樂(lè)。通過(guò)確定所取樣的部分是否指示所述首音樂(lè),可確定所取樣的部分是否為所述首音樂(lè)的一部分,以及所述首音樂(lè)是否已結(jié)束。音頻流的經(jīng)取樣部分可在音頻流的從中已提取所述至少一個(gè)聲音特征以用于產(chǎn)生或獲得音樂(lè)模型的所述部分之后。在此過(guò)程中,電子裝置120可連續(xù)地、周期性地或不定期地對(duì)音頻流的多個(gè)部分進(jìn)行取樣,且確定所述經(jīng)取樣的部分中的至少一者是否不是所述首音樂(lè)的一部分,或經(jīng)取樣的部分中的至少一者是否是所述首音樂(lè)的一部分。如本文所使用,短語(yǔ)“確定音頻流的一部分是否是一首音樂(lè)的一部分”可指確定音頻流的所述部分是否指示所述首音樂(lè),且可包含肯定測(cè)試(即確定音頻流的一部分是否指示一首音樂(lè))或否定測(cè)試(即確定音頻流的一部分是否不指示一首音樂(lè))。并且,短語(yǔ)“確定音頻流的一部分是否不是一首音樂(lè)的一部分”可指確定所述音頻流的所述部分是否指示不同聲音,例如另一首音樂(lè)、語(yǔ)音、噪聲、靜默等。
[0032]在一些實(shí)施例中,揚(yáng)聲器150可連續(xù)地、周期性地、不定期地或間歇地輸出多首音樂(lè)的一序列。在此情況下,電子裝置120可連續(xù)地接收包含所述多首音樂(lè)的所述序列的輸入聲音流,并將所述輸入聲音流轉(zhuǎn)換為音頻流。當(dāng)通過(guò)以如上文所描述的方式監(jiān)視音頻流來(lái)檢測(cè)到若干首音樂(lè)中的一首的結(jié)束時(shí),電子裝置120可繼續(xù)檢測(cè)另一首音樂(lè)的聲音和音樂(lè)。另外,電子裝置120可循序地獲得識(shí)別信息,以識(shí)別音頻流中的多首音樂(lè)。所述多首音樂(lè)的識(shí)別信息可存儲(chǔ)在音樂(lè)歷史數(shù)據(jù)庫(kù)中,以保持所識(shí)別的所述首音樂(lè)的記錄。
[0033]圖2說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的多個(gè)電子裝置210、220和230,其經(jīng)配置以經(jīng)由通信網(wǎng)絡(luò)250與服務(wù)器240通信,以獲得與多首音樂(lè)相關(guān)聯(lián)的識(shí)別信息。通信網(wǎng)絡(luò)250可包含一或多個(gè)有線和/或無(wú)線通信網(wǎng)絡(luò),例如因特網(wǎng)、其它廣域網(wǎng)、局域網(wǎng)、城域網(wǎng)等。另外,電子裝置210、220和230可通過(guò)使用各種通信技術(shù)(例如碼分多址(CDMA)、全球移動(dòng)通信系統(tǒng)(GSM)、寬帶CDMA(W-CDMA)、長(zhǎng)期演進(jìn)(LTE)、LTE-高級(jí)、LTE直接、W1-F1、W1-Fi直接、近場(chǎng)通信(NFC)、藍(lán)牙、以太網(wǎng)等)經(jīng)由通信網(wǎng)絡(luò)250與服務(wù)器240通信。
[0034]服務(wù)器240可存儲(chǔ)音樂(lè)數(shù)據(jù)庫(kù)242,其可包含多首音樂(lè)的識(shí)別信息。所述識(shí)別信息可包含標(biāo)題、藝術(shù)家、持續(xù)時(shí)間、到音樂(lè)視頻的鏈接、評(píng)分、音樂(lè)封套、評(píng)論、下載狀態(tài)等中的至少一者。在一些實(shí)施例中,音樂(lè)數(shù)據(jù)庫(kù)242可包含多個(gè)識(shí)別信息項(xiàng)目,其中的每一者可與多首首樂(lè)中的一者相關(guān)聯(lián)。
[0035]另外,音樂(lè)數(shù)據(jù)庫(kù)242還可包含多個(gè)音樂(lè)模型,其中的每一者可指示多首音樂(lè)中的一者。音樂(lè)模型可為聲音特性的統(tǒng)計(jì)模型,或可包含聲音特性或聲音特征(例如音頻指紋、MFCC向量等)。盡管圖2中說(shuō)明三個(gè)電子裝置210到230,但任何其它合適數(shù)目的電子裝置(包含圖1中的電子裝置120)可經(jīng)由通信網(wǎng)絡(luò)250與服務(wù)器240通信。
[0036]在所說(shuō)明的實(shí)施例中,電子裝置210到230可定位于不同位置處,且連續(xù)地、周期性地或不定期地接收包含對(duì)應(yīng)于不同首音樂(lè)的聲音的不同輸入聲音流。電子裝置210到230中的每一者可將接收到的輸入聲音流轉(zhuǎn)換為音頻流。當(dāng)接收到輸入聲音流并將其轉(zhuǎn)換成音頻流時(shí),電子裝置210到230中的每一者可檢測(cè)音頻流中的聲音,并開(kāi)始檢測(cè)音頻流中的音樂(lè)。
[0037]一旦在音頻串流中檢測(cè)到音樂(lè),電子裝置210到230就可開(kāi)始處理音頻流,以識(shí)別相應(yīng)音頻流中的若干首音樂(lè)。舉例來(lái)說(shuō),當(dāng)檢測(cè)到音樂(lè)時(shí),電子裝置210可開(kāi)始從音頻流提取至少一個(gè)聲音特征。在一些實(shí)施例中,可使用任何合適的特征提取方案(例如音頻指紋方法、MFCC方法等)提取至少一個(gè)聲音特征。在此情況下,電子裝置210可最初提取可用以識(shí)別音頻流中的一首音樂(lè)的至少一個(gè)聲音特征。接著可經(jīng)由通信網(wǎng)絡(luò)250將電子裝置210中所提取的至少一個(gè)聲音特征發(fā)射到服務(wù)器240。盡管參照電子裝置210來(lái)描述圖2的所說(shuō)明實(shí)施例,但電子裝置220和230還可經(jīng)配置以便以與電子裝置210類(lèi)似的方式執(zhí)行和操作。
[0038]在從電子裝置210接收到至少一個(gè)聲音特征后,服務(wù)器240可存取音樂(lè)數(shù)據(jù)庫(kù)242以獲得與所述至少一個(gè)聲音特征相關(guān)聯(lián)的識(shí)別信息。在一個(gè)實(shí)施例中,服務(wù)器240可將接收到的至少一個(gè)聲音特征與音樂(lè)數(shù)據(jù)庫(kù)242中的音樂(lè)模型進(jìn)行比較,且識(shí)別對(duì)應(yīng)于所述至少一個(gè)聲音特征的音樂(lè)模型。服務(wù)器240接著可識(shí)別與所識(shí)別的音樂(lè)模型相關(guān)聯(lián)的一首音樂(lè),且從音樂(lè)數(shù)據(jù)庫(kù)242檢索所識(shí)別的所述首音樂(lè)的識(shí)別信息??蓪樗鍪滓魳?lè)檢索到的識(shí)別信息發(fā)射到電子裝置210。
[0039]在接收到與所述首音樂(lè)相關(guān)聯(lián)的識(shí)別信息后,電子裝置210可獲得電子裝置210的位置以及接收到所述首音樂(lè)的時(shí)間,且用所述首音樂(lè)的所述識(shí)別信息、所述位置和時(shí)間來(lái)更新音樂(lè)歷史數(shù)據(jù)庫(kù)。一旦從服務(wù)器240接收到所述首音樂(lè)的所述識(shí)別信息,電子裝置210就無(wú)法再與服務(wù)器240通信,直到在所述音頻流中檢測(cè)到不同首音樂(lè)的音樂(lè)為止。
[0040]在一些實(shí)施例中,服務(wù)器240還可將與所識(shí)別的所述首音樂(lè)相關(guān)聯(lián)的音樂(lè)模型發(fā)射到電子裝置210。在接收到音樂(lè)模型后,電子裝置210可即刻開(kāi)始在音頻流中跟蹤所述首音樂(lè),以檢測(cè)所述首音樂(lè)的結(jié)束。當(dāng)從輸入聲音流產(chǎn)生音頻流時(shí),電子裝置210可監(jiān)視所述音頻流,以檢測(cè)音頻流中的所述首音樂(lè)的結(jié)束。根據(jù)一個(gè)實(shí)施例,電子裝置120可對(duì)音頻流的一部分進(jìn)行取樣,且基于音樂(lè)模型來(lái)確定所取樣的部分是否指示所述首音樂(lè)(即所取樣的部分是否是所述首音樂(lè)的一部分)。
[0041]通過(guò)接收和存儲(chǔ)多首音樂(lè)的識(shí)別信息以更新音樂(lè)歷史數(shù)據(jù)庫(kù),電子裝置210可提供與多首音樂(lè)有關(guān)的多種信息。在一個(gè)實(shí)施例中,電子裝置210可基于音樂(lè)歷史數(shù)據(jù)庫(kù)產(chǎn)生頻繁聽(tīng)的若干首音樂(lè)的列表,并向用戶(hù)提供下載或購(gòu)買(mǎi)一或多個(gè)首音樂(lè)的建議。另外或替代地,電子裝置210可在頻繁聽(tīng)的若干首音樂(lè)的列表中選擇一首音樂(lè),使得選定首音樂(lè)從外部服務(wù)器(例如服務(wù)器240或另一服務(wù)器)流式傳輸。另外,電子裝置210可提供在一或多個(gè)時(shí)間段或位置中聽(tīng)到的若干首音樂(lè)的列表,以及與所述首音樂(lè)相關(guān)聯(lián)的時(shí)間或位置。
[0042]在另一個(gè)實(shí)施例中,來(lái)自服務(wù)器240的一首音樂(lè)的識(shí)別信息可包含指示所述首音樂(lè)可用于免費(fèi)下載或與特定類(lèi)型的音樂(lè)視頻(例如搞笑音樂(lè)視頻、高評(píng)分音樂(lè)視頻等)相關(guān)聯(lián)的額外信息。在接收到所述首音樂(lè)的識(shí)別信息后,電子裝置210可即刻在電子裝置210的屏幕上輸出額外信息。所述額外信息可與可用于經(jīng)由通信網(wǎng)絡(luò)250下載所述首音樂(lè)的音頻文件或檢視相關(guān)聯(lián)的首樂(lè)視頻的一或多個(gè)圖標(biāo)一起顯不。
[0043]電子裝置210到230可經(jīng)配置以通過(guò)通信網(wǎng)絡(luò)250或?qū)Φ韧ㄐ欧桨副舜送ㄐ?。舉例來(lái)說(shuō),電子裝置210和220可彼此通信,以共享相應(yīng)的音樂(lè)歷史數(shù)據(jù)庫(kù)或此類(lèi)數(shù)據(jù)庫(kù)的子集。從電子裝置220的音樂(lè)歷史數(shù)據(jù)庫(kù),電子裝置210可確定與電子裝置220的用戶(hù)所聽(tīng)的若干首音樂(lè)有關(guān)的信息,例如電子裝置220的頻繁聽(tīng)的若干首音樂(lè)的列表以及最?lèi)?ài)音樂(lè)列表。在另一個(gè)實(shí)施例中,電子裝置210可通過(guò)通信網(wǎng)絡(luò)250將音樂(lè)歷史數(shù)據(jù)庫(kù)或所述數(shù)據(jù)庫(kù)的子集上載到社交網(wǎng)絡(luò)服務(wù)(SNS)服務(wù)器(未圖示)上,以與例如電子裝置220和230等其它電子裝置共享所述數(shù)據(jù)庫(kù)。
[0044]圖3說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以識(shí)別音頻流中的一首音樂(lè)以用于更新存儲(chǔ)單元中的音樂(lè)歷史數(shù)據(jù)庫(kù)的電子裝置300的框圖。電子裝置300可包含聲音傳感器310、1/0(輸入/輸出)單元320、通信單元330、處理器340、存儲(chǔ)單元360、位置傳感器370和時(shí)鐘模塊380。電子裝置300可為配備有聲音捕獲和處理能力以及通信能力的任何合適裝置,例如蜂窩式電話、智能電話、可穿戴計(jì)算機(jī)、智能表、智能眼鏡、膝上型計(jì)算機(jī)、平板個(gè)人計(jì)算機(jī)、游戲裝置、多媒體播放器等。另外,如上文參照?qǐng)D1和2所描述的電子裝置120、210、220和230還可配置有如圖3中所示的電子裝置300的組件。
[0045]處理器340可為經(jīng)配置以管理和操作電子裝置300的任何類(lèi)型的處理單元,包含(但不限于)AP(應(yīng)用程序處理器CPU(中央處理單元)或使用一或多個(gè)處理核心的MPU(微處理器單元)。處理器340可包含:DSP(數(shù)字信號(hào)處理器)350,其經(jīng)配置以處理音頻流;音樂(lè)識(shí)別單元342,其經(jīng)配置以從音頻流識(shí)別一首音樂(lè);以及音樂(lè)管理單元344,其經(jīng)配置以管理所述首音樂(lè)的記錄。在此配置中,DSP 350可包含聲音處理單元352和緩沖存儲(chǔ)器354。在一實(shí)施例中,DSP 350可為用于降低處理音頻流的電力消耗的低電力處理器。盡管將DSP 350說(shuō)明為包含于處理器340中,但在一些實(shí)施例中,DSP 350可與電子裝置300中的處理器340分開(kāi)布置。另外或替代地,音樂(lè)識(shí)別單元342和音樂(lè)管理單元344可為DSP 350內(nèi)提供的軟件單
J L ο
[0046]存儲(chǔ)單元360可包含可由處理器340存取的音樂(lè)模型數(shù)據(jù)庫(kù)362和音樂(lè)歷史數(shù)據(jù)庫(kù)364。音樂(lè)模型數(shù)據(jù)庫(kù)362可包含用于監(jiān)視音頻流且跟蹤音頻流中的一首音樂(lè)的一或多個(gè)音樂(lè)模型。舉例來(lái)說(shuō),音樂(lè)模型數(shù)據(jù)庫(kù)362可包含預(yù)定基礎(chǔ)音樂(lè)模型,其用于產(chǎn)生所述首音樂(lè)的音樂(lè)模型,如下文將參看圖4更詳細(xì)地描述。如本文所使用,術(shù)語(yǔ)“基礎(chǔ)音樂(lè)模型”可指指示一般來(lái)說(shuō)可指示音樂(lè)的一般和/或常見(jiàn)聲音特性(例如音調(diào)、節(jié)奏、力度等)的音樂(lè)模型。另外,可基于從指定首音樂(lè)提取的至少一個(gè)聲音特征來(lái)將所述基礎(chǔ)音樂(lè)模型修改為用于指定的一首音樂(lè)的音樂(lè)模型。
[0047]存儲(chǔ)單元360中的音樂(lè)歷史數(shù)據(jù)庫(kù)364可包含已由電子裝置300或由服務(wù)器識(shí)別的一或多首音樂(lè)的記錄。舉例來(lái)說(shuō),所識(shí)別的所述首音樂(lè)的記錄可包含與所述首音樂(lè)相關(guān)聯(lián)的識(shí)別信息,關(guān)于接收到所述首音樂(lè)的位置和時(shí)間的信息,以及類(lèi)似信息??赏ㄟ^(guò)位置傳感器370和時(shí)鐘模塊380來(lái)獲得關(guān)于位置和時(shí)間的信息,如下文將更詳細(xì)地描述。另外,音樂(lè)歷史數(shù)據(jù)庫(kù)364可包含用戶(hù)的最?lèi)?ài)音樂(lè)列表、另一用戶(hù)的最?lèi)?ài)音樂(lè)列表等。存儲(chǔ)單元260可為遠(yuǎn)程或本地存儲(chǔ)裝置,且可使用任何合適的存儲(chǔ)或存儲(chǔ)器裝置來(lái)實(shí)施,例如RAM(隨機(jī)存取存儲(chǔ)器)、R0M(只讀存儲(chǔ)器)、EEPR0M(電可擦除可編程只讀存儲(chǔ)器)、快閃存儲(chǔ)器或SSD(固態(tài)驅(qū)動(dòng)器)。
[0048]聲音傳感器310可經(jīng)配置以連續(xù)地接收包含所述多首音樂(lè)的所述序列的輸入聲音流,并將所述輸入聲音流轉(zhuǎn)換為音頻流。聲音傳感器310可將音頻流提供到DSP 350中的聲音處理單元352。聲音傳感器310可包含可用于接收、捕獲、感測(cè)、轉(zhuǎn)換和/或檢測(cè)輸入聲音流的一或多個(gè)麥克風(fēng)或任何其它類(lèi)型的聲音傳感器。另外,聲音傳感器310可使用任何合適的軟件和/或硬件來(lái)執(zhí)行此類(lèi)功能。
[0049]為了降低電力消耗,聲音傳感器310可經(jīng)配置以根據(jù)工作循環(huán)周期性地接收輸入聲音流,并將其轉(zhuǎn)換為音頻流。舉例來(lái)說(shuō),聲音傳感器310可以10%工作循環(huán)操作,使得在所述時(shí)間的10 % (例如,200ms周期中的20ms)接收到輸入聲音流,且可將輸入聲音流的接收到的部分轉(zhuǎn)換成所述音頻流的一部分。在此情況下,聲音傳感器310可從所述音頻流的所述部分檢測(cè)聲音。舉例來(lái)說(shuō),可確定音頻流的所述部分的聲音強(qiáng)度,并將其與預(yù)定閾值聲音強(qiáng)度進(jìn)行比較。如果音頻流的所述部分的聲音強(qiáng)度超過(guò)閾值聲音強(qiáng)度,那么聲音傳感器310可去活工作循環(huán)功能,以繼續(xù)接收輸入聲音流的其余部分,并將其轉(zhuǎn)換為音頻流的其余部分。另夕卜,聲音傳感器310可激活DSP 350,并向DSP 350提供音頻流的其余部分。
[0050]當(dāng)DSP 350由聲音傳感器310激活時(shí),聲音處理單元352可經(jīng)配置以從聲音傳感器310接收音頻流的所述部分,并確定音頻流的接收到的部分是否包含音樂(lè)(或音頻流的接收到的部分是否指示音樂(lè))。在一個(gè)實(shí)施例中,聲音處理單元352可從音頻流的接收到的部分提取至少一個(gè)聲音特征,并確定所述至少一個(gè)所提取的聲音特征是否指示所關(guān)注的聲音,例如音樂(lè)。可使用任何合適的特征提取方案(例如音頻指紋方法、MFCC方法等)來(lái)提取聲音特征。
[0051 ]響應(yīng)于從音頻流檢測(cè)到音樂(lè),DSP 350可激活處理器340,這又可允許音樂(lè)識(shí)別單元342識(shí)別與所述檢測(cè)到的音樂(lè)相關(guān)聯(lián)的一首音樂(lè)??蓮囊纛l流的一部分提取至少一個(gè)聲音特征,且可基于所述至少一個(gè)聲音特征來(lái)識(shí)別所述首音樂(lè)。根據(jù)一些實(shí)施例,聲音處理單元352可向音樂(lè)識(shí)別單元342提供已提取來(lái)用于檢測(cè)音樂(lè)的至少一個(gè)聲音特征,且音樂(lè)識(shí)別單元342接著可基于從聲音處理單元352提供的至少一個(gè)聲音特征來(lái)識(shí)別所述首音樂(lè)。
[0052]在一個(gè)實(shí)施例中,音樂(lè)識(shí)別單元342可通過(guò)經(jīng)由通信單元330通過(guò)通信網(wǎng)絡(luò)390將至少一個(gè)聲音特征發(fā)射到外部裝置(例如圖2中的服務(wù)器240)來(lái)識(shí)別與檢測(cè)到的音樂(lè)相關(guān)聯(lián)的一首音樂(lè)。所述外部裝置可包含具有多首音樂(lè)的識(shí)別信息的音樂(lè)數(shù)據(jù)庫(kù)。在從電子裝置300接收到至少一個(gè)聲音特征后,外部裝置可搜索音樂(lè)數(shù)據(jù)庫(kù)以尋找與接收到的聲音特征相關(guān)聯(lián)的識(shí)別信息,并將所述識(shí)別信息發(fā)射到電子裝置300。在另一個(gè)實(shí)施例中,電子裝置300中的存儲(chǔ)單元360可包含音樂(lè)數(shù)據(jù)庫(kù)(未圖示),其具有多首音樂(lè)的識(shí)別信息。在此情況下,音樂(lè)識(shí)別單元342可搜索存儲(chǔ)單元360中的音樂(lè)數(shù)據(jù)庫(kù),以尋找與所述聲音特征相關(guān)聯(lián)的所述識(shí)別信息。
[0053]I/O單元320可經(jīng)配置以接收來(lái)自電子裝置300的用戶(hù)的輸入,和/或?yàn)樗鲇脩?hù)輸出信息。I/O單元320可為能夠接收輸入命令和/或輸出信息的任何合適的裝置,例如觸摸屏、觸摸墊、觸摸傳感器、按鈕、鍵、觸感傳感照明傳感運(yùn)動(dòng)傳感麥克LCD顯示器、揚(yáng)聲器等。當(dāng)獲得所述識(shí)別信息時(shí),音樂(lè)識(shí)別單元342可將所述識(shí)別信息或與所述識(shí)別信息有關(guān)的任何信息提供到I/O單元320。另外,例如,I/O單元320還可顯示用于下載和共享所述首音樂(lè)的圖標(biāo),如圖1中所示。在此情況下,可接收在所顯示圖標(biāo)當(dāng)中選擇一圖標(biāo)的輸入,且可響應(yīng)于所述輸入而執(zhí)行與選定圖標(biāo)有關(guān)的功能。
[0054]位置傳感器370可經(jīng)配置以獲得電子裝置300的位置信息,用于更新所識(shí)別的一首音樂(lè)的音樂(lè)歷史數(shù)據(jù)庫(kù)364。舉例來(lái)說(shuō),位置傳感器370可通過(guò)確定當(dāng)接收到或識(shí)別所述首音樂(lè)時(shí)(或當(dāng)獲得所述首音樂(lè)的識(shí)別信息時(shí))移動(dòng)裝置所處的位置來(lái)獲得位置信息。在確定電子裝置300的位置信息時(shí),位置傳感器370可接收和使用GPS位置信息,如果此信息可用(例如在戶(hù)外設(shè)定中)。如果GPS信息不可用(例如在室內(nèi)設(shè)定中),那么位置傳感器370可從W1-Fi接入點(diǎn)或小區(qū)塔基站接收信號(hào),并基于接收到的信號(hào)中的每一者的強(qiáng)度和/或使用任何合適的三角測(cè)量方法來(lái)確定電子裝置300的位置。
[0055]時(shí)鐘模塊380可經(jīng)配置以監(jiān)視接收到或識(shí)別所述首音樂(lè)的時(shí)間。舉例來(lái)說(shuō),時(shí)鐘模塊380可記錄獲得所述首音樂(lè)的所述識(shí)別信息的時(shí)間。根據(jù)一些實(shí)施例,識(shí)別所述首音樂(lè)的處理器340可包含時(shí)鐘模塊380。
[0056]在一些實(shí)施例中,一旦音樂(lè)識(shí)別單元342獲得一首音樂(lè)的識(shí)別信息,就可將所述識(shí)別信息提供到音樂(lè)管理單元344。為了保持所述首音樂(lè)的記錄,音樂(lè)管理單元344可將所述識(shí)別信息提供到音樂(lè)歷史數(shù)據(jù)庫(kù)364,使得所述識(shí)別信息可存儲(chǔ)在音樂(lè)歷史數(shù)據(jù)庫(kù)364中。另外,音樂(lè)管理單元344可分別從位置傳感器370和時(shí)鐘模塊380接收與所述首音樂(lè)相關(guān)聯(lián)的位置信息和時(shí)間信息,且可將所述位置信息和時(shí)間信息連同所述首音樂(lè)的所述識(shí)別信息存儲(chǔ)在音樂(lè)歷史數(shù)據(jù)庫(kù)364中。在一些實(shí)施例中,所述識(shí)別信息、所述位置信息和/或所述時(shí)間信息可分別從音樂(lè)識(shí)別單元342、位置傳感器370和/或時(shí)鐘模塊380直接提供到音樂(lè)歷史數(shù)據(jù)庫(kù)364,而不經(jīng)由音樂(lè)管理單元344。如下文將參看圖10更詳細(xì)地描述,音樂(lè)管理單元344還可經(jīng)配置以為電子裝置300的用戶(hù)產(chǎn)生建議和通知。
[0057]除如上文所描述識(shí)別所述首音樂(lè)和更新音樂(lè)歷史數(shù)據(jù)庫(kù)364之外,當(dāng)聲音傳感器310檢測(cè)到音樂(lè)并激活DSP 350時(shí),DSP 350中的聲音處理單元352可產(chǎn)生或獲得與所述檢測(cè)到的音樂(lè)相關(guān)聯(lián)的所述首音樂(lè)的音樂(lè)模型。根據(jù)一個(gè)實(shí)施例,聲音處理單元352可從音頻流的一部分提取至少一個(gè)聲音特征,并基于所述至少一個(gè)聲音特征產(chǎn)生所述首音樂(lè)的音樂(lè)模型。在此情況下,所述音頻流的一部分可存儲(chǔ)在緩沖存儲(chǔ)器354中,且可從緩沖存儲(chǔ)器354中的所存儲(chǔ)的部分提取至少一個(gè)聲音特征。在一些實(shí)施例中,聲音處理單元352可從存儲(chǔ)單元360中的音樂(lè)模型數(shù)據(jù)庫(kù)362獲得基礎(chǔ)音樂(lè)模型,并基于至少一個(gè)聲音特征來(lái)修改所述基礎(chǔ)音樂(lè)模型以產(chǎn)生所述音樂(lè)模型。根據(jù)另一個(gè)實(shí)施例,聲音處理單元352可經(jīng)由通信單元330將至少一個(gè)聲音特征發(fā)射到外部裝置(例如,圖2中的服務(wù)器240),且以如上文參看圖2所描述的方式來(lái)接收與至少一個(gè)聲音特征相關(guān)聯(lián)的音樂(lè)模型。為所述首音樂(lè)產(chǎn)生或獲得的音樂(lè)模型可存儲(chǔ)在音樂(lè)模型數(shù)據(jù)庫(kù)362中。
[0058]一旦為所述首音樂(lè)產(chǎn)生或獲得音樂(lè)模型,聲音處理單元352就可對(duì)音頻流的至少一個(gè)部分進(jìn)行樣本(或接收),并基于所述音樂(lè)模型來(lái)確定所取樣的部分是否指示所述首音樂(lè)(即,所取樣的部分是所述首音樂(lè)的一部分)。舉例來(lái)說(shuō),如果當(dāng)聲音處理單元352對(duì)音頻流的一部分進(jìn)行取樣時(shí),同一首音樂(lè)仍在播放,那么可確定所取樣的部分指示所述首音樂(lè)。在此情況下,聲音處理單元352可確定所述首音樂(lè)尚未結(jié)束。另一方面,如果當(dāng)聲音處理單元352對(duì)音頻流的一部分進(jìn)行取樣時(shí),所述首音樂(lè)已結(jié)束,那么可確定所取樣的部分不指示所述首音樂(lè)。在此情況下,聲音處理單元352可確定所述首音樂(lè)已結(jié)束。在一些實(shí)施例中,聲音處理單元352可連續(xù)地、周期性地、不定期地或間或?qū)σ纛l流的多個(gè)部分進(jìn)行取樣。在此情況下,當(dāng)確定所取樣的部分(例如上一次取樣的部分)中的至少一者不指示所述首音樂(lè)時(shí),可檢測(cè)到所述首音樂(lè)的結(jié)束。
[0059]在確定所述首音樂(lè)已結(jié)束后,聲音傳感器310可即刻開(kāi)始根據(jù)工作循環(huán)周期性地接收輸入聲音流,將接收到的輸入聲音流轉(zhuǎn)換為音頻流,并檢測(cè)音頻流中的聲音。在檢測(cè)到音頻流中的聲音后,處理器340可繼續(xù)檢測(cè)音頻流中的新的一首音樂(lè)的音樂(lè),并識(shí)別所述新的一首音樂(lè)。另外,可產(chǎn)生或獲得所述新的一首音樂(lè)的新音樂(lè)模型,且基于所述新音樂(lè)模型來(lái)跟蹤所述新的一首音樂(lè),以便以如上文所描述的方式檢測(cè)所述新的一首音樂(lè)的結(jié)束。
[0060]圖4說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以產(chǎn)生或獲得一首音樂(lè)的音樂(lè)模型并基于所述音樂(lè)模型來(lái)跟蹤所述首音樂(lè)的聲音處理單元352的較詳細(xì)框圖。聲音處理單元352可包含音樂(lè)檢測(cè)模塊410、音樂(lè)模型管理模塊420和音樂(lè)跟蹤模塊430。如圖4中所示,聲音處理單元352可存取DSP 350中的緩沖存儲(chǔ)器354,以及存儲(chǔ)單元360中的音樂(lè)模型數(shù)據(jù)庫(kù)362。當(dāng)聲音傳感器310檢測(cè)音頻流中的聲音時(shí),如上文參看圖3所描述,聲音傳感器310可激活DSP 350中的聲音處理單元352的音樂(lè)檢測(cè)模塊410。
[0061]當(dāng)被激活時(shí),音樂(lè)檢測(cè)模塊410可從聲音傳感器310接收所述音頻流的至少一部分。音樂(lè)檢測(cè)模塊410可經(jīng)配置以通過(guò)使用任何合適的聲音分類(lèi)方法(例如基于GMM的分類(lèi)器、神經(jīng)網(wǎng)絡(luò)、基于HMM(隱式馬爾可夫模型)的分類(lèi)器、圖解模型或SVM(支持向量機(jī)))來(lái)檢測(cè)音頻流的接收到的部分中的音樂(lè)。如果確定音頻流的接收到的部分不指示音樂(lè),那么音樂(lè)檢測(cè)模塊410可指令聲音傳感器310開(kāi)始根據(jù)工作循環(huán)周期性地接收輸入聲音流,將接收到的輸入聲音流轉(zhuǎn)換為音頻流,且以如上文參看圖3所描述的方式來(lái)檢測(cè)音頻流中的聲音。在此情況下,可去活DSP 350以便降低電力消耗。另一方面,如果確定音頻流的接收到的部分指示音樂(lè),那么音樂(lè)檢測(cè)模塊410可激活音樂(lè)模型管理模塊420。
[0062]當(dāng)被激活時(shí),音樂(lè)模型管理模塊420可從聲音傳感器310接收所述音頻流的至少一部分。舉例來(lái)說(shuō),音頻流的接收到的部分可為音頻流的其中檢測(cè)到音樂(lè)的部分,或在音頻流的其中檢測(cè)到音樂(lè)的部分之后的部分?;谝纛l流的接收到的部分,音樂(lè)模型管理模塊420可產(chǎn)生一首音樂(lè)的音樂(lè)模型,其與音樂(lè)檢測(cè)模塊410檢測(cè)到的音樂(lè)相關(guān)聯(lián)。在一個(gè)實(shí)施例中,音樂(lè)模型管理模塊420可從音頻流的接收到的部分提取至少一個(gè)聲音特征(例如音頻指紋、MFCC向量等),且可基于所述至少一個(gè)聲音特征產(chǎn)生所述首音樂(lè)的音樂(lè)模型。緩沖存儲(chǔ)器354可存儲(chǔ)音頻流的一部分,且音樂(lè)模型管理模塊420可存取緩沖存儲(chǔ)器354中的所存儲(chǔ)的部分,以提取至少一個(gè)聲音特征,用于產(chǎn)生所述首音樂(lè)的音樂(lè)模型。
[0063]根據(jù)一些實(shí)施例,存儲(chǔ)單元360中的音樂(lè)模型數(shù)據(jù)庫(kù)362可包含預(yù)定基礎(chǔ)音樂(lè)模型。在此情況下,音樂(lè)模型管理模塊420可通過(guò)基于從音頻流的所述部分提取的至少一個(gè)聲音特征修改基礎(chǔ)音樂(lè)模型來(lái)產(chǎn)生所述首音樂(lè)的音樂(lè)模型。一旦產(chǎn)生所述首音樂(lè)的音樂(lè)模型,音樂(lè)模型管理模塊420就可激活音樂(lè)跟蹤模塊430,并將所述音樂(lè)模型提供到音樂(lè)跟蹤模塊430。在一個(gè)實(shí)施例中,音樂(lè)模型管理模塊420可將所述首音樂(lè)的音樂(lè)模型存儲(chǔ)在音樂(lè)模型數(shù)據(jù)庫(kù)362中,使得音樂(lè)跟蹤模塊430可存取音樂(lè)模型數(shù)據(jù)庫(kù)362,以獲得所述首音樂(lè)的音樂(lè)模型?;蛘呋蛄硗?,音樂(lè)模型管理模塊420可以如上文參看圖2所描述的方式,從外部裝置(例如圖2中的服務(wù)器240)獲得所述首音樂(lè)的音樂(lè)模型,并將所述音樂(lè)模型提供到音樂(lè)跟蹤模塊430。
[0064]當(dāng)被激活時(shí),音樂(lè)跟蹤模塊430可接收音頻流的后續(xù)部分,并基于所述首音樂(lè)的音樂(lè)模型來(lái)監(jiān)視接收到的部分。在一些實(shí)施例中,可將音頻流的后續(xù)部分存儲(chǔ)在緩沖存儲(chǔ)器354中,且音樂(lè)跟蹤模塊430可存取緩沖存儲(chǔ)器354中的音頻流的所存儲(chǔ)部分。通過(guò)對(duì)音頻流的至少一個(gè)部分進(jìn)行取樣(或接收),且基于音樂(lè)模型確定所取樣的部分是否指示所述首音樂(lè)(即所取樣的部分是否是所述首音樂(lè)的一部分),音樂(lè)跟蹤模塊430可跟蹤所述首音樂(lè),并檢測(cè)所述首音樂(lè)的結(jié)束。
[0065]根據(jù)一些實(shí)施例,音樂(lè)跟蹤模塊430可基于所述首音樂(lè)的音樂(lè)模型以及從所取樣的部分提取的至少一個(gè)聲音特征來(lái)確定所述首音樂(lè)與所取樣的部分之間的類(lèi)似性值(或得分)。在一個(gè)實(shí)施例中,可基于音樂(lè)模型與從所取樣的部分提取的至少一個(gè)聲音特征之間的類(lèi)似性值來(lái)確定所述類(lèi)似性值。下文將參看圖6更詳細(xì)地描述用于確定類(lèi)似性值的方案。
[0066]—旦確定所取樣的部分的類(lèi)似性值,就可將所述類(lèi)似性值與可存儲(chǔ)在存儲(chǔ)單元360中的預(yù)定閾值進(jìn)行比較。如果所述類(lèi)似性值超過(guò)閾值,那么確定所取樣的部分指示所述首音樂(lè)。在此情況下,音樂(lè)跟蹤模塊430可確定所取樣的部分是所述首音樂(lè)的一部分,且所述首音樂(lè)尚未結(jié)束。另一方面,如果類(lèi)似性值不超過(guò)閾值,那么確定所取樣的部分不指示所述首音樂(lè)。在此情況下,音樂(lè)跟蹤模塊430可確定所取樣的部分不是所述首音樂(lè)的一部分,且所述首音樂(lè)已結(jié)束。在一個(gè)實(shí)施例中,音樂(lè)跟蹤模塊430可連續(xù)地、周期性地或不定期地對(duì)音頻流的多個(gè)部分進(jìn)行取樣,且確定所取樣的部分中的每一者是否是所述首音樂(lè)的一部分。
[0067]一旦確定所取樣的部分不是所述首音樂(lè)的一部分,音樂(lè)跟蹤模塊430就可指令聲音傳感器310開(kāi)始根據(jù)工作循環(huán)周期性地接收輸入聲音流,將接收到的輸入聲音流轉(zhuǎn)換成音頻流,且檢測(cè)音頻流中的聲音。在此情況下,可去活DSP 350以便降低電力消耗。如果在音頻流中檢測(cè)到聲音,那么可以如上文所描述的方式來(lái)執(zhí)行檢測(cè)音頻流中的音樂(lè)、為新的一首音樂(lè)產(chǎn)生或獲得新的音樂(lè)模型,且基于所述新的音樂(lè)模型來(lái)跟蹤所述新的一首音樂(lè)的過(guò)程。
[0068]圖5說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于跟蹤輸入聲音流510中的一首音樂(lè)516以確定所述首音樂(lè)516是否已結(jié)束的時(shí)序圖500。為了處理輸入聲音流510,電子裝置300的聲音傳感器310可接收輸入聲音流510,其包含靜默512、汽車(chē)噪聲514、所述首音樂(lè)516和語(yǔ)音518的序列。在一個(gè)實(shí)施例中,聲音傳感器310可經(jīng)配置以接收輸入聲音流510,并將其轉(zhuǎn)換成可由聲音處理單元352處理的音頻流。
[0069]在一些實(shí)施例中,聲音傳感器310可經(jīng)配置以根據(jù)預(yù)定工作循環(huán),在預(yù)定時(shí)間周期內(nèi)(例如介于1與30毫秒(ms)之間的任何合適時(shí)間周期,例如20ms,用于音頻分析,例如快速傅里葉變換),以預(yù)定間隔T1(例如介于一百毫秒與若干秒之間的任何合適時(shí)間周期,例如180ms)周期性地接收輸入聲音流510。舉例來(lái)說(shuō),在間隔1^的激活狀態(tài)期間,聲音傳感器310可接收輸入聲音流的一部分,并將接收到的部分轉(zhuǎn)換為音頻流的一部分(例如S1、S2、S3等)。對(duì)于音頻流部分中的每一者,例如S3等,聲音傳感器310可通過(guò)確定每一部分是否包含超過(guò)預(yù)定閾值聲音強(qiáng)度的聲音來(lái)檢測(cè)聲音。根據(jù)一些實(shí)施例,假定一首典型的音樂(lè)的長(zhǎng)度可為約若干分鐘(例如約三或四分鐘),那么可將間隔T1S定成若干秒長(zhǎng)。在此情況下,在間隔1^的非作用中狀態(tài)下持續(xù)若干秒的輸入聲音流510的缺失部分(即輸入聲音流510的未由聲音傳感器310接收的部分)可不顯著影響一首音樂(lè)中的聲音的檢測(cè)。本文提到的時(shí)間周期是僅出于示范性目的,且還可利用其它周期。
[0070]當(dāng)在音頻流部分ShS^S3等中檢測(cè)到聲音時(shí),可去活工作循環(huán)功能,以允許聲音傳感器310繼續(xù)接收輸入聲音流510的一或多個(gè)后續(xù)部分,并將接收到的部分轉(zhuǎn)換成對(duì)應(yīng)的一或多個(gè)音頻流部分。在此情況下,可繼續(xù)接收輸入聲音流的一或多個(gè)后續(xù)部分,并將其轉(zhuǎn)換成對(duì)應(yīng)的一或多個(gè)音頻流部分,以用于通過(guò)音樂(lè)檢測(cè)模塊410來(lái)檢測(cè)與所述首音樂(lè)516相關(guān)聯(lián)的音樂(lè),且如果檢測(cè)到音樂(lè),那么跟蹤所述首音樂(lè)516以尋找所述首音樂(lè)516的結(jié)束。
[0071]如圖5中所示,聲音傳感器310可根據(jù)工作循環(huán)接收輸入聲音流510的多個(gè)部分,其包含靜默512、汽車(chē)噪聲514、所述首音樂(lè)516和語(yǔ)音518的序列。最初,在間隔!^的激活狀態(tài)期間接收輸入聲音流510中的靜默512的一部分,并通過(guò)聲音傳感器310將其轉(zhuǎn)換成音頻流部分S1。在此情況下,聲音傳感器310可不從音頻流部分51檢測(cè)聲音,且在間隔T1的非作用中狀態(tài)期間去活。在間隔!^結(jié)束時(shí),可激活聲音傳感器310,以接收輸入聲音流510中的靜默512的另一部分,并將接收到的部分轉(zhuǎn)換為音頻流部分S2。由于音頻流部分S2對(duì)應(yīng)于靜默512的一部分,因此聲音傳感器310可能未檢測(cè)到聲音。
[0072]在間隔T1的下一激活狀態(tài)期間,可激活聲音傳感器310,以接收輸入聲音流510中的汽車(chē)噪聲514的另一部分,并將接收到的部分轉(zhuǎn)換為音頻流部分S3。在此情況下,聲音傳感器310可確定音頻流部分S3超過(guò)預(yù)定閾值聲音強(qiáng)度,且因此在音頻流部分S3中檢測(cè)到聲音。在音頻流部分S3中檢測(cè)到聲音后,聲音傳感器310可去活工作循環(huán)功能,以接收輸入聲音流510的之后部分,并將接收到的部分轉(zhuǎn)換為表示為M1的音頻流部分。另外,聲音傳感器310可激活DSP 350的聲音處理單元352中的音樂(lè)檢測(cè)模塊410,并將音頻流部分施提供到音樂(lè)檢測(cè)模塊410。
[0073]當(dāng)被激活時(shí),音樂(lè)檢測(cè)模塊410可經(jīng)配置以在預(yù)定時(shí)間周期(例如10秒)內(nèi)接收音頻流的一部分,如由施或跑表示。在所說(shuō)明的實(shí)施例中,當(dāng)聲音傳感器310在音頻流部分S3中檢測(cè)到聲音時(shí),音樂(lè)檢測(cè)模塊410可接收對(duì)應(yīng)于汽車(chē)噪聲514的一部分的音頻流部分見(jiàn),且可確定音頻流部分M1并不包含音樂(lè)。在此情況下,音樂(lè)檢測(cè)模塊410可去活聲音傳感器310,以在預(yù)定時(shí)間周期T2R中斷接收輸入聲音流510。在一個(gè)實(shí)施例中,當(dāng)未檢測(cè)到音樂(lè)時(shí),可去活音樂(lè)檢測(cè)模塊410,以降低電力消耗。假定一首音樂(lè)通常可為若干分鐘長(zhǎng),那么時(shí)間周期T2,其可長(zhǎng)于間隔T1,可為例如介于10與30秒之間的任何合適的時(shí)間周期,因?yàn)槁曇魝鞲衅?10和音樂(lè)檢測(cè)模塊410在此時(shí)間周期內(nèi)的去活可能不顯著影響一首音樂(lè)中的聲音和音樂(lè)的檢測(cè)。
[0074]當(dāng)預(yù)定時(shí)間周期!^已逝去時(shí),可根據(jù)工作循環(huán)來(lái)激活聲音傳感器310,以接收輸入聲音流510中的所述首音樂(lè)516的一部分,并將所述首音樂(lè)516的接收到的部分轉(zhuǎn)換為音頻流部分S4。聲音傳感器310可通過(guò)確定音頻流部分S4包含超過(guò)預(yù)定閾值聲音強(qiáng)度的聲音來(lái)檢測(cè)音頻流部分S 4中對(duì)應(yīng)于所述首音樂(lè)516的一部分的聲音。在音頻流部分S 4中檢測(cè)到聲音后,聲音傳感器310可去活工作循環(huán)功能,以接收輸入聲音流510的之后部分,并將接收到的部分轉(zhuǎn)換為表示為M2的音頻流部分。另外,聲音傳感器310可激活音樂(lè)檢測(cè)模塊410,并將音頻流部分跑提供到音樂(lè)檢測(cè)模塊410。在一些實(shí)施例中,聲音傳感器310可持續(xù)接收輸入聲音流510的一或多個(gè)后續(xù)部分,并將所述部分轉(zhuǎn)換成音頻流部分(例如GhNhN^N3等),直到確定音頻流部分跑并不包含音樂(lè)或?qū)?yīng)于輸入聲音流510的后續(xù)部分中的一者的音頻流部分不是所述首音樂(lè)516的一部分為止。
[0075]在被激活后,音樂(lè)檢測(cè)模塊410可從聲音傳感器310接收對(duì)應(yīng)于所述首音樂(lè)516的一部分的音頻流部分M2,且可檢測(cè)音頻流部分跑中的音樂(lè)。響應(yīng)于在音頻流部分跑中檢測(cè)到音樂(lè),可激活音樂(lè)模型管理模塊420以在預(yù)定時(shí)間周期(例如10秒)內(nèi)接收在所述首音樂(lè)516的音頻流部分M2之后的音頻流部分G1?;谝纛l流部分GjP/或任何其它部分,音樂(lè)模型管理模塊420可產(chǎn)生或獲得所述首音樂(lè)516的音樂(lè)模型,如上文參看圖4所描述。在一個(gè)實(shí)施例中,音樂(lè)模型管理模塊420可從音頻流部分6工提取至少一個(gè)聲音特征,且基于所述至少一個(gè)聲音特征產(chǎn)生所述首音樂(lè)516的音樂(lè)模型。在另一個(gè)實(shí)施例中,可以如上文參看圖2所描述的方式,從外部裝置接收與從音頻流部分G1所提取的聲音特征相關(guān)聯(lián)的所述首音樂(lè)的音樂(lè)模型。
[0076]當(dāng)在基于音頻流部分G1產(chǎn)生或獲得音樂(lè)模型之后逝去了預(yù)定時(shí)間周期T3時(shí),可激活音樂(lè)跟蹤模塊430,以通過(guò)以預(yù)定間隔T4(例如介于2與30秒之間的任何合適時(shí)間周期)周期性地對(duì)一或多個(gè)后續(xù)音頻流部分(例如犯、犯和犯)進(jìn)行取樣來(lái)跟蹤所述首音樂(lè)516。在一些實(shí)施例中,在時(shí)間周期T3的結(jié)束之后,音樂(lè)跟蹤模塊430可經(jīng)配置以在預(yù)定時(shí)間周期(例如10秒)內(nèi)從聲音傳感器310接收音頻流部分(例如N^N2SN3)。盡管上文將音樂(lè)模型描述為是基于從圖5中的音頻流部分61提取的聲音特征而產(chǎn)生或獲得,但可基于從已經(jīng)用于檢測(cè)音樂(lè)的音頻流部分M2提取的聲音特征來(lái)產(chǎn)生或獲得音樂(lè)模型。在此情況下,預(yù)定時(shí)間周期T3可在對(duì)應(yīng)于音頻流部分跑的時(shí)間周期結(jié)束時(shí)開(kāi)始。
[0077]當(dāng)在用于跟蹤的間隔T4的開(kāi)頭接收到音頻流部分時(shí),音樂(lè)跟蹤模塊430可基于與所述首音樂(lè)516相關(guān)聯(lián)的音樂(lè)模型來(lái)確定所述音頻流部分是否指示所述首音樂(lè)516(即所述音頻流部分是所述首音樂(lè)516的一部分)。如果確定音頻流部分不是所述首音樂(lè)516的一部分,那么音樂(lè)跟蹤模塊430可確定所述首音樂(lè)516已結(jié)束。在此情況下,音樂(lè)跟蹤模塊430(或DSP 350,或處理器340)可產(chǎn)生一或多個(gè)中斷信號(hào),用于檢測(cè)音頻流中的聲音和音樂(lè),識(shí)別下一首音樂(lè)和/或跟蹤下一首音樂(lè)。舉例來(lái)說(shuō),音樂(lè)跟蹤模塊430可產(chǎn)生中斷信號(hào),且將中斷信號(hào)提供到聲音傳感器310,用于根據(jù)工作循環(huán)來(lái)接收輸入聲音流510,且在從輸入聲音流產(chǎn)生的音頻流中檢測(cè)聲音。另一方面,如果確定音頻流部分是所述首音樂(lè)516的指示所述首音樂(lè)516尚未結(jié)束的部分,那么音樂(lè)跟蹤模塊430可在間隔T4結(jié)束時(shí)接收下一音頻流。在此情況下,音樂(lè)跟蹤模塊430(或DSP 350,或處理器340)可不產(chǎn)生用于識(shí)別一首音樂(lè)的中斷信號(hào)。
[0078]在所說(shuō)明的實(shí)施例中,音樂(lè)跟蹤模塊430可接收對(duì)應(yīng)于所述首音樂(lè)516的一部分的音頻流部分N1,且基于所述音樂(lè)模型來(lái)確定音頻流部分N1是所述首音樂(lè)516的一部分。在間隔T4結(jié)束時(shí),對(duì)應(yīng)于所述首音樂(lè)516的后續(xù)部分的音頻流部分N2可由音樂(lè)跟蹤模塊430接收,其可通過(guò)使用音樂(lè)模型來(lái)確定音頻流部分N2是所述首音樂(lè)516的一部分。在下一間隔T4的開(kāi)始,音樂(lè)跟蹤模塊430可接收音頻流部分N3,其對(duì)應(yīng)于輸入聲音流510中的語(yǔ)音518的一部分。由于音頻流部分N3對(duì)應(yīng)于語(yǔ)音518的所述部分,因此音樂(lè)跟蹤模塊430或替代地音樂(lè)檢測(cè)模塊410可基于音樂(lè)模型來(lái)確定音頻流部分N3不是所述首音樂(lè)516的一部分,指示所述首音樂(lè)516已結(jié)束。如上文所描述,使用音頻流部分(S卩NlN^N3等)來(lái)跟蹤所述首音樂(lè)516以確定所述首音樂(lè)516是否已結(jié)束。因此,即使在所述首音樂(lè)516結(jié)束之后接收到第一音頻流部分(SPN1),也可能不會(huì)對(duì)確定所接收的音頻串流部分不是所述首音樂(lè)516的一部分從而指示所述首音樂(lè)516已結(jié)束具有相當(dāng)大的影響。因此,時(shí)間周期T3可為長(zhǎng)于時(shí)間周期T2的任何合適時(shí)間周期,例如介于5秒與5分鐘之間。
[0079]一旦確定音頻流部分N3不是所述首音樂(lè)516的一部分(S卩,所述首音樂(lè)516已結(jié)束或不再可由聲音傳感器310檢測(cè)),音樂(lè)跟蹤模塊430就可激活聲音傳感器310,以開(kāi)始根據(jù)工作循環(huán)周期性地接收輸入聲音流510的一或多個(gè)部分。在圖5中所示的實(shí)施例中,聲音傳感器310可接收輸入聲音流510中的語(yǔ)音518的一部分,并將接收到的部分轉(zhuǎn)換為音頻流部分Ss ο在此情況下,聲音傳感器310可確定音頻流部分Ss包含超過(guò)預(yù)定閾值聲音強(qiáng)度的聲音。在檢測(cè)到聲首后,可激活首樂(lè)檢測(cè)t旲塊410以接收后續(xù)首頻流部分,并確定所述首頻流部分并不包含音樂(lè)。輸入聲音流510或其它輸入聲音流的后續(xù)部分的處理可由聲音傳感器310、音樂(lè)檢測(cè)模塊410、音樂(lè)模型管理模塊420和/或音樂(lè)跟蹤模塊430以如上文所描述的類(lèi)似方式執(zhí)行。盡管借助于實(shí)例以時(shí)間周期或間隔(例如T4等)的特定時(shí)間參數(shù)和/或范圍來(lái)描述以上實(shí)施例,但所述時(shí)間周期可不限于此類(lèi)時(shí)間參數(shù)和范圍,而是可設(shè)定成任何其它合適的時(shí)間參數(shù)和/或范圍。另外,可根據(jù)各種實(shí)施方案(例如電子裝置300的電池功率、電子裝置300的計(jì)算資源和電力、所述首音樂(lè)516的預(yù)期長(zhǎng)度等)視需要調(diào)整所述時(shí)間周期。
[0080]圖6說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于對(duì)音頻流610中的一首音樂(lè)的音頻流部分630進(jìn)行取樣且確定音頻流610中的后續(xù)部分640是否是所述首音樂(lè)的一部分的時(shí)序圖600。最初,可在音頻流610的部分620中檢測(cè)在音頻流部分630之前或緊接在其之前的音樂(lè)。在檢測(cè)到所述音樂(lè)后,音樂(lè)模型管理模塊420可從音頻流部分630提取至少一個(gè)聲音特征650,且產(chǎn)生或獲得與所述部分620相關(guān)聯(lián)的所述首音樂(lè)的音樂(lè)模型。
[0081]接著可將所述首音樂(lè)的音樂(lè)模型提供到音樂(lè)跟蹤模塊430以用于跟蹤所述首音樂(lè)。音樂(lè)跟蹤模塊430可對(duì)音頻流610中的后續(xù)部分640進(jìn)行取樣,并從所取樣的音頻流部分640提取至少一個(gè)聲音特征660?;谒鲆魳?lè)模型聲音特征660,可確定所取樣的音頻流部分640是否是所述首音樂(lè)的一部分。根據(jù)一些實(shí)施例,音樂(lè)跟蹤模塊430可確定所取樣的音頻流部分640與所述首音樂(lè)的音樂(lè)模型之間的相似性。舉例來(lái)說(shuō),可計(jì)算指示所取樣的音頻流部分640與音樂(lè)模型之間的相似程度的類(lèi)似性值(例如得分、置信度值等)。如果類(lèi)似性值超過(guò)預(yù)定閾值,那么可確定所取樣的音頻流部分640是所述首音樂(lè)的一部分,指示所述首音樂(lè)尚未結(jié)束。另一方面,如果類(lèi)似性值并不超過(guò)閾值,那么可確定所取樣的音頻流部分640不是所述首音樂(lè)的一部分,指示所述首音樂(lè)已結(jié)束。
[0082]在一個(gè)實(shí)施例中,可基于概率值(例如似然值)來(lái)確定音頻流部分640與所述首音樂(lè)的音樂(lè)模型之間的類(lèi)似性值。舉例來(lái)說(shuō),可確定指示從音頻流部分640提取的至少一個(gè)聲音特征660指示音樂(lè)模型的可能性的第一概率值。另外,可確定指示至少一個(gè)聲音特征660是指示基礎(chǔ)音樂(lè)模型的可能性的第二概率值。在確定第一和第二概率值后,可通過(guò)從第一概率值減去第二概率值來(lái)確定音頻流部分640與所述首音樂(lè)的音樂(lè)模型之間的類(lèi)似性值,其可通過(guò)以下等式來(lái)表達(dá):
[0083]類(lèi)似性值=L(Xsample I Xmusic )—L ( Xsample | ^base )
[0084]其中Xsample表示從音頻流部分640提取的至少一個(gè)聲音特征660,Amusi。表示與所述首音樂(lè)相關(guān)聯(lián)的音樂(lè)模型,Abase3表示基礎(chǔ)音樂(lè)模型,LUsample31 Amusi。)表示第一概率值(例如,在給定Vjsi。的情況下,Xsample的記錄可能性),且L(XsamPle | Xbase )表示第二概率值(例如,在給定Abase的情況下,Xsample的記錄可能性)。
[0085]在另一個(gè)實(shí)施例中,可使用貝葉斯(Bayesian)信息準(zhǔn)則來(lái)確定類(lèi)似性值。如上文所描述,可基于從音頻流部分630提取的至少一個(gè)聲音特征650來(lái)產(chǎn)生或獲得所述首音樂(lè)的音樂(lè)模型。另外,可基于從所取樣的音頻流部分640提取的至少一個(gè)聲音特征660來(lái)產(chǎn)生或獲得另一音樂(lè)模型。舉例來(lái)說(shuō),可通過(guò)基于至少一個(gè)聲音特征660修改基礎(chǔ)音樂(lè)模型來(lái)產(chǎn)生音頻流部分640的音樂(lè)模型。根據(jù)此實(shí)施例,可為確指示至少一個(gè)聲音特征650是指示所述首音樂(lè)的音樂(lè)模型的可能性的第一概率值。另外,可確定指示至少一個(gè)聲音特征660是指示所取樣的音頻流部分640的其它音樂(lè)模型的可能性的第二概率值。此外,可確定指示聲音特征650和660是指示基礎(chǔ)音樂(lè)模型的可能性的第三概率值。在確定第一到第三概率值后,可通過(guò)將第三概率值從第一和第二概率值的總和減去來(lái)確定類(lèi)似性值,其可通過(guò)以下等式來(lái)表達(dá):
[0086]類(lèi)似性值=L( Xmusic I) +L ( Xsample |) —L ( Xmusic , Xsample | ^ase )
[0087]其中Xmusic表示從音頻流部分630提取的至少一個(gè)聲音特征650,xsample表示來(lái)自所取樣的音頻流部分640的至少一個(gè)聲音特征660 Amusl。表示與所述首音樂(lè)相關(guān)聯(lián)的音樂(lè)模型,Asample表示與音頻流部分640相關(guān)聯(lián)的音樂(lè)模型,Abase表示基礎(chǔ)音樂(lè)模型,L(xmusi。I Amusic)表示第一概率值(例如,在給定Xmusi。的情況下,Xmusi。的記錄可能性),L( Xsample | Xsample)表示第二概率值(例如,在給定^sample的情況下,Xsample的記錄可能性),且L ( Xmusic,Xsample | Abase )表示第三概率值(例如,在給定Xbase的情況下,Xmusi。和Xsample的記錄可能性)。
[0088]在以上實(shí)施例中,為了改進(jìn)計(jì)算資源和電力的效率,當(dāng)從所取樣的音頻流部分630提取每一聲音特征時(shí),可通過(guò)修改基礎(chǔ)音樂(lè)模型來(lái)產(chǎn)生所取樣的音頻流部分640的音樂(lè)模型。替代地,可基于所有所提取的聲音特征來(lái)修改基礎(chǔ)音樂(lè)模型一次。并且,為了改進(jìn)確定第一或第三概率值的效率,當(dāng)已從音頻流部分630提取多個(gè)聲音特征時(shí),可選擇和存儲(chǔ)所述多個(gè)聲音特征的子集,以用于確定第三概率值。舉例來(lái)說(shuō),可基于每一聲音特征是音樂(lè)的可能性來(lái)選擇聲音特征的子集。
[0089]在另一個(gè)實(shí)施例中,可使用交叉可能性比率方法來(lái)確定類(lèi)似性值。根據(jù)此實(shí)施例,可確定指示從音頻流部分640提取的至少一個(gè)聲音特征660是指示所述首音樂(lè)的音樂(lè)模型的可能性的第一概率值。另外,可確定指示從音頻流部分630提取的聲音特征650是指示音頻流部分640的音樂(lè)模型的可能性的第二概率值。另外,還可確定指示至少一個(gè)聲音特征650是指示基礎(chǔ)音樂(lè)模型的可能性的第三概率值,以及指示至少一個(gè)聲音特征660是指示基礎(chǔ)音樂(lè)模型的可能性的第四概率值。在確定第一到第四概率值后,可通過(guò)將第三和第四概率值從第一和第二概率值的總和減去來(lái)確定類(lèi)似性值,其可通過(guò)以下等式來(lái)表達(dá):
[0090]類(lèi)似性值=L(Xsample I Xmusic )+L ( Xmusic I Xsample ) _L ( Xmusic | Mmse ) _L ( Xsample | Mmse )
[0091]其中Xsample表示從音頻流部分640提取的至少一個(gè)聲音特征660,xmusic表示從音頻流部分630提取的至少一個(gè)聲音特征650 Amusl。表示與所述首音樂(lè)相關(guān)聯(lián)的音樂(lè)模型,Asample表示與音頻流部分640相關(guān)聯(lián)的音樂(lè)模型,Abase表示基礎(chǔ)音樂(lè)模型,L(Xsample|Amusi。)表示第一概率值(例如,在給定Xmusi。的情況下,Xsample的記錄可能性),L(Xmusi。| Xsample )表示第二概率值(例如,在給定Xbase的情況下,Xmusi。的記錄可能性),且L(XsamPle | Xbase )表示第四概率值(例如,在給定Xbase的情況下,Xsample的記錄可能性)。為了計(jì)算資源和電力的效率,可在確定類(lèi)似性值之前,事先確定第三概率值。
[0092]在又一實(shí)施例中,可基于音樂(lè)模型之間的距離值來(lái)確定類(lèi)似性值。舉例來(lái)說(shuō),可將歐幾里得距離、漢明距離、庫(kù)爾貝克-萊伯爾(Kullback-Leibler,KL)發(fā)散等計(jì)算為音樂(lè)模型之間的距離值。在此實(shí)施例中,可確定音頻流部分640的音樂(lè)模型與所述首音樂(lè)的音樂(lè)模型之間的第一距離值。另外,可確定所述首音樂(lè)的音樂(lè)模型與基礎(chǔ)音樂(lè)模型之間的第二距離值,且可確定音頻流部分640的音樂(lè)模型與基礎(chǔ)音樂(lè)模型之間的第三距離值。在確定第一到第三距離值后,可通過(guò)將第二和第三距離值從第一距離值的成倍值減去來(lái)確定類(lèi)似性值,其可通過(guò)以下等式來(lái)表達(dá):
[0093]類(lèi)似性值=2.D(Asampie,Amusic )—D (A.music,Abase ) _D ( A^samp Ie,^ase )
[0094]其中Asample表示音頻流部分640的音樂(lè)模型,Amusic表示所述首音樂(lè)的音樂(lè)模型,Xbase表小基礎(chǔ) H-樂(lè)型,D ( Xsample,Xmusic )表TJ^AsampIe與Xmus 丨司的距肖值,D ( Xmusic,■^base )表TJi^inusic與XbaseZ^ I司的 ——.距肖值,冃.D (^saInple,Xbase )表^jSample與XbaseZ^間的二距離值。在上文所述的用于確定類(lèi)似性值的實(shí)施例中,可進(jìn)行任何合適的修改,以便改進(jìn)計(jì)算資源和電力的效率。
[0095]圖7是根據(jù)本發(fā)明的一個(gè)實(shí)施例的在電子裝置中執(zhí)行的用于識(shí)別和跟蹤音頻流中的一首音樂(lè)的方法700的流程圖。電子裝置(例如,圖3中所示的電子裝置300)可接收輸入聲音流,其包含對(duì)應(yīng)于一首音樂(lè)的聲音,并將所述輸入聲音流轉(zhuǎn)換為音頻流。在710處,電子裝置可確定是否在音頻流中檢測(cè)到聲音。在一個(gè)實(shí)施例中,可基于閾值聲音強(qiáng)度在音頻流中檢測(cè)聲音。如果未檢測(cè)到聲音(即,710處的“否”),那么方法700可繼續(xù)進(jìn)行返回到710,以確定是否在正從正接收到的輸入聲音流產(chǎn)生的音頻流中檢測(cè)到聲音。
[0096]當(dāng)檢測(cè)到聲音(S卩,710處的“是”)時(shí),電子裝置可在720處對(duì)音頻流的一部分進(jìn)行取樣,且在730處基于音頻流的所取樣的部分來(lái)提取聲音特征。在一些實(shí)施例中,可從音頻流的所取樣的部分提取多個(gè)聲音特征?;谒雎曇籼卣?,電子裝置可在740處,通過(guò)使用任何合適的聲音分類(lèi)方法來(lái)確定是否在音頻流的所取樣的部分中檢測(cè)到音樂(lè)。如果未檢測(cè)到音樂(lè)(即,740處的“否”),方法700可繼續(xù)進(jìn)行返回到710,以持續(xù)確定是否在正產(chǎn)生的音頻流中檢測(cè)到聲音。
[0097]另一方面,當(dāng)檢測(cè)到音樂(lè)(S卩,740處的“是”)時(shí),方法700可繼續(xù)進(jìn)行到750,以識(shí)別一首音樂(lè),其與檢測(cè)到的音樂(lè)相關(guān)聯(lián)。根據(jù)一些實(shí)施例,可通過(guò)獲得與所述首音樂(lè)相關(guān)聯(lián)的識(shí)別信息來(lái)識(shí)別所述首音樂(lè)。如果電子裝置未能識(shí)別所述首音樂(lè)(即,750處的“否”),那么方法700可繼續(xù)進(jìn)行返回到710,以確定是否在正產(chǎn)生的音頻流中檢測(cè)到聲音。
[0098]另一方面,如果識(shí)別到所述首音樂(lè)(S卩,750處的“是”),那么用所識(shí)別的所述首音樂(lè)來(lái)更新電子裝置中的音樂(lè)歷史數(shù)據(jù)庫(kù)。另外,方法700可繼續(xù)進(jìn)行到760,以跟蹤所識(shí)別的所述首音樂(lè),并檢測(cè)所述首音樂(lè)的結(jié)束。根據(jù)一些實(shí)施例,電子裝置可對(duì)音頻流的一部分進(jìn)行取樣,并確定所取樣的部分是否是所述首音樂(lè)的一部分。在此過(guò)程中,可使用所述首音樂(lè)的音樂(lè)模型,其是在電子裝置中產(chǎn)生或從外部裝置獲得。如果未檢測(cè)到所述首音樂(lè)的結(jié)束(即,760處的“否”),那么方法700進(jìn)行到保持跟蹤所述首音樂(lè),舉例來(lái)說(shuō)通過(guò)對(duì)音頻流的下一部分進(jìn)行取樣。否則,如果檢測(cè)到所述首音樂(lè)的結(jié)束(即,760處的“是”),那么方法700可繼續(xù)進(jìn)行返回到710,以確定是否在正產(chǎn)生的音頻流中檢測(cè)到聲音。盡管上文將方法700描述為在獲得所述首音樂(lè)的識(shí)別信息之后跟蹤所述首音樂(lè),但即使電子裝置未能獲得此類(lèi)識(shí)別信息,方法700也可基于音頻流的一部分產(chǎn)生或獲得一首音樂(lè)的音樂(lè)模型,并基于所述音樂(lè)模型來(lái)跟蹤所述首音樂(lè)。
[0099]圖8說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于從音頻流的一部分提取的至少一個(gè)聲音特征來(lái)識(shí)別一首音樂(lè)的具體方法750。一旦在音頻流的所取樣的部分中檢測(cè)到音樂(lè),就在圖7中的740處,方法750可在810處獲得從音頻流的一部分提取的至少一個(gè)聲音特征。在一個(gè)實(shí)施例中,音樂(lè)檢測(cè)模塊410可向音樂(lè)識(shí)別單元342提供至少一個(gè)聲音特征,其已從音頻流的一部分提取且用于檢測(cè)音樂(lè)。在另一個(gè)實(shí)施例中,音樂(lè)識(shí)別單元342可從音頻流的一部分提取至少一個(gè)聲音特征,所述部分在音樂(lè)檢測(cè)模塊410已提取聲音特征來(lái)檢測(cè)音樂(lè)的部分之后。
[0100]在820處,可將所獲得的至少一個(gè)聲音特征從電子裝置(例如圖3中的電子裝置300)發(fā)射到服務(wù)器(例如圖2中服務(wù)器240)。服務(wù)器可存儲(chǔ)包含識(shí)別信息的音樂(lè)數(shù)據(jù)庫(kù)。基于來(lái)自電子裝置的聲音特征,服務(wù)器可檢索與對(duì)應(yīng)于所述聲音特征的一首音樂(lè)相關(guān)聯(lián)的識(shí)別信息。如果服務(wù)器未能檢索所述聲音特征的此類(lèi)識(shí)別信息,那么服務(wù)器可將指示未發(fā)現(xiàn)匹配的消息發(fā)射到電子裝置。另一方面,如果服務(wù)器成功檢索到所述聲音特征的所述識(shí)別信息,那么服務(wù)器可將檢索到的與所述首音樂(lè)相關(guān)聯(lián)的識(shí)別信息發(fā)射到電子裝置。
[0101]在830處,方法750可確定是否從服務(wù)器接收到所述首音樂(lè)的識(shí)別信息。當(dāng)從服務(wù)器接收到與所述首音樂(lè)相關(guān)聯(lián)的識(shí)別信息(即,830處的“是”)時(shí),方法750進(jìn)行到760,以跟蹤所述首音樂(lè)并檢測(cè)所述首音樂(lè)的結(jié)束。如果未從服務(wù)器接收到識(shí)別信息(例如,接收到指示未找到匹配的消息)(即,830處的“否”),方法750進(jìn)行到710,以確定是否在正產(chǎn)生的音頻流中檢測(cè)到聲音。根據(jù)一個(gè)實(shí)施例,服務(wù)器可包含用于多首音樂(lè)的多個(gè)音樂(lè)模型,并向電子裝置發(fā)射所述多個(gè)音樂(lè)模型中的一者,其與從電子裝置接收到的聲音特征匹配。
[0102]圖9說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于基于與一首音樂(lè)相關(guān)聯(lián)的音樂(lè)模型來(lái)跟蹤所述首音樂(lè)的具體方法760。方法760可在910處,對(duì)音頻流的一部分進(jìn)行取樣??稍趶囊褜?duì)音頻流的一部分(例如圖5中的G1)進(jìn)行取樣以用于檢測(cè)音樂(lè)起的預(yù)定時(shí)間周期(例如圖5中的T3)之后,或在已對(duì)音頻流的一部分(例如圖5中的N1)進(jìn)行取樣以用于檢測(cè)所述首音樂(lè)的結(jié)束之后的另一預(yù)定時(shí)間周期(例如圖5中的T4)之后,對(duì)所述部分進(jìn)行取樣。另外,方法760可在920處,基于音頻流的所取樣的部分提取聲音特征。在一些實(shí)施例中,可從音頻流的所取樣的部分提取多個(gè)聲音特征。
[0103]方法750可在930處,基于所述首音樂(lè)的音樂(lè)模型和所提取的聲音特征確定音頻流的所取樣的部分是否是所述首音樂(lè)的一部分。所述首音樂(lè)的音樂(lè)模型可在電子裝置中產(chǎn)生或從外部裝置接收。在一些實(shí)施例中,電子裝置中的音樂(lè)跟蹤模塊430可確定聲音特征與所述首音樂(lè)的音樂(lè)模型之間的類(lèi)似性值??赏ㄟ^(guò)例如使用任何合適的方案,以如上文參看圖6所描述的方式來(lái)確定類(lèi)似性值??蓪㈩?lèi)似性值與預(yù)定閾值進(jìn)行比較。
[0104]如果確定所取樣的部分不是所述首音樂(lè)的一部分(S卩,940處的“否”),那么方法760進(jìn)行到710,以持續(xù)確定是否在正產(chǎn)生的音頻流中檢測(cè)到聲音。另一方面,如果確定所取樣的部分是所述首音樂(lè)的一部分(即,940處的“是”),方法760進(jìn)行到910,以對(duì)音頻流的下一部分進(jìn)行取樣。以此方式,音樂(lè)跟蹤模塊430可持續(xù)跟蹤所述首音樂(lè)。
[0105]圖10說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例的經(jīng)配置以接收一首音樂(lè)的識(shí)別信息,管理音樂(lè)歷史數(shù)據(jù)庫(kù)364且產(chǎn)生建議和通知的電子裝置300的處理器340中的音樂(lè)管理單元344的較詳細(xì)框圖。音樂(lè)管理單元344可包含音樂(lè)歷史管理模塊1010、建議模塊1020和通知模塊1030。如所示,音樂(lè)管理單元344可存取處理器340中的音樂(lè)識(shí)別單元342以及存儲(chǔ)單元360中的音樂(lè)歷史數(shù)據(jù)庫(kù)364。
[0106]一旦音樂(lè)識(shí)別單元342獲得一首音樂(lè)的識(shí)別信息,其就可將所述識(shí)別信息提供到音樂(lè)管理單元344中的音樂(lè)歷史管理模塊1010。音樂(lè)歷史管理模塊1010可存取音樂(lè)歷史數(shù)據(jù)庫(kù)364并用所述識(shí)別信息來(lái)更新音樂(lè)歷史數(shù)據(jù)庫(kù)364。另外,音樂(lè)歷史管理模塊1010可指令位置傳感器370和時(shí)鐘模塊380確定電子裝置300的位置信息以及用于更新音樂(lè)歷史數(shù)據(jù)庫(kù)的時(shí)間信息。所述位置和時(shí)間信息可連同音樂(lè)歷史數(shù)據(jù)庫(kù)364中的所述首音樂(lè)的識(shí)別信息一起存儲(chǔ)。
[0107]在一個(gè)實(shí)施例中,音樂(lè)歷史管理模塊1010可基于存儲(chǔ)在音樂(lè)歷史數(shù)據(jù)庫(kù)364中的識(shí)別信息來(lái)產(chǎn)生頻繁聽(tīng)的若干首音樂(lè)的列表。舉例來(lái)說(shuō),音樂(lè)歷史管理模塊1010可確定再指定時(shí)間間隔內(nèi)一首音樂(lè)在音樂(lè)歷史數(shù)據(jù)庫(kù)364記錄多少次。當(dāng)識(shí)別所述首音樂(lè)超過(guò)預(yù)定次數(shù)時(shí),音樂(lè)歷史管理模塊1010可確定所述首音樂(lè)是頻繁聽(tīng)的一首音樂(lè),并將其添加到頻繁聽(tīng)的若干首音樂(lè)的列表。另外,音樂(lè)歷史管理模塊1010可連同與所述首音樂(lè)相關(guān)聯(lián)的時(shí)間或位置一起產(chǎn)生在一或多個(gè)時(shí)間周期或位置中聽(tīng)到的若干首音樂(lè)的列表。
[0108]基于存儲(chǔ)在音樂(lè)歷史數(shù)據(jù)庫(kù)364中的識(shí)別信息,建議模塊1020可為用戶(hù)產(chǎn)生建議。舉例來(lái)說(shuō),當(dāng)所識(shí)別的所述首音樂(lè)包含于頻繁聽(tīng)的若干首音樂(lè)的列表中時(shí),建議模塊1020可產(chǎn)生并顯示對(duì)用戶(hù)的建議,以在I/O單元320上下載或購(gòu)買(mǎi)所識(shí)別的所述首音樂(lè)。另外或替代地,建議模塊1020可提供建議來(lái)從外部服務(wù)器流式傳輸頻繁聽(tīng)的若干首音樂(lè)的列表中的所述首音樂(lè)。
[0109]通知模塊1030可經(jīng)配置以分析所述識(shí)別信息,并提供所識(shí)別的所述首音樂(lè)的通知。舉例來(lái)說(shuō),識(shí)別信息可包含指示所述首音樂(lè)可用于免費(fèi)下載或與特定類(lèi)型的音樂(lè)視頻(例如搞笑音樂(lè)視頻、高評(píng)分音樂(lè)視頻)相關(guān)聯(lián)的額外信息。在此情況下,通知單元460可通知所述用戶(hù)所述額外信息。在一些實(shí)施例中,當(dāng)確定所識(shí)別的所述首音樂(lè)為另一用戶(hù)的“最?lèi)?ài)音樂(lè)”時(shí),通知模塊1030可通知所述用戶(hù)所識(shí)別的所述首音樂(lè)是另一用戶(hù)的最?lèi)?ài)音樂(lè)。
[0110]圖11說(shuō)明根據(jù)一些實(shí)施例的其中可實(shí)施本發(fā)明的用于從音頻流識(shí)別一首音樂(lè)并跟蹤所述首音樂(lè)的方法和設(shè)備的無(wú)線通信系統(tǒng)中的移動(dòng)裝置1100的框圖。移動(dòng)裝置1100可為蜂窩式電話、智能電話、可穿戴計(jì)算機(jī)、智能表、智能眼鏡、平板個(gè)人計(jì)算機(jī)、終端、手持機(jī)、個(gè)人數(shù)字助理(PDA)、無(wú)線調(diào)制解調(diào)器、無(wú)繩電話、平板計(jì)算機(jī)等。無(wú)線通信系統(tǒng)可為CDMA系統(tǒng)、GSM系統(tǒng)、W-CDMA系統(tǒng)、LTE系統(tǒng)、LTE高級(jí)系統(tǒng)等。
[0111]移動(dòng)裝置1100可能夠經(jīng)由接收路徑和發(fā)射路徑提供雙向通信。在接收路徑上,基站發(fā)射的信號(hào)可被天線1112接收,并且被提供給接收器(RCVR) 1114。接收器1114可調(diào)節(jié)并數(shù)字化所接收的信號(hào),并將經(jīng)調(diào)節(jié)且經(jīng)數(shù)字化的數(shù)字信號(hào)提供到數(shù)字區(qū)段以供進(jìn)一步處理。在發(fā)射路徑上,發(fā)射器(TMTRH116可從數(shù)字區(qū)段1120接收待發(fā)射的數(shù)據(jù),處理并調(diào)節(jié)所述數(shù)據(jù),且產(chǎn)生經(jīng)調(diào)制信號(hào),所述經(jīng)調(diào)制信號(hào)經(jīng)由天線1112發(fā)射到基站。接收器1114和發(fā)射器1116可為可支持CDMA、GSM、W-CDMA、LTE、高級(jí)LTE等收發(fā)器的一部分。
[0112]數(shù)字區(qū)段1120可包含各種處理、接口和存儲(chǔ)器單元,例如,舉例來(lái)說(shuō),調(diào)制解調(diào)器處理器1122、精簡(jiǎn)指令集計(jì)算機(jī)/數(shù)字信號(hào)處理器(RISC/DSP)1124、控制器/處理器1126、內(nèi)部存儲(chǔ)器1128、通用音頻/視頻編碼器1132、通用音頻解碼器1134、圖形/顯示處理器1136,和/或外部總線接口(EBIH138。調(diào)制解調(diào)器處理器1122可執(zhí)行用于數(shù)據(jù)發(fā)射和接收的處理,例如,編碼、調(diào)制、解調(diào)和解碼。RISC/DSP 1124可執(zhí)行移動(dòng)裝置1100的通用和專(zhuān)用處理。控制器/處理器1126可執(zhí)行數(shù)字區(qū)段1120內(nèi)的各種處理和接口單元的操作。內(nèi)部存儲(chǔ)器1128可存儲(chǔ)用于數(shù)字區(qū)段1120內(nèi)的各種單元的數(shù)據(jù)和/或指令。
[0113]通用音頻/視頻編碼器1132可對(duì)來(lái)自音頻/視頻源1142、麥克風(fēng)1144、圖像傳感器1146等的輸入信號(hào)執(zhí)行編碼。通用音頻解碼器1134可執(zhí)行對(duì)經(jīng)譯碼音頻數(shù)據(jù)的解碼,且可將輸出信號(hào)提供到揚(yáng)聲器/頭戴式耳機(jī)1148。圖形/顯示處理器1136可執(zhí)行對(duì)可呈現(xiàn)到顯示單元1150的圖形、視頻、圖像和文本的處理。EBI 1138可促進(jìn)數(shù)據(jù)在數(shù)字區(qū)段1120與主存儲(chǔ)器1152之間的傳送。
[0114]數(shù)字區(qū)段1120可用一或多個(gè)處理器、DSP、微處理器、RISC等來(lái)實(shí)施。數(shù)字區(qū)段1120還可制造于一或多個(gè)專(zhuān)用集成電路(ASIC)和/或一些其它類(lèi)型的集成電路(IC)上。
[0115]圖12是說(shuō)明根據(jù)一些實(shí)施例實(shí)施的可為先前描述的服務(wù)器中的任一者的用于搜索和提供關(guān)于一首音樂(lè)的信息的服務(wù)器系統(tǒng)1200的框圖。服務(wù)器系統(tǒng)1200可包含一或多個(gè)處理單元(例如CPUH202、一或多個(gè)網(wǎng)絡(luò)或其它通信網(wǎng)接口、存儲(chǔ)器1212,以及用于互連這些組件的一或多個(gè)通信總線1214。服務(wù)器系統(tǒng)1200還可包含具有顯示裝置和鍵盤(pán)的用戶(hù)接口(未圖示)。
[0116]存儲(chǔ)器1212可為任何合適的存儲(chǔ)器,例如高速隨機(jī)存取存儲(chǔ)器,(例如DRAM、SRAM、DDR RAM或其它隨機(jī)存取固態(tài)存儲(chǔ)器裝置)。存儲(chǔ)器1212可包含或可替代地為非易失性存儲(chǔ)器(例如一或多個(gè)磁盤(pán)存儲(chǔ)裝置、光盤(pán)存儲(chǔ)裝置、快閃存儲(chǔ)器裝置,或其它非易失性固態(tài)存儲(chǔ)裝置)。在一些實(shí)施例中,存儲(chǔ)器1212可包含離CPU 1202遠(yuǎn)程定位和/或遠(yuǎn)程定位于多處的一或多個(gè)存儲(chǔ)裝置。
[0117]由存儲(chǔ)器1212表示的以上存儲(chǔ)器裝置中的任一者可存儲(chǔ)對(duì)應(yīng)于用于實(shí)施和/或執(zhí)行先前描述的過(guò)程、操作和方法中的任一者的指令集的任何數(shù)目的模塊或編程。舉例來(lái)說(shuō),存儲(chǔ)器1212可包含操作系統(tǒng)1216,其經(jīng)配置以存儲(chǔ)包含用于處置各種基本系統(tǒng)服務(wù)且用于執(zhí)行硬件相關(guān)任務(wù)的程序的指令。所述存儲(chǔ)器1212的網(wǎng)絡(luò)通信模塊1218可用于經(jīng)由一或多個(gè)通信網(wǎng)絡(luò)接口 1210(有線或無(wú)線)和一或多個(gè)通信網(wǎng)絡(luò)(例如因特網(wǎng)、其它廣域網(wǎng)、局域網(wǎng)、城域網(wǎng)等)將服務(wù)器系統(tǒng)1200連接到其它計(jì)算機(jī)。
[0118]存儲(chǔ)器1212還可包含音樂(lè)數(shù)據(jù)庫(kù)1220,其經(jīng)配置以包含音樂(lè)模型數(shù)據(jù)庫(kù)、識(shí)別信息數(shù)據(jù)庫(kù)等。音樂(lè)數(shù)據(jù)庫(kù)中的數(shù)據(jù)庫(kù)中的每一者可用于識(shí)別一首音樂(lè)和檢測(cè)一首音樂(lè)的結(jié)束。音樂(lè)模型數(shù)據(jù)庫(kù)中的每一音樂(lè)模型可與一首音樂(lè)相關(guān)聯(lián)。操作系統(tǒng)1216可用通過(guò)網(wǎng)絡(luò)通信模塊1218從多個(gè)音樂(lè)提供者接收的多媒體流中的各種音樂(lè)來(lái)更新音樂(lè)數(shù)據(jù)庫(kù)1220。操作系統(tǒng)1216還可經(jīng)由網(wǎng)絡(luò)通信模塊1218將多首音樂(lè)的音樂(lè)模型和識(shí)別信息提供到多個(gè)電子裝置。
[0119]一般來(lái)說(shuō),本文中所描述的任何裝置可表示各種類(lèi)型的裝置,例如無(wú)線電話、蜂窩式電話、膝上型計(jì)算機(jī)、無(wú)線多媒體裝置、無(wú)線通信個(gè)人計(jì)算機(jī)(PC)卡、PDA、外部或內(nèi)部調(diào)制解調(diào)器、通過(guò)無(wú)線信道通信的裝置等。裝置可具有各種名稱(chēng),例如接入終端(AT)、接入單元、訂戶(hù)單元、移動(dòng)臺(tái)、移動(dòng)裝置、移動(dòng)單元、移動(dòng)電話、移動(dòng)設(shè)備、遠(yuǎn)程站、遠(yuǎn)程終端、遠(yuǎn)程單元、用戶(hù)裝置、用戶(hù)設(shè)備、手持式裝置等。本文中所描述的任何裝置可具有用于存儲(chǔ)指令和數(shù)據(jù)的存儲(chǔ)器以及硬件、軟件、固件或其組合。
[0120]可通過(guò)各種手段來(lái)實(shí)施本文中所描述的技術(shù)。舉例來(lái)說(shuō),這些技術(shù)可以硬件、固件、軟件或其組合來(lái)實(shí)施。所屬領(lǐng)域的技術(shù)人員將進(jìn)一步了解,結(jié)合本文中的揭示內(nèi)容描述的各種說(shuō)明性邏輯塊、模塊、電路和算法步驟可實(shí)施為電子硬件、計(jì)算機(jī)軟件或兩者的組合。為清楚地說(shuō)明硬件與軟件的這種可互換性,上文已大體上關(guān)于其功能性描述了各種說(shuō)明性組件、塊、模塊、電路和步驟。將此功能性實(shí)施為硬件還是軟件取決于特定應(yīng)用以及強(qiáng)加于整個(gè)系統(tǒng)的設(shè)計(jì)約束。熟練的技術(shù)人員可針對(duì)每一特定應(yīng)用以不同方式實(shí)施所描述的功能性,但此類(lèi)實(shí)施決策不應(yīng)被解釋為引起偏離本發(fā)明的范圍。
[0121]對(duì)于硬件實(shí)施方案,用以執(zhí)行所述技術(shù)的處理單元可在以下各項(xiàng)內(nèi)實(shí)施:一或多個(gè)ASIC、DSP、數(shù)字信號(hào)處理裝置(DSPD)、可編程邏輯裝置(PLD)、現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)、處理器、控制器、微控制器、微處理器、電子裝置、經(jīng)設(shè)計(jì)以執(zhí)行本文中所描述的功能的其它電子單元、計(jì)算機(jī),或其組合。
[0122]因此,結(jié)合本文中的揭示內(nèi)容描述的各種說(shuō)明性邏輯塊、模塊和電路是用經(jīng)設(shè)計(jì)以執(zhí)行本文所述的功能的通用處理器、DSP、ASIC、FPGA或其它可編程邏輯裝置、離散門(mén)或晶體管邏輯、離散硬件組件或其任何組合來(lái)實(shí)施或執(zhí)行。通用處理器可以是微處理器,但在替代方案中,處理器可以是任何常規(guī)處理器、控制器、微控制器或狀態(tài)機(jī)。處理器還可實(shí)施為計(jì)算裝置的組合,例如,DSP與微處理器的組合、多個(gè)微處理器的組合、一或多個(gè)微處理器結(jié)合DSP核心,或任何其它此類(lèi)配置。
[0123]如果實(shí)施于軟件中,那么可將所述功能作為一或多個(gè)指令或代碼存儲(chǔ)在計(jì)算機(jī)可讀媒體上或經(jīng)由計(jì)算機(jī)可讀媒體傳輸。計(jì)算機(jī)可讀媒體包含計(jì)算機(jī)存儲(chǔ)媒體與通信媒體兩者,所述通信媒體包含促進(jìn)將計(jì)算機(jī)程序從一處傳送到另一處的任何媒體。存儲(chǔ)媒體可為可由計(jì)算機(jī)存取的任何可用媒體。作為舉例且并不限于此,此類(lèi)計(jì)算機(jī)可讀媒體可包括RAM、R0M、EEPR0M、CD_R0M或其它光盤(pán)存儲(chǔ)裝置、磁盤(pán)存儲(chǔ)裝置或其它磁性存儲(chǔ)裝置,或可用于運(yùn)載或存儲(chǔ)呈指令或數(shù)據(jù)結(jié)構(gòu)形式的所需程序代碼且可由計(jì)算機(jī)存取的任何其它媒體。如本文中所使用,磁盤(pán)和光盤(pán)包含壓縮光盤(pán)(CD)、激光光盤(pán)、光學(xué)光盤(pán)、數(shù)字多功能光盤(pán)(DVD),軟性磁盤(pán)和藍(lán)光光盤(pán),其中磁盤(pán)通常以磁性方式再現(xiàn)數(shù)據(jù),而光盤(pán)利用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。以上的組合也應(yīng)包含在計(jì)算機(jī)可讀媒體的范圍內(nèi)。
[0124]提供本發(fā)明的前述描述是為了使所屬領(lǐng)域的技術(shù)人員能夠制作或使用本發(fā)明。所屬領(lǐng)域的技術(shù)人員將易于明白對(duì)本發(fā)明的各種修改,且本文中界定的一般原理在不脫離本發(fā)明的精神或范圍的情況下應(yīng)用于其它變化。因此,本發(fā)明無(wú)意限于本文中所描述的實(shí)例,而應(yīng)被賦予與本文中所揭示的原理和新穎特征相一致的最寬范圍。
[0125]盡管稱(chēng)示范性實(shí)施方案利用在一或多個(gè)獨(dú)立計(jì)算機(jī)系統(tǒng)的上下文中的當(dāng)前揭示的標(biāo)的物的方面,但所述標(biāo)的物不受如此限制,而是可結(jié)合任何計(jì)算環(huán)境(例如網(wǎng)絡(luò)或分布式計(jì)算環(huán)境)來(lái)實(shí)施。此外,當(dāng)前揭示的標(biāo)的物的方面可在多個(gè)處理芯片或裝置中或跨越多個(gè)處理芯片或裝置實(shí)施,且可類(lèi)似地跨越多個(gè)裝置實(shí)現(xiàn)存儲(chǔ)。此類(lèi)裝置可包含PC、網(wǎng)絡(luò)服務(wù)器和手持式裝置。
[0126]盡管已經(jīng)以特定地針對(duì)結(jié)構(gòu)特征和/或方法動(dòng)作的語(yǔ)言來(lái)描述標(biāo)的物,但應(yīng)理解,所附權(quán)利要求書(shū)中所定義的標(biāo)的物未必限于上文所描述的具體特征或動(dòng)作。確切地說(shuō),以實(shí)施權(quán)利要求書(shū)的實(shí)例形式來(lái)揭示上文所描述的特定特征及動(dòng)作。
[0127]將了解,上文所識(shí)別的模塊或程序(即指令集)不必實(shí)施為單獨(dú)的軟件程序、程序或模塊,且因此在各種實(shí)施例中,可組合或以其它方式重新布置這些模塊的各種子集。此夕卜,存儲(chǔ)器1212可存儲(chǔ)上文未描述的額外模塊和數(shù)據(jù)結(jié)構(gòu)。
[0128]〈本發(fā)明的方面〉
[0129]在下文中,將另外陳述本發(fā)明的一些方面。
[0130](實(shí)例I)根據(jù)本發(fā)明的一方面,提供一種用于跟蹤音頻流中的一首音樂(lè)的方法,其包含:接收所述音頻流的第一部分;基于所述音頻流的所述第一部分提取第一聲音特征;基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂(lè);響應(yīng)于確定所述音頻流的所述第一部分指示音樂(lè),基于所述音頻流的所述第一部分識(shí)別第一首音樂(lè);接收所述音頻流的第二部分;基于所述音頻流的所述第二部分提取第二聲音特征;以及確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)。
[0131](實(shí)例2)在實(shí)例I的方法中,接收所述音頻流的第一部分包含根據(jù)聲音傳感器的工作循環(huán)周期性地接收音頻流的多個(gè)部分。
[0132](實(shí)例3)實(shí)例I或2的方法進(jìn)一步包含基于從音頻流的第一部分提取的至少一個(gè)聲音特征來(lái)產(chǎn)生指示第一首音樂(lè)的音樂(lè)模型。
[0133](實(shí)例4)在實(shí)例I到3中的任一者的方法中,產(chǎn)生指示第一首音樂(lè)的音樂(lè)模型包含:將對(duì)指示第一首音樂(lè)的音樂(lè)模型的請(qǐng)求發(fā)送到外部裝置,其中所述請(qǐng)求包含從音頻流的第一部分提取的至少一個(gè)聲音特征;以及從所述外部裝置接收所述音樂(lè)模型。
[0134](實(shí)例5)在實(shí)例I到4中的任一者的方法中,產(chǎn)生音樂(lè)模型包含基于從音頻流的第一部分提取的至少一個(gè)聲音特征來(lái)修改預(yù)定音樂(lè)模型。
[0135](實(shí)例6)在實(shí)例I到5中的任一者的方法中,確定音頻流的所述第二部分是否指示第一首音樂(lè)是基于所述音樂(lè)模型和從音頻流的所述第二部分提取的至少一個(gè)聲音特征。
[0136](實(shí)例7)實(shí)例I到6中的任一者的方法進(jìn)一步包含:響應(yīng)于確定所述第二部分不指示第一首音樂(lè),接收音頻流的第三部分;基于音頻流的第三部分提取第三聲音特征;基于第三聲音特征確定音頻流的第三部分是否指示音樂(lè);以及響應(yīng)于確定所述音頻流的所述第三部分指示音樂(lè),基于所述音頻流的所述第三部分識(shí)別第二首音樂(lè)。
[0137](實(shí)例8)在實(shí)例I到7中的任一者的方法中,基于所述音頻流的所述第三部分識(shí)別第二首音樂(lè)包含:將請(qǐng)求發(fā)送到外部裝置,其中所述請(qǐng)求包含從所述音頻流的所述第三部分提取的至少一個(gè)聲音特征;從外部裝置接收與第二首音樂(lè)相關(guān)聯(lián)的信息;以及基于從外部裝置接收到的信息識(shí)別第二首音樂(lè)。
[0138](實(shí)例9)在實(shí)例I到8中的任一者的方法中,識(shí)別第一首音樂(lè)包含從例如服務(wù)器等外部裝置獲得識(shí)別信息。
[0139](實(shí)例10)實(shí)例I到9中的任一者的方法進(jìn)一步包含響應(yīng)于確定所述音頻流的所述第二部分指示第一首音樂(lè)而接收音頻流的第三部分。在此實(shí)例中,接收音頻流的第三部分包含根據(jù)聲音傳感器的工作循環(huán)周期性地接收音頻流的多個(gè)部分。
[0140](實(shí)例11)根據(jù)本發(fā)明的另一方面,提供一種用于跟蹤音頻流中的一首音樂(lè)的電子裝置,其包含:音樂(lè)檢測(cè)單元,其經(jīng)配置以接收音頻流的第一部分;基于所述音頻流的所述第一部分提取第一聲音特征;以及基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂(lè);音樂(lè)識(shí)別單元,其經(jīng)配置以響應(yīng)于確定所述第一部分指示音樂(lè),基于所述音頻流的所述第一部分識(shí)別第一首音樂(lè);以及音樂(lè)跟蹤單元,其經(jīng)配置以接收所述音頻流的第二部分;基于所述音頻流的所述第二部分提取第二聲音特征;以及確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)。
[0141](實(shí)例12)在實(shí)例11的電子裝置中,音樂(lè)檢測(cè)單元經(jīng)配置以根據(jù)聲音傳感器的工作循環(huán)周期性地接收音頻流的多個(gè)部分。
[0142](實(shí)例13)實(shí)例11或12的電子裝置進(jìn)一步包含音樂(lè)模型管理單元,其經(jīng)配置以基于從音頻流的第一部分提取的至少一個(gè)聲音特征產(chǎn)生指示第一首音樂(lè)的音樂(lè)模型。
[0143](實(shí)例14)在實(shí)例11到13中的任一者的電子裝置中,音樂(lè)模型管理單元經(jīng)配置以將對(duì)指示第一首音樂(lè)的音樂(lè)模型的請(qǐng)求發(fā)送到外部裝置,其中所述請(qǐng)求包含從音頻流的第一部分提取的至少一個(gè)聲音特征;以及從外部裝置接收所述音樂(lè)模型。
[0144](實(shí)例15)在實(shí)例11到14中的任一者的電子裝置中,音樂(lè)模型管理單元經(jīng)配置以基于從音頻流的第一部分提取的至少一個(gè)聲音特征來(lái)修改預(yù)定音樂(lè)模型。
[0145](實(shí)例16)在實(shí)例11到15中的任一者的電子裝置中,響應(yīng)于確定音頻流的所述第二部分不指示所述首音樂(lè),音樂(lè)檢測(cè)單元經(jīng)配置以接收音頻流的第三部分;基于所述音頻流的所述第三部分提取第三聲音特征;以及基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂(lè)。在此實(shí)例中,響應(yīng)于確定所述音頻流的所述第三部分指示音樂(lè),音樂(lè)識(shí)別單元經(jīng)配置以基于所述音頻流的所述第三部分識(shí)別第二首音樂(lè)。
[0146](實(shí)例17)在實(shí)例11到16中的任一者的電子裝置中,經(jīng)配置以識(shí)別第二首音樂(lè)的音樂(lè)識(shí)別單元經(jīng)配置以將請(qǐng)求發(fā)送到外部裝置,其中所述請(qǐng)求包含從所述音頻流的所述第三部分提取的至少一個(gè)聲音特征;從所述外部裝置接收與第二首音樂(lè)相關(guān)聯(lián)的信息;以及基于從外部裝置接收到的信息來(lái)識(shí)別所述第二首音樂(lè)。
[0147](實(shí)例18)在實(shí)例11到17中的任一者的電子裝置中,音樂(lè)識(shí)別單元經(jīng)配置以從外部裝置獲得識(shí)別信息。
[0148](實(shí)例19)根據(jù)本發(fā)明的另一方面,提供一種用于跟蹤音頻流中的一首音樂(lè)的電子裝置,其包含:用于接收所述音頻流的第一部分的裝置;用于基于所述音頻流的所述第一部分提取第一聲音特征的裝置;用于基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂(lè)的裝置;用于響應(yīng)于確定所述音頻流的所述第一部分指示音樂(lè),基于所述音頻流的所述第一部分識(shí)別第一首音樂(lè)的裝置;用于接收所述音頻流的第二部分的裝置;用于基于所述音頻流的所述第二部分提取第二聲音特征的裝置;以及用于確定所述音頻流的所述第二部分是否指示第一首音樂(lè)的裝置。
[0149](實(shí)例20)在實(shí)例19的電子裝置中,所述用于接收音頻流的第一部分的裝置包含用于根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個(gè)部分的裝置。
[0150](實(shí)例21)實(shí)例19或20的電子裝置進(jìn)一步包含用于基于從所述音頻流的所述第一部分提取的至少一個(gè)聲音特征產(chǎn)生指示第一首音樂(lè)的音樂(lè)模型的裝置。
[0151](實(shí)例22)在實(shí)例19到21中的任一者的電子裝置中,所述用于產(chǎn)生指示第一首音樂(lè)的音樂(lè)模型的裝置包含:用于將對(duì)指示第一首音樂(lè)的音樂(lè)模型的請(qǐng)求發(fā)送到外部裝置的裝置。在此實(shí)例中,所述請(qǐng)求包含從所述音頻流的所述第一部分提取的至少一個(gè)聲音特征;以及用于從所述外部裝置接收所述音樂(lè)模型的裝置。
[0152](實(shí)例23)在實(shí)例19到22中的任一者的電子裝置中,所述用于產(chǎn)生所述音樂(lè)模型的裝置包含用于基于從所述音頻流的所述第一部分提取的所述至少一個(gè)聲音特征來(lái)修改預(yù)定音樂(lè)模型的裝置。
[0153](實(shí)例24)在實(shí)例19到23中的任一者的電子裝置中,所述用于確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)的裝置是基于所述音樂(lè)模型和從所述音頻流的所述第二部分提取的至少一個(gè)聲音特征。
[0154](實(shí)例25)實(shí)例19到24中的任一者的電子裝置進(jìn)一步包含:用于響應(yīng)于確定所述第二部分不指示所述第一首音樂(lè)而接收所述音頻流的第三部分的裝置;用于基于所述音頻流的所述第三部分提取第三聲音特征的裝置;用于基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂(lè)的裝置;以及用于響應(yīng)于確定所述音頻流的所述第三部分指示音樂(lè)而基于所述音頻流的所述第三部分識(shí)別第二首音樂(lè)的裝置。
[0155](實(shí)例26)在實(shí)例19到25中的任一者的電子裝置中,所述用于基于所述音頻流的所述第三部分識(shí)別所述第二首音樂(lè)的裝置包含:用于將請(qǐng)求發(fā)送到外部裝置的裝置,其中所述請(qǐng)求包含從所述音頻流的所述第三部分提取的至少一個(gè)聲音特征;用于從所述外部裝置接收與所述第二首音樂(lè)相關(guān)聯(lián)的信息的裝置;以及用于基于所述從所述外部裝置接收到的信息識(shí)別所述第二首音樂(lè)的裝置。
[0156](實(shí)例27)在實(shí)例19到26中的任一者的電子裝置中,所述用于識(shí)別所述首音樂(lè)的裝置經(jīng)配置以從例如服務(wù)器等外部裝置獲得識(shí)別信息。
[0157](實(shí)例28)根據(jù)本發(fā)明的另一個(gè)方面,提供一種非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體,其包含致使電子裝置的處理器執(zhí)行以下操作的指令:接收音頻流的第一部分;基于所述音頻流的所述第一部分提取第一聲音特征;基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂(lè);響應(yīng)于確定所述音頻流的所述第一部分指示音樂(lè),基于所述音頻流的所述第一部分識(shí)別第一首音樂(lè);接收所述音頻流的第二部分;基于所述音頻流的所述第二部分提取第二聲音特征;以及確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)。
[0158](實(shí)例29)在實(shí)例28的非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體中,接收所述音頻流的所述第一部分包含根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個(gè)部分。
[0159](實(shí)例30)實(shí)例28或29的非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體進(jìn)一步包含致使電子裝置的處理器執(zhí)行以下操作的指令:響應(yīng)于確定所述第二部分不指示所述第一首音樂(lè),接收所述音頻流的第三部分;基于所述音頻流的所述第三部分提取第三聲音特征;基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂(lè);以及響應(yīng)于確定所述音頻流的所述第三部分指示音樂(lè),基于所述音頻流的所述第三部分識(shí)別第二首音樂(lè)。
【主權(quán)項(xiàng)】
1.一種在電子裝置中執(zhí)行的用于跟蹤音頻流中的一首音樂(lè)的方法,其包括: 從聲音傳感器接收所述音頻流的第一部分; 基于所述音頻流的所述第一部分提取第一聲音特征; 基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂(lè); 響應(yīng)于確定所述音頻流的所述第一部分指示音樂(lè),基于所述音頻流的所述第一部分識(shí)別第一首音樂(lè); 接收所述音頻流的第二部分; 基于所述音頻流的所述第二部分提取第二聲音特征;以及 確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)。2.根據(jù)權(quán)利要求1所述的方法,其中接收所述音頻流的所述第一部分包括根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個(gè)部分。3.根據(jù)權(quán)利要求2所述的方法,其進(jìn)一步包括基于從所述音頻流的所述第一部分提取的至少一個(gè)聲音特征產(chǎn)生指示所述第一首音樂(lè)的音樂(lè)模型。4.根據(jù)權(quán)利要求3所述的方法,其中產(chǎn)生指示所述第一首音樂(lè)的所述音樂(lè)模型包括: 將對(duì)指示所述第一首音樂(lè)的所述音樂(lè)模型的請(qǐng)求發(fā)送到外部裝置,其中所述請(qǐng)求包含從所述音頻流的所述第一部分提取的所述至少一個(gè)聲音特征;以及從所述外部裝置接收所述音樂(lè)模型。5.根據(jù)權(quán)利要求3所述的方法,其中產(chǎn)生所述音樂(lè)模型包括基于從所述音頻流的所述第一部分提取的所述至少一個(gè)聲音特征來(lái)修改預(yù)定音樂(lè)模型。6.根據(jù)權(quán)利要求3所述的方法,其中確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)是基于所述音樂(lè)模型和從所述音頻流的所述第二部分提取的至少一個(gè)聲音特征。7.根據(jù)權(quán)利要求2所述的方法,其進(jìn)一步包括: 響應(yīng)于確定所述第二部分不指示所述第一首音樂(lè)而接收所述音頻流的第三部分; 基于所述音頻流的所述第三部分提取第三聲音特征; 基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂(lè);以及響應(yīng)于確定所述音頻流的所述第三部分指示音樂(lè),基于所述音頻流的所述第三部分識(shí)別弟一.首首樂(lè)。8.根據(jù)權(quán)利要求7所述的方法,其中基于所述音頻流的所述第三部分識(shí)別所述第二首音樂(lè)包括: 將請(qǐng)求發(fā)送到外部裝置,其中所述請(qǐng)求包含從所述音頻流的所述第三部分提取的至少一個(gè)聲音特征; 從所述外部裝置接收與所述第二首音樂(lè)相關(guān)聯(lián)的信息;以及 基于所述從所述外部裝置接收到的信息識(shí)別所述第二首音樂(lè)。9.根據(jù)權(quán)利要求1所述的方法,其中識(shí)別所述第一首音樂(lè)包括從外部裝置獲得識(shí)別信息。10.根據(jù)權(quán)利要求2所述的方法,其進(jìn)一步包括響應(yīng)于確定所述音頻流的所述第二部分指示所述第一首音樂(lè)而接收所述音頻流的第三部分,其中接收所述音頻流的所述第三部分包括根據(jù)所述聲音傳感器的所述工作循環(huán)周期性地接收所述音頻流的多個(gè)部分。11.一種用于跟蹤音頻流中的一首音樂(lè)的電子裝置,其包括: 音樂(lè)檢測(cè)單元,其經(jīng)配置以: 接收所述音頻流的第一部分; 基于所述音頻流的所述第一部分提取第一聲音特征;以及 基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂(lè); 音樂(lè)識(shí)別單元,其經(jīng)配置以響應(yīng)于確定所述第一部分指示音樂(lè),基于所述音頻流的所述第一部分識(shí)別第一首音樂(lè);以及音樂(lè)跟蹤單元,其經(jīng)配置以: 接收所述音頻流的第二部分; 基于所述音頻流的所述第二部分提取第二聲音特征;以及 確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)。12.根據(jù)權(quán)利要求11所述的電子裝置,其中所述音樂(lè)檢測(cè)單元經(jīng)配置以根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個(gè)部分。13.根據(jù)權(quán)利要求12所述的電子裝置,其進(jìn)一步包括音樂(lè)模型管理單元,所述音樂(lè)模型管理單元經(jīng)配置以基于從所述音頻流的所述第一部分提取的至少一個(gè)聲音特征產(chǎn)生指示所述第一首音樂(lè)的音樂(lè)模型。14.根據(jù)權(quán)利要求13所述的電子裝置,其中所述音樂(lè)模型管理單元經(jīng)配置以: 將對(duì)指示所述第一首音樂(lè)的所述音樂(lè)模型的請(qǐng)求發(fā)送到外部裝置,其中所述請(qǐng)求包含從所述音頻流的所述第一部分提取的所述至少一個(gè)聲音特征;以及從所述外部裝置接收所述音樂(lè)模型。15.根據(jù)權(quán)利要求13所述的電子裝置,其中所述音樂(lè)模型管理單元經(jīng)配置以基于從所述音頻流的所述第一部分提取的所述至少一個(gè)聲音特征來(lái)修改預(yù)定音樂(lè)模型。16.根據(jù)權(quán)利要求12所述的電子裝置,其中響應(yīng)于確定所述音頻流的所述第二部分不指示所述首音樂(lè),所述音樂(lè)檢測(cè)單元經(jīng)配置以: 接收所述音頻流的第三部分; 基于所述音頻流的所述第三部分提取第三聲音特征;以及基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂(lè),且其中響應(yīng)于確定所述音頻流的所述第三部分指示音樂(lè),所述音樂(lè)識(shí)別單元經(jīng)配置以基于所述音頻流的所述第三部分識(shí)別第二首音樂(lè)。17.根據(jù)權(quán)利要求16所述的電子裝置,其中經(jīng)配置以識(shí)別所述第二首音樂(lè)的所述音樂(lè)識(shí)別單元經(jīng)配置以: 將請(qǐng)求發(fā)送到外部裝置,其中所述請(qǐng)求包含從所述音頻流的所述第三部分提取的至少一個(gè)聲音特征; 從所述外部裝置接收與所述第二首音樂(lè)相關(guān)聯(lián)的信息;以及 基于所述從所述外部裝置接收到的信息識(shí)別所述第二首音樂(lè)。18.根據(jù)權(quán)利要求11所述的電子裝置,其中所述音樂(lè)識(shí)別單元經(jīng)配置以從外部裝置獲得識(shí)別?目息。19.一種用于跟蹤音頻流中的一首音樂(lè)的電子裝置,其包括: 用于接收所述音頻流的第一部分的裝置; 用于基于所述音頻流的所述第一部分提取第一聲音特征的裝置; 用于基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂(lè)的裝置;用于響應(yīng)于確定所述音頻流的所述第一部分指示音樂(lè),基于所述音頻流的所述第一部分識(shí)別第一首音樂(lè)的裝置; 用于接收所述音頻流的第二部分的裝置; 用于基于所述音頻流的所述第二部分提取第二聲音特征的裝置;以及 用于確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)的裝置。20.根據(jù)權(quán)利要求19所述的電子裝置,其中所述用于接收所述音頻流的所述第一部分的裝置包括用于根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個(gè)部分的裝置。21.根據(jù)權(quán)利要求20所述的電子裝置,其進(jìn)一步包括用于基于從所述音頻流的所述第一部分提取的至少一個(gè)聲音特征產(chǎn)生指示所述第一首音樂(lè)的音樂(lè)模型的裝置。22.根據(jù)權(quán)利要求21所述的電子裝置,其中所述用于產(chǎn)生指示所述第一首音樂(lè)的所述音樂(lè)模型的裝置包括: 用于將對(duì)指示所述第一首音樂(lè)的所述音樂(lè)模型的請(qǐng)求發(fā)送到外部裝置的裝置,其中所述請(qǐng)求包含從所述音頻流的所述第一部分提取的所述至少一個(gè)聲音特征;以及用于從所述外部裝置接收所述音樂(lè)模型的裝置。23.根據(jù)權(quán)利要求21所述的電子裝置,其中所述用于產(chǎn)生所述音樂(lè)模型的裝置包括用于基于從所述音頻流的所述第一部分提取的所述至少一個(gè)聲音特征來(lái)修改預(yù)定音樂(lè)模型的裝置。24.根據(jù)權(quán)利要求21所述的電子裝置,其中所述用于確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)的裝置是基于所述音樂(lè)模型和從所述音頻流的所述第二部分提取的至少一個(gè)聲音特征。25.根據(jù)權(quán)利要求20所述的電子裝置,其進(jìn)一步包括: 用于響應(yīng)于確定所述第二部分不指示所述第一首音樂(lè)而接收所述音頻流的第三部分的裝置; 用于基于所述音頻流的所述第三部分提取第三聲音特征的裝置; 用于基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂(lè)的裝置;以及 用于響應(yīng)于確定所述音頻流的所述第三部分指示音樂(lè),基于所述音頻流的所述第三部分識(shí)別第二首音樂(lè)的裝置。26.根據(jù)權(quán)利要求25所述的電子裝置,其中所述用于基于所述音頻流的所述第三部分識(shí)別所述第二首音樂(lè)的裝置包括: 用于將請(qǐng)求發(fā)送到外部裝置的裝置,其中所述請(qǐng)求包含從所述音頻流的所述第三部分提取的至少一個(gè)聲音特征; 用于從所述外部裝置接收與所述第二首音樂(lè)相關(guān)聯(lián)的信息的裝置;以及 用于基于所述從所述外部裝置接收到的信息識(shí)別所述第二首音樂(lè)的裝置。27.根據(jù)權(quán)利要求19所述的電子裝置,其中所述用于識(shí)別所述首音樂(lè)的裝置經(jīng)配置以從外部裝置獲得識(shí)別信息。28.—種非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體,其包括致使電子裝置的至少一處理器執(zhí)行以下操作的指令: 接收音頻流的第一部分; 基于所述音頻流的所述第一部分提取第一聲音特征; 基于所述第一聲音特征確定所述音頻流的所述第一部分是否指示音樂(lè); 響應(yīng)于確定所述音頻流的所述第一部分指示音樂(lè),基于所述音頻流的所述第一部分識(shí)別第一首音樂(lè); 接收所述音頻流的第二部分; 基于所述音頻流的所述第二部分提取第二聲音特征;以及 確定所述音頻流的所述第二部分是否指示所述第一首音樂(lè)。29.根據(jù)權(quán)利要求28所述的非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體,其中接收所述音頻流的所述第一部分包括根據(jù)聲音傳感器的工作循環(huán)周期性地接收所述音頻流的多個(gè)部分。30.根據(jù)權(quán)利要求28所述的非暫時(shí)性計(jì)算機(jī)可讀存儲(chǔ)媒體,其進(jìn)一步包括致使所述電子裝置的所述至少一處理器執(zhí)行以下操作的指令: 響應(yīng)于確定所述第二部分不指示所述第一首音樂(lè)而接收所述音頻流的第三部分; 基于所述音頻流的所述第三部分提取第三聲音特征; 基于所述第三聲音特征確定所述音頻流的所述第三部分是否指示音樂(lè);以及響應(yīng)于確定所述音頻流的所述第三部分指示音樂(lè),基于所述音頻流的所述第三部分識(shí)別第二首音樂(lè)。
【文檔編號(hào)】H04H60/37GK105874732SQ201580003535
【公開(kāi)日】2016年8月17日
【申請(qǐng)日】2015年1月7日
【發(fā)明人】金泰殊, 李敏秀, 周俊澈
【申請(qǐng)人】高通股份有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
高碑店市| 连州市| 洛浦县| 和静县| 嘉义县| 深州市| 佛冈县| 湟源县| 金塔县| 自治县| 肇州县| 湘阴县| 江山市| 黎平县| 安宁市| 苏尼特左旗| 嘉黎县| 新津县| 济南市| 和田市| 梁河县| 高密市| 林芝县| 淮阳县| 基隆市| 南昌县| 宾川县| 伊通| 锡林浩特市| 长兴县| 石泉县| 长泰县| 黑水县| 化德县| 永清县| 余庆县| 上高县| 西青区| 龙口市| 花莲市| 综艺|