1.一種音樂片段提取方法,其特征在于,所述方法包括:
分別從多個(gè)節(jié)目音頻數(shù)據(jù)中的每個(gè)節(jié)目音頻數(shù)據(jù)中提取至少一個(gè)節(jié)目音頻段,得到多個(gè)節(jié)目音頻段;
分別獲取多個(gè)節(jié)目音頻段的音頻指紋數(shù)據(jù)以及所述多個(gè)節(jié)目音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù);
根據(jù)所述節(jié)目音頻段的音頻指紋數(shù)據(jù),在預(yù)設(shè)的音樂指紋數(shù)據(jù)庫中查找與所述節(jié)目音頻段的音頻指紋數(shù)據(jù)匹配的音樂音頻指紋數(shù)據(jù),將查找到的音樂音頻指紋數(shù)據(jù)對應(yīng)的音樂確定為節(jié)目音樂,并獲取與各個(gè)節(jié)目音頻數(shù)據(jù)對應(yīng)的節(jié)目音樂的音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù);
通過將所述多個(gè)節(jié)目音頻數(shù)據(jù)中的目標(biāo)節(jié)目音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)與該目標(biāo)節(jié)目音頻數(shù)據(jù)對應(yīng)的目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)進(jìn)行比較,得到所述目標(biāo)節(jié)目音樂在所述目標(biāo)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段,從而得到各個(gè)節(jié)目音樂在對應(yīng)的節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段;
根據(jù)各個(gè)節(jié)目音樂在對應(yīng)的節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段,輸出至少一個(gè)節(jié)目音樂的音樂片段。
2.如權(quán)利要求1所述的音樂片段提取方法,其特征在于,所述根據(jù)各個(gè)節(jié)目音樂在對應(yīng)的節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段,輸出至少一個(gè)節(jié)目音樂的音樂片段包括:
根據(jù)各個(gè)節(jié)目音樂在對應(yīng)的節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段的重復(fù)次數(shù),確定各個(gè)節(jié)目音樂在對應(yīng)的節(jié)目音頻數(shù)據(jù)中出現(xiàn)的重復(fù)次數(shù)最多的至少一個(gè)預(yù)設(shè)時(shí)長的時(shí)間片段作為對應(yīng)節(jié)目音樂的備選片段;
根據(jù)各個(gè)備選片段在所述多個(gè)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的重復(fù)次數(shù),將至少一個(gè)備選片段確定為所述音樂片段并輸出。
3.如權(quán)利要求1所述的音樂片段提取方法,其特征在于,所述分別獲取多個(gè)節(jié)目音頻段的音頻指紋數(shù)據(jù)包括:
提取目標(biāo)節(jié)目音頻段的頻譜峰值點(diǎn);
在所述目標(biāo)節(jié)目音頻段的頻譜峰值點(diǎn)中選取至少一對相鄰頻譜峰值點(diǎn)對;
根據(jù)目標(biāo)相鄰頻譜峰值點(diǎn)對的頻率參數(shù)和時(shí)間參數(shù),確定目標(biāo)相鄰頻譜峰值點(diǎn)對對應(yīng)的指紋特征值;
根據(jù)所有相鄰頻譜峰值點(diǎn)對對應(yīng)的指紋特征值,確定所述目標(biāo)節(jié)目音頻段的音頻指紋數(shù)據(jù)。
4.如權(quán)利要求3所述的音樂片段提取方法,其特征在于,所述在所述目標(biāo)節(jié)目音頻段的頻譜峰值點(diǎn)中選取至少一對相鄰頻譜峰值點(diǎn)對之前還包括:
檢測目標(biāo)節(jié)目音頻段的各幀音頻數(shù)據(jù)的頻譜峰值點(diǎn)中是否存在頻率差小于預(yù)設(shè)頻率閾值并且時(shí)間差小于預(yù)設(shè)時(shí)間閾值的掩蔽頻譜峰值點(diǎn)對;
若存在,則將所述掩蔽頻譜峰值點(diǎn)對被掩蔽的頻譜峰值點(diǎn)濾除。
5.如權(quán)利要求1-4所述的任一音樂片段提取方法,其特征在于,所述通過將所述多個(gè)節(jié)目音頻數(shù)據(jù)中的目標(biāo)節(jié)目音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)與該目標(biāo)節(jié)目音頻數(shù)據(jù)對應(yīng)的目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)進(jìn)行比較,得到所述目標(biāo)節(jié)目音樂在所述目標(biāo)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段包括:
通過將目標(biāo)節(jié)目音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)與該目標(biāo)節(jié)目音頻數(shù)據(jù)對應(yīng)的目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)進(jìn)行比較,在所述目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)中查找與所述目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻匹配比例大于預(yù)設(shè)匹配比例閾值的最長時(shí)間片段,作為所述目標(biāo)節(jié)目音樂在所述目標(biāo)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段。
6.如權(quán)利要求5所述的音樂片段提取方法,其特征在于,所述頻譜能量編碼數(shù)據(jù)包括音頻數(shù)據(jù)中每個(gè)音頻幀的頻譜能量編碼;
所述通過將所述多個(gè)節(jié)目音頻數(shù)據(jù)中的目標(biāo)節(jié)目音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)與該目標(biāo)節(jié)目音頻數(shù)據(jù)對應(yīng)的目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)進(jìn)行比較包括:
將目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻幀的頻譜能量編碼與該目標(biāo)節(jié)目音頻數(shù)據(jù)對應(yīng)的目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)的音頻幀的頻譜能量編碼進(jìn)行比較,若目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻幀的頻譜能量編碼與目標(biāo)節(jié)目音樂的音頻幀的頻譜能量編碼的匹配度達(dá)到預(yù)設(shè)匹配度閾值,則確定該目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻幀為目標(biāo)節(jié)目音樂的音頻幀的匹配幀;
按照時(shí)序先后關(guān)系,將目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)中的目標(biāo)時(shí)間片段的音頻幀中被確定為目標(biāo)節(jié)目音頻數(shù)據(jù)中的相應(yīng)時(shí)間片段的音頻幀的匹配幀的比例,作為所述目標(biāo)節(jié)目音樂的目標(biāo)時(shí)間片段與所述目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻匹配比例。
7.如權(quán)利要求2所述的音樂片段提取方法,其特征在于,所述根據(jù)各個(gè)備選片段在所述多個(gè)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的重復(fù)次數(shù),將至少一個(gè)備選片段確定為所述音樂片段并輸出包括:
根據(jù)所述備選片段在所述多個(gè)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的重復(fù)次數(shù)以及出現(xiàn)的節(jié)目音頻數(shù)據(jù)對應(yīng)的熱點(diǎn)權(quán)重值,確定所述各個(gè)備選片段的投票計(jì)數(shù)值;
將投票計(jì)數(shù)值最高的預(yù)設(shè)數(shù)量個(gè)備選片段確定為所述音樂片段并輸出。
8.一種音樂片段提取設(shè)備,其特征在于,所述設(shè)備包括:
音頻段提取模塊,用于分別從多個(gè)節(jié)目音頻數(shù)據(jù)中的每個(gè)節(jié)目音頻數(shù)據(jù)中提取至少一個(gè)節(jié)目音頻段,得到多個(gè)節(jié)目音頻段;
指紋數(shù)據(jù)獲取模塊,用于分別獲取多個(gè)節(jié)目音頻段的音頻指紋數(shù)據(jù);
能量編碼數(shù)據(jù)獲取模塊,用于獲取所述多個(gè)節(jié)目音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù);
節(jié)目音樂確定模塊,用于根據(jù)所述節(jié)目音頻段的音頻指紋數(shù)據(jù),在預(yù)設(shè)的音樂指紋數(shù)據(jù)庫中查找與所述節(jié)目音頻段的音頻指紋數(shù)據(jù)匹配的音樂音頻指紋數(shù)據(jù),并將查找到的音樂音頻指紋數(shù)據(jù)對應(yīng)的音樂確定為節(jié)目音樂;
所述能量編碼數(shù)據(jù)獲取模塊,還用于獲取與各個(gè)節(jié)目音頻數(shù)據(jù)對應(yīng)的節(jié)目音樂的音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù);
時(shí)間片段確定模塊,用于通過將所述多個(gè)節(jié)目音頻數(shù)據(jù)中的目標(biāo)節(jié)目音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)與該目標(biāo)節(jié)目音頻數(shù)據(jù)對應(yīng)的目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)進(jìn)行比較,得到所述目標(biāo)節(jié)目音樂在所述目標(biāo)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段,從而得到各個(gè)節(jié)目音樂在對應(yīng)的節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段;
音樂片段輸出模塊,用于根據(jù)各個(gè)節(jié)目音樂在對應(yīng)的節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段,輸出至少一個(gè)節(jié)目音樂的音樂片段。
9.如權(quán)利要求8所述的音樂片段提取設(shè)備,其特征在于,所述音樂片段輸出模塊包括:
備選片段確定單元,用于根據(jù)各個(gè)節(jié)目音樂在對應(yīng)的節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段的重復(fù)次數(shù),確定各個(gè)節(jié)目音樂在對應(yīng)的節(jié)目音頻數(shù)據(jù)中出現(xiàn)的重復(fù)次數(shù)最多的至少一個(gè)預(yù)設(shè)時(shí)長的時(shí)間片段作為對應(yīng)節(jié)目音樂的備選片段;
音樂片段輸出單元,用于根據(jù)各個(gè)備選片段在所述多個(gè)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的重復(fù)次數(shù),將至少一個(gè)備選片段確定為所述音樂片段并輸出。
10.如權(quán)利要求8所述的音樂片段提取設(shè)備,其特征在于,所述指紋數(shù)據(jù)獲取模塊包括:
峰值點(diǎn)提取單元,用于提取目標(biāo)節(jié)目音頻段的頻譜峰值點(diǎn);
峰值點(diǎn)對選取單元,用于在所述目標(biāo)節(jié)目音頻段的頻譜峰值點(diǎn)中選取至少一對相鄰頻譜峰值點(diǎn)對;
特征值確定單元,用于根據(jù)目標(biāo)相鄰頻譜峰值點(diǎn)對的頻率參數(shù)和時(shí)間參數(shù),確定目標(biāo)相鄰頻譜峰值點(diǎn)對對應(yīng)的指紋特征值;
指紋數(shù)據(jù)確定單元,用于根據(jù)所有相鄰頻譜峰值點(diǎn)對對應(yīng)的指紋特征值,確定所述目標(biāo)節(jié)目音頻段的音頻指紋數(shù)據(jù)。
11.如權(quán)利要求10所述的音樂片段提取設(shè)備,其特征在于,所述音樂片段提取設(shè)備還包括:
掩蔽峰值點(diǎn)檢測模塊,用于檢測目標(biāo)節(jié)目音頻段的各幀音頻數(shù)據(jù)的頻譜峰值點(diǎn)中是否存在頻率差小于預(yù)設(shè)頻率閾值并且時(shí)間差小于預(yù)設(shè)時(shí)間閾值的掩蔽頻譜峰值點(diǎn)對;
掩蔽峰值點(diǎn)濾除模塊,用于當(dāng)存在頻率差小于預(yù)設(shè)頻率閾值并且時(shí)間差小于預(yù)設(shè)時(shí)間閾值的掩蔽頻譜峰值點(diǎn)對時(shí),將所述掩蔽頻譜峰值點(diǎn)對被掩蔽的頻譜峰值點(diǎn)濾除。
12.如權(quán)利要求8-11所述的任一音樂片段提取設(shè)備,其特征在于,所述時(shí)間片段確定模塊用于:
通過將目標(biāo)節(jié)目音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)與該目標(biāo)節(jié)目音頻數(shù)據(jù)對應(yīng)的目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)的頻譜能量編碼數(shù)據(jù)進(jìn)行比較,在所述目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)中查找與所述目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻匹配比例大于預(yù)設(shè)匹配比例閾值的最長時(shí)間片段,作為所述目標(biāo)節(jié)目音樂在所述目標(biāo)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的時(shí)間片段。
13.如權(quán)利要求12所述的音樂片段提取設(shè)備,其特征在于,所述頻譜能量編碼數(shù)據(jù)包括音頻數(shù)據(jù)中每個(gè)音頻幀的頻譜能量編碼;
所述時(shí)間片段確定模塊包括:
匹配幀確定單元,用于將目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻幀的頻譜能量編碼與該目標(biāo)節(jié)目音頻數(shù)據(jù)對應(yīng)的目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)的音頻幀的頻譜能量編碼進(jìn)行比較,若目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻幀的頻譜能量編碼與目標(biāo)節(jié)目音樂的音頻幀的頻譜能量編碼的匹配度達(dá)到預(yù)設(shè)匹配度閾值,則確定該目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻幀為目標(biāo)節(jié)目音樂的音頻幀的匹配幀;
匹配比例確定單元,用于按照時(shí)序先后關(guān)系,將目標(biāo)節(jié)目音樂的音頻數(shù)據(jù)中的目標(biāo)時(shí)間片段的音頻幀中被確定為目標(biāo)節(jié)目音頻數(shù)據(jù)中的相應(yīng)時(shí)間片段的音頻幀的匹配幀的比例,作為所述目標(biāo)節(jié)目音樂的目標(biāo)時(shí)間片段與所述目標(biāo)節(jié)目音頻數(shù)據(jù)的音頻匹配比例。
14.如權(quán)利要求9所述的音樂片段提取設(shè)備,其特征在于,所述音樂片段輸出單元用于:
根據(jù)所述備選片段在所述多個(gè)節(jié)目音頻數(shù)據(jù)中出現(xiàn)的重復(fù)次數(shù)以及出現(xiàn)的節(jié)目音頻數(shù)據(jù)對應(yīng)的熱點(diǎn)權(quán)重值,確定所述各個(gè)備選片段的投票計(jì)數(shù)值;
將投票計(jì)數(shù)值最高的預(yù)設(shè)數(shù)量個(gè)備選片段確定為所述音樂片段并輸出。