技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種基于瓶頸特征的復(fù)雜音頻分割聚類方法,包括如下步驟,首先構(gòu)造一個帶瓶頸層的深度神經(jīng)網(wǎng)絡(luò);接著讀入復(fù)雜音頻流,對復(fù)雜音頻流進(jìn)行端點檢測,然后提取非靜音段的音頻特征并輸入深度神經(jīng)網(wǎng)絡(luò),從深度神經(jīng)網(wǎng)絡(luò)的瓶頸層提取瓶頸特征;以瓶頸特征作為輸入,采用基于貝葉斯信息準(zhǔn)則的音頻分割方法,使得每個音頻段只包含一種音頻類型且相鄰音頻段的音頻類型不同;最后,采用譜聚類算法對分割后的音頻段進(jìn)行聚類,得到復(fù)雜音頻的音頻類型個數(shù),并將相同音頻類型的音頻段合并在一起。本發(fā)明采用的瓶頸特征是一種深層變換特征,比傳統(tǒng)音頻特征能更有效刻畫復(fù)雜音頻類型的特性差異,在復(fù)雜音頻分割聚類中獲得更加優(yōu)異的效果。
技術(shù)研發(fā)人員:李艷雄;王琴;李先苦;張雪;張聿晗
受保護(hù)的技術(shù)使用者:華南理工大學(xué)
技術(shù)研發(fā)日:2017.02.24
技術(shù)公布日:2017.07.14