高的音色數(shù)據(jù),將其與用于保存非人類聲音范圍內(nèi)的音色數(shù)據(jù)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的非人聲音色數(shù)據(jù)進(jìn)行匹配對(duì)比,若匹配成功,則根據(jù)匹配結(jié)果對(duì)錄音文件進(jìn)行分類并命名;若匹配失敗,則提取錄音文件的語音數(shù)據(jù)中的音量信息及音調(diào)信息進(jìn)行識(shí)別判斷,當(dāng)判斷音量和/或音調(diào)超過預(yù)設(shè)的閾值時(shí),則將該錄音文件定義為垃圾錄音文件,并以預(yù)設(shè)的特殊符號(hào)作為該錄音文件的文件名;在所述網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中,其用于保存常見的機(jī)動(dòng)車聲、動(dòng)物叫聲、風(fēng)聲、雨聲等聲音的非人聲音音色數(shù)據(jù)及其對(duì)應(yīng)名稱的信息。
[0023]本實(shí)施例提供的錄音文件的命名分類系統(tǒng),其發(fā)明構(gòu)思基于上一實(shí)施例的錄音文件的命名分類方法,因此其工作原理及過程與上一實(shí)施例所描述的相同或相似,在此不再贅述。
[0024]本發(fā)明實(shí)施例提供的錄音文件的命名分類方法及系統(tǒng),能使用戶根據(jù)錄音文件的文件名即可快速方便地找到所需的錄音文件,其通過音色數(shù)據(jù)識(shí)別,能對(duì)錄音文件中的各人物的音色數(shù)據(jù)進(jìn)行識(shí)別,在對(duì)錄音文件進(jìn)行命名時(shí)可根據(jù)各人物的音色數(shù)據(jù)對(duì)應(yīng)的身份標(biāo)識(shí)信息來進(jìn)行命名;此外,若錄音文件中沒有人物參與錄音,其還可根據(jù)錄音文件中出現(xiàn)頻率最高的音色數(shù)據(jù)去進(jìn)行分類命名,或者根據(jù)該錄音文件中的語音數(shù)據(jù)的音量信息及音調(diào)信息是否超過預(yù)設(shè)的閾值來將該錄音文件定義為垃圾錄音文件,并以預(yù)設(shè)的特殊符號(hào)作為該錄音文件的文件名,使用戶通過該文件名即可快速清楚地知道該錄音文件是否為垃圾文件;在保存錄音文件時(shí),還根據(jù)錄音文件的文件名進(jìn)行分類保存,如此用戶在查找錄音文件時(shí)即可根據(jù)文件名快速地找到所需的錄音文件,其有效地解決了現(xiàn)有技術(shù)中在查找錄音文件時(shí)存在的費(fèi)時(shí)麻煩,用戶體驗(yàn)差等問題。
[0025]上述實(shí)施例中提到的內(nèi)容為本發(fā)明較佳的實(shí)施方式,并非是對(duì)本發(fā)明的限定,在不脫離本發(fā)明構(gòu)思的前提下,任何顯而易見的替換均在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種錄音文件的命名分類方法,應(yīng)用于具有音色識(shí)別功能的錄音終端中,所述方法包括: 51、在錄音終端中預(yù)先建立人物音色I(xiàn)D數(shù)據(jù)庫(kù),所述人物音色I(xiàn)D數(shù)據(jù)庫(kù)保存有人物音色數(shù)據(jù),且各人物音色數(shù)據(jù)對(duì)應(yīng)著相應(yīng)的身份標(biāo)識(shí)信息; 52、當(dāng)完成錄音后,對(duì)錄音文件中的語音數(shù)據(jù)進(jìn)行人聲識(shí)別,提取錄音文件中屬于人類聲音范圍內(nèi)的人聲語音數(shù)據(jù); 53、對(duì)所述的人聲語音數(shù)據(jù)進(jìn)行音色識(shí)別,識(shí)別出所述人聲語音數(shù)據(jù)中每一說話者的音色數(shù)據(jù); 54、依次提取所述人聲語音數(shù)據(jù)中每一說話者的音色數(shù)據(jù),將其與所述人物音色I(xiàn)D數(shù)據(jù)庫(kù)中的人物音色數(shù)據(jù)進(jìn)行匹配對(duì)比;若匹配成功,則提取相應(yīng)的人物音色數(shù)據(jù)對(duì)應(yīng)的身份標(biāo)識(shí)信息;若匹配不成功,則播放一段與該音色數(shù)據(jù)相應(yīng)的人聲語音數(shù)據(jù),并彈出相應(yīng)的操作窗口以供用戶對(duì)該音色數(shù)據(jù)進(jìn)行標(biāo)注相應(yīng)的身份標(biāo)識(shí)信息; 55、對(duì)所述提取的身份標(biāo)識(shí)信息和/或標(biāo)注的身份標(biāo)識(shí)信息進(jìn)行整合處理,并將整合處理后的身份標(biāo)識(shí)信息中的全部或部分信息作為所述錄音文件的文件名; 56、根據(jù)文件名中的全部或部分身份標(biāo)識(shí)信息對(duì)命名后的錄音文件進(jìn)行自動(dòng)分類,或提供一操作選項(xiàng)供用戶根據(jù)文件名中的全部或部分身份標(biāo)識(shí)信息對(duì)命名后的錄音文件進(jìn)行分類。
2.根據(jù)權(quán)利要求1所述的錄音文件的命名分類方法,其特征在于,所述步驟S2還包括: 當(dāng)對(duì)錄音文件中的語音數(shù)據(jù)進(jìn)行人聲識(shí)別后,若無法識(shí)別出人聲語音數(shù)據(jù),則提取錄音文件中語音數(shù)據(jù)中出現(xiàn)頻率最高的音色數(shù)據(jù),將其與用于保存非人類聲音范圍內(nèi)的音色數(shù)據(jù)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的非人聲音色數(shù)據(jù)進(jìn)行匹配對(duì)比,若匹配成功,則根據(jù)匹配結(jié)果對(duì)錄音文件進(jìn)行分類并命名;若匹配失敗,則提取錄音文件的語音數(shù)據(jù)中的音量信息及音調(diào)信息進(jìn)行識(shí)別判斷,當(dāng)判斷音量和/或音調(diào)超過預(yù)設(shè)的閾值時(shí),則將該錄音文件定義為垃圾錄音文件,并以預(yù)設(shè)的特殊符號(hào)作為該錄音文件的文件名。
3.根據(jù)權(quán)利要求1所述的錄音文件的命名分類方法,其特征在于,所述步驟S4還包括,當(dāng)用戶將未能與人物音色I(xiàn)D數(shù)據(jù)庫(kù)中的人物音色數(shù)據(jù)匹配成功的音色數(shù)據(jù)進(jìn)行標(biāo)注相應(yīng)的身份標(biāo)識(shí)信息后,將該音色數(shù)據(jù)及其對(duì)應(yīng)的身份標(biāo)識(shí)信息保存于所述人物音色I(xiàn)D數(shù)據(jù)庫(kù)中。
4.根據(jù)權(quán)利要求1?3中任一項(xiàng)所述的錄音文件的命名分類方法,其特征在于:所述錄音終端為具有錄音功能的手機(jī)。
5.—種錄音文件的命名分類系統(tǒng),應(yīng)用于具有音色識(shí)別功能的錄音終端中,所述系統(tǒng)包括: 人物音色I(xiàn)D數(shù)據(jù)庫(kù)單元,用于在錄音終端中預(yù)先建立人物音色I(xiàn)D數(shù)據(jù)庫(kù),所述人物音色I(xiàn)D數(shù)據(jù)庫(kù)保存有人物音色數(shù)據(jù),且各人物音色數(shù)據(jù)對(duì)應(yīng)著相應(yīng)的身份標(biāo)識(shí)信息; 人聲識(shí)別單元,當(dāng)完成錄音后,對(duì)錄音文件中的語音數(shù)據(jù)進(jìn)行人聲識(shí)別,提取錄音文件中屬于人類聲音范圍內(nèi)的人聲語音數(shù)據(jù); 音色識(shí)別及匹配處理單元,用于對(duì)所述的人聲語音數(shù)據(jù)進(jìn)行音色識(shí)別,識(shí)別出所述人聲語音數(shù)據(jù)中每一說話者的音色數(shù)據(jù);依次提取所述人聲語音數(shù)據(jù)中每一說話者的音色數(shù)據(jù),將其與所述人物音色I(xiàn)D數(shù)據(jù)庫(kù)中的人物音色數(shù)據(jù)進(jìn)行匹配對(duì)比;若匹配成功,則提取相應(yīng)的人物音色數(shù)據(jù)對(duì)應(yīng)的身份標(biāo)識(shí)信息;若匹配不成功,則播放一段與該音色數(shù)據(jù)相應(yīng)的人聲語音數(shù)據(jù),并彈出相應(yīng)的操作窗口以供用戶對(duì)該音色數(shù)據(jù)進(jìn)行標(biāo)注相應(yīng)的身份標(biāo)識(shí)信息; 錄音文件命名單元,用于對(duì)所述提取的身份標(biāo)識(shí)信息和/或標(biāo)注的身份標(biāo)識(shí)信息進(jìn)行整合處理,并將整合處理后的身份標(biāo)識(shí)信息中的全部或部分信息作為所述錄音文件的文件名; 錄音文件分類單元,根據(jù)文件名中的全部或部分身份標(biāo)識(shí)信息對(duì)命名后的錄音文件進(jìn)行自動(dòng)分類,或提供一操作選項(xiàng)供用戶根據(jù)文件名中的全部或部分身份標(biāo)識(shí)信息對(duì)命名后的錄音文件進(jìn)行分類。
6.根據(jù)權(quán)利要求5所述的錄音文件的命名分類系統(tǒng),其特征在于,所述系統(tǒng)還包括: 非人聲錄音文件處理單元,用于當(dāng)對(duì)錄音文件中的語音數(shù)據(jù)進(jìn)行人聲識(shí)別后,若無法識(shí)別出人聲語音數(shù)據(jù),則提取錄音文件中語音數(shù)據(jù)中出現(xiàn)頻率最高的音色數(shù)據(jù),將其與用于保存非人類聲音范圍內(nèi)的音色數(shù)據(jù)的網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的非人聲音色數(shù)據(jù)進(jìn)行匹配對(duì)比,若匹配成功,則根據(jù)匹配結(jié)果對(duì)錄音文件進(jìn)行分類并命名;若匹配失敗,則提取錄音文件的語音數(shù)據(jù)中的音量信息及音調(diào)信息進(jìn)行識(shí)別判斷,當(dāng)判斷音量和/或音調(diào)超過預(yù)設(shè)的閾值時(shí),則將該錄音文件定義為垃圾錄音文件,并以預(yù)設(shè)的特殊符號(hào)作為該錄音文件的文件名。
7.根據(jù)權(quán)利要求5所述的錄音文件的命名分類系統(tǒng),其特征在于,所述音色識(shí)別及匹配處理單元還用于,當(dāng)用戶將未能與人物音色I(xiàn)D數(shù)據(jù)庫(kù)中的人物音色數(shù)據(jù)匹配成功的音色數(shù)據(jù)進(jìn)行標(biāo)注相應(yīng)的身份標(biāo)識(shí)信息后,將該音色數(shù)據(jù)及其對(duì)應(yīng)的身份標(biāo)識(shí)信息保存于所述人物音色I(xiàn)D數(shù)據(jù)庫(kù)中。
8.根據(jù)權(quán)利要求5?7中任一項(xiàng)所述的錄音文件的命名分類系統(tǒng),其特征在于:所述錄音終端為具有錄音功能的手機(jī)。
【專利摘要】本發(fā)明公開了一種錄音文件的命名分類方法及系統(tǒng),其通過音色數(shù)據(jù)識(shí)別,能對(duì)錄音文件中的各人物的音色數(shù)據(jù)進(jìn)行識(shí)別,在對(duì)錄音文件進(jìn)行命名時(shí)可根據(jù)各人物的音色數(shù)據(jù)對(duì)應(yīng)的身份標(biāo)識(shí)信息來進(jìn)行命名;此外,若錄音文件中沒有人物參與錄音,其還可根據(jù)錄音文件中出現(xiàn)頻率最高的音色數(shù)據(jù)去進(jìn)行分類命名,或者根據(jù)該錄音文件中的語音數(shù)據(jù)的音量信息及音調(diào)信息是否超過預(yù)設(shè)的閾值來將該錄音文件定義為垃圾錄音文件。利用本發(fā)明,用戶在查找錄音文件時(shí)可根據(jù)文件名快速地找到所需的錄音文件,其有效地解決了現(xiàn)有技術(shù)中在查找錄音文件時(shí)存在的費(fèi)時(shí)麻煩,用戶體驗(yàn)差等問題。
【IPC分類】G06F17-30, H04M1-65, G10L15-08
【公開號(hào)】CN104867494
【申請(qǐng)?zhí)枴緾N201510228698
【發(fā)明人】曾元清
【申請(qǐng)人】廣東歐珀移動(dòng)通信有限公司
【公開日】2015年8月26日
【申請(qǐng)日】2015年5月7日