本發(fā)明涉及語音控制,尤其涉及一種音頻設(shè)備模式語言控制方法及系統(tǒng)。
背景技術(shù):
1、音頻設(shè)備在人們的日常生活和工作中扮演著重要角色。搭建一個應(yīng)用于音頻設(shè)備的模式語言控制平臺能夠讓用戶通過語音指令輕松切換音頻設(shè)備的不同模式,從而提高音頻設(shè)備的使用便捷性和效率,同時用戶可以根據(jù)不同的場景需求快速調(diào)整音頻設(shè)備的參數(shù)設(shè)置,以獲得更加個性化的音頻體驗,以及方便不同用戶之間、音頻設(shè)備與其他智能設(shè)備之間的交互與協(xié)同,從而降低操作復(fù)雜性帶來的困擾,提高用戶的滿意度。
2、目前,對于音頻設(shè)備的控制通常采用手動按鍵、觸摸屏操作或者遙控器等傳統(tǒng)的控制方式,然而,通過這種傳統(tǒng)的控制方式,用戶需要進(jìn)行繁瑣的操作,且在某些情況下(如環(huán)境噪聲干擾,語音模糊或不清晰等情況)難以實現(xiàn)精準(zhǔn)控制,并且由于音頻設(shè)備的使用場景多樣,存在大量不同的模式和參數(shù)設(shè)置需求,傳統(tǒng)的控制方式在面對復(fù)雜操作和大量指令時,對于數(shù)據(jù)的處理不夠高效和精確,從而導(dǎo)致對于音頻設(shè)備的控制不夠便捷。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供一種音頻設(shè)備模式語言控制方法及系統(tǒng),其主要目的在于提高音頻設(shè)備控制的準(zhǔn)確性。
2、為實現(xiàn)上述目的,本發(fā)明提供的一種音頻設(shè)備模式語言控制方法,包括:
3、獲取音頻設(shè)備對應(yīng)用戶的語音指令,提取所述語音指令的語音音頻,對所述語音音頻進(jìn)行能量增強(qiáng),得到增強(qiáng)音頻;
4、分析所述增強(qiáng)音頻的功率譜,基于所述功率譜,對所述增強(qiáng)音頻進(jìn)行信號濾波,得到濾波音頻,計算所述濾波音頻的長時幀功率,基于所述長時幀功率,對所述濾波音頻進(jìn)行噪聲抑制,得到抑制音頻;
5、查詢所述抑制音頻的多通道時頻和功率,對所述通道時頻和所述功率進(jìn)行時頻尺度調(diào)整,得到調(diào)整時頻和調(diào)整功率,基于所述調(diào)整時頻和調(diào)整功率,確定所述抑制音頻的時頻調(diào)整音頻,查詢所述時頻調(diào)整音頻的最佳碼書,基于所述最佳碼書,識別所述抑制音頻的音頻特征;
6、基于所述音頻特征,解析所述語音指令對應(yīng)的指令文本,基于所述指令文本,對所述音頻設(shè)備進(jìn)行模式切換,得到目標(biāo)音頻設(shè)備;
7、分析所述目標(biāo)音頻設(shè)備的音頻效果;
8、若所述音頻效果不滿足預(yù)設(shè)的用戶需求效果,則查詢所述目標(biāo)音頻設(shè)備的用戶反饋指令,基于所述用戶反饋指令,對所述目標(biāo)音頻設(shè)備進(jìn)行參數(shù)調(diào)整之后,返回執(zhí)行分析所述目標(biāo)音頻設(shè)備的音頻效果的步驟;
9、若所述音頻效果滿足預(yù)設(shè)的用戶需求效果,將所述目標(biāo)音頻設(shè)備作為所述語音指令的音頻控制設(shè)備。
10、可選地,所述對所述語音音頻進(jìn)行能量增強(qiáng),得到增強(qiáng)音頻,包括:
11、對所述語音音頻進(jìn)行頻域轉(zhuǎn)換,得到轉(zhuǎn)換音頻;
12、計算所述轉(zhuǎn)換音頻中不同頻率區(qū)間的能量水平,得到區(qū)域音頻能量水平;
13、基于所述區(qū)域音頻能量水平,確定所述轉(zhuǎn)換音頻的能量增強(qiáng)區(qū)間;
14、基于所述能量增強(qiáng)區(qū)間對所述轉(zhuǎn)換音頻進(jìn)行能量增強(qiáng),得到增強(qiáng)音頻。
15、可選地,所述分析所述增強(qiáng)音頻的功率譜,包括:
16、提取所述增強(qiáng)音頻的初始信號;
17、計算所述初始信號的小波系數(shù)頻譜;
18、基于所述小波系數(shù)頻譜,計算所述增強(qiáng)音頻的功率譜。
19、可選地,所述基于所述功率譜,對所述增強(qiáng)音頻進(jìn)行信號濾波,得到濾波音頻,包括:
20、基于所述功率譜,確定所述增強(qiáng)音頻的濾波范圍;
21、基于所述濾波范圍,計算所述增強(qiáng)音頻的信號通過度;
22、基于所述信號通過度,對所述增強(qiáng)音頻的信號進(jìn)行信號變換,得到濾波音頻。
23、可選地,所述計算所述濾波音頻的長時幀功率,包括:
24、對所述濾波音頻進(jìn)行音頻分割,得到分割音頻;
25、計算所述分割音頻的信號功率;
26、基于所述分幀功率,計算所述濾波音頻的長時幀功率。
27、可選地,所述查詢所述時頻調(diào)整音頻的最佳碼書,包括:
28、將所述時頻調(diào)整音頻轉(zhuǎn)化成音頻矢量;
29、對所述音頻矢量進(jìn)行矢量聚類,得到聚類矢量;
30、查詢所述聚類矢量的聚類中心;
31、基于所述聚類中心,對所述聚類矢量進(jìn)行聚類優(yōu)化,得到優(yōu)化聚類矢量;
32、對所述優(yōu)化聚類矢量進(jìn)行篩選,得到篩選聚類矢量;
33、基于所述篩選聚類矢量,確定所述時頻調(diào)整音頻的最佳碼書。
34、可選地,所述將所述時頻調(diào)整音頻轉(zhuǎn)化成音頻矢量,包括:
35、對所述時頻調(diào)整音頻進(jìn)行分幀處理,得到多幀音頻;
36、對所述多幀音頻進(jìn)行頻率尺度轉(zhuǎn)換,得到轉(zhuǎn)換音頻;
37、對所述轉(zhuǎn)換音頻進(jìn)行離散余弦變換,得到音頻矢量。
38、可選地,所述基于所述最佳碼書,識別所述抑制音頻的音頻特特征,包括:
39、查詢所述抑制音頻的特征參數(shù);
40、對所述特征參數(shù)進(jìn)行矢量化處理,得到參數(shù)矢量;
41、將所述參數(shù)矢量與所述最佳碼書進(jìn)行匹配,得到匹配結(jié)果;
42、基于所述匹配結(jié)果,對所述抑制音頻進(jìn)行時頻域特征標(biāo)記,以確定所述抑制音頻的音頻特征。
43、可選地,所述分析所述目標(biāo)音頻設(shè)備的音頻效果,包括:
44、查詢所述目標(biāo)音頻設(shè)備對應(yīng)的控制參數(shù);
45、根據(jù)所述控制參數(shù),對所述目標(biāo)音頻設(shè)備進(jìn)行音頻效果測試;
46、在所述音頻效果測試結(jié)束后,與所述目標(biāo)音頻設(shè)備對應(yīng)的用戶進(jìn)行智能語音交互;
47、基于所述智能語音交互的交互結(jié)果,確定所述目標(biāo)音頻設(shè)備的音頻效果。
48、為了解決上述問題,本發(fā)明還提供一種音頻設(shè)備模式語言控制系統(tǒng),所述系統(tǒng)包括:
49、音頻增強(qiáng)模塊,用于獲取音頻設(shè)備對應(yīng)用戶的語音指令,提取所述語音指令的語音音頻,對所述語音音頻進(jìn)行能量增強(qiáng),得到增強(qiáng)音頻;
50、音頻抑制模塊,用于分析所述增強(qiáng)音頻的功率譜,基于所述功率譜,對所述增強(qiáng)音頻進(jìn)行信號濾波,得到濾波音頻,計算所述濾波音頻的長時幀功率,基于所述長時幀功率,對所述濾波音頻進(jìn)行噪聲抑制,得到抑制音頻;
51、音頻特征識別模塊,用于查詢所述抑制音頻的多通道時頻和功率,對所述通道時頻和所述功率進(jìn)行時頻尺度調(diào)整,得到調(diào)整時頻和調(diào)整功率,基于所述調(diào)整時頻和調(diào)整功率,確定所述抑制音頻的時頻調(diào)整音頻,查詢所述時頻調(diào)整音頻的最佳碼書,基于所述最佳碼書,識別所述抑制音頻的音頻特征;
52、設(shè)備模式切換模塊,用于基于所述音頻特征,解析所述語音指令對應(yīng)的指令文本,基于所述指令文本,對所述音頻設(shè)備進(jìn)行模式切換,得到目標(biāo)音頻設(shè)備;
53、音頻效果分析模塊,用于分析所述目標(biāo)音頻設(shè)備的音頻效果;
54、設(shè)備調(diào)整模塊,用于若所述音頻效果不滿足預(yù)設(shè)的用戶需求效果,則查詢所述目標(biāo)音頻設(shè)備的用戶反饋指令,基于所述用戶反饋指令,對所述目標(biāo)音頻設(shè)備進(jìn)行參數(shù)調(diào)整之后,返回執(zhí)行分析所述目標(biāo)音頻設(shè)備的音頻效果的步驟;
55、目標(biāo)設(shè)備獲取模塊,用于若所述音頻效果滿足預(yù)設(shè)的用戶需求效果,將所述目標(biāo)音頻設(shè)備作為所述語音指令的音頻控制設(shè)備。
56、本發(fā)明通過對所述語音音頻進(jìn)行能量增強(qiáng),得到增強(qiáng)音頻可以使語音信號更加突出,提高后續(xù)處理的準(zhǔn)確性和可靠性;本發(fā)明通過分析所述增強(qiáng)音頻的功率譜可以了解音頻信號在不同頻率上的能量分布情況,以便于更好的清除音頻噪聲;查詢所述抑制音頻的多通道時頻和功率可以更精確地捕捉抑制音頻的音頻信號在時間和頻率上的變化特性;本發(fā)明通過基于所述音頻特征,解析所述語音指令對應(yīng)的指令文本可以明確用戶下達(dá)的指令,以準(zhǔn)確地對音頻設(shè)備進(jìn)行控制。因此,本發(fā)明可以提高音頻設(shè)備控制的準(zhǔn)確性。