可能的實現(xiàn)方式,在第五種可能的實現(xiàn)方式中,所述信號 分析單元,在根據(jù)所述重構(gòu)信號幀的所有子幀的局部能量值中在對數(shù)域上的局部能量最大 值和局部能量平均值,得到第二特征值時,具體是用于:將所述重構(gòu)信號幀的所有子幀的局 部能量值中在對數(shù)域上的局部能量最大值和局部能量平均值作差,得到的差值為所述第二 特征值。
[0033] 結(jié)合第二方面至第二方面的第五種可能的實現(xiàn)方式中的任一種,在第六種可能的 實現(xiàn)方式中,還包括:信號處理單元,用于在一個信號幀與所述語音信號中前一個異常幀之 間的間隔距離小于第三閾值時,如果所述信號幀是異常幀,將位于所述一個信號幀與所述 前一個異常幀之間的正常幀調(diào)整為異常幀。
[0034]結(jié)合第二方面至第二方面的第五種可能的實現(xiàn)方式中的任一種,在第七種可能的 實現(xiàn)方式中,還包括:信號處理單元,用于統(tǒng)計所述語音信號中的異常幀的數(shù)量,若所述異 常幀的數(shù)量小于第四閾值,則將所述語音信號中的所有異常幀均調(diào)整為正常幀。
[0035] 結(jié)合第二方面至第二方面的第五種可能的實現(xiàn)方式中的任一種,在第八種可能的 實現(xiàn)方式中,還包括:信號處理單元,用于統(tǒng)計所述語音信號中異常幀所占的百分比;若所 述異常幀所占的百分比大于第五閾值,則輸出語音崎變告警信息。
[0036] 結(jié)合第二方面至第二方面的第六種可能的實現(xiàn)方式中的任一種,在第九種可能的 實現(xiàn)方式中,還包括:第一信號評價單元,用于根據(jù)所述需要進行異常幀檢測的信號幀的檢 測結(jié)果,計算所述語音信號的第一語音質(zhì)量評價值,所述檢測結(jié)果包括所述需要進行異常 幀檢測的信號幀中的任一幀是正常幀或者異常幀。
[0037] 結(jié)合第二方面的第九種可能的實現(xiàn)方式中,在第十種可能的實現(xiàn)方式中,所述第 一信號評價單元,在計算所述語音信號的第一語音質(zhì)量評價值時,具體是用于:獲取所述語 音信號中的異常幀所占的百分比;根據(jù)所述百分比以及質(zhì)量評價參數(shù),得到與所述百分比 對應的第一語音質(zhì)量評價值。
[0038] 結(jié)合第二方面的第九種或第十種可能的實現(xiàn)方式中,在第i^一種可能的實現(xiàn)方式 中,所述第一信號評價單元,還用于獲取使用語音質(zhì)量評估方法得到的所述語音信號的第 二語音質(zhì)量評價值;根據(jù)所述第一語音質(zhì)量評價值與所述第二語音質(zhì)量評價值,得到第三 語音質(zhì)量評價值。
[0039] 結(jié)合第二方面的第i^一種可能的實現(xiàn)方式,在第十二種可能的實現(xiàn)方式中,所述 第一信號評價單元,在根據(jù)所述第一語音質(zhì)量評價值與所述第二語音質(zhì)量評價值,得到第 三語音質(zhì)量評價值時,具體是用于將所述第二語音質(zhì)量評價值減去所述第一語音質(zhì)量評價 值,得到所述第三語音質(zhì)量評價值。
[0040] 結(jié)合第二方面至第二方面的第八種可能的實現(xiàn)方式,在第十三種可能的實現(xiàn)方式 中,還包括:第二信號評價單元,在在對所述語音信號中需要進行異常幀檢測的信號幀進行 檢測之后,還用于根據(jù)所述需要進行異常幀檢測的信號幀的檢測結(jié)果,獲取所述語音信號 的異常檢測特征值;獲取使用語音質(zhì)量評估方法得到的所述語音信號的的評估特征值;利 用評估系統(tǒng),根據(jù)所述異常檢測特征值和所述評估特征值得到第四語音質(zhì)量評價值。
[0041] 本發(fā)明實施例提供的異常幀檢測方法和裝置,通過對每個信號幀進行處理,比較 信號幀中的局部信號能量差異,實現(xiàn)了對語音信號是否發(fā)生崎變的檢測,能夠確定某信號 中貞是否是異常中貞。
【附圖說明】
[0042] 圖1為本發(fā)明實施例提供的異常幀檢測方法的應用場景示意圖;
[0043]圖2為本發(fā)明實施例提供的異常幀檢測方法中的語音差異示意圖;
[0044] 圖3為本發(fā)明實施例提供的一種異常幀檢測方法的流程示意圖;
[0045] 圖4為本發(fā)明實施例提供的一種異常幀檢測方法中的語音信號示意圖;
[0046] 圖5為本發(fā)明實施例提供的一種異常幀檢測裝置的結(jié)構(gòu)示意圖;
[0047] 圖6為本發(fā)明實施例提供的另一種異常幀檢測裝置的結(jié)構(gòu)示意圖;
[0048]圖7為本發(fā)明實施例提供的異常幀檢測裝置的實體結(jié)構(gòu)示意圖。
【具體實施方式】
[0049] 本發(fā)明實施例提供了一種異常幀檢測方法,該方法可以用于檢測語音信號中的每 一個幀是正常幀或者異常幀,從時域上來定位語音崎變發(fā)生的位置,即語音信號的哪個幀 發(fā)生異常。該方法的一種可選的應用場景可以參見圖1,圖1為本發(fā)明實施例提供的異常幀 檢測方法的應用場景示意圖。
[0050] 這是一個語音通信流程,聲音從主叫方傳輸?shù)奖唤蟹?,在主叫方,我們將A/D轉(zhuǎn) 換、以及編碼前的信號定義為參考信號S1,考慮到編碼以及傳輸對語音質(zhì)量的負面影響,S1 一般是整個流程中的最優(yōu)質(zhì)量;對應的,我們將經(jīng)過解碼、D/A轉(zhuǎn)換后的信號定義為接收信 號S2,一般的,S2的質(zhì)量次于S1。那么,本實施例的異常幀檢測方法可以用于在接收端對 接收信號S2進行檢測,具體可以用于檢測接收信號S2中的每個幀是否發(fā)生異常。
[0051] 下面將詳細描述本發(fā)明實施例的異常幀檢測方法如何進行語音檢測,為了使得對 該方法的思想理解更加容易和清楚,首先對本發(fā)明實施例中異常幀檢測方法所依據(jù)的主要 思路進行簡單說明。參見圖2,圖2為本發(fā)明實施例提供的異常幀檢測方法中的語音差異 示意圖。該圖2中示出了正常語音和異常語音,該異常語音即發(fā)生語音崎變的語音,可以看 至IJ,正常語音和異常語音具有明顯的差異性,例如,從局部能量來看,異常語音的局部能量 波動比較大,局部能量的幅度落差較大;從小波系數(shù)來看,異常語音的小波系數(shù)的抖動幅度 有所增加。本發(fā)明實施例就是要根據(jù)語音信號提取出能夠反映上述差異性的特征值,通過 該特征值的判斷體現(xiàn)上述的差異性,例如是否發(fā)生了局部能量較大變化,從而確定語言信 號是否發(fā)生崎變。
[0052] 需要說明的是,在本發(fā)明的各個實施例中,均是以對待檢測的語音信號中的每一 個信號幀都進行所述的語音畸變檢測方法的處理,并且是對當前正在處理的信號幀中的每 一個子幀都進行該方法所述的處理;但是這只是一種可選的方式,在具體實施中,并不一定 是語音信號中的每一個信號幀都要處理,可能只是選取了其中一部分信號幀進行處理;另 外,在處理一個信號幀時,也不一定是處理每個子幀,也可能是選取了該信號幀中的一部分 子幀進行處理。具體參見下面的實施例:
[0053]實施例一
[0054] 圖3為本發(fā)明實施例提供的一種異常幀檢測方法的流程示意圖,本實施例的方法 可以用于檢測待測試的語音信號,該語音信號例如是圖1中的接收端的S2,在本實施例中, 將S2稱為"語音信號";如圖3所示,該方法可以包括:
[0055] 301、獲取語音信號中的一個信號幀,并將該信號幀劃分成至少兩個子幀;
[0056] 其中,本實施例將語音信號的每一幀稱為一個"信號幀";并且,假設(shè)本實施例中信 號幀的幀長是L_shift,即每一信號幀包括的語音采樣的樣本數(shù)是L_shift。為描述方便, 假設(shè)本實施例的待測試的語音信號的總樣本數(shù)能夠被L_shift整除,且整個語音信號共有 N幀,即語音信號s(n),n= 1、2、3……N。并且,將每一信號幀劃分成至少兩個子幀,本實施 例假設(shè)分成4個子幀(當然該數(shù)目在具體實施中可變),即將每一信號幀中的L_shift個樣 本數(shù)平均分成4份。
[0057] 舉例如下:參見圖4,圖4為本發(fā)明實施例提供的一種異常幀檢測方法中的語音信 號示意圖。該語音信號共有6個信號幀,S卩"第1幀、第2幀……第6幀",即s(n)中的η的 最大取值Ν等于6 ;每一個信號幀的結(jié)構(gòu)以第5幀為例,該第5幀被劃分成4個子幀,分別是 "第一子幀、第二字幀……第四子幀";每個子幀中包括Ns個樣本點,該樣本點是語音測試中 的語音采樣的樣本點,例如間隔lms進行一次語音采樣。整個信號幀(即共四個子幀)中 包括的樣本點的數(shù)目是4*Ns個,那么也就是L_shift的取值是4*Ns。當然,實際的樣本點 在時域上是間隔均勻的,圖4僅是示例。
[0058] 本實施例的異常幀檢測方法是逐個信號幀進行判斷是否異常,例如,先判斷第1 幀是正常幀還是異常幀,得到判斷結(jié)果后,接著判斷第2幀是正常幀還是異常幀,再接著判 斷第3幀,依次類推。那么,下面的302-307就是說明如何對其中的每一信號幀進行判斷的, 每一信號幀都進行如下的判斷過程。需要說明的是,在302-307中,本實施例并不嚴格限制 各步驟之間的順序性,而只是為了描述方便對其進行了排序,但具體實施中302-307的序 號并不對其執(zhí)行順序構(gòu)成限制,例如303可以在302之前進行。
[0059] 302、獲取所述一個信號幀的一個子幀的局部能量值,根據(jù)所述一個子幀的局部能 量值,得到用于表示一個信號幀的局部能量變化趨勢的第一特征值;
[0060] 本步驟是通過計算局部能量值,查看能量是否發(fā)生了較大的變化,例如前面所述 的,與正常語音相比,異常語音的局部能量波動比較大,局部能量的幅度落差較大;而本步 驟所計算的第一特征值能夠用于表示所述信號幀的局部能量變化趨勢,是根據(jù)每一子幀的 局部能量值來計算的。
[0061] 可選的,可以按照如下方法來計算第一特征值:
[0062] 首先,對語音信號中的其中一個信號幀,分別獲取所述信號幀中的每一子幀對應 的局部能量值,并計算所有子幀對應的所有局部能量值的最大值和最小值;
[0063] 本實施例以第5幀作為要執(zhí)行異常判斷的信號幀。本步驟中,要獲取該第5幀中的 每一子幀對應的局部能量值,其中一個子幀的局部能量值可以按照如下的公式(1)計算, 其他子幀對應的局部能量值也按照該公式進行計算: 「00641
·.….·..····,·,.·….·….·..··……(1)
[0065]在公式(1)中,P是信號幀的局部能量值,Μ是該信號幀的子幀的數(shù)量,st和ed是 當前子幀的起始樣本點和末尾樣本點,s(η)2是該信號幀的語音信號能量,L_shift是信號 幀的樣本點的數(shù)量。例如,在本發(fā)明的一個實施例中,Μ= 4,即每一信號幀共有4個子幀, L_shift= 4*Ns,即每一信號幀中共有4*Ns個樣本點,Ns表示的是一個子幀的樣本點的數(shù) 量。以第5幀中的第四子幀為例,根據(jù)公式(1)的表述,那就是將第四子幀中的Ns個樣本 點的信號能量求和,然后該子幀的能量和乘以總的