異常幀檢測方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音處理技術(shù),尤其涉及一種異常幀檢測方法和裝置。
【背景技術(shù)】
[0002] 在音頻技術(shù)研究領(lǐng)域,對音頻質(zhì)量進(jìn)行測試是其中一項(xiàng)重要內(nèi)容。例如,某無線通 信場景,聲音從主叫方傳輸?shù)奖唤蟹?,要?jīng)過模擬數(shù)字(Analog-to-Digital,簡稱:A/D)轉(zhuǎn) 換、編碼、傳輸、解碼和數(shù)模D/A轉(zhuǎn)換等多種處理,在此過程中可能會出現(xiàn)由于編碼或者傳 輸中的丟包等因素,引起接收到的語音信號的質(zhì)量下降,我們將語音質(zhì)量下降的現(xiàn)象稱為 語音崎變。業(yè)界也研究了很多用于測試語音質(zhì)量的方法,例如人工主觀測試法,通過組織測 試人員對待測試音頻進(jìn)行試聽來給出測試評估結(jié)果,但是這種方法周期長且成本高;業(yè)界 需要獲得一種能夠及時(shí)自動的檢測語音是否發(fā)生崎變的方法,以對語音質(zhì)量自動進(jìn)行測試 和評估。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明實(shí)施例提供一種異常幀檢測方法和裝置,以檢測語音信號是否發(fā)生崎變。
[0004] 第一方面,提供一種異常幀檢測方法,所述方法包括:
[0005] 獲取語音信號中的一個(gè)信號幀;
[0006] 將所述一個(gè)信號幀劃分成至少兩個(gè)子幀;
[0007] 獲取所述一個(gè)信號幀的一個(gè)子幀的局部能量值;
[0008] 根據(jù)所述一個(gè)子幀的局部能量值,得到用于表示所述一個(gè)信號幀的局部能量變化 趨勢的第一特征值;
[0009] 對所述一個(gè)信號幀進(jìn)行奇異性分析,得到用于表示所述一個(gè)信號幀的奇異性特征 的第二特征值;
[0010] 若所述一個(gè)信號幀的第一特征值滿足第一閾值,并且所述一個(gè)信號幀的第二特征 值滿足第二閾值,則確定所述一個(gè)信號幀是異常幀。
[0011] 結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述一個(gè)子幀的局部能量 值,得到用于表示所述一個(gè)信號幀的局部能量變化趨勢的第一特征值,包括:獲取所述一個(gè) 信號幀中的所有子幀的局部能量值中在對數(shù)域上的局部能量最大值和局部能量最小值;將 所述在對數(shù)域上的局部能量最大值和局部能量最小值作差得到第一差值,所述第一差值為 所述第一特征值。
[0012] 結(jié)合第一方面,在第二種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述一個(gè)子幀的局部能量 值,得到用于表示所述一個(gè)信號幀的局部能量變化趨勢的第一特征值,包括:確定在時(shí)域上 位于所述一個(gè)信號幀之前的相關(guān)信號幀中的目標(biāo)相關(guān)子幀,并計(jì)算所述目標(biāo)相關(guān)子幀的局 部能量值,獲取所述目標(biāo)相關(guān)子幀的局部能量值中在對數(shù)域上的局部能量最小值;獲取所 述一個(gè)信號幀的所有子幀的局部能量值中在對數(shù)域上的局部能量最大值;將所述在對數(shù)域 上的局部能量最大值與所述在對數(shù)域上的局部能量值最小值作差得到第二差值,所述第二 差值為所述第一特征值。
[0013] 結(jié)合第一方面,在第三種可能的實(shí)現(xiàn)方式中,所述根據(jù)所述一個(gè)子幀的局部能量 值,得到用于表示所述一個(gè)信號幀的局部能量變化趨勢的第一特征值,包括:獲取所述一個(gè) 信號幀中的所有子幀的局部能量值中在對數(shù)域上的局部能量最大值和局部能量最小值;確 定在時(shí)域上位于所述一個(gè)信號幀之前的相關(guān)信號幀中的目標(biāo)相關(guān)子幀,并計(jì)算所述目標(biāo)相 關(guān)子幀的局部能量值,獲取所述目標(biāo)相關(guān)子幀的局部能量值中在對數(shù)域上的局部能量最小 值;將所述一個(gè)信號幀中的所有子幀的局部能量值中在對數(shù)域上的局部能量最大值和局部 能量最小值作差得到第一差值;將所述一個(gè)信號幀中的所有子幀的局部能量值中在對數(shù)域 上的局部能量最大值與所述所述目標(biāo)相關(guān)子幀的局部能量值中在對數(shù)域上的局部能量值 最小值作差得到第二差值;選擇所述第一差值和第二差值中的較小者作為第一特征值。
[0014] 結(jié)合第一方面至第一方面的第三種可能的實(shí)現(xiàn)方式中的任一種,在第四種可能的 實(shí)現(xiàn)方式中,所述對所述一個(gè)信號幀進(jìn)行奇異性分析,得到用于表示奇異性特征的第二特 征值,包括:對所述一個(gè)信號幀進(jìn)行小波分解得到小波系數(shù),并根據(jù)所述小波系數(shù)進(jìn)行信號 重構(gòu)得到重構(gòu)信號幀;根據(jù)所述重構(gòu)信號幀的所有子幀的局部能量值中在對數(shù)域上的局部 能量最大值和局部能量平均值,得到所述第二特征值。
[0015] 結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,所述根據(jù) 所述重構(gòu)信號幀的所有子幀的局部能量值中在對數(shù)域上的局部能量最大值和局部能量平 均值,得到第二特征值,包括:將所述重構(gòu)信號幀的所有子幀的局部能量值中在對數(shù)域上的 局部能量最大值和局部能量平均值作差,得到的差值為所述第二特征值。
[0016] 結(jié)合第一方面至第一方面的第五種可能的實(shí)現(xiàn)方式中的任一種,在第六種可能的 實(shí)現(xiàn)方式中,若所述一個(gè)信號幀與所述語音信號中前一個(gè)異常幀之間的間隔距離小于第三 閾值,在確定所述一個(gè)信號幀為異常幀之后,還包括:將位于所述一個(gè)信號幀與所述前一個(gè) 異常幀之間的正常幀調(diào)整為異常幀。
[0017] 結(jié)合第一方面至第一方面的第五種可能的實(shí)現(xiàn)方式中的任一種,在第七種可能的 實(shí)現(xiàn)方式中,在對所述語音信號中需要進(jìn)行異常幀檢測的信號幀進(jìn)行檢測之后,還包括:統(tǒng) 計(jì)所述語音信號中的異常幀的數(shù)量,若所述異常幀的數(shù)量小于第四閾值,則將所述語音信 號中的所有異常幀均調(diào)整為正常幀。
[0018] 結(jié)合第一方面至第一方面的第五種可能的實(shí)現(xiàn)方式中的任一種,在第八種可能的 實(shí)現(xiàn)方式中,在對所述語音信號中需要進(jìn)行異常幀檢測的信號幀進(jìn)行檢測之后,還包括:統(tǒng) 計(jì)所述語音信號中異常幀所占的百分比;若所述異常幀所占的百分比大于第五閾值,則輸 出語音崎變告警信息。
[0019] 結(jié)合第一方面至第一方面的第八種可能的實(shí)現(xiàn)方式中的任一種,在第九種可能的 實(shí)現(xiàn)方式中,在對所述語音信號中需要進(jìn)行異常幀檢測的信號幀進(jìn)行檢測之后,還包括:根 據(jù)所述需要進(jìn)行異常幀檢測的信號幀的檢測結(jié)果,計(jì)算所述語音信號的第一語音質(zhì)量評價(jià) 值,所述檢測結(jié)果包括所述需要進(jìn)行異常幀檢測的信號幀中的任一幀是正常幀或者異常 幀。
[0020] 結(jié)合第一方面的第九種可能的實(shí)現(xiàn)方式中,在第十種可能的實(shí)現(xiàn)方式中,所述根 據(jù)所述需要進(jìn)行異常幀檢測的信號幀的檢測結(jié)果,計(jì)算所述語音信號的第一語音質(zhì)量評價(jià) 值,包括:獲取所述語音信號中的異常幀所占的百分比;根據(jù)所述百分比以及質(zhì)量評價(jià)參 數(shù),得到與所述百分比對應(yīng)的第一語音質(zhì)量評價(jià)值。
[0021 ] 結(jié)合第一方面的第九種或第十種可能的實(shí)現(xiàn)方式中,在第i^一種可能的實(shí)現(xiàn)方式 中,在計(jì)算所述語音信號的第一語音質(zhì)量評價(jià)值之后,還包括:獲取使用語音質(zhì)量評估方法 得到的所述語音信號的第二語音質(zhì)量評價(jià)值;根據(jù)所述第一語音質(zhì)量評價(jià)值與所述第二語 音質(zhì)量評價(jià)值,得到第三語音質(zhì)量評價(jià)值。
[0022] 結(jié)合第一方面的第i^一種可能的實(shí)現(xiàn)方式,在第十二種可能的實(shí)現(xiàn)方式中,所述 根據(jù)所述第一語音質(zhì)量評價(jià)值與所述第二語音質(zhì)量評價(jià)值,得到第三語音質(zhì)量評價(jià)值,包 括:將所述第二語音質(zhì)量評價(jià)值減去所述第一語音質(zhì)量評價(jià)值,得到所述第三語音質(zhì)量評 價(jià)值。
[0023] 結(jié)合第一方面至第一方面的第八種可能的實(shí)現(xiàn)方式,在第十三種可能的實(shí)現(xiàn)方式 中,在對所述語音信號中需要進(jìn)行異常幀檢測的信號幀進(jìn)行檢測之后,還包括:根據(jù)所述需 要進(jìn)行異常幀檢測的信號幀的檢測結(jié)果,獲取所述語音信號的異常檢測特征值;獲取使用 語音質(zhì)量評估方法得到的所述語音信號的的評估特征值;利用評估系統(tǒng),根據(jù)所述異常檢 測特征值和所述評估特征值得到第四語音質(zhì)量評價(jià)值。
[0024] 第二方面,提供一種異常幀檢測裝置,所述裝置包括:
[0025] 信號劃分單元,用于獲取語音信號中的一個(gè)信號幀,并將所述一個(gè)信號幀劃分成 至少兩個(gè)子幀;
[0026] 信號分析單兀,用于獲取所述一個(gè)信號幀的一個(gè)子幀的局部能量值;根據(jù)所述一 個(gè)子幀的局部能量值,得到用于表示所述一個(gè)信號幀的局部能量變化趨勢的第一特征值; 對所述一個(gè)信號幀進(jìn)行奇異性分析,得到用于表示所述一個(gè)信號幀的奇異性特征的第二特 征值;
[0027] 判斷單元,用于在所述一個(gè)信號幀的第一特征值滿足第一閾值,并且所述一個(gè)信 號幀的第二特征值滿足第二閾值時(shí),確定所述一個(gè)信號幀是異常幀。
[0028] 結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式中,所述信號分析單元,在計(jì)算所述第一 特征值時(shí),具體是用于:獲取所述一個(gè)信號幀中的所有子幀的局部能量值中在對數(shù)域上的 局部能量最大值和局部能量最小值;將所述在對數(shù)域上的局部能量最大值和局部能量最小 值作差得到第一差值,所述第一差值為所述第一特征值。
[0029] 結(jié)合第二方面,在第二種可能的實(shí)現(xiàn)方式中,所述信號分析單元,在計(jì)算所述第一 特征值時(shí),具體是用于:確定在時(shí)域上位于所述一個(gè)信號幀之前的相關(guān)信號幀中的目標(biāo)相 關(guān)子幀,并計(jì)算所述目標(biāo)相關(guān)子幀的局部能量值,獲取所述目標(biāo)相關(guān)子幀的局部能量值中 在對數(shù)域上的局部能量最小值;獲取所述一個(gè)信號幀的所有子幀的局部能量值中在對數(shù)域 上的局部能量最大值;將所述在對數(shù)域上的局部能量最大值與所述在對數(shù)域上的局部能量 值最小值作差得到第二差值,所述第二差值為所述第一特征值。
[0030] 結(jié)合第二方面,在第三種可能的實(shí)現(xiàn)方式中,所述信號分析單元,在計(jì)算所述第一 特征值時(shí),具體是用于:獲取所述一個(gè)信號幀中的所有子幀的局部能量值中在對數(shù)域上的 局部能量最大值和局部能量最小值;確定在時(shí)域上位于所述一個(gè)信號幀之前的相關(guān)信號幀 中的目標(biāo)相關(guān)子幀,并計(jì)算所述目標(biāo)相關(guān)子幀的局部能量值,獲取所述目標(biāo)相關(guān)子幀的局 部能量值中在對數(shù)域上的局部能量最小值;將所述一個(gè)信號幀中的所有子幀的局部能量值 中在對數(shù)域上的局部能量最大值和局部能量最小值作差得到第一差值;將所述一個(gè)信號幀 中的所有子幀的局部能量值中在對數(shù)域上的局部能量最大值與所述所述目標(biāo)相關(guān)子幀的 局部能量值中在對數(shù)域上的局部能量值最小值作差得到第二差值;選擇所述第一差值和第 二差值中的較小者作為第一特征值。
[0031] 結(jié)合第二方面至第二方面的第三種可能的實(shí)現(xiàn)方式中的任一種,在第四種可能的 實(shí)現(xiàn)方式中,所述信號分析單元,在計(jì)算所述第二特征值時(shí),具體是用于:對所述一個(gè)信號 幀進(jìn)行小波分解得到小波系數(shù),并根據(jù)所述重構(gòu)信號幀的所有子幀的局部能量值中在對數(shù) 域上的局部能量最大值和局部能量平均值,得到所述第二特征值。
[0032] 結(jié)合第二方面的第四種