音頻信號還原度檢測方法及系統(tǒng)的制作方法

文檔序號：2827563閱讀：380來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

音頻信號還原度檢測方法及系統(tǒng)的制作方法
【專利摘要】本申請涉及一種音頻信號還原度檢測方法及系統(tǒng)，該方法包括：聲源部分產(chǎn)生標準的真人語音信號作為輸入語音信號，從聲源部分輸入被測系統(tǒng)；輸入語音信號在被測系統(tǒng)中傳遞，并作為輸出語音信號從被測系統(tǒng)的輸出端輸出；采集輸出的連續(xù)的語音信號；將采集的輸出語音信號的信號流切片和分析處理而確定還原度。本申請使用真人語音信號與采樣信號比較分析，符合被測系統(tǒng)和設(shè)備的實際應(yīng)用情況；對連續(xù)發(fā)出的音頻信號切片以連續(xù)的幀方式進行直接測試處理而實現(xiàn)了對所有關(guān)心的連續(xù)頻率的測試以及更準確的直接檢測音頻輸出性能還原度，解決了測試結(jié)果符合安全通信設(shè)備及系統(tǒng)實際應(yīng)用情況，提高了這類系統(tǒng)和設(shè)備音頻信號檢測、測試的準確度、精確度。
【專利說明】音頻信號還原度檢測方法及系統(tǒng)

【技術(shù)領(lǐng)域】
[0001] 本申請涉及語音傳輸檢測領(lǐng)域，更具體地涉及音頻信號還原度檢測方法及系統(tǒng)。

【背景技術(shù)】
[0002] 在現(xiàn)有技術(shù)中，需要對語音或視頻傳輸使用的設(shè)備進行語音傳輸、視頻傳輸?shù)刃?能是否符合規(guī)定的各項指標做檢測（檢驗）或測試，只有當這些檢測或測試所獲得結(jié)果符合規(guī)定的各項標準要求，才能保證這些語音或視頻設(shè)備是可用且好用、質(zhì)量是有保障的，進而，才能將這些設(shè)備進行生產(chǎn)和實際應(yīng)用。隨著語音、視頻傳輸設(shè)備的各項技術(shù)的不斷進步，對設(shè)備以及設(shè)備配合使用時的各方面的性能要求也在不斷更新進步中。因此，對于設(shè)備檢測（檢驗）的技術(shù)，也隨之不斷改進以便提高檢測檢驗結(jié)果的準確性和精確度。以應(yīng)用于住宅樓宇出入口控制的樓宇對講系統(tǒng)為例，對其使用的設(shè)備以及系統(tǒng)整體上的音頻傳輸特性的檢測（檢驗）或測試就是整個對講系統(tǒng)檢測最為重要的部分。已知的樓宇對講系統(tǒng) 的音頻傳輸質(zhì)量測試的試驗方法是評價樓宇對講系統(tǒng)產(chǎn)品語音傳輸質(zhì)量的一整套全程聲測試的試驗方法，其包括了 5項技術(shù)參數(shù)（如：響度評定值、頻率響應(yīng)/頻響、失真、信噪比、側(cè)音掩蔽評定值）的測試和計算。該已有的測試方法中，對輸出端的音頻信號檢測則專注于對其頻響、失真及振幅特性的技術(shù)特性的評測。例如，如圖3所示，聲源/音源即信號源 301產(chǎn)生音頻信號后，通過功放裝置302、被測系統(tǒng)的音頻信號通路等，在被測系統(tǒng)的音頻輸出端（如：被測的喇叭、聽筒等）303輸出；輸出端303的輸出口固定在隔聲擋板上，隔音擋板作為模擬的設(shè)備安裝用的墻體以保證測試結(jié)果更準確性，而正對輸出口方向，設(shè)有傳聲器（如：麥克MIC等）304,傳聲器304內(nèi)設(shè)的中央處理器CPU采集輸出信號，可以將音頻信號轉(zhuǎn)換為電信號；傳聲器304將電信號經(jīng)過一放大裝置305 (如信號放大器）傳給測量裝置測量后由頻譜儀306輸出結(jié)果，其中，測量裝置對采樣的輸出信號進行相應(yīng)技術(shù)參數(shù)評測包括：
[0003] 頻響測試：調(diào)節(jié)音頻信號源的頻率在200-4000HZ范圍，記錄在MIC端的CPU采樣值（輸出端的音頻響應(yīng)信號），由此得到音頻信號源調(diào)節(jié)到的每個頻點的聲壓（如：聲音強弱、聲音能量）有效值，從而計算（如：傅里葉變換、電頻表測算等）得到輸出端（如：喇叭）的頻響；
[0004] 失真測試：調(diào)節(jié)音頻信號源的頻率至要測試的頻率，記錄MIC端CPU的采樣值，通過頻譜轉(zhuǎn)換（如：傅里葉轉(zhuǎn)換）得到該采樣值信號的頻譜圖，再通過該頻譜圖計算出喇叭在該信號所對應(yīng)的信號源輸入信號頻率下的失真值；
[0005] 振幅特性測試：在同一頻率下改變音頻信號源的輸出幅度，記錄MIC端CPU的采樣值，通過頻譜轉(zhuǎn)換（如：傅里葉變換）得到該采樣值信號的頻譜，觀察在不同幅度信號輸入下的輸出值是否與輸入值相對應(yīng)，比如，是否符合線性關(guān)系，例：輸入提高l〇db，輸出是否也提聞l〇db。
[0006] 進而，僅基于上述參數(shù)間接判別其輸出信號的還原度，比如：失真越小，頻響越平 (即：盡可能輸入輸出之間的變化是趨近于穩(wěn)定、線性的），則判斷輸出的聲音越好，等等。其中，還原度，是指信號源輸入的原幀頻譜的形狀與輸出端的采樣幀頻譜形狀的一致性，其是音頻測量中評測設(shè)備和系統(tǒng)整體性能尤其是輸出性能的一個重要技術(shù)參數(shù)。而由于現(xiàn)有技術(shù)缺少對輸出端的輸出信號還原度進行直接測試和判斷，導(dǎo)致對設(shè)備和系統(tǒng)性能尤其輸出性能的測評并不精確。并且，現(xiàn)有的測試方式中還存在以下缺陷：不能對所有關(guān)心的連續(xù) 頻率都測試從而導(dǎo)致的測試結(jié)果不精確；實際設(shè)備和系統(tǒng)應(yīng)用時，實際存在的語音信號都是多頻點信號（如：人發(fā)聲為N個頻點/頻率的各種疊加），而現(xiàn)有的失真測試是使用單頻點（即單純的200Hz、400Hz等）進行，與實際的多頻點的失真情況并不一致，導(dǎo)致利用該測試的失真來判別還原度也不準確。因而，最終導(dǎo)致現(xiàn)有的音頻信號的檢測結(jié)果并不準確或者說精確度不高，與實際的主觀評測差距較大。。

【發(fā)明內(nèi)容】

[0007] 基于現(xiàn)有技術(shù)中存在的上述缺陷，本申請的主要目的是提供一種音頻信號還原度檢測方法及系統(tǒng)，以提高音頻信號還原度測試的準確度、精確度。進一步，提高了對設(shè)備、系統(tǒng)等的音頻信號性能測試整體的精確度。為了解決上述現(xiàn)有技術(shù)中的技術(shù)缺陷，本申請的目的是通過以下技術(shù)方案來實現(xiàn)的。
[0008] 本申請?zhí)峁┝艘环N音頻信號還原度測試方法，包括：聲源部分、被測系統(tǒng)、音頻信號采集裝置、音頻信號分析裝置；聲源部分產(chǎn)生標準的真人語音信號，將所述真人語音信號作為輸入語音信號，從聲源部分輸入到所述被測系統(tǒng)；輸入語音信號在被測系統(tǒng)中傳遞，并作為輸出語音信號從被測系統(tǒng)的輸出端輸出；音頻信號采集裝置采集輸出端輸出的連續(xù)的語音信號，并且，將采集的輸出語音信號傳送到音頻信號分析裝置；音頻信號分析裝置對輸出語音信號的信號流進行切片和分析處理，確定還原度。
[0009] 其中，所述音頻信號采集裝置，包括：將采集的連續(xù)語音信號轉(zhuǎn)換成相應(yīng)的數(shù)字信號流，傳送給音頻信號分析裝置進行信號流的切片和分析處理。
[0010] 其中，音頻信號分析裝置，包括：獲取聲源部分產(chǎn)生的作為輸入語音信號的所述真人語音信號；將所述輸入語音信號的信號流，以時間間隔進行切片劃分，以將信號流劃分成相同時間間隔的片段，每段語音信號組中包含有一個或多個語音信號，對每段語音信號組進行頻譜轉(zhuǎn)換，獲得每段語音信號組轉(zhuǎn)換后對應(yīng)的聲音特征值。
[0011] 其中，音頻信號分析裝置，包括：對來自音頻信號采集裝置采集的輸出語音信號的信號流，與該輸出語音信號的信號流相對應(yīng)的來自聲源部分的所述輸入語音信號的信號流進行同步；以與切片所述輸入語音信號的信號流相同的時間間隔，對采集的連續(xù)的語音信號的信號流切片劃分成相同時間間隔的片段，每段語音信號組中包含有一個或多個語音信號，對每段語音信號組進行頻譜轉(zhuǎn)換，獲得每段語音信號組轉(zhuǎn)換后對應(yīng)的聲音特征值。
[0012] 其中，音頻信號分析裝置，包括：提取屬于所述輸入語音信號的信號流中的一語音信號組的片段所對應(yīng)的聲音特征值，以及提取與該片段相應(yīng)的、屬于所述輸出語音信號的信號流中的一片段所對應(yīng)的聲音特征值，基于相似性原理，計算和分析兩個相應(yīng)片段的對比分數(shù)值；將所有相應(yīng)的、分屬于輸入語音信號的信號流和相應(yīng)的輸出語音信號的信號流中的語音信號組的片段的對比分數(shù)值，進行統(tǒng)計和/或平均計算，以確定還原度。
[0013] 本申請還提供了一種音頻信號還原度檢測方法，包括：聲源部分產(chǎn)生標準的真人語音信號，將所述真人語音信號作為輸入語音信號，從聲源部分輸入到所述被測系統(tǒng)；輸入語音信號在被測系統(tǒng)中傳遞，并作為輸出語音信號從被測系統(tǒng)的輸出端輸出；采集輸出端輸出的連續(xù)的語音信號；將采集的輸出語音信號的信號流進行切片和分析處理，確定還原度。
[0014] 其中，還包括：預(yù)先獲取聲源部分產(chǎn)生的作為輸入語音信號的所述真人語音信號；將所述輸入語音信號的信號流，以時間間隔進行切片劃分，以將信號流劃分成相同時間間隔的片段，每段語音信號組中包含有一個或多個語音信號，對每段語音信號組進行頻譜轉(zhuǎn) 換，獲得每段語音信號組轉(zhuǎn)換后對應(yīng)的聲音特征值。
[0015] 其中，將采集的輸出語音信號的信號流進行切片和分析處理，包括：對來自音頻信號采集裝置采集的輸出語音信號的信號流，與該輸出語音信號的信號流相對應(yīng)的來自聲源部分的所述輸入語音信號的信號流進行同步；以與切片所述輸入語音信號的信號流相同的時間間隔，對采集的連續(xù)的語音信號的信號流切片劃分成相同時間間隔的片段，每段語音信號組中包含有一個或多個語音信號，對每段語音信號組進行頻譜轉(zhuǎn)換，獲得每段語音信號組轉(zhuǎn)換后對應(yīng)的聲音特征值。
[0016] 其中，將采集的輸出語音信號的信號流進行切片和分析處理，確定還原度，包括：提取屬于所述輸入語音信號的信號流中的一語音信號組的片段所對應(yīng)的聲音特征值，以及提取與該片段相應(yīng)的、屬于所述輸出語音信號的信號流中的一片段所對應(yīng)的聲音特征值，基于相似性原理，計算和分析兩個相應(yīng)片段的對比分數(shù)值；將所有相應(yīng)的、分屬于輸入語音信號的信號流和相應(yīng)的輸出語音信號的信號流中的語音信號組的片段的對比分數(shù)值，進行統(tǒng)計和/或平均計算，以確定還原度。
[0017] 其中，還包括：對輸入語音信號的信號流和輸出語音信號的信號流以相同的時間間隔進行切片，是以20ms時間間隔將信號流切片包含一個或多個語音信號的語音信號組的片段。
[0018] 本申請使用真人說話聲音與采集或采樣信號進行比較分析，符合設(shè)備及其所在系統(tǒng)（例如：樓宇對講系統(tǒng)）在實際應(yīng)用中的情況，而由此能得到與實際應(yīng)用比較一致的測試結(jié)果；而對連續(xù)發(fā)出的音頻信號的切片以連續(xù)的幀方式進行處理，包括了對所有關(guān)心的連續(xù)頻率（例如：從在300Hz?3400Hz范圍的真人說話語音中的全部頻率）的測試、以及包括了直接基于連續(xù)的切片（幀）判斷音頻輸出性能的還原度，其對安全通信設(shè)備及系統(tǒng)的音頻測試結(jié)果、音頻輸出性能的判別更準確、更精確。

【專利附圖】

【附圖說明】
[0019] 此處所說明的附圖用來提供對本申請的進一步理解，構(gòu)成本申請的一部分，本申請的示意性實施例及其說明用于解釋本申請，并不構(gòu)成對本申請的不當限定。在附圖中：
[0020] 圖1為本申請的音頻信號還原度檢測系統(tǒng)的一實施例的結(jié)構(gòu)框圖；
[0021] 圖2為本申請的音頻信號還原度檢測方法的一實施例的流程圖；
[0022] 圖3為現(xiàn)有的音頻傳輸質(zhì)量測試中對輸出端的幾個測評參數(shù)進行測量的一實施例的示意圖。

【具體實施方式】
[0023] 本申請的主要思想在于，檢測中，聲源采用真人語音作為輸入語音信號，使得在檢測中傳輸?shù)恼Z音其音頻性能更符合被測設(shè)備或系統(tǒng)的實際應(yīng)用情況，從而對被檢測系統(tǒng)的聲音輸出特征（比如樓宇對講系統(tǒng)這類對安全性能有要求的通信設(shè)備和通信系統(tǒng)）進行檢測或測試所獲得的更準確、精確的測試結(jié)果；進一步，將連續(xù)音頻信號進行切片連續(xù)處理，與真人輸入語音信號進行相似性比較，得到還原度的分數(shù)，從而更精確、準確地確定被檢測系統(tǒng)的聲音輸出性能。
[0024] 為使本申請的目的、技術(shù)方案和優(yōu)點更加清楚，下面將結(jié)合本申請具體實施例及相應(yīng)的附圖對本申請技術(shù)方案進行清楚、完整地描述。顯然，所描述的實施例僅是本申請一部分實施例，而不是全部的實施例?；诒旧暾堉械膶嵤├?，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本申請保護的范圍。
[0025] 參見圖1所示本申請的音頻信號還原度檢測系統(tǒng)的一實施例的結(jié)構(gòu)示意圖。該實施例中，以對樓宇對講系統(tǒng)的音頻傳輸特性進行采樣測試為例，基于采樣信號的頻譜分析以及聲源信號進行還原度分析，確定該被測系統(tǒng)的聲音輸出性能。該實施例的檢測系統(tǒng)1〇〇中，主要可以包括：聲源部分110、被測系統(tǒng)120、音頻信號采集裝置（采集器）130、音頻信號分析裝置140。
[0026] 聲源部分110,產(chǎn)生特定語音信號，此特定語音信號可以為標準的人說話的聲音，例如：國際電信聯(lián)盟遠程通信標準化組織P. 501真人語音信號。該真人語音信號作為被檢測系統(tǒng)120的音頻傳輸特性的測試用傳輸語音。該語音信號可以經(jīng)由聲源部分110作為輸入語音信號（例如：信號源301)，輸入到被測系統(tǒng)120的輸入端，在被測系統(tǒng)120中傳輸，最后作為被測輸出語音信號由被測系統(tǒng)120的輸出端（例如：喇叭、聽筒等303)輸出。
[0027] 被測系統(tǒng)120,在本實施例中，可以是樓宇對講系統(tǒng)，接收來自聲源部分110的輸入語音信號，經(jīng)過功放裝置、被測通路、功放裝置，傳輸該輸入語音信號直到被測系統(tǒng)的輸出端，由該輸出端將經(jīng)過被測系統(tǒng)120的該輸入的語音信號作為被測輸出語音信號而輸出。其中，被測通路，可以是被測系統(tǒng)（如被測的樓宇對講系統(tǒng)）中需要檢測的通話通路。
[0028] 音頻信號采集裝置130,采集被測系統(tǒng)120輸出的語音信號，把采集到的語音信號進行轉(zhuǎn)換后傳送到音頻信號分析裝置140進行處理分析。如在輸出端設(shè)置傳聲器（例：麥克 MIC304)。
[0029] 音頻信號采集裝置130可以包括MIC、功放、音頻信號采集儀、等等。
[0030] 例如：由MIC接收被測系統(tǒng)120的輸出端喇叭播放的經(jīng)過該被測系統(tǒng)120傳輸過來的語音信號，具體地，這些從輸入端進入的連續(xù)語音信號經(jīng)過被測系統(tǒng)120后，通過輸出端作為輸出的連續(xù)語音信號被MIC所接收；連續(xù)的語音信號，通過功放，傳遞到音頻信號采集儀，由音頻信號采集儀將這些連續(xù)的語音信號采集到的并傳送給音頻信號分析裝置140。
[0031] 進一步，例如：由MIC接收被測系統(tǒng)120的輸出端喇叭播放的經(jīng)過該被測系統(tǒng)120 傳輸過來的語音信號，可以由MIC將輸出的語音信號轉(zhuǎn)換成電信號，再由MIC中的CPU等處理器進行A/D轉(zhuǎn)換等處理，形成數(shù)字信號，再將對應(yīng)語音信號的數(shù)字信號傳送到音頻信號分析裝置140進行數(shù)字信號的處理和分析。由于聲源部分110的輸入語音是連續(xù)的，通過被測系統(tǒng)120輸出的語音信號也是連續(xù)的，因而，這些由音頻信號采集裝置130采集到的連續(xù)的語音信號所對應(yīng)的連續(xù)的數(shù)字信號可以傳送到音頻信號分析裝置140
[0032] 音頻信號分析裝置140,接收到從音頻信號采集器130傳送來的連續(xù)語音信號，或者說，連續(xù)語音信號所轉(zhuǎn)換成的相應(yīng)的連續(xù)數(shù)字信號，并進行處理和分析，進而，可以確定語音信號的還原度。
[0033] 具體地，音頻信號分析裝置140可以包括內(nèi)置的處理器（如CPU等）或者具有分析處理性能的PC機等等。當接收到連續(xù)語音信號時，通過CPU對連續(xù)的語音信號做轉(zhuǎn)換形成連續(xù)的數(shù)字信號或者說語音的數(shù)字信號流；當接收到已經(jīng)轉(zhuǎn)換成的連續(xù)數(shù)字信號時，該連續(xù)數(shù)字信號即為語音的數(shù)字信號流。這里，將連續(xù)語音信號對應(yīng)的數(shù)字信號流稱為語音信號的信號流。
[0034] 進一步，對語音信號的信號流進行切片，如：將信號流劃分成N"片"或者說N"幀"(N 為大于等于〇的正整數(shù)），再基于這些切片或幀，對采集到的所有測試所關(guān)心的所有連續(xù)信號進行處理和分析。在一個實施例中，可以基于哈斯效應(yīng)的原理，考慮人耳在20毫秒（ms) 的時間段中不會分辨出信號電平頻率的先后，選擇以時間間隔對信號流切片，每個切片/ 幀的時間為20ms。進而，對每個切片/幀進行頻譜轉(zhuǎn)換，用轉(zhuǎn)換后的切片/幀的頻譜與原始聲源部分110輸入端的語音信號的信號流對應(yīng)的切片的頻譜（即輸入信號流的相應(yīng)幀頻譜）進行比較分析，以獲得還原度測試/檢測結(jié)果。
[0035] 下面將結(jié)合圖2所示本申請的音頻信號還原度檢測方法一實施例的流程圖，對本申請的音頻信號還原度檢測系統(tǒng)及其方法進行更具體的描述。
[0036] 在步驟210,聲源部分110產(chǎn)生特定語音信號，該語音信號可以是標準的人說話的聲音，如：國際電信聯(lián)盟遠程通信標準化組織P. 501真人語音信號。該語音信號作為被測系統(tǒng)120的音頻傳輸特性的測試用傳輸語音信號。該語音信號可以經(jīng)由聲源部分110作為輸入語音信號，輸入到被測系統(tǒng)120的輸入端，在被測系統(tǒng)120中傳輸，最后作為被測輸出語音信號由被測系統(tǒng)120的輸出端輸出。真人語音信號包含所有的交條失真，采用其作為輸入信號，更符合被測系統(tǒng)的使用環(huán)境，其測試更準確客觀。被測系統(tǒng)120,例如：樓宇對講系統(tǒng)。本步驟的具體實施可以參見對系統(tǒng)中關(guān)于聲源部分110及其被測系統(tǒng)120的描述。
[0037] 在步驟220,真人語音信號通過被測系統(tǒng)120輸出的連續(xù)語音信號被音頻信號采集裝置130進行采集，并發(fā)給音頻信號分析裝置130分析。本步驟的具體實施可以參見對系統(tǒng)中關(guān)于音頻信號采集裝置130的描述。
[0038] 在步驟230,音頻信號分析裝置140對采集的音頻信號（語音信號）進行切片，然后進行頻譜轉(zhuǎn)換，與聲源部分110產(chǎn)生的特定語音信號進行比較分析，得到還原度測試結(jié) 果。本步驟的具體實施可以參見對系統(tǒng)中關(guān)于音頻信號分析裝置140的描述。
[0039] 下面將在一個實施方式中，對音頻信號的切片處理做進一步描述。
[0040] 首先，可以由該音頻信號分析裝置140的處理器（CPU)預(yù)先將標準語音信號的數(shù) 字信號，即輸入端的聲源部分110產(chǎn)生的輸入的連續(xù)語音信號對應(yīng)的數(shù)字信號流，進行切片，每段20ms ( 8卩"幀"），信號流切片成N端語音信號組（即N幀信號）。其中，每段語音信號組（N幀信號）中包含一個或多個語音信號（或稱信號參數(shù)），N幀信號例如：Pl，P2， P3….PN，存儲這些切片后的幀，而每幀如P1，由20ms時間段內(nèi)數(shù)字信號組成。進而，把每幀信號（即該信號流）轉(zhuǎn)換成對應(yīng)的頻譜，并存儲。其中每幀經(jīng)轉(zhuǎn)換后有相應(yīng)的聲音特征值。
[0041] 然后，當該音頻信號分析裝置140接收到采集的信號流時，即接收到傳送來的從測試的輸出端所采集的、對應(yīng)該輸入的連續(xù)語音信號的信號流時，與該輸入信號流進行同步后，同樣，以每段20ms的方式切片成N段語音信號組，即N幀。其中，每幀信號即每段語音信號組中包含一個或多個語音信號（或稱為信號參數(shù)），N幀信號例如：pl，p2, p3….pN 存儲這些切片后的幀，而每幀如pl，也由20ms時間段內(nèi)數(shù)字信號組成。進而，把每幀信號都轉(zhuǎn)換成對應(yīng)的頻譜，并保存。其中每幀經(jīng)轉(zhuǎn)換后有相應(yīng)的聲音特征值。
[0042] 其中，語音信號（如：語音信號的數(shù)字信號流），可以通過傅里葉變換或者其他聲音信號處理實現(xiàn)頻譜轉(zhuǎn)換，同時得到各切片的聲音特征值。基于前述對應(yīng)輸入語音信號的經(jīng)過被測系統(tǒng)120傳輸后的輸出語音信號、與作為輸入語音信號的標準語音信號一樣，在二者同步后，進行同樣的切片和頻譜轉(zhuǎn)換，得到每段信號組或者說每幀信號的聲音特征值。
[0043] 接著，提取這些聲音特征值，即P1，P2，P3···. PN中每幀對應(yīng)的聲音特征值以及pl， p2, p3….pN中每幀對應(yīng)的聲音特征值，基于諸如相似性原理/相似度計算等方式，對每個對應(yīng)的幀即P1對應(yīng)的聲音特征值和Pi對應(yīng)的聲音特征值進行相似度計算或相似性原理分析，確定還原度。如：P1特征值與Pi特征值之間的相似度計算，得到相似度值0?1(0相似或100%相似），為了更清晰的確定分析結(jié)果，可以對該值的范圍同乘以倍數(shù)如100,采用百分制，即0?100分，從而每幀都能得到一個對比分析的分數(shù)。
[0044] 例如：P1的特征值A(chǔ)、B、C、D與pi的特征值a、b、c'、d之間做--匹配的相似性對比，得出C不同于c'，只有3個相似，為3/4*100 = 75分。
[0045] 又例如：P1的特征值為一維數(shù)組[A、B、C、D]，pl的特征值為一維數(shù)組[a、b、c、d]，排列都是一維數(shù)組，并且，A?D、a?d編號都為從小到大，則按相似性原理分析該排列趨勢、動向相似/相同，因而，P1與Pi的頻譜對比分數(shù)為（1/2+1/2)*100 = 100分。
[0046] 最后，根據(jù)每巾貞的分數(shù)，確定所有巾貞的分數(shù)，從而確定還原度，即輸出聲音對輸入聲音的還原程度（與輸入的相似程度）。例如：統(tǒng)計所有幀的分數(shù)并獲得該輸出語音信號的平均得分，該平均得分就是該被測系統(tǒng)120的還原度得分。進一步，在信號流中還可能存在間隙幀，而由于間隙幀不包含語音信息，為了減少干擾，可以把間隙幀的分數(shù)刪除，而只考慮屬于有效語音信號的幀的分數(shù)，然后統(tǒng)計有效的幀的分數(shù)得到該輸出信號的平均得分，該平均得分就是該被測系統(tǒng)120的還原度得分。
[0047] 利用本申請的方案，通過在檢測過程中檢測用的聲源信號采用真人語音，以保證被測系統(tǒng)在檢測過程中處于實際工作環(huán)境，并且，由于信號是真人語音，其失真包含所有交調(diào)失真；進而，通過對信號的切片處理，包括了對連續(xù)頻率的測試，符合真人語音的信號狀況，更能充分顯現(xiàn)被測系統(tǒng)的聲音輸出特性，因此，直接對還原度的連續(xù)信號切片檢測方式，能獲得更準確、更精確的被測系統(tǒng)、設(shè)備的檢測結(jié)果。
[0048] 需要說明的是，術(shù)語"包括"、"包含"或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、方法、商品或者設(shè)備不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為這種過程、方法、商品或者設(shè)備所固有的要素。在沒有更多限制的情況下，由語句"包括一個……"限定的要素，并不排除在包括所述要素的過程、方法、商品或者設(shè)備中還存在另外的相同要素。
[〇〇49] 以上所述僅為本申請的實施例而已，并不用于限制本申請。對于本領(lǐng)域技術(shù)人員來說，本申請可以有各種更改和變化。凡在本申請的精神和原理之內(nèi)所作的任何修改、等同替換、改進等，均應(yīng)包含在本申請的權(quán)利要求范圍之內(nèi)。
【權(quán)利要求】
1. 一種音頻信號還原度檢測系統(tǒng)，至少包括：聲源部分、被測系統(tǒng)、音頻信號采集裝置、音頻信號分析裝置；聲源部分產(chǎn)生標準的真人語音信號，將所述真人語音信號作為輸入語音信號，從聲源部分輸入到所述被測系統(tǒng)；輸入語音信號在被測系統(tǒng)中傳遞，并作為輸出語音信號從被測系統(tǒng)的輸出端輸出；音頻信號采集裝置采集輸出端輸出的連續(xù)的語音信號，并且，將采集的輸出語音信號傳送到音頻信號分析裝置；音頻信號分析裝置對輸出語音信號的信號流進行切片和分析處理，確定還原度。
2. 如權(quán)利要求1所述的系統(tǒng)，其特征在于，所述音頻信號采集裝置，包括：將采集的連續(xù)語音信號轉(zhuǎn)換成相應(yīng)的數(shù)字信號流，傳送給音頻信號分析裝置進行信號流的切片和分析處理。
3. 如權(quán)利要求1或2所述的系統(tǒng)，其特征在于，音頻信號分析裝置，包括：獲取聲源部分產(chǎn)生的作為輸入語音信號的所述真人語音信號；將所述輸入語音信號的信號流，以時間間隔進行切片劃分，以將信號流劃分成相同時間間隔的片段，每段語音信號組中包含有一個或多個語音信號，對每段語音信號組進行頻譜轉(zhuǎn)換，獲得每段語音信號組轉(zhuǎn)換后對應(yīng)的聲音特征值。
4. 如權(quán)利要求3所述的系統(tǒng)，其特征在于，音頻信號分析裝置，包括：對來自音頻信號采集裝置采集的輸出語音信號的信號流，與該輸出語音信號的信號流相對應(yīng)的來自聲源部分的所述輸入語音信號的信號流進行同步；以與切片所述輸入語音信號的信號流相同的時間間隔，對采集的連續(xù)的語音信號的信號流切片劃分成相同時間間隔的片段，每段語音信號組中包含有一個或多個語音信號，對每段語音信號組進行頻譜轉(zhuǎn)換，獲得每段語音信號組轉(zhuǎn)換后對應(yīng)的聲音特征值。
5. 如權(quán)利要求4所述的系統(tǒng)，其特征在于，音頻信號分析裝置，包括：提取屬于所述輸入語音信號的信號流中的一語音信號組的片段所對應(yīng)的聲音特征值，以及提取與該片段相應(yīng)的、屬于所述輸出語音信號的信號流中的一片段所對應(yīng)的聲音特征值，基于相似性原理，計算和分析兩個相應(yīng)片段的對比分數(shù)值；將所有相應(yīng)的、分屬于輸入語音信號的信號流和相應(yīng)的輸出語音信號的信號流中的語音信號組的片段的對比分數(shù)值，進行統(tǒng)計和/或平均計算，以確定還原度。
6. -種音頻信號還原度檢測方法，其特征在于，包括：聲源部分產(chǎn)生標準的真人語音信號，將所述真人語音信號作為輸入語音信號，從聲源部分輸入到所述被測系統(tǒng)；輸入語音信號在被測系統(tǒng)中傳遞，并作為輸出語音信號從被測系統(tǒng)的輸出端輸出；采集輸出端輸出的連續(xù)的語音信號；將采集的輸出語音信號的信號流進行切片和分析處理，確定還原度。
7. 如權(quán)利要求6所述的方法，其特征在于，還包括：預(yù)先獲取聲源部分產(chǎn)生的作為輸入語音信號的所述真人語音信號；將所述輸入語音信號的信號流，以時間間隔進行切片劃分，以將信號流劃分成相同時間間隔的片段，每段語音信號組中包含有一個或多個語音信號，對每段語音信號組進行頻譜轉(zhuǎn)換，獲得每段語音信號組轉(zhuǎn)換后對應(yīng)的聲音特征值。
8. 如權(quán)利要求7所述的方法，其特征在于，將采集的輸出語音信號的信號流進行切片和分析處理，包括：對來自音頻信號采集裝置采集的輸出語音信號的信號流，與該輸出語音信號的信號流相對應(yīng)的來自聲源部分的所述輸入語音信號的信號流進行同步；以與切片所述輸入語音信號的信號流相同的時間間隔，對采集的連續(xù)的語音信號的信號流切片劃分成相同時間間隔的片段，每段語音信號組中包含有一個或多個語音信號，對每段語音信號組進行頻譜轉(zhuǎn)換，獲得每段語音信號組轉(zhuǎn)換后對應(yīng)的聲音特征值。
9. 如權(quán)利要求8所述的方法，其特征在于，將采集的輸出語音信號的信號流進行切片和分析處理，確定還原度，包括：提取屬于所述輸入語音信號的信號流中的一語音信號組的片段所對應(yīng)的聲音特征值，以及提取與該片段相應(yīng)的、屬于所述輸出語音信號的信號流中的一片段所對應(yīng)的聲音特征值，基于相似性原理，計算和分析兩個相應(yīng)片段的對比分數(shù)值；將所有相應(yīng)的、分屬于輸入語音信號的信號流和相應(yīng)的輸出語音信號的信號流中的語音信號組的片段的對比分數(shù)值，進行統(tǒng)計和/或平均計算，以確定還原度。
10. 如權(quán)利要求8所述的方法，其特征在于，還包括：對輸入語音信號的信號流和輸出語音信號的信號流以相同的時間間隔進行切片，是以20ms時間間隔將信號流切片包含一個或多個語音信號的語音信號組的片段。
【文檔編號】G10L19/025GK104050964SQ201410269839
【公開日】2014年9月17日申請日期:2014年6月17日優(yōu)先權(quán)日:2014年6月17日
【發(fā)明者】戎玲, 趙澎, 鮑逸明, 唐德成, 胡融, 史源申請人:公安部第三研究所, 上海精匯電子設(shè)備閔行有限公司

完整全部詳細技術(shù)資料下載