一種聲音處理的方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及聲音信號(hào)降噪技術(shù)領(lǐng)域,尤其涉及一種聲音處理的方法和裝置。
【背景技術(shù)】
[0002]當(dāng)前的智能互動(dòng)類電子學(xué)習(xí)設(shè)備、如點(diǎn)讀機(jī),一般都設(shè)置有麥克風(fēng)(MIC),以便于與用戶之間形成互動(dòng)學(xué)習(xí)模式。該麥克風(fēng)(MIC)通常設(shè)置于設(shè)備的外殼并在與用戶距離相對(duì)較近時(shí),可以正常收錄用戶的應(yīng)答語(yǔ)音,且其自身具備一定的降噪功能,用以提高語(yǔ)音評(píng)測(cè)和識(shí)別的精度,排除噪聲干擾。不過(guò)現(xiàn)實(shí)情況是,這類產(chǎn)品在嘈雜的環(huán)境下、如大賣場(chǎng)或大型超市,依然容易誤判,明明無(wú)人應(yīng)答,也照樣能夠評(píng)測(cè)出高分。這類情況的發(fā)生,不可避免會(huì)大大降低用戶的體驗(yàn)感和信賴感。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的在于提出一種聲音處理的方法和裝置,能夠在準(zhǔn)確的時(shí)機(jī)自動(dòng)地對(duì)收錄的聲音信號(hào)進(jìn)行識(shí)別提取,不僅減少了識(shí)別的工作量,同時(shí)也提升了聲音識(shí)別的準(zhǔn)確性。
[0004]為達(dá)此目的,本發(fā)明采用以下技術(shù)方案:
[0005]第一方面,提供一種聲音處理的方法,包括:
[0006]通過(guò)距離檢測(cè),判斷聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)是否存在聲源端;
[0007]若存在,則利用語(yǔ)音端點(diǎn)檢測(cè)方法對(duì)收錄的聲音信號(hào)進(jìn)行聲音起始點(diǎn)和聲音結(jié)束點(diǎn)的自動(dòng)識(shí)別;
[0008]根據(jù)所述自動(dòng)識(shí)別的結(jié)果,提取出正式聲音信號(hào)。
[0009]其中,所述通過(guò)距離檢測(cè),包括:利用紅外線和/或超聲波進(jìn)行距離檢測(cè)。
[0010]其中,所述判斷聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)是否存在聲源端,包括:[0011 ]當(dāng)所述聲源端與聲音信號(hào)采集端前方的距離值處于預(yù)設(shè)距離范圍內(nèi),則判斷存在聲源端;
[0012]當(dāng)所述聲源端與聲音信號(hào)采集端前方的距離值處于預(yù)設(shè)距離范圍外,則判斷不存在聲源端。
[0013]其中,所述根據(jù)所述自動(dòng)識(shí)別的結(jié)果,提取出正式聲音信號(hào),包括:
[0014]若自動(dòng)識(shí)別到聲音起始點(diǎn)和聲音結(jié)束點(diǎn),則將聲音起始點(diǎn)和聲音結(jié)束點(diǎn)之間的聲音信號(hào)確定為正式聲音信號(hào);
[0015]或;
[0016]若沒(méi)有自動(dòng)識(shí)別到聲音起始點(diǎn)和聲音結(jié)束點(diǎn),則將該段時(shí)間內(nèi)收錄的聲音信號(hào)確定為第一聲音信號(hào);
[0017]在自動(dòng)識(shí)別到聲音起始點(diǎn)和聲音結(jié)束點(diǎn)后,則將聲音起始點(diǎn)和聲音結(jié)束點(diǎn)之間的聲音信號(hào)確定為第二聲音信號(hào);
[0018]利用第一聲音信號(hào)對(duì)第二聲音信號(hào)進(jìn)行降噪處理,以提取出正式聲音信號(hào);
[0019]或;
[0020]若自動(dòng)識(shí)別到聲音起始點(diǎn)、并沒(méi)有自動(dòng)識(shí)別到聲音結(jié)束點(diǎn)、且檢測(cè)到聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)不再存在聲源端,則停止錄音、并把停止錄音時(shí)對(duì)應(yīng)的聲音點(diǎn)標(biāo)記為聲音結(jié)束點(diǎn);
[0021]將聲音起始點(diǎn)和聲音結(jié)束點(diǎn)之間的聲音信號(hào)確定為正式聲音信號(hào)。
[0022]其中,所述聲音處理的方法,進(jìn)一步包括:
[0023]若通過(guò)距離檢測(cè),確定聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)不再存在聲源端,則取消對(duì)收錄的聲音信號(hào)進(jìn)行聲音起始點(diǎn)和聲音結(jié)束點(diǎn)的自動(dòng)識(shí)別,將此時(shí)收錄的聲音信號(hào)作為第一聲音信號(hào);
[0024]當(dāng)通過(guò)距離檢測(cè),再次確定聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)存在聲源端時(shí),則利用語(yǔ)音端點(diǎn)檢測(cè)方法對(duì)收錄的聲音信號(hào)進(jìn)行聲音起始點(diǎn)和聲音結(jié)束點(diǎn)的自動(dòng)識(shí)別;
[0025]在自動(dòng)識(shí)別到聲音起始點(diǎn)和聲音結(jié)束點(diǎn)后,將聲音起始點(diǎn)和聲音結(jié)束點(diǎn)之間的聲音信號(hào)確定為第二聲音信號(hào);
[0026]利用第一聲音信號(hào)對(duì)第二聲音信號(hào)進(jìn)行降噪處理,以提取出正式聲音信號(hào)。
[0027]其中,所述根據(jù)所述自動(dòng)識(shí)別的結(jié)果,提取出正式聲音信號(hào),包括:
[0028]當(dāng)播放預(yù)設(shè)指引信息時(shí),若檢測(cè)到聲音信號(hào)采集端前方與聲源端之間的距離值縮短,則開啟話筒收錄聲音信號(hào)或開始對(duì)收錄的聲音信號(hào)進(jìn)行語(yǔ)音端點(diǎn)檢測(cè);
[0029]利用語(yǔ)音端點(diǎn)檢測(cè)方法對(duì)收錄的聲音信號(hào)進(jìn)行聲音起始點(diǎn)和聲音結(jié)束點(diǎn)的自動(dòng)識(shí)別,以提取出正式聲音信號(hào)。
[0030]第二方面,提供一種聲音處理的裝置,包括:
[0031]聲源檢測(cè)單元,用于通過(guò)距離檢測(cè),判斷聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)是否存在聲源端;
[0032]自動(dòng)識(shí)別單元,用于若存在,則利用語(yǔ)音端點(diǎn)檢測(cè)方法對(duì)收錄的聲音信號(hào)進(jìn)行聲音起始點(diǎn)和聲音結(jié)束點(diǎn)的自動(dòng)識(shí)別;
[0033]提取聲音單元,用于根據(jù)所述自動(dòng)識(shí)別的結(jié)果,提取出正式聲音信號(hào)。
[0034]其中,所述通過(guò)距離檢測(cè),包括:利用紅外線和/或超聲波進(jìn)行距離檢測(cè)。
[0035]其中,所述判斷聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)是否存在聲源端,包括:
[0036]當(dāng)所述聲源端與聲音信號(hào)采集端前方的距離值處于預(yù)設(shè)距離范圍內(nèi),則判斷存在聲源端;
[0037]當(dāng)所述聲源端與聲音信號(hào)采集端前方的距離值處于預(yù)設(shè)距離范圍外,則判斷不存在聲源端。
[0038]其中,所述提取聲音單元,具體用于:
[0039]若自動(dòng)識(shí)別到聲音起始點(diǎn)和聲音結(jié)束點(diǎn),則將聲音起始點(diǎn)和聲音結(jié)束點(diǎn)之間的聲音信號(hào)確定為正式聲音信號(hào);
[0040]或;
[0041 ] 若沒(méi)有自動(dòng)識(shí)別到聲音起始點(diǎn)和聲音結(jié)束點(diǎn),則將該段時(shí)間內(nèi)收錄的聲音信號(hào)確定為第一聲音信號(hào);
[0042]在自動(dòng)識(shí)別到聲音起始點(diǎn)和聲音結(jié)束點(diǎn)后,則將聲音起始點(diǎn)和聲音結(jié)束點(diǎn)之間的聲音信號(hào)確定為第二聲音信號(hào);
[0043]利用第一聲音信號(hào)對(duì)第二聲音信號(hào)進(jìn)行降噪處理,以提取出正式聲音信號(hào);
[0044]或;
[0045]若自動(dòng)識(shí)別到聲音起始點(diǎn)、并沒(méi)有自動(dòng)識(shí)別到聲音結(jié)束點(diǎn)、且檢測(cè)到聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)不再存在聲源端,則停止錄音、并把停止錄音時(shí)對(duì)應(yīng)的聲音點(diǎn)標(biāo)記為聲音結(jié)束點(diǎn);
[0046]將聲音起始點(diǎn)和聲音結(jié)束點(diǎn)之間的聲音信號(hào)確定為正式聲音信號(hào)。
[0047]其中,所述聲音處理的裝置還包括第二提取聲音單元,所述第二提取聲音單元,用于:
[0048]若通過(guò)距離檢測(cè),確定聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)不再存在聲源端,則取消對(duì)收錄的聲音信號(hào)進(jìn)行聲音起始點(diǎn)和聲音結(jié)束點(diǎn)的自動(dòng)識(shí)別,將此時(shí)收錄的聲音信號(hào)作為第一聲音信號(hào);
[0049]當(dāng)通過(guò)距離檢測(cè),再次確定聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)存在聲源端時(shí),則利用語(yǔ)音端點(diǎn)檢測(cè)方法對(duì)收錄的聲音信號(hào)進(jìn)行聲音起始點(diǎn)和聲音結(jié)束點(diǎn)的自動(dòng)識(shí)別;
[0050]在自動(dòng)識(shí)別到聲音起始點(diǎn)和聲音結(jié)束點(diǎn)后,將聲音起始點(diǎn)和聲音結(jié)束點(diǎn)之間的聲音信號(hào)確定為第二聲音信號(hào);
[0051]利用第一聲音信號(hào)對(duì)第二聲音信號(hào)進(jìn)行降噪處理,以提取出正式聲音信號(hào)。
[0052]其中,所述提取聲音單元,還用于:
[0053]當(dāng)播放預(yù)設(shè)指引信息時(shí),若檢測(cè)到聲音信號(hào)采集端前方與聲源端之間的距離值縮短,則開啟話筒收錄聲音信號(hào)或開始對(duì)收錄的聲音信號(hào)進(jìn)行語(yǔ)音端點(diǎn)檢測(cè);
[0054]利用語(yǔ)音端點(diǎn)檢測(cè)方法對(duì)收錄的聲音信號(hào)進(jìn)行聲音起始點(diǎn)和聲音結(jié)束點(diǎn)的自動(dòng)識(shí)別,以提取出正式聲音信號(hào)。
[0055]本發(fā)明的有益效果在于:一種聲音處理的方法和裝置,包括:聲源檢測(cè)單元、自動(dòng)識(shí)別單元和提取聲音單元,所述聲源檢測(cè)單元,用于通過(guò)距離檢測(cè),判斷聲音信號(hào)采集端前方的預(yù)設(shè)距離范圍內(nèi)是否存在聲源端;所述自動(dòng)識(shí)別單元,用于若存在,則利用語(yǔ)音端點(diǎn)檢測(cè)方法對(duì)收錄的聲音信號(hào)進(jìn)行聲音起始點(diǎn)和聲音結(jié)束點(diǎn)的自動(dòng)識(shí)別;所述提取聲音單元,用于根據(jù)所述自動(dòng)識(shí)別的結(jié)果,提取出正式聲音信號(hào)。該聲音處理的方法和裝置,通過(guò)對(duì)聲音信號(hào)采集端前方與發(fā)出聲源的用戶之間的距離值進(jìn)行檢測(cè),判斷啟動(dòng)對(duì)收錄的聲音信號(hào)進(jìn)行自動(dòng)識(shí)別和提取的時(shí)機(jī),能夠在準(zhǔn)確的時(shí)機(jī)自動(dòng)地對(duì)收錄的聲音信號(hào)進(jìn)行識(shí)別提取,不僅減少了識(shí)別的工作量,同時(shí)也提升了聲音識(shí)別