本申請(qǐng)涉及語(yǔ)音識(shí)別,尤其涉及一種語(yǔ)音識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著人工智能的發(fā)展,語(yǔ)音識(shí)別模型可以廣泛地應(yīng)用于對(duì)語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別。語(yǔ)音識(shí)別模型例如包括端到端語(yǔ)音識(shí)別(automatic?speech?recognition,asr)模型。相關(guān)技術(shù)中,端到端asr模型一般僅能對(duì)普通話相關(guān)的語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別。然而,在語(yǔ)音信息包括方言、口音、噪音等等復(fù)雜語(yǔ)音的情況下,若通過端到端asr模型對(duì)語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,則容易導(dǎo)致對(duì)語(yǔ)音信息的語(yǔ)音識(shí)別準(zhǔn)確性不佳。例如,對(duì)于金融領(lǐng)域的客戶服務(wù)業(yè)務(wù),客服需要接聽不同客戶的來電,客戶在講話時(shí)例如會(huì)使用方言或者存在口音。在端到端asr模型對(duì)通話相關(guān)的語(yǔ)音信息的識(shí)別準(zhǔn)確性不佳的情況下,則容易導(dǎo)致客服無法理解客戶的問題,從而對(duì)客服向客戶提供的客戶服務(wù)質(zhì)量造成不利影響。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)的主要目的在于提供一種語(yǔ)音識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),旨在解決由于語(yǔ)音信息包括方言、口音、噪音等等復(fù)雜語(yǔ)音,而導(dǎo)致對(duì)語(yǔ)音信息的語(yǔ)音識(shí)別準(zhǔn)確性不佳的技術(shù)問題。
2、第一方面,本申請(qǐng)?zhí)峁┮环N語(yǔ)音識(shí)別方法,包括:
3、獲取待識(shí)別語(yǔ)音信息;
4、基于訓(xùn)練好的語(yǔ)音識(shí)別模型,對(duì)所述待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,得到所述待識(shí)別語(yǔ)音信息對(duì)應(yīng)的預(yù)設(shè)識(shí)別結(jié)果;
5、根據(jù)所述預(yù)設(shè)識(shí)別結(jié)果,確定所述待識(shí)別語(yǔ)音信息的語(yǔ)音類型;
6、當(dāng)根據(jù)所述語(yǔ)音類型確定所述待識(shí)別語(yǔ)音信息符合預(yù)設(shè)重識(shí)別條件時(shí),基于訓(xùn)練好的語(yǔ)音識(shí)別大模型,對(duì)所述待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,得到所述待識(shí)別語(yǔ)音信息對(duì)應(yīng)的目標(biāo)識(shí)別結(jié)果;其中,所述語(yǔ)音識(shí)別大模型的訓(xùn)練數(shù)據(jù)與所述語(yǔ)音識(shí)別模型的訓(xùn)練數(shù)據(jù)不同。
7、第二方面,本申請(qǐng)還提供一種語(yǔ)音識(shí)別裝置,所述語(yǔ)音識(shí)別裝置包括:
8、獲取模塊,用于獲取待識(shí)別語(yǔ)音信息;
9、第一識(shí)別模塊,用于基于訓(xùn)練好的語(yǔ)音識(shí)別模型,對(duì)所述待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,得到所述待識(shí)別語(yǔ)音信息對(duì)應(yīng)的預(yù)設(shè)識(shí)別結(jié)果;
10、確定模塊,用于根據(jù)所述識(shí)別結(jié)果,確定所述待識(shí)別語(yǔ)音信息的語(yǔ)音類型;
11、第二識(shí)別模塊,用于當(dāng)根據(jù)所述語(yǔ)音類型確定所述待識(shí)別語(yǔ)音信息符合預(yù)設(shè)重識(shí)別條件時(shí),基于訓(xùn)練好的語(yǔ)音識(shí)別大模型,對(duì)所述待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,得到所述待識(shí)別語(yǔ)音信息對(duì)應(yīng)的目標(biāo)識(shí)別結(jié)果;其中,所述語(yǔ)音識(shí)別大模型的訓(xùn)練數(shù)據(jù)與所述語(yǔ)音識(shí)別模型的訓(xùn)練數(shù)據(jù)不同。
12、第三方面,本申請(qǐng)還提供一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器;
13、所述存儲(chǔ)器,用于存儲(chǔ)計(jì)算機(jī)程序;
14、所述處理器,用于執(zhí)行所述計(jì)算機(jī)程序并在執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述的語(yǔ)音識(shí)別方法的步驟。
15、第四方面,本申請(qǐng)還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如上述的語(yǔ)音識(shí)別方法的步驟。
16、本申請(qǐng)?zhí)峁┮环N語(yǔ)音識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),方法包括:獲取待識(shí)別語(yǔ)音信息;基于訓(xùn)練好的語(yǔ)音識(shí)別模型,對(duì)待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,得到待識(shí)別語(yǔ)音信息對(duì)應(yīng)的預(yù)設(shè)識(shí)別結(jié)果;根據(jù)預(yù)設(shè)識(shí)別結(jié)果,確定待識(shí)別語(yǔ)音信息的語(yǔ)音類型;當(dāng)根據(jù)語(yǔ)音類型確定待識(shí)別語(yǔ)音信息符合預(yù)設(shè)重識(shí)別條件時(shí),基于訓(xùn)練好的語(yǔ)音識(shí)別大模型,對(duì)待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,得到待識(shí)別語(yǔ)音信息對(duì)應(yīng)的目標(biāo)識(shí)別結(jié)果;其中,語(yǔ)音識(shí)別大模型的訓(xùn)練數(shù)據(jù)與語(yǔ)音識(shí)別模型的訓(xùn)練數(shù)據(jù)不同,以提升對(duì)涉及方言、口音、噪音等復(fù)雜語(yǔ)音情形的語(yǔ)音信息的語(yǔ)音識(shí)別便捷性以及語(yǔ)音識(shí)別準(zhǔn)確性。例如,可以用于金融領(lǐng)域的客戶服務(wù)業(yè)務(wù)。對(duì)于客戶服務(wù)業(yè)務(wù),客服在接收到客戶來電的情況下,計(jì)算機(jī)設(shè)備可以優(yōu)先通過訓(xùn)練好的語(yǔ)音識(shí)別模型對(duì)客服與客戶的電話溝通過程所對(duì)應(yīng)的待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,以減少語(yǔ)音識(shí)別所需的計(jì)算資源。相應(yīng)地,在根據(jù)語(yǔ)音識(shí)別模型輸出的預(yù)設(shè)識(shí)別結(jié)果,確定待識(shí)別語(yǔ)音信息的語(yǔ)音類型符合重識(shí)別條件,如涉及方言、口音、噪音等等的情況下,計(jì)算機(jī)設(shè)備可以進(jìn)一步通過訓(xùn)練好的語(yǔ)音識(shí)別大模型對(duì)待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,得到對(duì)應(yīng)的目標(biāo)識(shí)別結(jié)果,以更準(zhǔn)確地對(duì)客戶通過語(yǔ)音描述的問題進(jìn)行識(shí)別,則客服可以更好地向客戶提供客戶服務(wù)。
1.一種語(yǔ)音識(shí)別方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的語(yǔ)音識(shí)別方法,其特征在于,所述根據(jù)所述語(yǔ)音類型確定所述待識(shí)別語(yǔ)音信息符合預(yù)設(shè)重識(shí)別條件,包括:
3.根據(jù)權(quán)利要求2所述的語(yǔ)音識(shí)別方法,其特征在于,所述根據(jù)所述預(yù)設(shè)識(shí)別結(jié)果,確定所述待識(shí)別語(yǔ)音信息的語(yǔ)音類型,包括:
4.根據(jù)權(quán)利要求2所述的語(yǔ)音識(shí)別方法,其特征在于,所述根據(jù)所述預(yù)設(shè)識(shí)別結(jié)果,確定所述待識(shí)別語(yǔ)音信息的語(yǔ)音類型,包括:
5.根據(jù)權(quán)利要求2所述的語(yǔ)音識(shí)別方法,其特征在于,所述根據(jù)所述預(yù)設(shè)識(shí)別結(jié)果,確定所述待識(shí)別語(yǔ)音信息的語(yǔ)音類型,包括:
6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的語(yǔ)音識(shí)別方法,其特征在于,在所述基于訓(xùn)練好的語(yǔ)音識(shí)別大模型,對(duì)所述待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,得到所述待識(shí)別語(yǔ)音信息對(duì)應(yīng)的目標(biāo)識(shí)別結(jié)果之前,還包括:
7.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的語(yǔ)音識(shí)別方法,其特征在于,在所述基于訓(xùn)練好的語(yǔ)音識(shí)別模型,對(duì)所述待識(shí)別語(yǔ)音信息進(jìn)行語(yǔ)音識(shí)別,得到所述待識(shí)別語(yǔ)音信息對(duì)應(yīng)的預(yù)設(shè)識(shí)別結(jié)果之前,還包括:
8.一種語(yǔ)音識(shí)別裝置,其特征在于,所述語(yǔ)音識(shí)別裝置包括:
9.一種計(jì)算機(jī)設(shè)備,其特征在于,所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器;
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的語(yǔ)音識(shí)別方法的步驟。