本申請(qǐng)涉及語音處理,尤其涉及一種聲紋處理方法、裝置、設(shè)備、介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、聲紋識(shí)別作為生物特征識(shí)別的主要方式之一,主要通過說話人的聲音進(jìn)行身份認(rèn)證,由于其便捷性和穩(wěn)定性,逐漸在各個(gè)領(lǐng)域被應(yīng)用。例如,語音是說話人之間溝通的有效途徑,更是對(duì)說話人進(jìn)行身份認(rèn)證的有效方式之一,在通話過程中基于聲紋特征對(duì)說話人進(jìn)行身份認(rèn)證,越來越受到關(guān)注和認(rèn)可。
2、如何提高通話過程中基于聲紋特征的身份認(rèn)證準(zhǔn)確性,成為研究的熱點(diǎn)問題。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例的目的提供一種聲紋處理方法、裝置、設(shè)備、介質(zhì)及程序產(chǎn)品,用于提高通話過程中基于聲紋特征的身份認(rèn)證準(zhǔn)確性。
2、為了實(shí)現(xiàn)上述目的,本申請(qǐng)實(shí)施例采用下述技術(shù)方案:
3、第一方面,本申請(qǐng)實(shí)施例提供一種聲紋處理方法,包括:
4、提取說話人的第一通話語音的第一聲紋特征;
5、在聲紋庫中查詢所述說話人的第二聲紋特征;
6、基于所述第一聲紋特征與所述第二聲紋特征之間的第一相似度,所述第一聲紋特征的信息源、所述第二聲紋特征的信息源,對(duì)所述第一聲紋特征和所述第二聲紋特征進(jìn)行融合,得到所述說話人的第三聲紋特征。
7、第二方面,本申請(qǐng)實(shí)施例提供一種聲紋處理裝置,包括:
8、獲取模塊,用于提取說話人的第一通話語音的第一聲紋特征;
9、查詢模塊,用于在聲紋庫中查詢所述說話人的第二聲紋特征;
10、更新模塊,用于基于所述第一聲紋特征與所述第二聲紋特征之間的第一相似度,所述第一聲紋特征的信息源、所述第二聲紋特征的信息源,對(duì)所述第一聲紋特征和所述第二聲紋特征進(jìn)行融合,得到所述說話人的第三聲紋特征。
11、第三方面,本申請(qǐng)實(shí)施例提供一種電子設(shè)備,包括:
12、處理器;
13、用于存儲(chǔ)所述處理器可執(zhí)行指令的存儲(chǔ)器;
14、其中,所述處理器被配置為執(zhí)行所述指令,以實(shí)現(xiàn)如第一方面提供的聲紋處理方法。
15、第四方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由電子設(shè)備的處理器執(zhí)行時(shí),使得電子設(shè)備能夠執(zhí)行如第一方面提供的聲紋處理方法。
16、第五方面,本申請(qǐng)實(shí)施例提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括存儲(chǔ)了計(jì)算機(jī)程序的非瞬時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)程序可操作來使計(jì)算機(jī)執(zhí)行如第一方面提供的聲紋處理方法中的部分或全部步驟。
17、本申請(qǐng)實(shí)施例采用的上述至少一個(gè)技術(shù)方案能夠達(dá)到以下有益效果:
18、提取說話人的第一通話語音的第一聲紋特征,并從聲紋庫中查詢說話人的第二聲紋特征;說話人的第二聲紋特征與第一聲紋特征之間的相似度,可以反映出第一聲紋特征與第二聲紋特征是否為同一人,在此基礎(chǔ)上,基于第一聲紋特征的信息源、第二聲紋特征的信息源,對(duì)第一聲紋特征和第二聲紋特征進(jìn)行融合,得到說話人的第三聲紋特征,不僅使得第三聲紋特征的信息源包含第一聲紋特征的信息源,克服身份認(rèn)證過程中的跨信息源比對(duì)問題,還可以有效消除聲紋變化對(duì)身份認(rèn)證準(zhǔn)確率的影響,從而提高身份認(rèn)證準(zhǔn)確率。此外,上述方法可用于實(shí)現(xiàn)通話過程中對(duì)第二聲紋特征的實(shí)時(shí)、自動(dòng)更新,無需說話人重復(fù)注冊(cè),減少資源消耗。
1.一種聲紋處理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提取說話人的第一通話語音的第一聲紋特征,包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述第二聲紋特征與所述第一聲紋特征之間的第一相似度,所述第一聲紋特征的信息源、所述第二聲紋特征的信息源,對(duì)所述第一聲紋特征和所述第二聲紋特征進(jìn)行融合,得到所述說話人的第三聲紋特征,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述第一相似度、所述第一聲紋特征的信息源以及所述第二聲紋特征的信息源,確定是否更新所述第二聲紋特征,包括:
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述第一相似度、所述第一聲紋特征的信息源以及所述第二聲紋特征的信息源,確定是否更新所述第二聲紋特征,包括:
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述基于所述第一相似度、所述第一聲紋特征的信息源以及所述第二聲紋特征的信息源,確定是否更新所述第二聲紋特征,包括:
7.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對(duì)所述第一聲紋特征和所述第二聲紋特征進(jìn)行融合,得到所述說話人的第三聲紋特征,包括:
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述基于所述第一聲紋特征,確定所述說話人的第一候選聲紋特征,包括:
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述對(duì)所述第二通話語音的聲紋特征和所述第一聲紋特征進(jìn)行平均,得到所述說話人的第一候選聲紋特征,包括:
10.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述對(duì)所述第二通話語音的聲紋特征和所述第一聲紋特征進(jìn)行平均,得到所述說話人的第一候選聲紋特征,包括:
11.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述第二聲紋特征的數(shù)量為多個(gè);
12.一種聲紋處理裝置,其特征在于,包括:
13.一種電子設(shè)備,其特征在于,包括:
14.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,當(dāng)所述存儲(chǔ)介質(zhì)中的指令由電子設(shè)備的處理器執(zhí)行時(shí),使得電子設(shè)備能夠執(zhí)行如權(quán)利要求1至11中任一項(xiàng)所述的聲紋處理方法。
15.一種計(jì)算機(jī)程序產(chǎn)品,其特征在于,所述計(jì)算機(jī)程序產(chǎn)品包括存儲(chǔ)了計(jì)算機(jī)程序的非瞬時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)程序可操作來使計(jì)算機(jī)執(zhí)行如權(quán)利要求1至11中任一項(xiàng)所述的聲紋處理方法中的部分或全部步驟。