聲紋信息管理方法、裝置以及身份認(rèn)證方法、系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及聲紋識(shí)別技術(shù)領(lǐng)域,尤其涉及一種聲紋信息管理方法、裝置以及身份 認(rèn)證方法、系統(tǒng)。
【背景技術(shù)】
[0002] 聲紋是指用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜。不同人說(shuō)相同的話,其 產(chǎn)生的聲波不同,相應(yīng)的聲波頻譜,即聲紋信息也不同。因此,通過(guò)比對(duì)聲紋信息可以判斷 對(duì)應(yīng)的說(shuō)話人是否相同,即實(shí)現(xiàn)基于聲紋識(shí)別的身份認(rèn)證;該基于聲紋識(shí)別的身份認(rèn)證方 式可以廣泛應(yīng)用于各種賬戶管理系統(tǒng),用于保證賬戶的安全性。
[0003] 相關(guān)技術(shù)中,在利用聲紋識(shí)別技術(shù)實(shí)現(xiàn)身份認(rèn)證前,首先需要用戶讀出預(yù)設(shè)文本 信息,采集此時(shí)用戶的聲音信號(hào),分析得到對(duì)應(yīng)的聲紋信息,作為該用戶的基準(zhǔn)聲紋信息, 存入聲紋庫(kù);在實(shí)現(xiàn)身份認(rèn)證時(shí),同樣要求被認(rèn)證人讀出上述預(yù)設(shè)文本信息,采集被認(rèn)證人 的聲音信號(hào),分析得到對(duì)應(yīng)的聲紋信息,通過(guò)比對(duì)該聲紋信息與聲紋庫(kù)中的基準(zhǔn)聲紋信息, 就可以判斷出被認(rèn)證人是否為用戶本人。
[0004] 以上技術(shù)中,用于身份認(rèn)證的文本信息已在聲紋庫(kù)建立時(shí)被公開,相應(yīng)的,進(jìn)行身 份認(rèn)證時(shí)要求被認(rèn)證人讀出的文本信息也是已知的,如果提前錄制用戶本人讀出該文本信 息時(shí)的聲音文件,則任何人都可以通過(guò)播放該提前錄制的聲音文件使得認(rèn)證成功??梢?jiàn),現(xiàn) 有基于聲紋識(shí)別的身份認(rèn)證方式存在嚴(yán)重的安全隱患。
【發(fā)明內(nèi)容】
[0005] 為克服相關(guān)技術(shù)中存在的問(wèn)題,本申請(qǐng)?zhí)峁┮环N聲紋信息管理方法、裝置以及身 份認(rèn)證方法、系統(tǒng)。
[0006] 本申請(qǐng)第一方面提供一種聲紋信息管理方法,該方法包括如下步驟:
[0007] 獲取第一用戶與第二用戶通話產(chǎn)生的歷史語(yǔ)音文件;
[0008] 對(duì)所述歷史語(yǔ)音文件執(zhí)行過(guò)濾處理,得到所述第一用戶的語(yǔ)音信息;
[0009] 對(duì)所述語(yǔ)音信息執(zhí)行文本識(shí)別處理,得到所述語(yǔ)音信息對(duì)應(yīng)的文本信息;
[0010] 將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息,并存儲(chǔ) 所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符。
[0011] 結(jié)合第一方面,在第一方面第一種可行的實(shí)施方式中,所述聲紋信息管理方法還 包括:
[0012] 將所述文本信息切分為多個(gè)子文本信息,并標(biāo)記每個(gè)子文本信息的起止時(shí)間;
[0013] 根據(jù)子文本信息的起止時(shí)間從所述語(yǔ)音信息中分別截取每個(gè)子文本信息對(duì)應(yīng)的 子語(yǔ)音信息。
[0014] 結(jié)合第一方面第一種可行的實(shí)施方式,在第一方面第二種可行的實(shí)施方式中,將 所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息,包括:
[0015] 將每對(duì)子語(yǔ)音信息和子文本信息分別編輯為所述第一用戶的一條基準(zhǔn)聲紋信息。
[0016] 結(jié)合第一方面,在第一方面第三種可行的實(shí)施方式中,存儲(chǔ)所述基準(zhǔn)聲紋信息和 所述第一用戶的身份標(biāo)識(shí)符,包括:
[0017] 判斷是否存在對(duì)應(yīng)的第二文本信息與待存儲(chǔ)的第一基準(zhǔn)聲紋信息中的第一文本 信息相同,且對(duì)應(yīng)的第二身份標(biāo)識(shí)符與所述第一基準(zhǔn)聲紋信息對(duì)應(yīng)的第一身份標(biāo)識(shí)符也相 同的第二基準(zhǔn)聲紋信息;
[0018] 如果不存在所述第二基準(zhǔn)聲紋信息,則直接存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第 一身份標(biāo)識(shí)符;
[0019] 如果存在所述第二基準(zhǔn)聲紋信息,則比較所述第一基準(zhǔn)聲紋信息中的第一語(yǔ)音信 息和所述第二基準(zhǔn)聲紋信息中的第二語(yǔ)音信息的質(zhì)量,如果所述第一語(yǔ)音信息的質(zhì)量低于 所述第二語(yǔ)音信息,則刪除所述第一基準(zhǔn)聲紋信息;
[0020] 如果所述第一語(yǔ)音信息的質(zhì)量高于所述第二語(yǔ)音信息,則刪除所述第二基準(zhǔn)聲紋 信息,并存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第一身份標(biāo)識(shí)符。
[0021] 本申請(qǐng)第二方面提供一種聲紋信息管理裝置,該裝置包括:
[0022] 語(yǔ)音過(guò)濾器,用于獲取第一用戶與第二用戶通話產(chǎn)生的歷史語(yǔ)音文件,并對(duì)所述 歷史語(yǔ)音文件執(zhí)行過(guò)濾處理,得到所述第一用戶的語(yǔ)音信息;
[0023] 文本識(shí)別器,用于對(duì)所述語(yǔ)音信息執(zhí)行文本識(shí)別處理,得到所述語(yǔ)音信息對(duì)應(yīng)的 文本信息;
[0024] 聲紋生成器,用于將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn) 聲紋信息,并存儲(chǔ)所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符。
[0025] 結(jié)合第二方面,在第二方面第一種可行的實(shí)施方式中,所述聲紋信息管理裝置還 包括:
[0026] 文本切割器,用于將所述文本信息切分為多個(gè)子文本信息,并標(biāo)記每個(gè)子文本信 息的起止時(shí)間;
[0027] 聲紋切割器,用于根據(jù)子文本信息的起止時(shí)間從所述語(yǔ)音信息中分別截取每個(gè)子 文本信息對(duì)應(yīng)的子語(yǔ)音信息。
[0028] 結(jié)合第二方面第一種可行的實(shí)施方式,在第二方面第二種可行的實(shí)施方式中,所 述聲紋生成器將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息,包 括:
[0029] 將每對(duì)子語(yǔ)音信息和子文本信息分別編輯為所述第一用戶的一條基準(zhǔn)聲紋信息。
[0030] 結(jié)合第二方面,在第二方面第三種可行的實(shí)施方式中,所述聲紋生成器存儲(chǔ)所述 基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符,包括:
[0031] 判斷是否存在對(duì)應(yīng)的第二文本信息與待存儲(chǔ)的第一基準(zhǔn)聲紋信息中的第一文本 信息相同,且對(duì)應(yīng)的第二身份標(biāo)識(shí)符與所述第一基準(zhǔn)聲紋信息對(duì)應(yīng)的第一身份標(biāo)識(shí)符也相 同的第二基準(zhǔn)聲紋信息;
[0032] 如果不存在所述第二基準(zhǔn)聲紋信息,則直接存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第 一身份標(biāo)識(shí)符;
[0033] 如果存在所述第二基準(zhǔn)聲紋信息,則比較所述第一基準(zhǔn)聲紋信息中的第一語(yǔ)音信 息和所述第二基準(zhǔn)聲紋信息中的第二語(yǔ)音信息的質(zhì)量,如果所述第一語(yǔ)音信息的質(zhì)量低于 所述第二語(yǔ)音信息,則刪除所述第一基準(zhǔn)聲紋信息;
[0034] 如果所述第一語(yǔ)音信息的質(zhì)量高于所述第二語(yǔ)音信息,則刪除所述第二基準(zhǔn)聲紋 信息,并存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第一身份標(biāo)識(shí)符。
[0035] 本申請(qǐng)第三方面提供一種身份認(rèn)證方法,該方法包括如下步驟:
[0036] 獲取第一用戶與第二用戶通話產(chǎn)生的歷史語(yǔ)音文件;
[0037] 對(duì)所述歷史語(yǔ)音文件執(zhí)行過(guò)濾處理,得到所述第一用戶的語(yǔ)音信息;
[0038] 對(duì)所述語(yǔ)音信息執(zhí)行文本識(shí)別處理,得到所述語(yǔ)音信息對(duì)應(yīng)的文本信息;
[0039] 將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息,并存儲(chǔ) 所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符;
[0040] 獲取待認(rèn)證用戶的身份標(biāo)識(shí)符對(duì)應(yīng)的基準(zhǔn)聲紋信息;
[0041] 輸出獲取到的基準(zhǔn)聲紋信息中的文本信息,并接收對(duì)應(yīng)的待認(rèn)證語(yǔ)音信息;
[0042] 將獲取到的基準(zhǔn)聲紋信息中的語(yǔ)音信息與所述待認(rèn)證語(yǔ)音信息進(jìn)行匹配,如果匹 配成功,則判定待認(rèn)證用戶認(rèn)證成功,如果匹配失敗,則判定待認(rèn)證用戶認(rèn)證失敗。
[0043] 結(jié)合第三方面,在第三方面第一種可行的實(shí)施方式中,所述身份認(rèn)證方法還包 括:
[0044] 將所述文本信息切分為多個(gè)子文本信息,并標(biāo)記每個(gè)子文本信息的起止時(shí)間;
[0045] 根據(jù)子文本信息的起止時(shí)間從所述語(yǔ)音信息中分別截取每個(gè)子文本信息對(duì)應(yīng)的 子語(yǔ)音信息。
[0046] 結(jié)合第三方面第一種可行的實(shí)施方式,在第三方面第二種可行的實(shí)施方式中,將 所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息,包括:
[0047] 將每對(duì)子語(yǔ)音信息和子文本信息分別編輯為所述第一用戶的一條基準(zhǔn)聲紋信息。
[0048] 結(jié)合第三方面,在第三方面第三種可行的實(shí)施方式中,存儲(chǔ)所述基準(zhǔn)聲紋信息和 所述第一用戶的身份標(biāo)識(shí)符,包括:
[0049] 判斷是否存在對(duì)應(yīng)的第二文本信息與待存儲(chǔ)的第一基準(zhǔn)聲紋信息中的第一文本 信息相同,且對(duì)應(yīng)的第二身份標(biāo)識(shí)符與所述第一基準(zhǔn)聲紋信息對(duì)應(yīng)的第一身份標(biāo)識(shí)符也相 同的第二基準(zhǔn)聲紋信息;
[0050] 如果不存在所述第二基準(zhǔn)聲紋信息,則直接存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第 一身份標(biāo)識(shí)符;
[0051] 如果存在所述第二基準(zhǔn)聲紋信息,則比較所述第一基準(zhǔn)聲紋信息中的第一語(yǔ)音信 息和所述第二基準(zhǔn)聲紋信息中的第二語(yǔ)音信息的質(zhì)量,如果所述第一語(yǔ)音信息的質(zhì)量低于 所述第二語(yǔ)音信息,則刪除所述第一基準(zhǔn)聲紋信息;
[0052] 如果所述第一語(yǔ)音信息的質(zhì)量高于所述第二語(yǔ)音信息,則刪除所述第二基準(zhǔn)聲紋 信息,并存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第一身份標(biāo)識(shí)符。
[0053] 本申請(qǐng)第四方面提供一種身份認(rèn)證系統(tǒng);該系統(tǒng)包括:
[0054] 語(yǔ)音過(guò)濾器,用于獲取第一用戶與第二用戶通話產(chǎn)生的歷史語(yǔ)音文件,并對(duì)所述 歷史語(yǔ)音文件執(zhí)行過(guò)濾處理,得到所述第一用戶的語(yǔ)音信息;
[0055] 文本識(shí)別器,用于對(duì)所述語(yǔ)音信息執(zhí)行文本識(shí)別處理,得到所述語(yǔ)音信息對(duì)應(yīng)的 文本信息;
[0056] 聲紋生成器,用于將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn) 聲紋信息,并存儲(chǔ)所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符;
[0057] 聲紋提取器,用于獲取待認(rèn)證用戶的身份標(biāo)識(shí)符對(duì)應(yīng)的基準(zhǔn)聲紋信息;
[0058] 識(shí)別前置器,用于輸出獲取到的基準(zhǔn)聲紋信息中的文本信息,并接收對(duì)應(yīng)的待認(rèn) 證語(yǔ)音信息;
[0059] 聲紋匹配器,用于將獲取到的基準(zhǔn)聲紋信息中的語(yǔ)音信息與所述待認(rèn)證語(yǔ)音信息 進(jìn)行匹配,如果匹配成功,則判定待認(rèn)證用戶認(rèn)證成功,如果匹配失敗,則判定待認(rèn)證用戶 認(rèn)證失敗。
[0060] 結(jié)合第四方面,在第四方面第一種可行的實(shí)施方式中,所述身份認(rèn)證系統(tǒng)還包 括:
[0061] 文本切割器,用于將所述文本信息切分為多個(gè)子文本信息,并標(biāo)記每個(gè)子文本信 息的起止時(shí)間;
[0062] 聲紋切割器,用于根據(jù)子文本信息的起止時(shí)間從所述語(yǔ)音信息中分別截取每個(gè)子 文本信息對(duì)應(yīng)的子語(yǔ)音信息。
[0063] 結(jié)合第四方面第一種可行的實(shí)施方式,在第四方面第二種可行的實(shí)施方式中,所 述聲紋生成器將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息,包 括:
[0064] 將每對(duì)子語(yǔ)音信息和子文本信息分別編輯為所述第一用戶的