聲紋信息管理方法、裝置以及身份認(rèn)證方法、系統(tǒng)的制作方法

文檔序號(hào)：9811910閱讀：1929來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

聲紋信息管理方法、裝置以及身份認(rèn)證方法、系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本申請(qǐng)涉及聲紋識(shí)別技術(shù)領(lǐng)域，尤其涉及一種聲紋信息管理方法、裝置以及身份認(rèn)證方法、系統(tǒng)。
【背景技術(shù)】
[0002] 聲紋是指用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜。不同人說(shuō)相同的話，其產(chǎn)生的聲波不同，相應(yīng)的聲波頻譜，即聲紋信息也不同。因此，通過(guò)比對(duì)聲紋信息可以判斷對(duì)應(yīng)的說(shuō)話人是否相同，即實(shí)現(xiàn)基于聲紋識(shí)別的身份認(rèn)證；該基于聲紋識(shí)別的身份認(rèn)證方式可以廣泛應(yīng)用于各種賬戶管理系統(tǒng)，用于保證賬戶的安全性。
[0003] 相關(guān)技術(shù)中，在利用聲紋識(shí)別技術(shù)實(shí)現(xiàn)身份認(rèn)證前，首先需要用戶讀出預(yù)設(shè)文本信息，采集此時(shí)用戶的聲音信號(hào)，分析得到對(duì)應(yīng)的聲紋信息，作為該用戶的基準(zhǔn)聲紋信息，存入聲紋庫(kù)；在實(shí)現(xiàn)身份認(rèn)證時(shí)，同樣要求被認(rèn)證人讀出上述預(yù)設(shè)文本信息，采集被認(rèn)證人的聲音信號(hào)，分析得到對(duì)應(yīng)的聲紋信息，通過(guò)比對(duì)該聲紋信息與聲紋庫(kù)中的基準(zhǔn)聲紋信息，就可以判斷出被認(rèn)證人是否為用戶本人。
[0004] 以上技術(shù)中，用于身份認(rèn)證的文本信息已在聲紋庫(kù)建立時(shí)被公開，相應(yīng)的，進(jìn)行身份認(rèn)證時(shí)要求被認(rèn)證人讀出的文本信息也是已知的，如果提前錄制用戶本人讀出該文本信息時(shí)的聲音文件，則任何人都可以通過(guò)播放該提前錄制的聲音文件使得認(rèn)證成功?？梢?jiàn)，現(xiàn) 有基于聲紋識(shí)別的身份認(rèn)證方式存在嚴(yán)重的安全隱患。

【發(fā)明內(nèi)容】

[0005] 為克服相關(guān)技術(shù)中存在的問(wèn)題，本申請(qǐng)?zhí)峁┮环N聲紋信息管理方法、裝置以及身份認(rèn)證方法、系統(tǒng)。
[0006] 本申請(qǐng)第一方面提供一種聲紋信息管理方法，該方法包括如下步驟：
[0007] 獲取第一用戶與第二用戶通話產(chǎn)生的歷史語(yǔ)音文件；
[0008] 對(duì)所述歷史語(yǔ)音文件執(zhí)行過(guò)濾處理，得到所述第一用戶的語(yǔ)音信息；
[0009] 對(duì)所述語(yǔ)音信息執(zhí)行文本識(shí)別處理，得到所述語(yǔ)音信息對(duì)應(yīng)的文本信息；
[0010] 將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息，并存儲(chǔ) 所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符。
[0011] 結(jié)合第一方面，在第一方面第一種可行的實(shí)施方式中，所述聲紋信息管理方法還包括：
[0012] 將所述文本信息切分為多個(gè)子文本信息，并標(biāo)記每個(gè)子文本信息的起止時(shí)間；
[0013] 根據(jù)子文本信息的起止時(shí)間從所述語(yǔ)音信息中分別截取每個(gè)子文本信息對(duì)應(yīng)的子語(yǔ)音信息。
[0014] 結(jié)合第一方面第一種可行的實(shí)施方式，在第一方面第二種可行的實(shí)施方式中，將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息，包括：
[0015] 將每對(duì)子語(yǔ)音信息和子文本信息分別編輯為所述第一用戶的一條基準(zhǔn)聲紋信息。
[0016] 結(jié)合第一方面，在第一方面第三種可行的實(shí)施方式中，存儲(chǔ)所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符，包括：
[0017] 判斷是否存在對(duì)應(yīng)的第二文本信息與待存儲(chǔ)的第一基準(zhǔn)聲紋信息中的第一文本信息相同，且對(duì)應(yīng)的第二身份標(biāo)識(shí)符與所述第一基準(zhǔn)聲紋信息對(duì)應(yīng)的第一身份標(biāo)識(shí)符也相同的第二基準(zhǔn)聲紋信息；
[0018] 如果不存在所述第二基準(zhǔn)聲紋信息，則直接存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第一身份標(biāo)識(shí)符；
[0019] 如果存在所述第二基準(zhǔn)聲紋信息，則比較所述第一基準(zhǔn)聲紋信息中的第一語(yǔ)音信息和所述第二基準(zhǔn)聲紋信息中的第二語(yǔ)音信息的質(zhì)量，如果所述第一語(yǔ)音信息的質(zhì)量低于所述第二語(yǔ)音信息，則刪除所述第一基準(zhǔn)聲紋信息；
[0020] 如果所述第一語(yǔ)音信息的質(zhì)量高于所述第二語(yǔ)音信息，則刪除所述第二基準(zhǔn)聲紋信息，并存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第一身份標(biāo)識(shí)符。
[0021] 本申請(qǐng)第二方面提供一種聲紋信息管理裝置，該裝置包括：
[0022] 語(yǔ)音過(guò)濾器，用于獲取第一用戶與第二用戶通話產(chǎn)生的歷史語(yǔ)音文件，并對(duì)所述歷史語(yǔ)音文件執(zhí)行過(guò)濾處理，得到所述第一用戶的語(yǔ)音信息；
[0023] 文本識(shí)別器，用于對(duì)所述語(yǔ)音信息執(zhí)行文本識(shí)別處理，得到所述語(yǔ)音信息對(duì)應(yīng)的文本信息；
[0024] 聲紋生成器，用于將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn) 聲紋信息，并存儲(chǔ)所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符。
[0025] 結(jié)合第二方面，在第二方面第一種可行的實(shí)施方式中，所述聲紋信息管理裝置還包括：
[0026] 文本切割器，用于將所述文本信息切分為多個(gè)子文本信息，并標(biāo)記每個(gè)子文本信息的起止時(shí)間；
[0027] 聲紋切割器，用于根據(jù)子文本信息的起止時(shí)間從所述語(yǔ)音信息中分別截取每個(gè)子文本信息對(duì)應(yīng)的子語(yǔ)音信息。
[0028] 結(jié)合第二方面第一種可行的實(shí)施方式，在第二方面第二種可行的實(shí)施方式中，所述聲紋生成器將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息，包括：
[0029] 將每對(duì)子語(yǔ)音信息和子文本信息分別編輯為所述第一用戶的一條基準(zhǔn)聲紋信息。
[0030] 結(jié)合第二方面，在第二方面第三種可行的實(shí)施方式中，所述聲紋生成器存儲(chǔ)所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符，包括：
[0031] 判斷是否存在對(duì)應(yīng)的第二文本信息與待存儲(chǔ)的第一基準(zhǔn)聲紋信息中的第一文本信息相同，且對(duì)應(yīng)的第二身份標(biāo)識(shí)符與所述第一基準(zhǔn)聲紋信息對(duì)應(yīng)的第一身份標(biāo)識(shí)符也相同的第二基準(zhǔn)聲紋信息；
[0032] 如果不存在所述第二基準(zhǔn)聲紋信息，則直接存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第一身份標(biāo)識(shí)符；
[0033] 如果存在所述第二基準(zhǔn)聲紋信息，則比較所述第一基準(zhǔn)聲紋信息中的第一語(yǔ)音信息和所述第二基準(zhǔn)聲紋信息中的第二語(yǔ)音信息的質(zhì)量，如果所述第一語(yǔ)音信息的質(zhì)量低于所述第二語(yǔ)音信息，則刪除所述第一基準(zhǔn)聲紋信息；
[0034] 如果所述第一語(yǔ)音信息的質(zhì)量高于所述第二語(yǔ)音信息，則刪除所述第二基準(zhǔn)聲紋信息，并存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第一身份標(biāo)識(shí)符。
[0035] 本申請(qǐng)第三方面提供一種身份認(rèn)證方法，該方法包括如下步驟：
[0036] 獲取第一用戶與第二用戶通話產(chǎn)生的歷史語(yǔ)音文件；
[0037] 對(duì)所述歷史語(yǔ)音文件執(zhí)行過(guò)濾處理，得到所述第一用戶的語(yǔ)音信息；
[0038] 對(duì)所述語(yǔ)音信息執(zhí)行文本識(shí)別處理，得到所述語(yǔ)音信息對(duì)應(yīng)的文本信息；
[0039] 將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息，并存儲(chǔ) 所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符；
[0040] 獲取待認(rèn)證用戶的身份標(biāo)識(shí)符對(duì)應(yīng)的基準(zhǔn)聲紋信息；
[0041] 輸出獲取到的基準(zhǔn)聲紋信息中的文本信息，并接收對(duì)應(yīng)的待認(rèn)證語(yǔ)音信息；
[0042] 將獲取到的基準(zhǔn)聲紋信息中的語(yǔ)音信息與所述待認(rèn)證語(yǔ)音信息進(jìn)行匹配，如果匹配成功，則判定待認(rèn)證用戶認(rèn)證成功，如果匹配失敗，則判定待認(rèn)證用戶認(rèn)證失敗。
[0043] 結(jié)合第三方面，在第三方面第一種可行的實(shí)施方式中，所述身份認(rèn)證方法還包括：
[0044] 將所述文本信息切分為多個(gè)子文本信息，并標(biāo)記每個(gè)子文本信息的起止時(shí)間；
[0045] 根據(jù)子文本信息的起止時(shí)間從所述語(yǔ)音信息中分別截取每個(gè)子文本信息對(duì)應(yīng)的子語(yǔ)音信息。
[0046] 結(jié)合第三方面第一種可行的實(shí)施方式，在第三方面第二種可行的實(shí)施方式中，將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息，包括：
[0047] 將每對(duì)子語(yǔ)音信息和子文本信息分別編輯為所述第一用戶的一條基準(zhǔn)聲紋信息。
[0048] 結(jié)合第三方面，在第三方面第三種可行的實(shí)施方式中，存儲(chǔ)所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符，包括：
[0049] 判斷是否存在對(duì)應(yīng)的第二文本信息與待存儲(chǔ)的第一基準(zhǔn)聲紋信息中的第一文本信息相同，且對(duì)應(yīng)的第二身份標(biāo)識(shí)符與所述第一基準(zhǔn)聲紋信息對(duì)應(yīng)的第一身份標(biāo)識(shí)符也相同的第二基準(zhǔn)聲紋信息；
[0050] 如果不存在所述第二基準(zhǔn)聲紋信息，則直接存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第一身份標(biāo)識(shí)符；
[0051] 如果存在所述第二基準(zhǔn)聲紋信息，則比較所述第一基準(zhǔn)聲紋信息中的第一語(yǔ)音信息和所述第二基準(zhǔn)聲紋信息中的第二語(yǔ)音信息的質(zhì)量，如果所述第一語(yǔ)音信息的質(zhì)量低于所述第二語(yǔ)音信息，則刪除所述第一基準(zhǔn)聲紋信息；
[0052] 如果所述第一語(yǔ)音信息的質(zhì)量高于所述第二語(yǔ)音信息，則刪除所述第二基準(zhǔn)聲紋信息，并存儲(chǔ)所述第一基準(zhǔn)聲紋信息和所述第一身份標(biāo)識(shí)符。
[0053] 本申請(qǐng)第四方面提供一種身份認(rèn)證系統(tǒng)；該系統(tǒng)包括：
[0054] 語(yǔ)音過(guò)濾器，用于獲取第一用戶與第二用戶通話產(chǎn)生的歷史語(yǔ)音文件，并對(duì)所述歷史語(yǔ)音文件執(zhí)行過(guò)濾處理，得到所述第一用戶的語(yǔ)音信息；
[0055] 文本識(shí)別器，用于對(duì)所述語(yǔ)音信息執(zhí)行文本識(shí)別處理，得到所述語(yǔ)音信息對(duì)應(yīng)的文本信息；
[0056] 聲紋生成器，用于將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn) 聲紋信息，并存儲(chǔ)所述基準(zhǔn)聲紋信息和所述第一用戶的身份標(biāo)識(shí)符；
[0057] 聲紋提取器，用于獲取待認(rèn)證用戶的身份標(biāo)識(shí)符對(duì)應(yīng)的基準(zhǔn)聲紋信息；
[0058] 識(shí)別前置器，用于輸出獲取到的基準(zhǔn)聲紋信息中的文本信息，并接收對(duì)應(yīng)的待認(rèn) 證語(yǔ)音信息；
[0059] 聲紋匹配器，用于將獲取到的基準(zhǔn)聲紋信息中的語(yǔ)音信息與所述待認(rèn)證語(yǔ)音信息進(jìn)行匹配，如果匹配成功，則判定待認(rèn)證用戶認(rèn)證成功，如果匹配失敗，則判定待認(rèn)證用戶認(rèn)證失敗。
[0060] 結(jié)合第四方面，在第四方面第一種可行的實(shí)施方式中，所述身份認(rèn)證系統(tǒng)還包括：
[0061] 文本切割器，用于將所述文本信息切分為多個(gè)子文本信息，并標(biāo)記每個(gè)子文本信息的起止時(shí)間；
[0062] 聲紋切割器，用于根據(jù)子文本信息的起止時(shí)間從所述語(yǔ)音信息中分別截取每個(gè)子文本信息對(duì)應(yīng)的子語(yǔ)音信息。
[0063] 結(jié)合第四方面第一種可行的實(shí)施方式，在第四方面第二種可行的實(shí)施方式中，所述聲紋生成器將所述語(yǔ)音信息和對(duì)應(yīng)的文本信息編輯為所述第一用戶的基準(zhǔn)聲紋信息，包括：
[0064] 將每對(duì)子語(yǔ)音信息和子文本信息分別編輯為所述第一用戶的

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3 4 5