認(rèn)證方法及裝置與流程

文檔序號(hào)：12128357閱讀：282來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本發(fā)明涉及通信及電子設(shè)備技術(shù)領(lǐng)域，具體來說，涉及一種認(rèn)證方法及認(rèn)證裝置。

背景技術(shù)：

隨著可穿戴智能設(shè)備的普及，用戶使用可穿戴設(shè)備的場(chǎng)景也越來越多元化，因此用戶使用可穿戴設(shè)備所產(chǎn)生的數(shù)據(jù)也在逐漸增加。為防止數(shù)據(jù)泄漏、保證可穿戴設(shè)備所產(chǎn)生的數(shù)據(jù)只允許設(shè)備所有者或授權(quán)使用方訪問，就需要對(duì)這些數(shù)據(jù)在傳輸、存儲(chǔ)等各個(gè)環(huán)節(jié)的安全性提供保護(hù)。

現(xiàn)有技術(shù)中，廣泛使用藍(lán)牙技術(shù)來實(shí)現(xiàn)可穿戴智能設(shè)備和移動(dòng)設(shè)備(如智能手機(jī))之間的通信。藍(lán)牙技術(shù)采用基于共享密鑰的身份驗(yàn)證，就是當(dāng)?shù)谝辉O(shè)備能證明自己擁有和第二設(shè)備相同的密鑰時(shí)，第二設(shè)備就認(rèn)為第一設(shè)備是可信賴的。早期藍(lán)牙版本要求用戶在待配對(duì)的兩臺(tái)設(shè)備上輸入相同的字符串(PIN Code)，用以生成鑒權(quán)使用的鏈路字(Link Key)。為提升安全級(jí)別及簡(jiǎn)化用戶交互，藍(lán)牙2.1版本提出安全簡(jiǎn)易配對(duì)(Secure Simple Pairing)，并提供幾種配對(duì)模式，其中包括:即刻連接(Just Works)模式和通關(guān)字輸入(Passkey Entry)模式。

即刻連接式可以使位于傳輸范圍內(nèi)的兩臺(tái)設(shè)備直接配對(duì)而不需要額外的用戶輸入，但該模式不提供對(duì)中間人(Man In The Middle)襲擊的防護(hù)功能。而通關(guān)字輸入模式則要求用戶將第一設(shè)備上顯示的字符串在第二設(shè)備上輸入以驗(yàn)證第一設(shè)備是否是可信賴的，該模式提供鑒權(quán)功能和對(duì)中間人襲擊的防護(hù)功能。

首先，基于美觀、易用性等方面因素，目前市面上的許多可穿戴智能設(shè)備不帶有可供鍵入的輸入模塊，因而普遍采用的是即刻連接(Just Works)模式。這就使傳輸中的數(shù)據(jù)面臨被未授權(quán)方截取、竊聽、和盜用的風(fēng)險(xiǎn)。

其次，藍(lán)牙協(xié)議提供的認(rèn)證和加密(包括即刻連接模式和通關(guān)字輸入模式等)的只保證兩臺(tái)設(shè)備間的認(rèn)證(如第一設(shè)備有權(quán)利訪問第二設(shè)備)，而并不能夠保證對(duì)第一設(shè)備使用者身份的認(rèn)證。因此，在安全性要求較高的使用場(chǎng)景下，需要由上層協(xié)議及其交互實(shí)現(xiàn)對(duì)使用者身份的確認(rèn)。具體地，目前可穿戴智能設(shè)備大多是通過智能手機(jī)操作系統(tǒng)或手機(jī)應(yīng)用軟件的驗(yàn)證機(jī)制來完成對(duì)使用者身份的確認(rèn)過程，例如用戶若能獲得第一設(shè)備的使用權(quán)，登錄第二設(shè)備對(duì)應(yīng)的手機(jī)端應(yīng)用軟件就能夠建立或解除與第二設(shè)備之間的通信連接，從而可以讀取第二設(shè)備中的數(shù)據(jù)、使用第二設(shè)備提供的功能等。

但是，上述對(duì)使用者身份的確認(rèn)過程只有智能手機(jī)操作系統(tǒng)和手機(jī)應(yīng)用軟件的驗(yàn)證機(jī)制而沒有用戶認(rèn)證機(jī)制。因此，在智能手機(jī)操作系統(tǒng)沒有設(shè)置驗(yàn)證密碼時(shí)、或在手機(jī)應(yīng)用軟件處于免登錄期間內(nèi)時(shí)，這會(huì)導(dǎo)致可穿戴智能設(shè)備可能被未授權(quán)方訪問或控制。例如：假設(shè)可穿戴智能設(shè)備被允許同一時(shí)間與多臺(tái)設(shè)備建立連接，且用戶使用該可穿戴智能設(shè)備產(chǎn)生了一定量的數(shù)據(jù)，未授權(quán)方可以通過靠近可穿戴智能設(shè)備與其建立連接，從而導(dǎo)致了可穿戴智能設(shè)備對(duì)用戶不可用、甚至可穿戴智能設(shè)備中的數(shù)據(jù)被盜取。又例如：假設(shè)可穿戴智能設(shè)備同一時(shí)間僅被允許與一臺(tái)設(shè)備建立連接，未授權(quán)方可以在智能手機(jī)的免登錄期間獲取到智能手機(jī)，而解除其與可穿戴智能設(shè)備已建立的連接、或?qū)⒃摽纱┐髦悄茉O(shè)備連接至另一臺(tái)智能手機(jī)，從而讀取或盜取該可穿戴智能設(shè)備中的數(shù)據(jù)。

針對(duì)相關(guān)技術(shù)中的上述問題，目前尚未提出有效的解決方案。

技術(shù)實(shí)現(xiàn)要素：

針對(duì)相關(guān)技術(shù)中上述的問題，本發(fā)明提出一種認(rèn)證方法及認(rèn)證裝置，能夠提高不便設(shè)置輸入模塊的設(shè)備在數(shù)據(jù)傳輸過程中的安全性，避免在數(shù)據(jù)傳輸過程中數(shù)據(jù)被未授權(quán)方竊聽。

本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的：

根據(jù)本發(fā)明的一個(gè)方面，提供了一種認(rèn)證方法，包括：在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后，生成文本認(rèn)證信息并向用戶顯示文本認(rèn)證信息；

接收用戶回應(yīng)的語音信息，并對(duì)語音信息進(jìn)行語音識(shí)別或?qū)φZ音信息進(jìn)行語音驗(yàn)證；以及

根據(jù)語音識(shí)別的結(jié)果或語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，文本認(rèn)證信息為包括多個(gè)數(shù)字字符的數(shù)字序列文本。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，根據(jù)語音識(shí)別的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證，包括：當(dāng)語音識(shí)別的結(jié)果與數(shù)字序列文本相符合的情況下，確定發(fā)起設(shè)備通過認(rèn)證。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，對(duì)語音信息進(jìn)行語音驗(yàn)證包括：根據(jù)語音信息提取聲音特征。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，根據(jù)語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證，包括：在不存在已存儲(chǔ)的聲音特征的情況下，確定發(fā)起設(shè)備通過認(rèn)證并存儲(chǔ)聲音特征。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，根據(jù)語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證，包括：在存在已存儲(chǔ)的聲音特征的情況下，根據(jù)聲音特征與已存儲(chǔ)的聲音特征確定發(fā)起設(shè)備是否通過認(rèn)證。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，根據(jù)聲音特征與已存儲(chǔ)的聲音特征確定發(fā)起設(shè)備是否通過認(rèn)證，包括：設(shè)置驗(yàn)證概率閾值并獲取與已存儲(chǔ)的聲音特征相應(yīng)的語音模型；計(jì)算驗(yàn)證概率，驗(yàn)證概率表示聲音特征由語音模型生成的概率；以及在驗(yàn)證概率大于驗(yàn)證概率閾值的情況下，聲音特征與已存儲(chǔ)的聲音特征相符合，確定發(fā)起設(shè)備通過認(rèn)證。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，對(duì)語音信息進(jìn)行語音識(shí)別包括：訓(xùn)練聲學(xué)模型并根據(jù)語音信息提取特征矢量；以及通過聲學(xué)模型對(duì)特征矢量進(jìn)行解析以獲取數(shù)字序列文本。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，響應(yīng)設(shè)備包括：智能手環(huán)、智能手表、智能眼鏡、和智能珠寶之中的任意一種；以及發(fā)起設(shè)備包括：智能手機(jī)、平板電腦、和筆記本電腦之中的任意一種。

根據(jù)本發(fā)明的另一方面，提供了一種認(rèn)證裝置，包括：認(rèn)證信息生成模塊，用于在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后，生成文本認(rèn)證信息并向用戶顯示文本認(rèn)證信息；處理模塊，接收用戶回應(yīng)的語音信息，并對(duì)語音信息進(jìn)行語音識(shí)別或?qū)φZ音信息進(jìn)行語音驗(yàn)證；以及連接模塊，用于根據(jù)語音識(shí)別的結(jié)果或語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證。

本發(fā)明在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后，通過語音識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)文本認(rèn)證信息的輸入，提高了響應(yīng)設(shè)備在數(shù)據(jù)傳輸過程中的安全性，避免在數(shù)據(jù)傳輸過程中數(shù)據(jù)被未授權(quán)設(shè)備竊聽；通過語音驗(yàn)證技術(shù)實(shí)現(xiàn)了對(duì)用戶身份的認(rèn)證，避免未授權(quán)用戶訪問響應(yīng)設(shè)備。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對(duì)于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其他的附圖。

圖1是根據(jù)本發(fā)明實(shí)施例的認(rèn)證方法的流程圖；

圖2是根據(jù)本發(fā)明一個(gè)實(shí)施例的認(rèn)證方法進(jìn)行藍(lán)牙配對(duì)的流程示意圖；

圖3是根據(jù)本發(fā)明另一個(gè)實(shí)施例的認(rèn)證方法的建立或解除綁定關(guān)系的流程示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例。根據(jù)本發(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

如圖1所示，根據(jù)本發(fā)明實(shí)施例的認(rèn)證方法，包括以下步驟：

步驟S110，在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后，生成文本認(rèn)證信息并向用戶顯示文本認(rèn)證信息；

步驟S120，接收用戶回應(yīng)的語音信息，并對(duì)語音信息進(jìn)行語音識(shí)別或?qū)φZ音信息進(jìn)行語音驗(yàn)證；以及

步驟S130，根據(jù)語音識(shí)別的結(jié)果或語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證。

通過上述技術(shù)方案，在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后，通過語音識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)文本認(rèn)證信息的輸入，通過語音驗(yàn)證技術(shù)實(shí)現(xiàn)了對(duì)用戶身份的認(rèn)證，提高了響應(yīng)設(shè)備在數(shù)據(jù)傳輸過程中的安全性，避免在數(shù)據(jù)傳輸過程中數(shù)據(jù)被未授權(quán)設(shè)備竊聽

根據(jù)本發(fā)明的一個(gè)實(shí)施例，響應(yīng)設(shè)備可以包括：智能手環(huán)、智能手表、智能眼鏡、和智能珠寶等不具有輸入功能的可穿戴智能設(shè)備之中的任意一種，可穿戴智能設(shè)備是可直接穿戴在身上、或是整合到用戶衣服或配件的一種便攜式智能設(shè)備。響應(yīng)設(shè)備也可以是其它不具有輸入功能的智能設(shè)備。發(fā)起設(shè)備可以包括智能手機(jī)和平板電腦等智能移動(dòng)終端中的一種，發(fā)起設(shè)備也可以包括筆記本電腦、臺(tái)式電腦等。發(fā)起設(shè)備具有顯示功能，可以通過具有顯示功能的發(fā)起設(shè)備來向用戶顯示文本認(rèn)證信息。

優(yōu)選地，文本認(rèn)證信息可以是包括多個(gè)數(shù)字字符的數(shù)字序列文本。其中文本認(rèn)證信息是隨機(jī)生成的?？商娲模谋菊J(rèn)證信息也可以是包括多個(gè)英文字母字符的序列。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，步驟S130可包括：

步驟S131，當(dāng)語音識(shí)別的結(jié)果與數(shù)字序列文本相符合的情況下，確定發(fā)起設(shè)備通過認(rèn)證；

步驟S132，當(dāng)語音識(shí)別的結(jié)果與數(shù)字序列文本不符的情況下，確定發(fā)起設(shè)備未通過認(rèn)證。

參考圖2，是根據(jù)本發(fā)明一個(gè)實(shí)施例的認(rèn)證方法進(jìn)行藍(lán)牙配對(duì)的流程示意圖。為兼顧通信的安全性和使用的方便性，可通過藍(lán)牙配對(duì)實(shí)現(xiàn)兩個(gè)從未通信過的設(shè)備間的首次認(rèn)證，生成鏈路字以便往后進(jìn)行免認(rèn)證連接。具體地，用戶203可在藍(lán)牙配對(duì)的發(fā)起設(shè)備201(例如智能手機(jī))上搜索并選擇待配對(duì)的響應(yīng)設(shè)備202(例如可穿戴智能設(shè)備)，或者也可以由可穿戴智能設(shè)備對(duì)應(yīng)的手機(jī)應(yīng)用軟件代用戶選擇可搜索范圍內(nèi)的合法的響應(yīng)設(shè)備。發(fā)起設(shè)備201向響應(yīng)設(shè)備202發(fā)送包括認(rèn)證請(qǐng)求的藍(lán)牙連接請(qǐng)求，響應(yīng)設(shè)備202接受連接請(qǐng)求。具備顯示功能的發(fā)起設(shè)備201向用戶203展示文本認(rèn)證信息。具體地，在本實(shí)施例中，文本認(rèn)證信息為由6位數(shù)字組成的通關(guān)字(Passkey)。用戶203通過語音信息將通關(guān)字輸入到響應(yīng)設(shè)備202。響應(yīng)設(shè)備202識(shí)別輸入的用戶203的語音信息，并將語音信息轉(zhuǎn)換為6位數(shù)字。當(dāng)6位數(shù)字與通關(guān)字相同時(shí)生成鏈路字并鑒權(quán)，發(fā)起設(shè)備201和響應(yīng)設(shè)備202分別將對(duì)方加入到可信賴列表中。使得發(fā)起設(shè)備201和響應(yīng)設(shè)備202利用相同的通關(guān)字，通過藍(lán)牙標(biāo)準(zhǔn)提供的鑒權(quán)算法實(shí)現(xiàn)配對(duì)，并儲(chǔ)存配對(duì)關(guān)系。實(shí)現(xiàn)了在一臺(tái)具備顯示功能的發(fā)起設(shè)備201及另一臺(tái)響應(yīng)設(shè)備202的藍(lán)牙配對(duì)過程中，利用語音識(shí)別來實(shí)現(xiàn)通關(guān)字的輸入，提升了不具有輸入功能的可穿戴智能設(shè)備在藍(lán)牙傳輸過程中的安全級(jí)別。

需要進(jìn)一步說明的，語音識(shí)別是根據(jù)用戶的語音信息來獲取用戶的說話內(nèi)容。在步驟S120中，可包括以下步驟：

步驟S121，訓(xùn)練聲學(xué)模型并根據(jù)語音信息提取其特征矢量；以及

步驟S122，通過聲學(xué)模型對(duì)特征矢量進(jìn)行解析以獲取數(shù)字序列文本。

用戶需將展示在智能手機(jī)上的通關(guān)字，例如數(shù)字序列(即數(shù)字序列文本)的內(nèi)容為“1 9 7 2 8 4”，通過語音信息輸入到語音識(shí)別模塊。其中，語音模塊可以由具有語音識(shí)別功能的硬件來實(shí)現(xiàn)。語音識(shí)別模塊從采集到的語音信息中提取特征矢量(例如梅爾頻率倒譜系數(shù))，并借助事先訓(xùn)練好的描述聲學(xué)單元特征的聲學(xué)模型(例如隱馬爾科夫鏈)，解析出語音信息中所要傳達(dá)的數(shù)字序列，即通關(guān)字。

具體地，在步驟S121中，由于不同頻率的聲波傳送到人耳將觸發(fā)不同的感知回路；相應(yīng)地，語音識(shí)別的語音信息的處理過程也大多涉及對(duì)頻譜包絡(luò)特征的分析和表示。以梅爾頻率倒譜系數(shù)(MFCC)為例，原始語音信息分別經(jīng)過分幀處理(如使用25ms相互重疊的音框，幀內(nèi)頻譜近似恒定)、傅立葉變換和梅爾刻度下的濾波處理來獲取對(duì)數(shù)能量，并對(duì)梅爾頻率倒譜系數(shù)進(jìn)行計(jì)算分離出低頻的包絡(luò)信息和高頻的細(xì)節(jié)信息，從而最終得到代表每幀語音信息的固定維度的特征向量。

具體地，在步驟S122中，待識(shí)別的數(shù)字序列可由智能手機(jī)隨機(jī)生成，通關(guān)字為數(shù)字序列“1 8 3 7 6 4”和通關(guān)字為數(shù)字序列“7 6 4 3 1 9”的概率相同，因此上下文相關(guān)性較小；另外，由于數(shù)字序列可由智能手機(jī)進(jìn)行顯示、順序隨機(jī)且用戶并未事先識(shí)記，因此連續(xù)性及音節(jié)間協(xié)同發(fā)音不顯著?？紤]到語音識(shí)別任務(wù)針對(duì)的數(shù)字序列、詞表小、上下文相關(guān)性弱、且連續(xù)性及音節(jié)間協(xié)同發(fā)音不顯著等因素，可采用音節(jié)作為聲學(xué)模型的基本單元，以音節(jié)為基本單元來建立聲學(xué)模型能夠避免更細(xì)粒度聲學(xué)單元(例如音素)產(chǎn)生的不穩(wěn)定性，同時(shí)基于上述原因需要訓(xùn)練的聲學(xué)模型的數(shù)量也是可控的。

可選地，采用隱馬爾科夫模型(HMM)這一統(tǒng)計(jì)模型對(duì)音節(jié)內(nèi)各隱性狀態(tài)的轉(zhuǎn)移概率及各隱性狀態(tài)輸出可觀測(cè)結(jié)果(如梅爾頻率倒譜系數(shù))的概率建立聲學(xué)模型；并可利用混合高斯模型(GMM)模擬輸出概率的分布情況。聲學(xué)模型的參數(shù)可以通過在訓(xùn)練數(shù)據(jù)集上迭代執(zhí)行“根據(jù)當(dāng)前參數(shù)估計(jì)概率-根據(jù)估計(jì)更新參數(shù)算法”(Forward-backward Algorithm)來獲得。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，對(duì)語音信息進(jìn)行語音驗(yàn)證包括：根據(jù)語音信息提取聲音特征。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，根據(jù)語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證，可包括以下步驟：在不存在已存儲(chǔ)的聲音特征的情況下，確定發(fā)起設(shè)備通過認(rèn)證并存儲(chǔ)聲音特征；在存在已存儲(chǔ)的聲音特征的情況下，根據(jù)聲音特征與已存儲(chǔ)的聲音特征確定發(fā)起設(shè)備是否通過認(rèn)證。

下面結(jié)合圖3對(duì)上述實(shí)施例進(jìn)行具體說明。如圖3所示是根據(jù)本發(fā)明另一個(gè)實(shí)施例的認(rèn)證方法的建立或解除綁定關(guān)系的流程示意圖。這里以藍(lán)牙配對(duì)成功后需建立綁定關(guān)系以傳輸數(shù)據(jù)來進(jìn)行說明。當(dāng)藍(lán)牙配對(duì)成功后，用戶303通過智能手機(jī)301(即發(fā)起設(shè)備)上的手機(jī)應(yīng)用發(fā)起綁定操作，可穿戴智能設(shè)備302(即響應(yīng)設(shè)備)首先對(duì)發(fā)起藍(lán)牙連接智能手機(jī)301(即發(fā)起設(shè)備)上的手機(jī)應(yīng)用進(jìn)行一次認(rèn)證以建立可信賴的藍(lán)牙連接。該認(rèn)證由智能手機(jī)301上的應(yīng)用向可穿戴智能設(shè)備302發(fā)送根據(jù)可穿戴智能設(shè)備302的設(shè)備標(biāo)識(shí)(例如Modoo01055B)和約定好的密鑰(例如Extant Future)進(jìn)行對(duì)稱加密后的加密數(shù)據(jù)；可穿戴智能設(shè)備302接收到加密數(shù)據(jù)后，通過約定好的密鑰(Extant Future)反向?qū)用軘?shù)據(jù)進(jìn)行解密后與自身的設(shè)備標(biāo)識(shí)進(jìn)行比對(duì)，若比對(duì)結(jié)果一致，則一次認(rèn)證通過；若不一致，則可穿戴智能設(shè)備302主動(dòng)斷開藍(lán)牙連接，建立綁定關(guān)系失敗。進(jìn)一步地，若藍(lán)牙連接成功后2秒內(nèi)，可穿戴智能設(shè)備302未收到來自智能手機(jī)301的應(yīng)用的認(rèn)證請(qǐng)求，同樣將斷開藍(lán)牙連接。上述過程并不涉及用戶交互，對(duì)用戶來說是透明的。

隨后，可穿戴智能設(shè)備302對(duì)發(fā)起綁定操作的用戶303的身份進(jìn)行認(rèn)證。該過程借助智能手機(jī)301的顯示功能，智能手機(jī)301在向穿戴智能設(shè)備302發(fā)送綁定請(qǐng)求的同時(shí)可向用戶顯示文本信息；用戶通過語音信息將顯示在手機(jī)上的文本輸入到穿戴智能設(shè)備302。穿戴智能設(shè)備302接收到綁定請(qǐng)求及用戶303的語音信息后，提取語音信息中用于身份識(shí)別的聲音特征，穿戴智能設(shè)備302判斷當(dāng)前是否有已存儲(chǔ)的聲音特征，若無說明目前仍無用戶綁定，回復(fù)同意建立綁定關(guān)系的認(rèn)證結(jié)果同時(shí)存儲(chǔ)用戶聲音特征；若有已存儲(chǔ)的聲音特征，說明目前已有用戶綁定，判斷請(qǐng)求中的用戶303的聲音特征與已存儲(chǔ)的聲音特征是否相符，若相符則說明聲音來自同一用戶，回復(fù)同意建立綁定關(guān)系的認(rèn)證結(jié)果，否則拒絕建立綁定關(guān)系。

智能手機(jī)301收到穿戴智能設(shè)備302回復(fù)的同意建立綁定關(guān)系的認(rèn)證結(jié)果后，將用戶303與穿戴智能設(shè)備302的信息(例如設(shè)備名稱和藍(lán)牙連接地址等)存儲(chǔ)到本地，并可通過HTTPS協(xié)議上報(bào)云端。

解綁過程與建立綁定關(guān)系時(shí)相同，用戶認(rèn)證過程也同樣借助智能手機(jī)301向用戶303顯示待語音輸入的文本信息。在穿戴智能設(shè)備302收到解綁請(qǐng)求和用戶303的語音信息后，提取聲音特征并與當(dāng)前存儲(chǔ)的聲音特征進(jìn)行比對(duì)，若相符，回復(fù)同意解除綁定的認(rèn)證結(jié)果且同時(shí)刪除該存儲(chǔ)的聲音特征；若不相符，回復(fù)拒絕解除綁定請(qǐng)求的認(rèn)證結(jié)果。智能手機(jī)301收到同意解除綁定的認(rèn)證結(jié)果后，可更新本地及云端存儲(chǔ)的設(shè)備連接關(guān)系。

為保證用戶產(chǎn)生的數(shù)據(jù)只能被用戶自己或授權(quán)方訪問，實(shí)現(xiàn)了在數(shù)據(jù)讀取方(例如智能手機(jī)301)和數(shù)據(jù)收集方(例如穿戴智能設(shè)備302)之間建立連接關(guān)系(綁定關(guān)系)、或解除綁定關(guān)系時(shí)均對(duì)用戶身份進(jìn)行確認(rèn)。在應(yīng)用層利用與手機(jī)應(yīng)用間的交互及語音驗(yàn)證技術(shù)，實(shí)現(xiàn)了對(duì)待連接的智能手機(jī)301上的應(yīng)用與智能手機(jī)301使用方身份的認(rèn)證，能夠避免可穿戴智能設(shè)備被未授權(quán)方非法連接、訪問和操控的風(fēng)險(xiǎn)。

需要進(jìn)一步說明的，穿戴智能設(shè)備302與智能手機(jī)301建立或解除綁定關(guān)系時(shí)需要進(jìn)行語音驗(yàn)證，即獲取請(qǐng)求發(fā)起人即用戶303的聲音特征、并與已存儲(chǔ)的聲音特征(若有)進(jìn)行匹配，從而完成對(duì)請(qǐng)求發(fā)起人身份的認(rèn)證。語音驗(yàn)證需要從語音信息中提取聲音特征，以及描述特定用戶的聲音特征的聲學(xué)模型。

在語音驗(yàn)證的過程中，若已知語音信號(hào)中用戶要表達(dá)的文本信息，則驗(yàn)證的準(zhǔn)確率將得到提升，因而在圖3中，建立和解除綁定關(guān)系過程均通過智能手機(jī)301的顯示功能，指定用戶303要用語音信息輸入的文本信息。

根據(jù)本發(fā)明的一個(gè)實(shí)施例，根據(jù)聲音特征與已存儲(chǔ)的聲音特征確定發(fā)起設(shè)備是否通過認(rèn)證，可包括以下步驟：設(shè)置驗(yàn)證概率閾值并獲取與已存儲(chǔ)的聲音特征相應(yīng)的語音模型；計(jì)算驗(yàn)證概率，驗(yàn)證概率表示聲音特征由語音模型生成的概率；以及在驗(yàn)證概率大于驗(yàn)證概率閾值的情況下，聲音特征與已存儲(chǔ)的聲音特征相符合，確定發(fā)起設(shè)備通過認(rèn)證。

具體地，語音驗(yàn)證可以是一個(gè)假設(shè)檢驗(yàn)任務(wù)，可在用戶首次注冊(cè)(穿戴智能設(shè)備未存儲(chǔ)與用戶的綁定關(guān)系)時(shí)，采集注冊(cè)用戶的聲音特征，并利用采集到的聲音特征訓(xùn)練語音模型(例如HMM)。在驗(yàn)證用戶身份階段，采集請(qǐng)求發(fā)起人的聲音特征，計(jì)算請(qǐng)求發(fā)起人的聲音特征是由注冊(cè)用戶指定的語音模型產(chǎn)生的驗(yàn)證概率，若驗(yàn)證概率高于特定的驗(yàn)證概率閾值，或驗(yàn)證概率高于請(qǐng)求發(fā)起人的聲音特征是由注冊(cè)用戶非指定的語音模型(例如Universal Background Model，統(tǒng)一背景模型)產(chǎn)生的概率，則接受請(qǐng)求發(fā)起人與已注冊(cè)用戶是同一個(gè)用戶的假設(shè)，否則拒絕該假設(shè)。

另外，在從語音信息中提取的聲音特征的選擇上，頻譜包絡(luò)特征除了因應(yīng)說話人期望表達(dá)的內(nèi)容不同而有所區(qū)別外，也因用戶本身的聲音特征的不同而有所區(qū)別，因而頻譜包絡(luò)特征也常被用作聲音識(shí)別和語音驗(yàn)證的基礎(chǔ)特征(尤其在注冊(cè)階段和驗(yàn)證階段用戶的語音信息所表述的文本信息相同的情況下)。例如，可使用線性預(yù)測(cè)系數(shù)(LPC)特征或梅爾頻率倒譜系數(shù)特征。

根據(jù)本發(fā)明的實(shí)施例，還提供了一種認(rèn)證裝置，包括：

認(rèn)證信息生成模塊，用于在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后，生成文本認(rèn)證信息并向用戶顯示文本認(rèn)證信息；

處理模塊，接收用戶回應(yīng)的語音信息，并對(duì)語音信息進(jìn)行語音識(shí)別或?qū)φZ音信息進(jìn)行語音驗(yàn)證；以及

連接模塊，用于根據(jù)語音識(shí)別的結(jié)果或語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證。

綜上所述，借助于本發(fā)明的上述技術(shù)方案，通過語音識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)文本認(rèn)證信息的輸入，還通過語音驗(yàn)證實(shí)現(xiàn)了對(duì)待連接的設(shè)備的使用方身份的認(rèn)證，提高了響應(yīng)設(shè)備在數(shù)據(jù)傳輸過程中的安全性，避免在數(shù)據(jù)傳輸過程中數(shù)據(jù)被未授權(quán)設(shè)備竊聽，避免了可穿戴智能設(shè)備被未授權(quán)方非法連接、訪問和操控。

應(yīng)當(dāng)理解，本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中，多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如，如果用硬件來實(shí)現(xiàn)，和在另一實(shí)施方式中一樣，可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn)：具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路，具有合適的組合邏輯門電路的專用集成電路，可編程門陣列(PGA)，現(xiàn)場(chǎng)可編程門陣列(FPGA)等。

以上所述僅為本發(fā)明的較佳實(shí)施例而已，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所作的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3