本發(fā)明涉及通信及電子設(shè)備技術(shù)領(lǐng)域,具體來說,涉及一種認(rèn)證方法及認(rèn)證裝置。
背景技術(shù):
隨著可穿戴智能設(shè)備的普及,用戶使用可穿戴設(shè)備的場(chǎng)景也越來越多元化,因此用戶使用可穿戴設(shè)備所產(chǎn)生的數(shù)據(jù)也在逐漸增加。為防止數(shù)據(jù)泄漏、保證可穿戴設(shè)備所產(chǎn)生的數(shù)據(jù)只允許設(shè)備所有者或授權(quán)使用方訪問,就需要對(duì)這些數(shù)據(jù)在傳輸、存儲(chǔ)等各個(gè)環(huán)節(jié)的安全性提供保護(hù)。
現(xiàn)有技術(shù)中,廣泛使用藍(lán)牙技術(shù)來實(shí)現(xiàn)可穿戴智能設(shè)備和移動(dòng)設(shè)備(如智能手機(jī))之間的通信。藍(lán)牙技術(shù)采用基于共享密鑰的身份驗(yàn)證,就是當(dāng)?shù)谝辉O(shè)備能證明自己擁有和第二設(shè)備相同的密鑰時(shí),第二設(shè)備就認(rèn)為第一設(shè)備是可信賴的。早期藍(lán)牙版本要求用戶在待配對(duì)的兩臺(tái)設(shè)備上輸入相同的字符串(PIN Code),用以生成鑒權(quán)使用的鏈路字(Link Key)。為提升安全級(jí)別及簡(jiǎn)化用戶交互,藍(lán)牙2.1版本提出安全簡(jiǎn)易配對(duì)(Secure Simple Pairing),并提供幾種配對(duì)模式,其中包括:即刻連接(Just Works)模式和通關(guān)字輸入(Passkey Entry)模式。
即刻連接式可以使位于傳輸范圍內(nèi)的兩臺(tái)設(shè)備直接配對(duì)而不需要額外的用戶輸入,但該模式不提供對(duì)中間人(Man In The Middle)襲擊的防護(hù)功能。而通關(guān)字輸入模式則要求用戶將第一設(shè)備上顯示的字符串在第二設(shè)備上輸入以驗(yàn)證第一設(shè)備是否是可信賴的,該模式提供鑒權(quán)功能和對(duì)中間人襲擊的防護(hù)功能。
首先,基于美觀、易用性等方面因素,目前市面上的許多可穿戴智能設(shè)備不帶有可供鍵入的輸入模塊,因而普遍采用的是即刻連接(Just Works)模式。這就使傳輸中的數(shù)據(jù)面臨被未授權(quán)方截取、竊聽、和盜用的風(fēng)險(xiǎn)。
其次,藍(lán)牙協(xié)議提供的認(rèn)證和加密(包括即刻連接模式和通關(guān)字輸入模式等)的只保證兩臺(tái)設(shè)備間的認(rèn)證(如第一設(shè)備有權(quán)利訪問第二設(shè)備),而并不能夠保證對(duì)第一設(shè)備使用者身份的認(rèn)證。因此,在安全性要求較高的使用場(chǎng)景下,需要由上層協(xié)議及其交互實(shí)現(xiàn)對(duì)使用者身份的確認(rèn)。具體地,目前可穿戴智能設(shè)備大多是通過智能手機(jī)操作系統(tǒng)或手機(jī)應(yīng)用軟件的驗(yàn)證機(jī)制來完成對(duì)使用者身份的確認(rèn)過程,例如用戶若能獲得第一設(shè)備的使用權(quán),登錄第二設(shè)備對(duì)應(yīng)的手機(jī)端應(yīng)用軟件就能夠建立或解除與第二設(shè)備之間的通信連接,從而可以讀取第二設(shè)備中的數(shù)據(jù)、使用第二設(shè)備提供的功能等。
但是,上述對(duì)使用者身份的確認(rèn)過程只有智能手機(jī)操作系統(tǒng)和手機(jī)應(yīng)用軟件的驗(yàn)證機(jī)制而沒有用戶認(rèn)證機(jī)制。因此,在智能手機(jī)操作系統(tǒng)沒有設(shè)置驗(yàn)證密碼時(shí)、或在手機(jī)應(yīng)用軟件處于免登錄期間內(nèi)時(shí),這會(huì)導(dǎo)致可穿戴智能設(shè)備可能被未授權(quán)方訪問或控制。例如:假設(shè)可穿戴智能設(shè)備被允許同一時(shí)間與多臺(tái)設(shè)備建立連接,且用戶使用該可穿戴智能設(shè)備產(chǎn)生了一定量的數(shù)據(jù),未授權(quán)方可以通過靠近可穿戴智能設(shè)備與其建立連接,從而導(dǎo)致了可穿戴智能設(shè)備對(duì)用戶不可用、甚至可穿戴智能設(shè)備中的數(shù)據(jù)被盜取。又例如:假設(shè)可穿戴智能設(shè)備同一時(shí)間僅被允許與一臺(tái)設(shè)備建立連接,未授權(quán)方可以在智能手機(jī)的免登錄期間獲取到智能手機(jī),而解除其與可穿戴智能設(shè)備已建立的連接、或?qū)⒃摽纱┐髦悄茉O(shè)備連接至另一臺(tái)智能手機(jī),從而讀取或盜取該可穿戴智能設(shè)備中的數(shù)據(jù)。
針對(duì)相關(guān)技術(shù)中的上述問題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)相關(guān)技術(shù)中上述的問題,本發(fā)明提出一種認(rèn)證方法及認(rèn)證裝置,能夠提高不便設(shè)置輸入模塊的設(shè)備在數(shù)據(jù)傳輸過程中的安全性,避免在數(shù)據(jù)傳輸過程中數(shù)據(jù)被未授權(quán)方竊聽。
本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
根據(jù)本發(fā)明的一個(gè)方面,提供了一種認(rèn)證方法,包括:在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后,生成文本認(rèn)證信息并向用戶顯示文本認(rèn)證信息;
接收用戶回應(yīng)的語音信息,并對(duì)語音信息進(jìn)行語音識(shí)別或?qū)φZ音信息進(jìn)行語音驗(yàn)證;以及
根據(jù)語音識(shí)別的結(jié)果或語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,文本認(rèn)證信息為包括多個(gè)數(shù)字字符的數(shù)字序列文本。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,根據(jù)語音識(shí)別的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證,包括:當(dāng)語音識(shí)別的結(jié)果與數(shù)字序列文本相符合的情況下,確定發(fā)起設(shè)備通過認(rèn)證。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,對(duì)語音信息進(jìn)行語音驗(yàn)證包括:根據(jù)語音信息提取聲音特征。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,根據(jù)語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證,包括:在不存在已存儲(chǔ)的聲音特征的情況下,確定發(fā)起設(shè)備通過認(rèn)證并存儲(chǔ)聲音特征。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,根據(jù)語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證,包括:在存在已存儲(chǔ)的聲音特征的情況下,根據(jù)聲音特征與已存儲(chǔ)的聲音特征確定發(fā)起設(shè)備是否通過認(rèn)證。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,根據(jù)聲音特征與已存儲(chǔ)的聲音特征確定發(fā)起設(shè)備是否通過認(rèn)證,包括:設(shè)置驗(yàn)證概率閾值并獲取與已存儲(chǔ)的聲音特征相應(yīng)的語音模型;計(jì)算驗(yàn)證概率,驗(yàn)證概率表示聲音特征由語音模型生成的概率;以及在驗(yàn)證概率大于驗(yàn)證概率閾值的情況下,聲音特征與已存儲(chǔ)的聲音特征相符合,確定發(fā)起設(shè)備通過認(rèn)證。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,對(duì)語音信息進(jìn)行語音識(shí)別包括:訓(xùn)練聲學(xué)模型并根據(jù)語音信息提取特征矢量;以及通過聲學(xué)模型對(duì)特征矢量進(jìn)行解析以獲取數(shù)字序列文本。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,響應(yīng)設(shè)備包括:智能手環(huán)、智能手表、智能眼鏡、和智能珠寶之中的任意一種;以及發(fā)起設(shè)備包括:智能手機(jī)、平板電腦、和筆記本電腦之中的任意一種。
根據(jù)本發(fā)明的另一方面,提供了一種認(rèn)證裝置,包括:認(rèn)證信息生成模塊,用于在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后,生成文本認(rèn)證信息并向用戶顯示文本認(rèn)證信息;處理模塊,接收用戶回應(yīng)的語音信息,并對(duì)語音信息進(jìn)行語音識(shí)別或?qū)φZ音信息進(jìn)行語音驗(yàn)證;以及連接模塊,用于根據(jù)語音識(shí)別的結(jié)果或語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證。
本發(fā)明在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后,通過語音識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)文本認(rèn)證信息的輸入,提高了響應(yīng)設(shè)備在數(shù)據(jù)傳輸過程中的安全性,避免在數(shù)據(jù)傳輸過程中數(shù)據(jù)被未授權(quán)設(shè)備竊聽;通過語音驗(yàn)證技術(shù)實(shí)現(xiàn)了對(duì)用戶身份的認(rèn)證,避免未授權(quán)用戶訪問響應(yīng)設(shè)備。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是根據(jù)本發(fā)明實(shí)施例的認(rèn)證方法的流程圖;
圖2是根據(jù)本發(fā)明一個(gè)實(shí)施例的認(rèn)證方法進(jìn)行藍(lán)牙配對(duì)的流程示意圖;
圖3是根據(jù)本發(fā)明另一個(gè)實(shí)施例的認(rèn)證方法的建立或解除綁定關(guān)系的流程示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。根據(jù)本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1所示,根據(jù)本發(fā)明實(shí)施例的認(rèn)證方法,包括以下步驟:
步驟S110,在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后,生成文本認(rèn)證信息并向用戶顯示文本認(rèn)證信息;
步驟S120,接收用戶回應(yīng)的語音信息,并對(duì)語音信息進(jìn)行語音識(shí)別或?qū)φZ音信息進(jìn)行語音驗(yàn)證;以及
步驟S130,根據(jù)語音識(shí)別的結(jié)果或語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證。
通過上述技術(shù)方案,在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后,通過語音識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)文本認(rèn)證信息的輸入,通過語音驗(yàn)證技術(shù)實(shí)現(xiàn)了對(duì)用戶身份的認(rèn)證,提高了響應(yīng)設(shè)備在數(shù)據(jù)傳輸過程中的安全性,避免在數(shù)據(jù)傳輸過程中數(shù)據(jù)被未授權(quán)設(shè)備竊聽
根據(jù)本發(fā)明的一個(gè)實(shí)施例,響應(yīng)設(shè)備可以包括:智能手環(huán)、智能手表、智能眼鏡、和智能珠寶等不具有輸入功能的可穿戴智能設(shè)備之中的任意一種,可穿戴智能設(shè)備是可直接穿戴在身上、或是整合到用戶衣服或配件的一種便攜式智能設(shè)備。響應(yīng)設(shè)備也可以是其它不具有輸入功能的智能設(shè)備。發(fā)起設(shè)備可以包括智能手機(jī)和平板電腦等智能移動(dòng)終端中的一種,發(fā)起設(shè)備也可以包括筆記本電腦、臺(tái)式電腦等。發(fā)起設(shè)備具有顯示功能,可以通過具有顯示功能的發(fā)起設(shè)備來向用戶顯示文本認(rèn)證信息。
優(yōu)選地,文本認(rèn)證信息可以是包括多個(gè)數(shù)字字符的數(shù)字序列文本。其中文本認(rèn)證信息是隨機(jī)生成的??商娲模谋菊J(rèn)證信息也可以是包括多個(gè)英文字母字符的序列。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,步驟S130可包括:
步驟S131,當(dāng)語音識(shí)別的結(jié)果與數(shù)字序列文本相符合的情況下,確定發(fā)起設(shè)備通過認(rèn)證;
步驟S132,當(dāng)語音識(shí)別的結(jié)果與數(shù)字序列文本不符的情況下,確定發(fā)起設(shè)備未通過認(rèn)證。
參考圖2,是根據(jù)本發(fā)明一個(gè)實(shí)施例的認(rèn)證方法進(jìn)行藍(lán)牙配對(duì)的流程示意圖。為兼顧通信的安全性和使用的方便性,可通過藍(lán)牙配對(duì)實(shí)現(xiàn)兩個(gè)從未通信過的設(shè)備間的首次認(rèn)證,生成鏈路字以便往后進(jìn)行免認(rèn)證連接。具體地,用戶203可在藍(lán)牙配對(duì)的發(fā)起設(shè)備201(例如智能手機(jī))上搜索并選擇待配對(duì)的響應(yīng)設(shè)備202(例如可穿戴智能設(shè)備),或者也可以由可穿戴智能設(shè)備對(duì)應(yīng)的手機(jī)應(yīng)用軟件代用戶選擇可搜索范圍內(nèi)的合法的響應(yīng)設(shè)備。發(fā)起設(shè)備201向響應(yīng)設(shè)備202發(fā)送包括認(rèn)證請(qǐng)求的藍(lán)牙連接請(qǐng)求,響應(yīng)設(shè)備202接受連接請(qǐng)求。具備顯示功能的發(fā)起設(shè)備201向用戶203展示文本認(rèn)證信息。具體地,在本實(shí)施例中,文本認(rèn)證信息為由6位數(shù)字組成的通關(guān)字(Passkey)。用戶203通過語音信息將通關(guān)字輸入到響應(yīng)設(shè)備202。響應(yīng)設(shè)備202識(shí)別輸入的用戶203的語音信息,并將語音信息轉(zhuǎn)換為6位數(shù)字。當(dāng)6位數(shù)字與通關(guān)字相同時(shí)生成鏈路字并鑒權(quán),發(fā)起設(shè)備201和響應(yīng)設(shè)備202分別將對(duì)方加入到可信賴列表中。使得發(fā)起設(shè)備201和響應(yīng)設(shè)備202利用相同的通關(guān)字,通過藍(lán)牙標(biāo)準(zhǔn)提供的鑒權(quán)算法實(shí)現(xiàn)配對(duì),并儲(chǔ)存配對(duì)關(guān)系。實(shí)現(xiàn)了在一臺(tái)具備顯示功能的發(fā)起設(shè)備201及另一臺(tái)響應(yīng)設(shè)備202的藍(lán)牙配對(duì)過程中,利用語音識(shí)別來實(shí)現(xiàn)通關(guān)字的輸入,提升了不具有輸入功能的可穿戴智能設(shè)備在藍(lán)牙傳輸過程中的安全級(jí)別。
需要進(jìn)一步說明的,語音識(shí)別是根據(jù)用戶的語音信息來獲取用戶的說話內(nèi)容。在步驟S120中,可包括以下步驟:
步驟S121,訓(xùn)練聲學(xué)模型并根據(jù)語音信息提取其特征矢量;以及
步驟S122,通過聲學(xué)模型對(duì)特征矢量進(jìn)行解析以獲取數(shù)字序列文本。
用戶需將展示在智能手機(jī)上的通關(guān)字,例如數(shù)字序列(即數(shù)字序列文本)的內(nèi)容為“1 9 7 2 8 4”,通過語音信息輸入到語音識(shí)別模塊。其中,語音模塊可以由具有語音識(shí)別功能的硬件來實(shí)現(xiàn)。語音識(shí)別模塊從采集到的語音信息中提取特征矢量(例如梅爾頻率倒譜系數(shù)),并借助事先訓(xùn)練好的描述聲學(xué)單元特征的聲學(xué)模型(例如隱馬爾科夫鏈),解析出語音信息中所要傳達(dá)的數(shù)字序列,即通關(guān)字。
具體地,在步驟S121中,由于不同頻率的聲波傳送到人耳將觸發(fā)不同的感知回路;相應(yīng)地,語音識(shí)別的語音信息的處理過程也大多涉及對(duì)頻譜包絡(luò)特征的分析和表示。以梅爾頻率倒譜系數(shù)(MFCC)為例,原始語音信息分別經(jīng)過分幀處理(如使用25ms相互重疊的音框,幀內(nèi)頻譜近似恒定)、傅立葉變換和梅爾刻度下的濾波處理來獲取對(duì)數(shù)能量,并對(duì)梅爾頻率倒譜系數(shù)進(jìn)行計(jì)算分離出低頻的包絡(luò)信息和高頻的細(xì)節(jié)信息,從而最終得到代表每幀語音信息的固定維度的特征向量。
具體地,在步驟S122中,待識(shí)別的數(shù)字序列可由智能手機(jī)隨機(jī)生成,通關(guān)字為數(shù)字序列“1 8 3 7 6 4”和通關(guān)字為數(shù)字序列“7 6 4 3 1 9”的概率相同,因此上下文相關(guān)性較小;另外,由于數(shù)字序列可由智能手機(jī)進(jìn)行顯示、順序隨機(jī)且用戶并未事先識(shí)記,因此連續(xù)性及音節(jié)間協(xié)同發(fā)音不顯著??紤]到語音識(shí)別任務(wù)針對(duì)的數(shù)字序列、詞表小、上下文相關(guān)性弱、且連續(xù)性及音節(jié)間協(xié)同發(fā)音不顯著等因素,可采用音節(jié)作為聲學(xué)模型的基本單元,以音節(jié)為基本單元來建立聲學(xué)模型能夠避免更細(xì)粒度聲學(xué)單元(例如音素)產(chǎn)生的不穩(wěn)定性,同時(shí)基于上述原因需要訓(xùn)練的聲學(xué)模型的數(shù)量也是可控的。
可選地,采用隱馬爾科夫模型(HMM)這一統(tǒng)計(jì)模型對(duì)音節(jié)內(nèi)各隱性狀態(tài)的轉(zhuǎn)移概率及各隱性狀態(tài)輸出可觀測(cè)結(jié)果(如梅爾頻率倒譜系數(shù))的概率建立聲學(xué)模型;并可利用混合高斯模型(GMM)模擬輸出概率的分布情況。聲學(xué)模型的參數(shù)可以通過在訓(xùn)練數(shù)據(jù)集上迭代執(zhí)行“根據(jù)當(dāng)前參數(shù)估計(jì)概率-根據(jù)估計(jì)更新參數(shù)算法”(Forward-backward Algorithm)來獲得。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,對(duì)語音信息進(jìn)行語音驗(yàn)證包括:根據(jù)語音信息提取聲音特征。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,根據(jù)語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證,可包括以下步驟:在不存在已存儲(chǔ)的聲音特征的情況下,確定發(fā)起設(shè)備通過認(rèn)證并存儲(chǔ)聲音特征;在存在已存儲(chǔ)的聲音特征的情況下,根據(jù)聲音特征與已存儲(chǔ)的聲音特征確定發(fā)起設(shè)備是否通過認(rèn)證。
下面結(jié)合圖3對(duì)上述實(shí)施例進(jìn)行具體說明。如圖3所示是根據(jù)本發(fā)明另一個(gè)實(shí)施例的認(rèn)證方法的建立或解除綁定關(guān)系的流程示意圖。這里以藍(lán)牙配對(duì)成功后需建立綁定關(guān)系以傳輸數(shù)據(jù)來進(jìn)行說明。當(dāng)藍(lán)牙配對(duì)成功后,用戶303通過智能手機(jī)301(即發(fā)起設(shè)備)上的手機(jī)應(yīng)用發(fā)起綁定操作,可穿戴智能設(shè)備302(即響應(yīng)設(shè)備)首先對(duì)發(fā)起藍(lán)牙連接智能手機(jī)301(即發(fā)起設(shè)備)上的手機(jī)應(yīng)用進(jìn)行一次認(rèn)證以建立可信賴的藍(lán)牙連接。該認(rèn)證由智能手機(jī)301上的應(yīng)用向可穿戴智能設(shè)備302發(fā)送根據(jù)可穿戴智能設(shè)備302的設(shè)備標(biāo)識(shí)(例如Modoo01055B)和約定好的密鑰(例如Extant Future)進(jìn)行對(duì)稱加密后的加密數(shù)據(jù);可穿戴智能設(shè)備302接收到加密數(shù)據(jù)后,通過約定好的密鑰(Extant Future)反向?qū)用軘?shù)據(jù)進(jìn)行解密后與自身的設(shè)備標(biāo)識(shí)進(jìn)行比對(duì),若比對(duì)結(jié)果一致,則一次認(rèn)證通過;若不一致,則可穿戴智能設(shè)備302主動(dòng)斷開藍(lán)牙連接,建立綁定關(guān)系失敗。進(jìn)一步地,若藍(lán)牙連接成功后2秒內(nèi),可穿戴智能設(shè)備302未收到來自智能手機(jī)301的應(yīng)用的認(rèn)證請(qǐng)求,同樣將斷開藍(lán)牙連接。上述過程并不涉及用戶交互,對(duì)用戶來說是透明的。
隨后,可穿戴智能設(shè)備302對(duì)發(fā)起綁定操作的用戶303的身份進(jìn)行認(rèn)證。該過程借助智能手機(jī)301的顯示功能,智能手機(jī)301在向穿戴智能設(shè)備302發(fā)送綁定請(qǐng)求的同時(shí)可向用戶顯示文本信息;用戶通過語音信息將顯示在手機(jī)上的文本輸入到穿戴智能設(shè)備302。穿戴智能設(shè)備302接收到綁定請(qǐng)求及用戶303的語音信息后,提取語音信息中用于身份識(shí)別的聲音特征,穿戴智能設(shè)備302判斷當(dāng)前是否有已存儲(chǔ)的聲音特征,若無說明目前仍無用戶綁定,回復(fù)同意建立綁定關(guān)系的認(rèn)證結(jié)果同時(shí)存儲(chǔ)用戶聲音特征;若有已存儲(chǔ)的聲音特征,說明目前已有用戶綁定,判斷請(qǐng)求中的用戶303的聲音特征與已存儲(chǔ)的聲音特征是否相符,若相符則說明聲音來自同一用戶,回復(fù)同意建立綁定關(guān)系的認(rèn)證結(jié)果,否則拒絕建立綁定關(guān)系。
智能手機(jī)301收到穿戴智能設(shè)備302回復(fù)的同意建立綁定關(guān)系的認(rèn)證結(jié)果后,將用戶303與穿戴智能設(shè)備302的信息(例如設(shè)備名稱和藍(lán)牙連接地址等)存儲(chǔ)到本地,并可通過HTTPS協(xié)議上報(bào)云端。
解綁過程與建立綁定關(guān)系時(shí)相同,用戶認(rèn)證過程也同樣借助智能手機(jī)301向用戶303顯示待語音輸入的文本信息。在穿戴智能設(shè)備302收到解綁請(qǐng)求和用戶303的語音信息后,提取聲音特征并與當(dāng)前存儲(chǔ)的聲音特征進(jìn)行比對(duì),若相符,回復(fù)同意解除綁定的認(rèn)證結(jié)果且同時(shí)刪除該存儲(chǔ)的聲音特征;若不相符,回復(fù)拒絕解除綁定請(qǐng)求的認(rèn)證結(jié)果。智能手機(jī)301收到同意解除綁定的認(rèn)證結(jié)果后,可更新本地及云端存儲(chǔ)的設(shè)備連接關(guān)系。
為保證用戶產(chǎn)生的數(shù)據(jù)只能被用戶自己或授權(quán)方訪問,實(shí)現(xiàn)了在數(shù)據(jù)讀取方(例如智能手機(jī)301)和數(shù)據(jù)收集方(例如穿戴智能設(shè)備302)之間建立連接關(guān)系(綁定關(guān)系)、或解除綁定關(guān)系時(shí)均對(duì)用戶身份進(jìn)行確認(rèn)。在應(yīng)用層利用與手機(jī)應(yīng)用間的交互及語音驗(yàn)證技術(shù),實(shí)現(xiàn)了對(duì)待連接的智能手機(jī)301上的應(yīng)用與智能手機(jī)301使用方身份的認(rèn)證,能夠避免可穿戴智能設(shè)備被未授權(quán)方非法連接、訪問和操控的風(fēng)險(xiǎn)。
需要進(jìn)一步說明的,穿戴智能設(shè)備302與智能手機(jī)301建立或解除綁定關(guān)系時(shí)需要進(jìn)行語音驗(yàn)證,即獲取請(qǐng)求發(fā)起人即用戶303的聲音特征、并與已存儲(chǔ)的聲音特征(若有)進(jìn)行匹配,從而完成對(duì)請(qǐng)求發(fā)起人身份的認(rèn)證。語音驗(yàn)證需要從語音信息中提取聲音特征,以及描述特定用戶的聲音特征的聲學(xué)模型。
在語音驗(yàn)證的過程中,若已知語音信號(hào)中用戶要表達(dá)的文本信息,則驗(yàn)證的準(zhǔn)確率將得到提升,因而在圖3中,建立和解除綁定關(guān)系過程均通過智能手機(jī)301的顯示功能,指定用戶303要用語音信息輸入的文本信息。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,根據(jù)聲音特征與已存儲(chǔ)的聲音特征確定發(fā)起設(shè)備是否通過認(rèn)證,可包括以下步驟:設(shè)置驗(yàn)證概率閾值并獲取與已存儲(chǔ)的聲音特征相應(yīng)的語音模型;計(jì)算驗(yàn)證概率,驗(yàn)證概率表示聲音特征由語音模型生成的概率;以及在驗(yàn)證概率大于驗(yàn)證概率閾值的情況下,聲音特征與已存儲(chǔ)的聲音特征相符合,確定發(fā)起設(shè)備通過認(rèn)證。
具體地,語音驗(yàn)證可以是一個(gè)假設(shè)檢驗(yàn)任務(wù),可在用戶首次注冊(cè)(穿戴智能設(shè)備未存儲(chǔ)與用戶的綁定關(guān)系)時(shí),采集注冊(cè)用戶的聲音特征,并利用采集到的聲音特征訓(xùn)練語音模型(例如HMM)。在驗(yàn)證用戶身份階段,采集請(qǐng)求發(fā)起人的聲音特征,計(jì)算請(qǐng)求發(fā)起人的聲音特征是由注冊(cè)用戶指定的語音模型產(chǎn)生的驗(yàn)證概率,若驗(yàn)證概率高于特定的驗(yàn)證概率閾值,或驗(yàn)證概率高于請(qǐng)求發(fā)起人的聲音特征是由注冊(cè)用戶非指定的語音模型(例如Universal Background Model,統(tǒng)一背景模型)產(chǎn)生的概率,則接受請(qǐng)求發(fā)起人與已注冊(cè)用戶是同一個(gè)用戶的假設(shè),否則拒絕該假設(shè)。
另外,在從語音信息中提取的聲音特征的選擇上,頻譜包絡(luò)特征除了因應(yīng)說話人期望表達(dá)的內(nèi)容不同而有所區(qū)別外,也因用戶本身的聲音特征的不同而有所區(qū)別,因而頻譜包絡(luò)特征也常被用作聲音識(shí)別和語音驗(yàn)證的基礎(chǔ)特征(尤其在注冊(cè)階段和驗(yàn)證階段用戶的語音信息所表述的文本信息相同的情況下)。例如,可使用線性預(yù)測(cè)系數(shù)(LPC)特征或梅爾頻率倒譜系數(shù)特征。
根據(jù)本發(fā)明的實(shí)施例,還提供了一種認(rèn)證裝置,包括:
認(rèn)證信息生成模塊,用于在發(fā)起設(shè)備向響應(yīng)設(shè)備發(fā)起認(rèn)證請(qǐng)求后,生成文本認(rèn)證信息并向用戶顯示文本認(rèn)證信息;
處理模塊,接收用戶回應(yīng)的語音信息,并對(duì)語音信息進(jìn)行語音識(shí)別或?qū)φZ音信息進(jìn)行語音驗(yàn)證;以及
連接模塊,用于根據(jù)語音識(shí)別的結(jié)果或語音驗(yàn)證的結(jié)果確定發(fā)起設(shè)備是否通過認(rèn)證。
綜上所述,借助于本發(fā)明的上述技術(shù)方案,通過語音識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)文本認(rèn)證信息的輸入,還通過語音驗(yàn)證實(shí)現(xiàn)了對(duì)待連接的設(shè)備的使用方身份的認(rèn)證,提高了響應(yīng)設(shè)備在數(shù)據(jù)傳輸過程中的安全性,避免在數(shù)據(jù)傳輸過程中數(shù)據(jù)被未授權(quán)設(shè)備竊聽,避免了可穿戴智能設(shè)備被未授權(quán)方非法連接、訪問和操控。
應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(PGA),現(xiàn)場(chǎng)可編程門陣列(FPGA)等。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。