用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法
【專利摘要】本發(fā)明描述一種用于通過(guò)電子裝置來(lái)評(píng)估音頻口令的強(qiáng)度的方法。所述方法包含獲得由一或多個(gè)麥克風(fēng)捕獲的音頻信號(hào)。所述音頻信號(hào)包含音頻口令。所述方法還包含基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度。所述方法進(jìn)一步包含基于對(duì)所述音頻口令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述音頻口令較弱。
【專利說(shuō)明】
用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明大體上涉及電子裝置。更具體地說(shuō),本發(fā)明涉及用評(píng)估音頻口令的強(qiáng)度的 系統(tǒng)和方法。
【背景技術(shù)】
[0002] 在最近幾十年中,電子裝置的使用已變得普遍。明確地說(shuō),電子技術(shù)中的進(jìn)步已減 少了越來(lái)越復(fù)雜且有用的電子裝置的成本。成本降低和消費(fèi)者需求已使電子裝置的使用劇 增,使得其在現(xiàn)代社會(huì)中幾乎隨處可見。由于電子裝置的使用已推廣開來(lái),因此具有對(duì)電子 裝置的新的且改進(jìn)的特征的需求。更具體來(lái)說(shuō),人們常常尋求執(zhí)行新功能和/或更快、更有 效或以更高質(zhì)量執(zhí)行功能的電子裝置。
[0003] -些電子裝置(例如,蜂窩式電話、智能電話、音頻記錄器、攝錄影機(jī)、計(jì)算機(jī)等)利 用音頻信號(hào)。這些電子裝置可捕獲、編碼、存儲(chǔ)和/或發(fā)射所述音頻信號(hào)。舉例來(lái)說(shuō),智能電 話可獲得、編碼和發(fā)射用于電話呼叫的語(yǔ)音信號(hào),同時(shí)另一智能電話可接收所述語(yǔ)音信號(hào) 并對(duì)其進(jìn)行解碼。
[0004] 然而,將音頻信號(hào)用于安全目的的電子裝置可能產(chǎn)生特定挑戰(zhàn)。舉例來(lái)說(shuō),許多音 頻信號(hào)可能不足以充分確保電子裝置接入的安全。如從此論述可觀察到,改進(jìn)安全性的系 統(tǒng)和方法可為有益的。
【發(fā)明內(nèi)容】
[0005] 描述一種用于通過(guò)電子裝置來(lái)評(píng)估音頻口令的強(qiáng)度的方法。所述方法包含獲得由 一或多個(gè)麥克風(fēng)捕獲的音頻信號(hào)。所述音頻信號(hào)包含音頻口令。所述方法還包含基于測(cè)量 所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度。所述方法進(jìn)一步包含 基于對(duì)音頻口令的強(qiáng)度的評(píng)估來(lái)告知用戶音頻口令較弱。所述音頻信號(hào)可包含至少一個(gè)語(yǔ) 音分量。測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性可基于通用語(yǔ)音模型。
[0006] 告知所述用戶可包含顯示與所述音頻口令的強(qiáng)度相關(guān)聯(lián)的標(biāo)記。告知所述用戶可 包含顯示口令強(qiáng)度得分。告知所述用戶可包含顯示至少一個(gè)候選語(yǔ)音分量。
[0007] 所述方法可包含將口令強(qiáng)度得分與另一值進(jìn)行比較。所述另一值可為閾值或先前 口令強(qiáng)度得分。
[0008] 所述方法可包含獲得至少一個(gè)額外驗(yàn)證輸入。所述方法可包含使所述音頻信號(hào)和 所述額外驗(yàn)證輸入中的至少一者降級(jí)。所述方法可包含基于地理位置、用戶年齡、用戶性 另Ij、用戶語(yǔ)言和地方方言中的一或多者來(lái)更新通用語(yǔ)音模型。
[0009] 還描述一種用于評(píng)估音頻口令的強(qiáng)度的電子裝置。所述電子裝置包含捕獲音頻信 號(hào)的一或多個(gè)麥克風(fēng)。所述音頻信號(hào)包含音頻口令。所述還包含耦合到所述一或多個(gè)麥克 風(fēng)的口令評(píng)估電路。所述口令評(píng)估電路基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估 音頻口令的強(qiáng)度。所述電子裝置進(jìn)一步包含耦合到所述口令評(píng)估電路的口令反饋電路。所 述口令反饋電路基于對(duì)音頻口令的強(qiáng)度的評(píng)估而告知用戶音頻口令較弱。
[0010] 還描述一種用于評(píng)估音頻口令的強(qiáng)度的計(jì)算機(jī)程序產(chǎn)品。所述計(jì)算機(jī)程序產(chǎn)品包 含上面具有指令的非暫時(shí)性有形計(jì)算機(jī)可讀媒體。所述指令包含用于致使電子裝置獲得由 一或多個(gè)麥克風(fēng)捕獲的音頻信號(hào)的代碼。所述音頻信號(hào)包含音頻口令。所述指令還包含用 于致使所述電子裝置基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估音頻口令的強(qiáng)度 的代碼。所述指令進(jìn)一步包含用于致使所述電子裝置基于對(duì)音頻口令的強(qiáng)度的評(píng)估來(lái)告知 用戶音頻口令較弱的代碼。
[0011] 還描述一種用于評(píng)估音頻口令的強(qiáng)度的設(shè)備。所述設(shè)備包含用于獲得音頻信號(hào)的 裝置。所述音頻信號(hào)包含音頻口令。所述設(shè)備還包含用于基于測(cè)量所述音頻信號(hào)的一或多 個(gè)唯一特性來(lái)評(píng)估音頻口令的強(qiáng)度的裝置。所述設(shè)備進(jìn)一步包含用于基于對(duì)音頻口令的強(qiáng) 度的評(píng)估來(lái)告知用戶音頻口令較弱的裝置。
【附圖說(shuō)明】
[0012] 圖1是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置的一個(gè) 配置的框圖;
[0013] 圖2是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的一個(gè)配置的流程圖;
[0014] 圖3包含說(shuō)明唯一性量度的實(shí)例的圖表;
[0015] 圖4是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置的更具 體配置的框圖;
[0016] 圖5是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的更具體配置的流程圖;
[0017] 圖6是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的另一更具體配置的流程圖;
[0018] 圖7是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的另一更具體配置的流程圖;
[0019] 圖8是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的另一更具體配置的流程圖;
[0020] 圖9是說(shuō)明揚(yáng)聲器(例如,用戶)辨識(shí)模型的一個(gè)實(shí)例的框圖;
[0021] 圖10是說(shuō)明用于基于預(yù)訓(xùn)練提供一或多個(gè)候選語(yǔ)音分量的方法的一個(gè)配置的流 程圖;
[0022] 圖11是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置的另 一更具體配置的框圖;
[0023] 圖12是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的更具體配置的流程圖;
[0024] 圖13是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的無(wú)線通信裝置 的一個(gè)配置的框圖;以及
[0025] 圖14說(shuō)明可在電子裝置中利用的各種組件。
【具體實(shí)施方式】
[0026] 本文所揭示的系統(tǒng)和方法的一些配置提供口令強(qiáng)度評(píng)估以及對(duì)基于語(yǔ)音的生物 計(jì)量驗(yàn)證的建議。當(dāng)出于驗(yàn)證的目的使用話音時(shí),用戶可能想要將口令設(shè)定成說(shuō)出。然而, 可能難以知曉所述口令在話音音色方面是否將足夠唯一,使得當(dāng)正好說(shuō)出同一口令時(shí),其 他任何人無(wú)法打破所述系統(tǒng)。如果說(shuō)出的口令含有用戶自身的與任意設(shè)定口令不同的生物 計(jì)量差異,那么將更好。如果額外手段可用,那么其可恰當(dāng)?shù)赜脕?lái)加強(qiáng)安全性。
[0027] 本文所揭示的系統(tǒng)和方法可提供途徑來(lái)評(píng)估"唯一性"的強(qiáng)度,使得用戶可選擇足 夠唯一的口令。在一些配置中,本文所揭示的系統(tǒng)和方法可使用保留用戶的增強(qiáng)型唯一性 的發(fā)聲來(lái)建議一些候選者。本文所揭示的系統(tǒng)和方法可建議一些候選者,不僅通過(guò)使用保 留用戶自身的增強(qiáng)型唯一性的發(fā)聲,并且通過(guò)在一些配置中利用一或多個(gè)其它可用模態(tài)。
[0028] -些揚(yáng)聲器檢驗(yàn)系統(tǒng)通過(guò)使揚(yáng)聲器數(shù)據(jù)適合于通用背景模型(UBM)來(lái)訓(xùn)練揚(yáng)聲器 模型。在檢驗(yàn)階段中,可計(jì)算在揚(yáng)聲器模型與UBM之間觀察到的幀的似然比??捎?jì)算整個(gè)話 語(yǔ)/句子幀上的概述統(tǒng)計(jì),以確定語(yǔ)音幀是否來(lái)自真實(shí)揚(yáng)聲器。然而,每話語(yǔ)/音素/音節(jié)或 甚至每幀的"局部"可能性指示一些具有高區(qū)別,但一些并不具有??蓪⒉痪哂卸喔邊^(qū)別的 部分解釋也從其它模型闡述的部分,意味著其將污染檢驗(yàn)性能?;蛘?,可將其闡述為目標(biāo)模 型看不見的數(shù)據(jù),意味著其可能難以被用戶重復(fù)。因此,具有足夠強(qiáng)且可容易再現(xiàn)的口令可 為有益的。
[0029] 現(xiàn)在參考圖式描述各種配置,其中相同的參考標(biāo)號(hào)可指示功能上相似的元件???以廣泛多種不同配置來(lái)布置和設(shè)計(jì)如本文中在各圖中大體描述和說(shuō)明的系統(tǒng)和方法。因 此,對(duì)如各圖中所表示的若干配置的以下更詳細(xì)描述無(wú)意限制如所主張的范圍,而僅表示 系統(tǒng)和方法。
[0030] 圖1是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置102的 一個(gè)配置的框圖。電子裝置102的實(shí)例包含智能電話、蜂窩式電話、平板裝置、計(jì)算機(jī)(例如, 膝上型計(jì)算機(jī)、桌上型計(jì)算機(jī)等)、游戲系統(tǒng)、電子汽車控制臺(tái)、個(gè)人數(shù)字助理(PDA)等。
[0031] 電子裝置102包含一或多個(gè)麥克風(fēng)104、口令評(píng)估模塊108、口令反饋模塊112和一 或多個(gè)輸出裝置116。麥克風(fēng)104可為將聲信號(hào)轉(zhuǎn)換為電子信號(hào)的一或多個(gè)變換器。所述一 或多個(gè)輸出裝置116可為用于提供來(lái)自電子裝置102的輸出的裝置。所述一或多個(gè)輸出裝置 116的實(shí)例包含顯不器(例如,顯不面板、觸摸屏)、揚(yáng)聲器(例如,將電子信號(hào)轉(zhuǎn)換為聲信號(hào) 的變換器)、觸覺裝置(例如,產(chǎn)生力、運(yùn)動(dòng)和/或振動(dòng)的裝置)等。"模塊"可在硬件(例如,電 路)中或在硬件與軟件的組合(例如,具有指令的處理器)中實(shí)施。舉例來(lái)說(shuō),口令評(píng)估模塊 108和/或口令反饋模塊112可在硬件中或在硬件與軟件的組合中實(shí)施。
[0032] -或多個(gè)麥克風(fēng)104可耦合到口令評(píng)估模塊108。口令評(píng)估模塊108可耦合到口令 反饋模塊112??诹罘答伳K112可耦合到一或多個(gè)輸出裝置116。如本文中所使用,術(shù)語(yǔ)"耦 合"和相關(guān)術(shù)語(yǔ)可意味著一個(gè)組件直接連接(例如,無(wú)介入組件)或間接連接(例如,具有一 或多個(gè)介入組件)到另一組件。圖式中所描繪的箭頭和/或線可表示耦合。
[0033] -或多個(gè)麥克風(fēng)104可捕獲音頻信號(hào)106。舉例來(lái)說(shuō),一或多個(gè)麥克風(fēng)104可捕獲聲 學(xué)信號(hào),并將其轉(zhuǎn)換為電子音頻信號(hào)106。音頻信號(hào)106可包含音頻口令。音頻口令可包含用 于檢驗(yàn)用戶的身份的一或多個(gè)聲音(例如,一或多個(gè)語(yǔ)音分量,例如音素、音節(jié)、詞語(yǔ)、短語(yǔ)、 語(yǔ)句、發(fā)聲等)。舉例來(lái)說(shuō),音頻口令可包含一或多個(gè)特性(例如,生物計(jì)量特性、音色等),其 可用于識(shí)別用戶??蓪⒁纛l信號(hào)106提供到口令評(píng)估模塊108。
[0034] 口令評(píng)估模塊108可獲得(例如,接收)一或多個(gè)麥克風(fēng)104所捕獲的音頻信號(hào)106。 如上文所描述,音頻信號(hào)106可包含音頻口令。口令評(píng)估模塊108可基于測(cè)量音頻信號(hào)106的 一或多個(gè)唯一特性來(lái)評(píng)估音頻口令的強(qiáng)度。口令"強(qiáng)度"可為指示所述口令的安全程度的屬 性。舉例來(lái)說(shuō),強(qiáng)音頻口令(例如,具有高強(qiáng)度的音頻口令)對(duì)于冒名頂替者來(lái)說(shuō)非常難以或 幾乎不可能自然地模仿或復(fù)寫,在冒名頂替者可自然地模仿或復(fù)寫的情況下,所述冒名頂 替者被不當(dāng)?shù)刈R(shí)別為真實(shí)用戶。然而,對(duì)于冒名頂替者來(lái)說(shuō),弱音頻口令(例如,具有低強(qiáng)度 的音頻口令)可能更容易自然地模仿或復(fù)寫,其中冒名頂替者被不當(dāng)?shù)刈R(shí)別為真實(shí)用戶。在 一些配置中,音頻口令強(qiáng)度可依據(jù)唯一性來(lái)表達(dá)。舉例來(lái)說(shuō),音頻口令的一或多個(gè)語(yǔ)音分量 越唯一,所述口令越強(qiáng)。然而,音頻口令的一或多個(gè)語(yǔ)音組件越不唯一,所述口令越弱。因 此,可對(duì)音頻口令強(qiáng)度進(jìn)行定量,且程度范圍從弱到強(qiáng)。舉例來(lái)說(shuō),較唯一的語(yǔ)音分量得分 可比較不唯一的語(yǔ)音分量高(例如,強(qiáng))。
[0035]在一些配置中,口令評(píng)估模塊108可用唯一性程度或與一或多個(gè)通用語(yǔ)音模型(例 如,UBM)的區(qū)別來(lái)評(píng)估音頻口令的一或多個(gè)語(yǔ)音分量(例如,發(fā)聲、音素等)的強(qiáng)度。通用語(yǔ) 音模型可為表示一群人的語(yǔ)音的語(yǔ)音模型(例如,統(tǒng)計(jì)語(yǔ)音模型)。一或多個(gè)UBM是通用語(yǔ)音 模型的實(shí)例。
[0036] 在一些配置中,口令評(píng)估模塊108可利用多個(gè)通用語(yǔ)音模型(例如,UBM)。舉例來(lái) 說(shuō),可基于用戶的輸入和/或特性(例如地理位置(例如,郵政編碼、城市、縣、州、國(guó)家等)、性 另IJ、年齡、語(yǔ)言、地方方言等)來(lái)采用(例如,選擇和/或適應(yīng)等)多個(gè)通用語(yǔ)音模型。用戶的特 性可影響用戶語(yǔ)音的聲學(xué)特性。在一些配置中,如果用戶提供的信息與所存儲(chǔ)的通用語(yǔ)音 模型不匹配,那么電子裝置102可通知用戶和/或可根據(jù)用戶的肯定應(yīng)答改為使用恰當(dāng)?shù)哪?型。通過(guò)使用更具體匹配的通用語(yǔ)音模型(例如,UBM)來(lái)測(cè)量唯一性,電子裝置102(例如,口 令評(píng)估模塊108)可提供更準(zhǔn)確的唯一性量度和/或得分。在一些配置中,電子裝置102(例 如,口令評(píng)估模塊108)可基于參與的一或多個(gè)用戶的數(shù)據(jù)來(lái)更新對(duì)應(yīng)的通用語(yǔ)音模型(例 如,UBM) 〇
[0037]在一些配置中,口令評(píng)估模塊108可基于如下測(cè)量音頻信號(hào)106的一或多個(gè)特性 (例如,唯一特性)來(lái)評(píng)估音頻口令的強(qiáng)度。口令評(píng)估模塊108可從音頻信號(hào)106提取一或多 個(gè)特性(例如,特征向量)。舉例來(lái)說(shuō),口令評(píng)估模塊108可基于所述音頻信號(hào)106確定一或多 個(gè)梅爾頻率倒譜系數(shù)(MFCC)。在一些配置中,MFCC可為通過(guò)對(duì)音頻信號(hào)106的梅爾頻率經(jīng)平 滑譜的記錄量值應(yīng)用離散余弦變換(DCT)而獲得的系數(shù)。根據(jù)本文所揭示的系統(tǒng)和方法,可 提取可用于揚(yáng)聲器/語(yǔ)音辨識(shí)的任何或所有特征來(lái)使用。MFCC是作為一實(shí)例而給出,因?yàn)槠?可為用于此類應(yīng)用的相關(guān)特征向量。在一些配置中,根據(jù)本文所揭示的系統(tǒng)和方法而提取 和/或利用的特征可不限于確定性特征(意味著例如不管數(shù)據(jù)如何,獲得特征的方式可為固 定的)。舉例來(lái)說(shuō),可使用數(shù)據(jù)驅(qū)動(dòng)的方法(例如在一些方法中,深神經(jīng)網(wǎng)絡(luò))來(lái)提取(例如, 習(xí)得)特征向量。
[0038] 口令評(píng)估模塊108可基于一或多個(gè)通用語(yǔ)音模型(例如,UMB)獲得音頻信號(hào)106的 唯一性量度。唯一性量度可指示音頻信號(hào)106 (例如,音頻口令)上的唯一性。舉例來(lái)說(shuō),唯一 性量度可隨音頻信號(hào)1〇6(例如,音頻口令)的時(shí)間周期而變化。在一些配置中,可在每一語(yǔ) 音分量(例如,音素、音節(jié)、詞語(yǔ)等)和/或音頻信號(hào)106 (例如,音頻口令)的幀上獲得唯一性 量度。在一些配置中,可將音頻信號(hào)106 (例如,輸入波)轉(zhuǎn)換為特征向量(例如,MFCC ),其可 用于獲得唯一性量度和/或口令強(qiáng)度得分。
[0039] 在一些配置中,唯一性量度可為音頻信號(hào)106與通用語(yǔ)音模型之間的似然比。舉例 來(lái)說(shuō),可根據(jù)等式(1)來(lái)確定似然比。
[0040] Υ\ο〇(ρ(χ\λ Utrgd ))- 丨 〇g(:/'(A I 又 )) (1)
[0041] 在等式(1)中,t是時(shí)間,X是音頻信號(hào)(或基于所述音頻信號(hào)的特征向量,例如), Xtarget是目標(biāo)(例如,真實(shí)用戶)模型,xg_ri。是通用語(yǔ)音模型(例如,UBM),P (XI Atarge3t)是X對(duì) 應(yīng)于真實(shí)用戶的概率,且P(X|Age3ne3ri。)是X對(duì)應(yīng)于通用用戶(例如,冒名頂替者、非真實(shí)用戶 等)的概率。通用術(shù)語(yǔ)(例如,A ge^ri。)可為冒名頂替者和/或非真實(shí)用戶等的模型。冒名頂替 者和/或非真實(shí)用戶的模型可用于比較實(shí)際用戶模型。比較實(shí)際用戶模型可計(jì)算密集型和/ 或窮盡性的,因此可利用一些層級(jí)來(lái)限定搜索范圍(例如,性別、年齡、位置等)。另外或替代 地,通用術(shù)語(yǔ)(例如,A generi。)可為非用戶相依模型(例如,通用揚(yáng)聲器模型)。非用戶相依模 型可用于簡(jiǎn)化所述比較,其中可僅需要一個(gè)模型來(lái)用于比較。應(yīng)注意,可更新(如果需要,例 如)電子裝置102中和/或遠(yuǎn)程裝置(例如,遠(yuǎn)程服務(wù)器)中的通用模型(例如A eneri。)。在一 些實(shí)例中,可通過(guò)更新一或多個(gè)模型參數(shù)(例如,平均和/或混合權(quán)重)來(lái)更新通用模型???周期性地(例如,定期)和/或不定期地(例如,按需、基于更新確定等)執(zhí)行更新。
[0042]在其它配置中,唯一性量度(例如,似然比)可一般化為任意非遞減函數(shù)f。舉例來(lái) 說(shuō),可根據(jù)等式(2)來(lái)確定唯一性量度。
[0043
(2)
[0044] 在一些配置中,可如下獲得和/或更新通用語(yǔ)音模型。通用語(yǔ)音模型可為(例如,不 同于真實(shí)用戶的)其它用戶的語(yǔ)音進(jìn)行建模。在一些配置中,通用語(yǔ)音模型可為其它用戶的 "始終適應(yīng)模型"。另外或替代地,可(例如,通過(guò)電子裝置102或遠(yuǎn)程裝置)將音頻信號(hào)106 (例如,音頻口令)與其它用戶的模型進(jìn)行比較,如果它們使用同一系統(tǒng)(例如,具有同一遠(yuǎn) 程服務(wù)器)的話。在一些配置中,代替于將音頻信號(hào)106與UBM進(jìn)行比較來(lái)執(zhí)行此步驟。
[0045] 復(fù)雜性可為此方法的一個(gè)問(wèn)題,但可通過(guò)縮小搜索范圍來(lái)減輕復(fù)雜性。舉例來(lái)說(shuō), 可首先執(zhí)行基本信息檢索,例如性別、年齡、語(yǔ)言(包含地方方言)等。另外或替代地,電子裝 置102或遠(yuǎn)程裝置(例如,服務(wù)器)可嘗試定位用戶的物理住宅區(qū)或其一些歷史。接著可將音 頻信號(hào)1〇6(例如,音頻□令)與具有同一類別(例如,性別、年齡、語(yǔ)言、地方方言、物理區(qū)等) 的其它音頻信號(hào)的實(shí)際模型的小得多的集合進(jìn)行比較,其可正靜態(tài)或動(dòng)態(tài)地變化。電子裝 置102可動(dòng)態(tài)地(例如,取決于住宅區(qū)或他/她講的語(yǔ)言等)(向用戶)提供對(duì)口令的不同建 議。
[0046] 在一些配置中,通用語(yǔ)音模型可基于多個(gè)模型。舉例來(lái)說(shuō),通用語(yǔ)音模型可基于基 于具有從原始單個(gè)UBM更新的高可能性的高斯混合模型(GMM)狀態(tài)來(lái)群集多個(gè)UBM。另外或 替代地,通用語(yǔ)音模型可基于分組,所述分組基于可使用的物理區(qū)(例如,92121,圣地亞 哥),且可將用戶的模型與同一區(qū)中的人的模型進(jìn)行比較。
[0047] 口令評(píng)估模塊108可基于唯一性量度確定一或多個(gè)口令強(qiáng)度得分??诹顝?qiáng)度得分 可指示音頻口令的強(qiáng)度。舉例來(lái)說(shuō),口令強(qiáng)度得分可為整個(gè)音頻口令的強(qiáng)度的指示。另外或 替代地,可確定一或多個(gè)子級(jí)口令強(qiáng)度得分。在一些配置中,可基于唯一性量度的概述統(tǒng)計(jì) 來(lái)確定口令強(qiáng)度得分。
[0048] 在一些配置中,口令強(qiáng)度得分可為唯一性量度本身。另外或替代地,確定口令強(qiáng)度 得分可包含組合(例如,求和)唯一性量度的若干部分。另外或替代地,確定口令強(qiáng)度得分可 包含映射唯一性量度、映射唯一性量度的一或多個(gè)部分和/或映射一或多個(gè)概述統(tǒng)計(jì)到數(shù) 值(例如,百分比)、到詞語(yǔ)(例如,"弱"、"適中"、"強(qiáng)"等)和/或到一些其它指示符(例如,色 彩、形狀等)。
[0049] 在一些配置中,口令強(qiáng)度得分可為唯一性量度。舉例來(lái)說(shuō),可利用等式(1)和/或等 式(2)來(lái)獲得口令強(qiáng)度得分。應(yīng)注意,t可確定概述統(tǒng)計(jì)的長(zhǎng)度。舉例來(lái)說(shuō),可利用一些小常 數(shù)t(例如,幀長(zhǎng)度)來(lái)獲得唯一性量度(例如,連續(xù)得分)。結(jié)合圖3描述以小常數(shù)t獲得的唯 一"性量度的一個(gè)實(shí)例。
[0050] 在一些配置中,確定口令強(qiáng)度得分可包含組合(例如,求和、求平均等)唯一性量度 的若干部分。舉例來(lái)說(shuō),口令評(píng)估模塊108可在唯一性量度的某一周期上組合(例如,求和、 求平均等),以確定口令強(qiáng)度得分。舉例來(lái)說(shuō),口令評(píng)估模塊108可使用整個(gè)唯一性量度或所 述唯一性量度的一或多個(gè)足夠長(zhǎng)的時(shí)間幀來(lái)獲得經(jīng)平滑的得分。此經(jīng)平滑的得分可為口令 強(qiáng)度得分的一個(gè)實(shí)例。
[0051 ] 在一些配置中,如果t足夠長(zhǎng),那么口令強(qiáng)度得分可為唯一性量度本身,而不組合 唯一性量度的若干部分。然而,獲得唯一性量度的對(duì)應(yīng)于一或多個(gè)語(yǔ)音分量(例如,在音素 級(jí))的部分可為有益的,其可用于推薦和/或接入語(yǔ)音分量級(jí)(例如,音素級(jí))唯一性。接著可 組合唯一性量度的這些部分,以確定總口令強(qiáng)度得分。
[0052]在一些配置中,可獲得一或多個(gè)子級(jí)口令強(qiáng)度。舉例來(lái)說(shuō),所述子級(jí)口令強(qiáng)度中的 每一者可或可基于唯一性量度的所述部分。這可有益于使唯一性量度變窄到語(yǔ)音分量(例 如,音素)級(jí)。另外或替代地,口令評(píng)估模塊108可通過(guò)組合(例如,求和、求平均等)唯一性量 度的若干部分(但不是所有唯一性量度,舉例來(lái)說(shuō))來(lái)獲得一或多個(gè)子級(jí)口令強(qiáng)度。舉例來(lái) 說(shuō),口令評(píng)估模塊108可組合唯一性量度的分別對(duì)應(yīng)于語(yǔ)音分量的部分。在一種方法中,口 令評(píng)估模塊108可對(duì)唯一性量度的對(duì)應(yīng)于較大集合內(nèi)的音素(例如,詞語(yǔ)、短語(yǔ)、句子等)的 部分求和和/或求平均。以此方式,可確定一或多個(gè)較高級(jí)(例如,詞語(yǔ)級(jí)、短語(yǔ)級(jí)、句子級(jí) 等)口令強(qiáng)度得分。
[0053]在一些配置中,確定口令強(qiáng)度得分可包含將口令強(qiáng)度得分表達(dá)為和/或?qū)⒖诹顝?qiáng) 度得分映射到數(shù)值(例如,1〇%、43%、65%、90%等)、詞語(yǔ)(例如"弱"、"適中"、"強(qiáng)"等)和/ 或一些其它指示符(例如紅色、黃色、綠色等)。舉例來(lái)說(shuō),口令評(píng)估模塊108可使唯一性量度 (和/或所述唯一性量度的若干部分)的概述統(tǒng)計(jì)乘以某一因子(例如,100),以確定口令強(qiáng) 度得分。另外或替代地,口令評(píng)估模塊108可基于唯一性量度、所述唯一性量度的若干部分 和/或所述唯一性量度的概述統(tǒng)計(jì)來(lái)選擇(例如,查找)特定數(shù)值、詞語(yǔ)和/或某一其它指示 符,以確定口令強(qiáng)度得分。舉例來(lái)說(shuō),口令評(píng)估模塊108可基于唯一性量度、所述唯一性量度 的一個(gè)或若干部分和/或基于所述唯一性量度的一或多個(gè)量(例如,綜合、平均值、統(tǒng)計(jì)等) 來(lái)確定口令強(qiáng)度得分??蓪⑦@些量中的一或多者與一或多個(gè)閾值進(jìn)行比較,以確定口令強(qiáng) 度得分,和/或可基于這些量中的一或多者來(lái)(例如,在表中)查找口令強(qiáng)度得分。
[0054]在一些配置中,口令評(píng)估模塊108可確定音頻口令是否足夠強(qiáng)(例如,根據(jù)任意概 率,根據(jù)用戶偏好和/或足以使冒名頂替者非常不可能借助于發(fā)出音頻口令而作為真實(shí)用 戶通過(guò))。舉例來(lái)說(shuō),口令評(píng)估模塊108可將口令強(qiáng)度得分與值進(jìn)行比較。舉例來(lái)說(shuō),所述值 可為先前口令強(qiáng)度得分和/或閾值。所述值可為靜態(tài)(例如,預(yù)定)的和/或動(dòng)態(tài)的。在一些配 置中,所述值可由制造商設(shè)定和/或由用戶配置。所述值可表達(dá)為數(shù)值(例如,60%、80%、 90%等)和/或表達(dá)為詞語(yǔ)(例如,"適中"、"強(qiáng)"等)。所述值可建立描繪口令強(qiáng)度被認(rèn)為是充 分還是不充分的決策點(diǎn)。
[0055]在一些配置中,口令強(qiáng)度得分可結(jié)合音頻口令考慮一或多個(gè)額外驗(yàn)證輸入。舉例 來(lái)說(shuō),如果結(jié)合字母數(shù)字代碼或指紋掃描使用音頻口令,那么強(qiáng)度得分可反映音頻口令與 一或多個(gè)額外驗(yàn)證輸入(如果利用)的組合所提供的額外驗(yàn)證強(qiáng)度。
[0056]在一些配置中,電子裝置102(例如,口令評(píng)估模塊108)可接收一或多個(gè)額外驗(yàn)證 輸入。舉例來(lái)說(shuō),一些配置可允許使用其它模態(tài),例如視頻陀螺/加速計(jì)傳感器,鍵盤,指紋 傳感器等。在一些方法中,一或多個(gè)此類模態(tài)可用于具有較少唯一性或辯別強(qiáng)度的(短語(yǔ)、 句子等)的一或多個(gè)部分。舉例來(lái)說(shuō),當(dāng)用戶發(fā)出具有低唯一性的詞語(yǔ)(例如,具有較小可辨 別得分的詞語(yǔ)"學(xué)校")時(shí),電子裝置102可獲得或接收一或多個(gè)額外驗(yàn)證輸入。
[0057]所述一或多個(gè)額外驗(yàn)證輸入的實(shí)例如下給出。在電子裝置102具有手勢(shì)辨識(shí)的配 置中,電子裝置102可接收用戶所輸入的示意動(dòng)作(例如,觸摸屏圖案、觸摸墊圖案、相機(jī)所 捕獲的視覺手勢(shì)圖案等)。所述示意動(dòng)作可為用戶創(chuàng)建或預(yù)定義的。在電子裝置102包含相 機(jī)的配置中,電子裝置102可捕獲用戶的一或多個(gè)圖像,例如用戶的臉部、眼睛、鼻子、嘴唇、 面部形狀和/或更多的唯一信息,例如具有音頻信號(hào)106的虹膜。舉例來(lái)說(shuō),包含于電子裝置 102中的相機(jī)可(例如,通過(guò)用戶)瞄準(zhǔn)以捕獲用戶的臉部的全部或部分。
[0058] 在電子裝置102包含一或多個(gè)運(yùn)動(dòng)和/或定向傳感器(例如,陀螺儀、加速計(jì)、傾斜 傳感器等)的配置中,電子裝置102可獲得運(yùn)動(dòng)和/或定向信息。舉例來(lái)說(shuō),用戶可以用戶創(chuàng) 建或預(yù)定義的方式來(lái)定向和/或移動(dòng)電子裝置1〇2(例如,電話)。舉例來(lái)說(shuō),電子裝置102可 連同音頻信號(hào)106編碼陀螺和/或加速計(jì)傳感器信息。
[0059] 在電子裝置102包含物理或軟件小鍵盤或鍵盤的配置中,電子裝置102可連同音頻 信號(hào)106接收數(shù)值代碼、文本和/或字母數(shù)字串(例如,由用戶鍵入)。在電子裝置102包含指 紋傳感器的配置中,電子裝置102可接收指紋(例如,當(dāng)用戶觸摸或握持指紋傳感器時(shí))。
[0060] 在電子裝置102包含多個(gè)麥克風(fēng)104的配置中,電子裝置102可獲得(例如,接收和/ 或確定)音頻信號(hào)106的空間方向性信息。舉例來(lái)說(shuō),用戶可在相對(duì)于電子裝置102的一序列 方向(例如,頂部、底部、左、右、前、后、右上、左下等)上說(shuō)出音頻口令。舉例來(lái)說(shuō),用戶可朝 電子裝置102的底部說(shuō)出第一個(gè)字,朝電子裝置102的頂部說(shuō)出第二個(gè)字,朝電子裝置102的 左側(cè)說(shuō)出第三個(gè)字,且朝電子裝置102的右側(cè)說(shuō)出第四個(gè)字。
[0061] 可利用一或多個(gè)額外驗(yàn)證輸入,而無(wú)時(shí)序和/或序列限制。在一些實(shí)例中,電子裝 置102可在接收到音頻信號(hào)106之前、期間或之后的任何時(shí)間獲得一或多個(gè)額外驗(yàn)證輸入。
[0062] 在其它實(shí)例中,電子裝置102可要求(或經(jīng)配置以要求)相對(duì)于音頻信號(hào)106的接收 以某一時(shí)序約束條件和/或以某一序列接收所述一或多個(gè)額外驗(yàn)證輸入。在一實(shí)例中,電子 裝置102可要求(或經(jīng)配置以要求)在接收到音頻信號(hào)106之前、期間和/或之后的某一時(shí)間 周期內(nèi)接收一或多個(gè)額外驗(yàn)證輸入。舉例來(lái)說(shuō),電子裝置102可要求在音頻口令的較弱語(yǔ)音 分量期間接收額外驗(yàn)證輸入。舉例來(lái)說(shuō),假定對(duì)于音頻口令"綠洲是海市蜃樓",與音頻口令 的另一部分相比,"是"部分可為較不唯一或較弱。當(dāng)用戶發(fā)出"是"時(shí),電子裝置102可要求 (或經(jīng)配置以要求)接收額外驗(yàn)證輸入(例如,文本、數(shù)值代碼、字母數(shù)字串、空間方向性和/ 或額外生物計(jì)量(例如指紋掃描、用戶的臉部的相機(jī)圖像或虹膜等))。另外或替代地,電子 裝置102可要求(或經(jīng)配置以要求)以特定序列(例如,在語(yǔ)音分量之前、在語(yǔ)音分量之后、在 語(yǔ)音分量之間、在具有其它額外驗(yàn)證輸入的序列中等)接收額外驗(yàn)證輸入。
[0063] 在一些配置中,電子裝置102(例如,口令評(píng)估模塊108)可使音頻信號(hào)106和/或額 外驗(yàn)證輸入降級(jí)。舉例來(lái)說(shuō),電子裝置102可將信息從音頻信號(hào)106去除(例如,下取樣,濾除 所述音頻信號(hào)的一或多個(gè)部分)。另外或替代地,電子裝置102可將信息從指紋掃描或從用 戶的臉部或虹膜的圖像去除。此方法的一個(gè)益處是出于其安全或隱私原因,用戶可能不想 要共享確切或高品質(zhì)信息(例如,確切或高品質(zhì)生物計(jì)量信息,例如話音樣本、所掃描的指 紋、圖像等)。因此,降級(jí)的信息可為所捕獲信息的簡(jiǎn)化或降級(jí)版本。在一些配置中,單個(gè)模 態(tài)或輸入類型(例如,話音或語(yǔ)音、指紋、虹膜掃描等)的降級(jí)的信息本身無(wú)法用于可靠的用 戶識(shí)別。然而,來(lái)自多個(gè)模態(tài)或輸入類型的降級(jí)的信息的組合仍可提供強(qiáng)驗(yàn)證。因此,甚至 "虹膜"或"指紋"掃描可利用額外模態(tài),如話音口令,即使非降級(jí)版本本身可提供高唯一性 強(qiáng)度。
[0064] 口令評(píng)估模塊108可將評(píng)估信息110提供到口令反饋模塊112。評(píng)估信息110可包含 指示口令評(píng)估中獲得的口令強(qiáng)度和/或信息的信息。舉例來(lái)說(shuō),評(píng)估信息110可包含所提取 特征、唯一性量度、口令強(qiáng)度得分和/或其它信息。
[0065] 口令反饋模塊112可提供口令反饋114。舉例來(lái)說(shuō),口令反饋模塊112可基于對(duì)音頻 口令的強(qiáng)度的評(píng)估來(lái)告知用戶音頻口令較弱。提供口令反饋114可使用戶能夠確定(例如, 選擇、提供或創(chuàng)建)足夠強(qiáng)的音頻口令。口令反饋114可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分 量候選者(例如,所推薦或建議的語(yǔ)音分量)、一或多個(gè)所建議動(dòng)作和/或一或多個(gè)消息。舉 例來(lái)說(shuō),口令反饋114可包含指示音頻口令較弱的口令強(qiáng)度得分和消息。另外或替代地,口 令反饋114可包含用戶可用于創(chuàng)建較強(qiáng)音頻口令的一或多個(gè)建議語(yǔ)音分量。在一些配置中, 電子裝置102可提供由所建議的語(yǔ)音分量組成的所建議合成(例如未知)字作為口令反饋 114。另外或替代地,口令反饋114可包含用戶可提供額外驗(yàn)證輸入(例如,文本、數(shù)值代碼、 字母數(shù)字串、空間方向性、額外生物計(jì)量(例如面部掃描、虹膜掃描、指紋等))的所建議動(dòng) 作。
[0066] 在一些配置中,口令反饋模塊112可提供一或多個(gè)口令建議。舉例來(lái)說(shuō),電子裝置 102(例如,口令反饋模塊112)可識(shí)別具有足夠高的唯一性或與一或多個(gè)其它模型(例如,通 用語(yǔ)音模型、通用模型、UBM等)的區(qū)別來(lái)識(shí)別一或多個(gè)語(yǔ)音分量(例如,發(fā)聲、音素等)。舉例 來(lái)說(shuō),口令反饋模塊112可經(jīng)由一對(duì)語(yǔ)音辨識(shí)和揚(yáng)聲器檢驗(yàn)系統(tǒng),基于用戶針對(duì)每一音素的 話音的唯一性來(lái)識(shí)別一或多個(gè)語(yǔ)音分量。接著,口令反饋模塊112可產(chǎn)生一些可能候選語(yǔ)音 分量(例如,音素、音節(jié)、發(fā)聲、口令等),其具有高"唯一性",使得用戶可選擇一或多個(gè)候選 語(yǔ)音分量來(lái)創(chuàng)建口令。舉例來(lái)說(shuō),電子裝置102可顯示口令反饋114,例如:"你可使用/啊/、/ k/、…、〈三角形〉、〈高通〉、…"。另外或替代地,可為用戶發(fā)出的口令提供具體口令反饋114, 以較多地加強(qiáng)所述口令(例如,"你的口令具有60%強(qiáng)度。話語(yǔ)/嗯/可被/啊/...代替")。
[0067] 在一些配置中,電子裝置102(例如,口令反饋模塊112)可以多模態(tài)提供口令建議。 如上文所描述,例如,口令反饋模塊112可提供口令反饋114,其建議一或多個(gè)額外驗(yàn)證輸入 (例如,文本數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如,面部掃描、虹膜掃描、 指紋等))。
[0068] 在一些配置中,口令反饋模塊112可執(zhí)行以下操作中的一或多者,以產(chǎn)生口令反饋 114??诹罘答伳K112可基于一或多個(gè)所提取的特征執(zhí)行語(yǔ)音辨識(shí)。舉例來(lái)說(shuō),口令反饋模 塊112可基于一或多個(gè)所提取的特征來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量??衫没谳斎胩?供具有時(shí)間對(duì)準(zhǔn)的一序列音素的任何已知語(yǔ)音辨識(shí)器來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量???利用的語(yǔ)音辨識(shí)器的一個(gè)實(shí)例是隱式馬爾可夫模型工具包(HTK)。
[0069] 口令反饋模塊112可使唯一性量度與一或多個(gè)所辨識(shí)語(yǔ)音分量對(duì)準(zhǔn)。舉例來(lái)說(shuō),口 令反饋模塊112可使一或多個(gè)所辨識(shí)語(yǔ)音分量的出現(xiàn)率與唯一性量度在時(shí)間上對(duì)準(zhǔn)。在一 些配置中,每一語(yǔ)音分量(例如,音素)邊界的時(shí)間對(duì)準(zhǔn)是語(yǔ)音辨識(shí)的副產(chǎn)品中的一者。明確 地說(shuō),口令反饋模塊112可利用所辨識(shí)語(yǔ)音分量(例如,音素)的邊界信息以及對(duì)應(yīng)時(shí)間周期 內(nèi)的唯一性量度來(lái)產(chǎn)生經(jīng)對(duì)準(zhǔn)語(yǔ)音和唯一性。舉例來(lái)說(shuō),口令反饋模塊112可指定唯一性量 度的一或多個(gè)時(shí)間點(diǎn)作為語(yǔ)音分量邊界,如由語(yǔ)音辨識(shí)所提供夫人的語(yǔ)音分量邊界所指 不。
[0070] 口令反饋模塊112可基于唯一性量度對(duì)一或多個(gè)語(yǔ)音分量進(jìn)行分類。舉例來(lái)說(shuō),口 令反饋模塊112可確定一或多個(gè)語(yǔ)音分量中的每一者的唯一性(例如,強(qiáng)度或弱度)。在一些 配置中,口令反饋模塊112可將經(jīng)對(duì)準(zhǔn)語(yǔ)音分量中的每一者處的唯一性量度(或基于唯一性 量度的一些值,例如平均值、最大值、最小值等)與一或多個(gè)閾值進(jìn)行比較。如果對(duì)應(yīng)于語(yǔ)音 分量的唯一性量度(或基于唯一性量度的值)大于閾值,那么可將對(duì)應(yīng)的語(yǔ)音分量分類為足 夠唯一或足夠強(qiáng)。在一些配置中,分類為足夠唯一或足夠強(qiáng)(例如,大于閾值)的語(yǔ)音分量可 作為建議在口令反饋114中提供。此外,包含所述語(yǔ)音分量或類似語(yǔ)音分量的類似語(yǔ)音分量 和/或話語(yǔ)、字、短語(yǔ)和/或口令可作為建議在口令反饋114中提供。
[0071] 口令反饋模塊112可將口令反饋114提供到一或多個(gè)輸出裝置116。一或多個(gè)輸出 裝置116可因此向用戶中繼或傳達(dá)口令反饋114。舉例來(lái)說(shuō),輸出裝置116(例如,顯示器、觸 摸屏、揚(yáng)聲器等)可中繼與音頻口令的強(qiáng)度相關(guān)聯(lián)的標(biāo)記。在一個(gè)方法中,顯示面板可顯示 口令強(qiáng)度得分。另外或替代地,揚(yáng)聲器可輸出聲學(xué)信號(hào)(例如,文字到語(yǔ)音),其指示口令強(qiáng) 度得分(例如,"你的口令較弱"、"你的口令強(qiáng)度為60%"等)。
[0072] 在一些配置中,輸出裝置116可中繼一或多個(gè)建議。舉例來(lái)說(shuō),顯示面板可顯示一 或多個(gè)所建議語(yǔ)音分量,例如音素、音節(jié)、字、發(fā)聲和/或短語(yǔ)(例如7啊/、/嗯Λ/k/、/三角 形/、/海市蜃樓/")。另外或替代地,揚(yáng)聲器可輸出聲學(xué)信號(hào)以中繼一或多個(gè)建議(例如,"請(qǐng) 將/啊/、/嗯/、/k/、/三角形/、/海市蜃樓/和/或額外輸入類型添加到你的口令")。
[0073]在一些配置中,可經(jīng)由一或多個(gè)圖形用戶接口(GUI)提供口令反饋114。舉例來(lái)說(shuō), 標(biāo)記(例如,口令強(qiáng)度得分)、一或多個(gè)建議和/或一或多個(gè)消息可在⑶I上呈現(xiàn)。在一些配置 中,GUI還可提供用于接收用戶輸入的接口。舉例來(lái)說(shuō),用戶可經(jīng)由GUI選擇一或多個(gè)建議 (例如,一或多個(gè)候選語(yǔ)音分量、合成字、所建議口令、一或多個(gè)額外驗(yàn)證輸入選項(xiàng)等)。
[0074] 在一些配置中,電子裝置102可包含檢驗(yàn)?zāi)K(未圖示)。所述檢驗(yàn)?zāi)K可基于音頻 口令檢驗(yàn)說(shuō)話的用戶是否是真實(shí)用戶。應(yīng)注意,檢驗(yàn)程序可不同于口令評(píng)估程序。舉例來(lái) 說(shuō),檢驗(yàn)可不發(fā)生,直到□令(例如,音頻□令和/或一或多個(gè)額外驗(yàn)證輸入)被設(shè)定為止。因 此,如本文所揭示的口令評(píng)估和建議可包含不同于口令檢驗(yàn)的程序,例如其可僅在口令已 設(shè)定之后發(fā)生。
[0075] 圖2是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法200的一個(gè)配置的流程圖。結(jié)合圖1描 述的電子裝置102可執(zhí)行方法200。
[0076]電子裝置102可獲得(202) -或多個(gè)麥克風(fēng)104所捕獲的音頻信號(hào)106。此操作可如 上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。音頻信號(hào)106可包含音頻口令。
[0077]電子裝置102可基于測(cè)量音頻信號(hào)106的一或多個(gè)特性(例如,唯一特性)來(lái)評(píng)估 (204)音頻口令的強(qiáng)度。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō),電子裝置102可 用唯一性程度或與一或多個(gè)通用語(yǔ)音模型(例如,UBM)的區(qū)別來(lái)評(píng)估(204)音頻口令的一或 多個(gè)語(yǔ)音分量(例如,發(fā)聲、音素等)的強(qiáng)度。在一些配置中,口令評(píng)估模塊108可利用多個(gè)通 用語(yǔ)音模型(例如,UBM),如上文所描述。舉例來(lái)說(shuō),可基于用戶的輸入和/或特性(例如地理 位置(例如,郵政編碼、城市、縣、州、國(guó)家等)、性別、年齡、語(yǔ)言、地方方言等)來(lái)采用(例如, 選擇和/或適應(yīng)等)多個(gè)通用語(yǔ)音模型。
[0078] 在一些配置中,電子裝置102可基于如下測(cè)量音頻信號(hào)106的一或多個(gè)唯一特性來(lái) 評(píng)估(204)音頻口令的強(qiáng)度。電子裝置102可從音頻信號(hào)106提取一或多個(gè)特征。電子裝置 102可基于一或多個(gè)通用語(yǔ)音模型(例如,UMB)獲得音頻信號(hào)106的唯一性量度。電子裝置 102可基于所述唯一性量度來(lái)確定口令強(qiáng)度得分。
[0079] 在一些配置中,電子裝置102可確定音頻口令是否足夠強(qiáng)(例如,根據(jù)任意概率,根 據(jù)用戶偏好和/或足以使冒名頂替者非常不可能借助于發(fā)出音頻口令而作為真實(shí)用戶通 過(guò))。舉例來(lái)說(shuō),口令評(píng)估模塊108可將口令強(qiáng)度得分與一值進(jìn)行比較。所述值可為先前口令 強(qiáng)度得分和/或閾值。
[0080] 電子裝置102可提供口令反饋114。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái) 說(shuō),電子裝置102可基于音頻口令的強(qiáng)度的評(píng)估(例如,當(dāng)口令強(qiáng)度得分不大于值時(shí))來(lái)告知 (206)用戶音頻口令較弱??诹罘答?14可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例 如,所推薦或建議的語(yǔ)音分量)、一或多個(gè)所建議動(dòng)作和/或一或多個(gè)消息。舉例來(lái)說(shuō),口令 反饋114可包含指示音頻口令較弱的口令強(qiáng)度得分和消息。另外或替代地,口令反饋114可 包含用戶可用于創(chuàng)建較強(qiáng)音頻口令的一或多個(gè)建議語(yǔ)音分量。另外或替代地,口令反饋114 可包含用戶可提供額外驗(yàn)證輸入(例如,文本、數(shù)值代碼、字母數(shù)字串、空間方向性、額外生 物計(jì)量(例如面部掃描、虹膜掃描、指紋等))的所建議動(dòng)作。
[0081] 可將口令反饋114提供到一或多個(gè)輸出裝置116。一或多個(gè)輸出裝置116可因此向 用戶中繼或傳達(dá)口令反饋114 (例如,標(biāo)記、一或多個(gè)所建議語(yǔ)音分量、一或多個(gè)所建議動(dòng)作 等),如上文結(jié)合圖1所描述。
[0082] 電子裝置102可任選地檢驗(yàn)用戶輸入。舉例來(lái)說(shuō),電子裝置102可在口令(例如,音 頻口令和/或額外驗(yàn)證輸入)已設(shè)定之后接收用戶輸入。電子裝置102可確定用戶輸入是否 與口令充分匹配(例如,以足夠高的概率)。音頻口令檢驗(yàn)的一種方法是結(jié)合圖9所提供。如 果用戶輸入與口令充分匹配(例如,與閾值概率和/或根據(jù)額外驗(yàn)證輸入的一個(gè)或額外準(zhǔn) 則),那么電子裝置102可準(zhǔn)予接入。舉例來(lái)說(shuō),如果用戶輸入與口令充分匹配,那么電子裝 置102可允許用戶接入一或多個(gè)功能(例如,應(yīng)用程序、呼叫等)。
[0083]圖3包含說(shuō)明唯一性量度的實(shí)例的圖表。明確地說(shuō),圖3包含圖表A 318a、圖表 B318b和圖表C 318c。圖表A318a的垂直軸線梅爾頻率標(biāo)度說(shuō)明,且圖表A318a的水平軸以時(shí) 間(幀)說(shuō)明。圖表B 318b的垂直軸線說(shuō)明似然比,且圖表B 318b的水平軸以時(shí)間(幀)說(shuō)明。 圖表C 318c的垂直軸線說(shuō)明似然比,且圖表C 318c的水平軸以時(shí)間(幀)說(shuō)明。
[0084]圖表A 318a說(shuō)明隨音頻信號(hào)的時(shí)間過(guò)去的梅爾頻率的頻譜圖。所述音頻信號(hào)包含 短語(yǔ)(例如,音頻口令)"綠洲是海市蜃樓"。語(yǔ)音分量A 320包含話語(yǔ)"是"。語(yǔ)音分量B322在 詞語(yǔ)"海市蜃樓"中包含話語(yǔ)"啊"。
[0085]圖表B 318b說(shuō)明隨時(shí)間的過(guò)去,真實(shí)用戶(例如,待驗(yàn)證的真實(shí)揚(yáng)聲器或用戶)的 唯一性量度(例如,似然比)的一個(gè)實(shí)例。唯一性量度對(duì)應(yīng)于圖表A 318a。在此實(shí)例中,唯一 性量度是真實(shí)用戶的語(yǔ)音(例如,用戶語(yǔ)音模型)與UBM之間的似然比。如在圖表B318b中可 觀察到,語(yǔ)音分量A 320(例如,"是")具有低唯一性。然而,語(yǔ)音分量B 322(例如,"海市蜃 樓"中的"啊")針對(duì)真實(shí)用戶具有高唯一性。
[0086]圖表C 318c說(shuō)明隨時(shí)間過(guò)去冒名頂替者的唯一性量度(例如,似然比)的一個(gè)實(shí) 例。唯一性量度對(duì)應(yīng)于圖表A 318a。在此實(shí)例中,唯一性量度是冒名頂替者的語(yǔ)音(例如,冒 名頂替者語(yǔ)音模型)與UBM之間的似然比。如在圖表C 318c中可觀察到,語(yǔ)音分量A320 (例 如,"是")和語(yǔ)音分量B 322具有低唯一性。如圖3中所示,可利用提供真實(shí)用戶的升高的唯 一性(例如,似然比)但提供冒名頂替者的低似然比的語(yǔ)音分量(例如,音素、音節(jié)、字等)來(lái) 創(chuàng)建較強(qiáng)口令。
[0087]圖4是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置402的 更具體配置的框圖。結(jié)合圖4描述的電子裝置402可為結(jié)合圖1描述的電子裝置102的一個(gè)實(shí) 例。
[0088]電子裝置402包含一或多個(gè)麥克風(fēng)404、口令評(píng)估模塊408、口令反饋模塊412和一 或多個(gè)輸出裝置416。包含于電子裝置402中的組件中的一或多者可對(duì)應(yīng)于包含于結(jié)合圖1 描述的電子裝置102中的組件中的一或多者和/或可類似于其而起作用。
[0089] 電子裝置402可任選地包含通信模塊436。通信模塊436可使電子裝置402能夠與一 或多個(gè)遠(yuǎn)程裝置(例如,其它電子裝置、基站、服務(wù)器、計(jì)算機(jī)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施等)通信。通信 模塊436可提供無(wú)線和/或有線通信。舉例來(lái)說(shuō),通信模塊436可根據(jù)一或多個(gè)無(wú)線規(guī)范(例 如,第三代合作伙伴計(jì)劃(3GPP)規(guī)范、電氣電子工程師學(xué)會(huì)(IEEE)802.11規(guī)范等)與一或多 個(gè)其它裝置無(wú)線通信。另外或替代地,通信模塊436可經(jīng)由有線鏈路(例如,經(jīng)由以太網(wǎng)、有 線通信等)與其它裝置通信。
[0090] 一或多個(gè)麥克風(fēng)404可捕獲音頻信號(hào)406。音頻信號(hào)406可包含音頻口令。音頻口令 可包含用于檢驗(yàn)用戶的身份的一或多個(gè)聲音(例如,一或多個(gè)語(yǔ)音分量,例如音素、音節(jié)、詞 語(yǔ)、短語(yǔ)、語(yǔ)句、發(fā)聲等)??蓪⒁纛l信號(hào)406提供到口令評(píng)估模塊408。
[0091] 口令評(píng)估模塊408可包含特征提取模塊424、唯一性測(cè)量模塊428和/或口令強(qiáng)度計(jì) 分模塊432。
[0092] 口令評(píng)估模塊408(例如,特征提取模塊424)可獲得(例如,接收)一或多個(gè)麥克風(fēng) 404所捕獲的音頻信號(hào)406。特征提取模塊424可從音頻信號(hào)406提取一或多個(gè)特征以獲得所 提取特征426。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō),特征提取模塊424可基于 音頻信號(hào)406確定一或多個(gè)MFCC JFCC可為所提取特征426的一個(gè)實(shí)例。特征提取模塊424可 耦合到唯一性測(cè)量模塊428。特征提取模塊424可將所提取的特征426提供到唯一性測(cè)量模 塊428。
[0093] 唯一性測(cè)量模塊428可基于一或多個(gè)通用語(yǔ)音模型(例如,UMB)獲得音頻信號(hào)406 的唯一性量度430。在一些配置中,唯一性量度可為音頻信號(hào)406與通用語(yǔ)音模型之間的似 然比。圖3中的圖表B 318b說(shuō)明唯一性量度430 (例如,似然比)的一個(gè)實(shí)例。在一些配置中, 電子裝置402可本地確定(例如,計(jì)算)唯一性量度430。舉例來(lái)說(shuō),電子裝置402可本地存儲(chǔ) 一或多個(gè)通用語(yǔ)音模型,其可用來(lái)確定唯一性量度430。在其它配置中,電子裝置402可從遠(yuǎn) 程裝置(例如,服務(wù)器、中央服務(wù)器)接收唯一性量度430。舉例來(lái)說(shuō),遠(yuǎn)程裝置(例如,服務(wù) 器、中央服務(wù)器)可存儲(chǔ)一或多個(gè)通用語(yǔ)音模型,其可用于遠(yuǎn)程確定唯一性量度430。
[0094]在一些配置中,可如上文結(jié)合圖1所描述,可獲得和/或更新通用語(yǔ)音模型。舉例來(lái) 說(shuō),電子裝置402和/或遠(yuǎn)程裝置(例如,服務(wù)器)可獲得和/或更新通用語(yǔ)音模型。在一些配 置中,電子裝置402可獲得和/或更新通用語(yǔ)音模型。舉例來(lái)說(shuō),電子裝置402(例如,唯一性 測(cè)量模塊428)可存儲(chǔ)用于通用語(yǔ)音模型的預(yù)定數(shù)據(jù)。電子裝置402可任選地通過(guò)經(jīng)由通信 模塊436從遠(yuǎn)程裝置(例如,服務(wù)器、中央服務(wù)器等)接收數(shù)據(jù)來(lái)更新通用語(yǔ)音模型。
[0095]在一些配置中,電子裝置402(例如,唯一性測(cè)量模塊428)可接收和/或確定用戶特 性(例如,性別、年齡、位置等)。舉例來(lái)說(shuō),唯一性測(cè)量模塊428可獲得如由用戶經(jīng)由一或多 個(gè)輸入裝置輸入的用戶特性。電子裝置402(例如,唯一性測(cè)量模塊428)可任選地將通用語(yǔ) 音模型(例如,UBM)更新請(qǐng)求發(fā)送到遠(yuǎn)程裝置(例如,服務(wù)器、中央服務(wù)器等)。在一些方法 中,通用語(yǔ)音模型更新請(qǐng)求可包含用戶特性的一或多個(gè)指示符。所述遠(yuǎn)程裝置可任選地(基 于例如用戶特性)為電子裝置402的通用語(yǔ)音模型確定更新。所述遠(yuǎn)程裝置可將通用語(yǔ)音模 型(例如,UBM)更新數(shù)據(jù)發(fā)送到電子裝置402。通用語(yǔ)音模型更新數(shù)據(jù)可基于用戶特性,其可 由所述電子裝置402用于適應(yīng)或修改電子裝置402(例如,唯一性測(cè)量模塊428)所使用的通 用語(yǔ)音模型。
[0096] 在一些配置中,電子裝置402可將唯一性量度請(qǐng)求發(fā)送到遠(yuǎn)程裝置。舉例來(lái)說(shuō),唯 一性測(cè)量模塊428可將唯一性量度請(qǐng)求提供到通信模塊436,其可將唯一性量度請(qǐng)求發(fā)送到 遠(yuǎn)程裝置(例如,服務(wù)器)。唯一性量度請(qǐng)求可包含關(guān)于音頻信號(hào)106的信息(例如,所提取特 征426)。在此方法中,遠(yuǎn)程裝置(例如,服務(wù)器)可基于一或多個(gè)通用語(yǔ)音模型(例如,UBM)確 定(例如,計(jì)算)唯一性量度430(例如,似然比)。電子裝置402 (例如,通信模塊436)可接收唯 一性量度430,并將唯一性量度430提供到唯一性測(cè)量模塊428。
[0097]應(yīng)注意,在一些配置中,遠(yuǎn)程裝置可基于用戶信息(例如,位置、年齡、性別等)獲 得、維持和/或適應(yīng)其通用語(yǔ)音模型。所述用戶信息可由遠(yuǎn)程裝置從電子裝置402、一或多個(gè) 其它裝置和/或一或多個(gè)第三方接收。遠(yuǎn)程裝置接著可將唯一性量度發(fā)送到電子裝置402。 [0098]唯一性測(cè)量模塊428可將唯一性量度430提供到口令強(qiáng)度計(jì)分模塊432??诹顝?qiáng)度 計(jì)分模塊432可基于唯一性量度430確定一或多個(gè)口令強(qiáng)度得分434。此操作可如上文結(jié)合 圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō),口令強(qiáng)度得分可為唯一性量度,和/或確定口令強(qiáng)度得分可包 含組合(例如,求和、求平均等)所述唯一性量度的若干部分。另外或替代地,確定口令強(qiáng)度 得分可包含映射唯一"性量度、映射所述唯一"性量度的一或多個(gè)部分和/或映射一或多個(gè)概 述統(tǒng)計(jì)到數(shù)值(例如,百分比)、到字(例如,"弱"、"適中"、"強(qiáng)"等)和/或到一些其它指示符 (例如,色彩、形狀等)。
[0099] 口令強(qiáng)度計(jì)分模塊432可確定音頻口令是否足夠強(qiáng),如上文結(jié)合圖1所描述。舉例 來(lái)說(shuō),口令強(qiáng)度計(jì)分模塊432可將口令強(qiáng)度得分434與一或多個(gè)值(例如,先前口令強(qiáng)度得分 和/或閾值)進(jìn)行比較。在一些配置中,口令強(qiáng)度得分可結(jié)合音頻口令反映一或多個(gè)額外驗(yàn) 證輸入(例如,空間方向性、文本、數(shù)值代碼、字母數(shù)字串、額外生物計(jì)量等)。在一些配置中, 電子裝置402(例如,口令評(píng)估模塊408)可使音頻信號(hào)406和/或額外驗(yàn)證輸入降級(jí)。
[0100] 口令評(píng)估模塊408可將評(píng)估信息提供到口令反饋模塊412。舉例來(lái)說(shuō),評(píng)估信息410 可包含所提取特征426、唯一性量度430、口令強(qiáng)度得分434和/或其它信息。
[0101] 口令反饋模塊412可任選地包含語(yǔ)音辨識(shí)模塊438、對(duì)準(zhǔn)模塊442和/或語(yǔ)音分量分 類模塊446語(yǔ)音辨識(shí)模塊438可基于一或多個(gè)所提取的特征426執(zhí)行語(yǔ)音辨識(shí)。舉例來(lái)說(shuō),口 令反饋模塊412可基于一或多個(gè)所提取的特征426來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量440。此 操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。語(yǔ)音辨識(shí)模塊438可將所辨識(shí)的語(yǔ)音分量440提供到 對(duì)準(zhǔn)模塊442。
[0102] 對(duì)準(zhǔn)模塊442可使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn)。舉例來(lái)說(shuō), 對(duì)準(zhǔn)模塊442可使一或多個(gè)所辨識(shí)語(yǔ)音分量440的出現(xiàn)與唯一性量度在時(shí)間上對(duì)準(zhǔn),以產(chǎn)生 對(duì)準(zhǔn)語(yǔ)音和唯一性444。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。對(duì)準(zhǔn)模塊442可將經(jīng)對(duì)準(zhǔn)的 語(yǔ)音和唯一性444提供到語(yǔ)音分量分類模塊446。
[0103] 語(yǔ)音分量分類模塊446可基于唯一性量度430對(duì)一或多個(gè)語(yǔ)音分量(例如,所辨識(shí) 語(yǔ)音分量440)進(jìn)行分類。舉例來(lái)說(shuō),口令反饋模塊412可確定經(jīng)對(duì)準(zhǔn)語(yǔ)音和唯一性444中的 一或多個(gè)所辨識(shí)語(yǔ)音分量中的每一者的唯一性(例如,強(qiáng)度或弱度)。在一些配置中,口令反 饋模塊412可將經(jīng)對(duì)準(zhǔn)語(yǔ)音分量中的每一者處的唯一性量度(或基于唯一性量度的一些值, 例如平均值、最大值、最小值等)與一或多個(gè)閾值進(jìn)行比較。如果對(duì)應(yīng)于語(yǔ)音分量的唯一性 量度(或基于唯一性量度的值)大于閾值,那么可將對(duì)應(yīng)的語(yǔ)音分量分類為足夠唯一或足夠 強(qiáng)。在一些配置中,分類為足夠唯一或足夠強(qiáng)(例如,大于閾值)的語(yǔ)音分量可作為建議在口 令反饋414中提供。此外,包含所述語(yǔ)音分量或類似語(yǔ)音分量的類似語(yǔ)音分量和/或話語(yǔ)、 字、短語(yǔ)和/或口令可作為建議在口令反饋414中提供。
[0104] 口令反饋模塊412可將口令反饋414提供到一或多個(gè)輸出裝置416??诹罘答?14可 包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如,所推薦或所建議語(yǔ)音分量、一或多個(gè) 所建議動(dòng)作(例如,建議一或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。一或多個(gè)輸出裝置 416可因此向用戶中繼或傳達(dá)口令反饋414。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái) 說(shuō),輸出裝置416可輸出口令反饋414作為文本、圖像和/或聲音。所述輸出可中繼標(biāo)記(例 如,口令強(qiáng)度得分)、一或多個(gè)語(yǔ)音分量候選者(例如,所推薦或所建議語(yǔ)音分量)、一或多個(gè) 所建議動(dòng)作(例如,建議一或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。
[0105] 圖5是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法500的更具體配置的流程圖。結(jié)合圖1 和4描述的電子裝置102、402中的一或多者可執(zhí)行方法500。
[0106]電子裝置402可基于預(yù)訓(xùn)練任選地提供(502)-或多個(gè)候選語(yǔ)音分量。結(jié)合圖10描 述基于預(yù)訓(xùn)練提供(502)-或多個(gè)候選語(yǔ)音分量的實(shí)例。
[0107] 電子裝置402可獲得(504) -或多個(gè)麥克風(fēng)404所捕獲的音頻信號(hào)406。這可如上文 結(jié)合圖1到2以及4中的一或多者所描述來(lái)實(shí)現(xiàn)。音頻信號(hào)106可包含音頻口令。音頻口令可 包含用于檢驗(yàn)用戶的身份的一或多個(gè)聲音(例如,一或多個(gè)語(yǔ)音分量,例如音素、音節(jié)、詞 語(yǔ)、短語(yǔ)、語(yǔ)句、發(fā)聲等)。
[0108] 電子裝置402可從音頻信號(hào)406提取(506) -或多個(gè)特征以獲得所提取特征426。這 可如上文結(jié)合圖1和4中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō),電子裝置402可基于音頻信號(hào) 406確定一或多個(gè)MFCC JFCC可為所提取特征426的一個(gè)實(shí)例。
[0109] 電子裝置402可基于一或多個(gè)通用語(yǔ)音模型(例如,UMB)獲得(508)音頻信號(hào)406的 唯一性量度430。這可如上文結(jié)合圖1到4中的一或多者所描述來(lái)實(shí)現(xiàn)。在一些配置中,唯一 性量度可為音頻信號(hào)406與通用語(yǔ)音模型之間的似然比。在一些配置中,電子裝置402可本 地確定(例如,計(jì)算)唯一性量度430。舉例來(lái)說(shuō),電子裝置402可本地存儲(chǔ)一或多個(gè)通用語(yǔ)音 模型(例如,本地UBM),其可用來(lái)確定唯一性量度430。在其它配置中,電子裝置402可從遠(yuǎn)程 裝置(例如,服務(wù)器、中央服務(wù)器)接收唯一性量度430。舉例來(lái)說(shuō),遠(yuǎn)程裝置(例如,服務(wù)器、 中央服務(wù)器)可存儲(chǔ)一或多個(gè)通用語(yǔ)音模型,其可用于遠(yuǎn)程確定唯一性量度430。在一些配 置中,電子裝置402可將唯一性量度請(qǐng)求發(fā)送到遠(yuǎn)程裝置。唯一性量度請(qǐng)求可包含關(guān)于音頻 信號(hào)406的信息(例如,所提取特征426)。在此方法中,遠(yuǎn)程裝置(例如,服務(wù)器)可基于一或 多個(gè)通用語(yǔ)音模型(例如,UBM)確定(例如,計(jì)算)唯一性量度430(例如,似然比)。電子裝置 402可接收唯一性量度430。
[0110]電子裝置402可基于所述唯一性量度430來(lái)確定(510) 口令強(qiáng)度得分434。這可如上 文結(jié)合圖1和4中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0111] 電子裝置402可確定(512) 口令強(qiáng)度得分是否大于一值。這可如上文結(jié)合圖1和4中 的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō),電子裝置402可將口令強(qiáng)度得分434與一值(例如,先 前口令強(qiáng)度得分和/或閾值)進(jìn)行比較。
[0112] 如果口令強(qiáng)度得分434大于所述值(例如,先前口令強(qiáng)度得分和/或閾值),那么電 子裝置402可基于音頻信號(hào)406設(shè)定(516) 口令。在一些配置中,電子裝置402可存儲(chǔ)音頻信 號(hào)406和/或指定音頻信號(hào)406作為口令。另外或替代地,電子裝置402可存儲(chǔ)和/或指定包含 于作為口令的音頻信號(hào)406中的所辨識(shí)語(yǔ)音分量的組合。
[0113] 如果口令強(qiáng)度得分434不大于所述值(例如,小于或等于所述值),那么電子裝置 402可提供(514) 口令反饋。這可如上文結(jié)合圖1到2以及4中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例 來(lái)說(shuō),電子裝置402可提供和/或輸出口令反饋414。口令反饋414可包含口令強(qiáng)度得分、一或 多個(gè)語(yǔ)音分量候選者(例如,所推薦或所建議語(yǔ)音分量、一或多個(gè)所建議動(dòng)作(例如,建議一 或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。舉例來(lái)說(shuō),電子裝置402可輸出口令反饋414作 為文本、圖像和/或聲音。所述輸出可中繼標(biāo)記(例如,口令強(qiáng)度得分)、一或多個(gè)語(yǔ)音分量候 選者(例如,所推薦或所建議語(yǔ)音分量)、一或多個(gè)所建議動(dòng)作(例如,建議一或多個(gè)額外驗(yàn) 證輸入)和/或一或多個(gè)消息。
[0114] 圖6是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法600的另一更具體配置的流程圖。明確 地說(shuō),這種配置提供可執(zhí)行以便提供一或多個(gè)建議的操作的實(shí)例。結(jié)合圖1和4描述的電子 裝置102、402中的一或多者可執(zhí)行方法600。
[0115] 電子裝置402可基于預(yù)訓(xùn)練任選地提供(602)-或多個(gè)候選語(yǔ)音分量。結(jié)合圖10描 述基于預(yù)訓(xùn)練提供(602)-或多個(gè)候選語(yǔ)音分量的實(shí)例。
[0116] 電子裝置402可獲得(604) -或多個(gè)麥克風(fēng)404所捕獲的音頻信號(hào)406。這可如上文 結(jié)合圖1到2以及4到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0117] 電子裝置402可從音頻信號(hào)406提取(606)-或多個(gè)特征以獲得所提取特征426。這 可如上文結(jié)合圖1以及4到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0118] 電子裝置402可基于一或多個(gè)通用語(yǔ)音模型(例如,UMB)獲得(608)音頻信號(hào)406的 唯一性量度430。這可如上文結(jié)合圖1以及4到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0119] 電子裝置402可基于所述唯一性量度430來(lái)確定(610) 口令強(qiáng)度得分434。這可如上 文結(jié)合圖1以及4到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0120] 電子裝置402可確定(612) 口令強(qiáng)度得分是否大于一值。這可如上文結(jié)合圖1以及4 到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0121] 如果口令強(qiáng)度得分434大于所述值(例如,先前口令強(qiáng)度得分和/或閾值),那么電 子裝置402可基于音頻信號(hào)406來(lái)設(shè)定(622) 口令。此操作可如上文結(jié)合圖5所描述來(lái)實(shí)現(xiàn)。
[0122] 如果口令強(qiáng)度得分434不大于所述值(例如,小于或等于所述值),那么電子裝置 402可基于一或多個(gè)所提取的特征426來(lái)執(zhí)行(614)語(yǔ)音辨識(shí)。舉例來(lái)說(shuō),電子裝置402可基 于一或多個(gè)所提取的特征426來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量440。此操作可如上文結(jié)合圖 1所描述來(lái)實(shí)現(xiàn)。
[0123] 電子裝置402可使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn)(616)。舉例 來(lái)說(shuō),電子裝置402可使一或多個(gè)所辨識(shí)語(yǔ)音分量的出現(xiàn)與所述唯一性量度在時(shí)間上對(duì)準(zhǔn), 以產(chǎn)生經(jīng)對(duì)準(zhǔn)的語(yǔ)音和唯一性444。這可如上文結(jié)合圖1和4中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0124] 電子裝置402可基于唯一性量度430對(duì)一或多個(gè)語(yǔ)音分量(例如,所辨識(shí)語(yǔ)音分量 440)進(jìn)行分類(618)。舉例來(lái)說(shuō),電子裝置402可確定經(jīng)對(duì)準(zhǔn)語(yǔ)音和唯一性444中的一或多個(gè) 所辨識(shí)語(yǔ)音分量中的每一者的唯一性(例如,強(qiáng)度或弱度)。在一些配置中,口令反饋模塊 412可將經(jīng)對(duì)準(zhǔn)語(yǔ)音分量中的每一者處的唯一性量度(或基于唯一性量度的一些值,例如平 均值、最大值、最小值等)與一或多個(gè)閾值進(jìn)行比較。如果對(duì)應(yīng)于語(yǔ)音分量的唯一性量度(或 基于唯一性量度的值)大于閾值,那么可將對(duì)應(yīng)的語(yǔ)音分量分類為足夠唯一或足夠強(qiáng)。在一 些配置中,分類為足夠唯一或足夠強(qiáng)(例如,大于閾值)的語(yǔ)音分量可作為建議在口令反饋 414中提供(620)。此外,包含所述語(yǔ)音分量或類似語(yǔ)音分量的類似語(yǔ)音分量和/或話語(yǔ)、字、 短語(yǔ)和/或口令可作為建議在口令反饋414中提供(620)。
[0125] 電子裝置402可提供(620) 口令反饋。此操作可如上文結(jié)合圖1以及4到5中的一或 多者所描述而實(shí)現(xiàn)。舉例來(lái)說(shuō),電子裝置402可提供和/或輸出口令反饋414。口令反饋414可 包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如,所推薦或所建議語(yǔ)音分量、一或多個(gè) 所建議動(dòng)作(例如,建議一或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。舉例來(lái)說(shuō),電子裝置 402可輸出口令反饋414作為文本、圖像和/或聲音。所述輸出可中繼標(biāo)記(例如,口令強(qiáng)度得 分)、一或多個(gè)語(yǔ)音分量候選者(例如,所推薦或所建議語(yǔ)音分量)、一或多個(gè)所建議動(dòng)作(例 如,建議一或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。在一些配置中,電子裝置402可提供 (620)由所建議的語(yǔ)音分量組成的所建議合成(例如未知)字作為口令反饋。
[0126] 圖7是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法700的另一更具體配置的流程圖。明確 地說(shuō),這種配置提供可為用其它用戶的模型進(jìn)行口令強(qiáng)度評(píng)估和建議執(zhí)行的操作的實(shí)例。 結(jié)合圖1和4描述的電子裝置102、402中的一或多者可執(zhí)行方法700。
[0127] 電子裝置402可基于預(yù)訓(xùn)練任選地提供(702)-或多個(gè)候選語(yǔ)音分量。結(jié)合圖10描 述基于預(yù)訓(xùn)練提供(702)-或多個(gè)候選語(yǔ)音分量的實(shí)例。
[0128] 電子裝置402可獲得(704) -或多個(gè)麥克風(fēng)404所捕獲的音頻信號(hào)406。這可如上文 結(jié)合圖1到2以及4到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0129] 電子裝置402可從音頻信號(hào)406提取(706)-或多個(gè)特征以獲得所提取特征426。這 可如上文結(jié)合圖1以及4到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0130]電子裝置402可將唯一性量度請(qǐng)求發(fā)送(708)(例如,到遠(yuǎn)程裝置)。此操作可如上 文結(jié)合圖4所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō),電子裝置402可經(jīng)由有線和/或無(wú)線通信將唯一性量度 請(qǐng)求發(fā)送到遠(yuǎn)程裝置(例如,服務(wù)器)。唯一性量度請(qǐng)求可包含關(guān)于音頻信號(hào)406的信息(例 如,所提取特征426)。在此方法中,遠(yuǎn)程裝置(例如,服務(wù)器)可基于一或多個(gè)通用語(yǔ)音模型 (例如,UBM、其它用戶的語(yǔ)音模型等)確定(例如,計(jì)算)唯一性量度430(例如,似然比)。應(yīng)注 意,在一些配置中,遠(yuǎn)程裝置可基于用戶信息(例如,位置、年齡、性別等)獲得、維持和/或適 應(yīng)其通用語(yǔ)音模型。所述用戶信息可由遠(yuǎn)程裝置從電子裝置402、一或多個(gè)其它裝置和/或 一或多個(gè)第三方接收。遠(yuǎn)程裝置接著可將唯一性量度發(fā)送到電子裝置402。
[0131] 電子裝置402(例如,通信模塊436)可接收(710)唯一性量度430。舉例來(lái)說(shuō),電子裝 置402可經(jīng)由有線和/或無(wú)線通信從遠(yuǎn)程裝置(例如,服務(wù)器)接收(710)唯一性量度430。
[0132] 電子裝置402可基于所述唯一性量度430來(lái)確定(712) 口令強(qiáng)度得分434。這可如上 文結(jié)合圖1以及4到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0133] 電子裝置402可確定(714) 口令強(qiáng)度得分是否大于一值。這可如上文結(jié)合圖1以及4 到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0134] 如果口令強(qiáng)度得分434大于所述值(例如,先前口令強(qiáng)度得分和/或閾值),那么電 子裝置402可基于音頻信號(hào)406來(lái)設(shè)定(724) 口令。這可如上文結(jié)合圖5到6中的一或多者所 描述來(lái)實(shí)現(xiàn)。
[0135] 如果口令強(qiáng)度得分434不大于所述值(例如,小于或等于所述值),那么電子裝置 402可基于一或多個(gè)所提取的特征426任選地執(zhí)行(716)語(yǔ)音辨識(shí)。這可如上文結(jié)合圖1到6 中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0136] 電子裝置402可任選地使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn) (718)。這可如上文結(jié)合圖1、4和6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0137] 電子裝置402可任選地基于唯一性量度430對(duì)一或多個(gè)語(yǔ)音分量(例如,所辨識(shí)語(yǔ) 音分量440)進(jìn)行分類(720)。這可如上文結(jié)合圖1、4和6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0138] 電子裝置402可提供(722) 口令反饋。這可如上文結(jié)合圖1以及4到6中的一或多者 所描述來(lái)實(shí)現(xiàn)。
[0139] 圖8是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法800的另一更具體配置的流程圖。明確 地說(shuō),這種配置提供可執(zhí)行以用于更新通用語(yǔ)音模型的操作的實(shí)例。結(jié)合圖1和4描述的電 子裝置102、402中的一或多者可執(zhí)行方法800。
[0140]電子裝置402可基于預(yù)訓(xùn)練任選地提供(802)-或多個(gè)候選語(yǔ)音分量。結(jié)合圖10描 述基于預(yù)訓(xùn)練提供(802)-或多個(gè)候選語(yǔ)音分量的實(shí)例。
[0141] 電子裝置402可獲得(804) -或多個(gè)麥克風(fēng)404所捕獲的音頻信號(hào)406。這可如上文 結(jié)合圖1到2以及4到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0142] 電子裝置402可從音頻信號(hào)406提取(806)-或多個(gè)特征以獲得所提取特征426。這 可如上文結(jié)合圖1以及4到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0143] 電子裝置402可獲得(808)-或多個(gè)用戶特性。用戶特性的實(shí)例包含地理位置(例 如,郵政編碼、城市、縣、州、國(guó)家等)、性別、年齡、語(yǔ)言和/或地方方言等。舉例來(lái)說(shuō),電子裝 置402可(例如,從用戶)接收指示一或多個(gè)用戶特性的一或多個(gè)輸入。另外或替代地,電子 裝置402可從一或多個(gè)傳感器獲得(808)-或多個(gè)用戶特性。舉例來(lái)說(shuō),電子裝置402可基于 從麥克風(fēng)404捕獲的音頻來(lái)確定用戶的性別、語(yǔ)言和/或地方方言。另外或替代地,電子裝置 402可基于從麥克風(fēng)404捕獲的音頻來(lái)估計(jì)用戶年齡。另外或替代地,電子裝置402可基于來(lái) 自全球定位系統(tǒng)(GPS)模塊的數(shù)據(jù)確定地理位置。另外或替代地,電子裝置402可從遠(yuǎn)程裝 置(例如,服務(wù)提供商服務(wù)器)請(qǐng)求一或多個(gè)用戶特性。
[0144] 電子裝置402可基于一或多個(gè)用戶特性更新(810)通用語(yǔ)音模型。這可如上文結(jié)合 圖1和4中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō),電子裝置402和/或遠(yuǎn)程裝置(例如,服務(wù)器) 可更新(810)通用語(yǔ)音模型。在一些配置中,電子裝置402可基于用戶特性來(lái)本地更新(810) 通用語(yǔ)音模型。舉例來(lái)說(shuō),電子裝置402可任選地存儲(chǔ)用于通用語(yǔ)音模型的預(yù)定數(shù)據(jù),電子 裝置402可通過(guò)僅包含具有類似于所述用戶的特性的特性的其它用戶的數(shù)據(jù)來(lái)本地更新 (810)所述預(yù)定數(shù)據(jù)。
[0145] 電子裝置402可通過(guò)經(jīng)由通信模塊436將用戶特性發(fā)送到遠(yuǎn)程裝置(例如,服務(wù)器) 和/或從遠(yuǎn)程裝置(例如,服務(wù)器、中央服務(wù)器等)接收數(shù)據(jù),基于用戶特性來(lái)任選地更新 (810)通用語(yǔ)音模型。舉例來(lái)說(shuō),電子裝置402可將通用語(yǔ)音模型(例如,UBM)更新請(qǐng)求發(fā)送 到遠(yuǎn)程裝置(例如,服務(wù)器、中央服務(wù)器等)。在一些方法中,通用語(yǔ)音模型更新請(qǐng)求可包含 用戶特性的一或多個(gè)指示符。在一些配置中,遠(yuǎn)程裝置可基于用戶特性來(lái)更新存儲(chǔ)在遠(yuǎn)程 裝置上的一或多個(gè)通用語(yǔ)音模型。另外或替代地,遠(yuǎn)程裝置可(例如,基于用戶特性)任選地 確定對(duì)電子裝置402的通用語(yǔ)音模型的更新。所述遠(yuǎn)程裝置可將通用語(yǔ)音模型(例如,UBM) 更新數(shù)據(jù)發(fā)送到電子裝置402。
[0146] 電子裝置402可基于一或多個(gè)通用語(yǔ)音模型(例如,UMB)獲得(812)音頻信號(hào)406的 唯一性量度430。這可如上文結(jié)合圖1以及4到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0147] 電子裝置402可基于所述唯一性量度430來(lái)確定(814) 口令強(qiáng)度得分434。這可如上 文結(jié)合圖1以及4到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0148] 電子裝置402可確定(816) 口令強(qiáng)度得分是否大于一值。這可如上文結(jié)合圖1以及4 到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0149] 如果口令強(qiáng)度得分434大于所述值(例如,先前口令強(qiáng)度得分和/或閾值),那么電 子裝置402可基于音頻信號(hào)406來(lái)設(shè)定(826) 口令。這可如上文結(jié)合圖5到7中的一或多者所 描述來(lái)實(shí)現(xiàn)。
[0150] 如果口令強(qiáng)度得分434不大于所述值(例如,小于或等于所述值),那么電子裝置 402可任選地基于一或多個(gè)所提取的特征426執(zhí)行(818)語(yǔ)音辨識(shí)。這可如上文結(jié)合圖1以及 6到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0151] 電子裝置402可任選地使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn) (820)。這可如上文結(jié)合圖1、4以及6到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0152] 電子裝置402可任選地基于唯一性量度430對(duì)一或多個(gè)語(yǔ)音分量(例如,所辨識(shí)語(yǔ) 音分量440)進(jìn)行分類(822)。這可如上文結(jié)合圖1、4以及6到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0153] 電子裝置402可提供(824) 口令反饋。這可如上文結(jié)合圖1以及4到7中的一或多者 所描述來(lái)實(shí)現(xiàn)。
[0154] 圖9是說(shuō)明揚(yáng)聲器(例如,用戶)辨識(shí)模型的一個(gè)實(shí)例的框圖。揚(yáng)聲器辨識(shí)模型可基 于文本無(wú)關(guān)揚(yáng)聲器辨識(shí)。一個(gè)模型是基于MFCC和UBM-GMM。這包含使用GMM來(lái)訓(xùn)練UBM。如圖9 中所示,訓(xùn)練948可包含將訓(xùn)練語(yǔ)音950用于通用語(yǔ)音模型產(chǎn)生952。
[0155] 在一些方法中,可使用對(duì)通用語(yǔ)音模型(例如,UBM)的最大后驗(yàn)概率(MAP)適應(yīng)來(lái) 執(zhí)行揚(yáng)聲器登記954。如圖9中所示,登記954(例如,適應(yīng))可包含將用戶話語(yǔ)956用于用戶語(yǔ) 音模型產(chǎn)生958。
[0156] 在一些方法中,可通過(guò)比較通用語(yǔ)音模型(例如,UBM)與每一所登記揚(yáng)聲器模型之 間的似然比來(lái)檢驗(yàn)每一語(yǔ)音話語(yǔ)962。如圖9中所示,可在檢驗(yàn)(964)程序中利用每一話語(yǔ) 962。舉例來(lái)說(shuō),可根據(jù)等式(1)和/或等式(2)執(zhí)行檢驗(yàn)(964)程序。舉例來(lái)說(shuō),檢驗(yàn)(964)程 序可根i
k行,其中t是時(shí)間,X是話語(yǔ)962或音頻 信號(hào),Atarget是目標(biāo)(例如,真實(shí)用戶話語(yǔ))模型,Ageneric是通用語(yǔ)音模型(例如,UBM),p(X Atarge3t)是X對(duì)應(yīng)于真實(shí)用戶的概率,p (X I Ag_ri。)是X對(duì)應(yīng)于通用用戶(例如,冒名頂替者、非 真實(shí)用戶、非用戶相依模型或通用揚(yáng)聲器模型)的概率,且Θ是檢驗(yàn)閾值。當(dāng)識(shí)別多個(gè)揚(yáng)聲器 時(shí),可選擇產(chǎn)生最高可能性的那個(gè)揚(yáng)聲器。另外或替代地,可利用其它分類器(例如,支持向 量機(jī)或神經(jīng)網(wǎng)絡(luò))。
[0157] 圖10是說(shuō)明用于基于預(yù)訓(xùn)練提供一或多個(gè)候選語(yǔ)音分量的方法1000的一個(gè)配置 的流程圖。舉例來(lái)說(shuō),結(jié)合圖10描述的程序中的一或多者可用于針對(duì)登記的預(yù)訓(xùn)練中。舉例 來(lái)說(shuō),針對(duì)登記的預(yù)訓(xùn)練可在接收到用于評(píng)估(例如,在結(jié)合圖5到8中的一或多者描述的步 驟502、602、702和802中的一或多者中)的音頻口令之前發(fā)生。
[0158] 下文給出關(guān)于登記和比較的更多細(xì)節(jié)。登記用戶的一種方法可包含讓用戶說(shuō)一會(huì) 話,以提供足夠的音素來(lái)從通用語(yǔ)音模型(例如,UBM)適應(yīng)所述用戶的模型。在一些配置中, 電子裝置102、402可提供一些預(yù)定義的在語(yǔ)音學(xué)上平衡的語(yǔ)句來(lái)最小化訓(xùn)練時(shí)間。另外或 替代地,用戶可讀足夠長(zhǎng)的提詞(例如,以充分地訓(xùn)練,使通用語(yǔ)音模型適應(yīng)所述用戶的語(yǔ) 音模型)。
[0159] 另外或替代地,電子裝置102、402可收集呼叫期間的用戶數(shù)據(jù)(例如,語(yǔ)音),假定 所述用戶是所述裝置的屬主(例如,真實(shí)用戶)。一旦達(dá)到數(shù)據(jù)大小方面的某一層級(jí),電子裝 置102、402就可通知或告知(例如,顯示消息,輸出提供所述消息的語(yǔ)音)用戶可啟用話音口 令。在一些配置中,電子裝置可繼續(xù)更新用戶的語(yǔ)音模型。以此方式,可監(jiān)視用戶隨時(shí)間的 音色改變(例如,年齡相關(guān)改變)。
[0160] 結(jié)合圖1和4中的一或多者描述的電子裝置102、402中的一或多者可執(zhí)行方法 1000。應(yīng)注意,盡管如結(jié)合圖10所描述的預(yù)訓(xùn)練或登記期間所執(zhí)行的程序中的一或多者可 類似于在獲得和評(píng)估音頻口令(例如,如結(jié)合圖1到2以及4到8中的一或多者所描述)后即刻 執(zhí)行的程序中的一或多者,結(jié)合圖10所描述的程序中的一或多者可與在如上文所描述獲得 音頻口令后即刻進(jìn)行的程序分開和/或在其之前進(jìn)行。
[0161] 電子裝置402可接收(1002)用戶音頻信號(hào)406。舉例來(lái)說(shuō),用戶音頻信號(hào)406可由一 或多個(gè)麥克風(fēng)404捕獲。舉例來(lái)說(shuō),當(dāng)用戶讀提詞或打電話時(shí),可接收用戶音頻信號(hào)406。
[0162] 電子裝置402可確定(1004)是否在良好聲學(xué)條件下接收到用戶音頻信號(hào)406。舉例 來(lái)說(shuō),電子裝置402可確定用戶音頻信號(hào)406的信噪比(SNR)。如果SNR高于SNR閾值,那么電 子裝置402可確定(1004)在良好聲學(xué)條件下接收到用戶音頻信號(hào)406。如果SNR不高于(例 如,小于或等于)SNR閾值,那么電子裝置402可確定(1004)未在良好聲學(xué)條件下接收到用戶 音頻信號(hào)406。如果未在良好聲學(xué)條件下接收到用戶音頻信號(hào)406,那么電子裝置402可丟棄 接收到的用戶音頻信號(hào)406并返回以接收(1002)后續(xù)用戶音頻信號(hào)406。
[0163] 如果在良好聲學(xué)條件下接收到用戶音頻信號(hào)406,那么電子裝置402可從音頻信號(hào) 406提?。?006)-或多個(gè)特征,以獲得所提取特征426。舉例來(lái)說(shuō),電子裝置402可基于音頻 信號(hào)406確定一或多個(gè)MFCC。
[0164] 電子裝置402可基于一或多個(gè)通用語(yǔ)音模型(例如,UMB)確定(1008)音頻信號(hào)406 的唯一性量度430。在一些配置中,唯一性量度可為音頻信號(hào)406與通用語(yǔ)音模型之間的似 然比。在一些配置中,電子裝置402可本地確定(例如,計(jì)算)唯一性量度430。在其它配置中, 電子裝置402可從遠(yuǎn)程裝置(例如,服務(wù)器、中央服務(wù)器)請(qǐng)求和接收唯一性量度430。
[0165] 電子裝置402可基于一或多個(gè)所提取的特征426執(zhí)行(1010)語(yǔ)音辨識(shí)。舉例來(lái)說(shuō), 電子裝置402可基于一或多個(gè)所提取的特征426來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量440。
[0166] 電子裝置402可使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn)(1012)。舉 例來(lái)說(shuō),電子裝置402可使一或多個(gè)所辨識(shí)語(yǔ)音分量的出現(xiàn)與所述唯一性量度在時(shí)間上對(duì) 準(zhǔn),以產(chǎn)生經(jīng)對(duì)準(zhǔn)的語(yǔ)音和唯一性444。
[0167] 電子裝置402可更新(1014)-或多個(gè)語(yǔ)音分量(例如,所辨識(shí)語(yǔ)音分量)的唯一性 統(tǒng)計(jì)。舉例來(lái)說(shuō),電子裝置402可基于對(duì)應(yīng)于語(yǔ)音分量的唯一性量度來(lái)更新(1014)語(yǔ)音分量 的唯一性統(tǒng)計(jì)。在一些配置中,電子裝置402可存儲(chǔ)當(dāng)捕獲和辨識(shí)時(shí)對(duì)應(yīng)于一或多個(gè)所辨識(shí) 語(yǔ)音分量得唯一性量度(或基于唯一性量度的值,例如最大值、最小值或平均值)。其后在獲 得所辨識(shí)語(yǔ)音分量時(shí)的每一后續(xù)時(shí)刻,電子裝置402可更新唯一性統(tǒng)計(jì)。舉例來(lái)說(shuō),電子裝 置402可基于所存儲(chǔ)的唯一性量度(或值)以及當(dāng)前唯一性量度(或值)來(lái)計(jì)算一些統(tǒng)計(jì)量度 (例如,平均值等)。電子裝置402接著可存儲(chǔ)經(jīng)更新的統(tǒng)計(jì)量度。
[0168] 電子裝置402可登記(1016)-或多個(gè)語(yǔ)音分量。舉例來(lái)說(shuō),電子裝置402可為一或 多個(gè)所辨識(shí)語(yǔ)音分量中的每一者存儲(chǔ)數(shù)據(jù)。另外或替代地,電子裝置402可將所辨識(shí)語(yǔ)音分 量中的一或多者指定為對(duì)于口令建議來(lái)說(shuō)足夠唯一或強(qiáng)(例如,如果語(yǔ)音分量具有大于閾 值的對(duì)應(yīng)唯一性量度或唯一性統(tǒng)計(jì))。舉例來(lái)說(shuō),在一些配置中,在最初接收到對(duì)口令評(píng)估 的音頻口令之前,電子裝置402可提供一或多個(gè)所建議語(yǔ)音分量。
[0169] 電子裝置402可適應(yīng)(1018)用戶語(yǔ)音模型。舉例來(lái)說(shuō),電子裝置402可通過(guò)更新用 戶語(yǔ)音模型的音素?cái)?shù)據(jù)和/或權(quán)重來(lái)適應(yīng)或修改用戶語(yǔ)音模型(例如,其可最初基于通用語(yǔ) 音模型)。在一些配置中,適應(yīng)(1018)用戶語(yǔ)音模型可包含更新一或多個(gè)模型參數(shù)(例如, GMM分量)。具體地說(shuō),適應(yīng)(1018)可通過(guò)更新GMM的平均值和/或混錄權(quán)重來(lái)執(zhí)行。
[0170]電子裝置402可確定(1020)是否存在充分的數(shù)據(jù)供用戶語(yǔ)音模型準(zhǔn)確地描述用戶 的語(yǔ)音。舉例來(lái)說(shuō),電子裝置402可確定是否已捕獲閾值數(shù)目和/或某些音素,使得用戶語(yǔ)音 模型足夠細(xì)化以準(zhǔn)確地反映真實(shí)用戶的語(yǔ)音。如果不存在充分的數(shù)據(jù),那么電子裝置402可 繼續(xù)接收(1002)用戶音頻信號(hào)。
[0171]如果存在充分的數(shù)據(jù),那么電子裝置402可提供(1022)用戶語(yǔ)音模型。舉例來(lái)說(shuō), 電子裝置402可使用戶語(yǔ)音模型可用于音頻口令強(qiáng)度評(píng)估和/或建議,如上文所描述。應(yīng)注 意,盡管可提供(1022)用戶語(yǔ)音模型來(lái)使用,但方法1000可反復(fù)數(shù)次和/或連續(xù),以便進(jìn)一 步適應(yīng)和/或細(xì)化用戶語(yǔ)音模型。
[0172] 圖11是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置1102 的另一更具體配置的框圖。結(jié)合圖11描述的電子裝置1102可為結(jié)合圖1和4描述的電子裝置 102、402中的一或多者的實(shí)例。
[0173] 電子裝置1102包含一或多個(gè)麥克風(fēng)1104、口令評(píng)估模塊1108、口令反饋模塊1112 和一或多個(gè)輸出裝置1116。包含于電子裝置1102中的分量中的一或多者可對(duì)應(yīng)于包含于結(jié) 合圖1和4中的一或多者描述的電子裝置102、402中的一或多者中的組件中的一或多者和/ 或可類似于其而起作用。
[0174] 電子裝置1102可包含一或多個(gè)輸入裝置1166。輸入裝置1166的實(shí)例包含觸摸屏、 觸控板、圖像傳感器(例如,相機(jī))、鍵盤(例如,物理和/或軟件鍵盤)、小鍵盤(例如,物理和/ 或軟件小鍵盤、指紋掃描器、額外麥克風(fēng)、定向傳感器(例如,傾斜傳感器)、運(yùn)動(dòng)傳感器(例 如,加速計(jì))、GPS模塊、壓力傳感器等。一或多個(gè)輸入裝置1166可獲得或接收一或多個(gè)輸入 1168。可將所述一或多個(gè)輸入1168提供到口令評(píng)估模塊1108。
[0175] -或多個(gè)麥克風(fēng)1104可捕獲音頻信號(hào)1106。音頻信號(hào)1106可包含音頻口令。可將 音頻信號(hào)1106提供到口令評(píng)估模塊1108。
[0176] 口令評(píng)估模塊1108可獲得(例如,接收)一或多個(gè)麥克風(fēng)1104所捕獲的音頻信號(hào) 1106。如上文所描述,音頻信號(hào)1106可包含音頻口令??诹钤u(píng)估模塊1108可基于測(cè)量音頻信 號(hào)1106的一或多個(gè)唯一特性來(lái)評(píng)估音頻口令的強(qiáng)度。這可如上文結(jié)合圖1到2以及4到8中的 一或多者所描述來(lái)實(shí)現(xiàn)。
[0177] 口令評(píng)估模塊1108可任選地包含額外驗(yàn)證輸入評(píng)估模塊1170。額外驗(yàn)證輸入評(píng)估 模塊1170可結(jié)合音頻口令考慮一或多個(gè)額外驗(yàn)證輸入1168。舉例來(lái)說(shuō),如果結(jié)合字母數(shù)字 代碼或指紋掃描使用音頻口令,那么強(qiáng)度得分可反映音頻口令與一或多個(gè)額外驗(yàn)證輸入 (如果利用)的組合所提供的額外驗(yàn)證強(qiáng)度。在一些配置中,電子裝置1102(例如,口令評(píng)估 模塊1108)可獲得一或多個(gè)額外驗(yàn)證輸入1168。舉例來(lái)說(shuō),一些配置可允許使用其它模態(tài), 例如視頻陀螺/加速計(jì)傳感器,鍵盤,指紋傳感器等。在一些方法中,一或多個(gè)此類模態(tài)可用 于具有較少唯一性或辯別強(qiáng)度的(短語(yǔ)、句子等)的一或多個(gè)部分。舉例來(lái)說(shuō),當(dāng)用戶發(fā)出具 有低唯一性的詞語(yǔ)(例如,具有較小可辨別得分的詞語(yǔ)"學(xué)校")時(shí),電子裝置1102可獲得或 接收一或多個(gè)額外驗(yàn)證輸入1168。
[0178]所述一或多個(gè)額外驗(yàn)證輸入1168的實(shí)例如下給出。在電子裝置1102具有手勢(shì)辨識(shí) 的配置中,電子裝置1102可接收用戶所輸入的示意動(dòng)作(例如,觸摸屏圖案、觸摸墊圖案、相 機(jī)所捕獲的視覺手勢(shì)圖案等)。所述示意動(dòng)作可為用戶創(chuàng)建或預(yù)定義的。在電子裝置1102包 含相機(jī)的配置中,電子裝置1102可捕獲用戶的一或多個(gè)圖像,例如用戶的臉部、眼睛、鼻子、 嘴唇、面部形狀和/或更多的唯一信息,例如具有音頻信號(hào)1106的虹膜。舉例來(lái)說(shuō),包含于電 子裝置1102中的相機(jī)可(例如,通過(guò)用戶)瞄準(zhǔn)以捕獲用戶的臉部的全部或部分。
[0179] 在電子裝置1102包含一或多個(gè)運(yùn)動(dòng)和/或定向傳感器(例如,陀螺儀、加速計(jì)、傾斜 傳感器等)的配置中,電子裝置1102可獲得運(yùn)動(dòng)和/或定向信息。舉例來(lái)說(shuō),用戶可以用戶創(chuàng) 建或預(yù)定義的方式來(lái)定向和/或移動(dòng)電子裝置1102(例如,電話)。舉例來(lái)說(shuō),電子裝置1102 可連同音頻信號(hào)1106編碼陀螺和/或加速計(jì)傳感器信息。
[0180]在電子裝置1102包含物理或軟件(例如,觸摸屏或顯示器上)小鍵盤或鍵盤的配置 中,電子裝置1102可連同音頻信號(hào)1106接收數(shù)值代碼、文本和/或字母數(shù)字串(例如,由用戶 鍵入)。在電子裝置1102包含指紋傳感器的配置中,電子裝置1102可接收指紋(例如,當(dāng)用戶 觸摸或握持指紋傳感器時(shí))。
[0181]在電子裝置1102包含多個(gè)麥克風(fēng)1104的配置中,電子裝置1102可獲得(例如,接收 和/或確定)音頻信號(hào)1106的空間方向性信息。舉例來(lái)說(shuō),用戶可在相對(duì)于電子裝置1102的 一序列方向(例如,頂部、底部、左、右、前、后、右上、左下等)上說(shuō)出音頻口令。舉例來(lái)說(shuō),用 戶可朝電子裝置1102的底部說(shuō)出第一個(gè)字,朝電子裝置1102的頂部說(shuō)出第二個(gè)字,朝電子 裝置1102的左側(cè)說(shuō)出第三個(gè)字,且朝電子裝置1102的右側(cè)說(shuō)出第四個(gè)字。
[0182] 下文提供關(guān)于空間方向性信息的額外細(xì)節(jié)。在一些配置中,電子裝置1102可利用 空間音頻的整合來(lái)獲得安全性。舉例來(lái)說(shuō),為了解鎖電子裝置1102,用戶可向某一空間扇區(qū) 或不同空間扇區(qū)(例如,相對(duì)于電子裝置1102(例如,電話))中發(fā)出一序列。
[0183] 電子裝置1102(例如,圖11中未圖示的檢驗(yàn)?zāi)K)可識(shí)別用戶(利用揚(yáng)聲器辨識(shí)), 且識(shí)別空間說(shuō)話方向序列是否正確。僅充分高的揚(yáng)聲器辨識(shí)可能性與正確空間序列的組合 將解鎖電子裝置1102。舉例來(lái)說(shuō),在一些配置中,電子裝置1102可如下執(zhí)行空間音頻/揚(yáng)聲 器辨識(shí)特征的檢驗(yàn)。電子裝置1102可初始化提示,接收來(lái)自電子裝置1102前面的話語(yǔ),接收 來(lái)自電子裝置1102左側(cè)的話語(yǔ),接收來(lái)自電子裝置1102頂部的話語(yǔ),且接收來(lái)自電子裝置 1102左側(cè)的話語(yǔ)。在初始提示之后,電子裝置1102(具有多個(gè)麥克風(fēng))提供預(yù)定義序列的空 間音頻拾取。在這些配置中,用戶可需要知曉向正確的空間扇區(qū)中發(fā)出音頻口令(例如,語(yǔ) 句)的序列。舉例來(lái)說(shuō),用戶可說(shuō):"我最喜歡的切換扇區(qū)寵物的切換扇區(qū)名字是 切換扇區(qū)巴尼")。
[0184] 在一些配置中,每一空間扇區(qū)中的話語(yǔ)的時(shí)序和/或持續(xù)時(shí)間可為檢驗(yàn)程序的一 部分(例如,在前扇區(qū)中2秒,在頂部扇區(qū)中5秒,在右扇區(qū)中3秒等)。舉例來(lái)說(shuō),電子裝置 1102可經(jīng)由話音提示或通過(guò)檢測(cè)按鈕或屏幕的推動(dòng)而起始話音記錄過(guò)程。電子裝置1102可 根據(jù)預(yù)定義序列(例如,激活的空間扇區(qū)和/或每一空間扇區(qū)的時(shí)序(持續(xù)時(shí)間)的序列),在 不同空間扇區(qū)中起始收聽。如果電子裝置1102在每一空間扇區(qū)(上下文相依或獨(dú)立發(fā)聲)中 識(shí)別到真實(shí)用戶,那么電子裝置1102準(zhǔn)予接入。
[0185] 更具體地說(shuō),電子裝置1102可根據(jù)以下方法或程序來(lái)操作。電子裝置1102可用話 音提示和/或在接收到(例如,按鈕或觸摸屏的)輸入時(shí)起始語(yǔ)音記錄。電子裝置1102可根據(jù) 預(yù)定義序列在不同空間扇區(qū)中起始收聽。舉例來(lái)說(shuō),電子裝置1102可在一序列所激活空間 扇區(qū)中接收音頻。在一些配置中,電子裝置1102可根據(jù)每一空間扇區(qū)中的時(shí)序(例如,持續(xù) 時(shí)間)序列來(lái)接收音頻。
[0186] 如果電子裝置1102在每一空間扇區(qū)(上下文相依或獨(dú)立發(fā)聲)中識(shí)別到真實(shí)用戶 (例如,所要揚(yáng)聲器),那么電子裝置1102準(zhǔn)予接入。舉例來(lái)說(shuō),電子裝置1102可允許用戶接 入電子裝置1102的較多功能性(例如,應(yīng)用程序、話音呼叫等)。
[0187] 在一個(gè)實(shí)例中,用戶可從相對(duì)于所述裝置的一個(gè)特定方向發(fā)出口令、密碼或詞語(yǔ) 序列(例如,"句子")。在另一實(shí)例中,用戶可在一序列方向上發(fā)出一句子的若干部分。另外 或替代地,可要求用戶以某一時(shí)序發(fā)出所述句子的不同部分。另外或替代地,可利用多個(gè)用 戶的話音。舉例來(lái)說(shuō),第一用戶可從電子保險(xiǎn)箱的左側(cè)發(fā)出口令,同時(shí)第二用戶可從電子保 險(xiǎn)箱的右側(cè)發(fā)出口令,以便解鎖所述保險(xiǎn)箱??瑟?dú)立地或結(jié)合其它量度(例如,人臉辨識(shí)、指 紋辨識(shí)等)實(shí)施空間音頻安全特征。
[0188] 在一些配置中,可需要音頻口令結(jié)合一或多個(gè)額外驗(yàn)證輸入來(lái)通過(guò)多個(gè)準(zhǔn)則,以 設(shè)定口令(例如,具有一或多個(gè)額外驗(yàn)證輸入1168的組合音頻口令)。舉例來(lái)說(shuō),口令評(píng)估模 塊1108可要求音頻口令提供最小唯一"性,且一或多個(gè)額外驗(yàn)證輸入1168滿足一或多個(gè)額外 準(zhǔn)則。可對(duì)唯一性閾值和/或一或多個(gè)額外準(zhǔn)則進(jìn)行加權(quán)。
[0189] 在一些配置中,額外驗(yàn)證輸入評(píng)估模塊1170可基于音頻信號(hào)1106和/或一或多個(gè) 額外驗(yàn)證輸入1168來(lái)忽視一或多個(gè)閾值。舉例來(lái)說(shuō),如果指紋掃描提供額外驗(yàn)證強(qiáng)度,那么 口令評(píng)估模塊1108可需要較低唯一性閾值或音頻口令強(qiáng)度。另外或替代地,如果音頻信號(hào) 1106提供高唯一性,那么口令評(píng)估模塊1108可需要額外驗(yàn)證輸入1168所貢獻(xiàn)的較低強(qiáng)度。 舉例來(lái)說(shuō),如果音頻信號(hào)1106提供相對(duì)良好的唯一性,那么口令評(píng)估模塊1108可建議利用2 位數(shù)值代碼。然而,如果音頻信號(hào)1106提供相對(duì)較弱的唯一性,那么口令評(píng)估模塊1108可建 議利用4位數(shù)值代碼和/或指紋掃描。
[0190] 可利用一或多個(gè)額外驗(yàn)證輸入1168,而無(wú)時(shí)序和/或序列限制。在一些實(shí)例中,電 子裝置1102可在接收到音頻信號(hào)1106之前、期間或之后的任何時(shí)間獲得一或多個(gè)額外驗(yàn)證 輸入1168。
[0191]在其它實(shí)例中,電子裝置1102可要求(或經(jīng)配置以要求)相對(duì)于音頻信號(hào)1106的接 收以某一時(shí)序約束條件和/或以某一序列接收所述一或多個(gè)額外驗(yàn)證輸入1168。在一實(shí)例 中,電子裝置1102可要求(或經(jīng)配置以要求)在接收到音頻信號(hào)1106之前、期間和/或之后的 某一時(shí)間周期內(nèi)接收一或多個(gè)額外驗(yàn)證輸入1168。舉例來(lái)說(shuō),電子裝置1102可要求在音頻 口令的較弱語(yǔ)音分量期間接收額外驗(yàn)證輸入1168。另外或替代地,電子裝置1102可要求(或 經(jīng)配置以要求)以特定序列(例如,在語(yǔ)音分量之前、在語(yǔ)音分量之后、在語(yǔ)音分量之間,以 具有其它額外驗(yàn)證輸入的序列等)接收額外驗(yàn)證輸入1168。在一些配置中,電子裝置1102可 以增加復(fù)雜性的次序添加(和/或建議添加)一或多個(gè)額外驗(yàn)證輸入1168。另外或替代地,電 子裝置1102可要求添加一或多個(gè)額外驗(yàn)證輸入1168,直到口令(例如,結(jié)合一或多個(gè)額外驗(yàn) 證輸入1168的音頻口令)超過(guò)最小所需強(qiáng)度為止。
[0192] 在一些配置中,口令評(píng)估模塊1108可任選地包含輸入降級(jí)模塊1172。輸入降級(jí)模 塊1172可使音頻信號(hào)1106和/或額外驗(yàn)證輸入1168降級(jí)。舉例來(lái)說(shuō),口令評(píng)估模塊1108可將 信息從音頻信號(hào)1106去除(例如,下取樣、濾除其一或多個(gè)部分)。另外或替代地,口令評(píng)估 模塊1108可將信息從指紋掃描或從用戶的臉部的圖像或虹膜去除。
[0193] 口令評(píng)估模塊1108可將評(píng)估信息1110提供到口令反饋模塊1112。評(píng)估信息1110可 包含指示口令評(píng)估中獲得的口令強(qiáng)度和/或信息的信息。舉例來(lái)說(shuō),評(píng)估信息1110可包含所 提取特征、唯一性量度、口令強(qiáng)度得分和/或其它信息。
[0194] 口令反饋模塊1112可提供口令反饋1114。舉例來(lái)說(shuō),口令反饋模塊1112可基于對(duì) 音頻口令的強(qiáng)度的評(píng)估來(lái)告知用戶音頻口令較弱。提供口令反饋1114可使用戶能夠確定 (例如,選擇、提供或創(chuàng)建)足夠強(qiáng)的音頻口令??诹罘答?114可包含口令強(qiáng)度得分、一或多 個(gè)語(yǔ)音分量候選者(例如,所推薦或建議的語(yǔ)音分量)、一或多個(gè)所建議動(dòng)作和/或一或多個(gè) 消息。舉例來(lái)說(shuō),口令反饋1114可包含口令強(qiáng)度得分和指示音頻口令較弱的消息。另外或替 代地,口令反饋1114可包含用戶可用于創(chuàng)建較強(qiáng)音頻口令的一或多個(gè)所建議語(yǔ)音分量。在 一些配置中,電子裝置1102可提供由所建議的語(yǔ)音分量組成的所建議合成(例如未知)字作 為口令反饋1114。另外或替代地,口令反饋1114可包含用戶可提供額外驗(yàn)證輸入(例如,文 本、數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如面部掃描、虹膜掃描、指紋等)) 的所建議動(dòng)作。
[0195] 在一些配置中,口令反饋模塊1112可提供一或多個(gè)口令建議。舉例來(lái)說(shuō),電子裝置 1102(例如,口令反饋模塊1112)可識(shí)別具有足夠高的唯一性或與一或多個(gè)其它模型(例如, 通用語(yǔ)音模型、通用模型、UBM等)的區(qū)別來(lái)識(shí)別一或多個(gè)語(yǔ)音分量(例如,發(fā)聲、音素等)。舉 例來(lái)說(shuō),口令反饋模塊1112可經(jīng)由一對(duì)語(yǔ)音辨識(shí)和揚(yáng)聲器檢驗(yàn)系統(tǒng),基于用戶針對(duì)每一音 素的話音的唯一性來(lái)識(shí)別一或多個(gè)語(yǔ)音分量。接著,口令反饋模塊1112可產(chǎn)生一些可能候 選語(yǔ)音分量(例如,音素、音節(jié)、發(fā)聲、口令等),其具有高"唯一性",使得用戶可選擇一或多 個(gè)候選語(yǔ)音分量來(lái)創(chuàng)建口令。舉例來(lái)說(shuō),電子裝置1102可顯示口令反饋1114,例如:"你可使 用/啊Λ/k/、…、〈三角形〉、〈高通〉、…、"。另外或替代地,可為用戶發(fā)出的口令提供具體口 令反饋1114,以較多地加強(qiáng)所述口令(例如,"你的口令具有60%強(qiáng)度。話語(yǔ)/嗯/可被/ 啊/...代替")。
[0196] 在一些配置中,電子裝置1102(例如,口令反饋模塊1112)可以多模態(tài)提供口令建 議。如上文所描述,例如,口令反饋模塊1112可提供口令反饋1114,其建議一或多個(gè)額外驗(yàn) 證輸入1168(例如,文本、數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如,面部掃 描、虹膜掃描、指紋等))。
[0197] 口令反饋模塊1112可將口令反饋1114提供到一或多個(gè)輸出裝置1116。一或多個(gè)輸 出裝置1116可因此向用戶中繼或傳達(dá)口令反饋1114。舉例來(lái)說(shuō),輸出裝置1116(例如,顯示 器、觸摸屏、揚(yáng)聲器等)可中繼與音頻口令的強(qiáng)度相關(guān)聯(lián)的標(biāo)記1174。在一些配置中,這可經(jīng) 由如結(jié)合圖1所描述的一或多個(gè)GUI來(lái)實(shí)現(xiàn)。在一個(gè)方法中,顯示面板可顯示口令強(qiáng)度得分。 另外或替代地,揚(yáng)聲器可輸出聲學(xué)信號(hào)(例如,文字到語(yǔ)音),其指示口令強(qiáng)度得分(例如, "你的口令較弱"、"你的口令強(qiáng)度為60%"等)。
[0198] 在一些配置中,輸出裝置1116可中繼一或多個(gè)建議(例如,候選語(yǔ)音分量1176、額 外驗(yàn)證輸入選項(xiàng)1178等)。舉例來(lái)說(shuō),顯示面板可顯示一或多個(gè)候選語(yǔ)音分量1176,例如音 素、音節(jié)、字、發(fā)聲和/或短語(yǔ)(例如7啊/、/嗯/、/k/、/三角形/、/海市蜃樓/")。另外或替代 地,揚(yáng)聲器可輸出聲學(xué)信號(hào)以中繼一或多個(gè)建議(例如,"請(qǐng)將/啊/、/嗯Λ/k/、/三角形/、/ 海市蜃樓/和/或額外輸入類型添加到你的口令")。
[0199] 使用音頻口令(例如,獨(dú)立音頻口令和/或具有一或多個(gè)額外驗(yàn)證輸入1168(例如 空間方向性)的音頻口令等)來(lái)獲得安全可應(yīng)用于許多不同類型的電子裝置1102(例如,其 可包含麥克風(fēng)陣列1104)。舉例來(lái)說(shuō),此安全特征可應(yīng)用于智能電話、平板裝置、電子門鎖、 門傳感器、相機(jī)、智能按鍵、膝上型計(jì)算機(jī)、桌上型計(jì)算機(jī)、游戲系統(tǒng)、汽車、繳費(fèi)查詢一體機(jī) (例如,作為驗(yàn)證交易的一種方式),電視機(jī)、音頻裝置(例如,mp3播放器、iPod、壓縮光盤 (CD)播放器等)、音頻/視頻裝置(例如,數(shù)字視頻記錄器(DVR)、藍(lán)光播放器、數(shù)字視頻光盤 (DVD)播放器等)、家用電器、恒溫器、保險(xiǎn)箱等。另外或替代地,此安全特征可遠(yuǎn)程應(yīng)用(例 如,應(yīng)用于遠(yuǎn)程裝置)。舉例來(lái)說(shuō),用戶可在智能電話上提供音頻口令(例如,句子、密碼、口 令等),其可將驗(yàn)證憑證或命令提供到電子門鎖,來(lái)解鎖/鎖定門(例如,家門、車門、辦公室 門等)。在另一實(shí)例中,用戶可在智能電話、膝上型計(jì)算機(jī)或平板計(jì)算機(jī)上提供空間音頻代 碼,以向遠(yuǎn)程服務(wù)器驗(yàn)證來(lái)進(jìn)行網(wǎng)站驗(yàn)證、交易(例如,購(gòu)買、銀行業(yè)務(wù))驗(yàn)證等。
[0200] 圖12是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法1200的更具體配置的流程圖。結(jié)合圖 1、4和11描述的電子裝置102、402、1102中的一或多者可執(zhí)行方法1200。
[0201]電子裝置1102可獲得(1202) -或多個(gè)麥克風(fēng)1104所捕獲的音頻信號(hào)1106。這可如 上文結(jié)合圖1到2、4到8以及11中的一或多者所描述來(lái)實(shí)現(xiàn)。音頻信號(hào)1106可包含音頻口令。 [0202]電子裝置1102可獲得至少一個(gè)額外驗(yàn)證輸入1168。此操作可如上文結(jié)合圖(例如, 圖1、4和11)中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō),電子裝置可獲得(1204)-或多個(gè)額外 驗(yàn)證輸入1168,例如文本、數(shù)值代碼、字母數(shù)字串、空間方向性和/或額外生物計(jì)量(例如指 紋掃描、用戶臉部的相機(jī)圖像或虹膜等)。
[0203]電子裝置1102可任選地使音頻信號(hào)1106和/或額外驗(yàn)證輸入1168降級(jí)(1206)。此 操作可如上文結(jié)合圖(例如,圖1、4和11)中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō),電子裝置 1102可將信息從音頻信號(hào)1106去除(例如,下取樣、濾除其一或多個(gè)部分)。另外或替代地, 口令評(píng)估模塊1108可將信息從指紋掃描或從用戶的臉部的圖像或虹膜去除。
[0204]電子裝置1102可結(jié)合至少一個(gè)額外驗(yàn)證輸入1168來(lái)評(píng)估(1208)音頻口令的強(qiáng)度。 舉例來(lái)說(shuō),電子裝置1102可結(jié)合音頻口令考慮一或多個(gè)額外驗(yàn)證輸入1168。舉例來(lái)說(shuō),如果 結(jié)合字母數(shù)字代碼或指紋掃描使用音頻口令,那么強(qiáng)度得分可反映音頻口令與一或多個(gè)額 外驗(yàn)證輸入的組合所提供的額外驗(yàn)證強(qiáng)度。
[0205]如果結(jié)合至少一個(gè)額外驗(yàn)證輸入1168的音頻口令的強(qiáng)度較弱,那么電子裝置1102 可提供(1210) 口令反饋1114。這可如上文結(jié)合圖1到2、4到8以及11中的一或多者所描述來(lái) 實(shí)現(xiàn)。舉例來(lái)說(shuō),電子裝置1102可基于對(duì)結(jié)合至少一個(gè)額外驗(yàn)證輸入1168的音頻口令的強(qiáng) 度的評(píng)估(例如,當(dāng)口令強(qiáng)度得分不大于一值時(shí)),告知(1206)用戶音頻口令較弱??诹罘答?1114可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如,所推薦或建議的語(yǔ)音分量)、一 或多個(gè)所建議動(dòng)作和/或一或多個(gè)消息。舉例來(lái)說(shuō),口令反饋1114可包含口令強(qiáng)度得分和指 示音頻口令較弱的消息。另外或替代地,口令反饋1114可包含用戶可用于創(chuàng)建較強(qiáng)音頻口 令的一或多個(gè)所建議語(yǔ)音分量。另外或替代地,口令反饋1114可包含用戶可提供額外驗(yàn)證 輸入1168 (例如,文本、數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如面部掃描、 虹膜掃描、指紋等))的所建議動(dòng)作。
[0206]圖13是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的無(wú)線通信裝置 1302的一個(gè)配置的框圖。圖13中說(shuō)明的無(wú)線通信裝置1302可為本文所述的電子裝置102、 402、1102中的一或多者的實(shí)例。無(wú)線通信裝置1302可包含應(yīng)用處理器1384。應(yīng)用程序處理 器1384通常處理指令(例如,運(yùn)行程序)以執(zhí)行無(wú)線通信裝置1302上的功能。應(yīng)用程序處理 器1384可耦合到音頻譯碼器/解碼器(編解碼器)1382。
[0207]音頻編解碼器1382可用于對(duì)音頻信號(hào)進(jìn)行譯碼和/或解碼。音頻編解碼器1382可 耦合到至少一個(gè)揚(yáng)聲器1335、耳機(jī)1337、輸出插孔1339和/或至少一個(gè)麥克風(fēng)1380。揚(yáng)聲器 1335可包含一或多個(gè)將電或電子信號(hào)轉(zhuǎn)換為聲學(xué)信號(hào)的電聲轉(zhuǎn)換器。舉例來(lái)說(shuō),揚(yáng)聲器 1335可用于播放音樂(lè)或輸出揚(yáng)聲器電話對(duì)話等。耳機(jī)1337可為可用于向用戶輸出聲學(xué)信號(hào) (例如,話語(yǔ)信號(hào))的另一揚(yáng)聲器或電聲轉(zhuǎn)換器。舉例來(lái)說(shuō),可使用聽筒1337使得僅用戶可確 實(shí)地聽到聲學(xué)信號(hào)。輸出插孔1339可用于將其它裝置(例如頭戴式耳機(jī))耦合到無(wú)線通信裝 置1302以用于輸出音頻。揚(yáng)聲器1335、聽筒1337和/或輸出插孔1339可通常用于從音頻編解 碼器1382輸出音頻信號(hào)。至少一個(gè)麥克風(fēng)1380可為將聲學(xué)信號(hào)(例如用戶的話音)轉(zhuǎn)換為提 供至音頻編解碼器1382的電或電子信號(hào)的聲電轉(zhuǎn)換器。
[0208] 在一些配置中,音頻編解碼器1382可包含口令評(píng)估模塊1308a和/或口令反饋模塊 1312a。另外或替代地,應(yīng)用程序處理器1384可包含口令評(píng)估模塊1308b和/或口令反饋模塊 1312b??诹钤u(píng)估模塊1308a-b和/或口令反饋模塊1312a-b可為上文結(jié)合圖1、4和11中的一 或多者描述的口令評(píng)估模塊108、408、1108和/或口令反饋模塊112、412、1112的實(shí)例。在其 它配置中,口令評(píng)估模塊1308a和口令反饋模塊1312a中的一或多者可分別從音頻編解碼器 1382和應(yīng)用程序處理器1384在無(wú)線通信裝置1302上實(shí)施。
[0209] 應(yīng)用處理器1384還可耦合到電力管理電路1394。電力管理電路1394的一個(gè)實(shí)例是 電力管理集成電路(PMIC),其可用于管理無(wú)線通信裝置1302的電力消耗。電力管理電路 1394可耦合到電池1396。電池1396可通常將電力提供到無(wú)線通信裝置1302。舉例來(lái)說(shuō),電池 1396和/或功率管理電路1394可耦合到包含于無(wú)線通信裝置1302中的元件中的至少一者。
[0210] 應(yīng)用處理器1384可耦合到至少一個(gè)輸入裝置1398以用于接收輸入。輸入裝置1398 的實(shí)例包含紅外傳感器、圖像傳感器、加速計(jì)、觸摸傳感器、小鍵盤等。輸入裝置1398可允許 用戶與無(wú)線通信裝置1302交互。應(yīng)用程序處理器1384還可耦合到一或多個(gè)輸出裝置1301。 輸出裝置1301的實(shí)例包含打印機(jī)、投影儀、屏幕、觸覺裝置等。輸出裝置1301可允許無(wú)線通 信裝置1302產(chǎn)生可由用戶體驗(yàn)的輸出。
[0211] 應(yīng)用程序處理器1384可耦合到應(yīng)用程序存儲(chǔ)器1303。應(yīng)用程序存儲(chǔ)器1303可為能 夠存儲(chǔ)電子信息的任何電子裝置。應(yīng)用存儲(chǔ)器1303的實(shí)例包含雙數(shù)據(jù)速率同步動(dòng)態(tài)隨機(jī)存 取存儲(chǔ)器(DDRAM)、同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(SDRAM)、快閃存儲(chǔ)器等。應(yīng)用存儲(chǔ)器1303可為 應(yīng)用處理器1384提供存儲(chǔ)。舉例來(lái)說(shuō),應(yīng)用存儲(chǔ)器1303可存儲(chǔ)在應(yīng)用程序處理器1384上運(yùn) 行的程序的功能的數(shù)據(jù)和/或指令。
[0212] 應(yīng)用程序處理器1384可耦合到顯示控制器1305,所述顯示控制器又可耦合到顯示 器1307。顯示控制器1305可為用于在顯示器1307上產(chǎn)生圖像的硬件塊。舉例來(lái)說(shuō),顯示器控 制器1305可將來(lái)自應(yīng)用程序處理器1384的指令和/或數(shù)據(jù)轉(zhuǎn)譯為可呈現(xiàn)在顯示器1307上的 圖像。顯示器1307的實(shí)例包含液晶顯示器(IXD)面板、發(fā)光二極管(LED)面板、陰極射線管 (CRT)顯示器、等離子顯示器等。
[0213] 應(yīng)用程序處理器1384可耦合到基帶處理器1386?;鶐幚砥?386通常處理通信信 號(hào)。舉例來(lái)說(shuō),基帶處理器1386可對(duì)接收到的信號(hào)進(jìn)行解調(diào)和/或解碼。另外或或者,基帶處 理器1386可對(duì)信號(hào)進(jìn)行編碼和/或調(diào)制以準(zhǔn)備發(fā)射。
[0214] 基帶處理器1386可耦合到基帶存儲(chǔ)器1309?;鶐Т鎯?chǔ)器1309可為能夠存儲(chǔ)電子信 息的任何電子裝置,例如SDRAM、DDRAM、快閃存儲(chǔ)器等?;鶐幚砥?386可從基帶存儲(chǔ)器 1309讀取信息(例如,指令和/或數(shù)據(jù))和/或?qū)⑿畔懭氲交鶐Т鎯?chǔ)器1309。另外或或者,基 帶處理器1386可使用存儲(chǔ)在基帶存儲(chǔ)器1309中的指令和/或數(shù)據(jù)來(lái)執(zhí)行通信操作。
[0215] 基帶處理器1386可耦合到射頻(RF)收發(fā)器1388 JF收發(fā)器1388可耦合到功率放大 器1390和一或多個(gè)天線1392 AF收發(fā)器1388可發(fā)射和/或接收射頻信號(hào)。舉例來(lái)說(shuō),RF收發(fā) 器1388可使用功率放大器1390和至少一個(gè)天線1392發(fā)射RF信號(hào)。RF收發(fā)器1388還可使用一 或多個(gè)天線1392接收RF信號(hào)。
[0216] 圖14說(shuō)明可在電子裝置1402中利用的各種組件。所說(shuō)明的組件可位于同一實(shí)體結(jié) 構(gòu)內(nèi)或位于單獨(dú)外殼或結(jié)構(gòu)中。結(jié)合圖14所描述的電子裝置1402可根據(jù)本文中所描述的電 子裝置102、402、1102和無(wú)線通信裝置1302中的一或多者來(lái)實(shí)施。電子裝置1402包含處理器 1417。處理器1417可為通用單芯片或多芯片微處理器(例如,ARM)專用微處理器(例如,數(shù)字 信號(hào)處理器(DSP))、微控制器、可編程門陣列等。處理器1417可被稱作中央處理單元(CPU)。 盡管在圖14的電子裝置1402中僅示出單個(gè)處理器1417,但在替代配置中,可使用處理器(例 如ARM與DSP)的組合。
[0217] 電子裝置1402還包含與處理器1417進(jìn)行電子通信的存儲(chǔ)器1411。也就是說(shuō),處理 器1417可從存儲(chǔ)器1411讀取信息和/或?qū)⑿畔懭氲酱鎯?chǔ)器1411。存儲(chǔ)器1411可為能夠存 儲(chǔ)電子信息的任何電子組件。存儲(chǔ)器1411可為隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、磁 盤存儲(chǔ)媒體、光學(xué)存儲(chǔ)媒體、RAM中的快閃存儲(chǔ)器裝置、隨處理器一起包含的機(jī)載存儲(chǔ)器、可 編程只讀存儲(chǔ)器(PROM)、可擦除可編程只讀存儲(chǔ)器(EPROM)、電可擦除PROM(EEPROM)、寄存 器等,包含其組合。
[0218] 數(shù)據(jù)1415a和指令1413a可存儲(chǔ)在存儲(chǔ)器1411中。指令1413a可包含一或多個(gè)程序、 例程、子例程、功能、過(guò)程等。指令1413a可包含單個(gè)計(jì)算機(jī)可讀語(yǔ)句或許多計(jì)算機(jī)可讀語(yǔ) 句。指令1413a可由處理器1417執(zhí)行以實(shí)施上文所描述的方法、功能和程序中的一或多者。 執(zhí)行指令1413a可涉及使用存儲(chǔ)在存儲(chǔ)器1411中的數(shù)據(jù)1415a。圖14示出一些指令1413b和 數(shù)據(jù)1415b正加載到處理器1417中(其可來(lái)自指令1413a和數(shù)據(jù)1415a)。
[0219] 電子裝置1402還可包含用于與其它電子裝置通信的一或多個(gè)通信接口 1421。通信 接口 1421可基于有線通信技術(shù)、無(wú)線通信技術(shù)或兩者。不同類型的通信接口 1421的實(shí)例包 含串行端口、并行端口、通用串行總線(USB)、以太網(wǎng)配接器、電氣電子工程師學(xué)會(huì)(IEEE) 1494總線接口、小型計(jì)算機(jī)系統(tǒng)接口(SCSI)總線接口、紅外(IR)通信端口、藍(lán)牙無(wú)線通信配 接器、第三代合作伙伴計(jì)劃(3GPP)收發(fā)器、IEEE 802.11 ( "Wi-Fi")收發(fā)器等。舉例來(lái)說(shuō),通 信接口 1421可耦合到用于發(fā)射和接收無(wú)線信號(hào)的一或多個(gè)天線(未展示)。
[0220] 電子裝置1402還可包含一或多個(gè)輸入裝置1423和一或多個(gè)輸出裝置1427。不同種 類的輸入裝置1423的實(shí)例包含鍵盤、鼠標(biāo)、麥克風(fēng)、遙控器裝置、按鈕、操縱桿、跟蹤球、觸控 板、光筆等。舉例來(lái)說(shuō),電子裝置1402可包含用于捕獲聲學(xué)信號(hào)的一或多個(gè)麥克風(fēng)1425。在 一種配置中,麥克風(fēng)1425可為將聲學(xué)信號(hào)(例如,話音、語(yǔ)音)轉(zhuǎn)換成電或電子信號(hào)的變換 器。不同種類的輸出裝置1427的實(shí)例包含揚(yáng)聲器、打印機(jī)等。舉例來(lái)說(shuō),電子裝置1402可包 含一或多個(gè)揚(yáng)聲器1429。在一種配置中,揚(yáng)聲器1429可為將電或電子信號(hào)轉(zhuǎn)換為聲學(xué)信號(hào) 的變換器??赏ǔ0陔娮友b置1402中的輸出裝置的一個(gè)特定類型為顯示裝置1431。與 本文中所公開的配置一起使用的顯示裝置1431可利用任何合適的圖像投影技術(shù),例如陰極 射線管(CRT)、液晶顯示器(LCD)、發(fā)光二極管(LED)、氣體等離子體、電致發(fā)光或類似者。還 可提供顯示器控制器1433,用于將存儲(chǔ)在存儲(chǔ)器1411中的數(shù)據(jù)轉(zhuǎn)換為顯示裝置1431上示出 的文本、圖形和/或移動(dòng)圖像(按需要)。
[0221] 電子裝置1402的各種組件可通過(guò)一或多個(gè)總線耦合在一起,所述總線可以包含電 力總線、控制信號(hào)總線、狀態(tài)信號(hào)總線、數(shù)據(jù)總線等。為簡(jiǎn)單起見,圖14中將各種總線說(shuō)明為 總線系統(tǒng)1419。應(yīng)注意,圖14僅說(shuō)明電子裝置1402的一個(gè)可能配置??衫酶鞣N其它架構(gòu)和 組件。
[0222] 在以上描述中,有時(shí)結(jié)合各種術(shù)語(yǔ)而使用參考標(biāo)號(hào)。在術(shù)語(yǔ)結(jié)合參考數(shù)字使用的 情況下,此可意味著指代圖中的一或多者中示出的特定元件。在無(wú)參考標(biāo)號(hào)而使用術(shù)語(yǔ)的 情況下,此可意味著大體上指代所述術(shù)語(yǔ),而不限于任何特定圖。
[0223]術(shù)語(yǔ)"確定"涵蓋各種各樣的動(dòng)作,且因此"確定"可包含計(jì)算、運(yùn)算、處理、導(dǎo)出、調(diào) 查、查找(例如,在表、數(shù)據(jù)庫(kù)或另一數(shù)據(jù)結(jié)構(gòu)中查找)、查實(shí)等等。并且,"確定"可包含接收 (例如,接收信息)、存取(例如,在存儲(chǔ)器中存取數(shù)據(jù))等。并且,"確定"可包括解析、選擇、挑 選、建立等等。
[0224]除非另有明確指定,否則短語(yǔ)"基于"并不意味著"僅基于"。換句話說(shuō),短語(yǔ)"基于" 描述"僅基于"以及"基于至少"兩者。
[0225] 應(yīng)注意,在相容的情況下,結(jié)合本文中所描述的配置中的任一者所描述的特征、功 能、過(guò)程、組件、元件、結(jié)構(gòu)等中的一或多者可與結(jié)合本文中所描述的其它配置中的任一者 所描述的功能、過(guò)程、組件、元件、結(jié)構(gòu)等中的一或多者進(jìn)行組合。換句話說(shuō),可根據(jù)本文中 揭示的系統(tǒng)和方法來(lái)實(shí)施本文中所描述的功能、程序、組件、元件等的任何相容的組合。
[0226] 可將本文中所描述的功能作為一或多個(gè)指令而存儲(chǔ)在處理器可讀或計(jì)算機(jī)可讀 媒體上。術(shù)語(yǔ)"計(jì)算機(jī)可讀媒體"是指可由計(jì)算機(jī)或處理器存取的任何可用媒體。作為實(shí)例 而非限制,此類媒體可包括隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀 存儲(chǔ)器(EEPR0M)、快閃存儲(chǔ)器、壓縮光盤只讀存儲(chǔ)器(⑶-ROM)或其它光盤存儲(chǔ)裝置、磁盤存 儲(chǔ)器或其它磁性存儲(chǔ)裝置,或可用于以指令或數(shù)據(jù)結(jié)構(gòu)的形式存儲(chǔ)所要的程序代碼且可由 計(jì)算機(jī)存取的任何其它媒體。如本文中所使用,磁盤和光盤包含壓縮光盤(CD)、激光光盤、 光學(xué)光盤、數(shù)字影音光盤(DVD)、軟性磁盤和Blu-ray 4光盤,其中磁盤通常以磁性方式再現(xiàn) 數(shù)據(jù),而光盤利用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。應(yīng)注意,計(jì)算機(jī)可讀媒體可為有形且非暫時(shí)性 的。術(shù)語(yǔ)"計(jì)算機(jī)程序產(chǎn)品"是指計(jì)算裝置或處理器,其與可由計(jì)算裝置或處理器執(zhí)行、處理 或計(jì)算的代碼或指令(例如,"程序")結(jié)合。如本文中所使用,術(shù)語(yǔ)"代碼"可指可由計(jì)算裝置 或處理器執(zhí)行的軟件、指令、代碼或數(shù)據(jù)。
[0227] 還可通過(guò)傳輸媒體來(lái)傳輸軟件或指令。舉例來(lái)說(shuō),如果使用同軸電纜、光纖電纜、 雙絞線、數(shù)字訂戶線路(DSL)或無(wú)線技術(shù)(例如,紅外線、無(wú)線電和微波)從網(wǎng)站、服務(wù)器或其 它遠(yuǎn)程源傳輸軟件,那么同軸電纜、光纖電纜、雙絞線、DSL或無(wú)線技術(shù)(例如,紅外線、無(wú)線 電和微波)包含在傳輸媒體的定義中。
[0228] 本文中所揭示的方法包括用于實(shí)現(xiàn)所描述的方法的一或多個(gè)步驟或動(dòng)作。在不偏 離權(quán)利要求書的范圍的情況下,方法步驟和/或動(dòng)作可彼此互換。換句話說(shuō),除非正描述的 方法的適當(dāng)操作需要步驟或動(dòng)作的特定次序,否則,在不脫離權(quán)利要求書的范圍的情況下, 可修改特定步驟和/或動(dòng)作的次序和/或使用。
[0229] 將理解,所附權(quán)利要求書不限于上文所說(shuō)明的精確配置和組件。在不脫離權(quán)利要 求書的范圍的情況下,可在本文中所描述的系統(tǒng)、方法和設(shè)備的配置、操作和細(xì)節(jié)方面進(jìn)行 各種修改、改變和變更。
【主權(quán)項(xiàng)】
1. 一種用于通過(guò)電子裝置來(lái)評(píng)估音頻口令的強(qiáng)度的方法,其包括: 獲得一或多個(gè)麥克風(fēng)所捕獲的音頻信號(hào),其中所述音頻信號(hào)包含音頻口令; 基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度;以及 基于所述音頻口令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述音頻口令較弱。2. 根據(jù)權(quán)利要求1所述的方法,其中所述音頻信號(hào)包含至少一個(gè)語(yǔ)音分量。3. 根據(jù)權(quán)利要求1所述的方法,其中所述測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性是基 于通用語(yǔ)音模型。4. 根據(jù)權(quán)利要求1所述的方法,其中告知所述用戶包括顯示與所述音頻口令的所述強(qiáng) 度相關(guān)聯(lián)的標(biāo)記。5. 根據(jù)權(quán)利要求1所述的方法,其中告知所述用戶包括顯示口令強(qiáng)度得分。6. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括將口令強(qiáng)度得分與另一值進(jìn)行比較。7. 根據(jù)權(quán)利要求6所述的方法,其中所述另一值是閾值或先前口令強(qiáng)度得分。8. 根據(jù)權(quán)利要求1所述的方法,其中告知所述用戶包括顯示至少一個(gè)候選語(yǔ)音分量。9. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括獲得至少一個(gè)額外驗(yàn)證輸入。10. 根據(jù)權(quán)利要求9所述的方法,其進(jìn)一步包括使所述音頻信號(hào)和所述額外驗(yàn)證輸入中 的至少一者降級(jí)。11. 根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包括基于地理位置、用戶年齡、用戶性別、用 戶語(yǔ)言和地方方言中的一或多者更新通用語(yǔ)音模型。12. -種用于評(píng)估音頻口令的強(qiáng)度的電子裝置,其包括: 一或多個(gè)麥克風(fēng),其捕獲音頻信號(hào),其中所述音頻信號(hào)包含音頻口令; 口令評(píng)估電路,其耦合到所述一或多個(gè)麥克風(fēng),其中所述口令評(píng)估電路基于測(cè)量所述 音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度;以及 口令反饋電路,其耦合到所述口令評(píng)估電路,其中所述口令反饋電路基于所述音頻口 令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述音頻口令較弱。13. 根據(jù)權(quán)利要求12所述的電子裝置,其中所述音頻信號(hào)包含至少一個(gè)語(yǔ)音分量。14. 根據(jù)權(quán)利要求12所述的電子裝置,其中所述測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特 性是基于通用語(yǔ)音模型。15. 根據(jù)權(quán)利要求12所述的電子裝置,其中告知所述用戶包括顯示與所述音頻口令的 所述強(qiáng)度相關(guān)聯(lián)的標(biāo)記。16. 根據(jù)權(quán)利要求12所述的電子裝置,其中告知所述用戶包括顯示口令強(qiáng)度得分。17. 根據(jù)權(quán)利要求12所述的電子裝置,其中所述口令評(píng)估電路進(jìn)一步將口令強(qiáng)度得分 與另一值進(jìn)行比較。18. 根據(jù)權(quán)利要求17所述的電子裝置,其中所述另一值是閾值或先前口令強(qiáng)度得分。19. 根據(jù)權(quán)利要求12所述的電子裝置,其中告知所述用戶包括顯示至少一個(gè)候選語(yǔ)音 分量。20. 根據(jù)權(quán)利要求12所述的電子裝置,其進(jìn)一步包括耦合到所述口令評(píng)估電路的一或 多個(gè)輸入裝置,其中所述一或多個(gè)輸入裝置獲得至少一個(gè)額外驗(yàn)證輸入。21. 根據(jù)權(quán)利要求20所述的電子裝置,其中所述口令評(píng)估電路使所述音頻信號(hào)和所述 額外驗(yàn)證輸入中的至少一者進(jìn)一步降級(jí)。22. 根據(jù)權(quán)利要求12所述的電子裝置,其中所述口令評(píng)估電路進(jìn)一步基于地理位置、用 戶年齡、用戶性別、用戶語(yǔ)言和地方方言中的一或多者來(lái)更新通用語(yǔ)音模型。23. -種用于評(píng)估音頻口令的強(qiáng)度的計(jì)算機(jī)程序產(chǎn)品,其包括上面具有指令的非暫時(shí) 性有形計(jì)算機(jī)可讀媒體,所述指令包括: 用于致使電子裝置獲得一或多個(gè)麥克風(fēng)所捕獲的音頻信號(hào)的代碼,其中所述音頻信號(hào) 包含音頻口令; 用于致使所述電子裝置基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻 口令的所述強(qiáng)度的代碼;以及 用于致使所述電子裝置基于對(duì)所述音頻口令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述 音頻口令較弱的代碼。24. 根據(jù)權(quán)利要求23所述的計(jì)算機(jī)程序產(chǎn)品,其中告知所述用戶包括顯示與所述音頻 口令的所述強(qiáng)度相關(guān)聯(lián)的標(biāo)記。25. 根據(jù)權(quán)利要求23所述的計(jì)算機(jī)程序產(chǎn)品,其中告知所述用戶包括顯示至少一個(gè)候 選語(yǔ)音分量。26. 根據(jù)權(quán)利要求23所述的計(jì)算機(jī)程序產(chǎn)品,其進(jìn)一步包括用于致使所述電子裝置獲 得至少一個(gè)額外驗(yàn)證輸入的代碼。27. -種用于評(píng)估音頻口令的強(qiáng)度的設(shè)備,其包括: 用于獲得音頻信號(hào)的裝置,其中所述音頻信號(hào)包含音頻口令; 用于基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度的 裝置;以及 用于基于所述音頻口令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述音頻口令較弱的裝置。28. 根據(jù)權(quán)利要求27所述的設(shè)備,其中告知所述用戶包括顯示與所述音頻口令的所述 強(qiáng)度相關(guān)聯(lián)的標(biāo)記。29. 根據(jù)權(quán)利要求27所述的設(shè)備,其中告知所述用戶包括顯示至少一個(gè)候選語(yǔ)音分量。30. 根據(jù)權(quán)利要求27所述的設(shè)備,其進(jìn)一步包括用于獲得至少一個(gè)額外驗(yàn)證輸入的裝 置。
【文檔編號(hào)】G06F21/46GK105940407SQ201580006253
【公開日】2016年9月14日
【申請(qǐng)日】2015年1月27日
【發(fā)明人】金萊軒, 南尤漢, 埃里克·維瑟
【申請(qǐng)人】高通股份有限公司