用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法

文檔序號(hào)：10579048閱讀：279來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法
【專利摘要】本發(fā)明描述一種用于通過(guò)電子裝置來(lái)評(píng)估音頻口令的強(qiáng)度的方法。所述方法包含獲得由一或多個(gè)麥克風(fēng)捕獲的音頻信號(hào)。所述音頻信號(hào)包含音頻口令。所述方法還包含基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度。所述方法進(jìn)一步包含基于對(duì)所述音頻口令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述音頻口令較弱。
【專利說(shuō)明】
用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明大體上涉及電子裝置。更具體地說(shuō)，本發(fā)明涉及用評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法。
【背景技術(shù)】
[0002] 在最近幾十年中，電子裝置的使用已變得普遍。明確地說(shuō)，電子技術(shù)中的進(jìn)步已減少了越來(lái)越復(fù)雜且有用的電子裝置的成本。成本降低和消費(fèi)者需求已使電子裝置的使用劇增，使得其在現(xiàn)代社會(huì)中幾乎隨處可見。由于電子裝置的使用已推廣開來(lái)，因此具有對(duì)電子裝置的新的且改進(jìn)的特征的需求。更具體來(lái)說(shuō)，人們常常尋求執(zhí)行新功能和/或更快、更有效或以更高質(zhì)量執(zhí)行功能的電子裝置。
[0003] -些電子裝置(例如，蜂窩式電話、智能電話、音頻記錄器、攝錄影機(jī)、計(jì)算機(jī)等)利用音頻信號(hào)。這些電子裝置可捕獲、編碼、存儲(chǔ)和/或發(fā)射所述音頻信號(hào)。舉例來(lái)說(shuō)，智能電話可獲得、編碼和發(fā)射用于電話呼叫的語(yǔ)音信號(hào)，同時(shí)另一智能電話可接收所述語(yǔ)音信號(hào) 并對(duì)其進(jìn)行解碼。
[0004] 然而，將音頻信號(hào)用于安全目的的電子裝置可能產(chǎn)生特定挑戰(zhàn)。舉例來(lái)說(shuō)，許多音頻信號(hào)可能不足以充分確保電子裝置接入的安全。如從此論述可觀察到，改進(jìn)安全性的系統(tǒng)和方法可為有益的。

【發(fā)明內(nèi)容】

[0005] 描述一種用于通過(guò)電子裝置來(lái)評(píng)估音頻口令的強(qiáng)度的方法。所述方法包含獲得由一或多個(gè)麥克風(fēng)捕獲的音頻信號(hào)。所述音頻信號(hào)包含音頻口令。所述方法還包含基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度。所述方法進(jìn)一步包含基于對(duì)音頻口令的強(qiáng)度的評(píng)估來(lái)告知用戶音頻口令較弱。所述音頻信號(hào)可包含至少一個(gè)語(yǔ) 音分量。測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性可基于通用語(yǔ)音模型。
[0006] 告知所述用戶可包含顯示與所述音頻口令的強(qiáng)度相關(guān)聯(lián)的標(biāo)記。告知所述用戶可包含顯示口令強(qiáng)度得分。告知所述用戶可包含顯示至少一個(gè)候選語(yǔ)音分量。
[0007] 所述方法可包含將口令強(qiáng)度得分與另一值進(jìn)行比較。所述另一值可為閾值或先前口令強(qiáng)度得分。
[0008] 所述方法可包含獲得至少一個(gè)額外驗(yàn)證輸入。所述方法可包含使所述音頻信號(hào)和所述額外驗(yàn)證輸入中的至少一者降級(jí)。所述方法可包含基于地理位置、用戶年齡、用戶性另Ij、用戶語(yǔ)言和地方方言中的一或多者來(lái)更新通用語(yǔ)音模型。
[0009] 還描述一種用于評(píng)估音頻口令的強(qiáng)度的電子裝置。所述電子裝置包含捕獲音頻信號(hào)的一或多個(gè)麥克風(fēng)。所述音頻信號(hào)包含音頻口令。所述還包含耦合到所述一或多個(gè)麥克風(fēng)的口令評(píng)估電路。所述口令評(píng)估電路基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估音頻口令的強(qiáng)度。所述電子裝置進(jìn)一步包含耦合到所述口令評(píng)估電路的口令反饋電路。所述口令反饋電路基于對(duì)音頻口令的強(qiáng)度的評(píng)估而告知用戶音頻口令較弱。
[0010] 還描述一種用于評(píng)估音頻口令的強(qiáng)度的計(jì)算機(jī)程序產(chǎn)品。所述計(jì)算機(jī)程序產(chǎn)品包含上面具有指令的非暫時(shí)性有形計(jì)算機(jī)可讀媒體。所述指令包含用于致使電子裝置獲得由一或多個(gè)麥克風(fēng)捕獲的音頻信號(hào)的代碼。所述音頻信號(hào)包含音頻口令。所述指令還包含用于致使所述電子裝置基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估音頻口令的強(qiáng)度的代碼。所述指令進(jìn)一步包含用于致使所述電子裝置基于對(duì)音頻口令的強(qiáng)度的評(píng)估來(lái)告知用戶音頻口令較弱的代碼。
[0011] 還描述一種用于評(píng)估音頻口令的強(qiáng)度的設(shè)備。所述設(shè)備包含用于獲得音頻信號(hào)的裝置。所述音頻信號(hào)包含音頻口令。所述設(shè)備還包含用于基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估音頻口令的強(qiáng)度的裝置。所述設(shè)備進(jìn)一步包含用于基于對(duì)音頻口令的強(qiáng) 度的評(píng)估來(lái)告知用戶音頻口令較弱的裝置。
【附圖說(shuō)明】
[0012] 圖1是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置的一個(gè) 配置的框圖；
[0013] 圖2是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的一個(gè)配置的流程圖；
[0014] 圖3包含說(shuō)明唯一性量度的實(shí)例的圖表；
[0015] 圖4是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置的更具體配置的框圖；
[0016] 圖5是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的更具體配置的流程圖；
[0017] 圖6是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的另一更具體配置的流程圖；
[0018] 圖7是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的另一更具體配置的流程圖；
[0019] 圖8是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的另一更具體配置的流程圖；
[0020] 圖9是說(shuō)明揚(yáng)聲器(例如，用戶)辨識(shí)模型的一個(gè)實(shí)例的框圖；
[0021] 圖10是說(shuō)明用于基于預(yù)訓(xùn)練提供一或多個(gè)候選語(yǔ)音分量的方法的一個(gè)配置的流程圖；
[0022] 圖11是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置的另一更具體配置的框圖；
[0023] 圖12是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法的更具體配置的流程圖；
[0024] 圖13是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的無(wú)線通信裝置的一個(gè)配置的框圖；以及
[0025] 圖14說(shuō)明可在電子裝置中利用的各種組件。
【具體實(shí)施方式】
[0026] 本文所揭示的系統(tǒng)和方法的一些配置提供口令強(qiáng)度評(píng)估以及對(duì)基于語(yǔ)音的生物計(jì)量驗(yàn)證的建議。當(dāng)出于驗(yàn)證的目的使用話音時(shí)，用戶可能想要將口令設(shè)定成說(shuō)出。然而，可能難以知曉所述口令在話音音色方面是否將足夠唯一，使得當(dāng)正好說(shuō)出同一口令時(shí)，其他任何人無(wú)法打破所述系統(tǒng)。如果說(shuō)出的口令含有用戶自身的與任意設(shè)定口令不同的生物計(jì)量差異，那么將更好。如果額外手段可用，那么其可恰當(dāng)?shù)赜脕?lái)加強(qiáng)安全性。
[0027] 本文所揭示的系統(tǒng)和方法可提供途徑來(lái)評(píng)估"唯一性"的強(qiáng)度，使得用戶可選擇足夠唯一的口令。在一些配置中，本文所揭示的系統(tǒng)和方法可使用保留用戶的增強(qiáng)型唯一性的發(fā)聲來(lái)建議一些候選者。本文所揭示的系統(tǒng)和方法可建議一些候選者，不僅通過(guò)使用保留用戶自身的增強(qiáng)型唯一性的發(fā)聲，并且通過(guò)在一些配置中利用一或多個(gè)其它可用模態(tài)。
[0028] -些揚(yáng)聲器檢驗(yàn)系統(tǒng)通過(guò)使揚(yáng)聲器數(shù)據(jù)適合于通用背景模型(UBM)來(lái)訓(xùn)練揚(yáng)聲器模型。在檢驗(yàn)階段中，可計(jì)算在揚(yáng)聲器模型與UBM之間觀察到的幀的似然比?？捎?jì)算整個(gè)話語(yǔ)/句子幀上的概述統(tǒng)計(jì)，以確定語(yǔ)音幀是否來(lái)自真實(shí)揚(yáng)聲器。然而，每話語(yǔ)/音素/音節(jié)或甚至每幀的"局部"可能性指示一些具有高區(qū)別，但一些并不具有?？蓪⒉痪哂卸喔邊^(qū)別的部分解釋也從其它模型闡述的部分，意味著其將污染檢驗(yàn)性能?；蛘?，可將其闡述為目標(biāo)模型看不見的數(shù)據(jù)，意味著其可能難以被用戶重復(fù)。因此，具有足夠強(qiáng)且可容易再現(xiàn)的口令可為有益的。
[0029] 現(xiàn)在參考圖式描述各種配置，其中相同的參考標(biāo)號(hào)可指示功能上相似的元件?？?以廣泛多種不同配置來(lái)布置和設(shè)計(jì)如本文中在各圖中大體描述和說(shuō)明的系統(tǒng)和方法。因此，對(duì)如各圖中所表示的若干配置的以下更詳細(xì)描述無(wú)意限制如所主張的范圍，而僅表示系統(tǒng)和方法。
[0030] 圖1是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置102的一個(gè)配置的框圖。電子裝置102的實(shí)例包含智能電話、蜂窩式電話、平板裝置、計(jì)算機(jī)(例如，膝上型計(jì)算機(jī)、桌上型計(jì)算機(jī)等）、游戲系統(tǒng)、電子汽車控制臺(tái)、個(gè)人數(shù)字助理(PDA)等。
[0031] 電子裝置102包含一或多個(gè)麥克風(fēng)104、口令評(píng)估模塊108、口令反饋模塊112和一或多個(gè)輸出裝置116。麥克風(fēng)104可為將聲信號(hào)轉(zhuǎn)換為電子信號(hào)的一或多個(gè)變換器。所述一或多個(gè)輸出裝置116可為用于提供來(lái)自電子裝置102的輸出的裝置。所述一或多個(gè)輸出裝置 116的實(shí)例包含顯不器(例如，顯不面板、觸摸屏）、揚(yáng)聲器(例如，將電子信號(hào)轉(zhuǎn)換為聲信號(hào) 的變換器）、觸覺裝置(例如，產(chǎn)生力、運(yùn)動(dòng)和/或振動(dòng)的裝置)等。"模塊"可在硬件(例如，電路）中或在硬件與軟件的組合(例如，具有指令的處理器）中實(shí)施。舉例來(lái)說(shuō)，口令評(píng)估模塊 108和/或口令反饋模塊112可在硬件中或在硬件與軟件的組合中實(shí)施。
[0032] -或多個(gè)麥克風(fēng)104可耦合到口令評(píng)估模塊108。口令評(píng)估模塊108可耦合到口令反饋模塊112?？诹罘答伳K112可耦合到一或多個(gè)輸出裝置116。如本文中所使用，術(shù)語(yǔ)"耦合"和相關(guān)術(shù)語(yǔ)可意味著一個(gè)組件直接連接(例如，無(wú)介入組件)或間接連接(例如，具有一或多個(gè)介入組件)到另一組件。圖式中所描繪的箭頭和/或線可表示耦合。
[0033] -或多個(gè)麥克風(fēng)104可捕獲音頻信號(hào)106。舉例來(lái)說(shuō)，一或多個(gè)麥克風(fēng)104可捕獲聲學(xué)信號(hào)，并將其轉(zhuǎn)換為電子音頻信號(hào)106。音頻信號(hào)106可包含音頻口令。音頻口令可包含用于檢驗(yàn)用戶的身份的一或多個(gè)聲音(例如，一或多個(gè)語(yǔ)音分量，例如音素、音節(jié)、詞語(yǔ)、短語(yǔ)、語(yǔ)句、發(fā)聲等）。舉例來(lái)說(shuō)，音頻口令可包含一或多個(gè)特性(例如，生物計(jì)量特性、音色等），其可用于識(shí)別用戶?？蓪⒁纛l信號(hào)106提供到口令評(píng)估模塊108。
[0034] 口令評(píng)估模塊108可獲得(例如，接收)一或多個(gè)麥克風(fēng)104所捕獲的音頻信號(hào)106。如上文所描述，音頻信號(hào)106可包含音頻口令。口令評(píng)估模塊108可基于測(cè)量音頻信號(hào)106的一或多個(gè)唯一特性來(lái)評(píng)估音頻口令的強(qiáng)度。口令"強(qiáng)度"可為指示所述口令的安全程度的屬性。舉例來(lái)說(shuō)，強(qiáng)音頻口令(例如，具有高強(qiáng)度的音頻口令)對(duì)于冒名頂替者來(lái)說(shuō)非常難以或幾乎不可能自然地模仿或復(fù)寫，在冒名頂替者可自然地模仿或復(fù)寫的情況下，所述冒名頂替者被不當(dāng)?shù)刈R(shí)別為真實(shí)用戶。然而，對(duì)于冒名頂替者來(lái)說(shuō)，弱音頻口令(例如，具有低強(qiáng)度的音頻口令)可能更容易自然地模仿或復(fù)寫，其中冒名頂替者被不當(dāng)?shù)刈R(shí)別為真實(shí)用戶。在一些配置中，音頻口令強(qiáng)度可依據(jù)唯一性來(lái)表達(dá)。舉例來(lái)說(shuō)，音頻口令的一或多個(gè)語(yǔ)音分量越唯一，所述口令越強(qiáng)。然而，音頻口令的一或多個(gè)語(yǔ)音組件越不唯一，所述口令越弱。因此，可對(duì)音頻口令強(qiáng)度進(jìn)行定量，且程度范圍從弱到強(qiáng)。舉例來(lái)說(shuō)，較唯一的語(yǔ)音分量得分可比較不唯一的語(yǔ)音分量高(例如，強(qiáng)）。
[0035]在一些配置中，口令評(píng)估模塊108可用唯一性程度或與一或多個(gè)通用語(yǔ)音模型(例如，UBM)的區(qū)別來(lái)評(píng)估音頻口令的一或多個(gè)語(yǔ)音分量(例如，發(fā)聲、音素等）的強(qiáng)度。通用語(yǔ) 音模型可為表示一群人的語(yǔ)音的語(yǔ)音模型(例如，統(tǒng)計(jì)語(yǔ)音模型）。一或多個(gè)UBM是通用語(yǔ)音模型的實(shí)例。
[0036] 在一些配置中，口令評(píng)估模塊108可利用多個(gè)通用語(yǔ)音模型（例如，UBM)。舉例來(lái) 說(shuō)，可基于用戶的輸入和/或特性(例如地理位置(例如，郵政編碼、城市、縣、州、國(guó)家等）、性另IJ、年齡、語(yǔ)言、地方方言等)來(lái)采用(例如，選擇和/或適應(yīng)等)多個(gè)通用語(yǔ)音模型。用戶的特性可影響用戶語(yǔ)音的聲學(xué)特性。在一些配置中，如果用戶提供的信息與所存儲(chǔ)的通用語(yǔ)音模型不匹配，那么電子裝置102可通知用戶和/或可根據(jù)用戶的肯定應(yīng)答改為使用恰當(dāng)?shù)哪?型。通過(guò)使用更具體匹配的通用語(yǔ)音模型（例如，UBM)來(lái)測(cè)量唯一性，電子裝置102(例如，口令評(píng)估模塊108)可提供更準(zhǔn)確的唯一性量度和/或得分。在一些配置中，電子裝置102(例如，口令評(píng)估模塊108)可基于參與的一或多個(gè)用戶的數(shù)據(jù)來(lái)更新對(duì)應(yīng)的通用語(yǔ)音模型（例如，UBM) 〇
[0037]在一些配置中，口令評(píng)估模塊108可基于如下測(cè)量音頻信號(hào)106的一或多個(gè)特性 (例如，唯一特性)來(lái)評(píng)估音頻口令的強(qiáng)度。口令評(píng)估模塊108可從音頻信號(hào)106提取一或多個(gè)特性(例如，特征向量）。舉例來(lái)說(shuō)，口令評(píng)估模塊108可基于所述音頻信號(hào)106確定一或多個(gè)梅爾頻率倒譜系數(shù)(MFCC)。在一些配置中，MFCC可為通過(guò)對(duì)音頻信號(hào)106的梅爾頻率經(jīng)平滑譜的記錄量值應(yīng)用離散余弦變換(DCT)而獲得的系數(shù)。根據(jù)本文所揭示的系統(tǒng)和方法，可提取可用于揚(yáng)聲器/語(yǔ)音辨識(shí)的任何或所有特征來(lái)使用。MFCC是作為一實(shí)例而給出，因?yàn)槠?可為用于此類應(yīng)用的相關(guān)特征向量。在一些配置中，根據(jù)本文所揭示的系統(tǒng)和方法而提取和/或利用的特征可不限于確定性特征(意味著例如不管數(shù)據(jù)如何，獲得特征的方式可為固定的）。舉例來(lái)說(shuō)，可使用數(shù)據(jù)驅(qū)動(dòng)的方法(例如在一些方法中，深神經(jīng)網(wǎng)絡(luò))來(lái)提取(例如，習(xí)得)特征向量。
[0038] 口令評(píng)估模塊108可基于一或多個(gè)通用語(yǔ)音模型（例如，UMB)獲得音頻信號(hào)106的唯一性量度。唯一性量度可指示音頻信號(hào)106 (例如，音頻口令)上的唯一性。舉例來(lái)說(shuō)，唯一性量度可隨音頻信號(hào)1〇6(例如，音頻口令）的時(shí)間周期而變化。在一些配置中，可在每一語(yǔ) 音分量(例如，音素、音節(jié)、詞語(yǔ)等)和/或音頻信號(hào)106 (例如，音頻口令）的幀上獲得唯一性量度。在一些配置中，可將音頻信號(hào)106 (例如，輸入波)轉(zhuǎn)換為特征向量(例如，MFCC )，其可用于獲得唯一性量度和/或口令強(qiáng)度得分。
[0039] 在一些配置中，唯一性量度可為音頻信號(hào)106與通用語(yǔ)音模型之間的似然比。舉例來(lái)說(shuō)，可根據(jù)等式(1)來(lái)確定似然比。
[0040] Υ\ο〇(ρ(χ\λ Utrgd ))- 丨〇g(:/'(A I 又 )) (1)
[0041] 在等式（1)中，t是時(shí)間，X是音頻信號(hào)（或基于所述音頻信號(hào)的特征向量，例如）， Xtarget是目標(biāo)(例如，真實(shí)用戶)模型，xg_ri。是通用語(yǔ)音模型(例如，UBM)，P (XI Atarge3t)是X對(duì) 應(yīng)于真實(shí)用戶的概率，且P(X|Age3ne3ri。)是X對(duì)應(yīng)于通用用戶（例如，冒名頂替者、非真實(shí)用戶等)的概率。通用術(shù)語(yǔ)(例如，A ge^ri。)可為冒名頂替者和/或非真實(shí)用戶等的模型。冒名頂替者和/或非真實(shí)用戶的模型可用于比較實(shí)際用戶模型。比較實(shí)際用戶模型可計(jì)算密集型和/ 或窮盡性的，因此可利用一些層級(jí)來(lái)限定搜索范圍（例如，性別、年齡、位置等）。另外或替代地，通用術(shù)語(yǔ)(例如，A generi。)可為非用戶相依模型（例如，通用揚(yáng)聲器模型）。非用戶相依模型可用于簡(jiǎn)化所述比較，其中可僅需要一個(gè)模型來(lái)用于比較。應(yīng)注意，可更新(如果需要，例如）電子裝置102中和/或遠(yuǎn)程裝置(例如，遠(yuǎn)程服務(wù)器）中的通用模型（例如A eneri。）。在一些實(shí)例中，可通過(guò)更新一或多個(gè)模型參數(shù)(例如，平均和/或混合權(quán)重)來(lái)更新通用模型?？?周期性地(例如，定期)和/或不定期地(例如，按需、基于更新確定等)執(zhí)行更新。
[0042]在其它配置中，唯一性量度(例如，似然比）可一般化為任意非遞減函數(shù)f。舉例來(lái) 說(shuō)，可根據(jù)等式(2)來(lái)確定唯一性量度。
[0043
(2)
[0044] 在一些配置中，可如下獲得和/或更新通用語(yǔ)音模型。通用語(yǔ)音模型可為(例如，不同于真實(shí)用戶的）其它用戶的語(yǔ)音進(jìn)行建模。在一些配置中，通用語(yǔ)音模型可為其它用戶的 "始終適應(yīng)模型"。另外或替代地，可（例如，通過(guò)電子裝置102或遠(yuǎn)程裝置)將音頻信號(hào)106 (例如，音頻口令)與其它用戶的模型進(jìn)行比較，如果它們使用同一系統(tǒng)(例如，具有同一遠(yuǎn) 程服務(wù)器)的話。在一些配置中，代替于將音頻信號(hào)106與UBM進(jìn)行比較來(lái)執(zhí)行此步驟。
[0045] 復(fù)雜性可為此方法的一個(gè)問(wèn)題，但可通過(guò)縮小搜索范圍來(lái)減輕復(fù)雜性。舉例來(lái)說(shuō)，可首先執(zhí)行基本信息檢索，例如性別、年齡、語(yǔ)言(包含地方方言)等。另外或替代地，電子裝置102或遠(yuǎn)程裝置(例如，服務(wù)器)可嘗試定位用戶的物理住宅區(qū)或其一些歷史。接著可將音頻信號(hào)1〇6(例如，音頻□令)與具有同一類別(例如，性別、年齡、語(yǔ)言、地方方言、物理區(qū)等）的其它音頻信號(hào)的實(shí)際模型的小得多的集合進(jìn)行比較，其可正靜態(tài)或動(dòng)態(tài)地變化。電子裝置102可動(dòng)態(tài)地(例如，取決于住宅區(qū)或他/她講的語(yǔ)言等）（向用戶）提供對(duì)口令的不同建議。
[0046] 在一些配置中，通用語(yǔ)音模型可基于多個(gè)模型。舉例來(lái)說(shuō)，通用語(yǔ)音模型可基于基于具有從原始單個(gè)UBM更新的高可能性的高斯混合模型(GMM)狀態(tài)來(lái)群集多個(gè)UBM。另外或替代地，通用語(yǔ)音模型可基于分組，所述分組基于可使用的物理區(qū)（例如，92121，圣地亞哥），且可將用戶的模型與同一區(qū)中的人的模型進(jìn)行比較。
[0047] 口令評(píng)估模塊108可基于唯一性量度確定一或多個(gè)口令強(qiáng)度得分?？诹顝?qiáng)度得分可指示音頻口令的強(qiáng)度。舉例來(lái)說(shuō)，口令強(qiáng)度得分可為整個(gè)音頻口令的強(qiáng)度的指示。另外或替代地，可確定一或多個(gè)子級(jí)口令強(qiáng)度得分。在一些配置中，可基于唯一性量度的概述統(tǒng)計(jì) 來(lái)確定口令強(qiáng)度得分。
[0048] 在一些配置中，口令強(qiáng)度得分可為唯一性量度本身。另外或替代地，確定口令強(qiáng)度得分可包含組合(例如，求和)唯一性量度的若干部分。另外或替代地，確定口令強(qiáng)度得分可包含映射唯一性量度、映射唯一性量度的一或多個(gè)部分和/或映射一或多個(gè)概述統(tǒng)計(jì)到數(shù) 值(例如，百分比）、到詞語(yǔ)(例如，"弱"、"適中"、"強(qiáng)"等)和/或到一些其它指示符(例如，色彩、形狀等）。
[0049] 在一些配置中，口令強(qiáng)度得分可為唯一性量度。舉例來(lái)說(shuō)，可利用等式（1)和/或等式(2)來(lái)獲得口令強(qiáng)度得分。應(yīng)注意，t可確定概述統(tǒng)計(jì)的長(zhǎng)度。舉例來(lái)說(shuō)，可利用一些小常數(shù)t(例如，幀長(zhǎng)度)來(lái)獲得唯一性量度(例如，連續(xù)得分）。結(jié)合圖3描述以小常數(shù)t獲得的唯一"性量度的一個(gè)實(shí)例。
[0050] 在一些配置中，確定口令強(qiáng)度得分可包含組合(例如，求和、求平均等)唯一性量度的若干部分。舉例來(lái)說(shuō)，口令評(píng)估模塊108可在唯一性量度的某一周期上組合(例如，求和、求平均等），以確定口令強(qiáng)度得分。舉例來(lái)說(shuō)，口令評(píng)估模塊108可使用整個(gè)唯一性量度或所述唯一性量度的一或多個(gè)足夠長(zhǎng)的時(shí)間幀來(lái)獲得經(jīng)平滑的得分。此經(jīng)平滑的得分可為口令強(qiáng)度得分的一個(gè)實(shí)例。
[0051 ] 在一些配置中，如果t足夠長(zhǎng)，那么口令強(qiáng)度得分可為唯一性量度本身，而不組合唯一性量度的若干部分。然而，獲得唯一性量度的對(duì)應(yīng)于一或多個(gè)語(yǔ)音分量(例如，在音素級(jí)）的部分可為有益的，其可用于推薦和/或接入語(yǔ)音分量級(jí)(例如，音素級(jí))唯一性。接著可組合唯一性量度的這些部分，以確定總口令強(qiáng)度得分。
[0052]在一些配置中，可獲得一或多個(gè)子級(jí)口令強(qiáng)度。舉例來(lái)說(shuō)，所述子級(jí)口令強(qiáng)度中的每一者可或可基于唯一性量度的所述部分。這可有益于使唯一性量度變窄到語(yǔ)音分量(例如，音素)級(jí)。另外或替代地，口令評(píng)估模塊108可通過(guò)組合(例如，求和、求平均等)唯一性量度的若干部分(但不是所有唯一性量度，舉例來(lái)說(shuō))來(lái)獲得一或多個(gè)子級(jí)口令強(qiáng)度。舉例來(lái) 說(shuō)，口令評(píng)估模塊108可組合唯一性量度的分別對(duì)應(yīng)于語(yǔ)音分量的部分。在一種方法中，口令評(píng)估模塊108可對(duì)唯一性量度的對(duì)應(yīng)于較大集合內(nèi)的音素(例如，詞語(yǔ)、短語(yǔ)、句子等）的部分求和和/或求平均。以此方式，可確定一或多個(gè)較高級(jí)（例如，詞語(yǔ)級(jí)、短語(yǔ)級(jí)、句子級(jí) 等）口令強(qiáng)度得分。
[0053]在一些配置中，確定口令強(qiáng)度得分可包含將口令強(qiáng)度得分表達(dá)為和/或?qū)⒖诹顝?qiáng) 度得分映射到數(shù)值(例如，1〇%、43%、65%、90%等）、詞語(yǔ)(例如"弱"、"適中"、"強(qiáng)"等）和/ 或一些其它指示符(例如紅色、黃色、綠色等）。舉例來(lái)說(shuō)，口令評(píng)估模塊108可使唯一性量度 (和/或所述唯一性量度的若干部分）的概述統(tǒng)計(jì)乘以某一因子(例如，100)，以確定口令強(qiáng) 度得分。另外或替代地，口令評(píng)估模塊108可基于唯一性量度、所述唯一性量度的若干部分和/或所述唯一性量度的概述統(tǒng)計(jì)來(lái)選擇(例如，查找)特定數(shù)值、詞語(yǔ)和/或某一其它指示符，以確定口令強(qiáng)度得分。舉例來(lái)說(shuō)，口令評(píng)估模塊108可基于唯一性量度、所述唯一性量度的一個(gè)或若干部分和/或基于所述唯一性量度的一或多個(gè)量(例如，綜合、平均值、統(tǒng)計(jì)等）來(lái)確定口令強(qiáng)度得分?？蓪⑦@些量中的一或多者與一或多個(gè)閾值進(jìn)行比較，以確定口令強(qiáng) 度得分，和/或可基于這些量中的一或多者來(lái)(例如，在表中）查找口令強(qiáng)度得分。
[0054]在一些配置中，口令評(píng)估模塊108可確定音頻口令是否足夠強(qiáng)（例如，根據(jù)任意概率，根據(jù)用戶偏好和/或足以使冒名頂替者非常不可能借助于發(fā)出音頻口令而作為真實(shí)用戶通過(guò)）。舉例來(lái)說(shuō)，口令評(píng)估模塊108可將口令強(qiáng)度得分與值進(jìn)行比較。舉例來(lái)說(shuō)，所述值可為先前口令強(qiáng)度得分和/或閾值。所述值可為靜態(tài)(例如，預(yù)定)的和/或動(dòng)態(tài)的。在一些配置中，所述值可由制造商設(shè)定和/或由用戶配置。所述值可表達(dá)為數(shù)值（例如，60%、80%、 90%等)和/或表達(dá)為詞語(yǔ)(例如，"適中"、"強(qiáng)"等）。所述值可建立描繪口令強(qiáng)度被認(rèn)為是充分還是不充分的決策點(diǎn)。
[0055]在一些配置中，口令強(qiáng)度得分可結(jié)合音頻口令考慮一或多個(gè)額外驗(yàn)證輸入。舉例來(lái)說(shuō)，如果結(jié)合字母數(shù)字代碼或指紋掃描使用音頻口令，那么強(qiáng)度得分可反映音頻口令與一或多個(gè)額外驗(yàn)證輸入(如果利用）的組合所提供的額外驗(yàn)證強(qiáng)度。
[0056]在一些配置中，電子裝置102(例如，口令評(píng)估模塊108)可接收一或多個(gè)額外驗(yàn)證輸入。舉例來(lái)說(shuō)，一些配置可允許使用其它模態(tài)，例如視頻陀螺/加速計(jì)傳感器，鍵盤，指紋傳感器等。在一些方法中，一或多個(gè)此類模態(tài)可用于具有較少唯一性或辯別強(qiáng)度的（短語(yǔ)、句子等）的一或多個(gè)部分。舉例來(lái)說(shuō)，當(dāng)用戶發(fā)出具有低唯一性的詞語(yǔ)(例如，具有較小可辨別得分的詞語(yǔ)"學(xué)校"）時(shí)，電子裝置102可獲得或接收一或多個(gè)額外驗(yàn)證輸入。
[0057]所述一或多個(gè)額外驗(yàn)證輸入的實(shí)例如下給出。在電子裝置102具有手勢(shì)辨識(shí)的配置中，電子裝置102可接收用戶所輸入的示意動(dòng)作(例如，觸摸屏圖案、觸摸墊圖案、相機(jī)所捕獲的視覺手勢(shì)圖案等）。所述示意動(dòng)作可為用戶創(chuàng)建或預(yù)定義的。在電子裝置102包含相機(jī)的配置中，電子裝置102可捕獲用戶的一或多個(gè)圖像，例如用戶的臉部、眼睛、鼻子、嘴唇、面部形狀和/或更多的唯一信息，例如具有音頻信號(hào)106的虹膜。舉例來(lái)說(shuō)，包含于電子裝置 102中的相機(jī)可(例如，通過(guò)用戶)瞄準(zhǔn)以捕獲用戶的臉部的全部或部分。
[0058] 在電子裝置102包含一或多個(gè)運(yùn)動(dòng)和/或定向傳感器(例如，陀螺儀、加速計(jì)、傾斜傳感器等）的配置中，電子裝置102可獲得運(yùn)動(dòng)和/或定向信息。舉例來(lái)說(shuō)，用戶可以用戶創(chuàng) 建或預(yù)定義的方式來(lái)定向和/或移動(dòng)電子裝置1〇2(例如，電話）。舉例來(lái)說(shuō)，電子裝置102可連同音頻信號(hào)106編碼陀螺和/或加速計(jì)傳感器信息。
[0059] 在電子裝置102包含物理或軟件小鍵盤或鍵盤的配置中，電子裝置102可連同音頻信號(hào)106接收數(shù)值代碼、文本和/或字母數(shù)字串（例如，由用戶鍵入）。在電子裝置102包含指紋傳感器的配置中，電子裝置102可接收指紋(例如，當(dāng)用戶觸摸或握持指紋傳感器時(shí)）。
[0060] 在電子裝置102包含多個(gè)麥克風(fēng)104的配置中，電子裝置102可獲得(例如，接收和/ 或確定)音頻信號(hào)106的空間方向性信息。舉例來(lái)說(shuō)，用戶可在相對(duì)于電子裝置102的一序列方向（例如，頂部、底部、左、右、前、后、右上、左下等)上說(shuō)出音頻口令。舉例來(lái)說(shuō)，用戶可朝電子裝置102的底部說(shuō)出第一個(gè)字，朝電子裝置102的頂部說(shuō)出第二個(gè)字，朝電子裝置102的左側(cè)說(shuō)出第三個(gè)字，且朝電子裝置102的右側(cè)說(shuō)出第四個(gè)字。
[0061] 可利用一或多個(gè)額外驗(yàn)證輸入，而無(wú)時(shí)序和/或序列限制。在一些實(shí)例中，電子裝置102可在接收到音頻信號(hào)106之前、期間或之后的任何時(shí)間獲得一或多個(gè)額外驗(yàn)證輸入。
[0062] 在其它實(shí)例中，電子裝置102可要求(或經(jīng)配置以要求)相對(duì)于音頻信號(hào)106的接收以某一時(shí)序約束條件和/或以某一序列接收所述一或多個(gè)額外驗(yàn)證輸入。在一實(shí)例中，電子裝置102可要求(或經(jīng)配置以要求)在接收到音頻信號(hào)106之前、期間和/或之后的某一時(shí)間周期內(nèi)接收一或多個(gè)額外驗(yàn)證輸入。舉例來(lái)說(shuō)，電子裝置102可要求在音頻口令的較弱語(yǔ)音分量期間接收額外驗(yàn)證輸入。舉例來(lái)說(shuō)，假定對(duì)于音頻口令"綠洲是海市蜃樓"，與音頻口令的另一部分相比，"是"部分可為較不唯一或較弱。當(dāng)用戶發(fā)出"是"時(shí)，電子裝置102可要求 (或經(jīng)配置以要求)接收額外驗(yàn)證輸入(例如，文本、數(shù)值代碼、字母數(shù)字串、空間方向性和/ 或額外生物計(jì)量(例如指紋掃描、用戶的臉部的相機(jī)圖像或虹膜等））。另外或替代地，電子裝置102可要求(或經(jīng)配置以要求）以特定序列（例如，在語(yǔ)音分量之前、在語(yǔ)音分量之后、在語(yǔ)音分量之間、在具有其它額外驗(yàn)證輸入的序列中等)接收額外驗(yàn)證輸入。
[0063] 在一些配置中，電子裝置102(例如，口令評(píng)估模塊108)可使音頻信號(hào)106和/或額外驗(yàn)證輸入降級(jí)。舉例來(lái)說(shuō)，電子裝置102可將信息從音頻信號(hào)106去除(例如，下取樣，濾除所述音頻信號(hào)的一或多個(gè)部分）。另外或替代地，電子裝置102可將信息從指紋掃描或從用戶的臉部或虹膜的圖像去除。此方法的一個(gè)益處是出于其安全或隱私原因，用戶可能不想要共享確切或高品質(zhì)信息（例如，確切或高品質(zhì)生物計(jì)量信息，例如話音樣本、所掃描的指紋、圖像等）。因此，降級(jí)的信息可為所捕獲信息的簡(jiǎn)化或降級(jí)版本。在一些配置中，單個(gè)模態(tài)或輸入類型(例如，話音或語(yǔ)音、指紋、虹膜掃描等)的降級(jí)的信息本身無(wú)法用于可靠的用戶識(shí)別。然而，來(lái)自多個(gè)模態(tài)或輸入類型的降級(jí)的信息的組合仍可提供強(qiáng)驗(yàn)證。因此，甚至 "虹膜"或"指紋"掃描可利用額外模態(tài)，如話音口令，即使非降級(jí)版本本身可提供高唯一性強(qiáng)度。
[0064] 口令評(píng)估模塊108可將評(píng)估信息110提供到口令反饋模塊112。評(píng)估信息110可包含指示口令評(píng)估中獲得的口令強(qiáng)度和/或信息的信息。舉例來(lái)說(shuō)，評(píng)估信息110可包含所提取特征、唯一性量度、口令強(qiáng)度得分和/或其它信息。
[0065] 口令反饋模塊112可提供口令反饋114。舉例來(lái)說(shuō)，口令反饋模塊112可基于對(duì)音頻口令的強(qiáng)度的評(píng)估來(lái)告知用戶音頻口令較弱。提供口令反饋114可使用戶能夠確定(例如，選擇、提供或創(chuàng)建)足夠強(qiáng)的音頻口令。口令反饋114可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或建議的語(yǔ)音分量）、一或多個(gè)所建議動(dòng)作和/或一或多個(gè)消息。舉例來(lái)說(shuō)，口令反饋114可包含指示音頻口令較弱的口令強(qiáng)度得分和消息。另外或替代地，口令反饋114可包含用戶可用于創(chuàng)建較強(qiáng)音頻口令的一或多個(gè)建議語(yǔ)音分量。在一些配置中，電子裝置102可提供由所建議的語(yǔ)音分量組成的所建議合成（例如未知）字作為口令反饋 114。另外或替代地，口令反饋114可包含用戶可提供額外驗(yàn)證輸入(例如，文本、數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如面部掃描、虹膜掃描、指紋等））的所建議動(dòng) 作。
[0066] 在一些配置中，口令反饋模塊112可提供一或多個(gè)口令建議。舉例來(lái)說(shuō)，電子裝置 102(例如，口令反饋模塊112)可識(shí)別具有足夠高的唯一性或與一或多個(gè)其它模型(例如，通用語(yǔ)音模型、通用模型、UBM等)的區(qū)別來(lái)識(shí)別一或多個(gè)語(yǔ)音分量(例如，發(fā)聲、音素等）。舉例來(lái)說(shuō)，口令反饋模塊112可經(jīng)由一對(duì)語(yǔ)音辨識(shí)和揚(yáng)聲器檢驗(yàn)系統(tǒng)，基于用戶針對(duì)每一音素的話音的唯一性來(lái)識(shí)別一或多個(gè)語(yǔ)音分量。接著，口令反饋模塊112可產(chǎn)生一些可能候選語(yǔ)音分量(例如，音素、音節(jié)、發(fā)聲、口令等），其具有高"唯一性"，使得用戶可選擇一或多個(gè)候選語(yǔ)音分量來(lái)創(chuàng)建口令。舉例來(lái)說(shuō)，電子裝置102可顯示口令反饋114,例如："你可使用/啊/、/ k/、…、〈三角形〉、〈高通〉、…"。另外或替代地，可為用戶發(fā)出的口令提供具體口令反饋114，以較多地加強(qiáng)所述口令(例如，"你的口令具有60%強(qiáng)度。話語(yǔ)/嗯/可被/啊/...代替"）。
[0067] 在一些配置中，電子裝置102(例如，口令反饋模塊112)可以多模態(tài)提供口令建議。如上文所描述，例如，口令反饋模塊112可提供口令反饋114,其建議一或多個(gè)額外驗(yàn)證輸入 (例如，文本數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如，面部掃描、虹膜掃描、指紋等））。
[0068] 在一些配置中，口令反饋模塊112可執(zhí)行以下操作中的一或多者，以產(chǎn)生口令反饋 114?？诹罘答伳K112可基于一或多個(gè)所提取的特征執(zhí)行語(yǔ)音辨識(shí)。舉例來(lái)說(shuō)，口令反饋模塊112可基于一或多個(gè)所提取的特征來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量?？衫没谳斎胩?供具有時(shí)間對(duì)準(zhǔn)的一序列音素的任何已知語(yǔ)音辨識(shí)器來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量?？?利用的語(yǔ)音辨識(shí)器的一個(gè)實(shí)例是隱式馬爾可夫模型工具包(HTK)。
[0069] 口令反饋模塊112可使唯一性量度與一或多個(gè)所辨識(shí)語(yǔ)音分量對(duì)準(zhǔn)。舉例來(lái)說(shuō)，口令反饋模塊112可使一或多個(gè)所辨識(shí)語(yǔ)音分量的出現(xiàn)率與唯一性量度在時(shí)間上對(duì)準(zhǔn)。在一些配置中，每一語(yǔ)音分量(例如，音素)邊界的時(shí)間對(duì)準(zhǔn)是語(yǔ)音辨識(shí)的副產(chǎn)品中的一者。明確地說(shuō)，口令反饋模塊112可利用所辨識(shí)語(yǔ)音分量(例如，音素）的邊界信息以及對(duì)應(yīng)時(shí)間周期內(nèi)的唯一性量度來(lái)產(chǎn)生經(jīng)對(duì)準(zhǔn)語(yǔ)音和唯一性。舉例來(lái)說(shuō)，口令反饋模塊112可指定唯一性量度的一或多個(gè)時(shí)間點(diǎn)作為語(yǔ)音分量邊界，如由語(yǔ)音辨識(shí)所提供夫人的語(yǔ)音分量邊界所指不。
[0070] 口令反饋模塊112可基于唯一性量度對(duì)一或多個(gè)語(yǔ)音分量進(jìn)行分類。舉例來(lái)說(shuō)，口令反饋模塊112可確定一或多個(gè)語(yǔ)音分量中的每一者的唯一性(例如，強(qiáng)度或弱度）。在一些配置中，口令反饋模塊112可將經(jīng)對(duì)準(zhǔn)語(yǔ)音分量中的每一者處的唯一性量度(或基于唯一性量度的一些值，例如平均值、最大值、最小值等)與一或多個(gè)閾值進(jìn)行比較。如果對(duì)應(yīng)于語(yǔ)音分量的唯一性量度(或基于唯一性量度的值)大于閾值，那么可將對(duì)應(yīng)的語(yǔ)音分量分類為足夠唯一或足夠強(qiáng)。在一些配置中，分類為足夠唯一或足夠強(qiáng)(例如，大于閾值)的語(yǔ)音分量可作為建議在口令反饋114中提供。此外，包含所述語(yǔ)音分量或類似語(yǔ)音分量的類似語(yǔ)音分量和/或話語(yǔ)、字、短語(yǔ)和/或口令可作為建議在口令反饋114中提供。
[0071] 口令反饋模塊112可將口令反饋114提供到一或多個(gè)輸出裝置116。一或多個(gè)輸出裝置116可因此向用戶中繼或傳達(dá)口令反饋114。舉例來(lái)說(shuō)，輸出裝置116(例如，顯示器、觸摸屏、揚(yáng)聲器等）可中繼與音頻口令的強(qiáng)度相關(guān)聯(lián)的標(biāo)記。在一個(gè)方法中，顯示面板可顯示口令強(qiáng)度得分。另外或替代地，揚(yáng)聲器可輸出聲學(xué)信號(hào)（例如，文字到語(yǔ)音），其指示口令強(qiáng) 度得分(例如，"你的口令較弱"、"你的口令強(qiáng)度為60%"等）。
[0072] 在一些配置中，輸出裝置116可中繼一或多個(gè)建議。舉例來(lái)說(shuō)，顯示面板可顯示一或多個(gè)所建議語(yǔ)音分量，例如音素、音節(jié)、字、發(fā)聲和/或短語(yǔ)(例如7啊/、/嗯Λ/k/、/三角形/、/海市蜃樓/"）。另外或替代地，揚(yáng)聲器可輸出聲學(xué)信號(hào)以中繼一或多個(gè)建議(例如，"請(qǐng) 將/啊/、/嗯/、/k/、/三角形/、/海市蜃樓/和/或額外輸入類型添加到你的口令"）。
[0073]在一些配置中，可經(jīng)由一或多個(gè)圖形用戶接口（GUI)提供口令反饋114。舉例來(lái)說(shuō)，標(biāo)記(例如，口令強(qiáng)度得分）、一或多個(gè)建議和/或一或多個(gè)消息可在⑶I上呈現(xiàn)。在一些配置中，GUI還可提供用于接收用戶輸入的接口。舉例來(lái)說(shuō)，用戶可經(jīng)由GUI選擇一或多個(gè)建議 (例如，一或多個(gè)候選語(yǔ)音分量、合成字、所建議口令、一或多個(gè)額外驗(yàn)證輸入選項(xiàng)等）。
[0074] 在一些配置中，電子裝置102可包含檢驗(yàn)?zāi)K(未圖示）。所述檢驗(yàn)?zāi)K可基于音頻口令檢驗(yàn)說(shuō)話的用戶是否是真實(shí)用戶。應(yīng)注意，檢驗(yàn)程序可不同于口令評(píng)估程序。舉例來(lái) 說(shuō)，檢驗(yàn)可不發(fā)生，直到□令(例如，音頻□令和/或一或多個(gè)額外驗(yàn)證輸入)被設(shè)定為止。因此，如本文所揭示的口令評(píng)估和建議可包含不同于口令檢驗(yàn)的程序，例如其可僅在口令已設(shè)定之后發(fā)生。
[0075] 圖2是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法200的一個(gè)配置的流程圖。結(jié)合圖1描述的電子裝置102可執(zhí)行方法200。
[0076]電子裝置102可獲得(202) -或多個(gè)麥克風(fēng)104所捕獲的音頻信號(hào)106。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。音頻信號(hào)106可包含音頻口令。
[0077]電子裝置102可基于測(cè)量音頻信號(hào)106的一或多個(gè)特性（例如，唯一特性）來(lái)評(píng)估 (204)音頻口令的強(qiáng)度。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置102可用唯一性程度或與一或多個(gè)通用語(yǔ)音模型（例如，UBM)的區(qū)別來(lái)評(píng)估(204)音頻口令的一或多個(gè)語(yǔ)音分量(例如，發(fā)聲、音素等)的強(qiáng)度。在一些配置中，口令評(píng)估模塊108可利用多個(gè)通用語(yǔ)音模型(例如，UBM)，如上文所描述。舉例來(lái)說(shuō)，可基于用戶的輸入和/或特性(例如地理位置(例如，郵政編碼、城市、縣、州、國(guó)家等）、性別、年齡、語(yǔ)言、地方方言等)來(lái)采用（例如，選擇和/或適應(yīng)等)多個(gè)通用語(yǔ)音模型。
[0078] 在一些配置中，電子裝置102可基于如下測(cè)量音頻信號(hào)106的一或多個(gè)唯一特性來(lái) 評(píng)估(204)音頻口令的強(qiáng)度。電子裝置102可從音頻信號(hào)106提取一或多個(gè)特征。電子裝置 102可基于一或多個(gè)通用語(yǔ)音模型（例如，UMB)獲得音頻信號(hào)106的唯一性量度。電子裝置 102可基于所述唯一性量度來(lái)確定口令強(qiáng)度得分。
[0079] 在一些配置中，電子裝置102可確定音頻口令是否足夠強(qiáng)(例如，根據(jù)任意概率，根據(jù)用戶偏好和/或足以使冒名頂替者非常不可能借助于發(fā)出音頻口令而作為真實(shí)用戶通過(guò)）。舉例來(lái)說(shuō)，口令評(píng)估模塊108可將口令強(qiáng)度得分與一值進(jìn)行比較。所述值可為先前口令強(qiáng)度得分和/或閾值。
[0080] 電子裝置102可提供口令反饋114。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái) 說(shuō)，電子裝置102可基于音頻口令的強(qiáng)度的評(píng)估(例如，當(dāng)口令強(qiáng)度得分不大于值時(shí))來(lái)告知 (206)用戶音頻口令較弱?？诹罘答?14可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或建議的語(yǔ)音分量）、一或多個(gè)所建議動(dòng)作和/或一或多個(gè)消息。舉例來(lái)說(shuō)，口令反饋114可包含指示音頻口令較弱的口令強(qiáng)度得分和消息。另外或替代地，口令反饋114可包含用戶可用于創(chuàng)建較強(qiáng)音頻口令的一或多個(gè)建議語(yǔ)音分量。另外或替代地，口令反饋114 可包含用戶可提供額外驗(yàn)證輸入(例如，文本、數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如面部掃描、虹膜掃描、指紋等））的所建議動(dòng)作。
[0081] 可將口令反饋114提供到一或多個(gè)輸出裝置116。一或多個(gè)輸出裝置116可因此向用戶中繼或傳達(dá)口令反饋114 (例如，標(biāo)記、一或多個(gè)所建議語(yǔ)音分量、一或多個(gè)所建議動(dòng)作等），如上文結(jié)合圖1所描述。
[0082] 電子裝置102可任選地檢驗(yàn)用戶輸入。舉例來(lái)說(shuō)，電子裝置102可在口令(例如，音頻口令和/或額外驗(yàn)證輸入）已設(shè)定之后接收用戶輸入。電子裝置102可確定用戶輸入是否與口令充分匹配(例如，以足夠高的概率）。音頻口令檢驗(yàn)的一種方法是結(jié)合圖9所提供。如果用戶輸入與口令充分匹配(例如，與閾值概率和/或根據(jù)額外驗(yàn)證輸入的一個(gè)或額外準(zhǔn) 則），那么電子裝置102可準(zhǔn)予接入。舉例來(lái)說(shuō)，如果用戶輸入與口令充分匹配，那么電子裝置102可允許用戶接入一或多個(gè)功能(例如，應(yīng)用程序、呼叫等）。
[0083]圖3包含說(shuō)明唯一性量度的實(shí)例的圖表。明確地說(shuō)，圖3包含圖表A 318a、圖表 B318b和圖表C 318c。圖表A318a的垂直軸線梅爾頻率標(biāo)度說(shuō)明，且圖表A318a的水平軸以時(shí) 間（幀)說(shuō)明。圖表B 318b的垂直軸線說(shuō)明似然比，且圖表B 318b的水平軸以時(shí)間（幀)說(shuō)明。圖表C 318c的垂直軸線說(shuō)明似然比，且圖表C 318c的水平軸以時(shí)間（幀)說(shuō)明。
[0084]圖表A 318a說(shuō)明隨音頻信號(hào)的時(shí)間過(guò)去的梅爾頻率的頻譜圖。所述音頻信號(hào)包含短語(yǔ)(例如，音頻口令）"綠洲是海市蜃樓"。語(yǔ)音分量A 320包含話語(yǔ)"是"。語(yǔ)音分量B322在詞語(yǔ)"海市蜃樓"中包含話語(yǔ)"啊"。
[0085]圖表B 318b說(shuō)明隨時(shí)間的過(guò)去，真實(shí)用戶（例如，待驗(yàn)證的真實(shí)揚(yáng)聲器或用戶）的唯一性量度(例如，似然比）的一個(gè)實(shí)例。唯一性量度對(duì)應(yīng)于圖表A 318a。在此實(shí)例中，唯一性量度是真實(shí)用戶的語(yǔ)音（例如，用戶語(yǔ)音模型）與UBM之間的似然比。如在圖表B318b中可觀察到，語(yǔ)音分量A 320(例如，"是"）具有低唯一性。然而，語(yǔ)音分量B 322(例如，"海市蜃樓"中的"啊"）針對(duì)真實(shí)用戶具有高唯一性。
[0086]圖表C 318c說(shuō)明隨時(shí)間過(guò)去冒名頂替者的唯一性量度（例如，似然比）的一個(gè)實(shí) 例。唯一性量度對(duì)應(yīng)于圖表A 318a。在此實(shí)例中，唯一性量度是冒名頂替者的語(yǔ)音(例如，冒名頂替者語(yǔ)音模型）與UBM之間的似然比。如在圖表C 318c中可觀察到，語(yǔ)音分量A320 (例如，"是"）和語(yǔ)音分量B 322具有低唯一性。如圖3中所示，可利用提供真實(shí)用戶的升高的唯一性(例如，似然比）但提供冒名頂替者的低似然比的語(yǔ)音分量(例如，音素、音節(jié)、字等)來(lái) 創(chuàng)建較強(qiáng)口令。
[0087]圖4是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置402的更具體配置的框圖。結(jié)合圖4描述的電子裝置402可為結(jié)合圖1描述的電子裝置102的一個(gè)實(shí) 例。
[0088]電子裝置402包含一或多個(gè)麥克風(fēng)404、口令評(píng)估模塊408、口令反饋模塊412和一或多個(gè)輸出裝置416。包含于電子裝置402中的組件中的一或多者可對(duì)應(yīng)于包含于結(jié)合圖1 描述的電子裝置102中的組件中的一或多者和/或可類似于其而起作用。
[0089] 電子裝置402可任選地包含通信模塊436。通信模塊436可使電子裝置402能夠與一或多個(gè)遠(yuǎn)程裝置(例如，其它電子裝置、基站、服務(wù)器、計(jì)算機(jī)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施等)通信。通信模塊436可提供無(wú)線和/或有線通信。舉例來(lái)說(shuō)，通信模塊436可根據(jù)一或多個(gè)無(wú)線規(guī)范(例如，第三代合作伙伴計(jì)劃(3GPP)規(guī)范、電氣電子工程師學(xué)會(huì)(IEEE)802.11規(guī)范等）與一或多個(gè)其它裝置無(wú)線通信。另外或替代地，通信模塊436可經(jīng)由有線鏈路(例如，經(jīng)由以太網(wǎng)、有線通信等)與其它裝置通信。
[0090] 一或多個(gè)麥克風(fēng)404可捕獲音頻信號(hào)406。音頻信號(hào)406可包含音頻口令。音頻口令可包含用于檢驗(yàn)用戶的身份的一或多個(gè)聲音(例如，一或多個(gè)語(yǔ)音分量，例如音素、音節(jié)、詞語(yǔ)、短語(yǔ)、語(yǔ)句、發(fā)聲等）?？蓪⒁纛l信號(hào)406提供到口令評(píng)估模塊408。
[0091] 口令評(píng)估模塊408可包含特征提取模塊424、唯一性測(cè)量模塊428和/或口令強(qiáng)度計(jì) 分模塊432。
[0092] 口令評(píng)估模塊408(例如，特征提取模塊424)可獲得(例如，接收)一或多個(gè)麥克風(fēng) 404所捕獲的音頻信號(hào)406。特征提取模塊424可從音頻信號(hào)406提取一或多個(gè)特征以獲得所提取特征426。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，特征提取模塊424可基于音頻信號(hào)406確定一或多個(gè)MFCC JFCC可為所提取特征426的一個(gè)實(shí)例。特征提取模塊424可耦合到唯一性測(cè)量模塊428。特征提取模塊424可將所提取的特征426提供到唯一性測(cè)量模塊428。
[0093] 唯一性測(cè)量模塊428可基于一或多個(gè)通用語(yǔ)音模型（例如，UMB)獲得音頻信號(hào)406 的唯一性量度430。在一些配置中，唯一性量度可為音頻信號(hào)406與通用語(yǔ)音模型之間的似然比。圖3中的圖表B 318b說(shuō)明唯一性量度430 (例如，似然比）的一個(gè)實(shí)例。在一些配置中，電子裝置402可本地確定（例如，計(jì)算）唯一性量度430。舉例來(lái)說(shuō)，電子裝置402可本地存儲(chǔ) 一或多個(gè)通用語(yǔ)音模型，其可用來(lái)確定唯一性量度430。在其它配置中，電子裝置402可從遠(yuǎn) 程裝置(例如，服務(wù)器、中央服務(wù)器)接收唯一性量度430。舉例來(lái)說(shuō)，遠(yuǎn)程裝置(例如，服務(wù) 器、中央服務(wù)器)可存儲(chǔ)一或多個(gè)通用語(yǔ)音模型，其可用于遠(yuǎn)程確定唯一性量度430。
[0094]在一些配置中，可如上文結(jié)合圖1所描述，可獲得和/或更新通用語(yǔ)音模型。舉例來(lái) 說(shuō)，電子裝置402和/或遠(yuǎn)程裝置(例如，服務(wù)器)可獲得和/或更新通用語(yǔ)音模型。在一些配置中，電子裝置402可獲得和/或更新通用語(yǔ)音模型。舉例來(lái)說(shuō)，電子裝置402(例如，唯一性測(cè)量模塊428)可存儲(chǔ)用于通用語(yǔ)音模型的預(yù)定數(shù)據(jù)。電子裝置402可任選地通過(guò)經(jīng)由通信模塊436從遠(yuǎn)程裝置(例如，服務(wù)器、中央服務(wù)器等)接收數(shù)據(jù)來(lái)更新通用語(yǔ)音模型。
[0095]在一些配置中，電子裝置402(例如，唯一性測(cè)量模塊428)可接收和/或確定用戶特性(例如，性別、年齡、位置等）。舉例來(lái)說(shuō)，唯一性測(cè)量模塊428可獲得如由用戶經(jīng)由一或多個(gè)輸入裝置輸入的用戶特性。電子裝置402(例如，唯一性測(cè)量模塊428)可任選地將通用語(yǔ) 音模型（例如，UBM)更新請(qǐng)求發(fā)送到遠(yuǎn)程裝置(例如，服務(wù)器、中央服務(wù)器等）。在一些方法中，通用語(yǔ)音模型更新請(qǐng)求可包含用戶特性的一或多個(gè)指示符。所述遠(yuǎn)程裝置可任選地(基于例如用戶特性)為電子裝置402的通用語(yǔ)音模型確定更新。所述遠(yuǎn)程裝置可將通用語(yǔ)音模型(例如，UBM)更新數(shù)據(jù)發(fā)送到電子裝置402。通用語(yǔ)音模型更新數(shù)據(jù)可基于用戶特性，其可由所述電子裝置402用于適應(yīng)或修改電子裝置402(例如，唯一性測(cè)量模塊428)所使用的通用語(yǔ)音模型。
[0096] 在一些配置中，電子裝置402可將唯一性量度請(qǐng)求發(fā)送到遠(yuǎn)程裝置。舉例來(lái)說(shuō)，唯一性測(cè)量模塊428可將唯一性量度請(qǐng)求提供到通信模塊436，其可將唯一性量度請(qǐng)求發(fā)送到遠(yuǎn)程裝置(例如，服務(wù)器）。唯一性量度請(qǐng)求可包含關(guān)于音頻信號(hào)106的信息(例如，所提取特征426)。在此方法中，遠(yuǎn)程裝置(例如，服務(wù)器)可基于一或多個(gè)通用語(yǔ)音模型（例如，UBM)確定(例如，計(jì)算)唯一性量度430(例如，似然比）。電子裝置402 (例如，通信模塊436)可接收唯一性量度430，并將唯一性量度430提供到唯一性測(cè)量模塊428。
[0097]應(yīng)注意，在一些配置中，遠(yuǎn)程裝置可基于用戶信息（例如，位置、年齡、性別等）獲得、維持和/或適應(yīng)其通用語(yǔ)音模型。所述用戶信息可由遠(yuǎn)程裝置從電子裝置402、一或多個(gè) 其它裝置和/或一或多個(gè)第三方接收。遠(yuǎn)程裝置接著可將唯一性量度發(fā)送到電子裝置402。 [0098]唯一性測(cè)量模塊428可將唯一性量度430提供到口令強(qiáng)度計(jì)分模塊432?？诹顝?qiáng)度計(jì)分模塊432可基于唯一性量度430確定一或多個(gè)口令強(qiáng)度得分434。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，口令強(qiáng)度得分可為唯一性量度，和/或確定口令強(qiáng)度得分可包含組合(例如，求和、求平均等)所述唯一性量度的若干部分。另外或替代地，確定口令強(qiáng)度得分可包含映射唯一"性量度、映射所述唯一"性量度的一或多個(gè)部分和/或映射一或多個(gè)概述統(tǒng)計(jì)到數(shù)值(例如，百分比）、到字(例如，"弱"、"適中"、"強(qiáng)"等)和/或到一些其它指示符 (例如，色彩、形狀等）。
[0099] 口令強(qiáng)度計(jì)分模塊432可確定音頻口令是否足夠強(qiáng)，如上文結(jié)合圖1所描述。舉例來(lái)說(shuō)，口令強(qiáng)度計(jì)分模塊432可將口令強(qiáng)度得分434與一或多個(gè)值(例如，先前口令強(qiáng)度得分和/或閾值)進(jìn)行比較。在一些配置中，口令強(qiáng)度得分可結(jié)合音頻口令反映一或多個(gè)額外驗(yàn) 證輸入(例如，空間方向性、文本、數(shù)值代碼、字母數(shù)字串、額外生物計(jì)量等）。在一些配置中，電子裝置402(例如，口令評(píng)估模塊408)可使音頻信號(hào)406和/或額外驗(yàn)證輸入降級(jí)。
[0100] 口令評(píng)估模塊408可將評(píng)估信息提供到口令反饋模塊412。舉例來(lái)說(shuō)，評(píng)估信息410 可包含所提取特征426、唯一性量度430、口令強(qiáng)度得分434和/或其它信息。
[0101] 口令反饋模塊412可任選地包含語(yǔ)音辨識(shí)模塊438、對(duì)準(zhǔn)模塊442和/或語(yǔ)音分量分類模塊446語(yǔ)音辨識(shí)模塊438可基于一或多個(gè)所提取的特征426執(zhí)行語(yǔ)音辨識(shí)。舉例來(lái)說(shuō)，口令反饋模塊412可基于一或多個(gè)所提取的特征426來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量440。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。語(yǔ)音辨識(shí)模塊438可將所辨識(shí)的語(yǔ)音分量440提供到對(duì)準(zhǔn)模塊442。
[0102] 對(duì)準(zhǔn)模塊442可使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn)。舉例來(lái)說(shuō)，對(duì)準(zhǔn)模塊442可使一或多個(gè)所辨識(shí)語(yǔ)音分量440的出現(xiàn)與唯一性量度在時(shí)間上對(duì)準(zhǔn)，以產(chǎn)生對(duì)準(zhǔn)語(yǔ)音和唯一性444。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。對(duì)準(zhǔn)模塊442可將經(jīng)對(duì)準(zhǔn)的語(yǔ)音和唯一性444提供到語(yǔ)音分量分類模塊446。
[0103] 語(yǔ)音分量分類模塊446可基于唯一性量度430對(duì)一或多個(gè)語(yǔ)音分量(例如，所辨識(shí) 語(yǔ)音分量440)進(jìn)行分類。舉例來(lái)說(shuō)，口令反饋模塊412可確定經(jīng)對(duì)準(zhǔn)語(yǔ)音和唯一性444中的一或多個(gè)所辨識(shí)語(yǔ)音分量中的每一者的唯一性(例如，強(qiáng)度或弱度）。在一些配置中，口令反饋模塊412可將經(jīng)對(duì)準(zhǔn)語(yǔ)音分量中的每一者處的唯一性量度(或基于唯一性量度的一些值，例如平均值、最大值、最小值等)與一或多個(gè)閾值進(jìn)行比較。如果對(duì)應(yīng)于語(yǔ)音分量的唯一性量度(或基于唯一性量度的值)大于閾值，那么可將對(duì)應(yīng)的語(yǔ)音分量分類為足夠唯一或足夠強(qiáng)。在一些配置中，分類為足夠唯一或足夠強(qiáng)(例如，大于閾值)的語(yǔ)音分量可作為建議在口令反饋414中提供。此外，包含所述語(yǔ)音分量或類似語(yǔ)音分量的類似語(yǔ)音分量和/或話語(yǔ)、字、短語(yǔ)和/或口令可作為建議在口令反饋414中提供。
[0104] 口令反饋模塊412可將口令反饋414提供到一或多個(gè)輸出裝置416?？诹罘答?14可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或所建議語(yǔ)音分量、一或多個(gè) 所建議動(dòng)作（例如，建議一或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。一或多個(gè)輸出裝置 416可因此向用戶中繼或傳達(dá)口令反饋414。此操作可如上文結(jié)合圖1所描述來(lái)實(shí)現(xiàn)。舉例來(lái) 說(shuō)，輸出裝置416可輸出口令反饋414作為文本、圖像和/或聲音。所述輸出可中繼標(biāo)記（例如，口令強(qiáng)度得分）、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或所建議語(yǔ)音分量）、一或多個(gè) 所建議動(dòng)作(例如，建議一或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。
[0105] 圖5是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法500的更具體配置的流程圖。結(jié)合圖1 和4描述的電子裝置102、402中的一或多者可執(zhí)行方法500。
[0106]電子裝置402可基于預(yù)訓(xùn)練任選地提供(502)-或多個(gè)候選語(yǔ)音分量。結(jié)合圖10描述基于預(yù)訓(xùn)練提供(502)-或多個(gè)候選語(yǔ)音分量的實(shí)例。
[0107] 電子裝置402可獲得(504) -或多個(gè)麥克風(fēng)404所捕獲的音頻信號(hào)406。這可如上文結(jié)合圖1到2以及4中的一或多者所描述來(lái)實(shí)現(xiàn)。音頻信號(hào)106可包含音頻口令。音頻口令可包含用于檢驗(yàn)用戶的身份的一或多個(gè)聲音（例如，一或多個(gè)語(yǔ)音分量，例如音素、音節(jié)、詞語(yǔ)、短語(yǔ)、語(yǔ)句、發(fā)聲等）。
[0108] 電子裝置402可從音頻信號(hào)406提取(506) -或多個(gè)特征以獲得所提取特征426。這可如上文結(jié)合圖1和4中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置402可基于音頻信號(hào) 406確定一或多個(gè)MFCC JFCC可為所提取特征426的一個(gè)實(shí)例。
[0109] 電子裝置402可基于一或多個(gè)通用語(yǔ)音模型（例如，UMB)獲得(508)音頻信號(hào)406的唯一性量度430。這可如上文結(jié)合圖1到4中的一或多者所描述來(lái)實(shí)現(xiàn)。在一些配置中，唯一性量度可為音頻信號(hào)406與通用語(yǔ)音模型之間的似然比。在一些配置中，電子裝置402可本地確定(例如，計(jì)算)唯一性量度430。舉例來(lái)說(shuō)，電子裝置402可本地存儲(chǔ)一或多個(gè)通用語(yǔ)音模型（例如，本地UBM)，其可用來(lái)確定唯一性量度430。在其它配置中，電子裝置402可從遠(yuǎn)程裝置(例如，服務(wù)器、中央服務(wù)器)接收唯一性量度430。舉例來(lái)說(shuō)，遠(yuǎn)程裝置(例如，服務(wù)器、中央服務(wù)器)可存儲(chǔ)一或多個(gè)通用語(yǔ)音模型，其可用于遠(yuǎn)程確定唯一性量度430。在一些配置中，電子裝置402可將唯一性量度請(qǐng)求發(fā)送到遠(yuǎn)程裝置。唯一性量度請(qǐng)求可包含關(guān)于音頻信號(hào)406的信息（例如，所提取特征426)。在此方法中，遠(yuǎn)程裝置(例如，服務(wù)器)可基于一或多個(gè)通用語(yǔ)音模型（例如，UBM)確定(例如，計(jì)算)唯一性量度430(例如，似然比）。電子裝置 402可接收唯一性量度430。
[0110]電子裝置402可基于所述唯一性量度430來(lái)確定(510) 口令強(qiáng)度得分434。這可如上文結(jié)合圖1和4中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0111] 電子裝置402可確定(512) 口令強(qiáng)度得分是否大于一值。這可如上文結(jié)合圖1和4中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置402可將口令強(qiáng)度得分434與一值(例如，先前口令強(qiáng)度得分和/或閾值)進(jìn)行比較。
[0112] 如果口令強(qiáng)度得分434大于所述值(例如，先前口令強(qiáng)度得分和/或閾值），那么電子裝置402可基于音頻信號(hào)406設(shè)定(516) 口令。在一些配置中，電子裝置402可存儲(chǔ)音頻信號(hào)406和/或指定音頻信號(hào)406作為口令。另外或替代地，電子裝置402可存儲(chǔ)和/或指定包含于作為口令的音頻信號(hào)406中的所辨識(shí)語(yǔ)音分量的組合。
[0113] 如果口令強(qiáng)度得分434不大于所述值（例如，小于或等于所述值），那么電子裝置 402可提供(514) 口令反饋。這可如上文結(jié)合圖1到2以及4中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置402可提供和/或輸出口令反饋414。口令反饋414可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或所建議語(yǔ)音分量、一或多個(gè)所建議動(dòng)作(例如，建議一或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。舉例來(lái)說(shuō)，電子裝置402可輸出口令反饋414作為文本、圖像和/或聲音。所述輸出可中繼標(biāo)記(例如，口令強(qiáng)度得分）、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或所建議語(yǔ)音分量）、一或多個(gè)所建議動(dòng)作（例如，建議一或多個(gè)額外驗(yàn) 證輸入)和/或一或多個(gè)消息。
[0114] 圖6是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法600的另一更具體配置的流程圖。明確地說(shuō)，這種配置提供可執(zhí)行以便提供一或多個(gè)建議的操作的實(shí)例。結(jié)合圖1和4描述的電子裝置102、402中的一或多者可執(zhí)行方法600。
[0115] 電子裝置402可基于預(yù)訓(xùn)練任選地提供(602)-或多個(gè)候選語(yǔ)音分量。結(jié)合圖10描述基于預(yù)訓(xùn)練提供(602)-或多個(gè)候選語(yǔ)音分量的實(shí)例。
[0116] 電子裝置402可獲得(604) -或多個(gè)麥克風(fēng)404所捕獲的音頻信號(hào)406。這可如上文結(jié)合圖1到2以及4到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0117] 電子裝置402可從音頻信號(hào)406提取(606)-或多個(gè)特征以獲得所提取特征426。這可如上文結(jié)合圖1以及4到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0118] 電子裝置402可基于一或多個(gè)通用語(yǔ)音模型（例如，UMB)獲得(608)音頻信號(hào)406的唯一性量度430。這可如上文結(jié)合圖1以及4到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0119] 電子裝置402可基于所述唯一性量度430來(lái)確定(610) 口令強(qiáng)度得分434。這可如上文結(jié)合圖1以及4到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0120] 電子裝置402可確定(612) 口令強(qiáng)度得分是否大于一值。這可如上文結(jié)合圖1以及4 到5中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0121] 如果口令強(qiáng)度得分434大于所述值(例如，先前口令強(qiáng)度得分和/或閾值），那么電子裝置402可基于音頻信號(hào)406來(lái)設(shè)定(622) 口令。此操作可如上文結(jié)合圖5所描述來(lái)實(shí)現(xiàn)。
[0122] 如果口令強(qiáng)度得分434不大于所述值（例如，小于或等于所述值），那么電子裝置 402可基于一或多個(gè)所提取的特征426來(lái)執(zhí)行(614)語(yǔ)音辨識(shí)。舉例來(lái)說(shuō)，電子裝置402可基于一或多個(gè)所提取的特征426來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量440。此操作可如上文結(jié)合圖 1所描述來(lái)實(shí)現(xiàn)。
[0123] 電子裝置402可使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn)(616)。舉例來(lái)說(shuō)，電子裝置402可使一或多個(gè)所辨識(shí)語(yǔ)音分量的出現(xiàn)與所述唯一性量度在時(shí)間上對(duì)準(zhǔn)，以產(chǎn)生經(jīng)對(duì)準(zhǔn)的語(yǔ)音和唯一性444。這可如上文結(jié)合圖1和4中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0124] 電子裝置402可基于唯一性量度430對(duì)一或多個(gè)語(yǔ)音分量(例如，所辨識(shí)語(yǔ)音分量 440)進(jìn)行分類(618)。舉例來(lái)說(shuō)，電子裝置402可確定經(jīng)對(duì)準(zhǔn)語(yǔ)音和唯一性444中的一或多個(gè) 所辨識(shí)語(yǔ)音分量中的每一者的唯一性（例如，強(qiáng)度或弱度）。在一些配置中，口令反饋模塊 412可將經(jīng)對(duì)準(zhǔn)語(yǔ)音分量中的每一者處的唯一性量度(或基于唯一性量度的一些值，例如平均值、最大值、最小值等)與一或多個(gè)閾值進(jìn)行比較。如果對(duì)應(yīng)于語(yǔ)音分量的唯一性量度(或基于唯一性量度的值)大于閾值，那么可將對(duì)應(yīng)的語(yǔ)音分量分類為足夠唯一或足夠強(qiáng)。在一些配置中，分類為足夠唯一或足夠強(qiáng)(例如，大于閾值）的語(yǔ)音分量可作為建議在口令反饋 414中提供(620)。此外，包含所述語(yǔ)音分量或類似語(yǔ)音分量的類似語(yǔ)音分量和/或話語(yǔ)、字、短語(yǔ)和/或口令可作為建議在口令反饋414中提供(620)。
[0125] 電子裝置402可提供(620) 口令反饋。此操作可如上文結(jié)合圖1以及4到5中的一或多者所描述而實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置402可提供和/或輸出口令反饋414。口令反饋414可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或所建議語(yǔ)音分量、一或多個(gè) 所建議動(dòng)作(例如，建議一或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。舉例來(lái)說(shuō)，電子裝置 402可輸出口令反饋414作為文本、圖像和/或聲音。所述輸出可中繼標(biāo)記(例如，口令強(qiáng)度得分）、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或所建議語(yǔ)音分量）、一或多個(gè)所建議動(dòng)作(例如，建議一或多個(gè)額外驗(yàn)證輸入)和/或一或多個(gè)消息。在一些配置中，電子裝置402可提供 (620)由所建議的語(yǔ)音分量組成的所建議合成(例如未知)字作為口令反饋。
[0126] 圖7是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法700的另一更具體配置的流程圖。明確地說(shuō)，這種配置提供可為用其它用戶的模型進(jìn)行口令強(qiáng)度評(píng)估和建議執(zhí)行的操作的實(shí)例。結(jié)合圖1和4描述的電子裝置102、402中的一或多者可執(zhí)行方法700。
[0127] 電子裝置402可基于預(yù)訓(xùn)練任選地提供(702)-或多個(gè)候選語(yǔ)音分量。結(jié)合圖10描述基于預(yù)訓(xùn)練提供(702)-或多個(gè)候選語(yǔ)音分量的實(shí)例。
[0128] 電子裝置402可獲得(704) -或多個(gè)麥克風(fēng)404所捕獲的音頻信號(hào)406。這可如上文結(jié)合圖1到2以及4到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0129] 電子裝置402可從音頻信號(hào)406提取(706)-或多個(gè)特征以獲得所提取特征426。這可如上文結(jié)合圖1以及4到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0130]電子裝置402可將唯一性量度請(qǐng)求發(fā)送(708)(例如，到遠(yuǎn)程裝置）。此操作可如上文結(jié)合圖4所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置402可經(jīng)由有線和/或無(wú)線通信將唯一性量度請(qǐng)求發(fā)送到遠(yuǎn)程裝置(例如，服務(wù)器）。唯一性量度請(qǐng)求可包含關(guān)于音頻信號(hào)406的信息（例如，所提取特征426)。在此方法中，遠(yuǎn)程裝置(例如，服務(wù)器)可基于一或多個(gè)通用語(yǔ)音模型 (例如，UBM、其它用戶的語(yǔ)音模型等)確定(例如，計(jì)算)唯一性量度430(例如，似然比）。應(yīng)注意，在一些配置中，遠(yuǎn)程裝置可基于用戶信息(例如，位置、年齡、性別等)獲得、維持和/或適應(yīng)其通用語(yǔ)音模型。所述用戶信息可由遠(yuǎn)程裝置從電子裝置402、一或多個(gè)其它裝置和/或一或多個(gè)第三方接收。遠(yuǎn)程裝置接著可將唯一性量度發(fā)送到電子裝置402。
[0131] 電子裝置402(例如，通信模塊436)可接收(710)唯一性量度430。舉例來(lái)說(shuō)，電子裝置402可經(jīng)由有線和/或無(wú)線通信從遠(yuǎn)程裝置(例如，服務(wù)器)接收(710)唯一性量度430。
[0132] 電子裝置402可基于所述唯一性量度430來(lái)確定(712) 口令強(qiáng)度得分434。這可如上文結(jié)合圖1以及4到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0133] 電子裝置402可確定(714) 口令強(qiáng)度得分是否大于一值。這可如上文結(jié)合圖1以及4 到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0134] 如果口令強(qiáng)度得分434大于所述值(例如，先前口令強(qiáng)度得分和/或閾值），那么電子裝置402可基于音頻信號(hào)406來(lái)設(shè)定(724) 口令。這可如上文結(jié)合圖5到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0135] 如果口令強(qiáng)度得分434不大于所述值（例如，小于或等于所述值），那么電子裝置 402可基于一或多個(gè)所提取的特征426任選地執(zhí)行（716)語(yǔ)音辨識(shí)。這可如上文結(jié)合圖1到6 中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0136] 電子裝置402可任選地使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn) (718)。這可如上文結(jié)合圖1、4和6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0137] 電子裝置402可任選地基于唯一性量度430對(duì)一或多個(gè)語(yǔ)音分量(例如，所辨識(shí)語(yǔ) 音分量440)進(jìn)行分類(720)。這可如上文結(jié)合圖1、4和6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0138] 電子裝置402可提供(722) 口令反饋。這可如上文結(jié)合圖1以及4到6中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0139] 圖8是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法800的另一更具體配置的流程圖。明確地說(shuō)，這種配置提供可執(zhí)行以用于更新通用語(yǔ)音模型的操作的實(shí)例。結(jié)合圖1和4描述的電子裝置102、402中的一或多者可執(zhí)行方法800。
[0140]電子裝置402可基于預(yù)訓(xùn)練任選地提供(802)-或多個(gè)候選語(yǔ)音分量。結(jié)合圖10描述基于預(yù)訓(xùn)練提供(802)-或多個(gè)候選語(yǔ)音分量的實(shí)例。
[0141] 電子裝置402可獲得(804) -或多個(gè)麥克風(fēng)404所捕獲的音頻信號(hào)406。這可如上文結(jié)合圖1到2以及4到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0142] 電子裝置402可從音頻信號(hào)406提取(806)-或多個(gè)特征以獲得所提取特征426。這可如上文結(jié)合圖1以及4到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0143] 電子裝置402可獲得(808)-或多個(gè)用戶特性。用戶特性的實(shí)例包含地理位置(例如，郵政編碼、城市、縣、州、國(guó)家等）、性別、年齡、語(yǔ)言和/或地方方言等。舉例來(lái)說(shuō)，電子裝置402可(例如，從用戶)接收指示一或多個(gè)用戶特性的一或多個(gè)輸入。另外或替代地，電子裝置402可從一或多個(gè)傳感器獲得(808)-或多個(gè)用戶特性。舉例來(lái)說(shuō)，電子裝置402可基于從麥克風(fēng)404捕獲的音頻來(lái)確定用戶的性別、語(yǔ)言和/或地方方言。另外或替代地，電子裝置 402可基于從麥克風(fēng)404捕獲的音頻來(lái)估計(jì)用戶年齡。另外或替代地，電子裝置402可基于來(lái) 自全球定位系統(tǒng)(GPS)模塊的數(shù)據(jù)確定地理位置。另外或替代地，電子裝置402可從遠(yuǎn)程裝置(例如，服務(wù)提供商服務(wù)器)請(qǐng)求一或多個(gè)用戶特性。
[0144] 電子裝置402可基于一或多個(gè)用戶特性更新(810)通用語(yǔ)音模型。這可如上文結(jié)合圖1和4中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置402和/或遠(yuǎn)程裝置(例如，服務(wù)器）可更新(810)通用語(yǔ)音模型。在一些配置中，電子裝置402可基于用戶特性來(lái)本地更新(810) 通用語(yǔ)音模型。舉例來(lái)說(shuō)，電子裝置402可任選地存儲(chǔ)用于通用語(yǔ)音模型的預(yù)定數(shù)據(jù)，電子裝置402可通過(guò)僅包含具有類似于所述用戶的特性的特性的其它用戶的數(shù)據(jù)來(lái)本地更新 (810)所述預(yù)定數(shù)據(jù)。
[0145] 電子裝置402可通過(guò)經(jīng)由通信模塊436將用戶特性發(fā)送到遠(yuǎn)程裝置(例如，服務(wù)器）和/或從遠(yuǎn)程裝置（例如，服務(wù)器、中央服務(wù)器等）接收數(shù)據(jù)，基于用戶特性來(lái)任選地更新 (810)通用語(yǔ)音模型。舉例來(lái)說(shuō)，電子裝置402可將通用語(yǔ)音模型（例如，UBM)更新請(qǐng)求發(fā)送到遠(yuǎn)程裝置(例如，服務(wù)器、中央服務(wù)器等）。在一些方法中，通用語(yǔ)音模型更新請(qǐng)求可包含用戶特性的一或多個(gè)指示符。在一些配置中，遠(yuǎn)程裝置可基于用戶特性來(lái)更新存儲(chǔ)在遠(yuǎn)程裝置上的一或多個(gè)通用語(yǔ)音模型。另外或替代地，遠(yuǎn)程裝置可(例如，基于用戶特性)任選地確定對(duì)電子裝置402的通用語(yǔ)音模型的更新。所述遠(yuǎn)程裝置可將通用語(yǔ)音模型（例如，UBM) 更新數(shù)據(jù)發(fā)送到電子裝置402。
[0146] 電子裝置402可基于一或多個(gè)通用語(yǔ)音模型（例如，UMB)獲得(812)音頻信號(hào)406的唯一性量度430。這可如上文結(jié)合圖1以及4到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0147] 電子裝置402可基于所述唯一性量度430來(lái)確定(814) 口令強(qiáng)度得分434。這可如上文結(jié)合圖1以及4到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0148] 電子裝置402可確定(816) 口令強(qiáng)度得分是否大于一值。這可如上文結(jié)合圖1以及4 到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0149] 如果口令強(qiáng)度得分434大于所述值(例如，先前口令強(qiáng)度得分和/或閾值），那么電子裝置402可基于音頻信號(hào)406來(lái)設(shè)定(826) 口令。這可如上文結(jié)合圖5到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0150] 如果口令強(qiáng)度得分434不大于所述值（例如，小于或等于所述值），那么電子裝置 402可任選地基于一或多個(gè)所提取的特征426執(zhí)行(818)語(yǔ)音辨識(shí)。這可如上文結(jié)合圖1以及 6到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0151] 電子裝置402可任選地使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn) (820)。這可如上文結(jié)合圖1、4以及6到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0152] 電子裝置402可任選地基于唯一性量度430對(duì)一或多個(gè)語(yǔ)音分量(例如，所辨識(shí)語(yǔ) 音分量440)進(jìn)行分類(822)。這可如上文結(jié)合圖1、4以及6到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0153] 電子裝置402可提供(824) 口令反饋。這可如上文結(jié)合圖1以及4到7中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0154] 圖9是說(shuō)明揚(yáng)聲器(例如，用戶)辨識(shí)模型的一個(gè)實(shí)例的框圖。揚(yáng)聲器辨識(shí)模型可基于文本無(wú)關(guān)揚(yáng)聲器辨識(shí)。一個(gè)模型是基于MFCC和UBM-GMM。這包含使用GMM來(lái)訓(xùn)練UBM。如圖9 中所示，訓(xùn)練948可包含將訓(xùn)練語(yǔ)音950用于通用語(yǔ)音模型產(chǎn)生952。
[0155] 在一些方法中，可使用對(duì)通用語(yǔ)音模型（例如，UBM)的最大后驗(yàn)概率(MAP)適應(yīng)來(lái) 執(zhí)行揚(yáng)聲器登記954。如圖9中所示，登記954(例如，適應(yīng))可包含將用戶話語(yǔ)956用于用戶語(yǔ) 音模型產(chǎn)生958。
[0156] 在一些方法中，可通過(guò)比較通用語(yǔ)音模型（例如，UBM)與每一所登記揚(yáng)聲器模型之間的似然比來(lái)檢驗(yàn)每一語(yǔ)音話語(yǔ)962。如圖9中所示，可在檢驗(yàn)(964)程序中利用每一話語(yǔ) 962。舉例來(lái)說(shuō)，可根據(jù)等式（1)和/或等式(2)執(zhí)行檢驗(yàn)(964)程序。舉例來(lái)說(shuō)，檢驗(yàn)(964)程序可根i
k行，其中t是時(shí)間，X是話語(yǔ)962或音頻信號(hào)，Atarget是目標(biāo)（例如，真實(shí)用戶話語(yǔ))模型，Ageneric是通用語(yǔ)音模型（例如，UBM)，p(X Atarge3t)是X對(duì)應(yīng)于真實(shí)用戶的概率，p (X I Ag_ri。)是X對(duì)應(yīng)于通用用戶(例如，冒名頂替者、非真實(shí)用戶、非用戶相依模型或通用揚(yáng)聲器模型）的概率，且Θ是檢驗(yàn)閾值。當(dāng)識(shí)別多個(gè)揚(yáng)聲器時(shí)，可選擇產(chǎn)生最高可能性的那個(gè)揚(yáng)聲器。另外或替代地，可利用其它分類器(例如，支持向量機(jī)或神經(jīng)網(wǎng)絡(luò)）。
[0157] 圖10是說(shuō)明用于基于預(yù)訓(xùn)練提供一或多個(gè)候選語(yǔ)音分量的方法1000的一個(gè)配置的流程圖。舉例來(lái)說(shuō)，結(jié)合圖10描述的程序中的一或多者可用于針對(duì)登記的預(yù)訓(xùn)練中。舉例來(lái)說(shuō)，針對(duì)登記的預(yù)訓(xùn)練可在接收到用于評(píng)估(例如，在結(jié)合圖5到8中的一或多者描述的步驟502、602、702和802中的一或多者中）的音頻口令之前發(fā)生。
[0158] 下文給出關(guān)于登記和比較的更多細(xì)節(jié)。登記用戶的一種方法可包含讓用戶說(shuō)一會(huì) 話，以提供足夠的音素來(lái)從通用語(yǔ)音模型(例如，UBM)適應(yīng)所述用戶的模型。在一些配置中，電子裝置102、402可提供一些預(yù)定義的在語(yǔ)音學(xué)上平衡的語(yǔ)句來(lái)最小化訓(xùn)練時(shí)間。另外或替代地，用戶可讀足夠長(zhǎng)的提詞（例如，以充分地訓(xùn)練，使通用語(yǔ)音模型適應(yīng)所述用戶的語(yǔ) 音模型）。
[0159] 另外或替代地，電子裝置102、402可收集呼叫期間的用戶數(shù)據(jù)(例如，語(yǔ)音），假定所述用戶是所述裝置的屬主(例如，真實(shí)用戶）。一旦達(dá)到數(shù)據(jù)大小方面的某一層級(jí)，電子裝置102、402就可通知或告知(例如，顯示消息，輸出提供所述消息的語(yǔ)音）用戶可啟用話音口令。在一些配置中，電子裝置可繼續(xù)更新用戶的語(yǔ)音模型。以此方式，可監(jiān)視用戶隨時(shí)間的音色改變(例如，年齡相關(guān)改變）。
[0160] 結(jié)合圖1和4中的一或多者描述的電子裝置102、402中的一或多者可執(zhí)行方法 1000。應(yīng)注意，盡管如結(jié)合圖10所描述的預(yù)訓(xùn)練或登記期間所執(zhí)行的程序中的一或多者可類似于在獲得和評(píng)估音頻口令(例如，如結(jié)合圖1到2以及4到8中的一或多者所描述)后即刻執(zhí)行的程序中的一或多者，結(jié)合圖10所描述的程序中的一或多者可與在如上文所描述獲得音頻口令后即刻進(jìn)行的程序分開和/或在其之前進(jìn)行。
[0161] 電子裝置402可接收（1002)用戶音頻信號(hào)406。舉例來(lái)說(shuō)，用戶音頻信號(hào)406可由一或多個(gè)麥克風(fēng)404捕獲。舉例來(lái)說(shuō)，當(dāng)用戶讀提詞或打電話時(shí)，可接收用戶音頻信號(hào)406。
[0162] 電子裝置402可確定（1004)是否在良好聲學(xué)條件下接收到用戶音頻信號(hào)406。舉例來(lái)說(shuō)，電子裝置402可確定用戶音頻信號(hào)406的信噪比（SNR)。如果SNR高于SNR閾值，那么電子裝置402可確定（1004)在良好聲學(xué)條件下接收到用戶音頻信號(hào)406。如果SNR不高于（例如，小于或等于)SNR閾值，那么電子裝置402可確定（1004)未在良好聲學(xué)條件下接收到用戶音頻信號(hào)406。如果未在良好聲學(xué)條件下接收到用戶音頻信號(hào)406,那么電子裝置402可丟棄接收到的用戶音頻信號(hào)406并返回以接收（1002)后續(xù)用戶音頻信號(hào)406。
[0163] 如果在良好聲學(xué)條件下接收到用戶音頻信號(hào)406,那么電子裝置402可從音頻信號(hào) 406提?。?006)-或多個(gè)特征，以獲得所提取特征426。舉例來(lái)說(shuō)，電子裝置402可基于音頻信號(hào)406確定一或多個(gè)MFCC。
[0164] 電子裝置402可基于一或多個(gè)通用語(yǔ)音模型（例如，UMB)確定（1008)音頻信號(hào)406 的唯一性量度430。在一些配置中，唯一性量度可為音頻信號(hào)406與通用語(yǔ)音模型之間的似然比。在一些配置中，電子裝置402可本地確定(例如，計(jì)算)唯一性量度430。在其它配置中，電子裝置402可從遠(yuǎn)程裝置(例如，服務(wù)器、中央服務(wù)器)請(qǐng)求和接收唯一性量度430。
[0165] 電子裝置402可基于一或多個(gè)所提取的特征426執(zhí)行（1010)語(yǔ)音辨識(shí)。舉例來(lái)說(shuō)，電子裝置402可基于一或多個(gè)所提取的特征426來(lái)確定一或多個(gè)所辨識(shí)語(yǔ)音分量440。
[0166] 電子裝置402可使唯一性量度430與一或多個(gè)所辨識(shí)語(yǔ)音分量440對(duì)準(zhǔn)（1012)。舉例來(lái)說(shuō)，電子裝置402可使一或多個(gè)所辨識(shí)語(yǔ)音分量的出現(xiàn)與所述唯一性量度在時(shí)間上對(duì) 準(zhǔn)，以產(chǎn)生經(jīng)對(duì)準(zhǔn)的語(yǔ)音和唯一性444。
[0167] 電子裝置402可更新（1014)-或多個(gè)語(yǔ)音分量(例如，所辨識(shí)語(yǔ)音分量）的唯一性統(tǒng)計(jì)。舉例來(lái)說(shuō)，電子裝置402可基于對(duì)應(yīng)于語(yǔ)音分量的唯一性量度來(lái)更新（1014)語(yǔ)音分量的唯一性統(tǒng)計(jì)。在一些配置中，電子裝置402可存儲(chǔ)當(dāng)捕獲和辨識(shí)時(shí)對(duì)應(yīng)于一或多個(gè)所辨識(shí) 語(yǔ)音分量得唯一性量度(或基于唯一性量度的值，例如最大值、最小值或平均值）。其后在獲得所辨識(shí)語(yǔ)音分量時(shí)的每一后續(xù)時(shí)刻，電子裝置402可更新唯一性統(tǒng)計(jì)。舉例來(lái)說(shuō)，電子裝置402可基于所存儲(chǔ)的唯一性量度(或值）以及當(dāng)前唯一性量度(或值)來(lái)計(jì)算一些統(tǒng)計(jì)量度 (例如，平均值等）。電子裝置402接著可存儲(chǔ)經(jīng)更新的統(tǒng)計(jì)量度。
[0168] 電子裝置402可登記（1016)-或多個(gè)語(yǔ)音分量。舉例來(lái)說(shuō)，電子裝置402可為一或多個(gè)所辨識(shí)語(yǔ)音分量中的每一者存儲(chǔ)數(shù)據(jù)。另外或替代地，電子裝置402可將所辨識(shí)語(yǔ)音分量中的一或多者指定為對(duì)于口令建議來(lái)說(shuō)足夠唯一或強(qiáng)(例如，如果語(yǔ)音分量具有大于閾值的對(duì)應(yīng)唯一性量度或唯一性統(tǒng)計(jì)）。舉例來(lái)說(shuō)，在一些配置中，在最初接收到對(duì)口令評(píng)估的音頻口令之前，電子裝置402可提供一或多個(gè)所建議語(yǔ)音分量。
[0169] 電子裝置402可適應(yīng)（1018)用戶語(yǔ)音模型。舉例來(lái)說(shuō)，電子裝置402可通過(guò)更新用戶語(yǔ)音模型的音素?cái)?shù)據(jù)和/或權(quán)重來(lái)適應(yīng)或修改用戶語(yǔ)音模型(例如，其可最初基于通用語(yǔ) 音模型）。在一些配置中，適應(yīng)（1018)用戶語(yǔ)音模型可包含更新一或多個(gè)模型參數(shù)（例如， GMM分量）。具體地說(shuō)，適應(yīng)(1018)可通過(guò)更新GMM的平均值和/或混錄權(quán)重來(lái)執(zhí)行。
[0170]電子裝置402可確定（1020)是否存在充分的數(shù)據(jù)供用戶語(yǔ)音模型準(zhǔn)確地描述用戶的語(yǔ)音。舉例來(lái)說(shuō)，電子裝置402可確定是否已捕獲閾值數(shù)目和/或某些音素，使得用戶語(yǔ)音模型足夠細(xì)化以準(zhǔn)確地反映真實(shí)用戶的語(yǔ)音。如果不存在充分的數(shù)據(jù)，那么電子裝置402可繼續(xù)接收(1002)用戶音頻信號(hào)。
[0171]如果存在充分的數(shù)據(jù)，那么電子裝置402可提供（1022)用戶語(yǔ)音模型。舉例來(lái)說(shuō)，電子裝置402可使用戶語(yǔ)音模型可用于音頻口令強(qiáng)度評(píng)估和/或建議，如上文所描述。應(yīng)注意，盡管可提供（1022)用戶語(yǔ)音模型來(lái)使用，但方法1000可反復(fù)數(shù)次和/或連續(xù)，以便進(jìn)一步適應(yīng)和/或細(xì)化用戶語(yǔ)音模型。
[0172] 圖11是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的電子裝置1102 的另一更具體配置的框圖。結(jié)合圖11描述的電子裝置1102可為結(jié)合圖1和4描述的電子裝置 102、402中的一或多者的實(shí)例。
[0173] 電子裝置1102包含一或多個(gè)麥克風(fēng)1104、口令評(píng)估模塊1108、口令反饋模塊1112 和一或多個(gè)輸出裝置1116。包含于電子裝置1102中的分量中的一或多者可對(duì)應(yīng)于包含于結(jié) 合圖1和4中的一或多者描述的電子裝置102、402中的一或多者中的組件中的一或多者和/ 或可類似于其而起作用。
[0174] 電子裝置1102可包含一或多個(gè)輸入裝置1166。輸入裝置1166的實(shí)例包含觸摸屏、觸控板、圖像傳感器(例如，相機(jī)）、鍵盤(例如，物理和/或軟件鍵盤）、小鍵盤(例如，物理和/ 或軟件小鍵盤、指紋掃描器、額外麥克風(fēng)、定向傳感器(例如，傾斜傳感器）、運(yùn)動(dòng)傳感器(例如，加速計(jì)）、GPS模塊、壓力傳感器等。一或多個(gè)輸入裝置1166可獲得或接收一或多個(gè)輸入 1168。可將所述一或多個(gè)輸入1168提供到口令評(píng)估模塊1108。
[0175] -或多個(gè)麥克風(fēng)1104可捕獲音頻信號(hào)1106。音頻信號(hào)1106可包含音頻口令。可將音頻信號(hào)1106提供到口令評(píng)估模塊1108。
[0176] 口令評(píng)估模塊1108可獲得（例如，接收）一或多個(gè)麥克風(fēng)1104所捕獲的音頻信號(hào) 1106。如上文所描述，音頻信號(hào)1106可包含音頻口令?？诹钤u(píng)估模塊1108可基于測(cè)量音頻信號(hào)1106的一或多個(gè)唯一特性來(lái)評(píng)估音頻口令的強(qiáng)度。這可如上文結(jié)合圖1到2以及4到8中的一或多者所描述來(lái)實(shí)現(xiàn)。
[0177] 口令評(píng)估模塊1108可任選地包含額外驗(yàn)證輸入評(píng)估模塊1170。額外驗(yàn)證輸入評(píng)估模塊1170可結(jié)合音頻口令考慮一或多個(gè)額外驗(yàn)證輸入1168。舉例來(lái)說(shuō)，如果結(jié)合字母數(shù)字代碼或指紋掃描使用音頻口令，那么強(qiáng)度得分可反映音頻口令與一或多個(gè)額外驗(yàn)證輸入 (如果利用）的組合所提供的額外驗(yàn)證強(qiáng)度。在一些配置中，電子裝置1102(例如，口令評(píng)估模塊1108)可獲得一或多個(gè)額外驗(yàn)證輸入1168。舉例來(lái)說(shuō)，一些配置可允許使用其它模態(tài)，例如視頻陀螺/加速計(jì)傳感器，鍵盤，指紋傳感器等。在一些方法中，一或多個(gè)此類模態(tài)可用于具有較少唯一性或辯別強(qiáng)度的（短語(yǔ)、句子等)的一或多個(gè)部分。舉例來(lái)說(shuō)，當(dāng)用戶發(fā)出具有低唯一性的詞語(yǔ)(例如，具有較小可辨別得分的詞語(yǔ)"學(xué)校"）時(shí)，電子裝置1102可獲得或接收一或多個(gè)額外驗(yàn)證輸入1168。
[0178]所述一或多個(gè)額外驗(yàn)證輸入1168的實(shí)例如下給出。在電子裝置1102具有手勢(shì)辨識(shí) 的配置中，電子裝置1102可接收用戶所輸入的示意動(dòng)作(例如，觸摸屏圖案、觸摸墊圖案、相機(jī)所捕獲的視覺手勢(shì)圖案等）。所述示意動(dòng)作可為用戶創(chuàng)建或預(yù)定義的。在電子裝置1102包含相機(jī)的配置中，電子裝置1102可捕獲用戶的一或多個(gè)圖像，例如用戶的臉部、眼睛、鼻子、嘴唇、面部形狀和/或更多的唯一信息，例如具有音頻信號(hào)1106的虹膜。舉例來(lái)說(shuō)，包含于電子裝置1102中的相機(jī)可(例如，通過(guò)用戶)瞄準(zhǔn)以捕獲用戶的臉部的全部或部分。
[0179] 在電子裝置1102包含一或多個(gè)運(yùn)動(dòng)和/或定向傳感器(例如，陀螺儀、加速計(jì)、傾斜傳感器等)的配置中，電子裝置1102可獲得運(yùn)動(dòng)和/或定向信息。舉例來(lái)說(shuō)，用戶可以用戶創(chuàng) 建或預(yù)定義的方式來(lái)定向和/或移動(dòng)電子裝置1102(例如，電話）。舉例來(lái)說(shuō)，電子裝置1102 可連同音頻信號(hào)1106編碼陀螺和/或加速計(jì)傳感器信息。
[0180]在電子裝置1102包含物理或軟件(例如，觸摸屏或顯示器上）小鍵盤或鍵盤的配置中，電子裝置1102可連同音頻信號(hào)1106接收數(shù)值代碼、文本和/或字母數(shù)字串（例如，由用戶鍵入）。在電子裝置1102包含指紋傳感器的配置中，電子裝置1102可接收指紋(例如，當(dāng)用戶觸摸或握持指紋傳感器時(shí)）。
[0181]在電子裝置1102包含多個(gè)麥克風(fēng)1104的配置中，電子裝置1102可獲得(例如，接收和/或確定）音頻信號(hào)1106的空間方向性信息。舉例來(lái)說(shuō)，用戶可在相對(duì)于電子裝置1102的一序列方向（例如，頂部、底部、左、右、前、后、右上、左下等)上說(shuō)出音頻口令。舉例來(lái)說(shuō)，用戶可朝電子裝置1102的底部說(shuō)出第一個(gè)字，朝電子裝置1102的頂部說(shuō)出第二個(gè)字，朝電子裝置1102的左側(cè)說(shuō)出第三個(gè)字，且朝電子裝置1102的右側(cè)說(shuō)出第四個(gè)字。
[0182] 下文提供關(guān)于空間方向性信息的額外細(xì)節(jié)。在一些配置中，電子裝置1102可利用空間音頻的整合來(lái)獲得安全性。舉例來(lái)說(shuō)，為了解鎖電子裝置1102,用戶可向某一空間扇區(qū) 或不同空間扇區(qū)（例如，相對(duì)于電子裝置1102(例如，電話)）中發(fā)出一序列。
[0183] 電子裝置1102(例如，圖11中未圖示的檢驗(yàn)?zāi)K)可識(shí)別用戶（利用揚(yáng)聲器辨識(shí)），且識(shí)別空間說(shuō)話方向序列是否正確。僅充分高的揚(yáng)聲器辨識(shí)可能性與正確空間序列的組合將解鎖電子裝置1102。舉例來(lái)說(shuō)，在一些配置中，電子裝置1102可如下執(zhí)行空間音頻/揚(yáng)聲器辨識(shí)特征的檢驗(yàn)。電子裝置1102可初始化提示，接收來(lái)自電子裝置1102前面的話語(yǔ)，接收來(lái)自電子裝置1102左側(cè)的話語(yǔ)，接收來(lái)自電子裝置1102頂部的話語(yǔ)，且接收來(lái)自電子裝置 1102左側(cè)的話語(yǔ)。在初始提示之后，電子裝置1102(具有多個(gè)麥克風(fēng)）提供預(yù)定義序列的空間音頻拾取。在這些配置中，用戶可需要知曉向正確的空間扇區(qū)中發(fā)出音頻口令(例如，語(yǔ) 句)的序列。舉例來(lái)說(shuō)，用戶可說(shuō)："我最喜歡的切換扇區(qū)寵物的切換扇區(qū)名字是切換扇區(qū)巴尼"）。
[0184] 在一些配置中，每一空間扇區(qū)中的話語(yǔ)的時(shí)序和/或持續(xù)時(shí)間可為檢驗(yàn)程序的一部分（例如，在前扇區(qū)中2秒，在頂部扇區(qū)中5秒，在右扇區(qū)中3秒等）。舉例來(lái)說(shuō)，電子裝置 1102可經(jīng)由話音提示或通過(guò)檢測(cè)按鈕或屏幕的推動(dòng)而起始話音記錄過(guò)程。電子裝置1102可根據(jù)預(yù)定義序列(例如，激活的空間扇區(qū)和/或每一空間扇區(qū)的時(shí)序(持續(xù)時(shí)間）的序列），在不同空間扇區(qū)中起始收聽。如果電子裝置1102在每一空間扇區(qū)（上下文相依或獨(dú)立發(fā)聲）中識(shí)別到真實(shí)用戶，那么電子裝置1102準(zhǔn)予接入。
[0185] 更具體地說(shuō)，電子裝置1102可根據(jù)以下方法或程序來(lái)操作。電子裝置1102可用話音提示和/或在接收到(例如，按鈕或觸摸屏的)輸入時(shí)起始語(yǔ)音記錄。電子裝置1102可根據(jù) 預(yù)定義序列在不同空間扇區(qū)中起始收聽。舉例來(lái)說(shuō)，電子裝置1102可在一序列所激活空間扇區(qū)中接收音頻。在一些配置中，電子裝置1102可根據(jù)每一空間扇區(qū)中的時(shí)序(例如，持續(xù) 時(shí)間)序列來(lái)接收音頻。
[0186] 如果電子裝置1102在每一空間扇區(qū)（上下文相依或獨(dú)立發(fā)聲）中識(shí)別到真實(shí)用戶 (例如，所要揚(yáng)聲器），那么電子裝置1102準(zhǔn)予接入。舉例來(lái)說(shuō)，電子裝置1102可允許用戶接入電子裝置1102的較多功能性(例如，應(yīng)用程序、話音呼叫等）。
[0187] 在一個(gè)實(shí)例中，用戶可從相對(duì)于所述裝置的一個(gè)特定方向發(fā)出口令、密碼或詞語(yǔ) 序列（例如，"句子"）。在另一實(shí)例中，用戶可在一序列方向上發(fā)出一句子的若干部分。另外或替代地，可要求用戶以某一時(shí)序發(fā)出所述句子的不同部分。另外或替代地，可利用多個(gè)用戶的話音。舉例來(lái)說(shuō)，第一用戶可從電子保險(xiǎn)箱的左側(cè)發(fā)出口令，同時(shí)第二用戶可從電子保險(xiǎn)箱的右側(cè)發(fā)出口令，以便解鎖所述保險(xiǎn)箱?？瑟?dú)立地或結(jié)合其它量度(例如，人臉辨識(shí)、指紋辨識(shí)等)實(shí)施空間音頻安全特征。
[0188] 在一些配置中，可需要音頻口令結(jié)合一或多個(gè)額外驗(yàn)證輸入來(lái)通過(guò)多個(gè)準(zhǔn)則，以設(shè)定口令(例如，具有一或多個(gè)額外驗(yàn)證輸入1168的組合音頻口令）。舉例來(lái)說(shuō)，口令評(píng)估模塊1108可要求音頻口令提供最小唯一"性，且一或多個(gè)額外驗(yàn)證輸入1168滿足一或多個(gè)額外準(zhǔn)則。可對(duì)唯一性閾值和/或一或多個(gè)額外準(zhǔn)則進(jìn)行加權(quán)。
[0189] 在一些配置中，額外驗(yàn)證輸入評(píng)估模塊1170可基于音頻信號(hào)1106和/或一或多個(gè) 額外驗(yàn)證輸入1168來(lái)忽視一或多個(gè)閾值。舉例來(lái)說(shuō)，如果指紋掃描提供額外驗(yàn)證強(qiáng)度，那么口令評(píng)估模塊1108可需要較低唯一性閾值或音頻口令強(qiáng)度。另外或替代地，如果音頻信號(hào) 1106提供高唯一性，那么口令評(píng)估模塊1108可需要額外驗(yàn)證輸入1168所貢獻(xiàn)的較低強(qiáng)度。舉例來(lái)說(shuō)，如果音頻信號(hào)1106提供相對(duì)良好的唯一性，那么口令評(píng)估模塊1108可建議利用2 位數(shù)值代碼。然而，如果音頻信號(hào)1106提供相對(duì)較弱的唯一性，那么口令評(píng)估模塊1108可建議利用4位數(shù)值代碼和/或指紋掃描。
[0190] 可利用一或多個(gè)額外驗(yàn)證輸入1168,而無(wú)時(shí)序和/或序列限制。在一些實(shí)例中，電子裝置1102可在接收到音頻信號(hào)1106之前、期間或之后的任何時(shí)間獲得一或多個(gè)額外驗(yàn)證輸入1168。
[0191]在其它實(shí)例中，電子裝置1102可要求(或經(jīng)配置以要求)相對(duì)于音頻信號(hào)1106的接收以某一時(shí)序約束條件和/或以某一序列接收所述一或多個(gè)額外驗(yàn)證輸入1168。在一實(shí)例中，電子裝置1102可要求(或經(jīng)配置以要求)在接收到音頻信號(hào)1106之前、期間和/或之后的某一時(shí)間周期內(nèi)接收一或多個(gè)額外驗(yàn)證輸入1168。舉例來(lái)說(shuō)，電子裝置1102可要求在音頻口令的較弱語(yǔ)音分量期間接收額外驗(yàn)證輸入1168。另外或替代地，電子裝置1102可要求(或經(jīng)配置以要求）以特定序列（例如，在語(yǔ)音分量之前、在語(yǔ)音分量之后、在語(yǔ)音分量之間，以具有其它額外驗(yàn)證輸入的序列等)接收額外驗(yàn)證輸入1168。在一些配置中，電子裝置1102可以增加復(fù)雜性的次序添加(和/或建議添加)一或多個(gè)額外驗(yàn)證輸入1168。另外或替代地，電子裝置1102可要求添加一或多個(gè)額外驗(yàn)證輸入1168,直到口令(例如，結(jié)合一或多個(gè)額外驗(yàn) 證輸入1168的音頻口令)超過(guò)最小所需強(qiáng)度為止。
[0192] 在一些配置中，口令評(píng)估模塊1108可任選地包含輸入降級(jí)模塊1172。輸入降級(jí)模塊1172可使音頻信號(hào)1106和/或額外驗(yàn)證輸入1168降級(jí)。舉例來(lái)說(shuō)，口令評(píng)估模塊1108可將信息從音頻信號(hào)1106去除（例如，下取樣、濾除其一或多個(gè)部分）。另外或替代地，口令評(píng)估模塊1108可將信息從指紋掃描或從用戶的臉部的圖像或虹膜去除。
[0193] 口令評(píng)估模塊1108可將評(píng)估信息1110提供到口令反饋模塊1112。評(píng)估信息1110可包含指示口令評(píng)估中獲得的口令強(qiáng)度和/或信息的信息。舉例來(lái)說(shuō)，評(píng)估信息1110可包含所提取特征、唯一性量度、口令強(qiáng)度得分和/或其它信息。
[0194] 口令反饋模塊1112可提供口令反饋1114。舉例來(lái)說(shuō)，口令反饋模塊1112可基于對(duì) 音頻口令的強(qiáng)度的評(píng)估來(lái)告知用戶音頻口令較弱。提供口令反饋1114可使用戶能夠確定 (例如，選擇、提供或創(chuàng)建)足夠強(qiáng)的音頻口令?？诹罘答?114可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或建議的語(yǔ)音分量）、一或多個(gè)所建議動(dòng)作和/或一或多個(gè) 消息。舉例來(lái)說(shuō)，口令反饋1114可包含口令強(qiáng)度得分和指示音頻口令較弱的消息。另外或替代地，口令反饋1114可包含用戶可用于創(chuàng)建較強(qiáng)音頻口令的一或多個(gè)所建議語(yǔ)音分量。在一些配置中，電子裝置1102可提供由所建議的語(yǔ)音分量組成的所建議合成(例如未知)字作為口令反饋1114。另外或替代地，口令反饋1114可包含用戶可提供額外驗(yàn)證輸入(例如，文本、數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如面部掃描、虹膜掃描、指紋等））的所建議動(dòng)作。
[0195] 在一些配置中，口令反饋模塊1112可提供一或多個(gè)口令建議。舉例來(lái)說(shuō)，電子裝置 1102(例如，口令反饋模塊1112)可識(shí)別具有足夠高的唯一性或與一或多個(gè)其它模型(例如，通用語(yǔ)音模型、通用模型、UBM等)的區(qū)別來(lái)識(shí)別一或多個(gè)語(yǔ)音分量(例如，發(fā)聲、音素等）。舉例來(lái)說(shuō)，口令反饋模塊1112可經(jīng)由一對(duì)語(yǔ)音辨識(shí)和揚(yáng)聲器檢驗(yàn)系統(tǒng)，基于用戶針對(duì)每一音素的話音的唯一性來(lái)識(shí)別一或多個(gè)語(yǔ)音分量。接著，口令反饋模塊1112可產(chǎn)生一些可能候選語(yǔ)音分量(例如，音素、音節(jié)、發(fā)聲、口令等），其具有高"唯一性"，使得用戶可選擇一或多個(gè)候選語(yǔ)音分量來(lái)創(chuàng)建口令。舉例來(lái)說(shuō)，電子裝置1102可顯示口令反饋1114,例如："你可使用/啊Λ/k/、…、〈三角形〉、〈高通〉、…、"。另外或替代地，可為用戶發(fā)出的口令提供具體口令反饋1114,以較多地加強(qiáng)所述口令（例如，"你的口令具有60%強(qiáng)度。話語(yǔ)/嗯/可被/ 啊/...代替"）。
[0196] 在一些配置中，電子裝置1102(例如，口令反饋模塊1112)可以多模態(tài)提供口令建議。如上文所描述，例如，口令反饋模塊1112可提供口令反饋1114,其建議一或多個(gè)額外驗(yàn) 證輸入1168(例如，文本、數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如，面部掃描、虹膜掃描、指紋等））。
[0197] 口令反饋模塊1112可將口令反饋1114提供到一或多個(gè)輸出裝置1116。一或多個(gè)輸出裝置1116可因此向用戶中繼或傳達(dá)口令反饋1114。舉例來(lái)說(shuō)，輸出裝置1116(例如，顯示器、觸摸屏、揚(yáng)聲器等)可中繼與音頻口令的強(qiáng)度相關(guān)聯(lián)的標(biāo)記1174。在一些配置中，這可經(jīng) 由如結(jié)合圖1所描述的一或多個(gè)GUI來(lái)實(shí)現(xiàn)。在一個(gè)方法中，顯示面板可顯示口令強(qiáng)度得分。另外或替代地，揚(yáng)聲器可輸出聲學(xué)信號(hào)（例如，文字到語(yǔ)音），其指示口令強(qiáng)度得分（例如， "你的口令較弱"、"你的口令強(qiáng)度為60%"等）。
[0198] 在一些配置中，輸出裝置1116可中繼一或多個(gè)建議(例如，候選語(yǔ)音分量1176、額外驗(yàn)證輸入選項(xiàng)1178等）。舉例來(lái)說(shuō)，顯示面板可顯示一或多個(gè)候選語(yǔ)音分量1176,例如音素、音節(jié)、字、發(fā)聲和/或短語(yǔ)(例如7啊/、/嗯/、/k/、/三角形/、/海市蜃樓/"）。另外或替代地，揚(yáng)聲器可輸出聲學(xué)信號(hào)以中繼一或多個(gè)建議(例如，"請(qǐng)將/啊/、/嗯Λ/k/、/三角形/、/ 海市蜃樓/和/或額外輸入類型添加到你的口令"）。
[0199] 使用音頻口令(例如，獨(dú)立音頻口令和/或具有一或多個(gè)額外驗(yàn)證輸入1168(例如空間方向性）的音頻口令等)來(lái)獲得安全可應(yīng)用于許多不同類型的電子裝置1102(例如，其可包含麥克風(fēng)陣列1104)。舉例來(lái)說(shuō)，此安全特征可應(yīng)用于智能電話、平板裝置、電子門鎖、門傳感器、相機(jī)、智能按鍵、膝上型計(jì)算機(jī)、桌上型計(jì)算機(jī)、游戲系統(tǒng)、汽車、繳費(fèi)查詢一體機(jī) (例如，作為驗(yàn)證交易的一種方式），電視機(jī)、音頻裝置（例如，mp3播放器、iPod、壓縮光盤 (CD)播放器等）、音頻/視頻裝置(例如，數(shù)字視頻記錄器(DVR)、藍(lán)光播放器、數(shù)字視頻光盤 (DVD)播放器等）、家用電器、恒溫器、保險(xiǎn)箱等。另外或替代地，此安全特征可遠(yuǎn)程應(yīng)用（例如，應(yīng)用于遠(yuǎn)程裝置）。舉例來(lái)說(shuō)，用戶可在智能電話上提供音頻口令(例如，句子、密碼、口令等），其可將驗(yàn)證憑證或命令提供到電子門鎖，來(lái)解鎖/鎖定門（例如，家門、車門、辦公室門等）。在另一實(shí)例中，用戶可在智能電話、膝上型計(jì)算機(jī)或平板計(jì)算機(jī)上提供空間音頻代碼，以向遠(yuǎn)程服務(wù)器驗(yàn)證來(lái)進(jìn)行網(wǎng)站驗(yàn)證、交易（例如，購(gòu)買、銀行業(yè)務(wù))驗(yàn)證等。
[0200] 圖12是說(shuō)明用于評(píng)估音頻口令的強(qiáng)度的方法1200的更具體配置的流程圖。結(jié)合圖 1、4和11描述的電子裝置102、402、1102中的一或多者可執(zhí)行方法1200。
[0201]電子裝置1102可獲得（1202) -或多個(gè)麥克風(fēng)1104所捕獲的音頻信號(hào)1106。這可如上文結(jié)合圖1到2、4到8以及11中的一或多者所描述來(lái)實(shí)現(xiàn)。音頻信號(hào)1106可包含音頻口令。 [0202]電子裝置1102可獲得至少一個(gè)額外驗(yàn)證輸入1168。此操作可如上文結(jié)合圖（例如，圖1、4和11)中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置可獲得（1204)-或多個(gè)額外驗(yàn)證輸入1168,例如文本、數(shù)值代碼、字母數(shù)字串、空間方向性和/或額外生物計(jì)量(例如指紋掃描、用戶臉部的相機(jī)圖像或虹膜等）。
[0203]電子裝置1102可任選地使音頻信號(hào)1106和/或額外驗(yàn)證輸入1168降級(jí)（1206)。此操作可如上文結(jié)合圖（例如，圖1、4和11)中的一或多者所描述來(lái)實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置 1102可將信息從音頻信號(hào)1106去除（例如，下取樣、濾除其一或多個(gè)部分）。另外或替代地，口令評(píng)估模塊1108可將信息從指紋掃描或從用戶的臉部的圖像或虹膜去除。
[0204]電子裝置1102可結(jié)合至少一個(gè)額外驗(yàn)證輸入1168來(lái)評(píng)估（1208)音頻口令的強(qiáng)度。舉例來(lái)說(shuō)，電子裝置1102可結(jié)合音頻口令考慮一或多個(gè)額外驗(yàn)證輸入1168。舉例來(lái)說(shuō)，如果結(jié)合字母數(shù)字代碼或指紋掃描使用音頻口令，那么強(qiáng)度得分可反映音頻口令與一或多個(gè)額外驗(yàn)證輸入的組合所提供的額外驗(yàn)證強(qiáng)度。
[0205]如果結(jié)合至少一個(gè)額外驗(yàn)證輸入1168的音頻口令的強(qiáng)度較弱，那么電子裝置1102 可提供（1210) 口令反饋1114。這可如上文結(jié)合圖1到2、4到8以及11中的一或多者所描述來(lái) 實(shí)現(xiàn)。舉例來(lái)說(shuō)，電子裝置1102可基于對(duì)結(jié)合至少一個(gè)額外驗(yàn)證輸入1168的音頻口令的強(qiáng) 度的評(píng)估(例如，當(dāng)口令強(qiáng)度得分不大于一值時(shí)），告知（1206)用戶音頻口令較弱?？诹罘答?1114可包含口令強(qiáng)度得分、一或多個(gè)語(yǔ)音分量候選者(例如，所推薦或建議的語(yǔ)音分量）、一或多個(gè)所建議動(dòng)作和/或一或多個(gè)消息。舉例來(lái)說(shuō)，口令反饋1114可包含口令強(qiáng)度得分和指示音頻口令較弱的消息。另外或替代地，口令反饋1114可包含用戶可用于創(chuàng)建較強(qiáng)音頻口令的一或多個(gè)所建議語(yǔ)音分量。另外或替代地，口令反饋1114可包含用戶可提供額外驗(yàn)證輸入1168 (例如，文本、數(shù)值代碼、字母數(shù)字串、空間方向性、額外生物計(jì)量(例如面部掃描、虹膜掃描、指紋等））的所建議動(dòng)作。
[0206]圖13是說(shuō)明其中可實(shí)施用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法的無(wú)線通信裝置 1302的一個(gè)配置的框圖。圖13中說(shuō)明的無(wú)線通信裝置1302可為本文所述的電子裝置102、 402、1102中的一或多者的實(shí)例。無(wú)線通信裝置1302可包含應(yīng)用處理器1384。應(yīng)用程序處理器1384通常處理指令(例如，運(yùn)行程序）以執(zhí)行無(wú)線通信裝置1302上的功能。應(yīng)用程序處理器1384可耦合到音頻譯碼器/解碼器(編解碼器)1382。
[0207]音頻編解碼器1382可用于對(duì)音頻信號(hào)進(jìn)行譯碼和/或解碼。音頻編解碼器1382可耦合到至少一個(gè)揚(yáng)聲器1335、耳機(jī)1337、輸出插孔1339和/或至少一個(gè)麥克風(fēng)1380。揚(yáng)聲器 1335可包含一或多個(gè)將電或電子信號(hào)轉(zhuǎn)換為聲學(xué)信號(hào)的電聲轉(zhuǎn)換器。舉例來(lái)說(shuō)，揚(yáng)聲器 1335可用于播放音樂(lè)或輸出揚(yáng)聲器電話對(duì)話等。耳機(jī)1337可為可用于向用戶輸出聲學(xué)信號(hào) (例如，話語(yǔ)信號(hào)）的另一揚(yáng)聲器或電聲轉(zhuǎn)換器。舉例來(lái)說(shuō)，可使用聽筒1337使得僅用戶可確實(shí)地聽到聲學(xué)信號(hào)。輸出插孔1339可用于將其它裝置(例如頭戴式耳機(jī))耦合到無(wú)線通信裝置1302以用于輸出音頻。揚(yáng)聲器1335、聽筒1337和/或輸出插孔1339可通常用于從音頻編解碼器1382輸出音頻信號(hào)。至少一個(gè)麥克風(fēng)1380可為將聲學(xué)信號(hào)(例如用戶的話音)轉(zhuǎn)換為提供至音頻編解碼器1382的電或電子信號(hào)的聲電轉(zhuǎn)換器。
[0208] 在一些配置中，音頻編解碼器1382可包含口令評(píng)估模塊1308a和/或口令反饋模塊 1312a。另外或替代地，應(yīng)用程序處理器1384可包含口令評(píng)估模塊1308b和/或口令反饋模塊 1312b?？诹钤u(píng)估模塊1308a-b和/或口令反饋模塊1312a-b可為上文結(jié)合圖1、4和11中的一或多者描述的口令評(píng)估模塊108、408、1108和/或口令反饋模塊112、412、1112的實(shí)例。在其它配置中，口令評(píng)估模塊1308a和口令反饋模塊1312a中的一或多者可分別從音頻編解碼器 1382和應(yīng)用程序處理器1384在無(wú)線通信裝置1302上實(shí)施。
[0209] 應(yīng)用處理器1384還可耦合到電力管理電路1394。電力管理電路1394的一個(gè)實(shí)例是電力管理集成電路（PMIC)，其可用于管理無(wú)線通信裝置1302的電力消耗。電力管理電路 1394可耦合到電池1396。電池1396可通常將電力提供到無(wú)線通信裝置1302。舉例來(lái)說(shuō)，電池 1396和/或功率管理電路1394可耦合到包含于無(wú)線通信裝置1302中的元件中的至少一者。
[0210] 應(yīng)用處理器1384可耦合到至少一個(gè)輸入裝置1398以用于接收輸入。輸入裝置1398 的實(shí)例包含紅外傳感器、圖像傳感器、加速計(jì)、觸摸傳感器、小鍵盤等。輸入裝置1398可允許用戶與無(wú)線通信裝置1302交互。應(yīng)用程序處理器1384還可耦合到一或多個(gè)輸出裝置1301。輸出裝置1301的實(shí)例包含打印機(jī)、投影儀、屏幕、觸覺裝置等。輸出裝置1301可允許無(wú)線通信裝置1302產(chǎn)生可由用戶體驗(yàn)的輸出。
[0211] 應(yīng)用程序處理器1384可耦合到應(yīng)用程序存儲(chǔ)器1303。應(yīng)用程序存儲(chǔ)器1303可為能夠存儲(chǔ)電子信息的任何電子裝置。應(yīng)用存儲(chǔ)器1303的實(shí)例包含雙數(shù)據(jù)速率同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DDRAM)、同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(SDRAM)、快閃存儲(chǔ)器等。應(yīng)用存儲(chǔ)器1303可為應(yīng)用處理器1384提供存儲(chǔ)。舉例來(lái)說(shuō)，應(yīng)用存儲(chǔ)器1303可存儲(chǔ)在應(yīng)用程序處理器1384上運(yùn) 行的程序的功能的數(shù)據(jù)和/或指令。
[0212] 應(yīng)用程序處理器1384可耦合到顯示控制器1305,所述顯示控制器又可耦合到顯示器1307。顯示控制器1305可為用于在顯示器1307上產(chǎn)生圖像的硬件塊。舉例來(lái)說(shuō)，顯示器控制器1305可將來(lái)自應(yīng)用程序處理器1384的指令和/或數(shù)據(jù)轉(zhuǎn)譯為可呈現(xiàn)在顯示器1307上的圖像。顯示器1307的實(shí)例包含液晶顯示器(IXD)面板、發(fā)光二極管（LED)面板、陰極射線管 (CRT)顯示器、等離子顯示器等。
[0213] 應(yīng)用程序處理器1384可耦合到基帶處理器1386?；鶐幚砥?386通常處理通信信號(hào)。舉例來(lái)說(shuō)，基帶處理器1386可對(duì)接收到的信號(hào)進(jìn)行解調(diào)和/或解碼。另外或或者，基帶處理器1386可對(duì)信號(hào)進(jìn)行編碼和/或調(diào)制以準(zhǔn)備發(fā)射。
[0214] 基帶處理器1386可耦合到基帶存儲(chǔ)器1309?；鶐Т鎯?chǔ)器1309可為能夠存儲(chǔ)電子信息的任何電子裝置，例如SDRAM、DDRAM、快閃存儲(chǔ)器等?；鶐幚砥?386可從基帶存儲(chǔ)器 1309讀取信息（例如，指令和/或數(shù)據(jù))和/或?qū)⑿畔懭氲交鶐Т鎯?chǔ)器1309。另外或或者，基帶處理器1386可使用存儲(chǔ)在基帶存儲(chǔ)器1309中的指令和/或數(shù)據(jù)來(lái)執(zhí)行通信操作。
[0215] 基帶處理器1386可耦合到射頻（RF)收發(fā)器1388 JF收發(fā)器1388可耦合到功率放大器1390和一或多個(gè)天線1392 AF收發(fā)器1388可發(fā)射和/或接收射頻信號(hào)。舉例來(lái)說(shuō)，RF收發(fā) 器1388可使用功率放大器1390和至少一個(gè)天線1392發(fā)射RF信號(hào)。RF收發(fā)器1388還可使用一或多個(gè)天線1392接收RF信號(hào)。
[0216] 圖14說(shuō)明可在電子裝置1402中利用的各種組件。所說(shuō)明的組件可位于同一實(shí)體結(jié) 構(gòu)內(nèi)或位于單獨(dú)外殼或結(jié)構(gòu)中。結(jié)合圖14所描述的電子裝置1402可根據(jù)本文中所描述的電子裝置102、402、1102和無(wú)線通信裝置1302中的一或多者來(lái)實(shí)施。電子裝置1402包含處理器 1417。處理器1417可為通用單芯片或多芯片微處理器(例如，ARM)專用微處理器(例如，數(shù)字信號(hào)處理器(DSP))、微控制器、可編程門陣列等。處理器1417可被稱作中央處理單元(CPU)。盡管在圖14的電子裝置1402中僅示出單個(gè)處理器1417,但在替代配置中，可使用處理器(例如ARM與DSP)的組合。
[0217] 電子裝置1402還包含與處理器1417進(jìn)行電子通信的存儲(chǔ)器1411。也就是說(shuō)，處理器1417可從存儲(chǔ)器1411讀取信息和/或?qū)⑿畔懭氲酱鎯?chǔ)器1411。存儲(chǔ)器1411可為能夠存儲(chǔ)電子信息的任何電子組件。存儲(chǔ)器1411可為隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、磁盤存儲(chǔ)媒體、光學(xué)存儲(chǔ)媒體、RAM中的快閃存儲(chǔ)器裝置、隨處理器一起包含的機(jī)載存儲(chǔ)器、可編程只讀存儲(chǔ)器(PROM)、可擦除可編程只讀存儲(chǔ)器(EPROM)、電可擦除PROM(EEPROM)、寄存器等，包含其組合。
[0218] 數(shù)據(jù)1415a和指令1413a可存儲(chǔ)在存儲(chǔ)器1411中。指令1413a可包含一或多個(gè)程序、例程、子例程、功能、過(guò)程等。指令1413a可包含單個(gè)計(jì)算機(jī)可讀語(yǔ)句或許多計(jì)算機(jī)可讀語(yǔ) 句。指令1413a可由處理器1417執(zhí)行以實(shí)施上文所描述的方法、功能和程序中的一或多者。執(zhí)行指令1413a可涉及使用存儲(chǔ)在存儲(chǔ)器1411中的數(shù)據(jù)1415a。圖14示出一些指令1413b和數(shù)據(jù)1415b正加載到處理器1417中（其可來(lái)自指令1413a和數(shù)據(jù)1415a)。
[0219] 電子裝置1402還可包含用于與其它電子裝置通信的一或多個(gè)通信接口 1421。通信接口 1421可基于有線通信技術(shù)、無(wú)線通信技術(shù)或兩者。不同類型的通信接口 1421的實(shí)例包含串行端口、并行端口、通用串行總線(USB)、以太網(wǎng)配接器、電氣電子工程師學(xué)會(huì)（IEEE) 1494總線接口、小型計(jì)算機(jī)系統(tǒng)接口（SCSI)總線接口、紅外（IR)通信端口、藍(lán)牙無(wú)線通信配接器、第三代合作伙伴計(jì)劃（3GPP)收發(fā)器、IEEE 802.11 ( "Wi-Fi"）收發(fā)器等。舉例來(lái)說(shuō)，通信接口 1421可耦合到用于發(fā)射和接收無(wú)線信號(hào)的一或多個(gè)天線(未展示）。
[0220] 電子裝置1402還可包含一或多個(gè)輸入裝置1423和一或多個(gè)輸出裝置1427。不同種類的輸入裝置1423的實(shí)例包含鍵盤、鼠標(biāo)、麥克風(fēng)、遙控器裝置、按鈕、操縱桿、跟蹤球、觸控板、光筆等。舉例來(lái)說(shuō)，電子裝置1402可包含用于捕獲聲學(xué)信號(hào)的一或多個(gè)麥克風(fēng)1425。在一種配置中，麥克風(fēng)1425可為將聲學(xué)信號(hào)（例如，話音、語(yǔ)音)轉(zhuǎn)換成電或電子信號(hào)的變換器。不同種類的輸出裝置1427的實(shí)例包含揚(yáng)聲器、打印機(jī)等。舉例來(lái)說(shuō)，電子裝置1402可包含一或多個(gè)揚(yáng)聲器1429。在一種配置中，揚(yáng)聲器1429可為將電或電子信號(hào)轉(zhuǎn)換為聲學(xué)信號(hào) 的變換器?？赏ǔ０陔娮友b置1402中的輸出裝置的一個(gè)特定類型為顯示裝置1431。與本文中所公開的配置一起使用的顯示裝置1431可利用任何合適的圖像投影技術(shù)，例如陰極射線管(CRT)、液晶顯示器(LCD)、發(fā)光二極管(LED)、氣體等離子體、電致發(fā)光或類似者。還可提供顯示器控制器1433,用于將存儲(chǔ)在存儲(chǔ)器1411中的數(shù)據(jù)轉(zhuǎn)換為顯示裝置1431上示出的文本、圖形和/或移動(dòng)圖像(按需要）。
[0221] 電子裝置1402的各種組件可通過(guò)一或多個(gè)總線耦合在一起，所述總線可以包含電力總線、控制信號(hào)總線、狀態(tài)信號(hào)總線、數(shù)據(jù)總線等。為簡(jiǎn)單起見，圖14中將各種總線說(shuō)明為總線系統(tǒng)1419。應(yīng)注意，圖14僅說(shuō)明電子裝置1402的一個(gè)可能配置?？衫酶鞣N其它架構(gòu)和組件。
[0222] 在以上描述中，有時(shí)結(jié)合各種術(shù)語(yǔ)而使用參考標(biāo)號(hào)。在術(shù)語(yǔ)結(jié)合參考數(shù)字使用的情況下，此可意味著指代圖中的一或多者中示出的特定元件。在無(wú)參考標(biāo)號(hào)而使用術(shù)語(yǔ)的情況下，此可意味著大體上指代所述術(shù)語(yǔ)，而不限于任何特定圖。
[0223]術(shù)語(yǔ)"確定"涵蓋各種各樣的動(dòng)作，且因此"確定"可包含計(jì)算、運(yùn)算、處理、導(dǎo)出、調(diào) 查、查找(例如，在表、數(shù)據(jù)庫(kù)或另一數(shù)據(jù)結(jié)構(gòu)中查找）、查實(shí)等等。并且，"確定"可包含接收 (例如，接收信息）、存取(例如，在存儲(chǔ)器中存取數(shù)據(jù))等。并且，"確定"可包括解析、選擇、挑選、建立等等。
[0224]除非另有明確指定，否則短語(yǔ)"基于"并不意味著"僅基于"。換句話說(shuō)，短語(yǔ)"基于" 描述"僅基于"以及"基于至少"兩者。
[0225] 應(yīng)注意，在相容的情況下，結(jié)合本文中所描述的配置中的任一者所描述的特征、功能、過(guò)程、組件、元件、結(jié)構(gòu)等中的一或多者可與結(jié)合本文中所描述的其它配置中的任一者所描述的功能、過(guò)程、組件、元件、結(jié)構(gòu)等中的一或多者進(jìn)行組合。換句話說(shuō)，可根據(jù)本文中揭示的系統(tǒng)和方法來(lái)實(shí)施本文中所描述的功能、程序、組件、元件等的任何相容的組合。
[0226] 可將本文中所描述的功能作為一或多個(gè)指令而存儲(chǔ)在處理器可讀或計(jì)算機(jī)可讀媒體上。術(shù)語(yǔ)"計(jì)算機(jī)可讀媒體"是指可由計(jì)算機(jī)或處理器存取的任何可用媒體。作為實(shí)例而非限制，此類媒體可包括隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPR0M)、快閃存儲(chǔ)器、壓縮光盤只讀存儲(chǔ)器(⑶-ROM)或其它光盤存儲(chǔ)裝置、磁盤存儲(chǔ)器或其它磁性存儲(chǔ)裝置，或可用于以指令或數(shù)據(jù)結(jié)構(gòu)的形式存儲(chǔ)所要的程序代碼且可由計(jì)算機(jī)存取的任何其它媒體。如本文中所使用，磁盤和光盤包含壓縮光盤(CD)、激光光盤、光學(xué)光盤、數(shù)字影音光盤(DVD)、軟性磁盤和Blu-ray 4光盤，其中磁盤通常以磁性方式再現(xiàn) 數(shù)據(jù)，而光盤利用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。應(yīng)注意，計(jì)算機(jī)可讀媒體可為有形且非暫時(shí)性的。術(shù)語(yǔ)"計(jì)算機(jī)程序產(chǎn)品"是指計(jì)算裝置或處理器，其與可由計(jì)算裝置或處理器執(zhí)行、處理或計(jì)算的代碼或指令(例如，"程序"）結(jié)合。如本文中所使用，術(shù)語(yǔ)"代碼"可指可由計(jì)算裝置或處理器執(zhí)行的軟件、指令、代碼或數(shù)據(jù)。
[0227] 還可通過(guò)傳輸媒體來(lái)傳輸軟件或指令。舉例來(lái)說(shuō)，如果使用同軸電纜、光纖電纜、雙絞線、數(shù)字訂戶線路(DSL)或無(wú)線技術(shù)(例如，紅外線、無(wú)線電和微波)從網(wǎng)站、服務(wù)器或其它遠(yuǎn)程源傳輸軟件，那么同軸電纜、光纖電纜、雙絞線、DSL或無(wú)線技術(shù)(例如，紅外線、無(wú)線電和微波)包含在傳輸媒體的定義中。
[0228] 本文中所揭示的方法包括用于實(shí)現(xiàn)所描述的方法的一或多個(gè)步驟或動(dòng)作。在不偏離權(quán)利要求書的范圍的情況下，方法步驟和/或動(dòng)作可彼此互換。換句話說(shuō)，除非正描述的方法的適當(dāng)操作需要步驟或動(dòng)作的特定次序，否則，在不脫離權(quán)利要求書的范圍的情況下，可修改特定步驟和/或動(dòng)作的次序和/或使用。
[0229] 將理解，所附權(quán)利要求書不限于上文所說(shuō)明的精確配置和組件。在不脫離權(quán)利要求書的范圍的情況下，可在本文中所描述的系統(tǒng)、方法和設(shè)備的配置、操作和細(xì)節(jié)方面進(jìn)行各種修改、改變和變更。
【主權(quán)項(xiàng)】
1. 一種用于通過(guò)電子裝置來(lái)評(píng)估音頻口令的強(qiáng)度的方法，其包括：獲得一或多個(gè)麥克風(fēng)所捕獲的音頻信號(hào)，其中所述音頻信號(hào)包含音頻口令；基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度；以及基于所述音頻口令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述音頻口令較弱。2. 根據(jù)權(quán)利要求1所述的方法，其中所述音頻信號(hào)包含至少一個(gè)語(yǔ)音分量。3. 根據(jù)權(quán)利要求1所述的方法，其中所述測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性是基于通用語(yǔ)音模型。4. 根據(jù)權(quán)利要求1所述的方法，其中告知所述用戶包括顯示與所述音頻口令的所述強(qiáng) 度相關(guān)聯(lián)的標(biāo)記。5. 根據(jù)權(quán)利要求1所述的方法，其中告知所述用戶包括顯示口令強(qiáng)度得分。6. 根據(jù)權(quán)利要求1所述的方法，其進(jìn)一步包括將口令強(qiáng)度得分與另一值進(jìn)行比較。7. 根據(jù)權(quán)利要求6所述的方法，其中所述另一值是閾值或先前口令強(qiáng)度得分。8. 根據(jù)權(quán)利要求1所述的方法，其中告知所述用戶包括顯示至少一個(gè)候選語(yǔ)音分量。9. 根據(jù)權(quán)利要求1所述的方法，其進(jìn)一步包括獲得至少一個(gè)額外驗(yàn)證輸入。10. 根據(jù)權(quán)利要求9所述的方法，其進(jìn)一步包括使所述音頻信號(hào)和所述額外驗(yàn)證輸入中的至少一者降級(jí)。11. 根據(jù)權(quán)利要求1所述的方法，其進(jìn)一步包括基于地理位置、用戶年齡、用戶性別、用戶語(yǔ)言和地方方言中的一或多者更新通用語(yǔ)音模型。12. -種用于評(píng)估音頻口令的強(qiáng)度的電子裝置，其包括：一或多個(gè)麥克風(fēng)，其捕獲音頻信號(hào)，其中所述音頻信號(hào)包含音頻口令；口令評(píng)估電路，其耦合到所述一或多個(gè)麥克風(fēng)，其中所述口令評(píng)估電路基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度；以及口令反饋電路，其耦合到所述口令評(píng)估電路，其中所述口令反饋電路基于所述音頻口令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述音頻口令較弱。13. 根據(jù)權(quán)利要求12所述的電子裝置，其中所述音頻信號(hào)包含至少一個(gè)語(yǔ)音分量。14. 根據(jù)權(quán)利要求12所述的電子裝置，其中所述測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性是基于通用語(yǔ)音模型。15. 根據(jù)權(quán)利要求12所述的電子裝置，其中告知所述用戶包括顯示與所述音頻口令的所述強(qiáng)度相關(guān)聯(lián)的標(biāo)記。16. 根據(jù)權(quán)利要求12所述的電子裝置，其中告知所述用戶包括顯示口令強(qiáng)度得分。17. 根據(jù)權(quán)利要求12所述的電子裝置，其中所述口令評(píng)估電路進(jìn)一步將口令強(qiáng)度得分與另一值進(jìn)行比較。18. 根據(jù)權(quán)利要求17所述的電子裝置，其中所述另一值是閾值或先前口令強(qiáng)度得分。19. 根據(jù)權(quán)利要求12所述的電子裝置，其中告知所述用戶包括顯示至少一個(gè)候選語(yǔ)音分量。20. 根據(jù)權(quán)利要求12所述的電子裝置，其進(jìn)一步包括耦合到所述口令評(píng)估電路的一或多個(gè)輸入裝置，其中所述一或多個(gè)輸入裝置獲得至少一個(gè)額外驗(yàn)證輸入。21. 根據(jù)權(quán)利要求20所述的電子裝置，其中所述口令評(píng)估電路使所述音頻信號(hào)和所述額外驗(yàn)證輸入中的至少一者進(jìn)一步降級(jí)。22. 根據(jù)權(quán)利要求12所述的電子裝置，其中所述口令評(píng)估電路進(jìn)一步基于地理位置、用戶年齡、用戶性別、用戶語(yǔ)言和地方方言中的一或多者來(lái)更新通用語(yǔ)音模型。23. -種用于評(píng)估音頻口令的強(qiáng)度的計(jì)算機(jī)程序產(chǎn)品，其包括上面具有指令的非暫時(shí) 性有形計(jì)算機(jī)可讀媒體，所述指令包括：用于致使電子裝置獲得一或多個(gè)麥克風(fēng)所捕獲的音頻信號(hào)的代碼，其中所述音頻信號(hào) 包含音頻口令；用于致使所述電子裝置基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度的代碼；以及用于致使所述電子裝置基于對(duì)所述音頻口令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述音頻口令較弱的代碼。24. 根據(jù)權(quán)利要求23所述的計(jì)算機(jī)程序產(chǎn)品，其中告知所述用戶包括顯示與所述音頻口令的所述強(qiáng)度相關(guān)聯(lián)的標(biāo)記。25. 根據(jù)權(quán)利要求23所述的計(jì)算機(jī)程序產(chǎn)品，其中告知所述用戶包括顯示至少一個(gè)候選語(yǔ)音分量。26. 根據(jù)權(quán)利要求23所述的計(jì)算機(jī)程序產(chǎn)品，其進(jìn)一步包括用于致使所述電子裝置獲得至少一個(gè)額外驗(yàn)證輸入的代碼。27. -種用于評(píng)估音頻口令的強(qiáng)度的設(shè)備，其包括：用于獲得音頻信號(hào)的裝置，其中所述音頻信號(hào)包含音頻口令；用于基于測(cè)量所述音頻信號(hào)的一或多個(gè)唯一特性來(lái)評(píng)估所述音頻口令的所述強(qiáng)度的裝置；以及用于基于所述音頻口令的所述強(qiáng)度的所述評(píng)估來(lái)告知用戶所述音頻口令較弱的裝置。28. 根據(jù)權(quán)利要求27所述的設(shè)備，其中告知所述用戶包括顯示與所述音頻口令的所述強(qiáng)度相關(guān)聯(lián)的標(biāo)記。29. 根據(jù)權(quán)利要求27所述的設(shè)備，其中告知所述用戶包括顯示至少一個(gè)候選語(yǔ)音分量。30. 根據(jù)權(quán)利要求27所述的設(shè)備，其進(jìn)一步包括用于獲得至少一個(gè)額外驗(yàn)證輸入的裝置。
【文檔編號(hào)】G06F21/46GK105940407SQ201580006253
【公開日】2016年9月14日
【申請(qǐng)日】2015年1月27日
【發(fā)明人】金萊軒, 南尤漢, 埃里克·維瑟
【申請(qǐng)人】高通股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：金萊軒;南尤漢;埃里克·維瑟;
技術(shù)所有人：高通股份有限公司;
我是此專利的發(fā)明人

上一篇：平臺(tái)實(shí)施的用戶責(zé)任性的制作方法
上一篇：通信系統(tǒng)、服務(wù)器及計(jì)算機(jī)程序的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

動(dòng)態(tài)口令管理系統(tǒng)相關(guān)技術(shù)

動(dòng)態(tài)口令身份認(rèn)證系統(tǒng)相關(guān)技術(shù)

動(dòng)態(tài)口令認(rèn)證系統(tǒng)相關(guān)技術(shù)

動(dòng)態(tài)口令系統(tǒng)相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于評(píng)估音頻口令的強(qiáng)度的系統(tǒng)和方法