欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

具有并行識(shí)別任務(wù)的語(yǔ)音識(shí)別的制作方法

文檔序號(hào):2823189閱讀:165來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):具有并行識(shí)別任務(wù)的語(yǔ)音識(shí)別的制作方法
技術(shù)領(lǐng)域
本申請(qǐng)涉及語(yǔ)音識(shí)別。
背景技術(shù)
許多應(yīng)用受益于接收以語(yǔ)音命令或詢(xún)問(wèn)形式的輸入。對(duì)于在諸如蜂窩電話的移動(dòng) 設(shè)備上運(yùn)行的應(yīng)用特別如此,其中通過(guò)小鍵盤(pán)或者用戶(hù)手指操縱的其他設(shè)備進(jìn)行輸入可能 因設(shè)備的減小的尺寸而是困難的。類(lèi)似地,如果移動(dòng)設(shè)備用于訪問(wèn)在另一設(shè)備(例如,電子 郵件服務(wù)器、地圖/路線服務(wù)器或者電話簿服務(wù)器)上運(yùn)行的應(yīng)用,則向應(yīng)用傳送語(yǔ)音命令 而非通過(guò)小鍵盤(pán)等輸入命令對(duì)于用戶(hù)可能是更加容易的。為了使應(yīng)用對(duì)口頭輸入起作用,語(yǔ)音識(shí)別器可以將口頭輸入轉(zhuǎn)換為由應(yīng)用使用的 符號(hào)表示。一些當(dāng)前的語(yǔ)音識(shí)別器可以使用嘗試識(shí)別口頭輸入中的可能語(yǔ)音的單個(gè)識(shí)別系 統(tǒng)。使用單個(gè)語(yǔ)音識(shí)別系統(tǒng)可能將語(yǔ)音識(shí)別的準(zhǔn)確性限制于與單個(gè)語(yǔ)音識(shí)別系統(tǒng)相關(guān)聯(lián)的 準(zhǔn)確性。其他當(dāng)前的語(yǔ)音識(shí)別器可以使用連續(xù)的語(yǔ)音識(shí)別,其中對(duì)口頭輸入執(zhí)行兩輪或更 多輪以確定口頭輸入最可能表示的語(yǔ)音。多輪的使用可能增加生成最終語(yǔ)音識(shí)別結(jié)果所需 要的時(shí)間。在其他當(dāng)前的語(yǔ)音識(shí)別器中,多個(gè)語(yǔ)音識(shí)別系統(tǒng)均可以完全處理口頭輸入并且隨 后輸出結(jié)果。由于處理時(shí)間的長(zhǎng)度由最慢的語(yǔ)音識(shí)別系統(tǒng)(和/或由執(zhí)行語(yǔ)音識(shí)別算法的 最慢的計(jì)算機(jī))確定,因此這種多個(gè)語(yǔ)音識(shí)別系統(tǒng)的使用也可能增加生成最終結(jié)果所需要 的時(shí)間。

發(fā)明內(nèi)容
一般地,本文描述了并行使用多個(gè)語(yǔ)音識(shí)別系統(tǒng)(SRS)來(lái)識(shí)別語(yǔ)音,但是如果所 生成的識(shí)別結(jié)果滿(mǎn)足所期望的閾值,則在完成之前中止(abort) —些SRS。例如,每個(gè)SRS 可能在執(zhí)行語(yǔ)音識(shí)別任務(wù)時(shí)具有不同的延時(shí)和準(zhǔn)確性。如果具有較低延時(shí)的SRS輸出語(yǔ)音 識(shí)別結(jié)果和表述結(jié)果中的高置信度的置信度值,則可以中止剩余的SRS執(zhí)行的語(yǔ)音識(shí)別任 務(wù)。如果置信度值相對(duì)于置信度閾值過(guò)低,則可以允許更多的SRS生成結(jié)果。如果這些結(jié) 果滿(mǎn)足置信度閾值,則可以中止仍未完成語(yǔ)音識(shí)別任務(wù)的SRS,等等。在第一一般方面,描述了一種計(jì)算機(jī)實(shí)現(xiàn)的方法。該方法包括接收音頻信號(hào)并且 發(fā)起多個(gè)語(yǔ)音識(shí)別系統(tǒng)(SRQ的語(yǔ)音識(shí)別任務(wù)。每個(gè)SRS被配置為生成指出音頻信號(hào)中包 括的可能語(yǔ)音的識(shí)別結(jié)果和指示語(yǔ)音結(jié)果的正確性的置信度的置信度值。該方法還包括完 成一部分語(yǔ)音識(shí)別任務(wù),包括生成一個(gè)或多個(gè)識(shí)別結(jié)果和關(guān)于一個(gè)或多個(gè)識(shí)別結(jié)果的一個(gè) 或多個(gè)置信度值,確定一個(gè)或多個(gè)置信度值是否滿(mǎn)足置信度閾值,對(duì)于未生成識(shí)別結(jié)果的 SRS中止剩余部分的語(yǔ)音識(shí)別任務(wù),并且基于所生成的一個(gè)或多個(gè)語(yǔ)音結(jié)果中的至少一個(gè) 輸出最終識(shí)別結(jié)果。在第二一般方面,描述了一種系統(tǒng),其包括多個(gè)語(yǔ)音識(shí)別系統(tǒng),所述多個(gè)語(yǔ)音識(shí)別 系統(tǒng)發(fā)起用于識(shí)別編碼在接收到的音頻信號(hào)中的可能語(yǔ)音的語(yǔ)音識(shí)別任務(wù)。每個(gè)語(yǔ)音識(shí)別系統(tǒng)(SRS)被配置為生成識(shí)別結(jié)果和指示識(shí)別結(jié)果的正確性的置信度的置信度值。該系統(tǒng) 還包括識(shí)別管理模塊,用于在SRS生成識(shí)別結(jié)果時(shí)接收識(shí)別結(jié)果并且接收與所生成的識(shí)別 結(jié)果相關(guān)聯(lián)的置信度值。如果接收到的置信度值中的一個(gè)或多個(gè)滿(mǎn)足置信度閾值,則識(shí)別 管理模塊中止由未生成識(shí)別結(jié)果的SRS進(jìn)行的未完成的語(yǔ)音識(shí)別任務(wù)。該系統(tǒng)包括接口, 用于傳送基于所生成的識(shí)別結(jié)果的置信度值選擇的最終識(shí)別結(jié)果。在第三一般方面,描述了一種系統(tǒng),其包括多個(gè)語(yǔ)音識(shí)別系統(tǒng),所述多個(gè)語(yǔ)音識(shí)別 系統(tǒng)發(fā)起對(duì)于接收的音頻信號(hào)的語(yǔ)音識(shí)別任務(wù),每個(gè)語(yǔ)音識(shí)別系統(tǒng)(SRQ被配置為生成識(shí) 別音頻信號(hào)中的可能語(yǔ)音的識(shí)別結(jié)果和指示識(shí)別結(jié)果的正確性的置信度的置信度值。該系 統(tǒng)包括用于以下的裝置在SRS生成一個(gè)或多個(gè)識(shí)別結(jié)果時(shí),從每個(gè)SRS接收一個(gè)或多個(gè)識(shí) 別結(jié)果和一個(gè)或多個(gè)相應(yīng)的置信度值,如果接收到的置信度值中的一個(gè)或多個(gè)滿(mǎn)足置信度 閾值,則中止由未生成識(shí)別結(jié)果的SRS進(jìn)行的未完成的語(yǔ)音識(shí)別任務(wù),并且基于所生成的 識(shí)別結(jié)果的置信度值選擇最終識(shí)別結(jié)果。該系統(tǒng)還包括用于傳送表示音頻信號(hào)中的可能語(yǔ) 音的最終識(shí)別結(jié)果的接口。這里描述的系統(tǒng)和技術(shù)可以提供以下優(yōu)點(diǎn)中的一個(gè)或多個(gè)。首先,并行地使用多 個(gè)語(yǔ)音識(shí)別系統(tǒng)對(duì)音頻解碼的系統(tǒng)可以提供延時(shí)和準(zhǔn)確性的改進(jìn)的聯(lián)合優(yōu)化,因?yàn)槿绻?收到令人滿(mǎn)意的結(jié)果,則可以允許中止未完成的識(shí)別任務(wù)。此外,使用多個(gè)識(shí)別系統(tǒng)的系統(tǒng) 可以改進(jìn)拒絕率(即,使拒絕率降低)。系統(tǒng)還可以通過(guò)比較多個(gè)識(shí)別系統(tǒng)輸出的識(shí)別結(jié)果 來(lái)增加準(zhǔn)確性。還可以提供用于縮放(例如,增加)用于提供增加的識(shí)別性能的計(jì)算資源 量的框架。在附圖和下面的描述中闡述了一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)。根據(jù)描述和附圖以及權(quán) 利要求,其他特征和優(yōu)點(diǎn)將是顯然的。


圖1是用于識(shí)別語(yǔ)音的示例系統(tǒng)的示圖。圖2是用于對(duì)嵌入在音頻傳送中的語(yǔ)音解碼的示例系統(tǒng)的更詳細(xì)的示圖。圖3是用于使用并行解碼來(lái)識(shí)別語(yǔ)音的示例方法的流程圖。圖4A-C示出了圖示示例語(yǔ)音識(shí)別任務(wù)的執(zhí)行的示圖。圖5A-C是SRS生成的示例識(shí)別結(jié)果和置信度值以及選擇最終識(shí)別結(jié)果的不同方 法的示圖。圖6是用于對(duì)在最終識(shí)別結(jié)果的選擇中使用的值加權(quán)的置信度值的分布的示例 曲線圖。圖7A-E是示出SRS輸出的示例識(shí)別結(jié)果集合和可用于對(duì)識(shí)別結(jié)果加權(quán)的集合之 間的相關(guān)性的Verm(維恩)示圖。圖8A和8B是圖示在語(yǔ)音解碼系統(tǒng)的運(yùn)行操作期間SRS之間的交集如何調(diào)整或改 變的Venn示圖。圖9是圖示在與識(shí)別結(jié)果相關(guān)聯(lián)的SRS錯(cuò)誤率和權(quán)重之間的示例相關(guān)性的曲線 圖。圖10是可用于實(shí)現(xiàn)本文中描述的系統(tǒng)和方法的計(jì)算設(shè)備的框圖。
各附圖中相同的附圖標(biāo)記指示相同的元素。
具體實(shí)施例方式本文描述了用于使用多個(gè)語(yǔ)音識(shí)別系統(tǒng)(SRS)對(duì)話語(yǔ)解碼的系統(tǒng)和技術(shù)。在一些 實(shí)現(xiàn)方式中,每個(gè)SRS具有不同的特性,諸如準(zhǔn)確性、延時(shí)、詞典等,從而多個(gè)SRS中的一些 SRS在其他SRS之前輸出識(shí)別結(jié)果。如果輸出的識(shí)別結(jié)果滿(mǎn)足某些要求(例如,所生成的結(jié) 果中的一個(gè)或多個(gè)與滿(mǎn)足或超過(guò)閾值置信度的指定置信度值相關(guān)聯(lián)),則語(yǔ)音解碼系統(tǒng)可 以在剩余的SRS完成它們的語(yǔ)音識(shí)別任務(wù)之前中止它們。圖1是用于識(shí)別語(yǔ)音的示例系統(tǒng)100的示圖。一般地,系統(tǒng)100包括處理從例如 蜂窩電話接收到的音頻信號(hào)的多個(gè)SRS。在該示例中,用戶(hù)呼叫具有語(yǔ)音功能的電話簿服 務(wù),其將包含用戶(hù)語(yǔ)音的音頻信號(hào)轉(zhuǎn)發(fā)到具有多個(gè)SRS的語(yǔ)音識(shí)別器。多個(gè)SRS可以并行處理音頻信號(hào),但是一些SRS可以在其他SRS之前生成識(shí)別結(jié) 果。如果生成識(shí)別結(jié)果的SRS表達(dá)這些結(jié)果中的足夠高的置信度,則可以中止剩余的未完 成的語(yǔ)音識(shí)別任務(wù)并且可以基于當(dāng)前生成的識(shí)別結(jié)果確定最終識(shí)別結(jié)果,而非等待所有 SRS完成它們的語(yǔ)音識(shí)別任務(wù)。示例系統(tǒng)100包括蜂窩電話102,其將以音頻信號(hào)104的形式輸入的語(yǔ)音傳送到具 有語(yǔ)音功能的電話簿信息服務(wù)器106,其允許蜂窩電話用戶(hù)口頭請(qǐng)求電話簿信息并且以所 請(qǐng)求的信息作出響應(yīng)。在圖1的示例中,信息服務(wù)器106將音頻信號(hào)104傳送到用于對(duì)嵌入在音頻信號(hào) 104中的語(yǔ)音解碼的語(yǔ)音識(shí)別器108。在一些應(yīng)用中,語(yǔ)音識(shí)別器108包括多個(gè)SRSA_E,其并 行操作以對(duì)音頻信號(hào)104中的語(yǔ)音解碼。語(yǔ)音識(shí)別系統(tǒng)(SRS)管理模塊110監(jiān)視任何SRS是否已生成識(shí)別結(jié)果并且收集與 這些結(jié)果相關(guān)聯(lián)的置信度值。該監(jiān)視在示圖112中示出,其示出了 SRS的并行執(zhí)行。示圖 112示出了 SR、首先生成具有0. 3的置信度值的識(shí)別結(jié)果。接著,SRSe生成具有0. 6的置 信度值的識(shí)別結(jié)果。稍后,一?。縙生成具有0.8的置信度值的識(shí)別結(jié)果。由于在該實(shí)現(xiàn)方式 中,SR&生成的識(shí)別結(jié)果具有滿(mǎn)足預(yù)定置信度閾值的置信度值,因此SRS管理模塊110可以 在SR&生成識(shí)別結(jié)果之后中止執(zhí)行的剩余的語(yǔ)音識(shí)別任務(wù)。在一些實(shí)現(xiàn)方式中,SRS管理模塊110中的最終結(jié)果選擇模塊113可以選擇最終識(shí) 別結(jié)果114以輸出到具有語(yǔ)音功能的電話簿信息服務(wù)器106。例如,SRS管理模塊110可以 基于由已完成語(yǔ)音識(shí)別任務(wù)的SRSa, B,E輸出的所生成的識(shí)別結(jié)果和相關(guān)聯(lián)的置信度值116 的集合來(lái)選擇最終識(shí)別結(jié)果。在一些實(shí)現(xiàn)方式中,最終識(shí)別結(jié)果114是從音頻信號(hào)104解 碼的可能語(yǔ)音的符號(hào)表示。例如,電話簿信息服務(wù)器106可以提示用戶(hù)說(shuō)出城市和州的名 稱(chēng)。所說(shuō)的城市和州名稱(chēng)可以被編碼在從蜂窩電話102的用戶(hù)接收的音頻信號(hào)104中并且 由語(yǔ)音識(shí)別器108解碼。在一些實(shí)現(xiàn)方式中,最終結(jié)果是解碼器已確定的音頻信號(hào)104最 可能表示的語(yǔ)音。SRS輸出的置信度值116可以根據(jù)若干種方法生成。在一些實(shí)現(xiàn)方式中,第一 SRS 可以生成關(guān)于話語(yǔ)識(shí)別的若干假設(shè)或猜想??壳吧傻募僭O(shè)可以與SRS生成的競(jìng)爭(zhēng)假設(shè)比 較并且置信度值可以基于靠前生成的假設(shè)和競(jìng)爭(zhēng)假設(shè)之間的識(shí)別分值的差異而變化。在另一示例中,第一識(shí)別結(jié)果的置信度值可以基于識(shí)別結(jié)果的生成中或者前端信 號(hào)分析的計(jì)算中使用的信號(hào)或特性。例如,信號(hào)可以包括搜索中使用的多個(gè)競(jìng)爭(zhēng)假設(shè)或者探測(cè)搜索曲線的密度,前端示例可以包括估計(jì)的信噪特性,或者基于與現(xiàn)有的那些信道類(lèi) 型的模型的匹配的估計(jì)的信道類(lèi)型(例如,免持vs.蜂窩vs.陸線)。這些信號(hào)的組合可以 基于保存的數(shù)據(jù)有條件地優(yōu)化。還可以作為來(lái)自聲學(xué)模型和語(yǔ)言模型的分值的非線性組合來(lái)估計(jì)置信度。例如, 給定最靠前的假設(shè),系統(tǒng)可以提取分立的語(yǔ)言模型分值(例如,在處理任何語(yǔ)音之前的關(guān) 于所識(shí)別的結(jié)果的先驗(yàn)估計(jì)),和聲學(xué)模型分值(例如,該話語(yǔ)與最靠前結(jié)果所關(guān)聯(lián)的聲學(xué) 單元的匹配程度)。這樣系統(tǒng)可以作為對(duì)保存的數(shù)據(jù)進(jìn)行有條件優(yōu)化的這兩個(gè)分值的非線 性組合來(lái)估計(jì)總置信度結(jié)果。除了分值之外,可用于使置信度優(yōu)化的另一信號(hào)基于經(jīng)過(guò)語(yǔ)言模型的路徑的類(lèi) 型。例如,對(duì)于n-gram語(yǔ)言模型,當(dāng)系統(tǒng)未遇到特定的3詞序列時(shí),系統(tǒng)可以“回退”,或者 從系統(tǒng)遇到的2詞序列來(lái)估計(jì)關(guān)于3詞序列的先驗(yàn)。針對(duì)給定假設(shè)對(duì)搜索必須經(jīng)歷回退估 計(jì)的次數(shù)進(jìn)行計(jì)數(shù)提供了可以在有條件地估計(jì)關(guān)于給定話語(yǔ)的置信度時(shí)使用的另一信號(hào)。在其他實(shí)現(xiàn)方式中,置信度值可以是識(shí)別結(jié)果是正確的后驗(yàn)概率。在一些實(shí)現(xiàn)方 式中,可以基于格陣密度計(jì)算來(lái)計(jì)算后驗(yàn)概率。在其他示例中,可以使用語(yǔ)音的不太特定 的聲學(xué)模型,諸如收發(fā)話器回路,或者利用比主聲學(xué)模型的參數(shù)少的參數(shù)訓(xùn)練的所有語(yǔ)音 gmm,通過(guò)將最靠前假設(shè)與所有語(yǔ)音的更一般的模型比較來(lái)確定后驗(yàn)概率。所有這些關(guān)于置 信度的后驗(yàn)估計(jì)的方法在本領(lǐng)域中是公知的,這些估計(jì)的組合也是公知的。在一些實(shí)現(xiàn)方式中,使用多種技術(shù)來(lái)計(jì)算置信度值。例如,置信度值基于后驗(yàn)概率 以及相比于在語(yǔ)音識(shí)別任務(wù)期間生成的其他識(shí)別結(jié)果的結(jié)果的相似性。選擇模塊113可以將最終識(shí)別結(jié)果114傳送到接口 118,其進(jìn)而可以將最終識(shí)別結(jié) 果114傳送到具有語(yǔ)音功能的電話簿信息服務(wù)器106。在一些實(shí)現(xiàn)方式中,接口 118使用 API的集合,其與在信息服務(wù)器1 處執(zhí)行的軟件對(duì)接。例如,信息服務(wù)器1 可以執(zhí)行軟 件,其具有用于輸入城市、州和企業(yè)名稱(chēng)的文本表示的公共方法。在其他實(shí)現(xiàn)方式中,接口 118可以包括聯(lián)網(wǎng)協(xié)議(例如,TCP/IP)用于在網(wǎng)絡(luò)上向信息服務(wù)器1 傳送信息。盡管圖1示出了分立的計(jì)算設(shè)備上的電話簿信息服務(wù)器106和語(yǔ)音識(shí)別器,但這 不是必需的。在一些實(shí)現(xiàn)方式中,這兩個(gè)系統(tǒng)可以在單個(gè)計(jì)算設(shè)備上實(shí)現(xiàn)。相似地,可以使 用若干個(gè)計(jì)算設(shè)備實(shí)現(xiàn)每個(gè)系統(tǒng)。例如,可以使用如圖2中示出的一個(gè)或多個(gè)計(jì)算機(jī)實(shí)現(xiàn) 每個(gè)SRS。圖2是用于對(duì)嵌入在音頻傳送中的語(yǔ)音解碼的示例系統(tǒng)200的示圖。出于說(shuō)明的 目的,系統(tǒng)200被分為兩個(gè)部分音頻傳送部分202和語(yǔ)音識(shí)別器部分204。音頻傳送部分 202示出了用于將音頻信號(hào)從用戶(hù)傳送到應(yīng)用服務(wù)器的示例架構(gòu)。語(yǔ)音識(shí)別器部分204示 出了用于解釋或解碼音頻傳送表示的語(yǔ)音的示例架構(gòu)。在該實(shí)現(xiàn)方式中,代表應(yīng)用服務(wù)器 執(zhí)行解碼,并且解碼的語(yǔ)音被傳送回應(yīng)用服務(wù)器,用于在處理用戶(hù)請(qǐng)求時(shí)使用。在一些實(shí)現(xiàn)方式中,系統(tǒng)200,音頻傳送部分202包括諸如蜂窩電話206的電話設(shè) 備,其在網(wǎng)絡(luò)(例如,POTS、蜂窩、互聯(lián)網(wǎng)等)上向電話服務(wù)器212傳送音頻信號(hào)208。電話 服務(wù)器可以將音頻傳送到諸如軟件應(yīng)用服務(wù)器214的另一計(jì)算設(shè)備或者直接傳送到隨后 描述的語(yǔ)音識(shí)別系統(tǒng)。軟件應(yīng)用服務(wù)器214可以包括用戶(hù)正在與其進(jìn)行口頭交互的軟件應(yīng)用。例如,軟 件應(yīng)用服務(wù)器可以是日歷應(yīng)用。用戶(hù)可以呼叫日歷應(yīng)用并且請(qǐng)求日歷應(yīng)用創(chuàng)建2012年5月16日的下午1:30到下午2:00的事件。軟件應(yīng)用服務(wù)器214可以將接收到的請(qǐng)求事件 創(chuàng)建的口頭輸入轉(zhuǎn)發(fā)到語(yǔ)音識(shí)別器部分204用于解碼。在一些實(shí)現(xiàn)方式中,語(yǔ)音識(shí)別器部分204包括語(yǔ)音識(shí)別系統(tǒng)SRSa_d和語(yǔ)音識(shí)別系 統(tǒng)(SRQ管理模塊,其可以協(xié)調(diào)SRS用于在確定音頻信號(hào)208最可能表示什么話語(yǔ)時(shí)使用。每個(gè)SRS可以在一個(gè)或多個(gè)方面不同。在一些實(shí)現(xiàn)方式中,SRS可以因它們底層 聲學(xué)模型而不同。例如,不同的聲學(xué)模型可以針對(duì)特定的條件,例如用戶(hù)的性別、口音、年齡 范圍或者特定的背景和前景噪聲條件或者特定的傳送信道。聲學(xué)模型還可以因它們的架構(gòu) 和尺寸而變化,例如具有較少參數(shù)的較小的模型可以產(chǎn)生較快的識(shí)別,而具有較多參數(shù)的 較大的模型可以產(chǎn)生更準(zhǔn)確的結(jié)果。在其他示例中,聲學(xué)模型可以因它們的訓(xùn)練過(guò)程而不 同(例如,可以使用不同的隨機(jī)化訓(xùn)練集合來(lái)訓(xùn)練模型或者可以使用不同的訓(xùn)練算法)。在一些實(shí)現(xiàn)方式中,SRS可以因它們的語(yǔ)言模型而不同。例如,模型可以針對(duì)不同 類(lèi)型的數(shù)據(jù),例如特定不同域的語(yǔ)言模型、不同的粒度或者不同的地理位置。在另一示例 中,模型可以因它們的架構(gòu)、尺寸、訓(xùn)練過(guò)程等而不同。在其他實(shí)現(xiàn)方式中,SRS可以因其他組件而不同,諸如結(jié)束指針、前端、詞典、置信 度估計(jì)算法、搜索配置等。出于說(shuō)明目的,圖2中示出了用于SR&的語(yǔ)言模型252、聲學(xué)模型2M和語(yǔ)音識(shí)別 算法256。在一些實(shí)現(xiàn)方式中,當(dāng)SRS管理模塊250接收音頻信號(hào)208時(shí),其發(fā)起如下過(guò)程, 通過(guò)該過(guò)程并行使用兩個(gè)或更多個(gè)SRS來(lái)識(shí)別進(jìn)入的話語(yǔ)。例如,通過(guò)四個(gè)SRS(SRSa_d)并 行執(zhí)行四個(gè)語(yǔ)音識(shí)別任務(wù)以試圖識(shí)別由音頻信號(hào)208表示的同一話語(yǔ)。在一些實(shí)現(xiàn)方式中,每個(gè)SRS可以具有特定延時(shí)。延時(shí)可以取決于SRS架構(gòu)(例 如,聲學(xué)模型、語(yǔ)言模型或者其他組件),但是其也可以基于語(yǔ)音識(shí)別任務(wù)的特定實(shí)例而變 化。例如,如果SRS具有指示話語(yǔ)將落在某組詞(例如,是、否、不是、是的、肯定、否定、決不、 叫喊等)中的信息,則關(guān)于特定模型的延時(shí)可以比SRS不具有指示其中講出話語(yǔ)的約束上 下文(例如,話語(yǔ)不在是或否問(wèn)題的上下文中)的信息時(shí)的延時(shí)短。在一些實(shí)現(xiàn)方式中,每個(gè)SRS在完成其語(yǔ)音識(shí)別任務(wù)之后輸出識(shí)別結(jié)果(例如, SRS確定進(jìn)入的話語(yǔ)說(shuō)出了什么),以及SRS有多確信其結(jié)果的正確性的度量。在一些實(shí)現(xiàn)方式中,SRS管理模塊250具有識(shí)別結(jié)果監(jiān)視器258,其跟蹤SRS生成 的識(shí)別結(jié)果262。結(jié)果監(jiān)視器258還可以監(jiān)視與識(shí)別結(jié)果262相關(guān)聯(lián)的置信度值264或者 分值。在一些實(shí)現(xiàn)方式中,結(jié)果監(jiān)視器258可以計(jì)算關(guān)于每個(gè)識(shí)別結(jié)果的組合置信度分 值。例如,以生成關(guān)于進(jìn)入的話語(yǔ)的識(shí)別結(jié)果“5月16日”。以使其 結(jié)果與置信度值0. 8相關(guān)聯(lián)而SR&可以使其結(jié)果與置信度值0. 7相關(guān)聯(lián)。結(jié)果監(jiān)視器258 可以計(jì)算關(guān)于結(jié)果“5月16日”的當(dāng)前滑動(dòng)平均值是0.75(即(0.8+0. 7)/2)。每當(dāng)SRS生 成識(shí)別結(jié)果(和相應(yīng)的置信度值)時(shí),可以更新組合置信度值。SRS管理模塊250還可以包括延時(shí)監(jiān)視器沈8,其跟蹤每個(gè)SRS的延時(shí)(例如,到 語(yǔ)音識(shí)別任務(wù)完成時(shí)的實(shí)際或估計(jì)時(shí)間)。例如,延時(shí)監(jiān)視器268可以跟蹤特定的語(yǔ)音識(shí)別 任務(wù)耗用SRS的多長(zhǎng)時(shí)間用于產(chǎn)生識(shí)別結(jié)果。延時(shí)監(jiān)視器268還可以監(jiān)視SRS是否已完成語(yǔ)音識(shí)別任務(wù)(例如,通過(guò)監(jiān)視SRS是否輸出識(shí)別結(jié)果)。此外,延時(shí)監(jiān)視器268可以估計(jì)SRS完成語(yǔ)音識(shí)別任務(wù)的預(yù)測(cè)延時(shí)。 例如,延時(shí)監(jiān)視器268可以訪問(wèn)針對(duì)SRS收集的經(jīng)驗(yàn)信息,其指示SRS耗用多長(zhǎng)時(shí)間用于完 成相似的語(yǔ)音識(shí)別任務(wù)(例如,先前耗用SRS的多長(zhǎng)時(shí)間用于對(duì)在諸如回答特定提示問(wèn)題 的相似的上下文中說(shuō)出的話語(yǔ)解碼)。延時(shí)監(jiān)視器260還可以訪問(wèn)關(guān)于底層模型的特性的信息以確定SRS完成語(yǔ)音識(shí)別 任務(wù)的估計(jì)時(shí)間(例如,延時(shí)監(jiān)視器260可以確定SRS是否由于必須搜索較大的詞典以識(shí) 別識(shí)別結(jié)果而耗用較長(zhǎng)的時(shí)間以完成語(yǔ)音識(shí)別)。SRS管理模塊可以包括SRS中止器270,其與延時(shí)監(jiān)視器260和/或識(shí)別結(jié)果監(jiān)視 器258通信以確定是否針對(duì)仍未完成接收的音頻信號(hào)208的解碼的SRS傳送中止命令沈6。 例如,SRS中止器270可以確定所跟蹤的置信度值和/或延時(shí)是否滿(mǎn)足操作點(diǎn)或曲線。如 果是這樣,則可以中止所有剩余的語(yǔ)音識(shí)別。在簡(jiǎn)單示例中,SRS管理模塊250可以確定在中止任何未完成的語(yǔ)音識(shí)別任務(wù)之 前,應(yīng)達(dá)到關(guān)于識(shí)別結(jié)果的0. 75的置信度閾值。在一些實(shí)現(xiàn)方式中,對(duì)于不同的語(yǔ)音識(shí)別 任務(wù),置信度閾值可以變化。例如,如果與特定語(yǔ)音識(shí)別任務(wù)相關(guān)聯(lián)的上下文信息指示識(shí) 別結(jié)果限于相對(duì)小量的話語(yǔ)(例如,識(shí)別任務(wù)在回答呈現(xiàn)給用戶(hù)的是或否的問(wèn)題的上下文 中),則SRS支持器270可以確定置信度值應(yīng)是相對(duì)高的(例如,0. 8,0. 9,0. 95)。如果上下文指示識(shí)別結(jié)果可以包括許多可能話語(yǔ)中的任何一個(gè)(例如,向用戶(hù)提 問(wèn)諸如“你今天想做什么? ”的開(kāi)放問(wèn)題),則SRS中止器270可以確定關(guān)于識(shí)別結(jié)果的置 信度閾值可以是相對(duì)低的(例如,0. 49,0. 55,0.61)并且對(duì)于SRS管理模塊250仍是可接受 的。在一些實(shí)現(xiàn)方式中,如果識(shí)別結(jié)果中的一個(gè)滿(mǎn)足閾值置信度點(diǎn)(例如,0.75),則 中止器270可以將中止命令266傳送到任何未完成的SRS。例如,如果SRSa,B的組合置信度 值等于或大于0. 75,則中止器270可以將中止命令266傳送到仍未生成識(shí)別結(jié)果的SRS。在另一示例中,如果識(shí)別結(jié)果中的一個(gè)具有等于或大于0. 75的置信度值,則中止 器270可以傳送中止命令沈6。在該情況中,置信度值可以不是組合置信度值,相反可以是 與單個(gè)SRS生成的識(shí)別結(jié)果相關(guān)聯(lián)的單個(gè)置信度值。在其他實(shí)現(xiàn)方式中,SRS中止器270可以基于關(guān)于SRS的實(shí)際或估計(jì)延時(shí)來(lái)傳送 中止命令。例如,如果已生成識(shí)別結(jié)果并且識(shí)別結(jié)果與非常低的置信度值相關(guān) 聯(lián),則SRS中止器270可以中止剩余的未完成的語(yǔ)音識(shí)別任務(wù)。在該情況中,由于其他SRS 仍未產(chǎn)生這樣的識(shí)別結(jié)果,因此在仍未完成識(shí)別任務(wù)的SRS將不會(huì)產(chǎn)生具有高置信度值的 識(shí)別結(jié)果的假設(shè)下,取消剩余的語(yǔ)音識(shí)別任務(wù)。不同于等待剩余SRS完成,在一些實(shí)現(xiàn)方式中,SRS中止器270可以傳送中止命令 266并且發(fā)起其中請(qǐng)求用戶(hù)重復(fù)話語(yǔ)274的過(guò)程。SRS隨后可以嘗試對(duì)新的話語(yǔ)解碼。在其他實(shí)現(xiàn)方式中,如果基于置信度值或其他參數(shù),識(shí)別結(jié)果不是令人滿(mǎn)意的,則 SRS管理模塊250可以發(fā)起其中請(qǐng)求切換到人類(lèi)操作員的過(guò)程。例如,如箭頭276指示的, 人類(lèi)操作員可以響應(yīng)于用戶(hù)來(lái)解釋音頻信號(hào),其圖示了將音頻信號(hào)路由到呼叫中心278。人 類(lèi)操作員可以解決用戶(hù)傳達(dá)的請(qǐng)求或信息。在一些實(shí)現(xiàn)方式中,SRS中止器270可以首先詢(xún)問(wèn)延時(shí)監(jiān)視器沈0以確定是否向 未完成的SRS傳送中止命令沈6。例如,如果SRS中止器270詢(xún)問(wèn)延時(shí)監(jiān)視器260并且確定未完成的SRS中的一個(gè)很可能將在相對(duì)短的時(shí)間量?jī)?nèi)完成,則SRS中止器270可以拖延以 從幾乎完成的SRS獲得結(jié)果。在生成結(jié)果之后,SRS中止器270可以傳送中止命令沈6以 停止剩余的未完成的SRS完成語(yǔ)音識(shí)別。在一些實(shí)現(xiàn)方式中,另外的識(shí)別結(jié)果和相關(guān)聯(lián)的信息可能是足夠有價(jià)值的,足以 使中止命令的傳送延遲直至幾乎完成的SRS被完成。例如,如果與幾乎完成的SRS相關(guān)聯(lián) 的特性指示其識(shí)別結(jié)果常常比先前完成的SRS的結(jié)果更準(zhǔn)確,則在中止剩余的未完成的語(yǔ) 音識(shí)別任務(wù)之前,中止器270可以等待直至幾乎完成的SRS生成識(shí)別結(jié)果。在一些實(shí)現(xiàn)方式中,使用具有一個(gè)或多個(gè)變量的函數(shù)來(lái)確定置信度閾值。例如,置 信度函數(shù)可以具有包括置信度值和延時(shí)的變量。如果所生成的置信度值和觀察到的延時(shí)滿(mǎn) 足置信度函數(shù),則中止器270可以取消任何未完成的語(yǔ)音識(shí)別任務(wù)。例如,在短的延時(shí)時(shí)段 中,置信度函數(shù)可以指示對(duì)于應(yīng)滿(mǎn)足的置信度函數(shù),置信度值應(yīng)是非常高的。這可以部分 地基于如下假設(shè)如果中止器270快速地發(fā)出中止命令,則由于將不會(huì)生成其他潛在的識(shí) 別結(jié)果,因此所生成的結(jié)果是正確的概率應(yīng)是非常高的。隨著延時(shí)增加,在耗用較長(zhǎng)時(shí)間處 理的語(yǔ)音識(shí)別任務(wù)可能是更困難的假設(shè)下,所需的置信度值可以下降,并且因此結(jié)果的置 信度很可能將是較低的。SRS管理模塊250還可以包括最終結(jié)果選擇模塊觀0,其在一些實(shí)現(xiàn)方式中從所生 成的識(shí)別結(jié)果中選擇最終識(shí)別結(jié)果。例如,選擇模塊280可以選擇具有最高組合置信度值 的識(shí)別結(jié)果或者具有最高單個(gè)置信度值的識(shí)別結(jié)果。在一些實(shí)現(xiàn)方式中,基于哪個(gè)SRS生成識(shí)別結(jié)果,最終識(shí)別結(jié)果的選擇可被影響。 例如,如果識(shí)別結(jié)果是由具有相對(duì)不同的組件(例如,語(yǔ)言模型、聲學(xué)模型、語(yǔ)音識(shí)別算法 等)和/或典型地產(chǎn)生不同的識(shí)別結(jié)果的SRS生成的,則選擇模塊280可以加權(quán)或偏好選 擇該識(shí)別結(jié)果。在一些實(shí)現(xiàn)方式中,SRS相關(guān)性監(jiān)視器282可以跟蹤SRS的輸出識(shí)別結(jié)果之間的 相關(guān)性。如果輸出識(shí)別結(jié)果指示兩個(gè)SRS不是高度相關(guān)的,然而在特定的識(shí)別任務(wù)中它們 生成相同的識(shí)別結(jié)果,則在最終識(shí)別結(jié)果的選擇中,該結(jié)果可以被更高地加權(quán)或偏好。替選 地,如果生成識(shí)別結(jié)果的SRS是高度相關(guān)的,則識(shí)別結(jié)果可被打折或者不加權(quán),從而在最終 識(shí)別結(jié)果的選擇中不一定偏好該結(jié)果。相關(guān)性監(jiān)視器282可以基于SRS生成的識(shí)別結(jié)果動(dòng)態(tài)地更新指定兩個(gè)或更多個(gè) SRS之間的相關(guān)性的相關(guān)性值。例如,兩個(gè)與低相關(guān)性值相關(guān)聯(lián)的SRS可以開(kāi)始產(chǎn)生相似的 識(shí)別結(jié)果。相關(guān)性監(jiān)視器282可以更新相關(guān)性值(例如,使其增加)以反映SRS之間的識(shí) 別結(jié)果中的重疊增加。在最終結(jié)果選擇模塊280識(shí)別最終結(jié)果之后,SRS管理模塊可以將結(jié)果傳送回請(qǐng) 求對(duì)音頻信號(hào)解碼的軟件應(yīng)用服務(wù)器。軟件應(yīng)用服務(wù)器可以使用解碼的音頻信號(hào)處理用戶(hù) 請(qǐng)求。圖3是用于使用并行解碼來(lái)識(shí)別語(yǔ)音的示例方法300的流程圖。方法300可以 例如由諸如系統(tǒng)100和200的系統(tǒng)執(zhí)行,并且為了表達(dá)清楚,下面的描述使用系統(tǒng)100和 200作為用于描述方法的示例的基礎(chǔ)。然而,可以使用另一系統(tǒng)或者系統(tǒng)的組合來(lái)執(zhí)行方法 300。在步驟302中,接收音頻信號(hào)。例如,語(yǔ)音識(shí)別器108可以接收音頻信號(hào)104。在一些實(shí)現(xiàn)方式中,音頻信號(hào)104已被采樣并且分割為數(shù)字幀用于在傳送到語(yǔ)音識(shí)別器108 之前進(jìn)行處理。在其他實(shí)現(xiàn)方式中,語(yǔ)音識(shí)別器108也執(zhí)行這些功能。在一些實(shí)現(xiàn)方式中,音頻信號(hào)可能已被預(yù)處理以識(shí)別信號(hào)的哪些部分包含語(yǔ)音以 及哪些部分被確定為噪聲。接收到的音頻信號(hào)104可能僅包括被確定為具有語(yǔ)音的部分, 其隨后可以在后面的步驟中由語(yǔ)音識(shí)別器108解碼。在步驟304A-N中,發(fā)起語(yǔ)音識(shí)別任務(wù)(SRT)。在一些實(shí)現(xiàn)方式中,SRT基本上被同 時(shí)發(fā)起并且開(kāi)始對(duì)音頻信號(hào)104表示的語(yǔ)音解碼。諸如圖2的SRSa_d的SRS可能具有處理 音頻信號(hào)的不同的延時(shí),從而SRT可能需要不同的時(shí)間量來(lái)完成。在步驟306中,監(jiān)視SRT的進(jìn)展。例如,延時(shí)監(jiān)視器260可以跟蹤與每個(gè)SRS相關(guān) 聯(lián)的延時(shí)(實(shí)際的和估計(jì)的)。在步驟308中,確定任何否已生成識(shí)別結(jié)果。例如,在識(shí)別結(jié)果被生成之 后,SRS可以向識(shí)別結(jié)果監(jiān)視器258輸出識(shí)別結(jié)果(或者結(jié)果存在的指示)。如果沒(méi)有SRS 已生成識(shí)別結(jié)果,則方法300可以返回步驟306并且繼續(xù)監(jiān)視SRT的進(jìn)展。如果SRS已生 成一個(gè)或多個(gè)識(shí)別結(jié)果,則該方法可以繼續(xù)到步驟310。在步驟310中,確定與所生成的識(shí)別結(jié)果相關(guān)聯(lián)的任何置信度值是否滿(mǎn)足置信度 閾值。例如,SRS中止器270可以將關(guān)于識(shí)別結(jié)果的置信度值(單個(gè)或組合置信度值)與 如前所述的置信度點(diǎn)或置信度函數(shù)比較。如果當(dāng)前置信度值不滿(mǎn)足置信度閾值,則方法300 可以返回步驟306,其中監(jiān)視SRT的進(jìn)展。如果滿(mǎn)足置信度閾值,則方法300可以進(jìn)行到步 馬聚312ο在步驟312中,中止未完成的SRT。例如,如果存在并行執(zhí)行的十個(gè)SRT并且四個(gè) 已完成,則可以取消或中止剩余的六個(gè)SRT。在一些實(shí)現(xiàn)方式中,SRS中止器270可以向適 當(dāng)?shù)腟RS傳送中止命令沈6,從而它們停止語(yǔ)音識(shí)別任務(wù)。在一些實(shí)現(xiàn)方式中,語(yǔ)音識(shí)別任務(wù)中的一個(gè)或多個(gè)未被中止,而是僅被“暫?!?, (例如,處理任務(wù)的狀態(tài)可以被保存并且稍后重新開(kāi)始)。例如,如果識(shí)別結(jié)果最終被證 明是不正確的(例如,當(dāng)軟件應(yīng)用服務(wù)器提示用戶(hù)確認(rèn)語(yǔ)音已被正確解碼時(shí),用戶(hù)否定答 復(fù)),則可以重新開(kāi)始“暫停的”語(yǔ)音識(shí)別任務(wù)。在一些實(shí)現(xiàn)方式中,可以基于例如執(zhí)行SRT的SRS的準(zhǔn)確性來(lái)有選擇地暫停SRT。 例如,如果識(shí)別結(jié)果與僅剛剛滿(mǎn)足置信度閾值的置信度值相關(guān)聯(lián),則中止器270可以有選 擇地暫停更準(zhǔn)確的SRS的SRT,同時(shí)中止剩余的SRT。如果識(shí)別結(jié)果最終被證明是不正確的, 則可以重新開(kāi)始更準(zhǔn)確的SRS的暫停的SRT。在一些實(shí)現(xiàn)方式中,先前完成的SRT和先前中止的SRT可以與“未暫停的” SRT同 時(shí)開(kāi)始。較之SRT完全重新開(kāi)始,這可以為更準(zhǔn)確的SRT提供更多的時(shí)間用于完成。在其他 實(shí)現(xiàn)方式中,基于用戶(hù)確認(rèn)不正確的識(shí)別而推斷或確定的信息可以被集成到未暫停的SRT 以及重新開(kāi)始的任務(wù)中。例如,可以從語(yǔ)音解碼的新的輪回中的考慮移除錯(cuò)誤話語(yǔ)。此外, 用于確定錯(cuò)誤結(jié)果的一些聲音、詞等可以被忽視或者從識(shí)別處理的第二次輪回中的考慮排 除。在步驟314中,基于所生成的結(jié)果選擇最終識(shí)別結(jié)果。例如,最終結(jié)果選擇模塊 280可以識(shí)別與最高平均置信度分值相關(guān)聯(lián)的識(shí)別結(jié)果。在一些實(shí)現(xiàn)方式中,還可以基于 產(chǎn)生結(jié)果的SRS的準(zhǔn)確性來(lái)對(duì)選擇加權(quán),其中來(lái)自典型地準(zhǔn)確的SRS的結(jié)果相對(duì)較不準(zhǔn)確的SRS是被偏好的。在其他實(shí)現(xiàn)方式中,選擇還可以基于生成結(jié)果或者與結(jié)果相關(guān)聯(lián)的出 現(xiàn)頻率的機(jī)器之間的相關(guān)性。所選擇的結(jié)果可以被輸出到請(qǐng)求音頻信號(hào)的解碼的應(yīng)用。接 著,該方法可以結(jié)束。圖4A-C示出了圖示示例語(yǔ)音識(shí)別任務(wù)的執(zhí)行的示圖。圖4A示出了四個(gè)SRS的四 個(gè)SRT的執(zhí)行。在圖示實(shí)現(xiàn)方式中,并行發(fā)起SRT并且SI^a首先生成識(shí)別結(jié)果。SI^a確定 關(guān)于其識(shí)別結(jié)果的0. 7的置信度值。在一些實(shí)現(xiàn)方式中,SRS管理模塊110可以將該置信 度值與置信度閾值比較。如果置信度值不滿(mǎn)足閾值,則允許剩余的任務(wù)執(zhí)行。例如,如果置 信度閾值是0. 9的固定常數(shù),則由于初始識(shí)別結(jié)果的0. 7不滿(mǎn)足閾值,因此SRS管理模塊將 允許剩余的SRS繼續(xù)。接著,SRSb生成識(shí)別結(jié)果和相關(guān)聯(lián)的0. 85的值。該置信度值也不滿(mǎn)足0. 9的置信 度閾值,因此允許剩余任務(wù)繼續(xù)。此外,SRS管理系統(tǒng)還可以跟蹤與每個(gè)SRS相關(guān)聯(lián)的延時(shí)并且可以將這些延時(shí)與 所允許的延時(shí)閾值比較。如圖4A中所示,在一些實(shí)現(xiàn)方式中,如果SRS(例如,SRSd) 未在延時(shí)閾值之前產(chǎn)生識(shí)別結(jié)果,SRS管理模塊110可以向它們傳送中止命令。在一些實(shí)現(xiàn)方式中,如果在生成滿(mǎn)足置信度閾值的識(shí)別結(jié)果之前SRT被中止,則 SRS管理模塊110可以選擇具有最高置信度值的結(jié)果,即使其未滿(mǎn)足置信度閾值。在一些 實(shí)現(xiàn)方式中,次最高的置信度值可能必須位于將選擇的置信度閾值的確定范圍內(nèi)(例如, 10% )。在其他實(shí)現(xiàn)方式中,如果未選擇識(shí)別結(jié)果,則SRS管理模塊110可以發(fā)送重復(fù)口頭 輸入的請(qǐng)求。圖4B是圖示一旦SRS生成具有滿(mǎn)足置信度閾值的置信度值的識(shí)別結(jié)果則中止未 完成的SRT的示圖。在該示例中,置信度閾值是0.9。SI^a首先生成識(shí)別結(jié)果,但是其向結(jié) 果分配0. 7的置信度值,其低于置信度閾值。因此,SRS管理模塊110允許SRSb_d繼續(xù)執(zhí)行。SRSb接著生成識(shí)別結(jié)果并且將其分配0. 9的置信度值。SRS管理模塊110將該置 信度值與置信度閾值比較并且確定滿(mǎn)足閾值。SRS管理模塊隨后可以向發(fā)出 中止命令,其使它們各自的SRT停止而不產(chǎn)生識(shí)別結(jié)果。圖4C是圖示基于已生成的低置信度值的識(shí)別結(jié)果來(lái)中止未完成的SRT的示圖。在 該示例中,置信度閾值可以被設(shè)定在0. 9的固定點(diǎn)。SR^^P SR&生成識(shí)別結(jié)果,然而,這兩 個(gè)結(jié)果分別與0. 3和0. 25的相對(duì)低的置信度值相關(guān)聯(lián)。假設(shè)置信度值均是相對(duì)低的,則在 由于先前的SRS產(chǎn)生的識(shí)別結(jié)果具有明顯低于置信度閾值的置信度值,因此這些SRS不太 可能產(chǎn)生具有滿(mǎn)足置信度閾值的置信度值的識(shí)別結(jié)果的假設(shè)下,SRS管理模塊110可以向 SRSc和SR&傳送中止命令。在如圖4C中所示的一些實(shí)現(xiàn)方式中,SRS管理模塊110可以在基于先前生成的識(shí) 別結(jié)果的低置信度值而傳送中止命令之前等待確定的時(shí)間量。在一些實(shí)現(xiàn)方式中,SRS管 理模塊110基于生成最后的識(shí)別結(jié)果的時(shí)間發(fā)起時(shí)間段。確定的時(shí)間段可以允許另一 SRS 完成其SRT ;然而,如果在所允許的時(shí)間段期間未生成結(jié)果,則可以傳送中止任何未完成的 SRT的命令。在一些實(shí)現(xiàn)方式中,要等待的時(shí)間段的確定可以基于仍未生成識(shí)別結(jié)果的一個(gè)或 多個(gè)SRS的估計(jì)延時(shí)。例如,SRS管理模塊110可以確定SRSc具有剩余SRS中的最短估計(jì) 延時(shí)。例如,3舊??梢跃哂械湫偷?.5秒的延時(shí)。如果38&在0.4秒之后生成識(shí)別結(jié)果,則語(yǔ)音識(shí)別管理模塊100在傳送中止命令之前可以延遲0. 1秒以確定SR&是否生成識(shí)別結(jié)果。在其他實(shí)現(xiàn)方式中,可以立即傳送中止命令。例如,SRS管理模塊110可以在確定 數(shù)量的SRS生成也與低置信度值相關(guān)聯(lián)的識(shí)別結(jié)果之后傳送中止命令。在圖4C中示出的 情況中,可以在一半的SRS返回與低置信度值相關(guān)聯(lián)的識(shí)別結(jié)果時(shí)傳送中止命令。在一些實(shí)現(xiàn)方式中,如果置信度值是低的,則系統(tǒng)繼續(xù)接收更多的識(shí)別結(jié)果直至 系統(tǒng)確認(rèn)復(fù)合(例如,總體/累積)置信度值高于某個(gè)閾值。對(duì)于一些識(shí)別任務(wù),確認(rèn)從 未出現(xiàn),并且系統(tǒng)可以通過(guò)拒絕話語(yǔ)來(lái)中止識(shí)別過(guò)程。因此,在一些實(shí)現(xiàn)方式中,存在三種 類(lèi)型的置信度第一,來(lái)自每個(gè)識(shí)別過(guò)程的原始置信度;第二,從來(lái)自每個(gè)識(shí)別過(guò)程的原始 置信度確定的累積總置信度;以及第三,當(dāng)系統(tǒng)等待更多的識(shí)別事件時(shí)總置信度可能改變 (例如,增加)的期望值。在一些情況中,系統(tǒng)跨越解相關(guān)的識(shí)別器接收到足夠數(shù)量的一致的低置信度結(jié) 果,促使中止所有識(shí)別任務(wù)并且拒絕話語(yǔ)。如果發(fā)生拒絕,則系統(tǒng)可以提示用戶(hù)重復(fù)話語(yǔ)。 例如,當(dāng)各原始置信度值是一致地低的,累積總置信度是低的,以及總置信度隨著更多的識(shí) 別而可能改變的期望值也是低的時(shí)候,可能出現(xiàn)拒絕情況。在一些實(shí)現(xiàn)方式中,通過(guò)針對(duì)給定的部分識(shí)別置信度的訓(xùn)練樣本,對(duì)最終識(shí)別置 信度的分布進(jìn)行計(jì)數(shù),提早執(zhí)行對(duì)于給定的特定置信度值集合的關(guān)于估計(jì)的預(yù)期置信度改 變的訓(xùn)練。(例如,在看到來(lái)自前20個(gè)快識(shí)別器的20個(gè)低于0. 1的置信度值之后,系統(tǒng)不 再體驗(yàn)其中關(guān)于超過(guò)20個(gè)識(shí)別器的組合置信度值使總置信度值增加到0. 5以上的示例。因 此,系統(tǒng)被訓(xùn)練為當(dāng)該情形出現(xiàn)時(shí)拒絕話語(yǔ)。)在一些實(shí)現(xiàn)方式中,與最終識(shí)別結(jié)果相關(guān)聯(lián)的組合置信度可以是來(lái)自各SRS的各 置信度值的函數(shù)。具有來(lái)自彼此也匹配的許多識(shí)別器的高置信度值的結(jié)果與高組和置信度 值一致。每個(gè)識(shí)別器的單獨(dú)貢獻(xiàn)的加權(quán)可以基于訓(xùn)練過(guò)程期間的測(cè)試數(shù)據(jù)的識(shí)別的實(shí)驗(yàn)優(yōu) 化。圖5A-C是SRS生成的示例識(shí)別結(jié)果和置信度值以及選擇最終識(shí)別結(jié)果的不同方 法的示圖。具體地,圖5A-C示出了來(lái)自SI A輸出502、來(lái)自輸出504和 來(lái)自SR&的SR&輸出506。在該示例中,響應(yīng)于每個(gè)SRS嘗試對(duì)表示詞“carry”的音頻信 號(hào)解碼生成輸出。如圖5A-C所示,由于每個(gè)SRS可能是不同的,因此SRS產(chǎn)生的識(shí)別結(jié)果 可能是不同的。在一些實(shí)現(xiàn)方式中,SRS輸出包括靠前的N個(gè)識(shí)別結(jié)果(其中N可以表示任何正整 數(shù)或0),其是基于哪些識(shí)別結(jié)果與最大置信度值相關(guān)聯(lián)而選擇的。例如,SI^a輸出502包 括關(guān)于SI^a的前四個(gè)識(shí)別結(jié)果和相關(guān)聯(lián)的置信度值結(jié)果=carry,置信度=0. 75 ;結(jié)果= Cory,置信度=0. 72 ;結(jié)果=quarry,置信度=0. 6 ;和結(jié)果=hoary,置信度=0. 25。SRSb輸出504包括結(jié)果=quarry,置信度=0. 61 ;結(jié)果=Cory,置信度=0. 59 ; 結(jié)果=hoary,置信度=0. 4 ;和結(jié)果=Terry,置信度=0. 39。3舊。輸出506包括結(jié)果=tarry,置信度=0.58 ;結(jié)果=Terry,置信度=0. 57 ;結(jié) 果=Cory,置信度=0. 55 ;和結(jié)果=carry,置信度=0. 2。圖5A示出了選擇與最高置信度值相關(guān)聯(lián)的識(shí)別結(jié)果的示例選擇算法。例如,最終 結(jié)果選擇模塊113可以比較所有識(shí)別結(jié)果并選擇與最大置信度值相關(guān)聯(lián)的一個(gè)識(shí)別結(jié)果。在該示例中,由于結(jié)果“carry”與所有置信度值中的最高置信度值0. 75相關(guān)聯(lián),因此被選 擇為最終識(shí)別結(jié)果。選擇模塊隨后可以輸出識(shí)別結(jié)果“carry”用于由請(qǐng)求語(yǔ)音解碼的應(yīng)用 進(jìn)行進(jìn)一步處理。圖5B示出了基于哪個(gè)結(jié)果具有最高組合置信度值來(lái)選擇識(shí)別結(jié)果的示例選擇算 法。例如,多于一個(gè)SRS可以生成相同的識(shí)別結(jié)果,但是可以向該結(jié)果分配不同的置信度 值。在一些實(shí)現(xiàn)方式中,關(guān)于相同結(jié)果的多個(gè)置信度分值可以被取平均(或者另外組合) 以創(chuàng)建組合置信度分值。例如,SRSa和SR&生成識(shí)別結(jié)果“carry”,然而,SRSa向結(jié)果分配 0. 75的置信度值并且SR&向結(jié)果分配0. 2的置信度值。這些置信度值的平均值是0. 475。相似地,關(guān)于識(shí)別結(jié)果“Cory”的平均組合置信度分值是0.61并且關(guān)于“quarry” 的組合置信度分值是0. 62。在該示例中,由于結(jié)果“quarry”的組合置信度分值大于其他 結(jié)果的組合置信度分值,因此選擇模塊113可以選擇“quarry”作為最終識(shí)別結(jié)果。應(yīng)當(dāng)注 意,該選擇算法產(chǎn)生了不同于圖5B中描述的算法的最終結(jié)果,盡管事實(shí)是從相同的識(shí)別結(jié) 果池中進(jìn)行選擇。圖5C示出了在選擇識(shí)別結(jié)果時(shí)考慮加權(quán)因子的示例選擇算法。在一些實(shí)現(xiàn)方式 中,權(quán)重可以基于識(shí)別結(jié)果的出現(xiàn)頻率。例如,表550列出了三個(gè)權(quán)重,它們可以與前面討 論的組合置信度分值倍乘以創(chuàng)建新的加權(quán)置信度分值。在該示例中,如果識(shí)別結(jié)果由單個(gè)SRS生成(例如,如果結(jié)果出現(xiàn)頻率是“一次”), 則將權(quán)重“1”與組合置信度分值倍乘。因此,如果識(shí)別結(jié)果僅出現(xiàn)一次,則將不會(huì)受益于加 權(quán)。如果識(shí)別結(jié)果出現(xiàn)兩次,則可以使用因子1.02對(duì)其加權(quán),這使得相對(duì)僅出現(xiàn)一次的另 一識(shí)別結(jié)果略微偏好該識(shí)別結(jié)果。如果識(shí)別結(jié)果出現(xiàn)三次,則可以通過(guò)因子1.04對(duì)其加 權(quán)。在圖5C的示例中,關(guān)于識(shí)別結(jié)果“Cory”的組合置信度值將按因子1.04進(jìn)行加權(quán), 這導(dǎo)致了 0. 6344的加權(quán)值。關(guān)于識(shí)別結(jié)果“quarry”的組合置信度值將按因子1. 02進(jìn)行 加權(quán),這導(dǎo)致了 0. 6324的加權(quán)值。在該情況中,選擇模塊113可以相對(duì)于結(jié)果“quarry”選 擇結(jié)果“Cory”,這是因?yàn)楹笳叩募訖?quán)組合置信度分值高于前者,盡管“Cory”的未加權(quán)組合 置信度分值小于結(jié)果“quarry”的未加權(quán)組合置信度分值。用于選擇最終識(shí)別結(jié)果的值可以基于若干種標(biāo)準(zhǔn)進(jìn)行加權(quán),其包括但不限于,SRS 生成的置信度分值的分布、生成識(shí)別結(jié)果的SRS的特性(例如,整體準(zhǔn)確性、特定上下文中 的準(zhǔn)確性、定義的時(shí)間段上的準(zhǔn)確性等)以及產(chǎn)生相同識(shí)別結(jié)果的SRS之間的相似性。在其他實(shí)現(xiàn)方式中,最終識(shí)別結(jié)果可以使用識(shí)別置信度值與關(guān)于識(shí)別器和關(guān)于最 終組合識(shí)別器的識(shí)別錯(cuò)誤的相關(guān)性進(jìn)行加權(quán)。例如,在訓(xùn)練期間,系統(tǒng)可以對(duì)特定識(shí)別器以 置信度值0. 3返回的次數(shù)計(jì)數(shù),并且還對(duì)這些“0. 3置信度識(shí)別結(jié)果”是關(guān)于該識(shí)別器的錯(cuò) 誤的頻繁度以及最終組合識(shí)別也是識(shí)別錯(cuò)誤的頻繁度計(jì)數(shù)。當(dāng)組合相似的識(shí)別結(jié)果時(shí),系 統(tǒng)可以使用相同的正態(tài)化計(jì)數(shù)。根據(jù)識(shí)別器具有相同的結(jié)果(具有給定的置信度值)和共 同的結(jié)果是正確的次數(shù)來(lái)估計(jì)組合置信度。圖6是用于對(duì)最終識(shí)別結(jié)果的選擇中使用的值加權(quán)的置信度值的分布的示例曲 線圖600。曲線圖的y軸指示其中特定的置信度值沿正態(tài)化比例(從0.0到1.0)下降。曲 線圖的χ軸標(biāo)記哪個(gè)特定SRS產(chǎn)生哪個(gè)識(shí)別結(jié)果。在該示例中,SI^a生成五個(gè)識(shí)別結(jié)果,其 中四個(gè)朝向可能的置信度值的中下范圍相對(duì)緊密地聚在一起。單個(gè)識(shí)別結(jié)果“quarry”明顯與其他識(shí)別結(jié)果分離并且具有相對(duì)較高的置信度值。這可以指示SI^a具有結(jié)果“quarry” 明顯優(yōu)于其他結(jié)果的較大的置信度,其他結(jié)果是彼此更加可互換的。在一些實(shí)現(xiàn)方式中,外部的或者分離的較高置信度值可以被加權(quán)以偏好選擇相關(guān) 聯(lián)的識(shí)別結(jié)果。例如,選擇模塊113可以以常數(shù)1. 05對(duì)關(guān)于結(jié)果“quarry”的置信度值0. 9 加權(quán)。關(guān)于“quarry”的得到的置信度值于是增加到0. 945。替選地,較均勻間隔的置信度值可能不接收額外的加權(quán)(或者可以接收較小的加 權(quán))。例如,關(guān)于SR&生成的識(shí)別結(jié)果的置信度值較均勻地間隔,沒(méi)有明顯的偏值。在該情 況中,選擇模塊113可以不向關(guān)于排名靠前的識(shí)別結(jié)果“quarry”的置信度值添加權(quán)重,這 是因?yàn)榕琶壳暗淖R(shí)別結(jié)果不太可能是正確的(例如,“quarry”未突出為遠(yuǎn)離具有較低置 信度值的結(jié)果簇中的靠前結(jié)果)。圖7A-E是示出SRS輸出的示例識(shí)別結(jié)果集合和可用于對(duì)識(shí)別結(jié)果加權(quán)的集合之 間的相關(guān)性的Verm示圖。圖7A是包括三個(gè)識(shí)別結(jié)果集合,即SEa生成的識(shí)別結(jié)果A、SRSb 生成的識(shí)別結(jié)果B和SRSc生成的識(shí)別結(jié)果c的Verm示圖700。如Verm示圖700所示,結(jié)果A、結(jié)果B和結(jié)果。部分地重疊。在該示例中,結(jié)果八和 結(jié)果B較之結(jié)果A和結(jié)果c或者結(jié)果B和結(jié)果c之間的重疊具有更多的重疊結(jié)果。這可以指 示SR^^P SR&常常產(chǎn)生相同的識(shí)別結(jié)果,而SRSc的結(jié)果常常不對(duì)應(yīng)于SR、或SR&的結(jié)果。在一些實(shí)現(xiàn)方式中,結(jié)果的交集基于哪些SRS響應(yīng)于特定的語(yǔ)音識(shí)別任務(wù)產(chǎn)生相 同的識(shí)別結(jié)果。例如,如果兩個(gè)SRS生成關(guān)于特定任務(wù)的排名靠前的識(shí)別結(jié)果,則該結(jié)果可 以被添加到交集。在另一示例中,如果第一 SRS生成識(shí)別結(jié)果“Cory”作為其靠前結(jié)果并且第二 SRS 生成識(shí)別結(jié)果“Cory”作為其(五個(gè)生成結(jié)果中的)第四排名結(jié)果,則結(jié)果“Cory”被添加 到交集。在一些實(shí)現(xiàn)方式中,都不與靠前排名相關(guān)聯(lián)的結(jié)果不會(huì)被添加到交集結(jié)果,但是也 可以與指示它們排名不同的折扣因子相關(guān)聯(lián)。例如,兩個(gè)排名之間的差異可以用于折扣與 交集相關(guān)聯(lián)的加權(quán)因子(例如,每個(gè)排名差異可以與折扣因子相關(guān)聯(lián))。例如,如果排名是 1和4,則絕對(duì)差異是3,其可以與0. 3的折扣因子相關(guān)聯(lián),該折扣因子與交集所關(guān)聯(lián)的權(quán)重 倍乘。例如,如果權(quán)重是1. 03并且折扣因子是0. 3,則總權(quán)重可以與權(quán)重1. 03的“提升”因 子相乘,即與0. 03相乘。這導(dǎo)致新的更低的提升因子0. 01,從而新的總權(quán)重值是1. 01。在一些實(shí)現(xiàn)方式中,SRS之間的識(shí)別結(jié)果的重疊可用于對(duì)識(shí)別結(jié)果加權(quán),從而它 們?cè)谶x擇最終識(shí)別結(jié)果時(shí)被偏好或冷遇。例如,如果識(shí)別結(jié)果是由兩個(gè)常常一致的SRS生 成的,則相對(duì)于由不常一致的兩個(gè)SRS生成的識(shí)別結(jié)果,其被較小地加權(quán)(或者冷遇)。圖 7B-7E更詳細(xì)地圖示了這一點(diǎn)。圖7B示出了僅包括來(lái)自圖7A的Verm示圖700的結(jié)果A和結(jié)果B的Verm示圖 710。如前所述,基于SR^^n它們的識(shí)別結(jié)果上的相似性,它們可以被分類(lèi)為略微相 似。在一些實(shí)現(xiàn)方式中,加權(quán)因子可以被分配給落在兩個(gè)(或更多個(gè))SRS之間的重疊中的 識(shí)別結(jié)果。例如,加權(quán)因子0. 01可以與落在該集合中的識(shí)別結(jié)果相關(guān)聯(lián)。在一些實(shí)現(xiàn)方式中,當(dāng)重疊較大時(shí),該加權(quán)因子較小,并且當(dāng)重疊較小時(shí),該加權(quán) 因子較大。這可以反映如下假設(shè),不常一致的SRS生成的結(jié)果應(yīng)被偏好,因?yàn)檫@些重疊的結(jié) 果很可能是正確的。例如,產(chǎn)生不同結(jié)果的SRS可以具有不同的底層架構(gòu)并且對(duì)不同類(lèi)型 的識(shí)別錯(cuò)誤敏感。
15
圖7C示出了僅包括來(lái)自圖7A的Verm示圖700的結(jié)果A和結(jié)果C的Verm示圖 720。在該示例中,結(jié)果之間的重疊小于圖7B中示出的重疊。因此,在該實(shí)現(xiàn)方式中,對(duì)于 落在該重疊中的結(jié)果相對(duì)于圖7B中示出的交集中的結(jié)果,0. 6的加權(quán)因子是較大的。相似地,圖7D示出了包括結(jié)果B和結(jié)果C的Verm示圖730。這些結(jié)果的交集具有 介于圖7B和7C的交集之間的尺寸。因此,在該實(shí)現(xiàn)方式中,加權(quán)因子也具有介于與圖7B 和7C的交集相關(guān)聯(lián)的加權(quán)因子之間的尺寸(例如,0. 03)。圖7E示出了圖也在7A中示出的Verm示圖700,然而,突出了所有SRSA_C的結(jié)果之 間的交集。該交集反映了每個(gè)SRS已生成的識(shí)別結(jié)果的集合。假定三個(gè)SRS之間的一致是 相對(duì)少的(在該示例中),落在該集合中的識(shí)別結(jié)果可以與高于其他權(quán)重的權(quán)重相關(guān)聯(lián),即 0. 1。圖8A和8B示出了圖示在系統(tǒng)的運(yùn)行操作期間SRS之間的交集如何調(diào)整或改變的 Venn示圖800和810。在一些實(shí)現(xiàn)方式中,隨著識(shí)別結(jié)果的交集改變,與交集相關(guān)聯(lián)的權(quán)重 也可以改變。圖8A示出了 3舊4和51 &生成的識(shí)別結(jié)果中的示例第一交集。第一交集與權(quán)重 0. 01相關(guān)聯(lián)。在一些實(shí)現(xiàn)方式中,語(yǔ)音識(shí)別器108執(zhí)行額外的語(yǔ)音解碼并且生成額外的識(shí) 別結(jié)果。SRS相關(guān)性監(jiān)視器282可以監(jiān)視這些結(jié)果并且識(shí)別各個(gè)SRS之間的結(jié)果的交集。相關(guān)性監(jiān)視器282可以隨著生成更多的結(jié)果動(dòng)態(tài)地更新交集計(jì)算。這由圖8B圖 示,除了交集改變之外,其示出了圖8A中示出的相同的SR、和SR&。在該示例中,由于SRS 對(duì)于特定語(yǔ)音識(shí)別任務(wù)達(dá)成一致的次數(shù)相對(duì)于SRS已執(zhí)行任務(wù)的次數(shù)增加,因此交集增 長(zhǎng)。也可以響應(yīng)于增加的交集來(lái)減小權(quán)重。例如,示圖810的結(jié)果交集可以與較低的 權(quán)重0.001相關(guān)聯(lián)。在一些實(shí)現(xiàn)方式中,權(quán)重值的改變可以與結(jié)果交集的尺寸改變線性關(guān) 聯(lián)。例如,當(dāng)識(shí)別器與另一識(shí)別器相似時(shí),系統(tǒng)可以較少地加權(quán)或偏好來(lái)自該識(shí)別器的結(jié) 果。在圖8A和8B中,兩個(gè)識(shí)別器的識(shí)別結(jié)果的相似性被表述為兩個(gè)識(shí)別器之間的交集,其 中交集越大,系統(tǒng)可以在兩個(gè)識(shí)別器生成相同結(jié)果時(shí)附加到識(shí)別結(jié)果的權(quán)重越小。相反地, 當(dāng)兩個(gè)識(shí)別器非常不同時(shí)(例如,由于不同的語(yǔ)音識(shí)別算法等,它們通常產(chǎn)生不同的識(shí)別 結(jié)果),結(jié)果的交集可以是較小的。當(dāng)這兩個(gè)不同的識(shí)別器隨后對(duì)話語(yǔ)達(dá)成一致時(shí),由于一 致可以指示結(jié)果很可能是正確的,因此系統(tǒng)可以對(duì)它們的結(jié)果加權(quán),從而它們被系統(tǒng)更重 地考慮。圖9是圖示將與識(shí)別結(jié)果相關(guān)聯(lián)的SRS錯(cuò)誤率和權(quán)重之間的示例相關(guān)性的曲線圖 900。在一些實(shí)現(xiàn)方式中,在選擇最終識(shí)別結(jié)果時(shí),具有低錯(cuò)誤率的SRS生成的識(shí)別結(jié)果可 以被更重地加權(quán)。例如,如果SRS具有高錯(cuò)誤率,則較之由高準(zhǔn)確度的SRS生成的識(shí)別結(jié)果, 其識(shí)別結(jié)果可以被折扣(或者不被重加權(quán))。曲線圖900圖示了用于向特定SRS分配權(quán)重的示例函數(shù)或算法。曲線圖900的y 軸指示與SRS相關(guān)聯(lián)的錯(cuò)誤率,并且χ軸指示與SRS相關(guān)聯(lián)的權(quán)重。在該示例中,折扣權(quán)重 (例如,0. 9,0. 95,0. 8)用于對(duì)具有高于確定閾值的錯(cuò)誤率的SRS (例如,SRSa, SRSe, SRSc) 加權(quán)。提升權(quán)重(例如,1.01、1.04、1. 1)用于對(duì)具有低于閾值的錯(cuò)誤率的SRS (例如,SRSb) 加權(quán)。在該示例中,中性權(quán)重(例如,1)用于對(duì)落在錯(cuò)誤閾值上的SRS(例如,SRSd)加權(quán)。在一些實(shí)現(xiàn)方式中,與每個(gè)SRS相關(guān)聯(lián)的錯(cuò)誤率可以基于識(shí)別結(jié)果不正確的確認(rèn)而被更新(例如,該結(jié)果被選擇為最終識(shí)別結(jié)果并且被用戶(hù)拒絕,基于用戶(hù)接受,第一結(jié)果 被選擇為最終識(shí)別結(jié)果并且被確定為正確的,因此未被選擇的結(jié)果被記錄為錯(cuò)誤結(jié)果等)。 選擇模塊113可以基于與每個(gè)SRS相關(guān)聯(lián)的更新的錯(cuò)誤率來(lái)動(dòng)態(tài)地改變權(quán)重。圖10是可用于實(shí)現(xiàn)本文中描述的系統(tǒng)和方法的作為客戶(hù)端或者服務(wù)器或多個(gè)服 務(wù)器的計(jì)算設(shè)備1000、1050的框圖。計(jì)算設(shè)備1000旨在表示各種形式的數(shù)字計(jì)算機(jī),諸 如膝上型計(jì)算機(jī)、桌面型計(jì)算機(jī)、工作站、個(gè)人數(shù)字助理、服務(wù)器、刀片服務(wù)器、主機(jī)和其他 適當(dāng)?shù)挠?jì)算機(jī)。計(jì)算設(shè)備1050旨在表示各種形式的移動(dòng)設(shè)備,諸如個(gè)人數(shù)字助理、蜂窩電 話、智能電話和其他相似的計(jì)算設(shè)備。此外,計(jì)算設(shè)備1000或1050可以包括通用串行總線 (USB)閃速驅(qū)動(dòng)器。USB閃速驅(qū)動(dòng)器可以存儲(chǔ)操作系統(tǒng)和其他應(yīng)用。USB閃速驅(qū)動(dòng)器可以包 括輸入/輸出組件,諸如無(wú)線傳送器或USB連接器,其可以被插入到另一計(jì)算設(shè)備的USB端 口。這里示出的組件、它們的連接和關(guān)系以及它們的功能僅是示例性的,并非限制本文中描 述和/或要求保護(hù)的本發(fā)明的實(shí)現(xiàn)方式。計(jì)算設(shè)備1000包括處理器1002、存儲(chǔ)器1004、存儲(chǔ)設(shè)備1006、連接到存儲(chǔ)器1004 和高速擴(kuò)展端口 1010的高速接口 1008以及連接到低速總線1014和存儲(chǔ)設(shè)備1006的低速 接口 1012。每個(gè)組件1002、1004、1006、1008、1010和1012使用各種總線互連,并且可以安 裝在公共主板上或者以其他適當(dāng)?shù)姆绞桨惭b。處理器1002可以處理用于在計(jì)算設(shè)備1000 中執(zhí)行的指令,包括存儲(chǔ)在存儲(chǔ)器1004中或者存儲(chǔ)設(shè)備1006上的指令,以在諸如耦合到高 速接口 1008的顯示器1016的外部輸入/輸出設(shè)備上顯示關(guān)于⑶I的圖形信息。在其他實(shí) 現(xiàn)方式中,可以適當(dāng)?shù)厥褂枚鄠€(gè)處理器和/或多個(gè)總線以及多個(gè)存儲(chǔ)器和存儲(chǔ)器類(lèi)型。而 且,可以連接多個(gè)計(jì)算設(shè)備1000,每個(gè)設(shè)備提供必要的操作的一部分(例如,作為服務(wù)器陣 列、刀片服務(wù)器組或者多處理器系統(tǒng))。存儲(chǔ)器1004存儲(chǔ)計(jì)算設(shè)備1000中的信息。在一個(gè)實(shí)現(xiàn)方式中,存儲(chǔ)器1004是易 失性存儲(chǔ)器單元。在另一實(shí)現(xiàn)方式中,存儲(chǔ)器1004是非易失性存儲(chǔ)器單元。存儲(chǔ)器1004 還可以是另一種形式的計(jì)算機(jī)可讀介質(zhì),諸如磁盤(pán)或光盤(pán)。存儲(chǔ)設(shè)備1006能夠提供用于計(jì)算設(shè)備1000的大容量存儲(chǔ)。在一個(gè)實(shí)現(xiàn)方式中, 存儲(chǔ)設(shè)備1006可以是或者包含計(jì)算機(jī)可讀介質(zhì),諸如軟盤(pán)設(shè)備、硬盤(pán)設(shè)備、光盤(pán)設(shè)備、或者 帶設(shè)備、閃速存儲(chǔ)器或者其他相似的固態(tài)存儲(chǔ)器設(shè)備,或者設(shè)備的陣列,包括存儲(chǔ)區(qū)域網(wǎng)絡(luò) 或者其他配置中的設(shè)備。計(jì)算機(jī)程序產(chǎn)品可以有形地實(shí)現(xiàn)在信息載體中。計(jì)算機(jī)程序產(chǎn)品 也可以包含指令,當(dāng)其被執(zhí)行時(shí),執(zhí)行諸如上文描述的一個(gè)或多個(gè)方法。信息載體是計(jì)算機(jī) 或機(jī)器可讀介質(zhì),諸如存儲(chǔ)器1004、存儲(chǔ)設(shè)備1006或者處理器1002上的存儲(chǔ)器。高速控制器1008管理關(guān)于計(jì)算設(shè)備1000的帶寬密集操作,而低速控制器1012管 理較低帶寬密集操作,該功能分配僅是示例性的。在一個(gè)實(shí)現(xiàn)方式中,高速控制器1008耦 合到存儲(chǔ)器1004、顯示器1016(例如,通過(guò)圖形處理器或加速器),并且耦合到高速擴(kuò)展端 口 1010,其可以接受各種擴(kuò)展卡(未示出)。在實(shí)現(xiàn)方式中,低速控制器1012耦合到存儲(chǔ) 設(shè)備1006和低速擴(kuò)展端口 1014。低速擴(kuò)展端口可以包括各種通信端口(例如,USB、藍(lán)牙、 以太網(wǎng)、無(wú)線以太網(wǎng)),可以耦合到一個(gè)或多個(gè)輸入/輸出設(shè)備,諸如鍵盤(pán)、指針設(shè)備、掃描 儀或者例如通過(guò)網(wǎng)絡(luò)適配器耦合到諸如交換機(jī)或路由器的聯(lián)網(wǎng)設(shè)備。如圖中所示,計(jì)算設(shè)備1000可以以許多不同的形式實(shí)現(xiàn)。例如,其可以被實(shí)現(xiàn)為 標(biāo)準(zhǔn)服務(wù)器1020,或者更多時(shí)間實(shí)現(xiàn)在這樣的服務(wù)器的組中。其還可以被實(shí)現(xiàn)為機(jī)架式服務(wù)器系統(tǒng)IOM的一部分。此外,其可以被實(shí)現(xiàn)為諸如膝上型計(jì)算機(jī)1022的個(gè)人計(jì)算機(jī)。替 選地,來(lái)自計(jì)算設(shè)備1000的組件可以與諸如設(shè)備1050的移動(dòng)設(shè)備(未示出)中的其他組 件組合。每個(gè)這樣的設(shè)備可以包含一個(gè)或多個(gè)計(jì)算設(shè)備1000、1050,并且整個(gè)系統(tǒng)可以由彼 此通信的多個(gè)計(jì)算設(shè)備1000、1050構(gòu)成。除其他組件之外,計(jì)算設(shè)備1050包括處理器1052、存儲(chǔ)器1064、諸如顯示器IOM 的輸入/輸出設(shè)備、通信接口 1066和收發(fā)器1068。設(shè)備1050還可以提供有諸如微驅(qū)動(dòng)器 或其他設(shè)備的存儲(chǔ)設(shè)備以提供額外的存儲(chǔ)。每個(gè)組件1050、1052、1064、1054、1066和1068 使用各種總線互連,并且若干個(gè)組件可以安裝在公共主板上或者以其他適當(dāng)?shù)姆绞桨惭b。處理器1052可以執(zhí)行計(jì)算設(shè)備1050中的指令,包括存儲(chǔ)在存儲(chǔ)器1064中的指 令。處理器可以被實(shí)現(xiàn)為包括分立的多個(gè)模擬和數(shù)字處理器的芯片的芯片組。此外,處理 器可以使用許多架構(gòu)中的任何架構(gòu)實(shí)現(xiàn)。例如,處理器410可以是CISC(復(fù)雜指令集計(jì)算 機(jī))處理器、RISC (簡(jiǎn)化指令集計(jì)算機(jī))處理器或者M(jìn)ISC (最小指令集計(jì)算機(jī))處理器。處 理器可以提供例如設(shè)備1050的其他組件的協(xié)調(diào),諸如用戶(hù)接口的控制、設(shè)備1050運(yùn)行的應(yīng) 用以及設(shè)備1050的無(wú)線通信。處理器1052可以通過(guò)耦合到顯示器IOM的控制接口 1058和顯示接口 1056與用 戶(hù)通信。顯示器IOM可以是例如TFT(薄膜晶體管液晶顯示器)顯示器或者0LED(有機(jī)發(fā) 光二極管)顯示器或者其他適當(dāng)?shù)娘@示技術(shù)。顯示接口 1056可以包括用于驅(qū)動(dòng)顯示器IOM 將圖形和其他信息呈現(xiàn)給用戶(hù)的適當(dāng)?shù)碾娐???刂平涌?1058可以從用戶(hù)接收命令并且對(duì) 它們進(jìn)行轉(zhuǎn)換以提交給處理器1052。此外,外部接口 1062可以被提供為與處理器1052通 信,以便于使設(shè)備1050能夠與其他設(shè)備進(jìn)行近程通信。例如,在一些實(shí)現(xiàn)方式中外部接口 1062可以提供有線通信,或者在其他實(shí)現(xiàn)方式中提供無(wú)線通信,并且多個(gè)接口也可以被使 用。存儲(chǔ)器1064存儲(chǔ)計(jì)算設(shè)備1050中的信息。存儲(chǔ)器1064可以被實(shí)現(xiàn)為一個(gè)或 多個(gè)計(jì)算機(jī)可讀介質(zhì)、易失性存儲(chǔ)器單元或者非易失性存儲(chǔ)器單元。還可以提供擴(kuò)展存 儲(chǔ)器1074并且通過(guò)擴(kuò)展接口 1072將其連接到設(shè)備1050,該擴(kuò)展接口 1072可以包括例如 SIMM (單列直插存儲(chǔ)器模塊)卡接口。該擴(kuò)展存儲(chǔ)器1074可以提供用于設(shè)備1050的額外的 存儲(chǔ)空間,或者也可以存儲(chǔ)用于設(shè)備1050的應(yīng)用或者其他信息。具體地,擴(kuò)展存儲(chǔ)器1074 可以包括用于執(zhí)行或補(bǔ)充上述過(guò)程的指令,并且還可以包括安全信息。因此,例如,擴(kuò)展存 儲(chǔ)器1074可以被提供為用于設(shè)備1050的安全模塊,并且可以通過(guò)允許設(shè)備1050的安全使 用的指令進(jìn)行編程。此外,可以經(jīng)由SIMM卡與另外的信息一起提供安全應(yīng)用,諸如以不可 破解的方式將識(shí)別信息置于SIMM卡上。存儲(chǔ)器可以包括例如如下文討論的閃速存儲(chǔ)器和/或NVRAM存儲(chǔ)器。在一個(gè)實(shí)現(xiàn) 方式中,計(jì)算機(jī)程序產(chǎn)品被有形地實(shí)現(xiàn)在信息載體中。計(jì)算機(jī)程序產(chǎn)品包含指令,當(dāng)其被執(zhí) 行時(shí),執(zhí)行諸如上文描述的一個(gè)或多個(gè)方法。信息載體是計(jì)算機(jī)或機(jī)器可讀介質(zhì),諸如存儲(chǔ) 器1064、擴(kuò)展存儲(chǔ)器1074或者處理器1052上的存儲(chǔ)器。設(shè)備1050可以通過(guò)在必要時(shí)包括數(shù)字信號(hào)處理電路的通信接口 1066無(wú)線通信。 通信接口 1066可以提供各種模式或協(xié)議下的通信,諸如GSM語(yǔ)音呼叫,SMS、EMS、或者M(jìn)MS 消息傳遞,CDMA、TDMA, PDC、WCDMA, CDMA 2000或GPRS等。該通信可以例如通過(guò)射頻收發(fā) 器1068進(jìn)行。此外,短程通信可以諸如使用藍(lán)牙、WiFi或者其他這種收發(fā)器(未示出)進(jìn)行。此外,GPS(全球定位系統(tǒng))接收器模塊1070可以向設(shè)備1050提供額外的導(dǎo)航和位置 相關(guān)的無(wú)線數(shù)據(jù),其可以由在設(shè)備1050上運(yùn)行的應(yīng)用適當(dāng)?shù)厥褂谩TO(shè)備1050還可以使用音頻編解碼器1060進(jìn)行可聽(tīng)通信,該音頻編解碼器1060可 以接收從用戶(hù)說(shuō)出的信息并且將其轉(zhuǎn)換為可使用的數(shù)字信息。音頻編解碼器1060同樣可 以諸如通過(guò)例如設(shè)備1050的聽(tīng)筒中的揚(yáng)聲器為用戶(hù)生成可聽(tīng)聲音。該聲音可以包括來(lái)自 語(yǔ)音電話呼叫的聲音,可以包括記錄的聲音(例如,語(yǔ)音消息、音樂(lè)文件等)并且還可以包 括由在設(shè)備1050上操作的應(yīng)用生成的聲音。如圖中所示,計(jì)算設(shè)備1050可以以許多不同的形式實(shí)現(xiàn)。例如,其可以被實(shí)現(xiàn)為 蜂窩電話1080。其還可以被實(shí)現(xiàn)為智能電話1082、個(gè)人數(shù)字助理或者其他相似的移動(dòng)設(shè)備 的一部分。這里描述的系統(tǒng)和技術(shù)的各種實(shí)現(xiàn)方式可以在數(shù)字電子電路、集成電路、專(zhuān)門(mén)設(shè) 計(jì)的ASIC(專(zhuān)用集成電路)、計(jì)算機(jī)硬件、固件、軟件和/或它們的組合中實(shí)現(xiàn)。這些各種實(shí) 現(xiàn)方式可以包括一個(gè)或多個(gè)計(jì)算機(jī)程序中的實(shí)現(xiàn)方式,該計(jì)算機(jī)程序可以在包括至少一個(gè) 可編程處理器的可編程系統(tǒng)上執(zhí)行和/或解釋?zhuān)摽删幊烫幚砥魇菍?zhuān)用的或通用的,被耦 合為從存儲(chǔ)系統(tǒng)、至少一個(gè)輸入設(shè)備和至少一個(gè)輸出設(shè)備接收數(shù)據(jù)和指令以及向其傳送數(shù) 據(jù)和指令。這些計(jì)算機(jī)程序(還被稱(chēng)為程序、軟件、軟件應(yīng)用或者代碼)包括用于可編程處理 器的機(jī)器指令,并且可以在高級(jí)程序和/或面向?qū)ο蟮木幊陶Z(yǔ)言中和/或在匯編/機(jī)器語(yǔ) 言中實(shí)現(xiàn)。如這里使用的,術(shù)語(yǔ)“機(jī)器可讀介質(zhì)”、“計(jì)算機(jī)可讀介質(zhì)”指的是用于向可編程處 理器提供機(jī)器指令和/或數(shù)據(jù)的任何計(jì)算機(jī)程序產(chǎn)品、裝置和/或設(shè)備(例如,磁盤(pán)、光盤(pán)、 存儲(chǔ)器、可編程邏輯器件(PLD)),包括接收機(jī)器指令作為機(jī)器可讀信號(hào)的機(jī)器可讀介質(zhì)。術(shù) 語(yǔ)“機(jī)器可讀信號(hào)”指的是用于向可編程處理器提供機(jī)器指令和/或數(shù)據(jù)的任何信號(hào)。為了提供與用戶(hù)的交互,這里描述的系統(tǒng)和技術(shù)可以在具有用于向用戶(hù)顯示信息 的顯示設(shè)備(例如,CRT(陰極射線管)或LCD(液晶顯示器)監(jiān)視器)和用戶(hù)可以通過(guò)其 向計(jì)算機(jī)提供輸入的鍵盤(pán)以及指針設(shè)備(例如,鼠標(biāo)或軌跡球)。其他類(lèi)別的設(shè)備也可以用 于提供與用戶(hù)的交互;例如,提供給用戶(hù)的反饋可以是任何形式的感知反饋(例如,視覺(jué)反 饋、聽(tīng)覺(jué)反饋或者觸覺(jué)反饋);并且來(lái)自用戶(hù)的輸入可以以任何形式接收,包括聲音、語(yǔ)音 或觸覺(jué)輸入。這里描述的系統(tǒng)和技術(shù)可以在如下計(jì)算系統(tǒng)中實(shí)現(xiàn),其包括后端組件(例如,作 為數(shù)據(jù)服務(wù)器),或者包括中間件組件(例如,應(yīng)用服務(wù)器),或者包括前端組件(例如,具 有圖形用戶(hù)接口或Web瀏覽器的客戶(hù)端計(jì)算機(jī),用戶(hù)可以通過(guò)該圖形用戶(hù)接口或Web瀏覽 器與這里描述的系統(tǒng)和技術(shù)的實(shí)現(xiàn)方式交互),或者該后端、中間件或前端組件的任何組 合。系統(tǒng)的各個(gè)組件可以通過(guò)任何形式或介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信(例如,通信網(wǎng)絡(luò))來(lái)互連。 通信網(wǎng)絡(luò)的示例包括局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、對(duì)等網(wǎng)絡(luò)(具有自組織或靜態(tài)成員)、柵 格計(jì)算基礎(chǔ)設(shè)施和互聯(lián)網(wǎng)。該計(jì)算系統(tǒng)可以包括客戶(hù)端和服務(wù)器??蛻?hù)端和服務(wù)器通常彼此遠(yuǎn)離并且典型地 通過(guò)通信網(wǎng)絡(luò)交互??蛻?hù)端和服務(wù)器的關(guān)系依靠在各個(gè)計(jì)算機(jī)上運(yùn)行的并且彼此具有客戶(hù) 端-服務(wù)器關(guān)系的計(jì)算機(jī)程序而產(chǎn)生。已描述了本發(fā)明的許多實(shí)施例。然而,將理解,在不偏離本發(fā)明的精神和范圍的情況下可以進(jìn)行各種修改。例如,多個(gè)SRS的組合或聯(lián)合置信度分值可以包括諸如關(guān)于話語(yǔ) 的識(shí)別的假設(shè)或猜想的一致性的特征。例如,輸出具有置信度0. 8的第一結(jié)果的三個(gè)SRS 可能比輸出具有置信度0. 9的第二結(jié)果的一個(gè)SRS更加可靠。在一些實(shí)現(xiàn)方式中,可以基于延時(shí)或其他因素選擇使用預(yù)定SRS集合。例如,如果 響應(yīng)于提示用戶(hù)回答是或否的問(wèn)題而接收到音頻,則最快的兩個(gè)SRS可以被選擇為處理答 案而非允許所有可用的SRS處理答案。此外,在一些實(shí)現(xiàn)方式中,當(dāng)SRS生成的各識(shí)別結(jié)果不一致時(shí),最終識(shí)別結(jié)果的整 體置信度可能下降。在識(shí)別結(jié)果未完全重疊時(shí)用于選擇“最佳”當(dāng)前結(jié)果的一個(gè)示例算法 是選擇具有最高單獨(dú)置信度的識(shí)別結(jié)果。在該示例中,當(dāng)系統(tǒng)具有相似的不重疊條件和相 似的給定置信度值時(shí),組合置信度將是在訓(xùn)練期間計(jì)數(shù)的正確的識(shí)別結(jié)果的期望數(shù)值。對(duì) 于識(shí)別結(jié)果中的給定量的部分重疊,還可以估計(jì)相似的計(jì)數(shù)和統(tǒng)計(jì)。因此,由于/如果重疊 程度與訓(xùn)練期間的較少的整體識(shí)別錯(cuò)誤相關(guān),整體系統(tǒng)可以向部分重疊的識(shí)別結(jié)果的組合 分配較高的置信度值。例如,可以通過(guò)對(duì)步驟重新排序、添加步驟或者移除步驟來(lái)使用上文示出的各種 形式的流程。而且,盡管已描述了在語(yǔ)音解碼中使用多個(gè)語(yǔ)音識(shí)別系統(tǒng)的若干個(gè)應(yīng)用和方 法,但是應(yīng)當(dāng)認(rèn)識(shí)到,許多其他應(yīng)用也在考慮范圍內(nèi)。因此,其他實(shí)施例在所附權(quán)利要求的 范圍內(nèi)。
權(quán)利要求
1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括接收音頻信號(hào);發(fā)起由多個(gè)語(yǔ)音識(shí)別系統(tǒng)SRS進(jìn)行的語(yǔ)音識(shí)別任務(wù),每個(gè)SRS被配置為生成指定所述 音頻信號(hào)中包括的可能語(yǔ)音的識(shí)別結(jié)果和指示所述識(shí)別結(jié)果的正確性的置信度的置信度 值;完成所述語(yǔ)音識(shí)別任務(wù)的一部分,包括生成一個(gè)或多個(gè)識(shí)別結(jié)果和關(guān)于所述一個(gè)或多 個(gè)識(shí)別結(jié)果的一個(gè)或多個(gè)置信度值;確定所述一個(gè)或多個(gè)置信度值是否滿(mǎn)足置信度閾值;中止未完成的SRS的語(yǔ)音識(shí)別任務(wù)的剩余部分;以及基于所生成的一個(gè)或多個(gè)識(shí)別結(jié)果中的至少一個(gè)輸出最終識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括如果語(yǔ)音識(shí)別任務(wù)超過(guò)指定完成所述語(yǔ) 音識(shí)別任務(wù)所允許的最大時(shí)間段的延時(shí)閾值,則中止所述語(yǔ)音識(shí)別任務(wù)。
3.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括如果完成的語(yǔ)音識(shí)別任務(wù)與所生成的識(shí) 別結(jié)果中的低置信度值相關(guān)聯(lián),則中止未完成的語(yǔ)音識(shí)別任務(wù)。
4.根據(jù)權(quán)利要求1所述的方法,其中所述SRS中的至少一個(gè)生成多個(gè)識(shí)別結(jié)果。
5.根據(jù)權(quán)利要求4所述的方法,進(jìn)一步包括基于與所述多個(gè)識(shí)別結(jié)果中的前N個(gè)識(shí) 別結(jié)果相關(guān)聯(lián)的置信度值,對(duì)所述前N個(gè)識(shí)別結(jié)果排名,其中N表示任何正整數(shù)。
6.根據(jù)權(quán)利要求5所述的方法,進(jìn)一步包括基于由不同的SRS生成的置信度值確定 與所述前N個(gè)識(shí)別結(jié)果相關(guān)聯(lián)的置信度值的滑動(dòng)平均值。
7.根據(jù)權(quán)利要求6所述的方法,基于哪個(gè)識(shí)別結(jié)果與最高整體置信度值相關(guān)聯(lián)來(lái)從所 述前N個(gè)結(jié)果中選擇所述最終識(shí)別結(jié)果。
8.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括基于哪個(gè)識(shí)別結(jié)果與最大置信度值相關(guān) 聯(lián)來(lái)選擇所述最終識(shí)別結(jié)果。
9.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括基于生成所述最終識(shí)別結(jié)果的SRS的數(shù) 量和與所述最終識(shí)別結(jié)果相關(guān)聯(lián)的置信度值來(lái)選擇所述最終識(shí)別結(jié)果。
10.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括基于關(guān)于所述多個(gè)SRS中的一個(gè)或多個(gè) 的可靠性的信息和與所述識(shí)別結(jié)果相關(guān)聯(lián)的置信度值來(lái)選擇所述最終識(shí)別結(jié)果。
11.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括如果超過(guò)最大時(shí)間段,則中止由所述多 個(gè)SRS進(jìn)行的所有語(yǔ)音識(shí)別任務(wù)。
12.根據(jù)權(quán)利要求11所述的方法,進(jìn)一步包括提示用戶(hù)重復(fù)話語(yǔ)。
13.根據(jù)權(quán)利要求11所述的方法,進(jìn)一步包括傳送人類(lèi)操作員接收所述音頻信號(hào)的 請(qǐng)求。
14.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括基于正態(tài)化比例上的置信度值的分布來(lái) 選擇所述最終識(shí)別結(jié)果。
15.根據(jù)權(quán)利要求14所述的方法,進(jìn)一步包括如果識(shí)別結(jié)果與高置信度值相關(guān)聯(lián)并 且其他識(shí)別結(jié)果中的至少一部分在低置信度值的相對(duì)小的范圍內(nèi)聚類(lèi)在一起,則將所述識(shí) 別結(jié)果選擇為所述最終識(shí)別結(jié)果。
16.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括在選擇所述最終識(shí)別結(jié)果時(shí)基于生成特 定識(shí)別結(jié)果的SRS之間的相關(guān)性來(lái)對(duì)所述特定識(shí)別結(jié)果加權(quán)。
17.根據(jù)權(quán)利要求1所述的方法,其中所述SRS中的至少一部分包括不同的語(yǔ)言模型和聲學(xué)模型。
18.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括如果所述一個(gè)或多個(gè)置信度值滿(mǎn)足置信 度閾值,則暫停未完成的SRS的所述語(yǔ)音識(shí)別任務(wù)的剩余部分。
19.根據(jù)權(quán)利要求18所述的方法,進(jìn)一步包括如果接收到所述最終識(shí)別結(jié)果不正確 的指示,則恢復(fù)所暫停的所述語(yǔ)音識(shí)別任務(wù)的剩余部分。
20.一種系統(tǒng),包括多個(gè)語(yǔ)音識(shí)別系統(tǒng),其發(fā)起用于識(shí)別編碼在接收到的音頻信號(hào)中的可能語(yǔ)音的語(yǔ)音識(shí) 別任務(wù),每個(gè)語(yǔ)音識(shí)別系統(tǒng)SRS被配置為生成識(shí)別結(jié)果和指示所述識(shí)別結(jié)果的正確性的置 信度的置信度值;識(shí)別管理模塊,用于在所述SRS生成識(shí)別結(jié)果時(shí)接收所述識(shí)別結(jié)果并且接收與所生成 的識(shí)別結(jié)果相關(guān)聯(lián)的置信度值,其中如果所接收到的置信度值中的一個(gè)或多個(gè)滿(mǎn)足置信度 閾值,則所述識(shí)別管理模塊中止由未完成生成識(shí)別結(jié)果的SRS進(jìn)行的未完成的語(yǔ)音識(shí)別任 務(wù);以及接口,用于傳送基于所生成的識(shí)別結(jié)果的置信度值選擇的最終識(shí)別結(jié)果。
21.—種系統(tǒng),包括多個(gè)語(yǔ)音識(shí)別系統(tǒng),其發(fā)起對(duì)接收到的音頻信號(hào)的語(yǔ)音識(shí)別任務(wù),每個(gè)語(yǔ)音識(shí)別系統(tǒng) SRS被配置為生成識(shí)別所述音頻信號(hào)中的可能語(yǔ)音的識(shí)別結(jié)果和指示所述識(shí)別結(jié)果的正確 性的置信度的置信度值;用于以下的裝置在每個(gè)SRS生成一個(gè)或多個(gè)識(shí)別結(jié)果時(shí)從所述SRS接收所述一個(gè)或 多個(gè)識(shí)別結(jié)果和一個(gè)或多個(gè)相應(yīng)的置信度值,如果所接收到的置信度值中的一個(gè)或多個(gè)滿(mǎn) 足置信度閾值,則中止由未完成生成識(shí)別結(jié)果的SRS進(jìn)行的未完成的語(yǔ)音識(shí)別任務(wù),并且 基于所生成的識(shí)別結(jié)果的置信度值選擇最終識(shí)別結(jié)果;以及接口,用于傳送表示所述音頻信號(hào)中的可能語(yǔ)音的最終識(shí)別結(jié)果。
全文摘要
除其他之外,本說(shuō)明書(shū)的主題可以具體化為一種方法,其包括接收音頻信號(hào)并且發(fā)起多個(gè)語(yǔ)音識(shí)別系統(tǒng)(SRS)的語(yǔ)音識(shí)別任務(wù)。每個(gè)SRS被配置為生成指定音頻信號(hào)中包括的可能語(yǔ)音的識(shí)別結(jié)果和指示語(yǔ)音結(jié)果的正確性的置信度的置信度值。該方法還包括完成語(yǔ)音識(shí)別任務(wù)的一部分,包括生成一個(gè)或多個(gè)識(shí)別結(jié)果和關(guān)于一個(gè)或多個(gè)識(shí)別結(jié)果的一個(gè)或多個(gè)置信度值,確定一個(gè)或多個(gè)置信度值是否滿(mǎn)足置信度閾值,中止未完成生成識(shí)別結(jié)果的SRS的剩余部分的語(yǔ)音識(shí)別任務(wù),并且基于所生成的一個(gè)或多個(gè)語(yǔ)音結(jié)果中的至少一個(gè)輸出最終識(shí)別結(jié)果。
文檔編號(hào)G10L15/00GK102138175SQ200980134034
公開(kāi)日2011年7月27日 申請(qǐng)日期2009年7月2日 優(yōu)先權(quán)日2008年7月2日
發(fā)明者奧利維爾·西奧漢, 布萊恩·斯特羅普, 弗朗索瓦絲·博費(fèi) 申請(qǐng)人:谷歌公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
陵川县| 桂阳县| 柳江县| 榆林市| 贵港市| 怀宁县| 万盛区| 嘉义市| 大港区| 两当县| 乾安县| 彭泽县| 晋江市| 定远县| 兴仁县| 潜江市| 高邮市| 禄劝| 长沙市| 波密县| 汾西县| 荥经县| 曲麻莱县| 上高县| 龙江县| 利津县| 衡山县| 淅川县| 信阳市| 兴和县| 花莲市| 根河市| 文昌市| 休宁县| 马龙县| 衢州市| 连平县| 伊宁市| 沛县| 舒城县| 衡东县|