欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種關(guān)鍵詞檢測方法和裝置制造方法

文檔序號:2826140閱讀:252來源:國知局
一種關(guān)鍵詞檢測方法和裝置制造方法
【專利摘要】本發(fā)明實(shí)施方式提出了一種關(guān)鍵詞檢測方法和裝置。方法包括:生成包含語種信息的解碼網(wǎng)絡(luò),在該解碼網(wǎng)絡(luò)中根據(jù)語種信息對關(guān)鍵詞進(jìn)行分組;利用所述解碼網(wǎng)絡(luò)對輸入語音進(jìn)行關(guān)鍵詞檢測,其中當(dāng)檢測出的關(guān)鍵詞之間的語種信息不一致時(shí),對所檢測出關(guān)鍵詞設(shè)置懲罰因子;基于懲罰因子評估所檢測出的關(guān)鍵詞。本發(fā)明實(shí)施方式有效規(guī)避了語種識別可能對關(guān)鍵詞檢測帶來的影響,使得在多語種混雜的語音句子中檢測關(guān)鍵詞成為可能,而且只需要單一的檢測引擎就可以完成多語種的關(guān)鍵詞檢測任務(wù)。
【專利說明】一種關(guān)鍵詞檢測方法和裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明實(shí)施方式涉及語音處理【技術(shù)領(lǐng)域】,更具體地,涉及一種關(guān)鍵詞檢測方法和 裝直。

【背景技術(shù)】
[0002] 關(guān)鍵詞檢測是從語音流中定位給定關(guān)鍵詞的起止時(shí)間點(diǎn)的過程,其中關(guān)鍵詞是能 夠表達(dá)某種實(shí)質(zhì)意義的詞語,一般為名詞或短語。現(xiàn)有的關(guān)鍵詞檢測系統(tǒng)框架一般可以分 為兩類,一類是基于垃圾網(wǎng)絡(luò)的系統(tǒng),一類是基于音素或音節(jié)識別器的系統(tǒng)。
[0003] 在基于垃圾網(wǎng)絡(luò)的系統(tǒng)中,解碼器的搜索空間由關(guān)鍵詞和補(bǔ)白音節(jié)組成的網(wǎng)絡(luò)構(gòu) 成。當(dāng)一段語音進(jìn)入網(wǎng)絡(luò)后,有些部分被識別成關(guān)鍵詞,其他部分被識別成補(bǔ)白音節(jié),然后 用置信度判決模塊對識別出的關(guān)鍵詞進(jìn)行判決,最后輸出被接受的關(guān)鍵詞及其在語音中的 位置信息。在基于音素或音節(jié)識別器的系統(tǒng)中,對輸入語音進(jìn)行全文識別,輸出音素或音節(jié) 網(wǎng)絡(luò),然后利用文本檢索技術(shù)在網(wǎng)絡(luò)中檢測給定的關(guān)鍵詞。
[0004] 在目前處理多語種關(guān)鍵詞檢測任務(wù)時(shí),通常的做法是把該關(guān)鍵詞檢測任務(wù)分成兩 個(gè)獨(dú)立的階段進(jìn)行。當(dāng)一段語音被輸入后,首先對語音進(jìn)行語種識別,然后根據(jù)語種識別結(jié) 果把語音送入與該語種相對應(yīng)的關(guān)鍵詞檢測引擎中進(jìn)行關(guān)鍵詞檢測,最后把所有結(jié)果匯總 起來作為最終的檢測結(jié)果。
[0005] 然而,在現(xiàn)有的多語種關(guān)鍵詞檢測技術(shù)中,語種識別的準(zhǔn)確率直接會(huì)影響到后續(xù) 關(guān)鍵詞檢測的效果。而且,由于語種識別一般需要至少一定長度的音頻(如3?5秒),在實(shí) 際應(yīng)用中會(huì)對流式關(guān)鍵詞檢測帶來一定的障礙。另外,現(xiàn)有技術(shù)的關(guān)鍵詞檢測技術(shù)無法解 決多語種混雜的情況,如"昨晚的演唱會(huì)high不high"則無法準(zhǔn)確識別語種和關(guān)鍵詞。


【發(fā)明內(nèi)容】

[0006] 本發(fā)明實(shí)施方式提出一種關(guān)鍵詞檢測方法,以完成多語種的關(guān)鍵詞檢測任務(wù)。
[0007] 本發(fā)明實(shí)施方式還提出了一種關(guān)鍵詞檢測方法裝置,以完成多語種的關(guān)鍵詞檢測 任務(wù)。
[0008] 本發(fā)明實(shí)施方式的技術(shù)方案如下:
[0009] -種關(guān)鍵詞檢測方法,該方法包括:
[0010] 生成包含語種信息的解碼網(wǎng)絡(luò),在該解碼網(wǎng)絡(luò)中根據(jù)語種信息對關(guān)鍵詞進(jìn)行分 組;
[0011] 利用所述解碼網(wǎng)絡(luò)對輸入語音進(jìn)行關(guān)鍵詞檢測,其中當(dāng)檢測出的關(guān)鍵詞之間的語 種信息不一致時(shí),對所檢測出關(guān)鍵詞設(shè)置懲罰因子;
[0012] 基于懲罰因子評估所檢測出的關(guān)鍵詞。
[0013] 一種關(guān)鍵詞檢測裝置,包括解碼網(wǎng)絡(luò)生成單元、關(guān)鍵詞檢測單元和關(guān)鍵詞評估單 元,其中:
[0014] 解碼網(wǎng)絡(luò)生成單元,用于生成包含語種信息的解碼網(wǎng)絡(luò),在該解碼網(wǎng)絡(luò)中根據(jù)語 種信息對關(guān)鍵詞進(jìn)行分組;
[0015] 關(guān)鍵詞檢測單元,用于利用所述解碼網(wǎng)絡(luò)對輸入語音進(jìn)行關(guān)鍵詞檢測,其中當(dāng)檢 測出的關(guān)鍵詞之間的語種信息不一致時(shí),對所檢測出關(guān)鍵詞設(shè)置懲罰因子;
[0016] 關(guān)鍵詞評估單元,用于基于懲罰因子評估所檢測出的關(guān)鍵詞。
[0017] 從上述技術(shù)方案可以看出,在本發(fā)明實(shí)施方式中,生成包含語種信息的解碼網(wǎng)絡(luò), 在該解碼網(wǎng)絡(luò)中根據(jù)語種信息對關(guān)鍵詞進(jìn)行分組;利用所述解碼網(wǎng)絡(luò)對輸入語音進(jìn)行關(guān) 鍵詞檢測,其中當(dāng)檢測出的關(guān)鍵詞之間的語種信息不一致時(shí),對所檢測出關(guān)鍵詞設(shè)置懲罰 因子;基于懲罰因子評估所檢測出的關(guān)鍵詞。由此可見,應(yīng)用本發(fā)明實(shí)施方式之后,將語種 信息直接構(gòu)造在解碼網(wǎng)絡(luò)中,利用語種信息對不同語種的關(guān)鍵詞進(jìn)行分組,有效規(guī)避了語 種識別可能對關(guān)鍵詞檢測帶來的影響,也使在多語種混雜的語音句子中檢測關(guān)鍵詞成為可 能。
[0018] 另外,本發(fā)明實(shí)施方式在解碼過程中,通過對語種信息的判斷來調(diào)整令牌的得分, 并引入了語種轉(zhuǎn)換的懲罰函數(shù),只需要單一的檢測引擎就可以完成多語種的關(guān)鍵詞檢測任 務(wù)。

【專利附圖】

【附圖說明】
[0019] 圖1為現(xiàn)有技術(shù)中解碼網(wǎng)絡(luò)示意圖;
[0020] 圖2為根據(jù)本發(fā)明實(shí)施方式關(guān)鍵詞檢測方法流程圖;
[0021] 圖3為根據(jù)本發(fā)明實(shí)施方式解碼網(wǎng)絡(luò)示意圖;
[0022] 圖4為根據(jù)本發(fā)明實(shí)施方式關(guān)鍵詞檢測裝置結(jié)構(gòu)圖。

【具體實(shí)施方式】
[0023] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖對本發(fā)明作進(jìn)一步 的詳細(xì)描述。
[0024] 圖1為現(xiàn)有技術(shù)中解碼網(wǎng)絡(luò)示意圖。
[0025] 由圖1可見,在現(xiàn)有技術(shù)基于垃圾網(wǎng)絡(luò)的關(guān)鍵詞檢測系統(tǒng)使用的解碼網(wǎng)絡(luò)中,關(guān) 鍵詞和填充音節(jié)需要進(jìn)一步做聲學(xué)上下文展開,最終的解碼空間以HMM狀態(tài)為圖節(jié)點(diǎn)。關(guān) 鍵詞使用較精細(xì)的聲學(xué)模型描述,一般使用上下文相關(guān)的三音子HMM建模,這些模型被成 為前景模型;填充音節(jié)代表語音段中的非關(guān)鍵詞部分,一般使用較粗的聲學(xué)模型,如聚類后 的音素語言模型,這些模型被稱為背景模型。
[0026] 然而,在現(xiàn)有的多語種關(guān)鍵詞檢測技術(shù)中,由于語種識別一般需要至少一定長度 的音頻(如3?5秒),在實(shí)際應(yīng)用中會(huì)對流式關(guān)鍵詞檢測帶來一定的障礙。另外,現(xiàn)有技術(shù) 的關(guān)鍵詞檢測技術(shù)無法解決多語種混雜的情況。
[0027] 在本發(fā)明實(shí)施方式中,基于垃圾網(wǎng)絡(luò)的框架基礎(chǔ)上提出了一種新的關(guān)鍵詞檢測 方案。在本發(fā)明實(shí)施方式構(gòu)造解碼空間時(shí),直接在解碼空間中嵌入語種信息,從而有效規(guī)避 了語種識別階段對流式檢測的影響;在本發(fā)明實(shí)施方式的解碼過程中,可以利用語種信息 對令牌傳遞策略進(jìn)行調(diào)整,只需要單一的檢測引擎就可以完成多語種的關(guān)鍵詞檢測任務(wù)。
[0028] 與現(xiàn)有的基于垃圾網(wǎng)絡(luò)的關(guān)鍵詞檢測系統(tǒng)相比,本發(fā)明提出的技術(shù)方案主要有兩 點(diǎn)改進(jìn):
[0029] (1)多語種解碼網(wǎng)絡(luò)的構(gòu)造,本發(fā)明在解碼網(wǎng)絡(luò)中嵌入語種信息;
[0030] (2)針對多語種解碼網(wǎng)絡(luò)的多語種關(guān)鍵詞檢測算法。在解碼過程中,通過對語種信 息的判斷來調(diào)整令牌的得分,并引入了語種轉(zhuǎn)換的懲罰函數(shù)。
[0031] 圖2為根據(jù)本發(fā)明實(shí)施方式關(guān)鍵詞檢測方法流程圖。
[0032] 如圖2所示,該方法包括:
[0033] 步驟201 :生成包含語種信息的解碼網(wǎng)絡(luò),在該解碼網(wǎng)絡(luò)中根據(jù)語種信息對關(guān)鍵 詞進(jìn)行分組。
[0034] 在這里,在生成解碼網(wǎng)絡(luò)的過程中,可以初始化開始節(jié)點(diǎn)和結(jié)束節(jié)點(diǎn),并針對每個(gè) 語種信息k執(zhí)行如下步驟,其中i為語種序號:
[0035] 構(gòu)造語種節(jié)點(diǎn)Nu,并構(gòu)造從開始節(jié)點(diǎn)到Nu的邊;
[0036] 加載與該語種信息Q對應(yīng)的關(guān)鍵詞列表和填充音節(jié)列表;
[0037] 對所述關(guān)鍵詞列表中的每一個(gè)關(guān)鍵詞I,其中j為關(guān)鍵詞序號,執(zhí)行如下動(dòng)作:
[0038] 將關(guān)鍵詞Κ」轉(zhuǎn)化成三音子序列,并針對每個(gè)三音子構(gòu)造一個(gè)節(jié)點(diǎn)以形成節(jié)點(diǎn)序 列;依次構(gòu)造節(jié)點(diǎn)序列之間的邊;構(gòu)造語種節(jié)點(diǎn)N u到節(jié)點(diǎn)序列中第一個(gè)節(jié)點(diǎn)的邊以及節(jié)點(diǎn) 序列中最后節(jié)點(diǎn)到結(jié)束節(jié)點(diǎn)的邊;
[0039] 對所述填充音節(jié)列表中的每個(gè)填充音節(jié)Fk,其中k為填充音節(jié)序號,執(zhí)行如下動(dòng) 作:
[0040] 構(gòu)造填充音節(jié)Fk對應(yīng)的節(jié)點(diǎn)Na;
[0041] 構(gòu)造語種節(jié)點(diǎn)Nu到NFk的邊和NFk到結(jié)束節(jié)點(diǎn)的邊;
[0042] 構(gòu)造從結(jié)束節(jié)點(diǎn)到開始節(jié)點(diǎn)的邊;
[0043] 輸出所述解碼網(wǎng)絡(luò)。
[0044] 步驟202 :利用所述解碼網(wǎng)絡(luò)對輸入語音進(jìn)行關(guān)鍵詞檢測,其中當(dāng)檢測出的關(guān)鍵 詞之間的語種信息不一致時(shí),對所檢測出關(guān)鍵詞設(shè)置懲罰因子。
[0045] 在一個(gè)實(shí)施方式中:
[0046] 在關(guān)鍵詞檢測的令牌傳播過程中,當(dāng)遇到語種狀態(tài)節(jié)點(diǎn)時(shí),比較該語種狀態(tài)節(jié)點(diǎn) 上的語種信息與令牌自帶的語種信息是否匹配,如果不匹配,則對該令牌得分設(shè)置懲罰因 子。
[0047] 更優(yōu)選地,預(yù)先設(shè)置對應(yīng)于語種類別差異的懲罰因子表;
[0048] 當(dāng)檢測出的關(guān)鍵詞之間的語種信息不一致時(shí),通過檢索該懲罰因子表確定對檢測 出關(guān)鍵詞所設(shè)置的懲罰因子。
[0049] 步驟203 :基于懲罰因子評估所檢測出的關(guān)鍵詞。
[0050] 在這里,可以預(yù)先設(shè)置關(guān)鍵詞門限值;并利用置信度算法以及懲罰因子計(jì)算所檢 測出的關(guān)鍵詞的置信度,其中當(dāng)計(jì)算出的置信度低于所述關(guān)鍵詞門限值時(shí),去除該關(guān)鍵詞。
[0051] 在上述流程中,還可以對填充音節(jié)增加一個(gè)懲罰因子,使得關(guān)鍵詞更容易被識別 出來,提高檢測的召回率。而且,如果某些關(guān)鍵詞對檢測任務(wù)更重要,可以給這些關(guān)鍵詞更 大的加權(quán)因子,而給其他關(guān)鍵詞較小的加權(quán)因子;并且在令牌傳遞過程中可對令牌的得分 門限進(jìn)行設(shè)置,從而加快解碼速度。
[0052] 圖3為根據(jù)本發(fā)明實(shí)施方式解碼網(wǎng)絡(luò)示意圖。
[0053] 由圖3可見,在該解碼網(wǎng)絡(luò)中根據(jù)語種信息對關(guān)鍵詞和填充音節(jié)進(jìn)行分組。在每 個(gè)關(guān)鍵詞和填充音節(jié)前都增加了與關(guān)鍵詞和填充音節(jié)的語種相對應(yīng)的語種狀態(tài)節(jié)點(diǎn)。比 如:語種節(jié)點(diǎn)1對應(yīng)于具有該語種1的關(guān)鍵詞11到ln,語種節(jié)點(diǎn)1對應(yīng)于具有該語種1的 填充音節(jié)11到lm ;依此類推,語種節(jié)點(diǎn)k對應(yīng)于具有該語種k的關(guān)鍵詞kl到kn,語種節(jié)點(diǎn) k還對應(yīng)于具有該語種k的填充音節(jié)kl到km。
[0054] 在令牌傳播過程中,一旦遇到語種狀態(tài)節(jié)點(diǎn),就要比較該節(jié)點(diǎn)上的語種信息與令 牌自帶的語種信息是否匹配,如果不匹配就要對該令牌的得分進(jìn)行一定程度的懲罰。
[0055] 其中,在構(gòu)建本發(fā)明實(shí)施方式的多語種解碼網(wǎng)絡(luò)時(shí),具體可以包括以下步驟:
[0056] 第一步:初始化開始節(jié)點(diǎn)Nstart和結(jié)束節(jié)點(diǎn)NEnd ;
[0057] 第二步:遍歷多語種列表,其中針對每一個(gè)語種1^,可以順序執(zhí)行如下子步驟 [2. 1]、[2. 2] ·、[2. 3]和[2. 4],其中子步驟[2. 3]包括進(jìn)一步的子步驟[2. 3. 1]、[2. 3. 2]、 [2. 3. 3]和[2. 3. 4];子步驟[2. 4]包括進(jìn)一步的子步驟[2. 4. 1]和[2. 4. 2]。因此,第二 步具體包括:
[0058] [2. 1]·構(gòu)造語種節(jié)點(diǎn)Nu,并構(gòu)造從開始節(jié)點(diǎn)Nstart到Nu的邊;
[0059] [2. 2].加載與語種Q對應(yīng)的關(guān)鍵詞列表和填充音節(jié)列表;
[0060] [2. 3].對關(guān)鍵詞列表中的每一個(gè)關(guān)鍵詞Kp執(zhí)行如下動(dòng)作;
[0061] [2· 3· 1] ·將關(guān)鍵詞Κ』.轉(zhuǎn)化成三音子序列?\,Τ2, · · ·,Τρ ;
[0062] [2· 3· 2] ·針對每個(gè)三音子構(gòu)造一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)序列記為心Ν2, · · ·,Νρ ;
[0063] [2· 3· 3] ·依次構(gòu)造 & 到 Ν2, Ν2 到 Ν3, · · ·,I 到 Νρ 的邊;
[0064] [2. 3. 4].構(gòu)造語種節(jié)點(diǎn)Nu到&的邊和Νρ到結(jié)束節(jié)點(diǎn)NEnd的邊;
[0065] [2. 4].對填充列表中的每個(gè)填充音節(jié)Fp執(zhí)行如下動(dòng)作
[0066] [2. 4. 1].構(gòu)造填充音節(jié)匕對應(yīng)的節(jié)點(diǎn)NFJ ;
[0067] [2. 4. 2].構(gòu)造語種節(jié)點(diǎn)Nu到NFj的邊和NFj到結(jié)束節(jié)點(diǎn)NEnd的邊;
[0068] 第三步:構(gòu)造從結(jié)束節(jié)點(diǎn)NEnd到開始節(jié)點(diǎn)Nstart的邊;
[0069] 第四步:輸出構(gòu)造好的多語種解碼網(wǎng)絡(luò)。
[0070] 而且,在多語種關(guān)鍵詞檢測時(shí),可以順序執(zhí)行以下步驟。其中:[1]為第一步;[2] 為第二步;[3]為第三步;[4]為第四步;[5]為第五步;[6]為第六步。而且[2]可以包括 子步驟[2. 1];子步驟[2. 1]包括[2. 1. 1]、[2. 1. 2]、[2. 1. 3]和[2. 1. 4]。
[0071] 具體執(zhí)行順序如下:
[0072] [1].給開始節(jié)點(diǎn)一個(gè)初始活躍令牌(Token),得分初始化為1 ;
[0073] [2].讀下一幀語音數(shù)據(jù),執(zhí)行如下步驟,直至所有語音數(shù)據(jù)處理完畢:
[0074] [2. 1].對每一個(gè)活躍令牌Tk,執(zhí)行如下步驟,直至所有活躍令牌都處理完畢:
[0075] [2. 1. 1].把Tk從當(dāng)前狀態(tài)節(jié)點(diǎn)Si沿著詞網(wǎng)格的邊往前傳遞,設(shè)新節(jié)點(diǎn)為Sj,新令 牌為Tp;
[0076] [2. 1. 2]·如果 Sj 為語種節(jié)點(diǎn),根據(jù) Score (Τρ)= δ (Lang (Tp), Lang 〇) X Score (Τ k)更新令牌Tp的得分Score (Tp),其中Score (Tk)為令牌從開始節(jié)點(diǎn)傳遞到Si節(jié)點(diǎn)的過程 中通過的所有節(jié)點(diǎn)路徑上的聲學(xué)模型得分累積,然后轉(zhuǎn)[2. 1. 1]繼續(xù)往前傳遞令牌;否則 執(zhí)行[2. 1. 3];
[0077] 其中Lang( ·)是用于求出節(jié)點(diǎn)或令牌語種信息的函數(shù),δ ( ·)是一個(gè)懲罰函數(shù), 用來定義從一個(gè)語種轉(zhuǎn)換為另一個(gè)語種時(shí)對得分的懲罰力度,當(dāng)語種信息一致時(shí)取值為1。
[0078] [2. 1. 3].根據(jù)當(dāng)前幀的語音數(shù)據(jù),使用聲學(xué)模型更新令牌Tp的得分;
[0079] [2. 1. 4].根據(jù)剪枝策略,判斷新令牌是否Τρ活躍;
[0080] [3].在所有到達(dá)結(jié)束節(jié)點(diǎn)的活躍令牌中取得分最高的,記為Tfinal ;
[0081] [4].回溯獲取Tfinal的路徑信息,返回路徑上所有的關(guān)鍵詞;
[0082] [5].利用置信度算法評估每個(gè)檢測出來的關(guān)鍵詞;
[0083] [6]·輸出最終的檢測關(guān)鍵詞列表。
[0084] 懲罰函數(shù)δ (·)在實(shí)際應(yīng)用中可以用一張二維表表示,如下為針對漢語、英語、日 語、俄語四個(gè)語種的一個(gè)懲罰函數(shù)示例。

【權(quán)利要求】
1. 一種關(guān)鍵詞檢測方法,其特征在于,該方法包括: 生成包含語種信息的解碼網(wǎng)絡(luò),在該解碼網(wǎng)絡(luò)中根據(jù)語種信息對關(guān)鍵詞進(jìn)行分組; 利用所述解碼網(wǎng)絡(luò)對輸入語音進(jìn)行關(guān)鍵詞檢測,其中當(dāng)檢測出的關(guān)鍵詞之間的語種信 息不一致時(shí),對所檢測出關(guān)鍵詞設(shè)置懲罰因子; 基于懲罰因子評估所檢測出的關(guān)鍵詞。
2. 根據(jù)權(quán)利要求1所述的關(guān)鍵詞檢測方法,其特征在于,所述基于懲罰因子評估所檢 測出的關(guān)鍵詞包括: 預(yù)先設(shè)置關(guān)鍵詞門限值; 利用置信度算法以及懲罰因子計(jì)算所檢測出的關(guān)鍵詞的置信度,其中當(dāng)計(jì)算出的置信 度低于所述關(guān)鍵詞門限值時(shí),去除該關(guān)鍵詞。
3. 根據(jù)權(quán)利要求1所述的關(guān)鍵詞檢測方法,其特征在于,所述生成包含語種信息的解 碼網(wǎng)絡(luò),在該解碼網(wǎng)絡(luò)中根據(jù)語種信息對關(guān)鍵詞進(jìn)行分組包括 : 初始化開始節(jié)點(diǎn)和結(jié)束節(jié)點(diǎn),并針對每個(gè)語種信息k執(zhí)行如下步驟,其中i為語種序 號: 構(gòu)造語種節(jié)點(diǎn)Nu,并構(gòu)造從開始節(jié)點(diǎn)到Nu的邊; 加載與該語種信息Q對應(yīng)的關(guān)鍵詞列表和填充音節(jié)列表; 對所述關(guān)鍵詞列表中的每一個(gè)關(guān)鍵詞I,其中j為關(guān)鍵詞序號,執(zhí)行如下動(dòng)作: 將關(guān)鍵詞Κ」轉(zhuǎn)化成三音子序列,并針對每個(gè)三音子構(gòu)造一個(gè)節(jié)點(diǎn)以形成節(jié)點(diǎn)序列;依 次構(gòu)造節(jié)點(diǎn)序列之間的邊;構(gòu)造語種節(jié)點(diǎn)Nu到節(jié)點(diǎn)序列中第一個(gè)節(jié)點(diǎn)的邊以及節(jié)點(diǎn)序列 中最后節(jié)點(diǎn)到結(jié)束節(jié)點(diǎn)的邊; 對所述填充音節(jié)列表中的每個(gè)填充音節(jié)Fk,其中k為填充音節(jié)序號,執(zhí)行如下動(dòng)作: 構(gòu)造填充音節(jié)Fk對應(yīng)的節(jié)點(diǎn)NFk; 構(gòu)造語種節(jié)點(diǎn)Nu到NFk的邊和NFk到結(jié)束節(jié)點(diǎn)的邊; 構(gòu)造從結(jié)束節(jié)點(diǎn)到開始節(jié)點(diǎn)的邊; 輸出所述解碼網(wǎng)絡(luò)。
4. 根據(jù)權(quán)利要求1所述的關(guān)鍵詞檢測方法,其特征在于,所述利用解碼網(wǎng)絡(luò)對輸入語 音進(jìn)行關(guān)鍵詞檢測,其中當(dāng)檢測出的關(guān)鍵詞之間的語種信息不一致時(shí),對所檢測出關(guān)鍵詞 設(shè)置懲罰因子包括: 在關(guān)鍵詞檢測的令牌傳播過程中,當(dāng)遇到語種狀態(tài)節(jié)點(diǎn)時(shí),比較該語種狀態(tài)節(jié)點(diǎn)上的 語種信息與令牌自帶的語種信息是否匹配,如果不匹配,則對該令牌得分設(shè)置懲罰因子。
5. 根據(jù)權(quán)利要求4所述的關(guān)鍵詞檢測方法,其特征在于,所述利用解碼網(wǎng)絡(luò)對輸入語 音進(jìn)行關(guān)鍵詞檢測,其中當(dāng)檢測出的關(guān)鍵詞之間的語種信息不一致時(shí),對所檢測出關(guān)鍵詞 設(shè)置懲罰因子包括: 預(yù)先設(shè)置對應(yīng)于語種類別差異的懲罰因子表; 當(dāng)檢測出的關(guān)鍵詞之間的語種信息不一致時(shí),通過檢索該懲罰因子表確定對檢測出關(guān) 鍵詞所設(shè)置的懲罰因子。
6. 根據(jù)權(quán)利要求1-5中任一項(xiàng)所述的關(guān)鍵詞檢測方法,其特征在于,在該解碼網(wǎng)絡(luò)中 進(jìn)一步利用語種信息對填充音節(jié)進(jìn)行分組; 在利用所述解碼網(wǎng)絡(luò)對輸入語音進(jìn)行關(guān)鍵詞檢測時(shí),其中當(dāng)檢測出的填充音節(jié)之間的 語種信息不一致時(shí),對與該填充音節(jié)相對應(yīng)的關(guān)鍵詞設(shè)置懲罰因子。
7. -種關(guān)鍵詞檢測裝置,其特征在于,包括解碼網(wǎng)絡(luò)生成單元、關(guān)鍵詞檢測單元和關(guān)鍵 詞評估單元,其中 : 解碼網(wǎng)絡(luò)生成單元,用于生成包含語種信息的解碼網(wǎng)絡(luò),在該解碼網(wǎng)絡(luò)中根據(jù)語種信 息對關(guān)鍵詞進(jìn)行分組; 關(guān)鍵詞檢測單元,用于利用所述解碼網(wǎng)絡(luò)對輸入語音進(jìn)行關(guān)鍵詞檢測,其中當(dāng)檢測出 的關(guān)鍵詞之間的語種信息不一致時(shí),對所檢測出關(guān)鍵詞設(shè)置懲罰因子; 關(guān)鍵詞評估單元,用于基于懲罰因子評估所檢測出的關(guān)鍵詞。
8. 根據(jù)權(quán)利要求7所述的關(guān)鍵詞檢測裝置,其特征在于, 關(guān)鍵詞評估單元,用于預(yù)先設(shè)置關(guān)鍵詞門限值;利用置信度算法以及懲罰因子計(jì)算所 檢測出的關(guān)鍵詞的置信度,其中當(dāng)計(jì)算出的置信度低于所述關(guān)鍵詞門限值時(shí),去除該關(guān)鍵 。
9. 根據(jù)權(quán)利要求7所述的關(guān)鍵詞檢測裝置,其特征在于, 解碼網(wǎng)絡(luò)生成單元,用于初始化開始節(jié)點(diǎn)和結(jié)束節(jié)點(diǎn),并針對每個(gè)語種信息k執(zhí)行如 下步驟,其中i為語種序號: 構(gòu)造語種節(jié)點(diǎn)Nu,并構(gòu)造從開始節(jié)點(diǎn)到Nu的邊; 加載與該語種信息Q對應(yīng)的關(guān)鍵詞列表和填充音節(jié)列表; 對所述關(guān)鍵詞列表中的每一個(gè)關(guān)鍵詞I,其中j為關(guān)鍵詞序號,執(zhí)行如下動(dòng)作: 將關(guān)鍵詞Κ」轉(zhuǎn)化成三音子序列,并針對每個(gè)三音子構(gòu)造一個(gè)節(jié)點(diǎn)以形成節(jié)點(diǎn)序列;依 次構(gòu)造節(jié)點(diǎn)序列之間的邊;構(gòu)造語種節(jié)點(diǎn)Nu到節(jié)點(diǎn)序列中第一個(gè)節(jié)點(diǎn)的邊以及節(jié)點(diǎn)序列 中最后節(jié)點(diǎn)到結(jié)束節(jié)點(diǎn)的邊; 對所述填充音節(jié)列表中的每個(gè)填充音節(jié)Fk,其中k為填充音節(jié)序號,執(zhí)行如下動(dòng)作: 構(gòu)造填充音節(jié)Fk對應(yīng)的節(jié)點(diǎn)NFk ; 構(gòu)造語種節(jié)點(diǎn)Nu到NFk的邊和NFk到結(jié)束節(jié)點(diǎn)的邊; 構(gòu)造從結(jié)束節(jié)點(diǎn)到開始節(jié)點(diǎn)的邊; 輸出所述解碼網(wǎng)絡(luò)。
10. 根據(jù)權(quán)利要求7所述的關(guān)鍵詞檢測裝置,其特征在于, 關(guān)鍵詞檢測單元,用于在關(guān)鍵詞檢測的令牌傳播過程中,當(dāng)遇到語種狀態(tài)節(jié)點(diǎn)時(shí),比較 該語種狀態(tài)節(jié)點(diǎn)上的語種信息與令牌自帶的語種信息是否匹配,如果不匹配,則對該令牌 得分設(shè)置懲罰因子。
11. 根據(jù)權(quán)利要求10所述的關(guān)鍵詞檢測裝置,其特征在于, 關(guān)鍵詞檢測單元,用于預(yù)先設(shè)置對應(yīng)于語種類別差異的懲罰因子表;當(dāng)檢測出的關(guān)鍵 詞之間的語種信息不一致時(shí),通過檢索該懲罰因子表確定對檢測出關(guān)鍵詞所設(shè)置的懲罰因 子。
【文檔編號】G10L15/08GK104143328SQ201310355905
【公開日】2014年11月12日 申請日期:2013年8月15日 優(yōu)先權(quán)日:2013年8月15日
【發(fā)明者】李露, 盧鯉, 馬建雄, 孔令揮, 饒豐, 岳帥, 張翔, 劉海波, 王爾玉, 陳波 申請人:騰訊科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
高雄市| 兴义市| 博客| 茂名市| 惠水县| 新丰县| 嵩明县| 垫江县| 建瓯市| 黄骅市| 宾川县| 宁化县| 台江县| 政和县| 饶平县| 建湖县| 宿松县| 太和县| 云龙县| 山东省| 镇宁| 驻马店市| 天峨县| 六枝特区| 岑溪市| 屏山县| 墨竹工卡县| 湟源县| 响水县| 萍乡市| 滕州市| 马山县| 固阳县| 明水县| 嘉兴市| 香格里拉县| 平利县| 建湖县| 商都县| 十堰市| 扬中市|