中文熱詞檢測(cè)方法和裝置的制造方法
【專利摘要】本發(fā)明提供了一種中文熱詞檢測(cè)方法和裝置。該方法包括:收集用戶語(yǔ)音的連續(xù)的多個(gè)片段;參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征,獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率;基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率,獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率;基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。本發(fā)明能夠支持以字為分割單位的中文熱詞檢測(cè),并保證檢測(cè)出的熱詞與目標(biāo)中文熱詞中的字的順序一致。
【專利說(shuō)明】
中文熱詞檢測(cè)方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及語(yǔ)音檢測(cè)技術(shù),特別涉及以字為分割單位中文語(yǔ)音熱詞檢測(cè)技術(shù)。
【背景技術(shù)】
[0002] 語(yǔ)音熱詞檢測(cè)技術(shù)日益發(fā)展,并在語(yǔ)音搜索以及熱詞喚醒等方面開(kāi)始廣泛應(yīng)用。 現(xiàn)有的熱詞檢測(cè)技術(shù)多是基于音節(jié)對(duì)目標(biāo)熱詞進(jìn)行分割,這種基于音節(jié)的熱詞分割非常適 用于英文單詞的提取,但不適用于中文語(yǔ)言材料的分析。此外,目前的語(yǔ)音熱詞檢測(cè)方法無(wú) 法在中文熱詞檢測(cè)中保證測(cè)出的熱詞與目標(biāo)中文熱詞中的字的順序一致。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明解決的技術(shù)問(wèn)題之一是,能夠支持以字為分割單位的中文熱詞檢測(cè),并保 證檢測(cè)出的熱詞與目標(biāo)中文熱詞中的字的順序一致。
[0004] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,提供了一種中文熱詞檢測(cè)方法,包括:收集用戶語(yǔ)音的 連續(xù)的多個(gè)片段;參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征,獲取目標(biāo)中文熱詞中各個(gè) 字在每個(gè)片段中出現(xiàn)的概率;基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率, 獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中 文熱詞的最大概率;基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。
[0005] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,提供了一種中文熱詞檢測(cè)裝置,包括:收集模塊,被配 置為收集用戶語(yǔ)音的連續(xù)的多個(gè)片段;第一獲取模塊,被配置為參照目標(biāo)中文熱詞中每個(gè) 字的標(biāo)準(zhǔn)語(yǔ)音特征,獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率;第二獲取模塊, 被配置為基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率,獲取在不違背目標(biāo)中 文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率;檢 測(cè)模塊,被配置為基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。
[0006] 由于本發(fā)明實(shí)施例中,判斷目標(biāo)中文熱詞在用戶語(yǔ)音中是否出現(xiàn)是通過(guò)在不違背 目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下計(jì)算最大概率進(jìn)行的,這樣就保證了所檢測(cè)出 的熱詞與目標(biāo)中文熱詞中的字的順序一致。另外,現(xiàn)有技術(shù)的熱詞檢測(cè)方法中,多數(shù)是以音 節(jié)為基本單位對(duì)語(yǔ)音進(jìn)行分割的,這種分割方法不利于中文形式的用戶熱詞語(yǔ)音的識(shí)別。 中文的詞語(yǔ)、短語(yǔ)、語(yǔ)句等語(yǔ)言資料是由"字"按照一定的順序連接而成,從而表達(dá)一定語(yǔ)義 的。因此"字"是中文詞語(yǔ)和語(yǔ)句的基本單位。對(duì)于不同的人,說(shuō)話的快慢,停頓的方式可能 不同,但針對(duì)每個(gè)字而言,發(fā)音的基本特征是非常相近的(這里不考慮方言帶來(lái)的干擾), 因此通過(guò)以字為單位對(duì)目標(biāo)中文熱詞進(jìn)行分割,提取每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征作為參照,可 以有效地抓住目標(biāo)中文熱詞的基本特征,降低錯(cuò)誤檢測(cè)率。
[0007] 本領(lǐng)域普通技術(shù)人員將了解,雖然下面的詳細(xì)說(shuō)明將參考圖示實(shí)施例、附圖進(jìn)行, 但本發(fā)明并不僅限于這些實(shí)施例。而是,本發(fā)明的范圍是廣泛的,且意在僅通過(guò)后附的權(quán)利 要求限定本發(fā)明的范圍。
【附圖說(shuō)明】
[0008] 通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它 特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0009] 圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的一種中文熱詞檢測(cè)方法的流程圖。
[0010] 圖2是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的一種中文熱詞檢測(cè)裝置的框圖。
【具體實(shí)施方式】
[0011] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0012] 圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的一種中文熱詞檢測(cè)方法1的流程圖。本發(fā)明 的方法主要通過(guò)計(jì)算機(jī)設(shè)備上的處理器或操作程序來(lái)完成,將該處理器或操作程序稱為一 種中文熱詞檢測(cè)裝置,以下簡(jiǎn)稱檢測(cè)裝置。該計(jì)算機(jī)設(shè)備包括但不限于電腦、手機(jī)、平板電 腦,以及帶有該處理器或操作程序的智能可穿戴設(shè)備,如智能手環(huán),智能手表,以及智能眼 鏡等。
[0013] 熱詞是指與用于發(fā)出的常規(guī)語(yǔ)音指令不同的一些特殊的語(yǔ)音指令,它們通常與應(yīng) 用或計(jì)算機(jī)設(shè)備的總體狀態(tài)相關(guān)而不涉及用戶的具體語(yǔ)音指令。例如,對(duì)于應(yīng)用的喚醒、關(guān) 閉、計(jì)算機(jī)設(shè)備的開(kāi)啟、關(guān)閉等。舉一個(gè)具體的例子。對(duì)于應(yīng)用"出門問(wèn)問(wèn)"來(lái)說(shuō),只要用戶 在計(jì)算機(jī)設(shè)備上安裝了 "出門問(wèn)問(wèn)",即使該應(yīng)用在未開(kāi)啟的狀態(tài)下它也以低功耗不停定時(shí) 檢測(cè)是否用戶說(shuō)出了熱詞"你好問(wèn)問(wèn)",一旦例如通過(guò)本發(fā)明實(shí)施例的中文熱詞檢測(cè)方法1 檢測(cè)到了用戶語(yǔ)音中有目標(biāo)中文熱詞"你好問(wèn)問(wèn)",就自動(dòng)喚醒或開(kāi)啟該應(yīng)用。用戶就可以 針對(duì)該應(yīng)用發(fā)出各種具體的語(yǔ)音查詢等。
[0014] 中文熱詞是指一切中文形式的熱詞。
[0015] 步驟110,收集用戶語(yǔ)音的連續(xù)的多個(gè)片段。
[0016] 用戶語(yǔ)音是指用戶發(fā)出的語(yǔ)音,它可能是中文熱詞(諸如"你好問(wèn)問(wèn)"),也可能是 其它語(yǔ)音。本發(fā)明的實(shí)施例用來(lái)從用戶語(yǔ)音中檢測(cè)出它是否是中文熱詞或包括中文熱詞。
[0017] 所述多個(gè)片段可以是等時(shí)間長(zhǎng)度的多個(gè)片段,也可以是不等時(shí)間長(zhǎng)度的多個(gè)片 段。
[0018] 在所述多個(gè)片段可以是等時(shí)間長(zhǎng)度的多個(gè)片段的情況下,例如,將檢測(cè)到有用戶 的聲音出現(xiàn)的一刻設(shè)為0,多個(gè)片段可以為〇-〇. 5s、0. 5s-ls、ls-l. 5s、l. 5s-2s、2s-2. 5s 等。一般來(lái)說(shuō),根據(jù)人的正常語(yǔ)速,讓每個(gè)片段的時(shí)間長(zhǎng)度不大于正常人說(shuō)一個(gè)中文字的時(shí) 間長(zhǎng)度。
[0019] 用戶語(yǔ)音的連續(xù)的多個(gè)片段可以通過(guò)計(jì)算機(jī)設(shè)備的音頻接收器等收集。
[0020] 步驟120,參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征,獲取目標(biāo)中文熱詞中各個(gè) 字在每個(gè)片段中出現(xiàn)的概率。
[0021] 目標(biāo)中文熱詞是指預(yù)先設(shè)定的中文形式的熱詞,例如預(yù)先設(shè)定"你好問(wèn)問(wèn)"作為開(kāi) 啟"出門問(wèn)問(wèn)"應(yīng)用的熱詞。
[0022] 字的標(biāo)準(zhǔn)語(yǔ)音特征可以是這個(gè)字發(fā)音的聲波波形,也可以是對(duì)該字發(fā)音聲波波形 處理后的數(shù)據(jù),該語(yǔ)音特征的出現(xiàn)就代表了該字的出現(xiàn)。
[0023]目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征可以是從不同的人說(shuō)目標(biāo)中文熱詞中每 個(gè)字的語(yǔ)音的樣本中利用已知的機(jī)器學(xué)習(xí)方法得到的。
[0024] 例如,目標(biāo)中文熱詞是"你好問(wèn)問(wèn)"。將大量的人說(shuō)"你"、"好"、"問(wèn)1"、"問(wèn)2"中的 每個(gè)字的語(yǔ)音作為樣本輸入機(jī)器學(xué)習(xí)的一個(gè)模型,該模型從大量的人說(shuō)"你"的語(yǔ)音樣本的 聲波波形中進(jìn)行學(xué)習(xí),學(xué)習(xí)所有這些"你"的語(yǔ)音樣本的聲波波形的規(guī)律,經(jīng)處理后就得到 了共性的語(yǔ)音特征作為"你"的標(biāo)準(zhǔn)語(yǔ)音特征。當(dāng)該模型再接收到一個(gè)新的字的語(yǔ)音后,該 模型就能識(shí)別出該新的字是不是"你"、以及是"你"的概率。"好"、"問(wèn)1"、"問(wèn)2"的標(biāo)準(zhǔn)語(yǔ) 音特征也可以類似地得到。
[0025] 目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征也可以是事先規(guī)定的,例如來(lái)自于教科 書。
[0026] 在一種實(shí)施方式中,參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征獲取目標(biāo)中文熱 詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率是通過(guò)深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法實(shí)現(xiàn)的。
[0027] 深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練以目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征為標(biāo)準(zhǔn),通過(guò)差值優(yōu) 化,不斷地對(duì)每個(gè)片段是否出現(xiàn)目標(biāo)中文熱詞中的字進(jìn)行分析,最終得到目標(biāo)中文熱詞中 各個(gè)字在每個(gè)片段中出現(xiàn)的概率。深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法是成熟的現(xiàn)有技術(shù),在這里就不 再詳細(xì)表述。當(dāng)然本領(lǐng)域的技術(shù)人員也可采用其他機(jī)器學(xué)習(xí)方法作為該步驟的分析方法, 比如多層神經(jīng)網(wǎng)絡(luò)訓(xùn)練等。
[0028] 步驟130,基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率,獲取在不違 背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最 大概率。
[0029] 在一種實(shí)施方式中,步驟130是通過(guò)基于時(shí)間的隱藏馬爾科夫模型實(shí)現(xiàn)的,其中 在所述基于時(shí)間的隱藏馬爾科夫模型中,以目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序,限制所述 基于時(shí)間的隱藏馬爾科夫模型在各個(gè)連續(xù)片段間出現(xiàn)的目標(biāo)中文熱詞中的字之間的轉(zhuǎn)移 路徑。
[0030] 目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序是指規(guī)定的目標(biāo)中文熱詞中字的前后順序。例 如,規(guī)定"你好問(wèn)問(wèn)"是啟動(dòng)應(yīng)用"出門問(wèn)問(wèn)"的熱詞,則標(biāo)準(zhǔn)前后順序就是"你"、"好"、"問(wèn) 1"、"問(wèn)2"。轉(zhuǎn)移路徑是隱藏馬爾科夫模型中的術(shù)語(yǔ),是將各個(gè)片段中判斷出來(lái)的字和相應(yīng) 概率相連接形成的路徑。
[0031] 為了清晰而簡(jiǎn)潔的描述基于時(shí)間的隱藏馬爾科夫模型的工作流程,建立以下表格 進(jìn)行闡釋,該表格僅作為示例,而不作為對(duì)本發(fā)明的限制。
[0032]
[0033]
[0034] 該表中,目標(biāo)中文熱詞為"你好問(wèn)問(wèn)"。每一行的數(shù)字表示在每一片段中,出現(xiàn)目標(biāo) 中文熱詞中各個(gè)相應(yīng)字的概率。
[0035] 對(duì)片段nl至n7這個(gè)7個(gè)連續(xù)的片段,按照目標(biāo)中文熱詞"你好問(wèn)問(wèn)"的順序,在 片段nl中應(yīng)當(dāng)找到"你",而不是概率更高的"好",作為基于時(shí)間的隱藏馬爾科夫模型的起 始;由于必須以"你好問(wèn)問(wèn)"為順序,因此由片段nl向片段n2的轉(zhuǎn)移路徑只有"你"到"你", "你"到"好"兩種,又因?yàn)橐易畲蟾怕兽D(zhuǎn)移路徑,片段n2中"你"的概率大于"好",因此由 語(yǔ)音單元nl到語(yǔ)音單元n2的轉(zhuǎn)移路徑是"你"到"你";基于以上原理,由語(yǔ)音單元n2到 語(yǔ)音單元n3的轉(zhuǎn)移路徑有"你"到"你","你"到"好"兩種,因?yàn)樵谡Z(yǔ)音單元n3中"你"和 "好"概率相等,因此由語(yǔ)音單元n2到語(yǔ)音單元n3的轉(zhuǎn)移路徑有兩種"你"到"你"和"你"到 "好";那么接下來(lái)的路徑就有"你"到"你","你"到"好","好"到"問(wèn)"三種,根據(jù)概率最大來(lái) 判斷,應(yīng)為"好"到"問(wèn)";其后的按此原則依次類推,就可以得到該七個(gè)連續(xù)片段中,目標(biāo)中 文熱詞中的字的轉(zhuǎn)移路徑為:"你"一〉"你"一〉"好"一〉"問(wèn)"一〉"問(wèn)"一〉"問(wèn)"一 > "問(wèn)",該路徑出現(xiàn)的概率為與在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述 多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率。
[0036] 根據(jù)本發(fā)明的一個(gè)實(shí)施例,所述最大概率的算法是將轉(zhuǎn)移路徑中所有字出現(xiàn) 概率進(jìn)行等權(quán)相加再除以轉(zhuǎn)移路徑中字的個(gè)數(shù)。比如,在上述表格中,所述最大概率為 (0. 1+0. 6+0. 4+0. 6+0. 8+0. 4+0. 5)/7 = 0. 49。當(dāng)然,最大概率的算法也可以是其他合理的 形式。
[0037] 步驟140,基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。
[0038] 在一種實(shí)施方式中,可以將所述最大概率與預(yù)定閾值相比較,大于預(yù)定閾值的,認(rèn) 為在所述用戶語(yǔ)音中有目標(biāo)中文熱詞。
[0039] 例如,該預(yù)定閾值設(shè)置為1除以目標(biāo)中文熱詞中的個(gè)數(shù)。比如,在上述表格中,所 述接受概率閾值為1/4 = 0. 25。將步驟130中獲取的最大概率與該預(yù)定閾值比較。由于 0. 49大于0. 25,那么認(rèn)為在上述表格的例子中,片段nl至n7這7個(gè)連續(xù)的片段中出現(xiàn)了 目標(biāo)中文熱詞"你好問(wèn)問(wèn)"。當(dāng)然,預(yù)定閾值也可以通過(guò)其他合理的形式設(shè)定。
[0040] 如果只應(yīng)用深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練對(duì)片段進(jìn)行分析,就會(huì)對(duì)收集片段的時(shí)間長(zhǎng)度加以 限制。因?yàn)樯顚由窠?jīng)網(wǎng)絡(luò)訓(xùn)練智能在語(yǔ)音層面上保證一個(gè)小時(shí)間片段上的順序,最多300ms 左右。如果欲在語(yǔ)音層面上保證長(zhǎng)時(shí)間的順序,就要加長(zhǎng)檢測(cè)時(shí)間長(zhǎng)度,比如大于300ms,這 種加長(zhǎng)檢測(cè)時(shí)間長(zhǎng)度,即加長(zhǎng)檢測(cè)延遲的手段不但會(huì)給之后的分析帶來(lái)更高的能耗,而且 依然不能保證字層面上的順序。本發(fā)明實(shí)施例獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后 順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率從而檢測(cè)用戶語(yǔ)音中是否 有目標(biāo)中文熱詞的方式還減輕了加長(zhǎng)檢測(cè)時(shí)間長(zhǎng)度的負(fù)面影響。
[0041] 如圖2所示,本發(fā)明的另一個(gè)實(shí)施例提供了一種中文熱詞檢測(cè)裝置2,包括:收集 模塊210,被配置為收集用戶語(yǔ)音的連續(xù)的多個(gè)片段;第一獲取模塊220,被配置為參照目 標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征,獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概 率;第二獲取模塊230,被配置為基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概 率,獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo) 中文熱詞的最大概率;檢測(cè)模塊240,被配置為基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否 有目標(biāo)中文熱詞。上述各模塊可以通過(guò)軟件、硬件(FPGA、集成電路等)或軟硬件結(jié)合的方 式實(shí)現(xiàn)。
[0042] 可選地,所述多個(gè)片段是等時(shí)間長(zhǎng)度的多個(gè)片段。
[0043] 可選地,目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征是從不同的人說(shuō)目標(biāo)中文熱詞中 每個(gè)字的語(yǔ)音的樣本中利用機(jī)器學(xué)習(xí)得到的。
[0044] 可選地,檢測(cè)模塊240進(jìn)一步被配置為:將所述最大概率與預(yù)定閾值相比較,大于 預(yù)定閾值的,認(rèn)為在所述用戶語(yǔ)音中有目標(biāo)中文熱詞。
[0045] 可選地,第一獲取模塊220通過(guò)深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法獲取目標(biāo)中文熱詞中各個(gè) 字在每個(gè)片段中出現(xiàn)的概率。
[0046] 可選地,第二獲取模塊230通過(guò)基于時(shí)間的隱藏馬爾科夫模型獲取在不違背目標(biāo) 中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率, 其中在所述基于時(shí)間的隱藏馬爾科夫模型中,以目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序,限制 所述基于時(shí)間的隱藏馬爾科夫模型在各個(gè)連續(xù)片段間出現(xiàn)的目標(biāo)中文熱詞中的字之間的 轉(zhuǎn)移路徑。
[0047] 附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程 序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代 表一個(gè)模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用 于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意的是,框圖和/或流程圖中的每個(gè)方框、 以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件 的系統(tǒng)來(lái)實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。
[0048] 對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在 不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無(wú)論 從哪一點(diǎn)來(lái)看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán) 利要求而不是上述說(shuō)明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有 變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。
【主權(quán)項(xiàng)】
1. 一種中文熱詞檢測(cè)方法(1),包括: 收集用戶語(yǔ)音的連續(xù)的多個(gè)片段(110); 參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征,獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段 中出現(xiàn)的概率(120); 基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率,獲取在不違背目標(biāo)中文熱 詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率(130); 基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞(140)。2. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法,其中所述多個(gè)片段是等時(shí)間長(zhǎng)度的多個(gè)片 段。3. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法,其中目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征 是從不同的人說(shuō)目標(biāo)中文熱詞中每個(gè)字的語(yǔ)音的樣本中利用機(jī)器學(xué)習(xí)得到的。4. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法,其中基于所述最大概率檢測(cè)在用戶語(yǔ)音中是 否有目標(biāo)中文熱詞的步驟(140)包括:將所述最大概率與預(yù)定閾值相比較,大于預(yù)定閾值 的,認(rèn)為在所述用戶語(yǔ)音中有目標(biāo)中文熱詞。5. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法,其中獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段 中出現(xiàn)的概率的步驟(120)是通過(guò)深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法實(shí)現(xiàn)的。6. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法,其中獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn) 前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率的步驟(130)是通過(guò) 基于時(shí)間的隱藏馬爾科夫模型實(shí)現(xiàn)的,其中在所述基于時(shí)間的隱藏馬爾科夫模型中,以目 標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序,限制所述基于時(shí)間的隱藏馬爾科夫模型在各個(gè)連續(xù)片段 間出現(xiàn)的目標(biāo)中文熱詞中的字之間的轉(zhuǎn)移路徑。7. -種中文熱詞檢測(cè)裝置(2),包括: 收集模塊(210),被配置為收集用戶語(yǔ)音的連續(xù)的多個(gè)片段; 第一獲取模塊(220),被配置為參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征,獲取目標(biāo) 中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率; 第二獲取模塊(230),被配置為基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的 概率,獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目 標(biāo)中文熱詞的最大概率; 檢測(cè)模塊(240),被配置為基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。8. 根據(jù)權(quán)利要求7的中文熱詞檢測(cè)裝置,其中所述多個(gè)片段是等時(shí)間長(zhǎng)度的多個(gè)片 段。9. 根據(jù)權(quán)利要求7的中文熱詞檢測(cè)裝置,其中目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征 是從不同的人說(shuō)目標(biāo)中文熱詞中每個(gè)字的語(yǔ)音的樣本中利用機(jī)器學(xué)習(xí)得到的。10. 根據(jù)權(quán)利要求7的中文熱詞檢測(cè)裝置,其中檢測(cè)模塊(240)進(jìn)一步被配置為:將所 述最大概率與預(yù)定閾值相比較,大于預(yù)定閾值的,認(rèn)為在所述用戶語(yǔ)音中有目標(biāo)中文熱詞。
【文檔編號(hào)】G10L15/02GK105869622SQ201510031181
【公開(kāi)日】2016年8月17日
【申請(qǐng)日】2015年1月21日
【發(fā)明人】雷欣, 李倩
【申請(qǐng)人】上海羽扇智信息科技有限公司