中文熱詞檢測(cè)方法和裝置的制造方法

文檔序號(hào)：10513494閱讀：291來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

中文熱詞檢測(cè)方法和裝置的制造方法
【專利摘要】本發(fā)明提供了一種中文熱詞檢測(cè)方法和裝置。該方法包括：收集用戶語(yǔ)音的連續(xù)的多個(gè)片段；參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征，獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率；基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率，獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率；基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。本發(fā)明能夠支持以字為分割單位的中文熱詞檢測(cè)，并保證檢測(cè)出的熱詞與目標(biāo)中文熱詞中的字的順序一致。
【專利說(shuō)明】
中文熱詞檢測(cè)方法和裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及語(yǔ)音檢測(cè)技術(shù)，特別涉及以字為分割單位中文語(yǔ)音熱詞檢測(cè)技術(shù)。
【背景技術(shù)】
[0002] 語(yǔ)音熱詞檢測(cè)技術(shù)日益發(fā)展，并在語(yǔ)音搜索以及熱詞喚醒等方面開(kāi)始廣泛應(yīng)用。現(xiàn)有的熱詞檢測(cè)技術(shù)多是基于音節(jié)對(duì)目標(biāo)熱詞進(jìn)行分割，這種基于音節(jié)的熱詞分割非常適用于英文單詞的提取，但不適用于中文語(yǔ)言材料的分析。此外，目前的語(yǔ)音熱詞檢測(cè)方法無(wú) 法在中文熱詞檢測(cè)中保證測(cè)出的熱詞與目標(biāo)中文熱詞中的字的順序一致。

【發(fā)明內(nèi)容】

[0003] 本發(fā)明解決的技術(shù)問(wèn)題之一是，能夠支持以字為分割單位的中文熱詞檢測(cè)，并保證檢測(cè)出的熱詞與目標(biāo)中文熱詞中的字的順序一致。
[0004] 根據(jù)本發(fā)明的一個(gè)實(shí)施例，提供了一種中文熱詞檢測(cè)方法，包括：收集用戶語(yǔ)音的連續(xù)的多個(gè)片段；參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征，獲取目標(biāo)中文熱詞中各個(gè) 字在每個(gè)片段中出現(xiàn)的概率；基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率，獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率；基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。
[0005] 根據(jù)本發(fā)明的一個(gè)實(shí)施例，提供了一種中文熱詞檢測(cè)裝置，包括：收集模塊，被配置為收集用戶語(yǔ)音的連續(xù)的多個(gè)片段；第一獲取模塊，被配置為參照目標(biāo)中文熱詞中每個(gè) 字的標(biāo)準(zhǔn)語(yǔ)音特征，獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率；第二獲取模塊，被配置為基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率，獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率；檢測(cè)模塊，被配置為基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。
[0006] 由于本發(fā)明實(shí)施例中，判斷目標(biāo)中文熱詞在用戶語(yǔ)音中是否出現(xiàn)是通過(guò)在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下計(jì)算最大概率進(jìn)行的，這樣就保證了所檢測(cè)出的熱詞與目標(biāo)中文熱詞中的字的順序一致。另外，現(xiàn)有技術(shù)的熱詞檢測(cè)方法中，多數(shù)是以音節(jié)為基本單位對(duì)語(yǔ)音進(jìn)行分割的，這種分割方法不利于中文形式的用戶熱詞語(yǔ)音的識(shí)別。中文的詞語(yǔ)、短語(yǔ)、語(yǔ)句等語(yǔ)言資料是由"字"按照一定的順序連接而成，從而表達(dá)一定語(yǔ)義的。因此"字"是中文詞語(yǔ)和語(yǔ)句的基本單位。對(duì)于不同的人，說(shuō)話的快慢，停頓的方式可能不同，但針對(duì)每個(gè)字而言，發(fā)音的基本特征是非常相近的（這里不考慮方言帶來(lái)的干擾），因此通過(guò)以字為單位對(duì)目標(biāo)中文熱詞進(jìn)行分割，提取每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征作為參照，可以有效地抓住目標(biāo)中文熱詞的基本特征，降低錯(cuò)誤檢測(cè)率。
[0007] 本領(lǐng)域普通技術(shù)人員將了解，雖然下面的詳細(xì)說(shuō)明將參考圖示實(shí)施例、附圖進(jìn)行，但本發(fā)明并不僅限于這些實(shí)施例。而是，本發(fā)明的范圍是廣泛的，且意在僅通過(guò)后附的權(quán)利要求限定本發(fā)明的范圍。
【附圖說(shuō)明】
[0008] 通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述，本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯：
[0009] 圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的一種中文熱詞檢測(cè)方法的流程圖。
[0010] 圖2是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的一種中文熱詞檢測(cè)裝置的框圖。
【具體實(shí)施方式】
[0011] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
[0012] 圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例的一種中文熱詞檢測(cè)方法1的流程圖。本發(fā)明的方法主要通過(guò)計(jì)算機(jī)設(shè)備上的處理器或操作程序來(lái)完成，將該處理器或操作程序稱為一種中文熱詞檢測(cè)裝置，以下簡(jiǎn)稱檢測(cè)裝置。該計(jì)算機(jī)設(shè)備包括但不限于電腦、手機(jī)、平板電腦，以及帶有該處理器或操作程序的智能可穿戴設(shè)備，如智能手環(huán)，智能手表，以及智能眼鏡等。
[0013] 熱詞是指與用于發(fā)出的常規(guī)語(yǔ)音指令不同的一些特殊的語(yǔ)音指令，它們通常與應(yīng) 用或計(jì)算機(jī)設(shè)備的總體狀態(tài)相關(guān)而不涉及用戶的具體語(yǔ)音指令。例如，對(duì)于應(yīng)用的喚醒、關(guān) 閉、計(jì)算機(jī)設(shè)備的開(kāi)啟、關(guān)閉等。舉一個(gè)具體的例子。對(duì)于應(yīng)用"出門問(wèn)問(wèn)"來(lái)說(shuō)，只要用戶在計(jì)算機(jī)設(shè)備上安裝了 "出門問(wèn)問(wèn)"，即使該應(yīng)用在未開(kāi)啟的狀態(tài)下它也以低功耗不停定時(shí) 檢測(cè)是否用戶說(shuō)出了熱詞"你好問(wèn)問(wèn)"，一旦例如通過(guò)本發(fā)明實(shí)施例的中文熱詞檢測(cè)方法1 檢測(cè)到了用戶語(yǔ)音中有目標(biāo)中文熱詞"你好問(wèn)問(wèn)"，就自動(dòng)喚醒或開(kāi)啟該應(yīng)用。用戶就可以針對(duì)該應(yīng)用發(fā)出各種具體的語(yǔ)音查詢等。
[0014] 中文熱詞是指一切中文形式的熱詞。
[0015] 步驟110,收集用戶語(yǔ)音的連續(xù)的多個(gè)片段。
[0016] 用戶語(yǔ)音是指用戶發(fā)出的語(yǔ)音，它可能是中文熱詞（諸如"你好問(wèn)問(wèn)"），也可能是其它語(yǔ)音。本發(fā)明的實(shí)施例用來(lái)從用戶語(yǔ)音中檢測(cè)出它是否是中文熱詞或包括中文熱詞。
[0017] 所述多個(gè)片段可以是等時(shí)間長(zhǎng)度的多個(gè)片段，也可以是不等時(shí)間長(zhǎng)度的多個(gè)片段。
[0018] 在所述多個(gè)片段可以是等時(shí)間長(zhǎng)度的多個(gè)片段的情況下，例如，將檢測(cè)到有用戶的聲音出現(xiàn)的一刻設(shè)為0,多個(gè)片段可以為〇-〇. 5s、0. 5s-ls、ls-l. 5s、l. 5s-2s、2s-2. 5s 等。一般來(lái)說(shuō)，根據(jù)人的正常語(yǔ)速，讓每個(gè)片段的時(shí)間長(zhǎng)度不大于正常人說(shuō)一個(gè)中文字的時(shí) 間長(zhǎng)度。
[0019] 用戶語(yǔ)音的連續(xù)的多個(gè)片段可以通過(guò)計(jì)算機(jī)設(shè)備的音頻接收器等收集。
[0020] 步驟120,參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征，獲取目標(biāo)中文熱詞中各個(gè) 字在每個(gè)片段中出現(xiàn)的概率。
[0021] 目標(biāo)中文熱詞是指預(yù)先設(shè)定的中文形式的熱詞，例如預(yù)先設(shè)定"你好問(wèn)問(wèn)"作為開(kāi) 啟"出門問(wèn)問(wèn)"應(yīng)用的熱詞。
[0022] 字的標(biāo)準(zhǔn)語(yǔ)音特征可以是這個(gè)字發(fā)音的聲波波形，也可以是對(duì)該字發(fā)音聲波波形處理后的數(shù)據(jù)，該語(yǔ)音特征的出現(xiàn)就代表了該字的出現(xiàn)。
[0023]目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征可以是從不同的人說(shuō)目標(biāo)中文熱詞中每個(gè)字的語(yǔ)音的樣本中利用已知的機(jī)器學(xué)習(xí)方法得到的。
[0024] 例如，目標(biāo)中文熱詞是"你好問(wèn)問(wèn)"。將大量的人說(shuō)"你"、"好"、"問(wèn)1"、"問(wèn)2"中的每個(gè)字的語(yǔ)音作為樣本輸入機(jī)器學(xué)習(xí)的一個(gè)模型，該模型從大量的人說(shuō)"你"的語(yǔ)音樣本的聲波波形中進(jìn)行學(xué)習(xí)，學(xué)習(xí)所有這些"你"的語(yǔ)音樣本的聲波波形的規(guī)律，經(jīng)處理后就得到了共性的語(yǔ)音特征作為"你"的標(biāo)準(zhǔn)語(yǔ)音特征。當(dāng)該模型再接收到一個(gè)新的字的語(yǔ)音后，該模型就能識(shí)別出該新的字是不是"你"、以及是"你"的概率。"好"、"問(wèn)1"、"問(wèn)2"的標(biāo)準(zhǔn)語(yǔ) 音特征也可以類似地得到。
[0025] 目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征也可以是事先規(guī)定的，例如來(lái)自于教科書。
[0026] 在一種實(shí)施方式中，參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率是通過(guò)深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法實(shí)現(xiàn)的。
[0027] 深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練以目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征為標(biāo)準(zhǔn)，通過(guò)差值優(yōu) 化，不斷地對(duì)每個(gè)片段是否出現(xiàn)目標(biāo)中文熱詞中的字進(jìn)行分析，最終得到目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率。深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法是成熟的現(xiàn)有技術(shù)，在這里就不再詳細(xì)表述。當(dāng)然本領(lǐng)域的技術(shù)人員也可采用其他機(jī)器學(xué)習(xí)方法作為該步驟的分析方法，比如多層神經(jīng)網(wǎng)絡(luò)訓(xùn)練等。
[0028] 步驟130,基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率，獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率。
[0029] 在一種實(shí)施方式中，步驟130是通過(guò)基于時(shí)間的隱藏馬爾科夫模型實(shí)現(xiàn)的，其中在所述基于時(shí)間的隱藏馬爾科夫模型中，以目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序，限制所述基于時(shí)間的隱藏馬爾科夫模型在各個(gè)連續(xù)片段間出現(xiàn)的目標(biāo)中文熱詞中的字之間的轉(zhuǎn)移路徑。
[0030] 目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序是指規(guī)定的目標(biāo)中文熱詞中字的前后順序。例如，規(guī)定"你好問(wèn)問(wèn)"是啟動(dòng)應(yīng)用"出門問(wèn)問(wèn)"的熱詞，則標(biāo)準(zhǔn)前后順序就是"你"、"好"、"問(wèn) 1"、"問(wèn)2"。轉(zhuǎn)移路徑是隱藏馬爾科夫模型中的術(shù)語(yǔ)，是將各個(gè)片段中判斷出來(lái)的字和相應(yīng) 概率相連接形成的路徑。
[0031] 為了清晰而簡(jiǎn)潔的描述基于時(shí)間的隱藏馬爾科夫模型的工作流程，建立以下表格進(jìn)行闡釋，該表格僅作為示例，而不作為對(duì)本發(fā)明的限制。
[0032]
[0033]
[0034] 該表中，目標(biāo)中文熱詞為"你好問(wèn)問(wèn)"。每一行的數(shù)字表示在每一片段中，出現(xiàn)目標(biāo) 中文熱詞中各個(gè)相應(yīng)字的概率。
[0035] 對(duì)片段nl至n7這個(gè)7個(gè)連續(xù)的片段，按照目標(biāo)中文熱詞"你好問(wèn)問(wèn)"的順序，在片段nl中應(yīng)當(dāng)找到"你"，而不是概率更高的"好"，作為基于時(shí)間的隱藏馬爾科夫模型的起始；由于必須以"你好問(wèn)問(wèn)"為順序，因此由片段nl向片段n2的轉(zhuǎn)移路徑只有"你"到"你"， "你"到"好"兩種，又因?yàn)橐易畲蟾怕兽D(zhuǎn)移路徑，片段n2中"你"的概率大于"好"，因此由語(yǔ)音單元nl到語(yǔ)音單元n2的轉(zhuǎn)移路徑是"你"到"你"；基于以上原理，由語(yǔ)音單元n2到語(yǔ)音單元n3的轉(zhuǎn)移路徑有"你"到"你"，"你"到"好"兩種，因?yàn)樵谡Z(yǔ)音單元n3中"你"和 "好"概率相等，因此由語(yǔ)音單元n2到語(yǔ)音單元n3的轉(zhuǎn)移路徑有兩種"你"到"你"和"你"到 "好";那么接下來(lái)的路徑就有"你"到"你"，"你"到"好"，"好"到"問(wèn)"三種，根據(jù)概率最大來(lái) 判斷，應(yīng)為"好"到"問(wèn)"；其后的按此原則依次類推，就可以得到該七個(gè)連續(xù)片段中，目標(biāo)中文熱詞中的字的轉(zhuǎn)移路徑為："你"一〉"你"一〉"好"一〉"問(wèn)"一〉"問(wèn)"一〉"問(wèn)"一 > "問(wèn)"，該路徑出現(xiàn)的概率為與在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率。
[0036] 根據(jù)本發(fā)明的一個(gè)實(shí)施例，所述最大概率的算法是將轉(zhuǎn)移路徑中所有字出現(xiàn) 概率進(jìn)行等權(quán)相加再除以轉(zhuǎn)移路徑中字的個(gè)數(shù)。比如，在上述表格中，所述最大概率為 (0. 1+0. 6+0. 4+0. 6+0. 8+0. 4+0. 5)/7 = 0. 49。當(dāng)然，最大概率的算法也可以是其他合理的形式。
[0037] 步驟140,基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。
[0038] 在一種實(shí)施方式中，可以將所述最大概率與預(yù)定閾值相比較，大于預(yù)定閾值的，認(rèn) 為在所述用戶語(yǔ)音中有目標(biāo)中文熱詞。
[0039] 例如，該預(yù)定閾值設(shè)置為1除以目標(biāo)中文熱詞中的個(gè)數(shù)。比如，在上述表格中，所述接受概率閾值為1/4 = 0. 25。將步驟130中獲取的最大概率與該預(yù)定閾值比較。由于 0. 49大于0. 25,那么認(rèn)為在上述表格的例子中，片段nl至n7這7個(gè)連續(xù)的片段中出現(xiàn)了目標(biāo)中文熱詞"你好問(wèn)問(wèn)"。當(dāng)然，預(yù)定閾值也可以通過(guò)其他合理的形式設(shè)定。
[0040] 如果只應(yīng)用深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練對(duì)片段進(jìn)行分析，就會(huì)對(duì)收集片段的時(shí)間長(zhǎng)度加以限制。因?yàn)樯顚由窠?jīng)網(wǎng)絡(luò)訓(xùn)練智能在語(yǔ)音層面上保證一個(gè)小時(shí)間片段上的順序，最多300ms 左右。如果欲在語(yǔ)音層面上保證長(zhǎng)時(shí)間的順序，就要加長(zhǎng)檢測(cè)時(shí)間長(zhǎng)度，比如大于300ms，這種加長(zhǎng)檢測(cè)時(shí)間長(zhǎng)度，即加長(zhǎng)檢測(cè)延遲的手段不但會(huì)給之后的分析帶來(lái)更高的能耗，而且依然不能保證字層面上的順序。本發(fā)明實(shí)施例獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率從而檢測(cè)用戶語(yǔ)音中是否有目標(biāo)中文熱詞的方式還減輕了加長(zhǎng)檢測(cè)時(shí)間長(zhǎng)度的負(fù)面影響。
[0041] 如圖2所示，本發(fā)明的另一個(gè)實(shí)施例提供了一種中文熱詞檢測(cè)裝置2,包括：收集模塊210,被配置為收集用戶語(yǔ)音的連續(xù)的多個(gè)片段；第一獲取模塊220,被配置為參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征，獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率；第二獲取模塊230,被配置為基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率，獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo) 中文熱詞的最大概率；檢測(cè)模塊240,被配置為基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。上述各模塊可以通過(guò)軟件、硬件（FPGA、集成電路等）或軟硬件結(jié)合的方式實(shí)現(xiàn)。
[0042] 可選地，所述多個(gè)片段是等時(shí)間長(zhǎng)度的多個(gè)片段。
[0043] 可選地，目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征是從不同的人說(shuō)目標(biāo)中文熱詞中每個(gè)字的語(yǔ)音的樣本中利用機(jī)器學(xué)習(xí)得到的。
[0044] 可選地，檢測(cè)模塊240進(jìn)一步被配置為：將所述最大概率與預(yù)定閾值相比較，大于預(yù)定閾值的，認(rèn)為在所述用戶語(yǔ)音中有目標(biāo)中文熱詞。
[0045] 可選地，第一獲取模塊220通過(guò)深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法獲取目標(biāo)中文熱詞中各個(gè) 字在每個(gè)片段中出現(xiàn)的概率。
[0046] 可選地，第二獲取模塊230通過(guò)基于時(shí)間的隱藏馬爾科夫模型獲取在不違背目標(biāo) 中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率，其中在所述基于時(shí)間的隱藏馬爾科夫模型中，以目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序，限制所述基于時(shí)間的隱藏馬爾科夫模型在各個(gè)連續(xù)片段間出現(xiàn)的目標(biāo)中文熱詞中的字之間的轉(zhuǎn)移路徑。
[0047] 附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上，流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段或代碼的一部分，所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意的是，框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合，可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn)，或者可以用專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。
[0048] 對(duì)于本領(lǐng)域技術(shù)人員而言，顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié)，而且在不背離本發(fā)明的精神或基本特征的情況下，能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此，無(wú)論從哪一點(diǎn)來(lái)看，均應(yīng)將實(shí)施例看作是示范性的，而且是非限制性的，本發(fā)明的范圍由所附權(quán) 利要求而不是上述說(shuō)明限定，因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。
【主權(quán)項(xiàng)】
1. 一種中文熱詞檢測(cè)方法（1)，包括：收集用戶語(yǔ)音的連續(xù)的多個(gè)片段（110); 參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征，獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率（120); 基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率，獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率（130); 基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞（140)。2. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法，其中所述多個(gè)片段是等時(shí)間長(zhǎng)度的多個(gè)片段。3. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法，其中目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征是從不同的人說(shuō)目標(biāo)中文熱詞中每個(gè)字的語(yǔ)音的樣本中利用機(jī)器學(xué)習(xí)得到的。4. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法，其中基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞的步驟（140)包括：將所述最大概率與預(yù)定閾值相比較，大于預(yù)定閾值的，認(rèn)為在所述用戶語(yǔ)音中有目標(biāo)中文熱詞。5. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法，其中獲取目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率的步驟（120)是通過(guò)深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法實(shí)現(xiàn)的。6. 根據(jù)權(quán)利要求1的中文熱詞檢測(cè)方法，其中獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn) 前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率的步驟（130)是通過(guò) 基于時(shí)間的隱藏馬爾科夫模型實(shí)現(xiàn)的，其中在所述基于時(shí)間的隱藏馬爾科夫模型中，以目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序，限制所述基于時(shí)間的隱藏馬爾科夫模型在各個(gè)連續(xù)片段間出現(xiàn)的目標(biāo)中文熱詞中的字之間的轉(zhuǎn)移路徑。7. -種中文熱詞檢測(cè)裝置（2)，包括：收集模塊（210)，被配置為收集用戶語(yǔ)音的連續(xù)的多個(gè)片段；第一獲取模塊（220)，被配置為參照目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征，獲取目標(biāo) 中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率；第二獲取模塊（230)，被配置為基于上述目標(biāo)中文熱詞中各個(gè)字在每個(gè)片段中出現(xiàn)的概率，獲取在不違背目標(biāo)中文熱詞的字的標(biāo)準(zhǔn)前后順序的前提下所述多個(gè)片段中出現(xiàn)該目標(biāo)中文熱詞的最大概率；檢測(cè)模塊（240)，被配置為基于所述最大概率檢測(cè)在用戶語(yǔ)音中是否有目標(biāo)中文熱詞。8. 根據(jù)權(quán)利要求7的中文熱詞檢測(cè)裝置，其中所述多個(gè)片段是等時(shí)間長(zhǎng)度的多個(gè)片段。9. 根據(jù)權(quán)利要求7的中文熱詞檢測(cè)裝置，其中目標(biāo)中文熱詞中每個(gè)字的標(biāo)準(zhǔn)語(yǔ)音特征是從不同的人說(shuō)目標(biāo)中文熱詞中每個(gè)字的語(yǔ)音的樣本中利用機(jī)器學(xué)習(xí)得到的。10. 根據(jù)權(quán)利要求7的中文熱詞檢測(cè)裝置，其中檢測(cè)模塊（240)進(jìn)一步被配置為：將所述最大概率與預(yù)定閾值相比較，大于預(yù)定閾值的，認(rèn)為在所述用戶語(yǔ)音中有目標(biāo)中文熱詞。
【文檔編號(hào)】G10L15/02GK105869622SQ201510031181
【公開(kāi)日】2016年8月17日
【申請(qǐng)日】2015年1月21日
【發(fā)明人】雷欣, 李倩
【申請(qǐng)人】上海羽扇智信息科技有限公司

完整全部詳細(xì)技術(shù)資料下載