名稱的語音識別方法、語音識別系統(tǒng)和語音識別設(shè)備的制作方法

文檔序號：2828096閱讀：229來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

名稱的語音識別方法、語音識別系統(tǒng)和語音識別設(shè)備的制作方法
【專利摘要】本發(fā)明提供了一種名稱的語音識別方法、一種名稱的語音識別系統(tǒng)和一種名稱的語音識別設(shè)備，其中，名稱的語音識別方法，包括：獲取所述名稱的語音字符串；根據(jù)所述語音字符串創(chuàng)建單詞查找樹；判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配；以及在判定所述名稱信息與所述預(yù)存的名稱信息匹配時(shí)向用戶提示所述名稱的語音識別結(jié)果。通過本發(fā)明的技術(shù)方案，提高了語音識別過程中的識別準(zhǔn)確率和識別效率，同時(shí)，降低了對于用戶發(fā)出語音指令的語調(diào)、語速和音色的要求，提升了用戶的使用體驗(yàn)。
【專利說明】名稱的語音識別方法、語音識別系統(tǒng)和語音識別設(shè)備

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音識別【技術(shù)領(lǐng)域】，具體而言，涉及一種名稱的語音識別方法、一種名稱的語音識別系統(tǒng)和一種名稱的語音識別設(shè)備。

【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)處理能力的迅速提高，語音識別技術(shù)得到了飛速發(fā)展，并且正在日益改變?nèi)祟惖纳a(chǎn)和生活方式，被廣泛應(yīng)用于諸如語音輸入系統(tǒng)、語音控制系統(tǒng)和智能對話查詢系統(tǒng)等領(lǐng)域。
[0003] 語音識別技術(shù)是通過識別和解析過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)，其具體過程包括：
[0004] (1)采集和預(yù)處理步驟：未知語音經(jīng)過話筒變換成電信號后加在識別系統(tǒng)的輸入端，經(jīng)過預(yù)處理過程對電信號進(jìn)行降噪和濾波等處理，以初步提高信噪比；
[0005] (2)識別步驟：對經(jīng)過預(yù)處理的電信號進(jìn)行識別處理，根據(jù)用戶的語音特定建立語音模型，根據(jù)語音模型對電信號進(jìn)行分析，抽取電信號中包括的語音特征，在此基礎(chǔ)上建立語音識別所需的模板。而計(jì)算機(jī)在識別過程中需要根據(jù)語音識別的模型，將計(jì)算機(jī)中預(yù) 存儲的語音模板和輸入的語音特征進(jìn)行匹配，按照預(yù)定的匹配策略找出最優(yōu)的匹配模板；
[0006] (3)后處理步驟：根據(jù)模板的映射表和定義獲知語音特征對應(yīng)的文本信息。
[0007] 其中，識別步驟作為語音識別的重要步驟通常有以下幾個指標(biāo)作為衡量標(biāo)準(zhǔn)：
[0008] (1)詞匯表范圍：語音設(shè)備能夠識別的單詞或詞組的范圍；
[0009] (2)說話人限制：語音設(shè)備能夠識別指定語音、語調(diào)和音色的語音信息；
[0010] (3)訓(xùn)練要求：語音設(shè)備是否經(jīng)過大量語音信號的識別訓(xùn)練過程；
[0011] (4)識別率：語音設(shè)備能夠平均正確識別的百分?jǐn)?shù)，取決于前三個參數(shù)。
[0012] 相關(guān)技術(shù)中，名稱作為最主要的語音識別對象之一，針對上述語音識別參數(shù)而言存在以下問題：
[0013] (1)將連續(xù)的語音信息分解為詞、音素等單位，語音識別過程較慢因此要求用戶語速不能過快；
[0014] (2)語音信息量大，受用戶發(fā)出語音指令的方式影響，會對識別過程產(chǎn)生影響甚至誤判；
[0015] (3)單個字母或詞、字的語音特性受上下文影響，會影響語音識別的誤判；
[0016] (4)語音的混淆音影響，具體地，如同音字、前后鼻音、平翹舌音和混淆音，都會影響語音識別的誤判；
[0017] (5)環(huán)境噪聲和干擾對語音識別過程產(chǎn)生嚴(yán)重影響。
[0018] 因此，如何設(shè)計(jì)名稱的語音識別方案提高識別過程的準(zhǔn)確率和識別效率成為亟待解決的技術(shù)問題。

【發(fā)明內(nèi)容】

[0019] 本發(fā)明正是基于上述技術(shù)問題至少之一，提出了一種新的名稱的語音識別方案和一種語音識別設(shè)備。
[0020] 有鑒于此，本發(fā)明提出了一種名稱的語音識別方法，包括：獲取所述名稱的語音字符串；根據(jù)所述語音字符串創(chuàng)建單詞查找樹；判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配；以及在判定所述名稱信息與所述預(yù)存的名稱信息匹配時(shí)向用戶提示所述名稱的語音識別結(jié)果。
[0021] 在該技術(shù)方案中，通過根據(jù)語音字符串創(chuàng)建單詞查找樹（trie樹），實(shí)現(xiàn)了名稱的快速和準(zhǔn)確查找，由于識別效率高且速度快，故識別過程受到環(huán)境噪聲影響極小，具體地，將名稱的語音字符串中的單個字符依次生成單詞查找樹中的節(jié)點(diǎn)，并且將每個節(jié)點(diǎn)拓展為相關(guān)信息，例如，名稱的全拼、簡拼、容易拼錯的漢字拼音組合、容易讀錯的漢字拼音組合以及名稱中的相關(guān)職位信息等，將有連接關(guān)系的節(jié)點(diǎn)根據(jù)生成順序和映射模板轉(zhuǎn)換為文本信息，最終將所有的文本信息列表向用戶進(jìn)行提示。
[0022] 其中，單詞查找樹具備節(jié)省存儲空間和查詢速度極快的特點(diǎn)，具體地，單詞查找樹包括漢字查找樹和字母查找樹，例如用戶輸入的名稱為中文名稱則同時(shí)生產(chǎn)漢字查找樹和字母查找樹，也同時(shí)向用戶提示漢字查找樹和字母查找樹生成的語音識別結(jié)果，或者生成漢字查找樹，在生成的漢字查找樹中沒有語言識別結(jié)果時(shí)，則生成字母查找樹完成語音識別過程，而在用戶輸入的名稱為外文名稱時(shí)僅生成字母查找樹，向用戶提示字母查找樹生成的語音識別結(jié)果。
[0023] 在上述技術(shù)方案中，優(yōu)選地，根據(jù)所述語音字符串創(chuàng)建單詞查找樹，包括以下具體步驟：在獲取到所述語音字符串后，創(chuàng)建至少一個詞元字符串；選擇最接近所述語音字符串的所述詞元字符串作為最優(yōu)詞元字符串；根據(jù)所述最優(yōu)詞元字符串的創(chuàng)建順序?qū)⑺鲈~ 元字符串通過分隔符劃分為至少一個單個字符串；根據(jù)所述至少一個單個字符串和所述至少一個單個字符串的劃分順序創(chuàng)建所述單詞查找樹。
[0024] 在該技術(shù)方案中，通過在創(chuàng)建的至少一個詞元字符串中選擇最接近的最優(yōu)詞元字符串，并以最優(yōu)詞元字符串創(chuàng)建單詞查找樹，實(shí)現(xiàn)了精準(zhǔn)識別模式，同時(shí)提高了識別效率，具體地，對一個最有詞元字符串進(jìn)行分割和生成單詞查找樹處理，同樣的，對每個單個字符串進(jìn)行拓展處理，拓展信息作為該單個字符串的子節(jié)點(diǎn)。
[0025] 在上述技術(shù)方案中，優(yōu)選地，根據(jù)所述至少一個單個字符串和所述至少一個單個字符串的劃分順序創(chuàng)建單詞查找樹，包括以下具體步驟：根據(jù)所述每個單個字符串創(chuàng)建第一類單詞查找樹的節(jié)點(diǎn)，其中，先劃分得到的所述單個字符串為第一類母節(jié)點(diǎn)，后劃分得到的所述單個字符串作為所述第一類母節(jié)點(diǎn)的第一類子節(jié)點(diǎn)。
[0026] 在上述技術(shù)方案中，優(yōu)選地，判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配，包括以下具體步驟：在所述第一類單詞查找樹不與所述預(yù)存的所述名稱信息匹配時(shí)，根據(jù)所述語音字符串創(chuàng)建第二類單詞查找樹；判斷所述第二類單詞查找樹是否與所述預(yù)存的名稱信息匹配。
[0027] 在該技術(shù)方案中，通過在所述第一類單詞查找樹不與預(yù)存的名稱信息匹配時(shí)，創(chuàng) 建第二類單詞查找樹繼續(xù)進(jìn)行語音識別，增加了語音識別過程的多樣性，更便于為用戶提供準(zhǔn)確的識別結(jié)果，具體地，如第一類單詞查找樹生成了漢字查找樹或字母查找樹，遍歷漢字查找樹和字母查找樹后均為得到語音識別結(jié)果，此時(shí)，創(chuàng)建第二類單詞查找樹，例如字符查找樹，也即在名稱中加入了字符信息，如語音輸入信息為"Lily'suncle"，在遍歷包括Lily的第一類單詞查找樹后，并未獲得用戶需要的語音信息，此時(shí)，創(chuàng)建例如"Lily's" 的第二類單詞查找樹，會生成包括諸如"李麗的叔叔"、"麗麗的叔叔"、"李莉的叔叔"以及 "Lily'suncle"等字符串的第二類單詞查找樹，并將所有的語音識別結(jié)果提示給用戶。
[0028] 在上述技術(shù)方案中，優(yōu)選地，根據(jù)所述語音字符串創(chuàng)建第二類單詞查找樹，包括以下具體步驟：在獲取到所述語音字符串后，創(chuàng)建所述至少一個詞元字符串；創(chuàng)建每個所述詞元字符串的至少一個混淆音字符串；根據(jù)所述至少一個混淆音字符串的創(chuàng)建順序?qū)⑺?至少一個混淆音字符串通過分隔符劃分為至少一個單個混淆音字符串；將通過所述分隔符劃分的所述至少一個單個混淆音字符串中的相同單個混淆音字符串放置于所述單詞查找樹的一個節(jié)點(diǎn)位置，其中，先劃分得到的所述單個混淆音字符串為第二類母節(jié)點(diǎn)，后劃分得到的所述單個混淆音字符串作為所述第二類母節(jié)點(diǎn)的第二類子節(jié)點(diǎn)。
[0029] 在該技術(shù)方案中，通過創(chuàng)建基于混淆音的單詞查找樹，可以提高語音識別效率和豐富的語音識別結(jié)果，具體地，以漢語發(fā)音為例，當(dāng)語音設(shè)備獲取用戶的語音指令為 "zhang"，會生成"zhang"的全部混淆音字符串，例如"zang"、"zhan"和"zan"等，對"zang"、 "zhan"和"zan"進(jìn)行字符劃分后，生成包括"zang"、"zhan"和"zan"的單詞查找樹，并將單詞查找樹的生成結(jié)果提示給用戶，這種識別方式降低了對用戶的發(fā)音準(zhǔn)確度和語速的要求，提升了用戶的使用體驗(yàn)。
[0030] 根據(jù)本發(fā)明的另一方面，還提出了一種名稱的語音識別系統(tǒng)，包括：獲取單元，用于獲取所述名稱的語音字符串；創(chuàng)建單元，用于根據(jù)所述語音字符串創(chuàng)建單詞查找樹；判斷單元，用于判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配；以及提示單元，用于在判定所述名稱信息與所述預(yù)存的名稱信息匹配時(shí)向用戶提示所述名稱的語音識別結(jié)果。
[0031] 在該技術(shù)方案中，通過根據(jù)語音字符串創(chuàng)建單詞查找樹（trie樹），實(shí)現(xiàn)了名稱的快速和準(zhǔn)確查找，由于識別效率高且速度快，故識別過程受到環(huán)境噪聲影響極小，具體地，將名稱的語音字符串中的單個字符依次生成單詞查找樹中的節(jié)點(diǎn)，并且將每個節(jié)點(diǎn)拓展為相關(guān)信息，例如，名稱的全拼、簡拼、容易拼錯的漢字拼音組合、容易讀錯的漢字拼音組合以及名稱中的相關(guān)職位信息等，將有連接關(guān)系的節(jié)點(diǎn)根據(jù)生成順序和映射模板轉(zhuǎn)換為文本信息，最終將所有的文本信息列表向用戶進(jìn)行提示。
[0032] 其中，單詞查找樹具備節(jié)省存儲空間和查詢速度極快的特點(diǎn)，具體地，單詞查找樹包括漢字查找樹和字母查找樹，例如用戶輸入的名稱為中文名稱則同時(shí)生產(chǎn)漢字查找樹和字母查找樹，也同時(shí)向用戶提示漢字查找樹和字母查找樹生成的語音識別結(jié)果，或者生成漢字查找樹，在生成的漢字查找樹中沒有語言識別結(jié)果時(shí)，則生成字母查找樹完成語音識別過程，而在用戶輸入的名稱為外文名稱時(shí)僅生成字母查找樹，向用戶提示字母查找樹生成的語音識別結(jié)果。
[0033] 在上述技術(shù)方案中，優(yōu)選地，所述創(chuàng)建單元還用于，在獲取到所述語音字符串后，創(chuàng)建至少一個詞元字符串；所述名稱的語音識別系統(tǒng)，還包括：選擇單元，用于選擇最接近所述語音字符串的所述詞元字符串作為最優(yōu)詞元字符串；劃分單元，用于根據(jù)所述最優(yōu)詞元字符串的創(chuàng)建順序?qū)⑺鲈~元字符串通過分隔符劃分為至少一個單個字符串；所述創(chuàng)建單元還用于，根據(jù)所述至少一個單個字符串和所述至少一個單個字符串的劃分順序創(chuàng)建所述單詞查找樹。
[0034] 在該技術(shù)方案中，通過在創(chuàng)建的至少一個詞元字符串中選擇最接近的最優(yōu)詞元字符串，并以最優(yōu)詞元字符串創(chuàng)建單詞查找樹，實(shí)現(xiàn)了精準(zhǔn)識別模式，同時(shí)提高了識別效率，具體地，對一個最有詞元字符串進(jìn)行分割和生成單詞查找樹處理，同樣的，對每個單個字符串進(jìn)行拓展處理，拓展信息作為該單個字符串的子節(jié)點(diǎn)。
[0035] 在上述技術(shù)方案中，優(yōu)選地，所述創(chuàng)建單元還用于，根據(jù)所述每個單個字符串創(chuàng)建第一類單詞查找樹的節(jié)點(diǎn)，其中，先劃分得到的所述單個字符串為第一類母節(jié)點(diǎn)，后劃分得到的所述單個字符串作為所述第一類母節(jié)點(diǎn)的第一類子節(jié)點(diǎn)。
[0036] 在上述技術(shù)方案中，優(yōu)選地，所述創(chuàng)建單元還用于，在所述第一類單詞查找樹不與所述預(yù)存的所述名稱信息匹配時(shí)，根據(jù)所述語音字符串創(chuàng)建第二類單詞查找樹；所述判斷單元還用于，判斷所述第二類單詞查找樹是否與所述預(yù)存的名稱信息匹配。
[0037] 在該技術(shù)方案中，通過在所述第一類單詞查找樹不與預(yù)存的名稱信息匹配時(shí)，創(chuàng) 建第二類單詞查找樹繼續(xù)進(jìn)行語音識別，增加了語音識別過程的多樣性，更便于為用戶提供準(zhǔn)確的識別結(jié)果，具體地，如第一類單詞查找樹生成了漢字查找樹或字母查找樹，遍歷漢字查找樹和字母查找樹后均為得到語音識別結(jié)果，此時(shí)，創(chuàng)建第二類單詞查找樹，例如字符查找樹，也即在名稱中加入了字符信息，如語音輸入信息為"Lily'suncle"，在遍歷包括Lily的第一類單詞查找樹后，并未獲得用戶需要的語音信息，此時(shí)，創(chuàng)建例如"Lily's" 的第二類單詞查找樹，會生成包括諸如"李麗的叔叔"、"麗麗的叔叔"、"李莉的叔叔"以及 "Lily'suncle"等字符串的第二類單詞查找樹，并將所有的語音識別結(jié)果提示給用戶。
[0038] 在上述技術(shù)方案中，優(yōu)選地，所述創(chuàng)建單元還用于，在獲取到所述語音字符串后，創(chuàng)建所述至少一個詞元字符串；所述創(chuàng)建單元還用于，創(chuàng)建每個所述詞元字符串的至少一個混淆音字符串；所述劃分單元還用于，根據(jù)所述至少一個混淆音字符串的創(chuàng)建順序?qū)⑺?述至少一個混淆音字符串通過分隔符劃分為至少一個單個混淆音字符串；所述創(chuàng)建單元還用于，將通過所述分隔符劃分的所述至少一個單個混淆音字符串中的相同單個混淆音字符串放置于所述單詞查找樹的一個節(jié)點(diǎn)位置，其中，先劃分得到的所述單個混淆音字符串為第二類母節(jié)點(diǎn)，后劃分得到的所述單個混淆音字符串作為所述第二類母節(jié)點(diǎn)的第二類子節(jié) 點(diǎn)。
[0039] 在該技術(shù)方案中，通過創(chuàng)建基于混淆音的單詞查找樹，可以提高語音識別效率和豐富的語音識別結(jié)果，具體地，以漢語發(fā)音為例，當(dāng)語音設(shè)備獲取用戶的語音指令為 "zhang"，會生成"zhang"的全部混淆音字符串，例如"zang"、"zhan"和"zan"等，對"zang"、 "zhan"和"zan"進(jìn)行字符劃分后，生成包括"zang"、"zhan"和"zan"的單詞查找樹，并將單詞查找樹的生成結(jié)果提示給用戶，這種識別方式降低了對用戶的發(fā)音準(zhǔn)確度和語速的要求，提升了用戶的使用體驗(yàn)。
[0040] 根據(jù)本發(fā)明的第三方面，還提出了一種名稱的語音識別設(shè)備，包括：如上述任一項(xiàng) 技術(shù)方案所述的名稱的語音識別系統(tǒng)。
[0041] 通過以上技術(shù)方案，提高了語音識別過程中的識別準(zhǔn)確率和識別效率，同時(shí)，降低了對于用戶發(fā)出語音指令的語調(diào)、語速和音色的要求，提升了用戶的使用體驗(yàn)。

【專利附圖】

【附圖說明】
[0042] 圖1示出了根據(jù)本發(fā)明的一個實(shí)施例的名稱的語音識別方法的示意流程圖；
[0043] 圖2示出了根據(jù)本發(fā)明的實(shí)施例的名稱的語音識別系統(tǒng)的示意框圖；
[0044] 圖3示出了根據(jù)本發(fā)明的另一個實(shí)施例的名稱的語音識別方法的示意流程圖；
[0045] 圖4示出了根據(jù)本發(fā)明的一個實(shí)施例的名稱的語音識別方法的單詞查找樹的示意圖；
[0046] 圖5示出了根據(jù)本發(fā)明的另一個實(shí)施例的名稱的語音識別方法的單詞查找樹的示意圖。

【具體實(shí)施方式】
[0047] 為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點(diǎn)，下面結(jié)合附圖和具體實(shí) 施方式對本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述。需要說明的是，在不沖突的情況下，本申請的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0048] 在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明，但是，本發(fā)明還可以采用其他不同于在此描述的其他方式來實(shí)施，因此，本發(fā)明的保護(hù)范圍并不受下面公開的具體實(shí)施例的限制。
[0049] 圖1示出了根據(jù)本發(fā)明的實(shí)施例的名稱的語音識別方法的示意流程圖。
[0050] 如圖1所示，根據(jù)本發(fā)明的實(shí)施例的名稱的語音識別方法，包括：步驟102,獲取所述名稱的語音字符串；步驟104,根據(jù)所述語音字符串創(chuàng)建單詞查找樹；步驟106,判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配；步驟108,以及在判定所述名稱信息與所述預(yù)存的名稱信息匹配時(shí)向用戶提示所述名稱的語音識別結(jié)果。
[0051] 在該技術(shù)方案中，通過根據(jù)語音字符串創(chuàng)建單詞查找樹（trie樹），實(shí)現(xiàn)了名稱的快速和準(zhǔn)確查找，由于識別效率高且速度快，故識別過程受到環(huán)境噪聲影響極小，具體地，將名稱的語音字符串中的單個字符依次生成單詞查找樹中的節(jié)點(diǎn)，并且將每個節(jié)點(diǎn)拓展為相關(guān)信息，例如，名稱的全拼、簡拼、容易拼錯的漢字拼音組合、容易讀錯的漢字拼音組合以及名稱中的相關(guān)職位信息等，將有連接關(guān)系的節(jié)點(diǎn)根據(jù)生成順序和映射模板轉(zhuǎn)換為文本信息，最終將所有的文本信息列表向用戶進(jìn)行提示。
[0052] 其中，單詞查找樹具備節(jié)省存儲空間和查詢速度極快的特點(diǎn)，具體地，單詞查找樹包括漢字查找樹和字母查找樹，例如用戶輸入的名稱為中文名稱則同時(shí)生產(chǎn)漢字查找樹和字母查找樹，也同時(shí)向用戶提示漢字查找樹和字母查找樹生成的語音識別結(jié)果，或者生成漢字查找樹，在生成的漢字查找樹中沒有語言識別結(jié)果時(shí)，則生成字母查找樹完成語音識別過程，而在用戶輸入的名稱為外文名稱時(shí)僅生成字母查找樹，向用戶提示字母查找樹生成的語音識別結(jié)果。
[0053] 在上述技術(shù)方案中，優(yōu)選地，根據(jù)所述語音字符串創(chuàng)建單詞查找樹，包括以下具體步驟：在獲取到所述語音字符串后，創(chuàng)建至少一個詞元字符串；選擇最接近所述語音字符串的所述詞元字符串作為最優(yōu)詞元字符串；根據(jù)所述最優(yōu)詞元字符串的創(chuàng)建順序?qū)⑺鲈~ 元字符串通過分隔符劃分為至少一個單個字符串；根據(jù)所述至少一個單個字符串和所述至少一個單個字符串的劃分順序創(chuàng)建所述單詞查找樹。
[0054] 在該技術(shù)方案中，通過在創(chuàng)建的至少一個詞元字符串中選擇最接近的最優(yōu)詞元字符串，并以最優(yōu)詞元字符串創(chuàng)建單詞查找樹，實(shí)現(xiàn)了精準(zhǔn)識別模式，同時(shí)提高了識別效率，具體地，對一個最有詞元字符串進(jìn)行分割和生成單詞查找樹處理，同樣的，對每個單個字符串進(jìn)行拓展處理，拓展信息作為該單個字符串的子節(jié)點(diǎn)。
[0055] 在上述技術(shù)方案中，優(yōu)選地，根據(jù)所述至少一個單個字符串和所述至少一個單個字符串的劃分順序創(chuàng)建單詞查找樹，包括以下具體步驟：根據(jù)所述每個單個字符串創(chuàng)建第一類單詞查找樹的節(jié)點(diǎn)，其中，先劃分得到的所述單個字符串為第一類母節(jié)點(diǎn)，后劃分得到的所述單個字符串作為所述第一類母節(jié)點(diǎn)的第一類子節(jié)點(diǎn)。
[0056] 在上述技術(shù)方案中，優(yōu)選地，判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配，包括以下具體步驟：在所述第一類單詞查找樹不與所述預(yù)存的所述名稱信息匹配時(shí)，根據(jù)所述語音字符串創(chuàng)建第二類單詞查找樹；判斷所述第二類單詞查找樹是否與所述預(yù)存的名稱信息匹配。
[0057] 在該技術(shù)方案中，通過在所述第一類單詞查找樹不與預(yù)存的名稱信息匹配時(shí)，創(chuàng) 建第二類單詞查找樹繼續(xù)進(jìn)行語音識別，增加了語音識別過程的多樣性，更便于為用戶提供準(zhǔn)確的識別結(jié)果，具體地，如第一類單詞查找樹生成了漢字查找樹或字母查找樹，遍歷漢字查找樹和字母查找樹后均為得到語音識別結(jié)果，此時(shí)，創(chuàng)建第二類單詞查找樹，例如字符查找樹，也即在名稱中加入了字符信息，如語音輸入信息為"Lily'suncle"，在遍歷包括Lily的第一類單詞查找樹后，并未獲得用戶需要的語音信息，此時(shí)，創(chuàng)建例如"Lily's" 的第二類單詞查找樹，會生成包括諸如"李麗的叔叔"、"麗麗的叔叔"、"李莉的叔叔"以及 "Lily'suncle"等字符串的第二類單詞查找樹，并將所有的語音識別結(jié)果提示給用戶。
[0058] 在上述技術(shù)方案中，優(yōu)選地，根據(jù)所述語音字符串創(chuàng)建第二類單詞查找樹，包括以下具體步驟：在獲取到所述語音字符串后，創(chuàng)建所述至少一個詞元字符串；創(chuàng)建每個所述詞元字符串的至少一個混淆音字符串；根據(jù)所述至少一個混淆音字符串的創(chuàng)建順序?qū)⑺?至少一個混淆音字符串通過分隔符劃分為至少一個單個混淆音字符串；將通過所述分隔符劃分的所述至少一個單個混淆音字符串中的相同單個混淆音字符串放置于所述單詞查找樹的一個節(jié)點(diǎn)位置，其中，先劃分得到的所述單個混淆音字符串為第二類母節(jié)點(diǎn)，后劃分得到的所述單個混淆音字符串作為所述第二類母節(jié)點(diǎn)的第二類子節(jié)點(diǎn)。
[0059] 在該技術(shù)方案中，通過創(chuàng)建基于混淆音的單詞查找樹，可以提高語音識別效率和豐富的語音識別結(jié)果，具體地，以漢語發(fā)音為例，當(dāng)語音設(shè)備獲取用戶的語音指令為 "zhang"，會生成"zhang"的全部混淆音字符串，例如"zang"、"zhan"和"zan"等，對"zang"、 "zhan"和"zan"進(jìn)行字符劃分后，生成包括"zang"、"zhan"和"zan"的單詞查找樹，并將單詞查找樹的生成結(jié)果提示給用戶，這種識別方式降低了對用戶的發(fā)音準(zhǔn)確度和語速的要求，提升了用戶的使用體驗(yàn)。
[0060] 圖2示出了根據(jù)本發(fā)明的實(shí)施例的名稱的語音識別系統(tǒng)的示意框圖。
[0061] 如圖2所示，根據(jù)本發(fā)明的實(shí)施例的名稱的語音識別系統(tǒng)200,包括：獲取單元 202,用于獲取所述名稱的語音字符串；創(chuàng)建單元204,用于根據(jù)所述語音字符串創(chuàng)建單詞查找樹；判斷單元206,用于判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配；以及提示單元208,用于在判定所述名稱信息與所述預(yù)存的名稱信息匹配時(shí)向用戶提示所述名稱的語音識別結(jié)果。
[0062] 在該技術(shù)方案中，通過根據(jù)語音字符串創(chuàng)建單詞查找樹（trie樹），實(shí)現(xiàn)了名稱的快速和準(zhǔn)確查找，由于識別效率高且速度快，故識別過程受到環(huán)境噪聲影響極小，具體地，將名稱的語音字符串中的單個字符依次生成單詞查找樹中的節(jié)點(diǎn)，并且將每個節(jié)點(diǎn)拓展為相關(guān)信息，例如，名稱的全拼、簡拼、容易拼錯的漢字拼音組合、容易讀錯的漢字拼音組合以及名稱中的相關(guān)職位信息等，將有連接關(guān)系的節(jié)點(diǎn)根據(jù)生成順序和映射模板轉(zhuǎn)換為文本信息，最終將所有的文本信息列表向用戶進(jìn)行提示。
[0063] 其中，單詞查找樹具備節(jié)省存儲空間和查詢速度極快的特點(diǎn)，具體地，單詞查找樹包括漢字查找樹和字母查找樹，例如用戶輸入的名稱為中文名稱則同時(shí)生產(chǎn)漢字查找樹和字母查找樹，也同時(shí)向用戶提示漢字查找樹和字母查找樹生成的語音識別結(jié)果，或者生成漢字查找樹，在生成的漢字查找樹中沒有語言識別結(jié)果時(shí)，則生成字母查找樹完成語音識別過程，而在用戶輸入的名稱為外文名稱時(shí)僅生成字母查找樹，向用戶提示字母查找樹生成的語音識別結(jié)果。
[0064] 在上述技術(shù)方案中，優(yōu)選地，所述創(chuàng)建單元204還用于，在獲取到所述語音字符串后，創(chuàng)建至少一個詞元字符串；所述名稱的語音識別系統(tǒng)，還包括：選擇單元210,用于選擇最接近所述語音字符串的所述詞元字符串作為最優(yōu)詞元字符串；劃分單元212,用于根據(jù) 所述最優(yōu)詞元字符串的創(chuàng)建順序?qū)⑺鲈~元字符串通過分隔符劃分為至少一個單個字符串；所述創(chuàng)建單元204還用于，根據(jù)所述至少一個單個字符串和所述至少一個單個字符串的劃分順序創(chuàng)建所述單詞查找樹。
[0065] 在該技術(shù)方案中，通過在創(chuàng)建的至少一個詞元字符串中選擇最接近的最優(yōu)詞元字符串，并以最優(yōu)詞元字符串創(chuàng)建單詞查找樹，實(shí)現(xiàn)了精準(zhǔn)識別模式，同時(shí)提高了識別效率，具體地，對一個最有詞元字符串進(jìn)行分割和生成單詞查找樹處理，同樣的，對每個單個字符串進(jìn)行拓展處理，拓展信息作為該單個字符串的子節(jié)點(diǎn)。
[0066] 在上述技術(shù)方案中，優(yōu)選地，所述創(chuàng)建單元204還用于，根據(jù)所述每個單個字符串創(chuàng)建第一類單詞查找樹的節(jié)點(diǎn)，其中，先劃分得到的所述單個字符串為第一類母節(jié)點(diǎn)，后劃分得到的所述單個字符串作為所述第一類母節(jié)點(diǎn)的第一類子節(jié)點(diǎn)。
[0067] 在上述技術(shù)方案中，優(yōu)選地，所述創(chuàng)建單元204還用于，在所述第一類單詞查找樹不與所述預(yù)存的所述名稱信息匹配時(shí)，根據(jù)所述語音字符串創(chuàng)建第二類單詞查找樹；所述判斷單元206還用于，判斷所述第二類單詞查找樹是否與所述預(yù)存的名稱信息匹配。
[0068] 在該技術(shù)方案中，通過在所述第一類單詞查找樹不與預(yù)存的名稱信息匹配時(shí)，創(chuàng) 建第二類單詞查找樹繼續(xù)進(jìn)行語音識別，增加了語音識別過程的多樣性，更便于為用戶提供準(zhǔn)確的識別結(jié)果，具體地，如第一類單詞查找樹生成了漢字查找樹或字母查找樹，遍歷漢字查找樹和字母查找樹后均為得到語音識別結(jié)果，此時(shí)，創(chuàng)建第二類單詞查找樹，例如字符查找樹，也即在名稱中加入了字符信息，如語音輸入信息為"Lily'suncle"，在遍歷包括Lily的第一類單詞查找樹后，并未獲得用戶需要的語音信息，此時(shí)，創(chuàng)建例如"Lily's" 的第二類單詞查找樹，會生成包括諸如"李麗的叔叔"、"麗麗的叔叔"、"李莉的叔叔"以及 "Lily'suncle"等字符串的第二類單詞查找樹，并將所有的語音識別結(jié)果提示給用戶。
[0069] 在上述技術(shù)方案中，優(yōu)選地，所述創(chuàng)建單元204還用于，在獲取到所述語音字符串后，創(chuàng)建所述至少一個詞元字符串；所述創(chuàng)建單元204還用于，創(chuàng)建每個所述詞元字符串的至少一個混淆音字符串；所述劃分單元212還用于，根據(jù)所述至少一個混淆音字符串的創(chuàng) 建順序?qū)⑺鲋辽僖粋€混淆音字符串通過分隔符劃分為至少一個單個混淆音字符串；所述創(chuàng)建單元204還用于，將通過所述分隔符劃分的所述至少一個單個混淆音字符串中的相同單個混淆音字符串放置于所述單詞查找樹的一個節(jié)點(diǎn)位置，其中，先劃分得到的所述單個混淆音字符串為第二類母節(jié)點(diǎn)，后劃分得到的所述單個混淆音字符串作為所述第二類母節(jié) 點(diǎn)的第二類子節(jié)點(diǎn)。
[0070] 在該技術(shù)方案中，通過創(chuàng)建基于混淆音的單詞查找樹，可以提高語音識別效率和豐富的語音識別結(jié)果，具體地，以漢語發(fā)音為例，當(dāng)語音設(shè)備獲取用戶的語音指令為 "zhang"，會生成"zhang"的全部混淆音字符串，例如"zang"、"zhan"和"zan"等，對"zang"、 "zhan"和"zan"進(jìn)行字符劃分后，生成包括"zang"、"zhan"和"zan"的單詞查找樹，并將單詞查找樹的生成結(jié)果提示給用戶，這種識別方式降低了對用戶的發(fā)音準(zhǔn)確度和語速的要求，提升了用戶的使用體驗(yàn)。
[0071] 結(jié)合圖3至圖5,對根據(jù)本發(fā)明的實(shí)施例的名稱的語音識別方法進(jìn)行具體說明。
[0072] 如圖3所示，根據(jù)本發(fā)明的實(shí)施例的名稱的語音識別方法，包括：步驟302,預(yù)處理過程；步驟304,語音識別過程；步驟306,后處理過程；步驟3041，精準(zhǔn)識別；步驟3042,模糊音識別；步驟3043,混淆音識別；步驟3043,分詞識別。
[0073] 具體地，在接收到用戶輸入數(shù)據(jù)時(shí)，首先進(jìn)行存儲。存儲的時(shí)候，盡可能擴(kuò)展數(shù)據(jù) 的信息，例如：人名的全拼、簡拼、容易拼錯的漢字拼音組合、容易讀錯的漢字拼音組合等。對于具有職位信息的數(shù)據(jù)，還需要增加職位稱呼的擴(kuò)展信息，例如：總經(jīng)理、研發(fā)總監(jiān)、產(chǎn)品經(jīng)理、銷售區(qū)域經(jīng)理等。
[0074] 本系統(tǒng)使用的存儲結(jié)構(gòu)為trie樹。trie樹具有節(jié)省存儲空間、查詢速度快的特點(diǎn)。trie樹插入的內(nèi)容包括名稱以及對應(yīng)的擴(kuò)展信息，葉子節(jié)點(diǎn)綁定對應(yīng)人名的id信息。
[0075] 其中，trie樹結(jié)構(gòu)設(shè)計(jì)包括多種實(shí)施方式：
[0076] 實(shí)施方式一：
[0077] 單詞查找樹為漢字查找樹，漢字查找樹的中間節(jié)點(diǎn)存儲了人名的每一個字符（漢字），葉子節(jié)點(diǎn)存儲了符合該姓名的實(shí)體列表，漢字查找樹在存儲的準(zhǔn)確人名的時(shí)候，還存儲了人名的昵稱，為以后的識別和糾錯提供數(shù)據(jù)支持。
[0078] 漢字查找樹包括以下【具體實(shí)施方式】：
[0079] 如圖4所示，Ci表示人名的一個字符，上圖中最左邊的人名是由C1、C2和C3順序連接組成的。
[0080] 圖4中根節(jié)點(diǎn)的中間葉子節(jié)點(diǎn)表示人名的昵稱，一般是去掉姓之后的字符串，如果去掉姓之后僅剩一個漢字，則不存儲，葉子節(jié)點(diǎn)存儲的list(j)表示符合該人名的實(shí)體列表。
[0081] 實(shí)施方式二：
[0082] 單詞查找樹為拼音查找樹，拼音樹的中間節(jié)點(diǎn)存儲人名全拼（包括準(zhǔn)確全拼和模糊拼音）的每一個字母，和漢字樹一樣，葉子節(jié)點(diǎn)存儲符合該全拼的的實(shí)體列表。模糊音的擴(kuò)展規(guī)則如表1所示，規(guī)則涵蓋前后兩個發(fā)音的互轉(zhuǎn)。
[0083] 表 1
[0084]

【權(quán)利要求】
1. 一種名稱的語音識別方法，其特征在于，包括：獲取所述名稱的語音字符串；根據(jù)所述語音字符串創(chuàng)建單詞查找樹；判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配；以及在判定所述名稱信息與所述預(yù)存的名稱信息匹配時(shí)向用戶提示所述名稱的語音識別結(jié)果。
2. 根據(jù)權(quán)利要求1所述的名稱的語音識別方法，其特征在于，根據(jù)所述語音字符串創(chuàng) 建單詞查找樹，包括以下具體步驟：在獲取到所述語音字符串后，創(chuàng)建至少一個詞元字符串；選擇最接近所述語音字符串的所述詞元字符串作為最優(yōu)詞元字符串；根據(jù)所述最優(yōu)詞元字符串的創(chuàng)建順序?qū)⑺鲈~元字符串通過分隔符劃分為至少一個單個字符串；根據(jù)所述至少一個單個字符串和所述至少一個單個字符串的劃分順序創(chuàng)建所述單詞查找樹。
3. 根據(jù)權(quán)利要求2所述的名稱的語音識別方法，其特征在于，根據(jù)所述至少一個單個字符串和所述至少一個單個字符串的劃分順序創(chuàng)建單詞查找樹，包括以下具體步驟：根據(jù)所述每個單個字符串創(chuàng)建第一類單詞查找樹的節(jié)點(diǎn)，其中，先劃分得到的所述單個字符串為第一類母節(jié)點(diǎn)，后劃分得到的所述單個字符串作為所述第一類母節(jié)點(diǎn)的第一類子節(jié)點(diǎn)。
4. 根據(jù)權(quán)利要求3所述的名稱的語音識別方法，其特征在于，判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配，包括以下具體步驟：在所述第一類單詞查找樹不與所述預(yù)存的所述名稱信息匹配時(shí)，根據(jù)所述語音字符串創(chuàng)建第二類單詞查找樹；判斷所述第二類單詞查找樹是否與所述預(yù)存的名稱信息匹配。
5. 根據(jù)權(quán)利要求4所述的名稱的語音識別方法，其特征在于，根據(jù)所述語音字符串創(chuàng) 建第二類單詞查找樹，包括以下具體步驟：在獲取到所述語音字符串后，創(chuàng)建所述至少一個詞元字符串；創(chuàng)建每個所述詞元字符串的至少一個混淆音字符串；根據(jù)所述至少一個混淆音字符串的創(chuàng)建順序?qū)⑺鲋辽僖粋€混淆音字符串通過分隔符劃分為至少一個單個混淆音字符串；將通過所述分隔符劃分的所述至少一個單個混淆音字符串中的相同單個混淆音字符串放置于所述單詞查找樹的一個節(jié)點(diǎn)位置，其中，先劃分得到的所述單個混淆音字符串為第二類母節(jié)點(diǎn)，后劃分得到的所述單個混淆音字符串作為所述第二類母節(jié)點(diǎn)的第二類子節(jié) 點(diǎn)。
6. -種名稱的語音識別系統(tǒng)，其特征在于，包括：獲取單元，用于獲取所述名稱的語音字符串；創(chuàng)建單元，用于根據(jù)所述語音字符串創(chuàng)建單詞查找樹；判斷單元，用于判斷所述單詞查找樹是否與預(yù)存的名稱信息匹配；以及提示單元，用于在判定所述名稱信息與所述預(yù)存的名稱信息匹配時(shí)向用戶提示所述名稱的語音識別結(jié)果。
7. 根據(jù)權(quán)利要求6所述的名稱的語音識別系統(tǒng)，其特征在于，所述創(chuàng)建單元還用于，在獲取到所述語音字符串后，創(chuàng)建至少一個詞元字符串；所述名稱的語音識別系統(tǒng)，還包括：選擇單元，用于選擇最接近所述語音字符串的所述詞元字符串作為最優(yōu)詞元字符串；劃分單元，用于根據(jù)所述最優(yōu)詞元字符串的創(chuàng)建順序?qū)⑺鲈~元字符串通過分隔符劃分為至少一個單個字符串；所述創(chuàng)建單元還用于，根據(jù)所述至少一個單個字符串和所述至少一個單個字符串的劃分順序創(chuàng)建所述單詞查找樹。
8. 根據(jù)權(quán)利要求7所述的名稱的語音識別系統(tǒng)，其特征在于，所述創(chuàng)建單元還用于，根據(jù)所述每個單個字符串創(chuàng)建第一類單詞查找樹的節(jié)點(diǎn)，其中，先劃分得到的所述單個字符串為第一類母節(jié)點(diǎn)，后劃分得到的所述單個字符串作為所述第一類母節(jié)點(diǎn)的第一類子節(jié) 點(diǎn)。
9. 根據(jù)權(quán)利要求8所述的名稱的語音識別系統(tǒng)，其特征在于，所述創(chuàng)建單元還用于，在所述第一類單詞查找樹不與所述預(yù)存的所述名稱信息匹配時(shí)，根據(jù)所述語音字符串創(chuàng)建第二類單詞查找樹；所述判斷單元還用于，判斷所述第二類單詞查找樹是否與所述預(yù)存的名稱信息匹配。
10. 根據(jù)權(quán)利要求9所述的名稱的語音識別系統(tǒng)，其特征在于，所述創(chuàng)建單元還用于，在獲取到所述語音字符串后，創(chuàng)建所述至少一個詞元字符串；所述創(chuàng)建單元還用于，創(chuàng)建每個所述詞元字符串的至少一個混淆音字符串；所述劃分單元還用于，根據(jù)所述至少一個混淆音字符串的創(chuàng)建順序?qū)⑺鲋辽僖粋€混淆音字符串通過分隔符劃分為至少一個單個混淆音字符串；所述創(chuàng)建單元還用于，將通過所述分隔符劃分的所述至少一個單個混淆音字符串中的相同單個混淆音字符串放置于所述單詞查找樹的一個節(jié)點(diǎn)位置，其中，先劃分得到的所述單個混淆音字符串為第二類母節(jié)點(diǎn)，后劃分得到的所述單個混淆音字符串作為所述第二類母節(jié)點(diǎn)的第二類子節(jié)點(diǎn)。
11. 一種名稱的語音識別設(shè)備，其特征在于，包括：如權(quán)利要求6至10中任一項(xiàng)所述的名稱的語音識別系統(tǒng)。
【文檔編號】G10L15/28GK104485107SQ201410743432
【公開日】2015年4月1日申請日期:2014年12月8日優(yōu)先權(quán)日:2014年12月8日
【發(fā)明者】薛會萍申請人:暢捷通信息技術(shù)股份有限公司

完整全部詳細(xì)技術(shù)資料下載