本發(fā)明屬于語音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種導(dǎo)航語音識(shí)別方法及系統(tǒng)。
背景技術(shù):
語音識(shí)別技術(shù)是近十年來信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一,主要應(yīng)用于語音撥號(hào)、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音搜索、聽寫數(shù)據(jù)錄入等。語音識(shí)別技術(shù)一般包括聲學(xué)模型和語言模型,聲學(xué)模型負(fù)責(zé)完成語音到音素的轉(zhuǎn)換,其中所述語音如英語中的音標(biāo)和中文中的拼音的聲韻母;語言模型負(fù)責(zé)完成音素到文本的轉(zhuǎn)換,兩者配合完成語音到文本的識(shí)別過程。
現(xiàn)有技術(shù)中一般有三種語音識(shí)別技術(shù):第一種是基于云端識(shí)別引擎的語音識(shí)別技術(shù),第二種是基于本地語音識(shí)別引擎的語音識(shí)別技術(shù),第三種是同時(shí)基于本地語音識(shí)別引擎和云端識(shí)別引擎的語音識(shí)別技術(shù)。而不管采用上述任意一種語言識(shí)別技術(shù),由于語音識(shí)別過程是智能的,會(huì)出現(xiàn)同音不同字的情況,因此就會(huì)出現(xiàn)多個(gè)識(shí)別結(jié)果。當(dāng)存在多個(gè)識(shí)別結(jié)果時(shí),對(duì)識(shí)別結(jié)果進(jìn)行排序顯得尤為重要?,F(xiàn)有技術(shù)中一般是將識(shí)別結(jié)果按照相似度由高到低排序的識(shí)別結(jié)果返回給用戶。另外,現(xiàn)有的語音識(shí)別引擎識(shí)別率低,正常環(huán)境下大部分識(shí)別結(jié)果與期望結(jié)果相差較大。再者,同時(shí)按照相似度由高到低排序的識(shí)別結(jié)果返回給用戶,會(huì)使得發(fā)音不標(biāo)準(zhǔn)的用戶每次都需要花大量的時(shí)間去尋找所需識(shí)別結(jié)果。
技術(shù)實(shí)現(xiàn)要素:
針對(duì)以上技術(shù)問題,本發(fā)明公開了一種導(dǎo)航語音識(shí)別方法及系統(tǒng),通過特定識(shí)別地域及語音引擎識(shí)別結(jié)果分析,并獲取更接近輸入語音的結(jié)果。
對(duì)此,本發(fā)明采用的技術(shù)方案為:
一種導(dǎo)航語音識(shí)別方法,其包括以下步驟:
步驟S1:將客戶端收到的語音信息通過語音引擎進(jìn)行語音識(shí)別;
步驟S2:對(duì)步驟S1語音識(shí)別的結(jié)果根據(jù)識(shí)別地域檢索后臺(tái)數(shù)據(jù)庫,如果存在對(duì)應(yīng)數(shù)據(jù)記錄,則將識(shí)別結(jié)果返回到客戶端,識(shí)別完成;
如果不存在對(duì)應(yīng)數(shù)據(jù)記錄,則從本地?cái)?shù)據(jù)庫中尋找預(yù)設(shè)地域范圍內(nèi)的、與識(shí)別結(jié)果相似度大于預(yù)設(shè)值的數(shù)據(jù),如果存在相似度大于預(yù)設(shè)值的的結(jié)果,則將該相似度大于預(yù)設(shè)值的數(shù)據(jù)按照使用頻率降序排序推薦給用戶;如果在本地?cái)?shù)據(jù)庫中沒有相似度大于預(yù)設(shè)值的數(shù)據(jù),則將該識(shí)別結(jié)果返回至后臺(tái)服務(wù)器數(shù)據(jù)庫中,后臺(tái)服務(wù)器計(jì)算出后臺(tái)服務(wù)器數(shù)據(jù)庫中所有記錄與識(shí)別結(jié)果的相似度,根據(jù)相似度降序排序所有記錄,并將排序結(jié)果返回至客戶端;其中,所述相近似的數(shù)據(jù)是指大于預(yù)設(shè)相似度的數(shù)據(jù);
如后臺(tái)服務(wù)器數(shù)據(jù)庫中也沒有大于預(yù)設(shè)相似度的數(shù)據(jù),則本次語音識(shí)別錯(cuò)誤,并反饋給客戶端。
其中,本地?cái)?shù)據(jù)庫是指設(shè)備自帶的存儲(chǔ)數(shù)據(jù)庫。
采用此技術(shù)方案,通過多種途徑實(shí)現(xiàn)對(duì)語音識(shí)別的辨認(rèn),并結(jié)合特定識(shí)別地域獲取更接近輸入語音的結(jié)果,減少搜尋時(shí)間。
作為本發(fā)明的進(jìn)一步改進(jìn),步驟S2中,首選對(duì)步驟S1語音識(shí)別的結(jié)果進(jìn)行判斷,是否為有效結(jié)果,然后進(jìn)行檢索。采用此技術(shù)方案,首先對(duì)識(shí)別結(jié)果進(jìn)行初步分析,看是否為有效結(jié)果,如果不是,則不再進(jìn)行下一步的檢索,使結(jié)果反饋更快,節(jié)約不必要的時(shí)間浪費(fèi)。
作為本發(fā)明的進(jìn)一步改進(jìn),步驟S2中,如果存在相似度大于預(yù)設(shè)值的結(jié)果,則將其按照使用頻率降序排序推薦給用戶,并獲取用戶當(dāng)前位置信息,根據(jù)地域范圍篩選數(shù)據(jù),反饋至客戶端。采用此技術(shù)方案,結(jié)合用戶當(dāng)前位置信息進(jìn)行分析,使得識(shí)別分析的結(jié)果更加準(zhǔn)確。
作為本發(fā)明的進(jìn)一步改進(jìn),步驟S2中,如果在本地?cái)?shù)據(jù)庫中沒有相近似的結(jié)果,則將該識(shí)別結(jié)果返回至后臺(tái)服務(wù)器數(shù)據(jù)庫中,服務(wù)器計(jì)算出后臺(tái)服務(wù)器數(shù)據(jù)庫中所有記錄與識(shí)別結(jié)果的相似度,根據(jù)相似度降序排序所有記錄,并將排序結(jié)果返回至客戶端,并獲取用戶當(dāng)前位置信息,根據(jù)地域范圍篩選數(shù)據(jù),反饋至客戶端。
作為本發(fā)明的進(jìn)一步改進(jìn),步驟S2中,如后臺(tái)服務(wù)器數(shù)據(jù)庫中也沒有大于預(yù)設(shè)相似度的數(shù)據(jù),則本次語音識(shí)別錯(cuò)誤,并反饋給客戶端,同時(shí)告知用戶重新輸入語音信息或者加入限定詞或者擴(kuò)展詞。
作為本發(fā)明的進(jìn)一步改進(jìn),步驟S2中,所述預(yù)設(shè)相似度不小于50%。
本發(fā)明還公開了一種語音識(shí)別系統(tǒng),所述語音識(shí)別系統(tǒng)包括語音接收模塊、語音識(shí)別模塊、本地?cái)?shù)據(jù)庫、通訊模塊、后臺(tái)服務(wù)器和發(fā)送模塊;其中,所述語音接收模塊,用于接收客戶端發(fā)送的語音信息;所述語音識(shí)別模塊,用于將語音信息根據(jù)識(shí)別地域檢索后臺(tái)服務(wù)器數(shù)據(jù)庫查找對(duì)應(yīng)數(shù)據(jù)記錄,或從本地?cái)?shù)據(jù)庫中尋找預(yù)設(shè)地域范圍內(nèi)的、與識(shí)別結(jié)果相近似的數(shù)據(jù);所述通訊模塊,用于與后臺(tái)服務(wù)器連接,則將該識(shí)別結(jié)果返回至后臺(tái)服務(wù)器數(shù)據(jù)庫中;所述后臺(tái)服務(wù)器,用于計(jì)算出后臺(tái)服務(wù)器數(shù)據(jù)庫中所有記錄與識(shí)別結(jié)果的相似度,根據(jù)相似度降序排序所有記錄;發(fā)送模塊,用于將排序結(jié)果返回至客戶端。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:
采用本發(fā)明的技術(shù)方案,通過特定識(shí)別地域及語音引擎識(shí)別結(jié)果分析,并獲取更接近輸入語音的結(jié)果,減少搜尋時(shí)間,使用更加方便。本發(fā)明的技術(shù)方案可以應(yīng)用在各個(gè)需要語音識(shí)別的平臺(tái)上,尤其是智能終端。
附圖說明
圖1是本發(fā)明一種實(shí)施例的流程圖。
具體實(shí)施方式
下面結(jié)合附圖,對(duì)本發(fā)明的較優(yōu)的實(shí)施例作進(jìn)一步的詳細(xì)說明。
一種導(dǎo)航語音識(shí)別方法,如圖1所示,首先使用第三方語音引擎獲得識(shí)別結(jié)果后,根據(jù)用戶所選的語音內(nèi)容識(shí)別地域通過后在臺(tái)服務(wù)器數(shù)據(jù)庫中檢索看是否存在對(duì)應(yīng)的記錄,即完全相同的記錄;若存在,則將語音引擎得出的識(shí)別結(jié)果發(fā)送至客戶端;此種結(jié)果僅僅一個(gè)識(shí)別結(jié)果對(duì)應(yīng)后臺(tái)服務(wù)器檢索數(shù)據(jù)庫中一個(gè)數(shù)據(jù);若識(shí)別的結(jié)果與數(shù)據(jù)庫中對(duì)比無完全相同的,則認(rèn)為識(shí)別結(jié)果存在一定的謬誤,并發(fā)送語音識(shí)別結(jié)果的同時(shí),告之客戶端識(shí)別結(jié)果存在謬誤同時(shí)進(jìn)入下一步;然后在本地?cái)?shù)據(jù)庫中尋找預(yù)設(shè)地域范圍內(nèi)的與識(shí)別結(jié)果相近似的數(shù)據(jù),然后以使用頻率降序排列推薦給用戶,減少用戶搜尋時(shí)間;其中,所述相近似的數(shù)據(jù)是指大于預(yù)設(shè)相似度的數(shù)據(jù)。另外,如果在本地?cái)?shù)據(jù)庫中尋找不到大于預(yù)設(shè)相似度的數(shù)據(jù),則將該識(shí)別結(jié)果返回至后臺(tái)服務(wù)器檢索數(shù)據(jù)中,后臺(tái)服務(wù)器計(jì)算出數(shù)據(jù)庫中所有記錄與識(shí)別結(jié)果的相似度,根據(jù)相似度降序排序所有記錄,并將排序結(jié)果返回至客戶端。如后臺(tái)服務(wù)器數(shù)據(jù)庫同樣也尋找不到大于預(yù)設(shè)相似度的數(shù)據(jù),則認(rèn)為本次語音識(shí)別錯(cuò)誤,并反饋給客戶端,提醒用戶重新輸入語音信息或者加入限定詞或者擴(kuò)展詞。
例如,用戶在成都需要導(dǎo)航至廣州市廣州塔,在成都輸入語音“廣州塔”而預(yù)設(shè)的地域范圍為市轄區(qū)即只搜索成都市的地名,則在后臺(tái)無法搜索到與“廣州塔”相對(duì)應(yīng)的數(shù)據(jù);下一步則在本地?cái)?shù)據(jù)庫中搜索,如本地?cái)?shù)據(jù)庫中存在 “光軸塔”“光州塔”以及“逛周它” “廣州塔”,其頻率分別為A、B、C以及D,D>C>B>A,那么呈現(xiàn)給用戶的信息是由上往下依次為“廣州塔”,“逛周它”,“光州塔”,“光軸塔”,即方便客戶選取,識(shí)別成功。
如本地?cái)?shù)據(jù)庫預(yù)設(shè)的相似度為大于50%,而其識(shí)別結(jié)果“廣州塔”無法找到與之相似度大于50%的數(shù)據(jù),那么將識(shí)別結(jié)果“廣州塔”反饋至后臺(tái)服務(wù)器數(shù)據(jù)庫中檢索,通過后臺(tái)服務(wù)器計(jì)算出數(shù)據(jù)庫中所有記錄與識(shí)別結(jié)果的相似度,將相似度超過預(yù)設(shè)閾值的數(shù)據(jù)根據(jù)相似度降序排序所有記錄,并將排序結(jié)果返回至客戶端。
如通過服務(wù)端計(jì)算出數(shù)據(jù)庫中所有記錄與識(shí)別結(jié)果的相似度,其相似度均小于預(yù)設(shè)閾值,則識(shí)別失敗,那么反饋給用戶該次語音輸入錯(cuò)誤,并且提示用戶更換語音或者加入限定詞或者擴(kuò)展詞,如在成都的用戶需要導(dǎo)航位于廣州的“廣州塔”,則輸入語音信息的時(shí)候加上擴(kuò)展詞,即輸入語音為“廣州市廣州塔”。
以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對(duì)本發(fā)明所作的進(jìn)一步詳細(xì)說明,不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說明。對(duì)于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干簡(jiǎn)單推演或替換,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。