一種語(yǔ)音信息的處理方法及終端的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語(yǔ)音信息處理領(lǐng)域,尤其涉及一種語(yǔ)音信息的處理方法及終端。
【背景技術(shù)】
[0002] 隨著科技的發(fā)展,將語(yǔ)音信號(hào)轉(zhuǎn)換成對(duì)應(yīng)的文本信息這一技術(shù)越來(lái)越受到人們的 青睞,該技術(shù)使得人們能夠擺脫鍵盤的束縛,可以通過(guò)對(duì)輸入的語(yǔ)音進(jìn)行識(shí)別,獲得對(duì)應(yīng)的 文本信息,以實(shí)現(xiàn)輸入,方便用戶使用。
[0003] 目前,以智能手機(jī)為例,當(dāng)用戶使用智能手機(jī)上安裝的個(gè)人語(yǔ)音助手時(shí),輸入語(yǔ)音 為"你在干嗎呢?最近忙不忙啊?",個(gè)人語(yǔ)音助手對(duì)該語(yǔ)音信息進(jìn)行識(shí)別,可能由于用戶 周圍的環(huán)境噪音較大、用戶自己的語(yǔ)言習(xí)慣等因素,使得該語(yǔ)音助手不能準(zhǔn)確地識(shí)別出用 戶輸入的語(yǔ)音,所以識(shí)別出的文本信息就可能為"擬再干嘛吶?嘴緊忙吧忙?。?,然后將 該文本信息輸出給用戶,這樣,用戶看到的文本信息與其實(shí)際輸入的內(nèi)容差距較大,也就是 說(shuō),終端不能夠準(zhǔn)確地識(shí)別出用戶輸入的語(yǔ)音內(nèi)容。
[0004] 所以,現(xiàn)有技術(shù)中存在終端語(yǔ)音識(shí)別的準(zhǔn)確率低的技術(shù)問(wèn)題。
【發(fā)明內(nèi)容】
[0005] 有鑒于此,本發(fā)明實(shí)施例期望提供一種語(yǔ)音信息的處理方法及終端,以提高終端 語(yǔ)音識(shí)別的準(zhǔn)確率,提高用戶體驗(yàn)。
[0006] 為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0007] 第一方面,本發(fā)明實(shí)施例提供一種語(yǔ)音信息的處理方法,所述方法包括:獲得語(yǔ)音 信號(hào);識(shí)別所述語(yǔ)音信號(hào),獲得對(duì)應(yīng)的文本信息;基于預(yù)置在所述終端中的會(huì)話歷史數(shù)據(jù) 庫(kù),對(duì)所述文本信息進(jìn)行糾錯(cuò),獲得糾錯(cuò)后的文本信息,其中,所述會(huì)話歷史數(shù)據(jù)庫(kù)中存儲(chǔ) 有用戶的會(huì)話歷史記錄。
[0008] 進(jìn)一步地,所述基于預(yù)置在所述終端中的會(huì)話歷史數(shù)據(jù)庫(kù),對(duì)所述文本信息進(jìn)行 糾錯(cuò),獲得糾錯(cuò)后的文本信息,包括:基于預(yù)置在所述終端中的字詞庫(kù),獲得與所述文本信 息關(guān)聯(lián)的至少一個(gè)備選語(yǔ)句;將所述至少一個(gè)備選語(yǔ)句與所述會(huì)話歷史數(shù)據(jù)庫(kù)中的會(huì)話內(nèi) 容進(jìn)行匹配,篩選出匹配程度最高的語(yǔ)句;將所述匹配程度最高的語(yǔ)句確定為所述糾錯(cuò)后 的文本信息。
[0009] 進(jìn)一步地,在所述獲得糾錯(cuò)后的文本信息之后,所述方法還包括:將所述糾錯(cuò)后的 文本信息存入所述會(huì)話歷史數(shù)據(jù)庫(kù),更新所述會(huì)話歷史數(shù)據(jù)庫(kù)。
[0010] 進(jìn)一步地,在所述獲得糾錯(cuò)后的文本信息之后,所述方法還包括:輸出所述糾錯(cuò)后 的文本信息。
[0011] 第二方面,本發(fā)明實(shí)施例提供一種終端,所述終端包括:獲得單元、識(shí)別單元及糾 錯(cuò)單元;其中,所述獲得單元,用于獲得語(yǔ)音信號(hào);所述識(shí)別單元,用于識(shí)別所述終端中的 語(yǔ)音信號(hào),獲得對(duì)應(yīng)的文本信息;所述糾錯(cuò)單元,用于基于預(yù)置在所述終端中的會(huì)話歷史數(shù) 據(jù)庫(kù),對(duì)所述文本信息進(jìn)行糾錯(cuò),獲得糾錯(cuò)后的文本信息;其中,所述會(huì)話歷史數(shù)據(jù)庫(kù)中存 儲(chǔ)有用戶的會(huì)話歷史記錄。
[0012] 進(jìn)一步地,所述糾錯(cuò)單元,具體用于基于預(yù)置在所述終端中的字詞庫(kù),獲得與所述 文本信息關(guān)聯(lián)的至少一個(gè)備選語(yǔ)句;將所述至少一個(gè)備選語(yǔ)句與所述會(huì)話歷史數(shù)據(jù)庫(kù)中的 會(huì)話內(nèi)容進(jìn)行匹配,篩選出匹配程度最高的語(yǔ)句;將所述匹配程度最高的語(yǔ)句確定為所述 糾錯(cuò)后的文本信息。
[0013] 進(jìn)一步地,所述終端還包括更新單元,用于在獲得糾錯(cuò)后的文本信息之后,將所述 糾錯(cuò)后的文本信息存入所述會(huì)話歷史數(shù)據(jù)庫(kù),更新所述會(huì)話歷史數(shù)據(jù)庫(kù)。
[0014] 進(jìn)一步地,所述終端還包括輸出單元,用于在獲得糾錯(cuò)后的文本信息之后,輸出所 述糾錯(cuò)后的文本信息。
[0015] 本發(fā)明實(shí)施例所提供的語(yǔ)音信息的處理方法及終端,當(dāng)終端獲得語(yǔ)音信號(hào)后,對(duì) 該語(yǔ)音信號(hào)進(jìn)行識(shí)別,獲得對(duì)應(yīng)的文本信息,然后,基于預(yù)置在終端中的存儲(chǔ)有用戶的會(huì)話 歷史記錄的會(huì)話歷史數(shù)據(jù)庫(kù),終端對(duì)文本信息進(jìn)行糾錯(cuò),獲得糾錯(cuò)后的文本信息,此時(shí),糾 錯(cuò)后的文本信息是與用戶的會(huì)話歷史記錄匹配程度最高的,也就是最符合上下文的語(yǔ)境 的,那么,糾錯(cuò)后的文本信息也是最為貼近用戶實(shí)際輸入的語(yǔ)音內(nèi)容的,如此,有效地解決 了現(xiàn)有技術(shù)存在的終端語(yǔ)音識(shí)別的準(zhǔn)確率低的技術(shù)問(wèn)題,提高了終端語(yǔ)音識(shí)別的準(zhǔn)確率, 提1?用戶體驗(yàn)。
【附圖說(shuō)明】
[0016] 圖1為本發(fā)明實(shí)施例中的語(yǔ)音信息的處理方法的流程示意圖;
[0017] 圖2為本發(fā)明實(shí)施例中的文本信息糾錯(cuò)方法的流程示意圖;
[0018] 圖3為本發(fā)明實(shí)施例中的終端的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0019] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述。
[0020] 本發(fā)明實(shí)施例提供一種語(yǔ)音信息的處理方法,該方法應(yīng)用于終端上,該終端可以 為智能手機(jī)、平板電腦等設(shè)備。
[0021] 圖1為本發(fā)明實(shí)施例中語(yǔ)音信息的處理方法的流程示意圖,參考圖1所示,該方法 包括:
[0022] S101 :獲得語(yǔ)首f目號(hào);
[0023] 具體來(lái)說(shuō),當(dāng)用戶使用個(gè)人語(yǔ)音助手,或者與其他用戶進(jìn)行即時(shí)聊天時(shí),用戶可以 通過(guò)語(yǔ)音喚醒、點(diǎn)擊物理按鍵等方式開啟終端的語(yǔ)音識(shí)別功能,此時(shí),用戶對(duì)著終端的麥克 風(fēng)輸入語(yǔ)音,終端獲得該語(yǔ)音的語(yǔ)音信號(hào)。
[0024] 例如,用戶A和用戶B正在進(jìn)行即時(shí)聊天,用戶A輸入的會(huì)話內(nèi)容為"你在干嗎 呢?",用戶B輸入的會(huì)話內(nèi)容為"沒(méi)干嘛啊,你呢?",用戶A接著輸入會(huì)話內(nèi)容為"一樣,你 在哪?",此時(shí),用戶B喚醒終端,并語(yǔ)音輸入"我在家,你呢?",那么,終端獲得用戶B輸入的 語(yǔ)音所對(duì)應(yīng)的語(yǔ)音信號(hào)。
[0025] S102 :識(shí)別語(yǔ)音信號(hào),獲得對(duì)應(yīng)的文本信息;
[0026] 具體來(lái)說(shuō),在終端獲得上述語(yǔ)音信號(hào)之后,通過(guò)預(yù)定的采樣率得到語(yǔ)音信號(hào)對(duì)應(yīng) 的音頻流,并將該音頻流作為語(yǔ)音識(shí)別引擎的輸入,以此來(lái)對(duì)語(yǔ)音信號(hào)進(jìn)行識(shí)別,獲得語(yǔ)音 信號(hào)對(duì)應(yīng)的文本信息。但是由于用戶進(jìn)行語(yǔ)音輸入時(shí),可能周圍的噪音較大或用戶自己的 語(yǔ)言習(xí)慣等因素,導(dǎo)致獲得的文本信息與用戶實(shí)際想要表達(dá)的意思不一致。比如,終端對(duì)獲 得的用戶B的語(yǔ)音信號(hào)進(jìn)行語(yǔ)音識(shí)別,語(yǔ)音識(shí)別出現(xiàn)偏差,得到的用戶B的語(yǔ)音對(duì)應(yīng)的文本 信息就為"偶在假,你那? "。
[0027] 在實(shí)際應(yīng)用中,上述預(yù)定的采樣率可以為16KHz,也可以為22KHz,當(dāng)然,采樣率還 可以為其他取值,本申請(qǐng)不做具體限定。
[0028] S103:基于預(yù)置在終端中的會(huì)話歷史數(shù)據(jù)庫(kù),對(duì)文本信息進(jìn)行糾錯(cuò),獲得糾錯(cuò)后的 文本信息;
[0029] 首先,需要說(shuō)明的是,在實(shí)際應(yīng)用中,終端中預(yù)置有字詞庫(kù)和會(huì)話歷史數(shù)據(jù)庫(kù),其 中,字詞庫(kù)中可以存儲(chǔ)有所有的字詞句,類似于存儲(chǔ)在終端中的字典或者詞典;另外,字詞 庫(kù)還可以在初始時(shí)僅存儲(chǔ)一些常用的字詞句,并在之后用戶的使用過(guò)程中,根據(jù)用戶語(yǔ)音 輸入或者文本輸入的內(nèi)容進(jìn)行學(xué)習(xí),將用戶常用的字詞添加到該字詞庫(kù)中,來(lái)擴(kuò)充字詞庫(kù)。
[0030] 進(jìn)一步地,在本實(shí)施例中,字詞庫(kù)中所有的字、詞可以根據(jù)用戶使用每個(gè)字或者詞 的頻率,由大到小排列,如下表1所示,C1列為使用頻率最高的字,C2列為使用頻率次高的 字,依次類推;R1行為讀音為"W0"的所有字,R2為發(fā)音為"ZAI"的所有字,依次類推。
[0031]
[0032] 表 1
[0033] 較優(yōu)地,針對(duì)不用的用戶,可以將字詞庫(kù)分為基礎(chǔ)字詞庫(kù)以及個(gè)人字詞庫(kù),在基礎(chǔ) 字詞庫(kù)中存儲(chǔ)一些常用的字詞,在個(gè)人字詞庫(kù)中,針對(duì)不同的用戶,存儲(chǔ)每個(gè)用戶的習(xí)慣性 用語(yǔ),形成與用戶一一對(duì)應(yīng)的個(gè)人字詞庫(kù)。
[0034] 進(jìn)一步地,上述會(huì)話歷史數(shù)據(jù)庫(kù)中可以存儲(chǔ)有用戶的會(huì)話歷史記錄,包括以語(yǔ)音、 文本等方式輸入的會(huì)話記錄。比如,用戶A和用戶B正在進(jìn)行會(huì)話,會(huì)話歷史數(shù)據(jù)庫(kù)中可以 存儲(chǔ)兩個(gè)用戶之前的會(huì)話記錄,如表2所示。
[0035]
[0036] 表 2
[0037] 那么,S103可以為:基于預(yù)置在終端中的字詞庫(kù),獲得與文本信息關(guān)聯(lián)的至少一 個(gè)備選語(yǔ)句,將至少一個(gè)備選語(yǔ)句與會(huì)話歷史數(shù)據(jù)庫(kù)中的會(huì)話內(nèi)容進(jìn)行匹配,篩選出匹配 程度最高的語(yǔ)句,將匹配程度最高的語(yǔ)句確定為糾錯(cuò)后的文本信息。
[0038] 具體來(lái)說(shuō),終端將通過(guò)S102獲得的文本信息進(jìn)行詞法及句法的分析,進(jìn)行拆分, 比如,通過(guò)S102獲得的文本信息為"偶在假,你那?",終端經(jīng)過(guò)詞法及句法的分析,對(duì)該信 息進(jìn)行拆分,將該語(yǔ)句拆分成多個(gè)句子組件,如"偶"、"在"、"假"、"你"、"那",然后,針對(duì)每 一個(gè)句子組件,在表1中,取出與該句子組件同行的所有字、詞,即根據(jù)表1,得到:與"偶" 同行的所有字"我""窩""喔";與"在"同行的所有字"再""載""仔";與"假"同行的所 有字"家""加""佳";與"你"同行的所有字"擬""呢""泥";以及與"那"同行的所有字 "呢""吶""訥",然后對(duì)這些字詞進(jìn)行排列組合,得到與文本信息相關(guān)聯(lián)的多個(gè)備選語(yǔ)句,即 S1 :"偶在假,你呢? ",S2 :"我在家,你呢? ",S3 :我在家,擬那?",然后將這3個(gè)備選語(yǔ)句和 上述會(huì)話歷史數(shù)據(jù)庫(kù)中最新一條會(huì)話記錄,即"一樣,你在哪? "進(jìn)行匹配,計(jì)算每一個(gè)備選 語(yǔ)句與該條會(huì)話記錄的匹配程度,得到S1的相關(guān)匹配程度為50%,S2的相關(guān)匹配程度為 100%,S3的匹配程度為85%,由此可以看出,S2為與會(huì)話記錄匹配度最高的語(yǔ)句,此時(shí),將 可以將S2確認(rèn)為糾錯(cuò)后的文本信息。
[0039] 需要說(shuō)明的是,上述一個(gè)或者多個(gè)實(shí)施例中所說(shuō)的會(huì)話歷史數(shù)據(jù)庫(kù)和字詞庫(kù)可以 為存儲(chǔ)在終端本地的數(shù)據(jù)庫(kù),也可以為存儲(chǔ)在云端服務(wù)器的數(shù)據(jù)庫(kù),本發(fā)明不做具體限定。
[0040] 進(jìn)一步地,上述基于會(huì)話歷史數(shù)據(jù)庫(kù)對(duì)文本信息進(jìn)行糾錯(cuò)的步驟除了上述一個(gè)或 者多個(gè)實(shí)施例中所述的方法之外,還可以采用其他的方法,只要能夠基于會(huì)話歷史數(shù)據(jù)庫(kù) 進(jìn)行糾錯(cuò)即可,本發(fā)明不做具體限定。
[0041] 在另一實(shí)施例中,為了保證終端能夠正常地進(jìn)行下一次語(yǔ)音糾錯(cuò),那么,在S103 之后,該方法還可以包括:在獲得糾錯(cuò)后的文本信息之后,將糾錯(cuò)后的文本信息存入會(huì)話歷 史數(shù)據(jù)庫(kù),更新會(huì)話歷史數(shù)據(jù)庫(kù)。也就是說(shuō),將S103得到的糾錯(cuò)后的文本信息作為會(huì)話記 錄存儲(chǔ)在會(huì)話歷史數(shù)據(jù)庫(kù)中,以更新該數(shù)據(jù)庫(kù)。
[0042] 在實(shí)際應(yīng)用中,