一種語音輸入方法及移動(dòng)終端與流程

文檔序號：11286497閱讀：321來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及電子技術(shù)領(lǐng)域，尤其涉及一種語音輸入方法及移動(dòng)終端。

背景技術(shù)：

語音輸入又稱聲控輸入，是一種根據(jù)操作者的講話，自動(dòng)識別成文字的輸入方法，其與文字輸入法相較，更為快捷易用。當(dāng)前，諸如智能手機(jī)、平板電腦等移動(dòng)終端大多具備語音輸入的功能。實(shí)踐發(fā)現(xiàn)，當(dāng)用戶進(jìn)入移動(dòng)終端中的某一應(yīng)用程序進(jìn)行語音輸入時(shí)，一般需先點(diǎn)擊輸入欄，再查找語音輸入的按鈕，通過點(diǎn)擊按鈕來進(jìn)行語音輸入，輸入完畢后識別成文字顯示在輸入欄中。然而，有時(shí)候語音輸入的按鈕并不明顯，用戶需要花費(fèi)較長時(shí)間查找，且每一次進(jìn)行語音輸入之前都需要手動(dòng)去點(diǎn)擊輸入欄，從而使得整個(gè)語音輸入的操作效率低下。

技術(shù)實(shí)現(xiàn)要素：

本發(fā)明實(shí)施例公開了一種語音輸入方法及移動(dòng)終端，能夠提高語音輸入的操作效率。

本發(fā)明實(shí)施例第一方面公開一種語音輸入方法，包括：

檢測移動(dòng)終端當(dāng)前顯示界面中的目標(biāo)輸入欄，所述目標(biāo)輸入欄為未輸入文字信息的輸入欄；

接收用戶按照預(yù)設(shè)方式觸發(fā)的語音輸入開啟指令；

根據(jù)所述語音輸入開啟指令，開啟語音輸入模式；

在所述語音輸入模式下，接收輸入的語音信息；

在所述目標(biāo)輸入欄中顯示所述語音信息對應(yīng)的文字信息。

作為一種可選的實(shí)施方式，在本發(fā)明實(shí)施例第一方面中，所述檢測移動(dòng)終端當(dāng)前顯示界面中的目標(biāo)輸入欄，包括：

獲取移動(dòng)終端當(dāng)前顯示界面所屬應(yīng)用程序的注冊接口；

獲取所述注冊接口的狀態(tài)信息；

判斷所述狀態(tài)信息是否為預(yù)設(shè)狀態(tài)信息，所述預(yù)設(shè)狀態(tài)信息用于指示輸入欄未輸入文字信息；

如果所述狀態(tài)信息為所述預(yù)設(shè)狀態(tài)信息，確定所述注冊接口對應(yīng)的輸入欄為目標(biāo)輸入欄。

作為一種可選的實(shí)施方式，在本發(fā)明實(shí)施例第一方面中，所述接收用戶按照預(yù)設(shè)方式觸發(fā)的語音輸入開啟指令，包括以下情況中的一種或幾種的組合：

接收用戶通過操作預(yù)設(shè)物理按鍵所觸發(fā)的語音輸入開啟指令；

接收用戶通過操作預(yù)設(shè)虛擬按鍵所觸發(fā)的語音輸入開啟指令；

接收用戶通過輸入預(yù)設(shè)手勢所觸發(fā)的語音輸入開啟指令；

接收用戶通過輸入預(yù)設(shè)生物特征信息所觸發(fā)的語音輸入開啟指令。

作為一種可選的實(shí)施方式，在本發(fā)明實(shí)施例第一方面中，所述在所述目標(biāo)輸入欄中顯示所述語音信息對應(yīng)的文字信息之前，所述方法還包括：

對接收到的所述語音信息進(jìn)行預(yù)處理，以獲得預(yù)處理后的語音信息；

對所述預(yù)處理后的語音信息進(jìn)行識別，以得出所述預(yù)處理后的語音信息所包含的內(nèi)容；

其中，所述在所述目標(biāo)輸入欄中顯示所述語音信息對應(yīng)的文字信息，包括：

在所述目標(biāo)輸入欄中以文字的形式顯示所述預(yù)處理后的語音信息所包含的內(nèi)容。

作為一種可選的實(shí)施方式，在本發(fā)明實(shí)施例第一方面中，所述對所述預(yù)處理后的語音信息進(jìn)行識別，以得出所述預(yù)處理后的語音信息所包含的內(nèi)容，包括：

將所述預(yù)處理后的語音信息與預(yù)設(shè)語音模型進(jìn)行匹配，以獲得匹配結(jié)果；

當(dāng)所述預(yù)處理后的語音信息與所述預(yù)設(shè)語音模型進(jìn)行匹配的匹配率低于預(yù)設(shè)值時(shí)，輸出至少一條識別內(nèi)容；

接收用戶針對所述至少一條識別內(nèi)容中的其中一條輸入的選取指令；

根據(jù)所述選取指令，確定用戶選取的識別內(nèi)容為所述預(yù)處理后的語音信息所包含的內(nèi)容。

本發(fā)明實(shí)施例第二方面公開一種移動(dòng)終端，包括：

檢測單元，用于檢測移動(dòng)終端當(dāng)前顯示界面中的目標(biāo)輸入欄，所述目標(biāo)輸入欄為未輸入文字信息的輸入欄；

第一接收單元，用于接收用戶按照預(yù)設(shè)方式觸發(fā)的語音輸入開啟指令；

開啟指令，用于根據(jù)所述語音輸入開啟指令，開啟語音輸入模式；

第二接收單元，用于在所述語音輸入模式下，接收輸入的語音信息；

顯示單元，用于在所述目標(biāo)輸入欄中顯示所述語音信息對應(yīng)的文字信息。

作為一種可選的實(shí)施方式，在本發(fā)明實(shí)施例第二方面中，所述檢測單元包括：

第一獲取子單元，用于獲取移動(dòng)終端當(dāng)前顯示界面所屬應(yīng)用程序的注冊接口；

第二獲取子單元，用于獲取所述注冊接口的狀態(tài)信息；

判斷子單元，用于判斷所述狀態(tài)信息是否為預(yù)設(shè)狀態(tài)信息，所述預(yù)設(shè)狀態(tài)信息用于指示輸入欄未輸入文字信息；

第一確定子單元，用于當(dāng)所述判斷子單元判斷出所述狀態(tài)信息為所述預(yù)設(shè)狀態(tài)信息時(shí)，確定所述注冊接口對應(yīng)的輸入欄為目標(biāo)輸入欄。

作為一種可選的實(shí)施方式，在本發(fā)明實(shí)施例第二方面中，所述第一接收單元接收用戶按照預(yù)設(shè)方式觸發(fā)的語音輸入開啟指令的方式具體包括以下情況中的一種或幾種的組合：

所述第一接收單元接收用戶通過操作預(yù)設(shè)物理按鍵所觸發(fā)的語音輸入開啟指令；

所述第一接收單元接收用戶通過操作預(yù)設(shè)虛擬按鍵所觸發(fā)的語音輸入開啟指令；

所述第一接收單元接收用戶通過輸入預(yù)設(shè)手勢所觸發(fā)的語音輸入開啟指令；

所述第一接收單元接收用戶通過輸入預(yù)設(shè)生物特征信息所觸發(fā)的語音輸入開啟指令。

作為一種可選的實(shí)施方式，在本發(fā)明實(shí)施例第二方面中，所述移動(dòng)終端還包括：

預(yù)處理單元，用于在所述顯示單元在所述目標(biāo)輸入欄中顯示所述語音信息對應(yīng)的文字信息之前，對接收到的所述語音信息進(jìn)行預(yù)處理，以獲得預(yù)處理后的語音信息；

識別單元，用于對所述預(yù)處理后的語音信息進(jìn)行識別，以得出所述預(yù)處理后的語音信息所包含的內(nèi)容；

所述顯示單元具體用于在所述目標(biāo)輸入欄中以文字的形式顯示所述預(yù)處理后的語音信息所包含的內(nèi)容。

作為一種可選的實(shí)施方式，在本發(fā)明實(shí)施例第二方面中，所述識別單元包括：

匹配子單元，用于將所述預(yù)處理后的語音信息與預(yù)設(shè)語音模型進(jìn)行匹配，以獲得匹配結(jié)果；

輸出子單元，用于當(dāng)所述匹配子單元將所述預(yù)處理后的語音信息與所述預(yù)設(shè)語音模型進(jìn)行匹配的匹配率低于預(yù)設(shè)值時(shí)，輸出至少一條識別內(nèi)容；

接收子單元，用于接收用戶針對所述至少一條識別內(nèi)容中的其中一條輸入的選取指令；

第二確定子單元，用于根據(jù)所述選取指令，確定用戶選取的識別內(nèi)容為所述預(yù)處理后的語音信息所包含的內(nèi)容。

與現(xiàn)有技術(shù)相比，本發(fā)明實(shí)施例具有以下有益效果：

本發(fā)明實(shí)施例中，當(dāng)檢測到移動(dòng)終端當(dāng)前顯示界面中存在未輸入文字信息的目標(biāo)輸入欄時(shí)，可以接收用戶觸發(fā)的語音輸入開啟指令，根據(jù)該語音輸入開啟指令來開啟移動(dòng)終端的語音輸入模式，并在該語音輸入模式下接收輸入的語音信息，可以在該目標(biāo)輸入欄中顯示該語音信息對應(yīng)的文字信息?？梢?，實(shí)施本發(fā)明實(shí)施例，移動(dòng)終端通過自動(dòng)檢測當(dāng)前顯示界面上空閑的文字輸入欄，并接收用戶按照預(yù)設(shè)方式輸入的語音輸入開啟指令來快速開啟語音輸入功能以進(jìn)行語音輸入，而用戶無需手動(dòng)點(diǎn)擊待輸入的文字輸入欄，也無需用戶花時(shí)間去查找當(dāng)前應(yīng)用程序所提供的語音輸入按鈕。這樣，自動(dòng)檢測空閑的文字輸入欄，并采用快捷方式啟動(dòng)語音輸入功能，能夠提高語音輸入的操作效率，有效改善用戶進(jìn)行語音輸入的體驗(yàn)。

附圖說明

為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案，下面將對實(shí)施例中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動(dòng)的前提下，還可以根據(jù)這些附圖獲得其他的附圖。

圖1是本發(fā)明實(shí)施例公開的一種語音輸入方法的流程示意圖；

圖2是本發(fā)明實(shí)施例公開的另一種語音輸入方法的流程示意圖；

圖3是本發(fā)明實(shí)施例公開的一種通過語音輸入進(jìn)行導(dǎo)航的具體操作示意圖；

圖4是本發(fā)明實(shí)施例公開的一種移動(dòng)終端的結(jié)構(gòu)示意圖；

圖5是本發(fā)明實(shí)施例公開的另一種移動(dòng)終端的結(jié)構(gòu)示意圖；

圖6是本發(fā)明實(shí)施例公開的又一種移動(dòng)終端的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面將結(jié)合本發(fā)明實(shí)施例中的附圖，對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實(shí)施例僅是本發(fā)明一部分實(shí)施例，而不是全部的實(shí)施例?；诒景l(fā)明中的實(shí)施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例，都屬于本發(fā)明保護(hù)的范圍。

需要說明的是，本發(fā)明實(shí)施例的術(shù)語“包括”和“具有”以及他們的任何變形，意圖在于覆蓋不排他的包含，例如，包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元，而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

本發(fā)明實(shí)施例公開了一種語音輸入方法及移動(dòng)終端，能夠提高語音輸入的操作效率。以下將結(jié)合附圖進(jìn)行詳細(xì)描述。

實(shí)施例一

請參閱圖1，圖1是本發(fā)明實(shí)施例公開的一種語音輸入方法的流程示意圖。其中，該語音輸入方法可以應(yīng)用于移動(dòng)終端中。如圖1所示，該語音輸入方法可以包括以下步驟。

101、檢測移動(dòng)終端當(dāng)前顯示界面中的目標(biāo)輸入欄。

本發(fā)明實(shí)施例中，移動(dòng)終端可以包括但不限于移動(dòng)手機(jī)、移動(dòng)平板、個(gè)人數(shù)字助理(personaldigitalassistant，pda)、多媒體播放器、電子閱讀器、可穿戴設(shè)備、移動(dòng)互聯(lián)網(wǎng)設(shè)備(mobileinternetdevice，mid)等各種終端設(shè)備。

本發(fā)明實(shí)施例中，移動(dòng)終端可以實(shí)時(shí)或每隔特定時(shí)間檢測自身當(dāng)前顯示界面中是否存在目標(biāo)輸入欄。其中，目標(biāo)輸入欄可以為未輸入文字信息的輸入欄，即目標(biāo)輸入欄當(dāng)前處于空閑狀態(tài)，可以輸入文字信息。當(dāng)前顯示界面可以是移動(dòng)終端當(dāng)前進(jìn)入的某一應(yīng)用程序的操作界面，如短信聊天界面、資訊搜索界面等等。在本發(fā)明實(shí)施例中，移動(dòng)終端是自動(dòng)檢測目標(biāo)輸入欄的，而無需用戶去手動(dòng)點(diǎn)擊輸入欄。具體的，移動(dòng)終端可以根據(jù)光標(biāo)的位置或者輸入欄的狀態(tài)變化來自動(dòng)檢測是否為空閑的目標(biāo)輸入欄。

102、接收用戶按照預(yù)設(shè)方式觸發(fā)的語音輸入開啟指令。

本發(fā)明實(shí)施例中，移動(dòng)終端在自動(dòng)檢測到當(dāng)前顯示界面中的目標(biāo)輸入欄后，可以接收用戶觸發(fā)的語音輸入開啟指令，該語音輸入開啟指令用于開啟移動(dòng)終端的語音輸入模式。具體的，移動(dòng)終端可以實(shí)時(shí)或每隔一定時(shí)間檢測是否接收到用戶按照預(yù)設(shè)方式所觸發(fā)的語音輸入開啟指令。

作為一種可選的實(shí)施方式，步驟102接收用戶按照預(yù)設(shè)方式觸發(fā)的語音輸入開啟指令的具體實(shí)施方式可以包括但不限于以下情況中的一種或多種的組合：

11)接收用戶通過操作預(yù)設(shè)物理按鍵所觸發(fā)的語音輸入開啟指令；

12)接收用戶通過操作預(yù)設(shè)虛擬按鍵所觸發(fā)的語音輸入開啟指令；

13)接收用戶通過輸入預(yù)設(shè)手勢所觸發(fā)的語音輸入開啟指令；

14)接收用戶通過輸入預(yù)設(shè)生物特征信息所觸發(fā)的語音輸入開啟指令。

在該實(shí)施方式中，預(yù)設(shè)方式可以是操作預(yù)設(shè)物理按鍵，該預(yù)設(shè)物理按鍵可以是一個(gè)或多個(gè)物理按鍵的組合，如用戶通過長按或短按音量鍵來觸發(fā)語音輸入開啟指令。預(yù)設(shè)方式可以是操作預(yù)設(shè)虛擬按鍵，該預(yù)設(shè)虛擬按鍵可以是一個(gè)或多個(gè)虛擬按鍵的組合，如用戶通過長按或短按主菜單home鍵來觸發(fā)語音輸入開啟指令。預(yù)設(shè)方式也可以是輸入預(yù)設(shè)手勢，該預(yù)設(shè)手勢可以包括但不限于針對移動(dòng)終端觸摸屏的預(yù)設(shè)觸控軌跡、改變移動(dòng)終端姿態(tài)的預(yù)設(shè)搖晃軌跡等，通過獲取用戶輸入的手勢與該預(yù)設(shè)手勢進(jìn)行匹配來確定語音輸入開啟指令，當(dāng)匹配率高于預(yù)設(shè)值時(shí)，兩者匹配成功，接收到的是語音輸入開啟指令；當(dāng)匹配率不高于預(yù)設(shè)值時(shí)，兩者匹配失敗，接收到的不是語音輸入開啟指令，如用戶通過在移動(dòng)終端的觸摸屏上輸入某一特定觸控軌跡來觸發(fā)語音輸入開啟指令，或者用戶按照某一特定搖晃軌跡搖動(dòng)移動(dòng)終端來觸發(fā)語音輸入開啟指令。預(yù)設(shè)方式還可以是輸入預(yù)設(shè)生物特征信息，該預(yù)設(shè)生物特征信息可以包括但不限于預(yù)設(shè)人臉特征信息、預(yù)設(shè)虹膜特征信息、預(yù)設(shè)聲紋特征信息、預(yù)設(shè)指紋特征信息等中的至少一種，如通過獲取用戶輸入的指紋信息與預(yù)設(shè)指紋信息進(jìn)行匹配，當(dāng)匹配成功，則接收到的為語音輸入開啟指令。此外，還可以通過其他快捷方式來觸發(fā)語音輸入開啟指令，該實(shí)施方式不作限定。通過實(shí)施該實(shí)施方式，用戶無需去查找當(dāng)前應(yīng)用程序提供的語音輸入按鈕，尤其對于一些不提供語音輸入按鈕的應(yīng)用程序，可以通過上述方式快捷的開啟移動(dòng)終端的語音輸入功能來進(jìn)行語音輸入，提高輸入的效率。

可以理解的是，步驟101可以先于步驟102執(zhí)行，也可以后于步驟102執(zhí)行，也可以與步驟102交叉或同步執(zhí)行，本發(fā)明實(shí)施例不作限定。

103、根據(jù)該語音輸入開啟指令，開啟語音輸入模式。

本發(fā)明實(shí)施例中，當(dāng)移動(dòng)終端接收到用戶觸發(fā)的語音輸入開啟指令時(shí)，可以響應(yīng)該語音輸入開啟指令來開啟移動(dòng)終端的語音輸入模式。其中，語音輸入模式為允許用戶或外部其他設(shè)備向移動(dòng)終端輸入語音信息的一種模式。

104、在該語音輸入模式下，接收輸入的語音信息。

本發(fā)明實(shí)施例中，當(dāng)移動(dòng)終端進(jìn)入語音輸入模式時(shí)，此時(shí)可以接收用戶或外部設(shè)備輸入的語音信息。具體的，移動(dòng)終端在語音輸入模式下可以開啟自身中的麥克風(fēng)、話筒或特定的聲音采集器，從而可以實(shí)時(shí)采集外部輸入的語音信息。

105、在目標(biāo)輸入欄中顯示該語音信息對應(yīng)的文字信息。

本發(fā)明實(shí)施例中，移動(dòng)終端在接收到輸入的語音信息后，可以將該語音信息轉(zhuǎn)化為對應(yīng)的文字信息，并顯示在空閑的目標(biāo)輸入欄中。語音信息轉(zhuǎn)化為文字信息可以采用語音識別的方法，其具體實(shí)現(xiàn)過程可以參考當(dāng)前現(xiàn)有的語音識別技術(shù)。

可見，實(shí)施圖1所描述的方法，移動(dòng)終端通過自動(dòng)檢測當(dāng)前顯示界面上空閑的文字輸入欄，并接收用戶按照預(yù)設(shè)方式輸入的語音輸入開啟指令來快速開啟語音輸入功能以進(jìn)行語音輸入，而無需用戶手動(dòng)點(diǎn)擊待輸入的文字輸入欄，也無需用戶花時(shí)間去查找當(dāng)前應(yīng)用程序所提供的語音輸入按鈕。這樣，自動(dòng)檢測空閑的文字輸入欄，并采用快捷方式啟動(dòng)語音輸入功能，能夠提高語音輸入的操作效率，有效改善用戶進(jìn)行語音輸入的體驗(yàn)。

實(shí)施例二

請參閱圖2，圖2是本發(fā)明實(shí)施例公開的另一種語音輸入方法的流程示意圖。其中，該語音輸入方法可以應(yīng)用于移動(dòng)終端中。如圖2所示，該語音輸入方法可以包括以下步驟。

201、檢測移動(dòng)終端當(dāng)前顯示界面中的目標(biāo)輸入欄。

本發(fā)明實(shí)施例中，目標(biāo)輸入欄可以為當(dāng)前顯示界面中未輸入文字信息的輸入欄，即處于空閑狀態(tài)的輸入欄。

作為一種可選的實(shí)施方式，步驟201檢測移動(dòng)終端當(dāng)前顯示界面中的目標(biāo)輸入欄的具體實(shí)施方式可以包括以下步驟：

21)獲取移動(dòng)終端當(dāng)前顯示界面所屬應(yīng)用程序的注冊接口；

22)獲取該注冊接口的狀態(tài)信息；

23)判斷該狀態(tài)信息是否為預(yù)設(shè)狀態(tài)信息，預(yù)設(shè)狀態(tài)信息用于指示輸入欄未輸入文字信息；

24)如果該狀態(tài)信息為預(yù)設(shè)狀態(tài)信息，確定該注冊接口對應(yīng)的輸入欄為目標(biāo)輸入欄。

在該實(shí)施方式中，應(yīng)用程序可以通過設(shè)置注冊接口來關(guān)聯(lián)輸入欄，一般一個(gè)輸入欄關(guān)聯(lián)一個(gè)注冊接口，通過實(shí)時(shí)監(jiān)測注冊接口的狀態(tài)來確定其關(guān)聯(lián)的輸入欄是否空閑。具體的，移動(dòng)終端先確定當(dāng)前顯示界面所屬的應(yīng)用程序，再獲取該應(yīng)用程序的一個(gè)或多個(gè)注冊接口，分別獲取每一個(gè)注冊接口的狀態(tài)信息，并判斷每一個(gè)注冊接口的狀態(tài)信息是否為預(yù)設(shè)狀態(tài)信息，如果一個(gè)注冊接口的狀態(tài)信息為預(yù)設(shè)狀態(tài)信息，則說明該注冊接口對應(yīng)關(guān)聯(lián)的輸入欄為未輸入文字信息的空閑輸入欄，即目標(biāo)輸入欄。如果一個(gè)注冊接口的狀態(tài)信息不為預(yù)設(shè)狀態(tài)信息，則說明該注冊接口對應(yīng)關(guān)聯(lián)的輸入欄為已輸入有文字信息的非空閑輸入欄。當(dāng)在空閑輸入欄中輸入文字信息后，其關(guān)聯(lián)的注冊接口的狀態(tài)信息將發(fā)生變化，以及將非空閑輸入欄中的文字信息清空后，其關(guān)聯(lián)的注冊接口的狀態(tài)信息也將發(fā)生變化。例如，假設(shè)預(yù)設(shè)狀態(tài)信息為“0”，當(dāng)一注冊接口的狀態(tài)信息為“0”時(shí)，則該注冊接口對應(yīng)的輸入欄為空閑輸入欄；當(dāng)該注冊接口的狀態(tài)信息為“1”時(shí)，則該注冊接口對應(yīng)的輸入欄為非空閑輸入欄。

202、接收用戶按照預(yù)設(shè)方式觸發(fā)的語音輸入開啟指令。

具體的，移動(dòng)終端可以接收用戶通過操作預(yù)設(shè)物理按鍵、預(yù)設(shè)虛擬按鍵、輸入預(yù)設(shè)手勢以及輸入預(yù)設(shè)生物特征信息等中的一種或多種方式觸發(fā)的語音輸入開啟指令。

203、根據(jù)該語音輸入開啟指令，開啟語音輸入模式。

204、在該語音輸入模式下，接收輸入的語音信息。

205、對接收到的該語音信息進(jìn)行預(yù)處理，以獲得預(yù)處理后的語音信息。

本發(fā)明實(shí)施例中，移動(dòng)終端接收到的語音信息可能因?yàn)榇嬖谠肼暥绊懻Z音識別結(jié)果，因此需要對接收到的語音信息進(jìn)行預(yù)處理。其具體實(shí)施方式可以包括但不限于：按照預(yù)設(shè)好的降噪值對語音信息進(jìn)行去噪濾波處理，和/或，根據(jù)預(yù)設(shè)的音頻分貝值對語音信息再次進(jìn)行濾波處理(例如將語音信息中的分貝值低于預(yù)設(shè)的音頻分貝值的內(nèi)容進(jìn)行濾除)，以去除語音信息中的各種噪聲，避免呼吸聲、雜音異響等干擾，從而提升語音信息識別成文本的精度。

206、對預(yù)處理后的語音信息進(jìn)行識別，以得出預(yù)處理后的語音信息所包含的內(nèi)容。

本發(fā)明實(shí)施例中，對預(yù)處理后的語音信息進(jìn)行識別，以識別出其中所包含的內(nèi)容的具體實(shí)施方式可以為：將預(yù)處理后的語音信息與預(yù)設(shè)語音模型進(jìn)行匹配，識別出預(yù)處理后的語音信息所包含的內(nèi)容。具體的，可以提取出預(yù)處理后的語音信息中的特征參數(shù)，并與移動(dòng)終端中事先存儲的預(yù)設(shè)語音模型進(jìn)行匹配，從而將匹配率最高的語音模型作為識別結(jié)果。預(yù)設(shè)語音模型中可以包括多個(gè)語音字詞的訓(xùn)練模型，可以采用孤立詞語音識別、隱馬爾可夫模型(hiddenmarkovmodel，hmm)、動(dòng)態(tài)時(shí)間規(guī)整(dynamictimewarping，dtw)等方法來完成語音識別過程。

作為一種可選的實(shí)施方式，步驟206對預(yù)處理后的語音信息進(jìn)行識別，以得出預(yù)處理后的語音信息所包含的內(nèi)容的具體實(shí)施方式可以包括以下步驟：

25)將預(yù)處理后的語音信息與預(yù)設(shè)語音模型進(jìn)行匹配，以獲得匹配結(jié)果；

26)當(dāng)預(yù)處理后的語音信息與預(yù)設(shè)語音模型進(jìn)行匹配的匹配率低于預(yù)設(shè)值時(shí)，輸出至少一條識別內(nèi)容；

27)接收用戶針對上述至少一條識別內(nèi)容中的其中一條輸入的選取指令；

28)根據(jù)該選取指令，確定用戶選取的識別內(nèi)容為預(yù)處理后的語音信息所包含的內(nèi)容。

在該實(shí)施方式中，當(dāng)語音信息中存在部分內(nèi)容與預(yù)設(shè)語音模型中的所有模型進(jìn)行匹配時(shí)，得到的所有匹配率均低于預(yù)設(shè)值，說明語音音質(zhì)差或發(fā)音不太標(biāo)準(zhǔn)，導(dǎo)致語音識別的準(zhǔn)確率低。為了避免識別錯(cuò)誤，可以以文字的形式同時(shí)輸出至少一條識別內(nèi)容，這至少一條識別內(nèi)容可以取其中匹配率較高的幾條。用戶可以在輸出的幾條識別內(nèi)容中選取正確的那一條作為最終的識別結(jié)果，即語音信息識別成的文字信息。如果輸出的幾條識別內(nèi)容均不符合用戶的需求，則此時(shí)用戶可以重復(fù)之前的操作開啟語音輸入模式來再次輸入語音信息。

207、在目標(biāo)輸入欄中以文字的形式顯示預(yù)處理后的語音信息所包含的內(nèi)容。

在一具體的實(shí)施方式中，請參閱圖3，圖3是本發(fā)明實(shí)施例公開的一種通過語音輸入進(jìn)行導(dǎo)航的具體操作示意圖。如圖3所示，在進(jìn)入地圖應(yīng)用app后，首先檢測輸入欄的狀態(tài)，當(dāng)為未輸入狀態(tài)后，可以按下預(yù)設(shè)的物理按鍵，開啟語音輸入模式，并接收用戶語音輸入的目的地，并實(shí)時(shí)將接收到的目的地轉(zhuǎn)化為文字顯示在輸入欄中，此時(shí)點(diǎn)擊導(dǎo)航按鈕即可根據(jù)地圖算法生成相應(yīng)的路徑。當(dāng)輸入的目的地不太精準(zhǔn)時(shí)，此時(shí)將生成多個(gè)候選地點(diǎn)和路徑供用戶選擇，用戶可以手動(dòng)選擇其中一個(gè)，也可以再次按下預(yù)設(shè)物理按鍵進(jìn)入語音輸入模式來再次輸入正確的目的地，識別輸入結(jié)果后，根據(jù)結(jié)果自動(dòng)開始導(dǎo)航。通過實(shí)施上述操作，無需用戶手動(dòng)點(diǎn)擊輸入欄和查找語音輸入按鈕，從而可以提升語音輸入的操作效率，從而提高導(dǎo)航的效率。

本發(fā)明實(shí)施例中，如果移動(dòng)終端當(dāng)前顯示界面上存在多個(gè)輸入欄時(shí)，可以逐一檢測各個(gè)輸入欄的狀態(tài)，在將輸入的語音信息識別為文字后顯示在其中一個(gè)空閑輸入欄后，可以按照順序依次在下一個(gè)空閑輸入欄中顯示新一輪的語音識別成的文字信息，而無需用戶每次進(jìn)行語音輸入前均手動(dòng)點(diǎn)擊相應(yīng)的輸入欄，從而進(jìn)一步提高了語音輸入的操作效率。

可見，實(shí)施圖2所描述的方法，移動(dòng)終端通過自動(dòng)檢測當(dāng)前顯示界面上空閑的文字輸入欄，并接收用戶按照預(yù)設(shè)方式輸入的語音輸入開啟指令來快速開啟語音輸入功能以進(jìn)行語音輸入，而無需用戶手動(dòng)點(diǎn)擊待輸入的文字輸入欄，也無需用戶花時(shí)間去查找當(dāng)前應(yīng)用程序所提供的語音輸入按鈕。這樣，自動(dòng)檢測空閑的文字輸入欄，并采用快捷方式啟動(dòng)語音輸入功能，能夠提高語音輸入的操作效率，有效改善用戶進(jìn)行語音輸入的體驗(yàn)。

實(shí)施例三

請參閱圖4，圖4是本發(fā)明實(shí)施例公開的一種移動(dòng)終端的結(jié)構(gòu)示意圖，可以用于執(zhí)行上述公開的語音輸入方法。如圖4所示，該移動(dòng)終端可以包括：

檢測單元401，用于檢測移動(dòng)終端當(dāng)前顯示界面中的目標(biāo)輸入欄。

其中，該目標(biāo)輸入欄可以為未輸入文字信息的輸入欄，即目標(biāo)輸入欄當(dāng)前處于空閑狀態(tài)，可以輸入文字信息。當(dāng)前顯示界面可以是移動(dòng)終端當(dāng)前進(jìn)入的某一應(yīng)用程序的操作界面，如短信聊天界面、資訊搜索界面等等。

第一接收單元402，用于接收用戶按照預(yù)設(shè)方式觸發(fā)的語音輸入開啟指令。

本發(fā)明實(shí)施例中，該語音輸入開啟指令用于開啟移動(dòng)終端的語音輸入模式。在檢測單元401檢測到目標(biāo)輸入欄后，可以發(fā)送一觸發(fā)指令，以觸發(fā)第一接收單元402去接收語音輸入開啟指令。

作為一種可選的實(shí)施方式，第一接收單元402接收用戶按照預(yù)設(shè)方式觸發(fā)的語音輸入開啟指令的具體實(shí)施方式可以包括但不限于以下情況中的一種或幾種的組合：

第一接收單元402接收用戶通過操作預(yù)設(shè)物理按鍵所觸發(fā)的語音輸入開啟指令；

第一接收單元402接收用戶通過操作預(yù)設(shè)虛擬按鍵所觸發(fā)的語音輸入開啟指令；

第一接收單元402接收用戶通過輸入預(yù)設(shè)手勢所觸發(fā)的語音輸入開啟指令；

第一接收單元402接收用戶通過輸入預(yù)設(shè)生物特征信息所觸發(fā)的語音輸入開啟指令。

其中，預(yù)設(shè)物理按鍵可以是一個(gè)或多個(gè)物理按鍵的組合；預(yù)設(shè)虛擬按鍵可以是一個(gè)或多個(gè)虛擬按鍵的組合；預(yù)設(shè)手勢可以包括但不限于針對移動(dòng)終端觸摸屏的預(yù)設(shè)觸控軌跡、改變移動(dòng)終端姿態(tài)的預(yù)設(shè)搖晃軌跡等；預(yù)設(shè)生物特征信息可以包括但不限于預(yù)設(shè)人臉特征信息、預(yù)設(shè)虹膜特征信息、預(yù)設(shè)聲紋特征信息、預(yù)設(shè)指紋特征信息等中的至少一種。

開啟指令403，用于根據(jù)該語音輸入開啟指令，開啟語音輸入模式。

第二接收單元404，用于在該語音輸入模式下，接收輸入的語音信息。

顯示單元405，用于在檢測單元401檢測出的目標(biāo)輸入欄中顯示該語音信息對應(yīng)的文字信息。

其中，實(shí)施圖4所描述的移動(dòng)終端，通過自動(dòng)檢測當(dāng)前顯示界面上空閑的文字輸入欄，并接收用戶按照預(yù)設(shè)方式輸入的語音輸入開啟指令來快速開啟語音輸入功能以進(jìn)行語音輸入，而用戶無需手動(dòng)點(diǎn)擊待輸入的文字輸入欄，也無需用戶花時(shí)間去查找當(dāng)前應(yīng)用程序所提供的語音輸入按鈕。這樣，自動(dòng)檢測空閑的文字輸入欄，并采用快捷方式啟動(dòng)語音輸入功能，能夠提高語音輸入的操作效率，有效改善用戶進(jìn)行語音輸入的體驗(yàn)。

實(shí)施例四

請參閱圖5，圖5是本發(fā)明實(shí)施例公開的另一種移動(dòng)終端的結(jié)構(gòu)示意圖，可以用于執(zhí)行上述公開的語音輸入方法。其中，圖5所示的移動(dòng)終端是由圖4所示的移動(dòng)終端進(jìn)行優(yōu)化得到的。與圖4所示的移動(dòng)終端相比較，圖5所示的移動(dòng)終端還可以包括：

預(yù)處理單元406，用于在顯示單元405在目標(biāo)輸入欄中顯示該語音信息對應(yīng)的文字信息之前，對第二接收單元404接收到的該語音信息進(jìn)行預(yù)處理，以獲得預(yù)處理后的語音信息；

識別單元407，用于對預(yù)處理后的語音信息進(jìn)行識別，以得出預(yù)處理后的語音信息所包含的內(nèi)容；

相應(yīng)地，顯示單元405具體用于在檢測單元401檢測出的目標(biāo)輸入欄中以文字的形式顯示預(yù)處理后的語音信息所包含的內(nèi)容。

作為一種可選的實(shí)施方式，檢測單元401可以進(jìn)一步包括：

第一獲取子單元4011，用于獲取移動(dòng)終端當(dāng)前顯示界面所屬應(yīng)用程序的注冊接口；

第二獲取子單元4012，用于獲取該注冊接口的狀態(tài)信息；

判斷子單元4013，用于判斷該狀態(tài)信息是否為預(yù)設(shè)狀態(tài)信息，該預(yù)設(shè)狀態(tài)信息用于指示輸入欄未輸入文字信息；

第一確定子單元4014，用于當(dāng)判斷子單元4013判斷出該狀態(tài)信息為預(yù)設(shè)狀態(tài)信息時(shí)，確定該注冊接口對應(yīng)的輸入欄為目標(biāo)輸入欄。

作為一種可選的實(shí)施方式，請一并參閱圖6，圖6是本發(fā)明實(shí)施例公開的又一種移動(dòng)終端的結(jié)構(gòu)示意圖，可以用于執(zhí)行上述公開的語音輸入方法。其中，圖6所示的移動(dòng)終端是由圖5所示的移動(dòng)終端進(jìn)行優(yōu)化得到的。與圖5所示的移動(dòng)終端相比較，圖6所示的移動(dòng)終端中識別單元407可以進(jìn)一步包括：

匹配子單元4071，用于將預(yù)處理后的語音信息與預(yù)設(shè)語音模型進(jìn)行匹配，以獲得匹配結(jié)果；

輸出子單元4072，用于當(dāng)匹配子單元4071將預(yù)處理后的語音信息與預(yù)設(shè)語音模型進(jìn)行匹配的匹配率低于預(yù)設(shè)值時(shí)，輸出至少一條識別內(nèi)容；

接收子單元4073，用于接收用戶針對上述至少一條識別內(nèi)容中的其中一條輸入的選取指令；

第二確定子單元4074，用于根據(jù)該選取指令，確定用戶選取的識別內(nèi)容為預(yù)處理后的語音信息所包含的內(nèi)容。

其中，實(shí)施圖6所描述的移動(dòng)終端，通過自動(dòng)檢測當(dāng)前顯示界面上空閑的文字輸入欄，并接收用戶按照預(yù)設(shè)方式輸入的語音輸入開啟指令來快速開啟語音輸入功能以進(jìn)行語音輸入，而用戶無需手動(dòng)點(diǎn)擊待輸入的文字輸入欄，也無需用戶花時(shí)間去查找當(dāng)前應(yīng)用程序所提供的語音輸入按鈕。這樣，自動(dòng)檢測空閑的文字輸入欄，并采用快捷方式啟動(dòng)語音輸入功能，能夠提高語音輸入的操作效率，有效改善用戶進(jìn)行語音輸入的體驗(yàn)。

具體地，本發(fā)明實(shí)施例中介紹的移動(dòng)終端可以實(shí)施本發(fā)明結(jié)合圖1或圖2介紹的語音輸入方法實(shí)施例中的部分或全部流程。

需要說明的是，對于前述的各個(gè)方法實(shí)施例，為了簡單描述，故將其都表述為一系列的動(dòng)作組合，但是本領(lǐng)域技術(shù)人員應(yīng)該知悉，本發(fā)明并不受所描述的動(dòng)作順序的限制，因?yàn)橐罁?jù)本申請，某一些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次，本領(lǐng)域技術(shù)人員也應(yīng)該知悉，說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例，所涉及的動(dòng)作和模塊并不一定是本申請所必須的。

在上述實(shí)施例中，對各個(gè)實(shí)施例的描述都各有側(cè)重，某個(gè)實(shí)施例中沒有詳細(xì)描述的部分，可以參見其他實(shí)施例的相關(guān)描述。

本發(fā)明實(shí)施例方法中的步驟可以根據(jù)實(shí)際需要進(jìn)行順序調(diào)整、合并和刪減。

本發(fā)明實(shí)施例移動(dòng)終端中的單元或子單元可以根據(jù)實(shí)際需要進(jìn)行合并、劃分和刪減。

本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成，該程序可以存儲于一計(jì)算機(jī)可讀存儲介質(zhì)中，存儲介質(zhì)包括只讀存儲器(read-onlymemory，rom)、隨機(jī)存儲器(randomaccessmemory，ram)、可編程只讀存儲器(programmableread-onlymemory，prom)、可擦除可編程只讀存儲器(erasableprogrammablereadonlymemory，eprom)、一次可編程只讀存儲器(one-timeprogrammableread-onlymemory，otprom)、電子抹除式可復(fù)寫只讀存儲器(electrically-erasableprogrammableread-onlymemory，eeprom)、只讀光盤(compactdiscread-onlymemory，cd-rom)或其他光盤存儲器、磁盤存儲器、磁帶存儲器、或者能夠用于攜帶或存儲數(shù)據(jù)的計(jì)算機(jī)可讀的任何其他介質(zhì)。

以上對本發(fā)明實(shí)施例公開的一種語音輸入方法及移動(dòng)終端進(jìn)行了詳細(xì)介紹，本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述，以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想；同時(shí)，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā)明的思想，在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處，綜上所述，本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李濱何
技術(shù)所有人：廣東艾檬電子科技有限公司
我是此專利的發(fā)明人

上一篇：閥組件的制造方法與工藝
上一篇：動(dòng)畫素材的搜索方法及系統(tǒng)與流程

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

移動(dòng)終端取證檢驗(yàn)方法相關(guān)技術(shù)

語音輸入相關(guān)技術(shù)

電腦語音輸入軟件相關(guān)技術(shù)

語音輸入軟件相關(guān)技術(shù)

微信語音輸入相關(guān)技術(shù)

手機(jī)語音輸入軟件相關(guān)技術(shù)

mac語音輸入相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語音輸入方法及移動(dòng)終端與流程