本發(fā)明涉及多媒體技術(shù)領(lǐng)域,具體涉及一種語音識(shí)別方法及終端。
背景技術(shù):
人機(jī)交互是人與終端進(jìn)行交互的一門學(xué)問,終端可以是各種各樣的機(jī)器,如手機(jī)、平板電腦、洗衣機(jī)、電視機(jī)等。人機(jī)交互界面通常是指用戶可見的部分,用戶可以通過人機(jī)交互界面與終端交流。用戶可以通過可視化窗口、操縱桿、手柄、遙控等方式與終端進(jìn)行交互,但上述交互方式都需要用戶手動(dòng)操作終端,當(dāng)用戶不方便手動(dòng)操作時(shí),用戶將無法操作終端。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種語音識(shí)別方法及終端,可以實(shí)現(xiàn)用戶通過語音操作終端。
本發(fā)明實(shí)施例第一方面提供一種語音識(shí)別方法,包括:
終端采集語音信號(hào);
所述終端從所述語音信號(hào)中提取所述語音信號(hào)的對(duì)象信息;
所述終端判斷所述對(duì)象信息是否為所述終端的信息;
當(dāng)所述對(duì)象信息不是所述終端的信息時(shí),所述終端將所述語音信號(hào)發(fā)送給所述對(duì)象信息對(duì)應(yīng)的終端,以使所述對(duì)象信息對(duì)應(yīng)的終端從所述語音信號(hào)中提取指令并執(zhí)行。
本發(fā)明實(shí)施例第二方面提供一種終端,包括:
采集單元,用于采集語音信號(hào);
第一提取單元,用于從所述采集單元采集的語音信號(hào)中提取所述語音信號(hào)的對(duì)象信息;
第一判斷單元,用于判斷所述第一提取單元提取的對(duì)象信息是否為所述終端的信息;
發(fā)送單元,用于當(dāng)所述第一判斷單元的判斷結(jié)果為所述對(duì)象信息不是所述終端的信息時(shí),將所述采集單元采集的語音信號(hào)發(fā)送給所述對(duì)象信息對(duì)應(yīng)的終端,以使所述對(duì)象信息對(duì)應(yīng)的終端從所述語音信號(hào)中提取指令并執(zhí)行。
本發(fā)明實(shí)施例中,終端采集語音信號(hào),從語音信號(hào)中提取語音信號(hào)的對(duì)象信息,判斷對(duì)象信息是否為該終端的信息,當(dāng)對(duì)象信息不是該終端的信息時(shí),將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行,可見,用戶不僅可以直接與一個(gè)終端進(jìn)行交互,還可以通過這個(gè)終端與另一終端進(jìn)行間接交互,從而可以實(shí)現(xiàn)用戶通過語音操作終端。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明實(shí)施例提供的一種網(wǎng)絡(luò)架構(gòu)示意圖;
圖2是本發(fā)明實(shí)施例提供的一種語音識(shí)別方法的流程示意圖;
圖3是本發(fā)明實(shí)施例提供的另一種語音識(shí)別方法的流程示意圖;
圖4是本發(fā)明實(shí)施例提供的一種終端的結(jié)構(gòu)示意圖;
圖5是本發(fā)明實(shí)施例提供的另一種終端的結(jié)構(gòu)示意圖;
圖6是本發(fā)明實(shí)施例提供的又一種終端的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明實(shí)施例提供一種語音識(shí)別方法及終端,可以實(shí)現(xiàn)用戶通過語音操作終端。以下分別進(jìn)行詳細(xì)說明。
為了更好地理解本發(fā)明實(shí)施例提供的一種語音識(shí)別方法及終端,下面先對(duì)本發(fā)明實(shí)施例使用的網(wǎng)絡(luò)架構(gòu)進(jìn)行描述。請參閱圖1,圖1是本發(fā)明實(shí)施例提供的一種網(wǎng)絡(luò)架構(gòu)示意圖。如圖1所示,該網(wǎng)絡(luò)架構(gòu)可以包括至少兩個(gè)終端,這至少兩個(gè)終端之間通過數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行連接,這至少兩個(gè)終端之間可以通過數(shù)據(jù)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸,這至少兩個(gè)終端具有語音采集功能。這至少兩個(gè)終端可以為手機(jī)、平板電腦、洗衣機(jī)、電視機(jī)、電冰箱等。數(shù)據(jù)網(wǎng)絡(luò)可以因特網(wǎng)、局域網(wǎng)、WIFI網(wǎng)絡(luò)等。
基于圖1所示的網(wǎng)絡(luò)架構(gòu),請參閱圖2,圖2是本發(fā)明實(shí)施例提供的一種語音識(shí)別方法的流程示意圖。其中,該語音識(shí)別方法是從上述至少兩個(gè)終端中的任一終端的角度來描述的。如圖2所示,該語音識(shí)別方法可以包括以下步驟。
201、終端采集語音信號(hào)。
本實(shí)施例中,終端可以通過話筒、麥克風(fēng)、傳感器等語音采集裝置采集語音信號(hào)。
202、終端從語音信號(hào)中提取語音信號(hào)的對(duì)象信息。
本實(shí)施例中,終端采集到語音信號(hào)之后,將從語音信號(hào)中提取語音信號(hào)的對(duì)象信息,語音信號(hào)的對(duì)象信息用于標(biāo)識(shí)這個(gè)語音信號(hào)是針對(duì)哪個(gè)終端的語音信號(hào)。其中,語音信號(hào)的對(duì)象信息可以為終端名稱,例如:當(dāng)家里只有一臺(tái)洗衣機(jī)、一臺(tái)電視機(jī)和一臺(tái)電冰箱時(shí),對(duì)象信息可以直接為洗衣機(jī)、電視機(jī)、電冰箱等終端名稱,語音信號(hào)可以為“打開電冰箱”等;也可以為終端編號(hào),可以預(yù)先為每個(gè)終端唯一設(shè)置一個(gè)編號(hào),之后可以通過編號(hào)識(shí)別每個(gè)終端,例如:洗衣機(jī)為編號(hào)1、電冰箱為編號(hào)2、客廳的電視機(jī)為編號(hào)3、臥室的電視機(jī)為編號(hào)4等,對(duì)象信息為1、2、3、4等,語音信號(hào)可以為“啟動(dòng)1”;還可以為終端名稱和終端編號(hào),例如:當(dāng)家里有至少兩臺(tái)電視機(jī)時(shí),只通過終端名稱電視機(jī)將無法識(shí)別出這個(gè)語音信號(hào)是針對(duì)那臺(tái)電視機(jī)的語音信號(hào),因此,可以為這至少兩臺(tái)電視機(jī)進(jìn)行編號(hào),如電視機(jī)1、電視機(jī)2等。
203、終端判斷語音信號(hào)的對(duì)象信息是否為該終端的信息,當(dāng)語音信號(hào)的對(duì)象信息為該終端的信息時(shí),執(zhí)行步驟204,當(dāng)語音信號(hào)的對(duì)象信息不是該終端的信息時(shí),執(zhí)行步驟205。
本實(shí)施例中,終端從語音信號(hào)中提取到語音信號(hào)的對(duì)象信息之后,將判斷語音信號(hào)的對(duì)象信息是否為該終端的信息,即比較語音信號(hào)的對(duì)象信息與該終端的信息,當(dāng)語音信號(hào)的對(duì)象信息與該終端的信息相同時(shí),表明語音信號(hào)的對(duì)象信息為該終端的信息,即表明語音信號(hào)是針對(duì)該終端的語音信號(hào),將執(zhí)行步驟204;當(dāng)語音信號(hào)的對(duì)象信息與該終端的信息不同時(shí),表明語音信號(hào)的對(duì)象信息不是該終端的信息,即表明語音信號(hào)不是針對(duì)該終端的語音信號(hào),將執(zhí)行步驟205。
204、終端從語音信號(hào)中提取指令并執(zhí)行。
本實(shí)施例中,當(dāng)判斷出語音信號(hào)的對(duì)象信息為該終端的信息,即表明語音信號(hào)是針對(duì)該終端的語音信號(hào)時(shí),終端將從語音信號(hào)中提取指令并執(zhí)行,例如:語音信號(hào)為“將電冰箱的溫度調(diào)為5度”時(shí),指令為“將溫度調(diào)為5度”。
205、終端將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行。
本實(shí)施例中,當(dāng)判斷出語音信號(hào)的對(duì)象信息不是該終端的信息,即表明語音信號(hào)不是針對(duì)該終端的語音信號(hào)時(shí),終端將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行,即以使對(duì)象信息對(duì)應(yīng)的終端執(zhí)行步驟204的操作。
在圖2所描述的語音識(shí)別方法中,從語音信號(hào)中提取語音信號(hào)的對(duì)象信息,判斷對(duì)象信息是否為該終端的信息,當(dāng)對(duì)象信息不是該終端的信息時(shí),將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行,可見,用戶不僅可以直接與一個(gè)終端進(jìn)行交互,還可以通過這個(gè)終端與另一終端進(jìn)行間接交互,從而可以實(shí)現(xiàn)用戶通過語音操作終端。
基于圖1所示的網(wǎng)絡(luò)架構(gòu),請參閱圖3,圖3是本發(fā)明實(shí)施例提供的另一種語音識(shí)別方法的流程示意圖。其中,該語音識(shí)別方法是從上述至少兩個(gè)終端中的任一終端的角度來描述的。如圖3所示,該語音識(shí)別方法可以包括以下步驟。
301、終端采集語音信號(hào)。
本實(shí)施例中,終端可以通過話筒、麥克風(fēng)、傳感器等語音采集裝置采集語音信號(hào)。
302、終端從語音信號(hào)中提取語音信號(hào)的對(duì)象信息。
本實(shí)施例中,終端采集到語音信號(hào)之后,將從語音信號(hào)中提取語音信號(hào)的對(duì)象信息,語音信號(hào)的對(duì)象信息用于標(biāo)識(shí)這個(gè)語音信號(hào)是針對(duì)哪個(gè)終端的語音信號(hào)。其中,語音信號(hào)的對(duì)象信息可以為終端名稱,例如:當(dāng)家里只有一臺(tái)洗衣機(jī)、一臺(tái)電視機(jī)和一臺(tái)電冰箱時(shí),對(duì)象信息可以直接為洗衣機(jī)、電視機(jī)、電冰箱等終端名稱,語音信號(hào)可以為“打開電冰箱”等;也可以為終端編號(hào),可以預(yù)先為每個(gè)終端唯一設(shè)置一個(gè)編號(hào),之后可以通過編號(hào)識(shí)別每個(gè)終端,例如:洗衣機(jī)為編號(hào)1、電冰箱為編號(hào)2、客廳的電視機(jī)為編號(hào)3、臥室的電視機(jī)為編號(hào)4等,對(duì)象信息為1、2、3、4等,語音信號(hào)可以為“啟動(dòng)1”;還可以為終端名稱和終端編號(hào),例如:當(dāng)家里有至少兩臺(tái)電視機(jī)時(shí),只通過終端名稱電視機(jī)將無法識(shí)別出這個(gè)語音信號(hào)是針對(duì)那臺(tái)電視機(jī)的語音信號(hào),因此,可以為這至少兩臺(tái)電視機(jī)進(jìn)行編號(hào),如電視機(jī)1、電視機(jī)2等。
303、終端判斷語音信號(hào)的對(duì)象信息是否為該終端的信息,當(dāng)語音信號(hào)的對(duì)象信息為該終端的信息時(shí),執(zhí)行步驟304,當(dāng)語音信號(hào)的對(duì)象信息不是該終端的信息時(shí),執(zhí)行步驟308。
本實(shí)施例中,終端從語音信號(hào)中提取到語音信號(hào)的對(duì)象信息之后,將判斷語音信號(hào)的對(duì)象信息是否為該終端的信息,即比較語音信號(hào)的對(duì)象信息與該終端的信息,當(dāng)語音信號(hào)的對(duì)象信息與該終端的信息相同時(shí),表明語音信號(hào)的對(duì)象信息為該終端的信息,即表明語音信號(hào)是針對(duì)該終端的語音信號(hào),將執(zhí)行步驟304;當(dāng)語音信號(hào)的對(duì)象信息與該終端的信息不同時(shí),表明語音信號(hào)的對(duì)象信息不是該終端的信息,即表明語音信號(hào)不是針對(duì)該終端的語音信號(hào),將執(zhí)行步驟308。
304、終端判斷該終端是否設(shè)置有權(quán)限,當(dāng)該終端設(shè)置有權(quán)限時(shí),執(zhí)行步驟305,當(dāng)該終端未設(shè)置有權(quán)限時(shí),執(zhí)行步驟306。
本實(shí)施例中,為了保護(hù)終端的安全性或限制某些用戶對(duì)終端的使用,可以預(yù)先為終端設(shè)置權(quán)限,即采集允許使用終端的用戶的第一語音信號(hào),從第一語音信號(hào)中提取第一特征,為第一特征設(shè)置允許誤差值,并存儲(chǔ)第一特征和允許誤差值。當(dāng)判斷出語音信號(hào)的對(duì)象信息不是該終端的信息,即表明語音信號(hào)不是針對(duì)該終端的語音信號(hào)時(shí),終端可以先判斷該終端是否設(shè)置有權(quán)限,當(dāng)該終端設(shè)置有權(quán)限時(shí),表明有些用戶可以對(duì)該終端進(jìn)行操作、有些用戶不能對(duì)該終端進(jìn)行操作,將執(zhí)行步驟305,當(dāng)該終端未設(shè)置有權(quán)限時(shí),表明所有的用戶都可以對(duì)該終端進(jìn)行操作,將執(zhí)行步驟306。
305、終端提取語音信號(hào)的特征,比較該特征與存儲(chǔ)的語音特征,當(dāng)存儲(chǔ)的語音特征中存在與該特征相匹配的語音特征時(shí),將執(zhí)行步驟306,當(dāng)存儲(chǔ)的語音特征中不存在與該特征相匹配的語音特征時(shí),將執(zhí)行步驟307。
本實(shí)施例中,當(dāng)判斷出該終端設(shè)置有權(quán)限時(shí),將提取語音信號(hào)的特征,比較語音信號(hào)的特征與存儲(chǔ)的語音特征,當(dāng)存儲(chǔ)的語音特征中存在與語音信號(hào)的特征相匹配的語音特征時(shí),表明語音信號(hào)對(duì)應(yīng)的用戶具有操作該終端的權(quán)限,將執(zhí)行步驟306;當(dāng)存儲(chǔ)的語音特征中不存在與語音信號(hào)的特征相匹配的語音特征時(shí),表明語音信號(hào)對(duì)應(yīng)的用戶不具有操作該終端的權(quán)限,將執(zhí)行步驟307。其中,語音信號(hào)的特征可以包括幅度、相位和頻率,比較語音信號(hào)的特征與存儲(chǔ)的語音特征,即比較語音信號(hào)的幅度與目標(biāo)幅度、語音信號(hào)的相位和目標(biāo)相位以及語音信號(hào)的頻率和目標(biāo)頻率,目標(biāo)幅度、目標(biāo)相位和目標(biāo)頻率屬于存儲(chǔ)的語音特征中的目標(biāo)語音特征,當(dāng)語音信號(hào)的幅度與目標(biāo)幅度的差的絕對(duì)值小于第一預(yù)設(shè)值、語音信號(hào)的相位和目標(biāo)相位的差的絕對(duì)值小于第二預(yù)設(shè)值以及語音信號(hào)的頻率和目標(biāo)頻率的差的絕對(duì)值小于第三預(yù)設(shè)值時(shí),確定目標(biāo)語音特征與語音信號(hào)的特征相匹配。第一預(yù)設(shè)值、第二預(yù)設(shè)值和第三預(yù)設(shè)值即為允許誤差值。
306、終端從語音信號(hào)中提取指令并執(zhí)行。
本實(shí)施例中,當(dāng)判斷出語音信號(hào)的對(duì)象信息為該終端的信息,即表明語音信號(hào)是針對(duì)該終端的語音信號(hào)時(shí),終端將從語音信號(hào)中提取指令并執(zhí)行,例如:語音信號(hào)為“將電冰箱的溫度調(diào)為5度”時(shí),指令為“將溫度調(diào)為5度”。
307、終端丟棄語音信號(hào)。
308、終端將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行。
本實(shí)施例中,當(dāng)判斷出語音信號(hào)的對(duì)象信息不是該終端的信息,即表明語音信號(hào)不是針對(duì)該終端的語音信號(hào)時(shí),終端將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行,即以使對(duì)象信息對(duì)應(yīng)的終端執(zhí)行步驟304-307的操作。
在圖3所描述的語音識(shí)別方法中,從語音信號(hào)中提取語音信號(hào)的對(duì)象信息,判斷對(duì)象信息是否為該終端的信息,當(dāng)對(duì)象信息不是該終端的信息時(shí),將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行,可見,用戶不僅可以直接與一個(gè)終端進(jìn)行交互,還可以通過這個(gè)終端與另一終端進(jìn)行間接交互,從而可以實(shí)現(xiàn)用戶通過語音操作終端。
基于圖1所示的網(wǎng)絡(luò)架構(gòu),請參閱圖4,圖4是本發(fā)明實(shí)施例提供的一種終端的結(jié)構(gòu)示意圖。如圖4所示,該終端可以包括:
采集單元401,用于采集語音信號(hào);
第一提取單元402,用于從采集單元401采集的語音信號(hào)中提取語音信號(hào)的對(duì)象信息;
第一判斷單元403,用于判斷第一提取單元402提取的對(duì)象信息是否為該終端的信息;
發(fā)送單元404,用于當(dāng)?shù)谝慌袛鄦卧?03的判斷結(jié)果為語音信號(hào)的對(duì)象信息不是該終端的信息時(shí),將采集單元401采集的語音信號(hào)發(fā)送給語音信號(hào)的對(duì)象信息對(duì)應(yīng)的終端,以使語音信號(hào)的對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行。
在圖4所描述的終端中,從語音信號(hào)中提取語音信號(hào)的對(duì)象信息,判斷對(duì)象信息是否為該終端的信息,當(dāng)對(duì)象信息不是該終端的信息時(shí),將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行,可見,用戶不僅可以直接與一個(gè)終端進(jìn)行交互,還可以通過這個(gè)終端與另一終端進(jìn)行間接交互,從而可以實(shí)現(xiàn)用戶通過語音操作終端。
基于圖1所示的網(wǎng)絡(luò)架構(gòu),請參閱圖5,圖5是本發(fā)明實(shí)施例提供的另一種終端的結(jié)構(gòu)示意圖。其中,圖5所示的終端是由圖4所示的終端優(yōu)化得到的,其中,該終端還可以包括:
執(zhí)行單元405,用于當(dāng)?shù)谝慌袛鄦卧?03的判斷結(jié)果為語音信號(hào)的對(duì)象信息是該終端的信息時(shí),從采集單元401采集的語音信號(hào)中提取指令并執(zhí)行。
作為一種可能的實(shí)施方式,該終端還可以包括:
第二判斷單元406,用于判斷該終端是否設(shè)置有權(quán)限;
第二提取單元407,用于當(dāng)?shù)诙袛鄦卧?06的判斷結(jié)果為該終端設(shè)置有權(quán)限時(shí),提取采集單元401采集的語音信號(hào)的特征;
比較單元408,用于比較第二提取單元407提取的特征與存儲(chǔ)的語音特征,當(dāng)比較單元408的比較結(jié)果為存儲(chǔ)的語音特征中存在與語音信號(hào)的特征相匹配的語音特征時(shí),觸發(fā)執(zhí)行單元405執(zhí)行所述的從語音信號(hào)中提取指令并執(zhí)行的步驟。
具體地,當(dāng)?shù)谝慌袛鄦卧?03的判斷結(jié)果為語音信號(hào)的對(duì)象信息是該終端的信息時(shí),將觸發(fā)第二判斷單元406判斷該終端是否設(shè)置有權(quán)限。
作為一種可能的實(shí)施方式,語音信號(hào)的特征可以包括幅度、相位和頻率;
比較單元408,具體用于比較語音信號(hào)的幅度與目標(biāo)幅度、語音信號(hào)的相位和目標(biāo)相位以及語音信號(hào)的頻率和目標(biāo)頻率,當(dāng)語音信號(hào)的幅度與目標(biāo)幅度的差的絕對(duì)值小于第一預(yù)設(shè)值、語音信號(hào)的相位和目標(biāo)相位的差的絕對(duì)值小于第二預(yù)設(shè)值以及語音信號(hào)的頻率和目標(biāo)頻率的差的絕對(duì)值小于第三預(yù)設(shè)值時(shí),確定目標(biāo)語音特征與語音信號(hào)的特征相匹配,目標(biāo)幅度、目標(biāo)相位和目標(biāo)頻率屬于存儲(chǔ)的語音特征中的目標(biāo)語音特征。
作為一種可能的實(shí)施方式,語音信號(hào)的對(duì)象信息可以包括:
終端名稱;或者
終端編號(hào);或者
終端名稱和終端編號(hào)。
在圖5所描述的終端中,從語音信號(hào)中提取語音信號(hào)的對(duì)象信息,判斷對(duì)象信息是否為該終端的信息,當(dāng)對(duì)象信息不是該終端的信息時(shí),將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行,可見,用戶不僅可以直接與一個(gè)終端進(jìn)行交互,還可以通過這個(gè)終端與另一終端進(jìn)行間接交互,從而可以實(shí)現(xiàn)用戶通過語音操作終端。
基于圖1所示的網(wǎng)絡(luò)架構(gòu),請參閱圖6,圖6是本發(fā)明實(shí)施例提供的又一種終端的結(jié)構(gòu)示意圖。如圖6所示,該終端可以包括:至少一個(gè)處理器601,如CPU,存儲(chǔ)器602,通信接口603、語音采集裝置604以及至少一個(gè)通信總線605。存儲(chǔ)器602可以是高速RAM存儲(chǔ)器,也可以是非不穩(wěn)定的存儲(chǔ)器(non-volatile memory),例如至少一個(gè)磁盤存儲(chǔ)器??蛇x地,存儲(chǔ)器602還可以是至少一個(gè)位于遠(yuǎn)離前述處理器601的存儲(chǔ)裝置。其中:
通信總線605,用于實(shí)現(xiàn)這些組件之間的連接通信;
語音采集裝置604,用于采集語音信號(hào)并發(fā)送給處理器601;
存儲(chǔ)器602中存儲(chǔ)有一組程序代碼,處理器601用于調(diào)用存儲(chǔ)器602中存儲(chǔ)的程序代碼執(zhí)行以下操作:
從語音信號(hào)中提取語音信號(hào)的對(duì)象信息;
判斷語音信號(hào)的對(duì)象信息是否為該終端的信息;
通信接口603,用于當(dāng)語音信號(hào)的對(duì)象信息不是該終端的信息時(shí),將語音信號(hào)發(fā)送給語音信號(hào)的對(duì)象信息對(duì)應(yīng)的終端,以使語音信號(hào)的對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行。
作為一種可能的實(shí)施方式,處理器601還用于調(diào)用存儲(chǔ)器602中存儲(chǔ)的程序代碼執(zhí)行以下操作:
當(dāng)語音信號(hào)的對(duì)象信息是該終端的信息時(shí),從語音信號(hào)中提取指令并執(zhí)行。
作為一種可能的實(shí)施方式,當(dāng)語音信號(hào)的對(duì)象信息是該終端的信息時(shí),處理器601還用于調(diào)用存儲(chǔ)器602中存儲(chǔ)的程序代碼執(zhí)行以下操作:
判斷該終端是否設(shè)置有權(quán)限;
當(dāng)該終端設(shè)置有權(quán)限時(shí),提取語音信號(hào)的特征;
比較語音信號(hào)的特征與存儲(chǔ)的語音特征;
當(dāng)存儲(chǔ)的語音特征中存在與語音信號(hào)的特征相匹配的語音特征時(shí),執(zhí)行所述的從語音信號(hào)中提取指令并執(zhí)行的步驟。
作為一種可能的實(shí)施方式,語音信號(hào)的特征可以包括幅度、相位和頻率;
處理器601比較語音信號(hào)的特征與存儲(chǔ)的語音特征包括:
比較語音信號(hào)的幅度與目標(biāo)幅度、語音信號(hào)的相位和目標(biāo)相位以及語音信號(hào)的頻率和目標(biāo)頻率,目標(biāo)幅度、目標(biāo)相位和目標(biāo)頻率屬于存儲(chǔ)的語音特征中的目標(biāo)語音特征;
當(dāng)語音信號(hào)的幅度與目標(biāo)幅度的差的絕對(duì)值小于第一預(yù)設(shè)值、語音信號(hào)的相位和目標(biāo)相位的差的絕對(duì)值小于第二預(yù)設(shè)值以及語音信號(hào)的頻率和目標(biāo)頻率的差的絕對(duì)值小于第三預(yù)設(shè)值時(shí),確定目標(biāo)語音特征與語音信號(hào)的特征相匹配。
作為一種可能的實(shí)施方式,語音信號(hào)的對(duì)象信息可以包括:
終端名稱;或者
終端編號(hào);或者
終端名稱和終端編號(hào)。
其中,步驟201和301可以由終端中的語音采集裝置604來執(zhí)行,步驟202-204、302-307可以由終端中的處理器601和存儲(chǔ)器602來執(zhí)行,步驟205和308可以由終端中的通信接口603來執(zhí)行。
其中,采集單元401可以由終端中的語音采集裝置604來實(shí)現(xiàn),第一提取單元402、第一判斷單元403、執(zhí)行單元405、第二判斷單元406、第二提取單元407和比較單元408可以由終端中的處理器601和存儲(chǔ)器602來實(shí)現(xiàn),發(fā)送單元404可以由終端中的通信接口603來實(shí)現(xiàn)。
在圖6所描述的終端中,從語音信號(hào)中提取語音信號(hào)的對(duì)象信息,判斷對(duì)象信息是否為該終端的信息,當(dāng)對(duì)象信息不是該終端的信息時(shí),將語音信號(hào)發(fā)送給對(duì)象信息對(duì)應(yīng)的終端,以使對(duì)象信息對(duì)應(yīng)的終端從語音信號(hào)中提取指令并執(zhí)行,可見,用戶不僅可以直接與一個(gè)終端進(jìn)行交互,還可以通過這個(gè)終端與另一終端進(jìn)行間接交互,從而可以實(shí)現(xiàn)用戶通過語音操作終端。
本發(fā)明實(shí)施例的單元,可以以通用集成電路(如中央處理器CPU),或以專用集成電路(ASIC)來實(shí)現(xiàn)。
本領(lǐng)域普通技術(shù)人員可以意識(shí)到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來實(shí)現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡潔,上述描述的終端和單元的具體工作過程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過程,在此不再贅述。
在本申請所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的終端和方法,可以通過其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口、裝置或單元的間接耦合或通信連接,也可以是電的,機(jī)械的或其它的形式連接。
本發(fā)明實(shí)施例方法中的步驟可以根據(jù)實(shí)際需要進(jìn)行順序調(diào)整、合并和刪減。
本發(fā)明實(shí)施例終端中的單元可以根據(jù)實(shí)際需要進(jìn)行合并、劃分和刪減。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本發(fā)明實(shí)施例方案的目的。
另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以是兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分,或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上對(duì)本發(fā)明實(shí)施例提供的語音識(shí)別方法及終端進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。