本發(fā)明的實(shí)施方式涉及智能設(shè)備領(lǐng)域,更具體地,本發(fā)明的實(shí)施方式涉及一種喚醒智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法、智能設(shè)備和介質(zhì)。
背景技術(shù):
本部分旨在為權(quán)利要求書中陳述的本發(fā)明的實(shí)施方式提供背景或上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。
隨著智能設(shè)備技術(shù)的不斷進(jìn)步以及對(duì)生活品質(zhì)的不斷追求,作為物聯(lián)網(wǎng)應(yīng)用之一的智能設(shè)備的應(yīng)用前景越來(lái)越廣闊。隨著需求的不斷提升,在很多情況下,用戶需要跟智能設(shè)備進(jìn)行人機(jī)交互。
中國(guó)專利cn105912092a于2016年4月6日公開(kāi)了一種人機(jī)交互中的語(yǔ)音喚醒方法和語(yǔ)音識(shí)別裝置,該專利中的語(yǔ)音喚醒方法包括:s1靜音檢測(cè)步驟,包括:在機(jī)器檢測(cè)到聲音能量時(shí),進(jìn)行喚醒詞檢出,如果聲音能量包括喚醒詞,則喚醒機(jī)器開(kāi)始語(yǔ)音識(shí)別,否則,啟動(dòng)s2圖像檢測(cè)步驟;s2圖像檢測(cè)步驟,包括:在圖像檢測(cè)中,如果檢測(cè)到人,則喚醒機(jī)器開(kāi)始語(yǔ)音識(shí)別,否則繼續(xù)檢測(cè)聲音能量。通過(guò)本發(fā)明的方法和語(yǔ)音識(shí)別裝置,能夠結(jié)合圖像檢測(cè),實(shí)現(xiàn)人機(jī)交互,同時(shí)保持待機(jī)狀態(tài)下的低電力消耗,但是該方案是依賴喚醒詞來(lái)喚醒機(jī)器,需要先說(shuō)出喚醒詞才能喚醒機(jī)器,因此,喚醒操作不便捷,人機(jī)交互效率較低。
中國(guó)專利cn104065718a公開(kāi)了通過(guò)攝像頭判斷是否有人存在,來(lái)決定是否開(kāi)始進(jìn)行語(yǔ)音識(shí)別的方法。但是,在攝像頭前有人走動(dòng)但沒(méi)有交互意圖的場(chǎng)景下,會(huì)導(dǎo)致智能設(shè)備持續(xù)誤喚醒和識(shí)別,導(dǎo)致智能設(shè)備的功耗較大,用戶體驗(yàn)較差。
本發(fā)明主要解決如何減少喚醒時(shí)間,及降低功耗和提高用戶體驗(yàn)的問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
現(xiàn)有技術(shù)中的喚醒設(shè)備的方法存在喚醒操作不便捷、智能設(shè)備功耗較大及用戶體驗(yàn)較差的缺陷,這些是非常令人煩惱的過(guò)程。
為此,非常需要一種改進(jìn)的喚醒智能終端進(jìn)行語(yǔ)音識(shí)別的方法,以解決上述問(wèn)題。
在本發(fā)明實(shí)施方式的第一方面中,提供了一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法,包括:
確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí),進(jìn)入語(yǔ)音檢測(cè)狀態(tài);
在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量時(shí),進(jìn)行語(yǔ)音識(shí)別。
在一個(gè)實(shí)施方式中,根據(jù)本發(fā)明的上述實(shí)施方式所述的方法,確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備,包括下列方式中的至少一種:
接收到所述第一智能設(shè)備發(fā)送的第一信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備,所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的;
在所述第二智能設(shè)備處接收到所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備;或
在所述第二智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向,判定所述眼球朝向?yàn)樗龅诙悄茉O(shè)備所處的方向時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法,確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備,包括:
接收到所述第一智能設(shè)備發(fā)送的第一信號(hào),所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的,并且在所述第二智能設(shè)備處接收到所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備;或者
接收到所述第一智能設(shè)備發(fā)送的觸發(fā)信號(hào),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備,所述觸發(fā)信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域,并且在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向、判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí)發(fā)送的。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法,所述第一智能設(shè)備為智能眼鏡,和/或所述第二智能設(shè)備為智能音箱。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法,在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量,包括:
在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)到語(yǔ)音能量。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法,進(jìn)行語(yǔ)音識(shí)別,包括:
采用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法進(jìn)行語(yǔ)音識(shí)別。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法,所述第一部位為面部和/或眼部。
在本發(fā)明實(shí)施方式的第二方面中,提供了一種第二智能設(shè)備,包括:
第一確定單元,用于確定持有第一智能設(shè)備的用戶的第一部位是否朝向第二智能設(shè)備;
檢測(cè)單元,用于在所述第一確定單元確定持有第一智能設(shè)備的用戶的所述第一部位朝向第二智能設(shè)備時(shí),進(jìn)入語(yǔ)音檢測(cè)狀態(tài),進(jìn)行語(yǔ)音檢測(cè);
語(yǔ)音識(shí)別單元,用于在所述檢測(cè)單元在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量時(shí),進(jìn)行語(yǔ)音識(shí)別。
在一個(gè)實(shí)施方式中,根據(jù)本發(fā)明的上述實(shí)施方式所述的智能設(shè)備,所述第一確定單元包括接收單元和第二確定單元,或者包括判斷單元和第二確定單元,其中:
所述接收單元,用于接收所述第一智能設(shè)備發(fā)送的第一信號(hào),所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的;所述第二確定單元,用于在所述接收單元接收到所述第一信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備;或者,
所述接收單元,用于在所述第二智能設(shè)備處接收所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào);所述第二確定單元,用于在所述接收單元接收到所述第二信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備;或者,
所述判斷單元,用于在所述第二智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向;所述第二確定單元,用于在所述判斷單元判定所述眼球朝向?yàn)樗龅诙悄茉O(shè)備所處的方向時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備,所述第一確定單元包括接收單元和第二確定單元,其中:所述接收單元,用于接收所述第一智能設(shè)備發(fā)送的第一信號(hào)及在所述第二智能設(shè)備處接收所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào),或者,接收所述第一智能設(shè)備發(fā)送的觸發(fā)信號(hào),所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的,所述觸發(fā)信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域,并且在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向、判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí)發(fā)送的;
所述第二確定單元,用于在所述接收單元接收到所述第一信號(hào)及所述第二信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備,或者用于在所述接收單元接收到所述觸發(fā)信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備,所述第一智能設(shè)備為智能眼鏡,和/或所述第二智能設(shè)備為智能音箱。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備,所述檢測(cè)單元在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量,包括:
在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)到語(yǔ)音能量。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備,所述語(yǔ)音識(shí)別單元進(jìn)行語(yǔ)音識(shí)別,包括:
采用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法進(jìn)行語(yǔ)音識(shí)別。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備,所述第一部位為面部和/或眼部。
在本發(fā)明實(shí)施方式的第三方面中,提供了一種智能設(shè)備,包括:
一個(gè)或者多個(gè)處理器;
存儲(chǔ)器;
存儲(chǔ)在所述存儲(chǔ)器中的程序,當(dāng)被所述一個(gè)或者多個(gè)處理器執(zhí)行時(shí),所述程序使所述智能設(shè)備執(zhí)行如第一方面,或者第一方面的任意一實(shí)施方式所述的方法。
在本發(fā)明實(shí)施方式的第四方面中,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有程序,當(dāng)所述程序被處理器執(zhí)行時(shí),使得所述處理器執(zhí)行如第一方面,或者第一方面的任意一實(shí)施方式所述的方法。
在本發(fā)明實(shí)施方式的第五方面中,提供了一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法,包括:
判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中;
判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),向所述第二智能設(shè)備發(fā)送第一信號(hào)。
在一個(gè)實(shí)施方式中,根據(jù)本發(fā)明的上述實(shí)施方式所述的方法,判定出所述第二智能設(shè)備位于所述可視區(qū)域中,包括:
判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域時(shí),判定出所述第二智能設(shè)備位于所述可視區(qū)域中。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法,判定出所述第二智能設(shè)備位于所述可視區(qū)域中,包括:
判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域,及在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向,在判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí),判定出所述第二智能設(shè)備位于所述可視區(qū)域中。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法,所述方法還包括:
所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源發(fā)送第二信號(hào)。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法,所述第一智能設(shè)備為智能眼鏡,和/或所述第二智能設(shè)備為智能音箱。
在本發(fā)明實(shí)施方式的第六方面中,提供了一種第一智能設(shè)備,包括:
判斷單元,用于判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中;
發(fā)送單元,用于在所述判斷單元判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),向所述第二智能設(shè)備發(fā)送第一信號(hào)。
在一個(gè)實(shí)施方式中,根據(jù)本發(fā)明的上述實(shí)施方式所述的智能設(shè)備,所述判斷單元判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),具體為:
判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域時(shí),判定出所述第二智能設(shè)備位于所述可視區(qū)域中。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備,所述判斷單元判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),具體為:
判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域,及在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向,在判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí),判定出所述第二智能設(shè)備位于所述可視區(qū)域中。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備,所述發(fā)送單元還用于,向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)。
在一些實(shí)施方式中,根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備,所述第一智能設(shè)備為智能眼鏡,和/或所述第二智能設(shè)備為智能音箱。
在本發(fā)明實(shí)施方式的第七方面中,提供了一種智能設(shè)備,包括:
一個(gè)或者多個(gè)處理器;
存儲(chǔ)器;
存儲(chǔ)在所述存儲(chǔ)器中的程序,當(dāng)被所述一個(gè)或者多個(gè)處理器執(zhí)行時(shí),所述程序使所述智能設(shè)備執(zhí)行如第五方面,或者第五方面的任意一實(shí)施方式所述的方法。
在本發(fā)明實(shí)施方式的第八方面中,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有程序,當(dāng)所述程序被處理器執(zhí)行時(shí),使得所述處理器執(zhí)行如第五方面,或者第五方面的任意一實(shí)施方式所述的方法。
本發(fā)明實(shí)施例中,提出一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法,包括:確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí),進(jìn)入語(yǔ)音檢測(cè)狀態(tài);在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量時(shí),進(jìn)行語(yǔ)音識(shí)別;該方案基于這樣一個(gè)實(shí)踐觀察規(guī)律:在人與人之間當(dāng)面交流時(shí),a為了讓b知道其是與b在說(shuō)話,a通常會(huì)臉和目光朝向b,此時(shí)b通常會(huì)自然知曉,a是在同b交流,特別的,目光接觸時(shí),b更能確定a是在和他說(shuō)話(而不是其他對(duì)象),該方案并不是依賴于喚醒詞來(lái)喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的,也就是說(shuō),在用戶還沒(méi)有發(fā)出喚醒詞的情況下就將第二智能設(shè)備喚醒了,因此,提高了喚醒操作的便捷性、減少了喚醒時(shí)間,提高了喚醒的效率,并且,該方案也不是在檢測(cè)到用戶圖像的時(shí)候就喚醒第二智能設(shè)備,而是在持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí),才喚醒第二智能設(shè)備進(jìn)行語(yǔ)音檢測(cè),避免了持有第一智能設(shè)備的用戶的第一部位沒(méi)有朝向第二智能設(shè)備時(shí)也喚醒第二智能終端,進(jìn)而避免了持續(xù)喚醒第二智能設(shè)備,因此,降低了第二智能設(shè)備的功耗,提高了用戶體驗(yàn)。
附圖說(shuō)明
通過(guò)參考附圖閱讀下文的詳細(xì)描述,本發(fā)明示例性實(shí)施方式的上述以及其他目的、特征和優(yōu)點(diǎn)將變得易于理解。在附圖中,以示例性而非限制性的方式示出了本發(fā)明的若干實(shí)施方式,其中:
圖1示意性地示出了根據(jù)本發(fā)明實(shí)施方式的持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備的場(chǎng)景示意圖;
圖2示意性地示出了根據(jù)本發(fā)明實(shí)施方式的喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法的一種流程圖;
圖3示意性地示出了根據(jù)本發(fā)明實(shí)施方式的喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法的另一種流程圖;
圖4示意性地示出了根據(jù)本發(fā)明實(shí)施方式的第二智能設(shè)備的一種示意圖;
圖5示意性地示出了根據(jù)本發(fā)明實(shí)施方式的第一智能設(shè)備的另一種示意圖;
圖6示意性地示出了根據(jù)本發(fā)明實(shí)施方式的智能設(shè)備的另一種示意圖;
圖7示意性地示出了根據(jù)本發(fā)明實(shí)施方式的智能設(shè)備的另一種示意圖;
在附圖中,相同或?qū)?yīng)的標(biāo)號(hào)表示相同或?qū)?yīng)的部分。
具體實(shí)施方式
下面將參考若干示例性實(shí)施方式來(lái)描述本發(fā)明的原理和精神。應(yīng)當(dāng)理解,給出這些實(shí)施方式僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實(shí)現(xiàn)本發(fā)明,而并非以任何方式限制本發(fā)明的范圍。相反,提供這些實(shí)施方式是為了使本公開(kāi)更加透徹和完整,并且能夠?qū)⒈竟_(kāi)的范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。
本領(lǐng)域技術(shù)人員知道,本發(fā)明的實(shí)施方式可以實(shí)現(xiàn)為一種系統(tǒng)、裝置、設(shè)備、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本公開(kāi)可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件、完全的軟件(包括固件、駐留軟件、微代碼等),或者硬件和軟件結(jié)合的形式。
根據(jù)本發(fā)明的實(shí)施方式,提出了一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法、智能設(shè)備及介質(zhì)。
在本文中,附圖中的任何元素?cái)?shù)量均用于示例而非限制,以及任何命名都僅用于區(qū)分,而不具有任何限制含義。
下面參考本發(fā)明的若干代表性實(shí)施方式,詳細(xì)闡釋本發(fā)明的原理和精神。
發(fā)明概述
本發(fā)明人發(fā)現(xiàn),人與人在當(dāng)面交流時(shí),用戶a為了讓用戶b知道用戶a要與用戶b說(shuō)話,用戶a通常會(huì)將臉和目光朝向用戶b,此時(shí),即使用戶a沒(méi)有說(shuō)話,用戶b也會(huì)知道用戶a接下來(lái)要與他打招呼交流,更進(jìn)一步的,當(dāng)用戶a和用戶b的目光接觸時(shí),用戶b更能確定用戶a是要與用戶b說(shuō)話,而不是與其他人說(shuō)話。發(fā)明人提出了鑒于上述“人與人交互方法”的人機(jī)交互的方法;例如,用戶a戴有智能眼鏡,當(dāng)用戶a面向智能音箱時(shí),智能音箱就進(jìn)入語(yǔ)音檢測(cè)狀態(tài),智能音箱在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量時(shí),進(jìn)行語(yǔ)音識(shí)別,這樣,還沒(méi)等到用戶a說(shuō)話,智能音箱就知道用戶a要與智能音箱進(jìn)行交互,喚醒了智能音箱,因此,提高了喚醒效率,同時(shí),即使智能音箱檢測(cè)到了存在用戶a但是如果用戶a沒(méi)有朝向智能音箱時(shí),智能音箱也不會(huì)喚醒,因此,避免了持續(xù)喚醒智能音箱,降低了智能音箱的功耗,提高了用戶體驗(yàn)。
在介紹了本發(fā)明的基本原理之后,下面具體介紹本發(fā)明的各種非限制性實(shí)施方式。
應(yīng)用場(chǎng)景總覽
參考圖1所示,戴有智能眼鏡的用戶a預(yù)跟智能音箱進(jìn)行交互,用戶a的眼睛朝向智能音箱時(shí),智能音箱就喚醒了,進(jìn)入語(yǔ)音檢測(cè)狀態(tài),接下來(lái),用戶a說(shuō)了一句“請(qǐng)播放張國(guó)榮的《沉默是金》”,智能音箱檢測(cè)到這句話時(shí),進(jìn)行語(yǔ)音識(shí)別。這樣,智能音箱在用戶a說(shuō)話之前就喚醒了,因此,提高了喚醒效率,同時(shí),由于在用戶a的眼睛朝向智能音箱時(shí)才喚醒智能音箱,避免了智能音箱在檢測(cè)到用戶a的圖像時(shí)就喚醒導(dǎo)致的持續(xù)喚醒的缺陷,因此,降低了智能音箱的功耗,提高了用戶體驗(yàn)。
示例性方法
下面結(jié)合圖1的應(yīng)用場(chǎng)景,參考圖2來(lái)描述根據(jù)本發(fā)明示例性實(shí)施方式的用于喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法。需要注意的是,上述應(yīng)用場(chǎng)景僅是為了便于理解本發(fā)明的精神和原理而示出,本發(fā)明的實(shí)施方式在此方面不受任何限制。相反,本發(fā)明的實(shí)施方式可以應(yīng)用于適用的任何場(chǎng)景。
參閱圖2所示,本發(fā)明實(shí)施例中,提出一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法20,包括:
步驟200:確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí),進(jìn)入語(yǔ)音檢測(cè)狀態(tài);
步驟210:在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量時(shí),進(jìn)行語(yǔ)音識(shí)別。
本發(fā)明實(shí)施例中,確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí),包括下列方式中的至少一種:
接收到所述第一智能設(shè)備發(fā)送的第一信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備,所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的,例如,智能音箱接收到用戶a戴的智能眼鏡發(fā)送的第一信號(hào)時(shí),確定用戶a的第一部位朝向智能音箱,其中,第一信號(hào)是智能眼鏡在識(shí)別出智能音箱出現(xiàn)在智能眼鏡的圖像采集區(qū)域中的第一區(qū)域時(shí)發(fā)送的;
在所述第二智能設(shè)備處接收到所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備,例如,智能音箱接收到用戶a戴的智能眼鏡中的紅外發(fā)射源發(fā)射的紅外信號(hào)時(shí),確定用戶a的第一部位朝向智能音箱;或
前面兩種描述的是第二智能設(shè)備依賴第一智能設(shè)備發(fā)送的信號(hào)來(lái)確定持有所述第一智能設(shè)備的用戶的第一部位是否朝向所述第二智能設(shè)備,當(dāng)然,也可以不依賴于第一智能設(shè)備發(fā)射的信號(hào)來(lái)確定,例如,采用如下方式:
在所述第二智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向,判定所述眼球朝向?yàn)樗龅诙悄茉O(shè)備所處的方向時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備,例如,智能音箱判定用戶a的眼球朝向智能音箱時(shí),確定用戶a的第一部位朝向智能音箱。
或者,確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí),也可以采用如下方式:
接收到所述第一智能設(shè)備發(fā)送的第一信號(hào),所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的,并且在所述第二智能設(shè)備處接收到所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備,也就是說(shuō),第二智能設(shè)備要同時(shí)接收到第一信號(hào)和第二信號(hào)時(shí),才能確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備,例如,智能音箱接收到用戶a戴的智能眼鏡發(fā)送的第一信號(hào),并且還要接收到智能眼鏡發(fā)送的紅外信號(hào)時(shí),確定用戶a的第一部位朝向智能音箱,其中,第一信號(hào)是智能眼鏡在識(shí)別出智能音箱出現(xiàn)在智能眼鏡的圖像采集區(qū)域中的第一區(qū)域時(shí)發(fā)送的;或者
接收到所述第一智能設(shè)備發(fā)送的觸發(fā)信號(hào),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備,所述觸發(fā)信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域,并且在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向、判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí)發(fā)送的,也就是說(shuō),第二智能設(shè)備要接收到觸發(fā)信號(hào)時(shí),就能確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備,例如,智能音箱接收到用戶a戴的智能眼鏡發(fā)送觸發(fā)信號(hào),第二智能設(shè)備就可以確定用戶a的第一部位朝向智能音箱,其中,觸發(fā)信號(hào)是智能眼鏡在識(shí)別出智能音箱出現(xiàn)在智能眼鏡的圖像采集區(qū)域中的第一區(qū)域,且判定出用戶a的眼球朝向智能眼鏡的第一方向時(shí)發(fā)送的。
前面所描述的第二信號(hào)可以是紅外信號(hào),也可以是藍(lán)牙信號(hào),紅外信號(hào)和藍(lán)牙信號(hào)是第二信號(hào)的幾種示例,本發(fā)明實(shí)施例中并不限定于此。
本發(fā)明實(shí)施例中,可選地,所述第一智能設(shè)備為智能眼鏡,和/或所述第二智能設(shè)備為智能音箱。
當(dāng)然,第一智能設(shè)備和第二智能并不限定于上述示例,還可以是其他形式,例如,第一智能設(shè)備還可以為帽子、褲帶、衣服等可穿戴設(shè)備,第二使能設(shè)備還可以為家居設(shè)備、移動(dòng)設(shè)備等。
在有些情況下,用戶可能由于誤操作將第一部位朝向第二智能設(shè)備,在這種情況下,用戶不會(huì)向第二智能設(shè)備發(fā)送語(yǔ)音消息,但是,第二智能設(shè)備如果一直處于語(yǔ)音檢測(cè)狀態(tài)的話,第二智能終端會(huì)產(chǎn)生不必要的功耗,因此,為了降低第二智能終端的功耗,在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)語(yǔ)音,如果沒(méi)有檢測(cè)到語(yǔ)音能量的話,進(jìn)入休眠狀態(tài),因此,本發(fā)明實(shí)施例中,在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量,可選地,可以采用如下方式:
在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)到語(yǔ)音能量。
例如,用戶a由于誤操作,在x1時(shí)刻眼睛朝向智能音箱,智能音箱檢測(cè)到用戶a的眼睛朝向智能音箱時(shí),進(jìn)入語(yǔ)音檢測(cè)狀態(tài),如果在從x1時(shí)刻開(kāi)始的預(yù)設(shè)時(shí)長(zhǎng)內(nèi)都沒(méi)有檢測(cè)到語(yǔ)音能量時(shí),智能音箱進(jìn)入休眠狀態(tài),如果在從x1時(shí)刻開(kāi)始的預(yù)設(shè)時(shí)長(zhǎng)內(nèi)檢測(cè)到語(yǔ)音能量時(shí),進(jìn)行語(yǔ)音識(shí)別,這樣可以避免智能音箱的功耗。
本發(fā)明實(shí)施例中,進(jìn)行語(yǔ)音識(shí)別時(shí),可選地,可以采用如下方法:
采用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法進(jìn)行語(yǔ)音識(shí)別。例如,基于cnn(convolutionalneuralnetworks,卷積神經(jīng)網(wǎng)絡(luò))方法。
本發(fā)明實(shí)施例中,所述第一部位為面部和/或眼部。
參閱圖3所示,本發(fā)明實(shí)施例中,還提出一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法30,包括:
步驟300:判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中;
步驟310:判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),向所述第二智能設(shè)備發(fā)送第一信號(hào)。
本發(fā)明實(shí)施例中,判定出所述第二智能設(shè)備位于所述可視區(qū)域中,包括:
判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域時(shí),判定出所述第二智能設(shè)備位于所述可視區(qū)域中。在這種情況下,方法30中所描述的第一信號(hào)與方法20中所描述的第一信號(hào)相同。
例如,判定出智能音箱位于智能眼鏡的圖像采集區(qū)域中的前方區(qū)域時(shí),判定出智能音箱位于可視區(qū)域中。
本發(fā)明實(shí)施例中,判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),可選地,可以采用如下方式:
判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域,及在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向,在判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí),判定出所述第二智能設(shè)備位于所述可視區(qū)域中。在這種情況下,方法30中所描述的第一信號(hào)包括方法20中所描述的第一信號(hào)和觸發(fā)信號(hào)。
例如,判定出智能音箱位于智能眼鏡的圖像采集區(qū)域中的前方區(qū)域,及進(jìn)一步要在判定出用戶的眼球朝向智能眼鏡的第一方向時(shí),才能判定出智能音箱位于可視區(qū)域中。
本發(fā)明實(shí)施例中,進(jìn)一步的,所述方法還包括:
所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源發(fā)送第二信號(hào)。其中,可選地,第二信號(hào)可以是紅外信號(hào),或者,也可以是藍(lán)牙信號(hào),當(dāng)然,紅外信號(hào)和藍(lán)牙信號(hào)是幾種示例,并不限定于此。
本發(fā)明實(shí)施例中,可選地,所述第一智能設(shè)備為智能眼鏡,和/或所述第二智能設(shè)備為智能音箱。
當(dāng)然,第一智能設(shè)備和第二智能并不限定于上述示例,還可以是其他形式,例如,第一智能設(shè)備還可以為帽子、褲帶、衣服等可穿戴設(shè)備;第二使能設(shè)備還可以為家居設(shè)備、移動(dòng)設(shè)備等。
本發(fā)明實(shí)施例是基于人與人之間的“目光接觸”的方法提出的,無(wú)需喚醒詞就可以實(shí)現(xiàn)喚醒,縮短了從發(fā)出命令到智能設(shè)備執(zhí)行的時(shí)間,也就是說(shuō),在用戶還沒(méi)有發(fā)出喚醒詞的情況下就將第二智能設(shè)備喚醒了,因此,減少了喚醒時(shí)間,提高了喚醒的效率,并且,該方案也不是在檢測(cè)到用戶圖像的時(shí)候就喚醒第二智能設(shè)備,而是在持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí),才喚醒第二智能設(shè)備進(jìn)行語(yǔ)音檢測(cè),避免了持有第一智能設(shè)備的用戶的第一部位沒(méi)有朝向第二智能設(shè)備時(shí)也喚醒第二智能終端,進(jìn)而避免了持續(xù)喚醒第二智能設(shè)備,因此,降低了第二智能設(shè)備的功耗,提高了用戶體驗(yàn)。
示例性裝置
在介紹了本發(fā)明示例性實(shí)施方式的介質(zhì)之后,接下來(lái),參考圖4對(duì)本發(fā)明示例性實(shí)施方式的第二智能設(shè)備40進(jìn)行描述,第二智能設(shè)備40包括:
第一確定單元400,用于確定持有第一智能設(shè)備的用戶的第一部位是否朝向第二智能設(shè)備;
檢測(cè)單元410,用于在所述第一確定單元400確定持有第一智能設(shè)備的用戶的所述第一部位朝向第二智能設(shè)備時(shí),進(jìn)入語(yǔ)音檢測(cè)狀態(tài),進(jìn)行語(yǔ)音檢測(cè);
語(yǔ)音識(shí)別單元420,用于在所述檢測(cè)單元410在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量時(shí),進(jìn)行語(yǔ)音識(shí)別。
本發(fā)明實(shí)施例中,可選地,所述第一確定單元400包括接收單元400a和第二確定單元400b,或者包括判斷單元400c和第二確定單元400b,其中:
所述接收單元400a,用于接收所述第一智能設(shè)備發(fā)送的第一信號(hào),所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的;所述第二確定單元400b,用于在所述接收單元400a接收到所述第一信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備;或者,
所述接收單元400a,用于在所述第二智能設(shè)備處接收所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào);所述第二確定單元400b,用于在所述接收單元400a接收到所述第二信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備;或者,
所述判斷單元400c,用于在所述第二智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向;所述第二確定單元400b,用于在所述判斷單元400c判定所述眼球朝向?yàn)樗龅诙悄茉O(shè)備所處的方向時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。
本發(fā)明實(shí)施例中,可選地,所述第一確定單元400包括接收單元400a和第二確定單元400b,其中:所述接收單元400a,用于接收所述第一智能設(shè)備發(fā)送的第一信號(hào)及在所述第二智能設(shè)備處接收所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào),或者,接收所述第一智能設(shè)備發(fā)送的觸發(fā)信號(hào),所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的,所述觸發(fā)信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域,并且在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向、判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí)發(fā)送的;
所述第二確定單元400b,用于在所述接收單元400a接收到所述第一信號(hào)及所述第二信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備,或者用于在所述接收單元400a接收到所述觸發(fā)信號(hào)時(shí),確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。
本發(fā)明實(shí)施例中,可選地,所述第一智能設(shè)備為智能眼鏡,和/或所述第二智能設(shè)備為智能音箱。
本發(fā)明實(shí)施例中,可選地,所述檢測(cè)單元410在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量,包括:
在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)到語(yǔ)音能量。
本發(fā)明實(shí)施例中,可選地,所述語(yǔ)音識(shí)別單元420進(jìn)行語(yǔ)音識(shí)別,包括:
采用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法進(jìn)行語(yǔ)音識(shí)別。
本發(fā)明實(shí)施例中,可選地,所述第一部位為面部和/或眼部。
參閱圖5所示,本發(fā)明實(shí)施例中,提出一種第一智能設(shè)備50,包括:
判斷單元500,用于判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中;
發(fā)送單元510,用于在所述判斷單元500判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),向所述第二智能設(shè)備發(fā)送第一信號(hào)。
本發(fā)明實(shí)施例張,可選地,所述判斷單元500判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),具體為:
判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域時(shí),判定出所述第二智能設(shè)備位于所述可視區(qū)域中。
本發(fā)明實(shí)施例中,可選地,所述判斷單元500判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),具體為:
判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域,及在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向,在判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí),判定出所述第二智能設(shè)備位于所述可視區(qū)域中。
本發(fā)明實(shí)施例中,進(jìn)一步的,所述發(fā)送單元510還用于,向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)。
本發(fā)明實(shí)施例中,可選地,所述第一智能設(shè)備為智能眼鏡,和/或所述第二智能設(shè)備為智能音箱。
示例性設(shè)備
在介紹了本發(fā)明示例性實(shí)施方式的方法和裝置之后,接下來(lái),介紹根據(jù)本發(fā)明的另一示例性實(shí)施方式的智能設(shè)備。
所屬技術(shù)領(lǐng)域的技術(shù)人員能夠理解,本發(fā)明的各個(gè)方面可以實(shí)現(xiàn)為系統(tǒng)、方法或程序產(chǎn)品。因此,本發(fā)明的各個(gè)方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、微代碼等),或硬件和軟件方面結(jié)合的實(shí)施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。
在一些可能的實(shí)施方式中,根據(jù)本發(fā)明的智能設(shè)備可以至少包括至少一個(gè)處理單元、以及至少一個(gè)存儲(chǔ)單元。其中,所述存儲(chǔ)單元存儲(chǔ)有程序代碼,當(dāng)所述程序代碼被所述處理單元執(zhí)行時(shí),使得所述處理單元執(zhí)行本說(shuō)明書上述“示例性方法”部分中描述的根據(jù)本發(fā)明各種示例性實(shí)施方式的用于喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法中的步驟。例如,所述處理單元可以執(zhí)行如圖2中所示的步驟200:確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí),進(jìn)入語(yǔ)音檢測(cè)狀態(tài);步驟210:在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量時(shí),進(jìn)行語(yǔ)音識(shí)別。
又例如,所述處理單元可以執(zhí)行如圖3中所示的步驟300:判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中;步驟310:判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),向所述第二智能設(shè)備發(fā)送第一信號(hào)。
下面參照?qǐng)D6來(lái)描述根據(jù)本發(fā)明的這種實(shí)施方式的智能設(shè)備60。圖6顯示的智能設(shè)備60僅僅是一個(gè)示例,不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來(lái)任何限制。
如圖6所示,智能設(shè)備60以通用計(jì)算設(shè)備的形式表現(xiàn)。智能設(shè)備60的組件可以包括但不限于:上述至少一個(gè)處理單元16、上述至少一個(gè)存儲(chǔ)單元28、連接不同系統(tǒng)組件(包括存儲(chǔ)單元28和處理單元16)的總線18。
總線18表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)器總線或者存儲(chǔ)器控制器、外圍總線、圖形加速端口、處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。
存儲(chǔ)單元28可以包括易失性存儲(chǔ)器形式的可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)器(ram)31和/或高速緩存存儲(chǔ)器32,還可以進(jìn)一步只讀存儲(chǔ)器(rom)34。
存儲(chǔ)單元28還可以包括具有一組(至少一個(gè))程序模塊42的程序/實(shí)用工具41,這樣的程序模塊42包括但不限于:操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。
智能設(shè)備60也可以與一個(gè)或多個(gè)外部設(shè)備14(例如鍵盤、指向設(shè)備、藍(lán)牙設(shè)備等)通信,還可與一個(gè)或者多個(gè)使得用戶能與該智能設(shè)備60交互的設(shè)備通信,和/或與使得該智能設(shè)備60能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如路由器、調(diào)制解調(diào)器等等)通信。這種通信可以通過(guò)輸入/輸出(i/o)接口22進(jìn)行。并且,智能設(shè)備60還可以通過(guò)網(wǎng)絡(luò)適配器21與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器21通過(guò)總線18與智能設(shè)備60的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合智能設(shè)備60使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。
示例性程序產(chǎn)品
在一些可能的實(shí)施方式中,本發(fā)明的各個(gè)方面還可以實(shí)現(xiàn)為一種程序產(chǎn)品的形式,其包括程序代碼,當(dāng)所述程序產(chǎn)品在設(shè)備上運(yùn)行時(shí),所述程序代碼用于使所述設(shè)備執(zhí)行本說(shuō)明書上述“示例性方法”部分中描述的根據(jù)本發(fā)明各種示例性實(shí)施方式的用于喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法中的步驟,例如,所述設(shè)備可以執(zhí)行如圖2中所示的步驟200:確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí),進(jìn)入語(yǔ)音檢測(cè)狀態(tài);步驟210:在語(yǔ)音檢測(cè)狀態(tài)下,檢測(cè)到語(yǔ)音能量時(shí),進(jìn)行語(yǔ)音識(shí)別。
例如,所述設(shè)備可以執(zhí)行如圖3中所示的步驟300:判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中;步驟310:判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí),向所述第二智能設(shè)備發(fā)送第一信號(hào)。
所述程序產(chǎn)品可以采用一個(gè)或多個(gè)可讀介質(zhì)的任意組合。可讀介質(zhì)可以是可讀信號(hào)介質(zhì)或者可讀存儲(chǔ)介質(zhì)??勺x存儲(chǔ)介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式盤、硬盤、隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。
如圖7所示,描述了根據(jù)本發(fā)明的實(shí)施方式的用于喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的程序產(chǎn)品70,其可以采用便攜式緊湊盤只讀存儲(chǔ)器(cd-rom)并包括程序代碼,并可以在終端設(shè)備,例如個(gè)人電腦上運(yùn)行。然而,本發(fā)明的程序產(chǎn)品不限于此,在本文件中,可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
可讀信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了可讀程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括——但不限于——電磁信號(hào)、光信號(hào)或上述的任意合適的組合??勺x信號(hào)介質(zhì)還可以是可讀存儲(chǔ)介質(zhì)以外的任何可讀介質(zhì),該可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括——但不限于——無(wú)線、有線、光纜、rf等等,或者上述的任意合適的組合。
可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任意組合來(lái)編寫用于執(zhí)行本發(fā)明操作的程序代碼,所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言—諸如java、c++等,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言—諸如“c”語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶計(jì)算設(shè)備上執(zhí)行、部分地在用戶設(shè)備上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算設(shè)備上部分在遠(yuǎn)程計(jì)算設(shè)備上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算設(shè)備或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算設(shè)備的情形中,遠(yuǎn)程計(jì)算設(shè)備可以通過(guò)任意種類的網(wǎng)絡(luò)——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶計(jì)算設(shè)備,或者,可以連接到外部計(jì)算設(shè)備(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。
應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了智能設(shè)備的若干裝置或子裝置,但是這種劃分僅僅并非強(qiáng)制性的。實(shí)際上,根據(jù)本發(fā)明的實(shí)施方式,上文描述的兩個(gè)或更多裝置的特征和功能可以在一個(gè)裝置中具體化。反之,上文描述的一個(gè)裝置的特征和功能可以進(jìn)一步劃分為由多個(gè)裝置來(lái)具體化。
此外,盡管在附圖中以特定順序描述了本發(fā)明方法的操作,但是,這并非要求或者暗示必須按照該特定順序來(lái)執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實(shí)現(xiàn)期望的結(jié)果。附加地或備選地,可以省略某些步驟,將多個(gè)步驟合并為一個(gè)步驟執(zhí)行,和/或?qū)⒁粋€(gè)步驟分解為多個(gè)步驟執(zhí)行。
雖然已經(jīng)參考若干具體實(shí)施方式描述了本發(fā)明的精神和原理,但是應(yīng)該理解,本發(fā)明并不限于所公開(kāi)的具體實(shí)施方式,對(duì)各方面的劃分也不意味著這些方面中的特征不能組合以進(jìn)行受益,這種劃分僅是為了表述的方便。本發(fā)明旨在涵蓋所附權(quán)利要求的精神和范圍內(nèi)所包括的各種修改和等同布置。