一種喚醒智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法、智能設(shè)備和介質(zhì)與流程

文檔序號(hào)：11434063閱讀：347來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種喚醒智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法、智能設(shè)備和介質(zhì)與流程

本發(fā)明的實(shí)施方式涉及智能設(shè)備領(lǐng)域，更具體地，本發(fā)明的實(shí)施方式涉及一種喚醒智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法、智能設(shè)備和介質(zhì)。

背景技術(shù)：

本部分旨在為權(quán)利要求書中陳述的本發(fā)明的實(shí)施方式提供背景或上下文。此處的描述不因?yàn)榘ㄔ诒静糠种芯统姓J(rèn)是現(xiàn)有技術(shù)。

隨著智能設(shè)備技術(shù)的不斷進(jìn)步以及對(duì)生活品質(zhì)的不斷追求，作為物聯(lián)網(wǎng)應(yīng)用之一的智能設(shè)備的應(yīng)用前景越來(lái)越廣闊。隨著需求的不斷提升，在很多情況下，用戶需要跟智能設(shè)備進(jìn)行人機(jī)交互。

中國(guó)專利cn105912092a于2016年4月6日公開(kāi)了一種人機(jī)交互中的語(yǔ)音喚醒方法和語(yǔ)音識(shí)別裝置，該專利中的語(yǔ)音喚醒方法包括：s1靜音檢測(cè)步驟，包括：在機(jī)器檢測(cè)到聲音能量時(shí)，進(jìn)行喚醒詞檢出，如果聲音能量包括喚醒詞，則喚醒機(jī)器開(kāi)始語(yǔ)音識(shí)別，否則，啟動(dòng)s2圖像檢測(cè)步驟；s2圖像檢測(cè)步驟，包括：在圖像檢測(cè)中，如果檢測(cè)到人，則喚醒機(jī)器開(kāi)始語(yǔ)音識(shí)別，否則繼續(xù)檢測(cè)聲音能量。通過(guò)本發(fā)明的方法和語(yǔ)音識(shí)別裝置，能夠結(jié)合圖像檢測(cè)，實(shí)現(xiàn)人機(jī)交互，同時(shí)保持待機(jī)狀態(tài)下的低電力消耗，但是該方案是依賴喚醒詞來(lái)喚醒機(jī)器，需要先說(shuō)出喚醒詞才能喚醒機(jī)器，因此，喚醒操作不便捷，人機(jī)交互效率較低。

中國(guó)專利cn104065718a公開(kāi)了通過(guò)攝像頭判斷是否有人存在，來(lái)決定是否開(kāi)始進(jìn)行語(yǔ)音識(shí)別的方法。但是，在攝像頭前有人走動(dòng)但沒(méi)有交互意圖的場(chǎng)景下，會(huì)導(dǎo)致智能設(shè)備持續(xù)誤喚醒和識(shí)別，導(dǎo)致智能設(shè)備的功耗較大，用戶體驗(yàn)較差。

本發(fā)明主要解決如何減少喚醒時(shí)間，及降低功耗和提高用戶體驗(yàn)的問(wèn)題。

技術(shù)實(shí)現(xiàn)要素：

現(xiàn)有技術(shù)中的喚醒設(shè)備的方法存在喚醒操作不便捷、智能設(shè)備功耗較大及用戶體驗(yàn)較差的缺陷，這些是非常令人煩惱的過(guò)程。

為此，非常需要一種改進(jìn)的喚醒智能終端進(jìn)行語(yǔ)音識(shí)別的方法，以解決上述問(wèn)題。

在本發(fā)明實(shí)施方式的第一方面中，提供了一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法，包括：

確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí)，進(jìn)入語(yǔ)音檢測(cè)狀態(tài)；

在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量時(shí)，進(jìn)行語(yǔ)音識(shí)別。

在一個(gè)實(shí)施方式中，根據(jù)本發(fā)明的上述實(shí)施方式所述的方法，確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備，包括下列方式中的至少一種：

在所述第二智能設(shè)備處接收到所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備；或

在所述第二智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向，判定所述眼球朝向?yàn)樗龅诙悄茉O(shè)備所處的方向時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法，確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備，包括：

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法，所述第一智能設(shè)備為智能眼鏡，和/或所述第二智能設(shè)備為智能音箱。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法，在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量，包括：

在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)到語(yǔ)音能量。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法，進(jìn)行語(yǔ)音識(shí)別，包括：

采用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法進(jìn)行語(yǔ)音識(shí)別。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法，所述第一部位為面部和/或眼部。

在本發(fā)明實(shí)施方式的第二方面中，提供了一種第二智能設(shè)備，包括：

第一確定單元，用于確定持有第一智能設(shè)備的用戶的第一部位是否朝向第二智能設(shè)備；

檢測(cè)單元，用于在所述第一確定單元確定持有第一智能設(shè)備的用戶的所述第一部位朝向第二智能設(shè)備時(shí)，進(jìn)入語(yǔ)音檢測(cè)狀態(tài)，進(jìn)行語(yǔ)音檢測(cè)；

語(yǔ)音識(shí)別單元，用于在所述檢測(cè)單元在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量時(shí)，進(jìn)行語(yǔ)音識(shí)別。

在一個(gè)實(shí)施方式中，根據(jù)本發(fā)明的上述實(shí)施方式所述的智能設(shè)備，所述第一確定單元包括接收單元和第二確定單元，或者包括判斷單元和第二確定單元，其中：

所述接收單元，用于接收所述第一智能設(shè)備發(fā)送的第一信號(hào)，所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的；所述第二確定單元，用于在所述接收單元接收到所述第一信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備；或者，

所述接收單元，用于在所述第二智能設(shè)備處接收所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào)；所述第二確定單元，用于在所述接收單元接收到所述第二信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備；或者，

所述判斷單元，用于在所述第二智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向；所述第二確定單元，用于在所述判斷單元判定所述眼球朝向?yàn)樗龅诙悄茉O(shè)備所處的方向時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備，所述第一確定單元包括接收單元和第二確定單元，其中：所述接收單元，用于接收所述第一智能設(shè)備發(fā)送的第一信號(hào)及在所述第二智能設(shè)備處接收所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào)，或者，接收所述第一智能設(shè)備發(fā)送的觸發(fā)信號(hào)，所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的，所述觸發(fā)信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域，并且在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向、判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí)發(fā)送的；

所述第二確定單元，用于在所述接收單元接收到所述第一信號(hào)及所述第二信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備，或者用于在所述接收單元接收到所述觸發(fā)信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備，所述第一智能設(shè)備為智能眼鏡，和/或所述第二智能設(shè)備為智能音箱。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備，所述檢測(cè)單元在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量，包括：

在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)到語(yǔ)音能量。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備，所述語(yǔ)音識(shí)別單元進(jìn)行語(yǔ)音識(shí)別，包括：

采用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法進(jìn)行語(yǔ)音識(shí)別。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備，所述第一部位為面部和/或眼部。

在本發(fā)明實(shí)施方式的第三方面中，提供了一種智能設(shè)備，包括：

一個(gè)或者多個(gè)處理器；

存儲(chǔ)器；

存儲(chǔ)在所述存儲(chǔ)器中的程序，當(dāng)被所述一個(gè)或者多個(gè)處理器執(zhí)行時(shí)，所述程序使所述智能設(shè)備執(zhí)行如第一方面，或者第一方面的任意一實(shí)施方式所述的方法。

在本發(fā)明實(shí)施方式的第四方面中，提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有程序，當(dāng)所述程序被處理器執(zhí)行時(shí)，使得所述處理器執(zhí)行如第一方面，或者第一方面的任意一實(shí)施方式所述的方法。

在本發(fā)明實(shí)施方式的第五方面中，提供了一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法，包括：

判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中；

判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，向所述第二智能設(shè)備發(fā)送第一信號(hào)。

在一個(gè)實(shí)施方式中，根據(jù)本發(fā)明的上述實(shí)施方式所述的方法，判定出所述第二智能設(shè)備位于所述可視區(qū)域中，包括：

判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域時(shí)，判定出所述第二智能設(shè)備位于所述可視區(qū)域中。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法，判定出所述第二智能設(shè)備位于所述可視區(qū)域中，包括：

判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域，及在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向，在判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí)，判定出所述第二智能設(shè)備位于所述可視區(qū)域中。

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的方法，所述方法還包括：

所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源發(fā)送第二信號(hào)。

在本發(fā)明實(shí)施方式的第六方面中，提供了一種第一智能設(shè)備，包括：

判斷單元，用于判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中；

發(fā)送單元，用于在所述判斷單元判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，向所述第二智能設(shè)備發(fā)送第一信號(hào)。

在一個(gè)實(shí)施方式中，根據(jù)本發(fā)明的上述實(shí)施方式所述的智能設(shè)備，所述判斷單元判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，具體為：

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備，所述判斷單元判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，具體為：

在一些實(shí)施方式中，根據(jù)本發(fā)明的上述任一實(shí)施方式所述的智能設(shè)備，所述發(fā)送單元還用于，向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)。

在本發(fā)明實(shí)施方式的第七方面中，提供了一種智能設(shè)備，包括：

一個(gè)或者多個(gè)處理器；

存儲(chǔ)器；

存儲(chǔ)在所述存儲(chǔ)器中的程序，當(dāng)被所述一個(gè)或者多個(gè)處理器執(zhí)行時(shí)，所述程序使所述智能設(shè)備執(zhí)行如第五方面，或者第五方面的任意一實(shí)施方式所述的方法。

在本發(fā)明實(shí)施方式的第八方面中，提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有程序，當(dāng)所述程序被處理器執(zhí)行時(shí)，使得所述處理器執(zhí)行如第五方面，或者第五方面的任意一實(shí)施方式所述的方法。

本發(fā)明實(shí)施例中，提出一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法，包括：確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí)，進(jìn)入語(yǔ)音檢測(cè)狀態(tài)；在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量時(shí)，進(jìn)行語(yǔ)音識(shí)別；該方案基于這樣一個(gè)實(shí)踐觀察規(guī)律：在人與人之間當(dāng)面交流時(shí)，a為了讓b知道其是與b在說(shuō)話，a通常會(huì)臉和目光朝向b，此時(shí)b通常會(huì)自然知曉，a是在同b交流，特別的，目光接觸時(shí)，b更能確定a是在和他說(shuō)話(而不是其他對(duì)象)，該方案并不是依賴于喚醒詞來(lái)喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的，也就是說(shuō)，在用戶還沒(méi)有發(fā)出喚醒詞的情況下就將第二智能設(shè)備喚醒了，因此，提高了喚醒操作的便捷性、減少了喚醒時(shí)間，提高了喚醒的效率，并且，該方案也不是在檢測(cè)到用戶圖像的時(shí)候就喚醒第二智能設(shè)備，而是在持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí)，才喚醒第二智能設(shè)備進(jìn)行語(yǔ)音檢測(cè)，避免了持有第一智能設(shè)備的用戶的第一部位沒(méi)有朝向第二智能設(shè)備時(shí)也喚醒第二智能終端，進(jìn)而避免了持續(xù)喚醒第二智能設(shè)備，因此，降低了第二智能設(shè)備的功耗，提高了用戶體驗(yàn)。

附圖說(shuō)明

通過(guò)參考附圖閱讀下文的詳細(xì)描述，本發(fā)明示例性實(shí)施方式的上述以及其他目的、特征和優(yōu)點(diǎn)將變得易于理解。在附圖中，以示例性而非限制性的方式示出了本發(fā)明的若干實(shí)施方式，其中：

圖1示意性地示出了根據(jù)本發(fā)明實(shí)施方式的持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備的場(chǎng)景示意圖；

圖2示意性地示出了根據(jù)本發(fā)明實(shí)施方式的喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法的一種流程圖；

圖3示意性地示出了根據(jù)本發(fā)明實(shí)施方式的喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法的另一種流程圖；

圖4示意性地示出了根據(jù)本發(fā)明實(shí)施方式的第二智能設(shè)備的一種示意圖；

圖5示意性地示出了根據(jù)本發(fā)明實(shí)施方式的第一智能設(shè)備的另一種示意圖；

圖6示意性地示出了根據(jù)本發(fā)明實(shí)施方式的智能設(shè)備的另一種示意圖；

圖7示意性地示出了根據(jù)本發(fā)明實(shí)施方式的智能設(shè)備的另一種示意圖；

在附圖中，相同或?qū)?yīng)的標(biāo)號(hào)表示相同或?qū)?yīng)的部分。

具體實(shí)施方式

下面將參考若干示例性實(shí)施方式來(lái)描述本發(fā)明的原理和精神。應(yīng)當(dāng)理解，給出這些實(shí)施方式僅僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實(shí)現(xiàn)本發(fā)明，而并非以任何方式限制本發(fā)明的范圍。相反，提供這些實(shí)施方式是為了使本公開(kāi)更加透徹和完整，并且能夠?qū)⒈竟_(kāi)的范圍完整地傳達(dá)給本領(lǐng)域的技術(shù)人員。

本領(lǐng)域技術(shù)人員知道，本發(fā)明的實(shí)施方式可以實(shí)現(xiàn)為一種系統(tǒng)、裝置、設(shè)備、方法或計(jì)算機(jī)程序產(chǎn)品。因此，本公開(kāi)可以具體實(shí)現(xiàn)為以下形式，即：完全的硬件、完全的軟件(包括固件、駐留軟件、微代碼等)，或者硬件和軟件結(jié)合的形式。

根據(jù)本發(fā)明的實(shí)施方式，提出了一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法、智能設(shè)備及介質(zhì)。

在本文中，附圖中的任何元素?cái)?shù)量均用于示例而非限制，以及任何命名都僅用于區(qū)分，而不具有任何限制含義。

下面參考本發(fā)明的若干代表性實(shí)施方式，詳細(xì)闡釋本發(fā)明的原理和精神。

發(fā)明概述

本發(fā)明人發(fā)現(xiàn)，人與人在當(dāng)面交流時(shí)，用戶a為了讓用戶b知道用戶a要與用戶b說(shuō)話，用戶a通常會(huì)將臉和目光朝向用戶b，此時(shí)，即使用戶a沒(méi)有說(shuō)話，用戶b也會(huì)知道用戶a接下來(lái)要與他打招呼交流，更進(jìn)一步的，當(dāng)用戶a和用戶b的目光接觸時(shí)，用戶b更能確定用戶a是要與用戶b說(shuō)話，而不是與其他人說(shuō)話。發(fā)明人提出了鑒于上述“人與人交互方法”的人機(jī)交互的方法；例如，用戶a戴有智能眼鏡，當(dāng)用戶a面向智能音箱時(shí)，智能音箱就進(jìn)入語(yǔ)音檢測(cè)狀態(tài)，智能音箱在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量時(shí)，進(jìn)行語(yǔ)音識(shí)別，這樣，還沒(méi)等到用戶a說(shuō)話，智能音箱就知道用戶a要與智能音箱進(jìn)行交互，喚醒了智能音箱，因此，提高了喚醒效率，同時(shí)，即使智能音箱檢測(cè)到了存在用戶a但是如果用戶a沒(méi)有朝向智能音箱時(shí)，智能音箱也不會(huì)喚醒，因此，避免了持續(xù)喚醒智能音箱，降低了智能音箱的功耗，提高了用戶體驗(yàn)。

在介紹了本發(fā)明的基本原理之后，下面具體介紹本發(fā)明的各種非限制性實(shí)施方式。

應(yīng)用場(chǎng)景總覽

參考圖1所示，戴有智能眼鏡的用戶a預(yù)跟智能音箱進(jìn)行交互，用戶a的眼睛朝向智能音箱時(shí)，智能音箱就喚醒了，進(jìn)入語(yǔ)音檢測(cè)狀態(tài)，接下來(lái)，用戶a說(shuō)了一句“請(qǐng)播放張國(guó)榮的《沉默是金》”，智能音箱檢測(cè)到這句話時(shí)，進(jìn)行語(yǔ)音識(shí)別。這樣，智能音箱在用戶a說(shuō)話之前就喚醒了，因此，提高了喚醒效率，同時(shí)，由于在用戶a的眼睛朝向智能音箱時(shí)才喚醒智能音箱，避免了智能音箱在檢測(cè)到用戶a的圖像時(shí)就喚醒導(dǎo)致的持續(xù)喚醒的缺陷，因此，降低了智能音箱的功耗，提高了用戶體驗(yàn)。

示例性方法

下面結(jié)合圖1的應(yīng)用場(chǎng)景，參考圖2來(lái)描述根據(jù)本發(fā)明示例性實(shí)施方式的用于喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法。需要注意的是，上述應(yīng)用場(chǎng)景僅是為了便于理解本發(fā)明的精神和原理而示出，本發(fā)明的實(shí)施方式在此方面不受任何限制。相反，本發(fā)明的實(shí)施方式可以應(yīng)用于適用的任何場(chǎng)景。

參閱圖2所示，本發(fā)明實(shí)施例中，提出一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法20，包括：

步驟200：確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí)，進(jìn)入語(yǔ)音檢測(cè)狀態(tài)；

步驟210：在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量時(shí)，進(jìn)行語(yǔ)音識(shí)別。

本發(fā)明實(shí)施例中，確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí)，包括下列方式中的至少一種：

接收到所述第一智能設(shè)備發(fā)送的第一信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備，所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的，例如，智能音箱接收到用戶a戴的智能眼鏡發(fā)送的第一信號(hào)時(shí)，確定用戶a的第一部位朝向智能音箱，其中，第一信號(hào)是智能眼鏡在識(shí)別出智能音箱出現(xiàn)在智能眼鏡的圖像采集區(qū)域中的第一區(qū)域時(shí)發(fā)送的；

在所述第二智能設(shè)備處接收到所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備，例如，智能音箱接收到用戶a戴的智能眼鏡中的紅外發(fā)射源發(fā)射的紅外信號(hào)時(shí)，確定用戶a的第一部位朝向智能音箱；或

前面兩種描述的是第二智能設(shè)備依賴第一智能設(shè)備發(fā)送的信號(hào)來(lái)確定持有所述第一智能設(shè)備的用戶的第一部位是否朝向所述第二智能設(shè)備，當(dāng)然，也可以不依賴于第一智能設(shè)備發(fā)射的信號(hào)來(lái)確定，例如，采用如下方式：

在所述第二智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向，判定所述眼球朝向?yàn)樗龅诙悄茉O(shè)備所處的方向時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備，例如，智能音箱判定用戶a的眼球朝向智能音箱時(shí)，確定用戶a的第一部位朝向智能音箱。

或者，確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí)，也可以采用如下方式：

接收到所述第一智能設(shè)備發(fā)送的第一信號(hào)，所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的，并且在所述第二智能設(shè)備處接收到所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備，也就是說(shuō)，第二智能設(shè)備要同時(shí)接收到第一信號(hào)和第二信號(hào)時(shí)，才能確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備，例如，智能音箱接收到用戶a戴的智能眼鏡發(fā)送的第一信號(hào)，并且還要接收到智能眼鏡發(fā)送的紅外信號(hào)時(shí)，確定用戶a的第一部位朝向智能音箱，其中，第一信號(hào)是智能眼鏡在識(shí)別出智能音箱出現(xiàn)在智能眼鏡的圖像采集區(qū)域中的第一區(qū)域時(shí)發(fā)送的；或者

接收到所述第一智能設(shè)備發(fā)送的觸發(fā)信號(hào)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備，所述觸發(fā)信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域，并且在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向、判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí)發(fā)送的，也就是說(shuō)，第二智能設(shè)備要接收到觸發(fā)信號(hào)時(shí)，就能確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備，例如，智能音箱接收到用戶a戴的智能眼鏡發(fā)送觸發(fā)信號(hào)，第二智能設(shè)備就可以確定用戶a的第一部位朝向智能音箱，其中，觸發(fā)信號(hào)是智能眼鏡在識(shí)別出智能音箱出現(xiàn)在智能眼鏡的圖像采集區(qū)域中的第一區(qū)域，且判定出用戶a的眼球朝向智能眼鏡的第一方向時(shí)發(fā)送的。

前面所描述的第二信號(hào)可以是紅外信號(hào)，也可以是藍(lán)牙信號(hào)，紅外信號(hào)和藍(lán)牙信號(hào)是第二信號(hào)的幾種示例，本發(fā)明實(shí)施例中并不限定于此。

本發(fā)明實(shí)施例中，可選地，所述第一智能設(shè)備為智能眼鏡，和/或所述第二智能設(shè)備為智能音箱。

當(dāng)然，第一智能設(shè)備和第二智能并不限定于上述示例，還可以是其他形式，例如，第一智能設(shè)備還可以為帽子、褲帶、衣服等可穿戴設(shè)備，第二使能設(shè)備還可以為家居設(shè)備、移動(dòng)設(shè)備等。

在有些情況下，用戶可能由于誤操作將第一部位朝向第二智能設(shè)備，在這種情況下，用戶不會(huì)向第二智能設(shè)備發(fā)送語(yǔ)音消息，但是，第二智能設(shè)備如果一直處于語(yǔ)音檢測(cè)狀態(tài)的話，第二智能終端會(huì)產(chǎn)生不必要的功耗，因此，為了降低第二智能終端的功耗，在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)語(yǔ)音，如果沒(méi)有檢測(cè)到語(yǔ)音能量的話，進(jìn)入休眠狀態(tài)，因此，本發(fā)明實(shí)施例中，在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量，可選地，可以采用如下方式：

在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)到語(yǔ)音能量。

例如，用戶a由于誤操作，在x1時(shí)刻眼睛朝向智能音箱，智能音箱檢測(cè)到用戶a的眼睛朝向智能音箱時(shí)，進(jìn)入語(yǔ)音檢測(cè)狀態(tài)，如果在從x1時(shí)刻開(kāi)始的預(yù)設(shè)時(shí)長(zhǎng)內(nèi)都沒(méi)有檢測(cè)到語(yǔ)音能量時(shí)，智能音箱進(jìn)入休眠狀態(tài)，如果在從x1時(shí)刻開(kāi)始的預(yù)設(shè)時(shí)長(zhǎng)內(nèi)檢測(cè)到語(yǔ)音能量時(shí)，進(jìn)行語(yǔ)音識(shí)別，這樣可以避免智能音箱的功耗。

本發(fā)明實(shí)施例中，進(jìn)行語(yǔ)音識(shí)別時(shí)，可選地，可以采用如下方法：

采用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法進(jìn)行語(yǔ)音識(shí)別。例如，基于cnn(convolutionalneuralnetworks，卷積神經(jīng)網(wǎng)絡(luò))方法。

本發(fā)明實(shí)施例中，所述第一部位為面部和/或眼部。

參閱圖3所示，本發(fā)明實(shí)施例中，還提出一種喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法30，包括：

步驟300：判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中；

步驟310：判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，向所述第二智能設(shè)備發(fā)送第一信號(hào)。

本發(fā)明實(shí)施例中，判定出所述第二智能設(shè)備位于所述可視區(qū)域中，包括：

判定出所述第二智能設(shè)備位于所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域時(shí)，判定出所述第二智能設(shè)備位于所述可視區(qū)域中。在這種情況下，方法30中所描述的第一信號(hào)與方法20中所描述的第一信號(hào)相同。

例如，判定出智能音箱位于智能眼鏡的圖像采集區(qū)域中的前方區(qū)域時(shí)，判定出智能音箱位于可視區(qū)域中。

本發(fā)明實(shí)施例中，判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，可選地，可以采用如下方式：

例如，判定出智能音箱位于智能眼鏡的圖像采集區(qū)域中的前方區(qū)域，及進(jìn)一步要在判定出用戶的眼球朝向智能眼鏡的第一方向時(shí)，才能判定出智能音箱位于可視區(qū)域中。

本發(fā)明實(shí)施例中，進(jìn)一步的，所述方法還包括：

所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源發(fā)送第二信號(hào)。其中，可選地，第二信號(hào)可以是紅外信號(hào)，或者，也可以是藍(lán)牙信號(hào)，當(dāng)然，紅外信號(hào)和藍(lán)牙信號(hào)是幾種示例，并不限定于此。

本發(fā)明實(shí)施例中，可選地，所述第一智能設(shè)備為智能眼鏡，和/或所述第二智能設(shè)備為智能音箱。

當(dāng)然，第一智能設(shè)備和第二智能并不限定于上述示例，還可以是其他形式，例如，第一智能設(shè)備還可以為帽子、褲帶、衣服等可穿戴設(shè)備；第二使能設(shè)備還可以為家居設(shè)備、移動(dòng)設(shè)備等。

本發(fā)明實(shí)施例是基于人與人之間的“目光接觸”的方法提出的，無(wú)需喚醒詞就可以實(shí)現(xiàn)喚醒，縮短了從發(fā)出命令到智能設(shè)備執(zhí)行的時(shí)間，也就是說(shuō)，在用戶還沒(méi)有發(fā)出喚醒詞的情況下就將第二智能設(shè)備喚醒了，因此，減少了喚醒時(shí)間，提高了喚醒的效率，并且，該方案也不是在檢測(cè)到用戶圖像的時(shí)候就喚醒第二智能設(shè)備，而是在持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí)，才喚醒第二智能設(shè)備進(jìn)行語(yǔ)音檢測(cè)，避免了持有第一智能設(shè)備的用戶的第一部位沒(méi)有朝向第二智能設(shè)備時(shí)也喚醒第二智能終端，進(jìn)而避免了持續(xù)喚醒第二智能設(shè)備，因此，降低了第二智能設(shè)備的功耗，提高了用戶體驗(yàn)。

示例性裝置

在介紹了本發(fā)明示例性實(shí)施方式的介質(zhì)之后，接下來(lái)，參考圖4對(duì)本發(fā)明示例性實(shí)施方式的第二智能設(shè)備40進(jìn)行描述，第二智能設(shè)備40包括：

第一確定單元400，用于確定持有第一智能設(shè)備的用戶的第一部位是否朝向第二智能設(shè)備；

檢測(cè)單元410，用于在所述第一確定單元400確定持有第一智能設(shè)備的用戶的所述第一部位朝向第二智能設(shè)備時(shí)，進(jìn)入語(yǔ)音檢測(cè)狀態(tài)，進(jìn)行語(yǔ)音檢測(cè)；

語(yǔ)音識(shí)別單元420，用于在所述檢測(cè)單元410在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量時(shí)，進(jìn)行語(yǔ)音識(shí)別。

本發(fā)明實(shí)施例中，可選地，所述第一確定單元400包括接收單元400a和第二確定單元400b，或者包括判斷單元400c和第二確定單元400b，其中：

所述接收單元400a，用于接收所述第一智能設(shè)備發(fā)送的第一信號(hào)，所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的；所述第二確定單元400b，用于在所述接收單元400a接收到所述第一信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備；或者，

所述接收單元400a，用于在所述第二智能設(shè)備處接收所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào)；所述第二確定單元400b，用于在所述接收單元400a接收到所述第二信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備；或者，

所述判斷單元400c，用于在所述第二智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向；所述第二確定單元400b，用于在所述判斷單元400c判定所述眼球朝向?yàn)樗龅诙悄茉O(shè)備所處的方向時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。

本發(fā)明實(shí)施例中，可選地，所述第一確定單元400包括接收單元400a和第二確定單元400b，其中：所述接收單元400a，用于接收所述第一智能設(shè)備發(fā)送的第一信號(hào)及在所述第二智能設(shè)備處接收所述第一智能設(shè)備中的向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)的信號(hào)發(fā)射源所發(fā)送的第二信號(hào)，或者，接收所述第一智能設(shè)備發(fā)送的觸發(fā)信號(hào)，所述第一信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域的情況下發(fā)送的，所述觸發(fā)信號(hào)是所述第一智能設(shè)備在識(shí)別出所述第二智能設(shè)備出現(xiàn)在所述第一智能設(shè)備的圖像采集區(qū)域中的第一區(qū)域，并且在所述第一智能設(shè)備處采用眼球跟蹤技術(shù)判斷所述用戶的眼球朝向、判定所述眼球朝向所述第一智能設(shè)備的第一方向時(shí)發(fā)送的；

所述第二確定單元400b，用于在所述接收單元400a接收到所述第一信號(hào)及所述第二信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備，或者用于在所述接收單元400a接收到所述觸發(fā)信號(hào)時(shí)，確定持有所述第一智能設(shè)備的用戶的第一部位朝向所述第二智能設(shè)備。

本發(fā)明實(shí)施例中，可選地，所述第一智能設(shè)備為智能眼鏡，和/或所述第二智能設(shè)備為智能音箱。

本發(fā)明實(shí)施例中，可選地，所述檢測(cè)單元410在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量，包括：

在與開(kāi)始進(jìn)行語(yǔ)音檢測(cè)的時(shí)間點(diǎn)相距預(yù)設(shè)時(shí)長(zhǎng)的時(shí)間段內(nèi)檢測(cè)到語(yǔ)音能量。

本發(fā)明實(shí)施例中，可選地，所述語(yǔ)音識(shí)別單元420進(jìn)行語(yǔ)音識(shí)別，包括：

采用基于深度學(xué)習(xí)的目標(biāo)檢測(cè)方法進(jìn)行語(yǔ)音識(shí)別。

本發(fā)明實(shí)施例中，可選地，所述第一部位為面部和/或眼部。

參閱圖5所示，本發(fā)明實(shí)施例中，提出一種第一智能設(shè)備50，包括：

判斷單元500，用于判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中；

發(fā)送單元510，用于在所述判斷單元500判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，向所述第二智能設(shè)備發(fā)送第一信號(hào)。

本發(fā)明實(shí)施例張，可選地，所述判斷單元500判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，具體為：

本發(fā)明實(shí)施例中，可選地，所述判斷單元500判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，具體為：

本發(fā)明實(shí)施例中，進(jìn)一步的，所述發(fā)送單元510還用于，向預(yù)設(shè)方向區(qū)間發(fā)送第二信號(hào)。

本發(fā)明實(shí)施例中，可選地，所述第一智能設(shè)備為智能眼鏡，和/或所述第二智能設(shè)備為智能音箱。

示例性設(shè)備

在介紹了本發(fā)明示例性實(shí)施方式的方法和裝置之后，接下來(lái)，介紹根據(jù)本發(fā)明的另一示例性實(shí)施方式的智能設(shè)備。

所屬技術(shù)領(lǐng)域的技術(shù)人員能夠理解，本發(fā)明的各個(gè)方面可以實(shí)現(xiàn)為系統(tǒng)、方法或程序產(chǎn)品。因此，本發(fā)明的各個(gè)方面可以具體實(shí)現(xiàn)為以下形式，即：完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、微代碼等)，或硬件和軟件方面結(jié)合的實(shí)施方式，這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。

在一些可能的實(shí)施方式中，根據(jù)本發(fā)明的智能設(shè)備可以至少包括至少一個(gè)處理單元、以及至少一個(gè)存儲(chǔ)單元。其中，所述存儲(chǔ)單元存儲(chǔ)有程序代碼，當(dāng)所述程序代碼被所述處理單元執(zhí)行時(shí)，使得所述處理單元執(zhí)行本說(shuō)明書上述“示例性方法”部分中描述的根據(jù)本發(fā)明各種示例性實(shí)施方式的用于喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法中的步驟。例如，所述處理單元可以執(zhí)行如圖2中所示的步驟200：確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí)，進(jìn)入語(yǔ)音檢測(cè)狀態(tài)；步驟210：在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量時(shí)，進(jìn)行語(yǔ)音識(shí)別。

又例如，所述處理單元可以執(zhí)行如圖3中所示的步驟300：判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中；步驟310：判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，向所述第二智能設(shè)備發(fā)送第一信號(hào)。

下面參照?qǐng)D6來(lái)描述根據(jù)本發(fā)明的這種實(shí)施方式的智能設(shè)備60。圖6顯示的智能設(shè)備60僅僅是一個(gè)示例，不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來(lái)任何限制。

如圖6所示，智能設(shè)備60以通用計(jì)算設(shè)備的形式表現(xiàn)。智能設(shè)備60的組件可以包括但不限于：上述至少一個(gè)處理單元16、上述至少一個(gè)存儲(chǔ)單元28、連接不同系統(tǒng)組件(包括存儲(chǔ)單元28和處理單元16)的總線18。

總線18表示幾類總線結(jié)構(gòu)中的一種或多種，包括存儲(chǔ)器總線或者存儲(chǔ)器控制器、外圍總線、圖形加速端口、處理器或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。

存儲(chǔ)單元28可以包括易失性存儲(chǔ)器形式的可讀介質(zhì)，例如隨機(jī)存取存儲(chǔ)器(ram)31和/或高速緩存存儲(chǔ)器32，還可以進(jìn)一步只讀存儲(chǔ)器(rom)34。

存儲(chǔ)單元28還可以包括具有一組(至少一個(gè))程序模塊42的程序/實(shí)用工具41，這樣的程序模塊42包括但不限于：操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù)，這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。

智能設(shè)備60也可以與一個(gè)或多個(gè)外部設(shè)備14(例如鍵盤、指向設(shè)備、藍(lán)牙設(shè)備等)通信，還可與一個(gè)或者多個(gè)使得用戶能與該智能設(shè)備60交互的設(shè)備通信，和/或與使得該智能設(shè)備60能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如路由器、調(diào)制解調(diào)器等等)通信。這種通信可以通過(guò)輸入/輸出(i/o)接口22進(jìn)行。并且，智能設(shè)備60還可以通過(guò)網(wǎng)絡(luò)適配器21與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan)，廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò)，例如因特網(wǎng))通信。如圖所示，網(wǎng)絡(luò)適配器21通過(guò)總線18與智能設(shè)備60的其它模塊通信。應(yīng)當(dāng)明白，盡管圖中未示出，可以結(jié)合智能設(shè)備60使用其它硬件和/或軟件模塊，包括但不限于：微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。

示例性程序產(chǎn)品

在一些可能的實(shí)施方式中，本發(fā)明的各個(gè)方面還可以實(shí)現(xiàn)為一種程序產(chǎn)品的形式，其包括程序代碼，當(dāng)所述程序產(chǎn)品在設(shè)備上運(yùn)行時(shí)，所述程序代碼用于使所述設(shè)備執(zhí)行本說(shuō)明書上述“示例性方法”部分中描述的根據(jù)本發(fā)明各種示例性實(shí)施方式的用于喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的方法中的步驟，例如，所述設(shè)備可以執(zhí)行如圖2中所示的步驟200：確定持有第一智能設(shè)備的用戶的第一部位朝向第二智能設(shè)備時(shí)，進(jìn)入語(yǔ)音檢測(cè)狀態(tài)；步驟210：在語(yǔ)音檢測(cè)狀態(tài)下，檢測(cè)到語(yǔ)音能量時(shí)，進(jìn)行語(yǔ)音識(shí)別。

例如，所述設(shè)備可以執(zhí)行如圖3中所示的步驟300：判斷第二智能設(shè)備是否位于持有第一智能設(shè)備的用戶的可視區(qū)域中；步驟310：判定出所述第二智能設(shè)備位于所述可視區(qū)域中時(shí)，向所述第二智能設(shè)備發(fā)送第一信號(hào)。

所述程序產(chǎn)品可以采用一個(gè)或多個(gè)可讀介質(zhì)的任意組合。可讀介質(zhì)可以是可讀信號(hào)介質(zhì)或者可讀存儲(chǔ)介質(zhì)?？勺x存儲(chǔ)介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件，或者任意以上的組合。可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括：具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式盤、硬盤、隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。

如圖7所示，描述了根據(jù)本發(fā)明的實(shí)施方式的用于喚醒第二智能設(shè)備進(jìn)行語(yǔ)音識(shí)別的程序產(chǎn)品70，其可以采用便攜式緊湊盤只讀存儲(chǔ)器(cd-rom)并包括程序代碼，并可以在終端設(shè)備，例如個(gè)人電腦上運(yùn)行。然而，本發(fā)明的程序產(chǎn)品不限于此，在本文件中，可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì)，該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。

可讀信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào)，其中承載了可讀程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式，包括——但不限于——電磁信號(hào)、光信號(hào)或上述的任意合適的組合?？勺x信號(hào)介質(zhì)還可以是可讀存儲(chǔ)介質(zhì)以外的任何可讀介質(zhì)，該可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。

可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸，包括——但不限于——無(wú)線、有線、光纜、rf等等，或者上述的任意合適的組合。

可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任意組合來(lái)編寫用于執(zhí)行本發(fā)明操作的程序代碼，所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言—諸如java、c++等，還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言—諸如“c”語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶計(jì)算設(shè)備上執(zhí)行、部分地在用戶設(shè)備上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算設(shè)備上部分在遠(yuǎn)程計(jì)算設(shè)備上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算設(shè)備或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算設(shè)備的情形中，遠(yuǎn)程計(jì)算設(shè)備可以通過(guò)任意種類的網(wǎng)絡(luò)——包括局域網(wǎng)(lan)或廣域網(wǎng)(wan)—連接到用戶計(jì)算設(shè)備，或者，可以連接到外部計(jì)算設(shè)備(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。

應(yīng)當(dāng)注意，盡管在上文詳細(xì)描述中提及了智能設(shè)備的若干裝置或子裝置，但是這種劃分僅僅并非強(qiáng)制性的。實(shí)際上，根據(jù)本發(fā)明的實(shí)施方式，上文描述的兩個(gè)或更多裝置的特征和功能可以在一個(gè)裝置中具體化。反之，上文描述的一個(gè)裝置的特征和功能可以進(jìn)一步劃分為由多個(gè)裝置來(lái)具體化。

此外，盡管在附圖中以特定順序描述了本發(fā)明方法的操作，但是，這并非要求或者暗示必須按照該特定順序來(lái)執(zhí)行這些操作，或是必須執(zhí)行全部所示的操作才能實(shí)現(xiàn)期望的結(jié)果。附加地或備選地，可以省略某些步驟，將多個(gè)步驟合并為一個(gè)步驟執(zhí)行，和/或?qū)⒁粋€(gè)步驟分解為多個(gè)步驟執(zhí)行。

雖然已經(jīng)參考若干具體實(shí)施方式描述了本發(fā)明的精神和原理，但是應(yīng)該理解，本發(fā)明并不限于所公開(kāi)的具體實(shí)施方式，對(duì)各方面的劃分也不意味著這些方面中的特征不能組合以進(jìn)行受益，這種劃分僅是為了表述的方便。本發(fā)明旨在涵蓋所附權(quán)利要求的精神和范圍內(nèi)所包括的各種修改和等同布置。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2