欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語(yǔ)音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)與流程

文檔序號(hào):40610433發(fā)布日期:2025-01-07 20:53閱讀:16來(lái)源:國(guó)知局
語(yǔ)音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)與流程

本公開涉及計(jì)算機(jī)領(lǐng)域,具體涉及語(yǔ)音處理、深度學(xué)習(xí)、圖像處理等,尤其涉及一種語(yǔ)音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品。


背景技術(shù):

1、目前市面上主流的座艙語(yǔ)音系統(tǒng)均支持多音區(qū)交互,如雙音區(qū)、四音區(qū)、六音區(qū)等,同時(shí)跟音區(qū)配套的功能也有許多,如分區(qū)空調(diào)、分區(qū)車控、系統(tǒng)控制等。

2、各個(gè)音區(qū)配套的功能均獨(dú)立實(shí)現(xiàn),用戶在控制相應(yīng)音區(qū)的部件時(shí)需要通過(guò)關(guān)鍵字喚醒后加上識(shí)別固定的指令才可以實(shí)現(xiàn),控制算法的運(yùn)算量大,用戶體驗(yàn)差。


技術(shù)實(shí)現(xiàn)思路

1、本公開提供了一種語(yǔ)音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品。

2、根據(jù)第一方面,提供了一種語(yǔ)音控制方法,該方法包括:接收至少兩個(gè)音區(qū)中第一音區(qū)的語(yǔ)音信息;檢測(cè)語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配;響應(yīng)于檢測(cè)到語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有至少兩個(gè)音區(qū)中第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);響應(yīng)于檢測(cè)到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。

3、根據(jù)第二方面,提供了一種語(yǔ)音控制裝置,該裝置包括:接收單元,被配置成接收至少兩個(gè)音區(qū)中第一音區(qū)的語(yǔ)音信息;關(guān)鍵檢測(cè)單元,被配置成檢測(cè)語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配;意圖檢測(cè)單元,被配置成響應(yīng)于檢測(cè)到語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有至少兩個(gè)音區(qū)中第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);執(zhí)行單元,被配置成響應(yīng)于檢測(cè)到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。

4、根據(jù)第三方面,提供了一種電子設(shè)備,該電子設(shè)備包括:至少一個(gè)處理器;以及與至少一個(gè)處理器通信連接的存儲(chǔ)器,其中,存儲(chǔ)器存儲(chǔ)有可被至少一個(gè)處理器執(zhí)行的指令,指令被至少一個(gè)處理器執(zhí)行,以使至少一個(gè)處理器能夠執(zhí)行如第一方面任一實(shí)現(xiàn)方式描述的方法。

5、根據(jù)第四方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行如第一方面任一實(shí)現(xiàn)方式描述的方法。

6、根據(jù)第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面任一實(shí)現(xiàn)方式描述的方法。

7、本公開的實(shí)施例提供的語(yǔ)音控制方法和裝置,首先,接收至少兩個(gè)音區(qū)中第一音區(qū)的語(yǔ)音信息;其次,檢測(cè)語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配;再次,響應(yīng)于檢測(cè)到語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);最后,響應(yīng)于檢測(cè)到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。由此,在第一音區(qū)的語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配時(shí),若檢測(cè)到的第二音區(qū)的可繼承意圖信息,直接執(zhí)行該可繼承意圖信息,可以使第一音區(qū)的用戶無(wú)需發(fā)出與指令動(dòng)作相匹配的控制指令,簡(jiǎn)化了用戶語(yǔ)音控制流程,節(jié)省了控制算法的運(yùn)算量,提高了用戶體驗(yàn)。

8、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過(guò)以下的說(shuō)明書而變得容易理解。



技術(shù)特征:

1.一種語(yǔ)音控制方法,所述方法包括:

2.根據(jù)權(quán)利要求1所述的方法,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承關(guān)鍵詞,所述檢測(cè)所述語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配包括:

3.根據(jù)權(quán)利要求1所述的方法,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承語(yǔ)義信息,所述檢測(cè)所述語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配包括:

4.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有所述第二音區(qū)的可繼承意圖信息包括:

5.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有所述第二音區(qū)的可繼承意圖信息包括:

6.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有所述第二音區(qū)的可繼承意圖信息包括:

7.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測(cè)到具有所述可繼承意圖信息,控制所述第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作包括:

8.根據(jù)權(quán)利要求1-7之一所述的方法,所述方法還包括:

9.根據(jù)權(quán)利要求8所述的方法,所述方法還包括:

10.根據(jù)權(quán)利要求9所述的方法,其中,所述檢測(cè)所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息包括:

11.根據(jù)權(quán)利要求9所述的方法,其中,所述檢測(cè)所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息包括:

12.根據(jù)權(quán)利要求8所述的方法,其中,所述響應(yīng)于判斷結(jié)果為所述語(yǔ)音信息包括喚醒控制信息,基于所述語(yǔ)音信息,識(shí)別動(dòng)作執(zhí)行意圖包括:

13.一種語(yǔ)音控制裝置,所述裝置包括:

14.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承關(guān)鍵詞,所述關(guān)鍵檢測(cè)單元被配置成:基于所述語(yǔ)音信息,得到轉(zhuǎn)化文本;檢測(cè)所述轉(zhuǎn)化文本中是否具有所述意圖繼承關(guān)鍵詞;響應(yīng)于檢測(cè)到所述轉(zhuǎn)化文本中具有所述意圖繼承關(guān)鍵詞,確定所述語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配。

15.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承語(yǔ)義信息,所述關(guān)鍵檢測(cè)單元被配置成:基于所述語(yǔ)音信息,提取文本語(yǔ)義信息;檢測(cè)所述文本語(yǔ)義信息是否與所述意圖繼承語(yǔ)義信息相匹配;響應(yīng)于檢測(cè)到所述文本語(yǔ)義信息與所述意圖繼承語(yǔ)義信息相匹配,確定所述語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配。

16.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測(cè)單元被配置成:響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,從本地存儲(chǔ)的至少兩個(gè)音區(qū)的可繼承意圖信息中選取與所述語(yǔ)音信息時(shí)間相差最短的可繼承意圖信息;檢測(cè)與所述語(yǔ)音信息時(shí)間相差最短的可繼承意圖信息是否屬于所述第一音區(qū);響應(yīng)于檢測(cè)到與所述語(yǔ)音信息時(shí)間相差最短的可繼承意圖信息不屬于所述第一音區(qū),確定具有所述第二音區(qū)的可繼承意圖信息。

17.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測(cè)單元被配置成:響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)本地?cái)?shù)據(jù)庫(kù)是否存儲(chǔ)有所述第二音區(qū)的動(dòng)作執(zhí)行意圖;響應(yīng)于檢測(cè)到所述動(dòng)作執(zhí)行意圖,且所述動(dòng)作執(zhí)行意圖只有一個(gè);將所述動(dòng)作執(zhí)行意圖確定為可繼承意圖信息,并確定所述第二音區(qū)具有可繼承意圖信息。

18.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測(cè)單元被配置成:響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)所述意圖繼承關(guān)鍵信息是否包括所述第二音區(qū)的意圖繼承語(yǔ)義信息;響應(yīng)于檢測(cè)到所述意圖繼承關(guān)鍵信息包括所述第二音區(qū)的意圖繼承語(yǔ)義信息,確定具有所述第二音區(qū)的可繼承意圖信息。

19.根據(jù)權(quán)利要求13所述的裝置,所述執(zhí)行單元被配置成:基于所述可繼承意圖信息,生成并發(fā)送意圖問(wèn)詢信息;響應(yīng)于接收到對(duì)所述意圖問(wèn)詢信息的答復(fù)信息,控制第一音區(qū)的被控對(duì)象執(zhí)行所述可繼承意圖信息和所述答復(fù)信息對(duì)應(yīng)的指令動(dòng)作。

20.根據(jù)權(quán)利要求13-19之一所述的裝置,所述裝置還包括:第一實(shí)施單元,被配置成:響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息不相匹配,判斷所述語(yǔ)音信息是否包括喚醒控制信息;響應(yīng)于判斷結(jié)果為所述語(yǔ)音信息包括喚醒控制信息,基于所述語(yǔ)音信息,識(shí)別動(dòng)作執(zhí)行意圖;控制所述第一音區(qū)的被控對(duì)象執(zhí)行所述動(dòng)作執(zhí)行意圖的指令動(dòng)作。

21.根據(jù)權(quán)利要求20所述的裝置,所述裝置還包括:第二實(shí)施單元,被配置成:檢測(cè)所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息;響應(yīng)于檢測(cè)到所述動(dòng)作執(zhí)行意圖是所述第一音區(qū)的可繼承意圖信息,將所述動(dòng)作執(zhí)行意圖作為所述第一音區(qū)的可繼承意圖信息存儲(chǔ)在本地?cái)?shù)據(jù)庫(kù)中。

22.根據(jù)權(quán)利要求21所述的裝置,其中,所述第二實(shí)施單元被配置成:基于所述動(dòng)作執(zhí)行意圖,確定當(dāng)前場(chǎng)景下的被控對(duì)象;檢測(cè)所述被控對(duì)象是否屬于預(yù)設(shè)垂類;響應(yīng)于檢測(cè)到所述被控對(duì)象屬于預(yù)設(shè)垂類,確定所述動(dòng)作執(zhí)行意圖為所述第一音區(qū)的可繼承意圖信息。

23.根據(jù)權(quán)利要求21所述的裝置,其中,所述第二實(shí)施單元被配置成:基于所述動(dòng)作執(zhí)行意圖,確定當(dāng)前場(chǎng)景下的被控對(duì)象;檢測(cè)所述第二音區(qū)是否具有與所述被控對(duì)象類型相同的對(duì)象;響應(yīng)于檢測(cè)到所述第二音區(qū)具有與所述被控對(duì)象類型相同的對(duì)象,確定所述動(dòng)作執(zhí)行意圖為所述第一音區(qū)的可繼承意圖信息。

24.根據(jù)權(quán)利要求20所述的裝置,其中,所述第一實(shí)施單元被配置成:響應(yīng)于判斷結(jié)果為所述語(yǔ)音信息包括喚醒控制信息,基于所述語(yǔ)音信息,得到轉(zhuǎn)化文本;將所述轉(zhuǎn)化文本輸入訓(xùn)練完成的意圖識(shí)別模型,得到意圖識(shí)別模型輸出的動(dòng)作執(zhí)行意圖。

25.一種電子設(shè)備,其特征在于,包括:

26.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-12中任一項(xiàng)所述方法。

27.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-12中任一項(xiàng)所述的方法。


技術(shù)總結(jié)
本公開提供了一種語(yǔ)音控制方法和裝置,涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及語(yǔ)音處理、深度學(xué)習(xí)、圖像處理等技術(shù)領(lǐng)域。具體實(shí)現(xiàn)方案為:接收至少兩個(gè)音區(qū)中第一音區(qū)的語(yǔ)音信息;檢測(cè)語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配;響應(yīng)于檢測(cè)到語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有第二音區(qū)的可繼承意圖信息,所述第二音區(qū)是與所述第一音區(qū)不同的音區(qū);響應(yīng)于檢測(cè)到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作,提高了用戶體驗(yàn)。

技術(shù)研發(fā)人員:毛文強(qiáng)
受保護(hù)的技術(shù)使用者:阿波羅智聯(lián)(北京)科技有限公司
技術(shù)研發(fā)日:
技術(shù)公布日:2025/1/6
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
淮北市| 汉阴县| 无棣县| 措勤县| 大方县| 凤台县| 五家渠市| 兴安盟| 乾安县| 达拉特旗| 六盘水市| 岑溪市| 清水河县| 漯河市| 滦平县| 定结县| 东港市| 黎城县| 洛宁县| 科技| 通化市| 营山县| 甘德县| 米脂县| 额尔古纳市| 铁力市| 新河县| 栾城县| 温宿县| 天祝| 正宁县| 郑州市| 梁平县| 乐清市| 黑山县| 双牌县| 沅江市| 德阳市| 天长市| 景宁| 高平市|