本公開涉及計(jì)算機(jī)領(lǐng)域,具體涉及語(yǔ)音處理、深度學(xué)習(xí)、圖像處理等,尤其涉及一種語(yǔ)音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
1、目前市面上主流的座艙語(yǔ)音系統(tǒng)均支持多音區(qū)交互,如雙音區(qū)、四音區(qū)、六音區(qū)等,同時(shí)跟音區(qū)配套的功能也有許多,如分區(qū)空調(diào)、分區(qū)車控、系統(tǒng)控制等。
2、各個(gè)音區(qū)配套的功能均獨(dú)立實(shí)現(xiàn),用戶在控制相應(yīng)音區(qū)的部件時(shí)需要通過(guò)關(guān)鍵字喚醒后加上識(shí)別固定的指令才可以實(shí)現(xiàn),控制算法的運(yùn)算量大,用戶體驗(yàn)差。
技術(shù)實(shí)現(xiàn)思路
1、本公開提供了一種語(yǔ)音控制方法和裝置、電子設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及計(jì)算機(jī)程序產(chǎn)品。
2、根據(jù)第一方面,提供了一種語(yǔ)音控制方法,該方法包括:接收至少兩個(gè)音區(qū)中第一音區(qū)的語(yǔ)音信息;檢測(cè)語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配;響應(yīng)于檢測(cè)到語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有至少兩個(gè)音區(qū)中第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);響應(yīng)于檢測(cè)到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。
3、根據(jù)第二方面,提供了一種語(yǔ)音控制裝置,該裝置包括:接收單元,被配置成接收至少兩個(gè)音區(qū)中第一音區(qū)的語(yǔ)音信息;關(guān)鍵檢測(cè)單元,被配置成檢測(cè)語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配;意圖檢測(cè)單元,被配置成響應(yīng)于檢測(cè)到語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有至少兩個(gè)音區(qū)中第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);執(zhí)行單元,被配置成響應(yīng)于檢測(cè)到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。
4、根據(jù)第三方面,提供了一種電子設(shè)備,該電子設(shè)備包括:至少一個(gè)處理器;以及與至少一個(gè)處理器通信連接的存儲(chǔ)器,其中,存儲(chǔ)器存儲(chǔ)有可被至少一個(gè)處理器執(zhí)行的指令,指令被至少一個(gè)處理器執(zhí)行,以使至少一個(gè)處理器能夠執(zhí)行如第一方面任一實(shí)現(xiàn)方式描述的方法。
5、根據(jù)第四方面,提供了一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行如第一方面任一實(shí)現(xiàn)方式描述的方法。
6、根據(jù)第五方面,提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面任一實(shí)現(xiàn)方式描述的方法。
7、本公開的實(shí)施例提供的語(yǔ)音控制方法和裝置,首先,接收至少兩個(gè)音區(qū)中第一音區(qū)的語(yǔ)音信息;其次,檢測(cè)語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配;再次,響應(yīng)于檢測(cè)到語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有第二音區(qū)的可繼承意圖信息,第二音區(qū)是與第一音區(qū)不同的音區(qū);最后,響應(yīng)于檢測(cè)到具有可繼承意圖信息,控制第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作。由此,在第一音區(qū)的語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配時(shí),若檢測(cè)到的第二音區(qū)的可繼承意圖信息,直接執(zhí)行該可繼承意圖信息,可以使第一音區(qū)的用戶無(wú)需發(fā)出與指令動(dòng)作相匹配的控制指令,簡(jiǎn)化了用戶語(yǔ)音控制流程,節(jié)省了控制算法的運(yùn)算量,提高了用戶體驗(yàn)。
8、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本公開的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過(guò)以下的說(shuō)明書而變得容易理解。
1.一種語(yǔ)音控制方法,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承關(guān)鍵詞,所述檢測(cè)所述語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配包括:
3.根據(jù)權(quán)利要求1所述的方法,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承語(yǔ)義信息,所述檢測(cè)所述語(yǔ)音信息是否與意圖繼承關(guān)鍵信息相匹配包括:
4.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有所述第二音區(qū)的可繼承意圖信息包括:
5.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有所述第二音區(qū)的可繼承意圖信息包括:
6.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)是否具有所述第二音區(qū)的可繼承意圖信息包括:
7.根據(jù)權(quán)利要求1所述的方法,其中,所述響應(yīng)于檢測(cè)到具有所述可繼承意圖信息,控制所述第一音區(qū)的被控對(duì)象執(zhí)行指令動(dòng)作包括:
8.根據(jù)權(quán)利要求1-7之一所述的方法,所述方法還包括:
9.根據(jù)權(quán)利要求8所述的方法,所述方法還包括:
10.根據(jù)權(quán)利要求9所述的方法,其中,所述檢測(cè)所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息包括:
11.根據(jù)權(quán)利要求9所述的方法,其中,所述檢測(cè)所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息包括:
12.根據(jù)權(quán)利要求8所述的方法,其中,所述響應(yīng)于判斷結(jié)果為所述語(yǔ)音信息包括喚醒控制信息,基于所述語(yǔ)音信息,識(shí)別動(dòng)作執(zhí)行意圖包括:
13.一種語(yǔ)音控制裝置,所述裝置包括:
14.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承關(guān)鍵詞,所述關(guān)鍵檢測(cè)單元被配置成:基于所述語(yǔ)音信息,得到轉(zhuǎn)化文本;檢測(cè)所述轉(zhuǎn)化文本中是否具有所述意圖繼承關(guān)鍵詞;響應(yīng)于檢測(cè)到所述轉(zhuǎn)化文本中具有所述意圖繼承關(guān)鍵詞,確定所述語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配。
15.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖繼承關(guān)鍵信息包括:意圖繼承語(yǔ)義信息,所述關(guān)鍵檢測(cè)單元被配置成:基于所述語(yǔ)音信息,提取文本語(yǔ)義信息;檢測(cè)所述文本語(yǔ)義信息是否與所述意圖繼承語(yǔ)義信息相匹配;響應(yīng)于檢測(cè)到所述文本語(yǔ)義信息與所述意圖繼承語(yǔ)義信息相匹配,確定所述語(yǔ)音信息與意圖繼承關(guān)鍵信息相匹配。
16.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測(cè)單元被配置成:響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,從本地存儲(chǔ)的至少兩個(gè)音區(qū)的可繼承意圖信息中選取與所述語(yǔ)音信息時(shí)間相差最短的可繼承意圖信息;檢測(cè)與所述語(yǔ)音信息時(shí)間相差最短的可繼承意圖信息是否屬于所述第一音區(qū);響應(yīng)于檢測(cè)到與所述語(yǔ)音信息時(shí)間相差最短的可繼承意圖信息不屬于所述第一音區(qū),確定具有所述第二音區(qū)的可繼承意圖信息。
17.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測(cè)單元被配置成:響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)本地?cái)?shù)據(jù)庫(kù)是否存儲(chǔ)有所述第二音區(qū)的動(dòng)作執(zhí)行意圖;響應(yīng)于檢測(cè)到所述動(dòng)作執(zhí)行意圖,且所述動(dòng)作執(zhí)行意圖只有一個(gè);將所述動(dòng)作執(zhí)行意圖確定為可繼承意圖信息,并確定所述第二音區(qū)具有可繼承意圖信息。
18.根據(jù)權(quán)利要求13所述的裝置,其中,所述意圖檢測(cè)單元被配置成:響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息相匹配,檢測(cè)所述意圖繼承關(guān)鍵信息是否包括所述第二音區(qū)的意圖繼承語(yǔ)義信息;響應(yīng)于檢測(cè)到所述意圖繼承關(guān)鍵信息包括所述第二音區(qū)的意圖繼承語(yǔ)義信息,確定具有所述第二音區(qū)的可繼承意圖信息。
19.根據(jù)權(quán)利要求13所述的裝置,所述執(zhí)行單元被配置成:基于所述可繼承意圖信息,生成并發(fā)送意圖問(wèn)詢信息;響應(yīng)于接收到對(duì)所述意圖問(wèn)詢信息的答復(fù)信息,控制第一音區(qū)的被控對(duì)象執(zhí)行所述可繼承意圖信息和所述答復(fù)信息對(duì)應(yīng)的指令動(dòng)作。
20.根據(jù)權(quán)利要求13-19之一所述的裝置,所述裝置還包括:第一實(shí)施單元,被配置成:響應(yīng)于檢測(cè)到所述語(yǔ)音信息與所述意圖繼承關(guān)鍵信息不相匹配,判斷所述語(yǔ)音信息是否包括喚醒控制信息;響應(yīng)于判斷結(jié)果為所述語(yǔ)音信息包括喚醒控制信息,基于所述語(yǔ)音信息,識(shí)別動(dòng)作執(zhí)行意圖;控制所述第一音區(qū)的被控對(duì)象執(zhí)行所述動(dòng)作執(zhí)行意圖的指令動(dòng)作。
21.根據(jù)權(quán)利要求20所述的裝置,所述裝置還包括:第二實(shí)施單元,被配置成:檢測(cè)所述動(dòng)作執(zhí)行意圖是否為所述第一音區(qū)的可繼承意圖信息;響應(yīng)于檢測(cè)到所述動(dòng)作執(zhí)行意圖是所述第一音區(qū)的可繼承意圖信息,將所述動(dòng)作執(zhí)行意圖作為所述第一音區(qū)的可繼承意圖信息存儲(chǔ)在本地?cái)?shù)據(jù)庫(kù)中。
22.根據(jù)權(quán)利要求21所述的裝置,其中,所述第二實(shí)施單元被配置成:基于所述動(dòng)作執(zhí)行意圖,確定當(dāng)前場(chǎng)景下的被控對(duì)象;檢測(cè)所述被控對(duì)象是否屬于預(yù)設(shè)垂類;響應(yīng)于檢測(cè)到所述被控對(duì)象屬于預(yù)設(shè)垂類,確定所述動(dòng)作執(zhí)行意圖為所述第一音區(qū)的可繼承意圖信息。
23.根據(jù)權(quán)利要求21所述的裝置,其中,所述第二實(shí)施單元被配置成:基于所述動(dòng)作執(zhí)行意圖,確定當(dāng)前場(chǎng)景下的被控對(duì)象;檢測(cè)所述第二音區(qū)是否具有與所述被控對(duì)象類型相同的對(duì)象;響應(yīng)于檢測(cè)到所述第二音區(qū)具有與所述被控對(duì)象類型相同的對(duì)象,確定所述動(dòng)作執(zhí)行意圖為所述第一音區(qū)的可繼承意圖信息。
24.根據(jù)權(quán)利要求20所述的裝置,其中,所述第一實(shí)施單元被配置成:響應(yīng)于判斷結(jié)果為所述語(yǔ)音信息包括喚醒控制信息,基于所述語(yǔ)音信息,得到轉(zhuǎn)化文本;將所述轉(zhuǎn)化文本輸入訓(xùn)練完成的意圖識(shí)別模型,得到意圖識(shí)別模型輸出的動(dòng)作執(zhí)行意圖。
25.一種電子設(shè)備,其特征在于,包括:
26.一種存儲(chǔ)有計(jì)算機(jī)指令的非瞬時(shí)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)指令用于使所述計(jì)算機(jī)執(zhí)行權(quán)利要求1-12中任一項(xiàng)所述方法。
27.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序在被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-12中任一項(xiàng)所述的方法。