本發(fā)明涉及汽車語音交互技術(shù)領(lǐng)域,尤其涉及一種車載語音交互方法、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù):
當(dāng)前汽車的車載系統(tǒng)作為用戶駕駛的輔助系統(tǒng),普遍采用觸摸顯示器或按鈕按鍵等作為用戶與車載系統(tǒng)溝通交互的方式。用戶可通過觸摸顯示器上的功能選項(xiàng)或調(diào)整按鈕按鍵所對(duì)應(yīng)的功能選項(xiàng),達(dá)到對(duì)車載系統(tǒng)下達(dá)操作命令的目標(biāo)。
但是,以上所述的交互方式存在有以下缺陷。當(dāng)用戶處于駕駛狀態(tài),而又需要快速調(diào)整某一個(gè)功能時(shí),假設(shè)若用戶把注意力放在觸摸顯示器或者按鈕按鍵上,則用戶的注意力會(huì)被分散。而汽車駕駛需要用戶全程保持集中精神的狀態(tài),用戶的注意力被分散,將大大影響到汽車的駕駛安全問題,容易造成交通事故的發(fā)生。同時(shí),通過觸摸顯示器或者按鈕按鍵的交互方式較為繁瑣,對(duì)用戶的使用體驗(yàn)不佳。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的主要目的在于提供一種車載語音交互方法、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),旨在解決車載系統(tǒng)的交互方式影響到用戶的駕駛安全以及使用體驗(yàn)不佳的技術(shù)問題。
為實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供一種車載語音交互方法,所述車載語音交互方法包括:
采集用戶輸入的語音口令;
根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令,以獲得對(duì)應(yīng)的語音指令;
根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能。
優(yōu)選地,所述根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令的步驟之前還包括:
當(dāng)基于默認(rèn)的語音數(shù)據(jù)包無法識(shí)別語音口令時(shí),提取語音口令的語音特征;
將語音特征與預(yù)設(shè)的方言語音數(shù)據(jù)包進(jìn)行特征比對(duì),獲取符合語音特征的目標(biāo)語音數(shù)據(jù)包;
基于目標(biāo)語音數(shù)據(jù)包識(shí)別語音口令。
優(yōu)選地,所述根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能步驟之前還包括:
當(dāng)檢測(cè)到語音指令所指代的功能與當(dāng)前的使用場(chǎng)景相違背時(shí),提示用戶進(jìn)行語音確認(rèn)操作。
優(yōu)選地,所述根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能的步驟包括:
根據(jù)語音指令所指代的功能,獲取執(zhí)行該功能的控制權(quán)限;
基于控制權(quán)限控制汽車執(zhí)行該功能。
優(yōu)選地,所述基于控制權(quán)限控制汽車執(zhí)行該功能的步驟包括:
當(dāng)檢測(cè)到控制權(quán)限不足和/或控制權(quán)限獲取失敗時(shí),向用戶發(fā)出最高控制權(quán)限請(qǐng)求;
當(dāng)檢測(cè)到用戶基于最高權(quán)限請(qǐng)求的確認(rèn)指令時(shí),獲取汽車的最高控制權(quán)限;
基于最高控制權(quán)限控制汽車執(zhí)行語音指令所指代的功能。
優(yōu)選地,所述車載語音交互方法還包括:
當(dāng)汽車無法正常執(zhí)行語音指令對(duì)應(yīng)的功能時(shí),將該語音指令和本次執(zhí)行信息發(fā)送至后臺(tái)服務(wù)器進(jìn)行數(shù)據(jù)分析;
在接收后臺(tái)服務(wù)器基于語音指令和本次執(zhí)行信息的分析后獲取的異常結(jié)果后,根據(jù)異常結(jié)果執(zhí)行相應(yīng)的功能。
優(yōu)選地,所述車載語音交互方法還包括:
在汽車基于語音指令執(zhí)行對(duì)應(yīng)的功能之后,當(dāng)接收到用戶針對(duì)該功能的糾錯(cuò)指令時(shí),更新該語音指令對(duì)應(yīng)的語義分析的數(shù)據(jù)庫。
優(yōu)選地,所述車載語音交互方法還包括:
當(dāng)檢測(cè)到用戶基于語義數(shù)據(jù)庫的更新操作時(shí),更新語義數(shù)據(jù)庫。
本發(fā)明還提供一種車載語音終端,所述車載語音終端包括:存儲(chǔ)器、處理器,通信總線以及存儲(chǔ)在所述存儲(chǔ)器上的車載語音交互程序,
所述通信總線用于實(shí)現(xiàn)處理器與存儲(chǔ)器間的通信連接;
所述處理器用于執(zhí)行所述車載語音交互程序,以實(shí)現(xiàn)以下步驟:
采集用戶輸入的語音口令;
根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令,以獲得對(duì)應(yīng)的語音指令;
根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能。
優(yōu)選地,所述根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令的步驟之前還包括:
當(dāng)基于默認(rèn)的語音數(shù)據(jù)包無法識(shí)別語音口令時(shí),提取語音口令的語音特征;
將語音特征與預(yù)設(shè)的方言語音數(shù)據(jù)包進(jìn)行特征比對(duì),獲取符合語音特征的目標(biāo)語音數(shù)據(jù)包;
基于目標(biāo)語音數(shù)據(jù)包識(shí)別語音口令。
優(yōu)選地,所述根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能步驟之前還包括:
當(dāng)檢測(cè)到語音指令所指代的功能與當(dāng)前的使用場(chǎng)景相違背時(shí),提示用戶進(jìn)行語音確認(rèn)操作。
優(yōu)選地,所述根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能的步驟包括:
根據(jù)語音指令所指代的功能,獲取執(zhí)行該功能的控制權(quán)限;
基于控制權(quán)限控制汽車執(zhí)行該功能。
優(yōu)選地,所述基于控制權(quán)限控制汽車執(zhí)行該功能的步驟包括:
當(dāng)檢測(cè)到控制權(quán)限不足和/或控制權(quán)限獲取失敗時(shí),向用戶發(fā)出最高控制權(quán)限請(qǐng)求;
當(dāng)檢測(cè)到用戶基于最高權(quán)限請(qǐng)求的確認(rèn)指令時(shí),獲取汽車的最高控制權(quán)限;
基于最高控制權(quán)限控制汽車執(zhí)行語音指令所指代的功能。
優(yōu)選地,所述車載語音交互方法還包括:
當(dāng)汽車無法正常執(zhí)行語音指令對(duì)應(yīng)的功能時(shí),將該語音指令和本次執(zhí)行信息發(fā)送至后臺(tái)服務(wù)器進(jìn)行數(shù)據(jù)分析;
在接收后臺(tái)服務(wù)器基于語音指令和本次執(zhí)行信息的分析后獲取的異常結(jié)果后,根據(jù)異常結(jié)果執(zhí)行相應(yīng)的功能。
優(yōu)選地,所述車載語音交互方法還包括:
在汽車基于語音指令執(zhí)行對(duì)應(yīng)的功能之后,當(dāng)接收到用戶針對(duì)該功能的糾錯(cuò)指令時(shí),更新該語音指令對(duì)應(yīng)的語義分析的數(shù)據(jù)庫。
優(yōu)選地,所述車載語音交互方法還包括:
當(dāng)檢測(cè)到用戶基于語義數(shù)據(jù)庫的更新操作時(shí),更新語義數(shù)據(jù)庫。
此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有一個(gè)或者一個(gè)以上程序,所述一個(gè)或者一個(gè)以上程序可被一個(gè)或者一個(gè)以上的處理器執(zhí)行以用于:
采集用戶輸入的語音口令;
根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令,以獲得對(duì)應(yīng)的語音指令;
根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能。
本發(fā)明的技術(shù)方案中,首先采集用戶輸入的語音口令;然后根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令,以獲得對(duì)應(yīng)的語音指令;最后根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能。本發(fā)明使用戶可以在保障安全駕駛的前提下,實(shí)現(xiàn)與車輛語音終端的交互操作,以達(dá)到操作目的。同時(shí),本發(fā)明簡化了用戶與車載語音終端之間的交互操作,避免了繁瑣的交互操作步驟,改善了用戶的使用體驗(yàn)。
附圖說明
圖1為本發(fā)明實(shí)施例方法涉及的硬件運(yùn)行環(huán)境的設(shè)備結(jié)構(gòu)示意圖;
圖2為本發(fā)明車載語音交互方法第一實(shí)施例的流程示意圖;
圖3為本發(fā)明車載語音交互方法第二實(shí)施例的流程示意圖;
圖4為本發(fā)明車載語音交互方法第三實(shí)施例的流程示意圖;
圖5為本發(fā)明車載語音交互方法第四實(shí)施例中所述根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能的步驟的細(xì)化流程示意圖;
圖6為本發(fā)明車載語音交互方法第五實(shí)施例中所述基于控制權(quán)限控制汽車執(zhí)行該功能的步驟的細(xì)化流程示意圖;
圖7為本發(fā)明車載語音交互方法第六實(shí)施例的流程示意圖。
具體實(shí)施方式
應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
參照?qǐng)D1和圖2,本發(fā)明所述的車載語音交互方法的設(shè)備結(jié)構(gòu)包括了汽車200和車載語音終端10。車載語音終端10可以一個(gè)完整的集成電路面板,也可以是分離式芯片模組,本發(fā)明中的車載語音終端10的硬件結(jié)構(gòu)均不作具體限定。車載語音終端10與汽車相互連接,汽車的原車專用接口和原車主機(jī)與車載語音終端控制芯片連接,原車專用接口和原車主機(jī)負(fù)責(zé)數(shù)據(jù)的輸入和輸出,控制芯片用于數(shù)據(jù)識(shí)別解析。車載語音終端10中還包括各種功能模塊,以實(shí)現(xiàn)車載語音終端的各種功能,包括但不限于以下所述:人機(jī)交互接口101、裝置控制模塊102、語音解析模塊103。其中人機(jī)交互接口101用于實(shí)現(xiàn)用戶與車載語音終端之間的連接,其中包括語音收集裝置和音頻輸入裝置,語音收集裝置可以是麥克風(fēng),或者是揚(yáng)聲器喇叭等,人機(jī)交互接口包括麥克風(fēng)接口、usb接口、aux接口、rs232接口、rj45接口、rs485接口、喇叭接口等一系列語音輸入輸出裝置或輔助裝置;裝置控制模塊102負(fù)責(zé)連接汽車上的各種功能裝置,例如汽車內(nèi)置的麥克風(fēng)、揚(yáng)聲器、空調(diào)等等;語音解析模塊103用于解析或者輔助控制芯片對(duì)語音指令的解析工作,通過內(nèi)置的軟硬件對(duì)語音指令的波段頻率等信號(hào)特征進(jìn)行高質(zhì)解析。各種功能模塊在控制芯片的控制下與汽車實(shí)現(xiàn)數(shù)據(jù)交互,而汽車通過本身的硬件裝置與車載語音終端,共同實(shí)現(xiàn)用戶的語音口令所指代的功能需求。
本發(fā)明提供一種車載語音交互方法,在車載語音交互方法第一實(shí)施例中,參照?qǐng)D2,所述車載語音交互方法包括:
步驟s10,采集用戶輸入的語音口令;
一般地,用戶在與汽車進(jìn)行語音交互的過程中,除了需要通過用戶喚醒車輛語音交互系統(tǒng)之外,也存在著會(huì)實(shí)時(shí)監(jiān)測(cè)的語音交互系統(tǒng)。在本實(shí)施例中,當(dāng)車載語音終端監(jiān)測(cè)到用戶的語音口令時(shí),采集并記錄下該語音口令。所述語音口令指的是用戶以自然語音形式發(fā)出的音頻數(shù)據(jù)。
步驟s20,根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令,以獲得對(duì)應(yīng)的語音指令;
語義數(shù)據(jù)庫是針對(duì)用戶的語音口令所開發(fā)出來的數(shù)據(jù)特征模型的集合,作為分析匹配語音口令的參考數(shù)據(jù)源。一般地,語音口令被車載語音終端以音頻數(shù)據(jù)的形式記錄下來之后,會(huì)結(jié)合到預(yù)先設(shè)置的語義數(shù)據(jù)庫,語義數(shù)據(jù)庫中存儲(chǔ)有大量的語義數(shù)據(jù)包,各自對(duì)應(yīng)著不同的語音口令。將語音口令和語音數(shù)據(jù)庫進(jìn)行數(shù)據(jù)匹配分析,即將語音口令在語義數(shù)據(jù)庫中,通過解析轉(zhuǎn)換為對(duì)應(yīng)的數(shù)據(jù)編碼,從而獲取到對(duì)應(yīng)的語音指令。
步驟s30,根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能。
獲取到的語音指令各自對(duì)應(yīng)著所要執(zhí)行的功能項(xiàng)目。在本實(shí)施例中,汽車語音指令確定之后,車載語音終端會(huì)基于該語音指令的功能需求,調(diào)動(dòng)汽車上的功能裝置,并控制功能裝置的啟動(dòng)形態(tài),以實(shí)現(xiàn)用戶的功能需求。
具體地,參照?qǐng)D1,人機(jī)交互接口101連接到汽車的原車主機(jī),負(fù)責(zé)與用戶完成交互操作,本發(fā)明采用語音交互模式,故人機(jī)交互接口101可以是麥克風(fēng),揚(yáng)聲器等設(shè)備,負(fù)責(zé)采集用戶在自然語言形式下的語音口令和輸出語音播報(bào)。控制芯片車載語音終端的核心元件,接收來自人機(jī)交互接口101的語音口令,并在語音解析模塊103的功能輔助下,對(duì)語音口令進(jìn)行高質(zhì)解析,從而獲得對(duì)應(yīng)的語音指令。該語音指令是基于語音口令生成而來,所指代的編碼信息對(duì)應(yīng)著自然語言形式下的功能需求。
例如,語音口令為“打開左轉(zhuǎn)向燈”,那么該語音口令經(jīng)過控制芯片的語音解析后,對(duì)應(yīng)的功能指令應(yīng)對(duì)應(yīng)著“左轉(zhuǎn)向燈以及左轉(zhuǎn)向燈的面板指示燈協(xié)同閃爍”,該功能指令以汽車能夠識(shí)別的數(shù)據(jù)編碼形式存在,該功能指令即為語音指令。
車載語音終端生成語音指令之后,經(jīng)由控制芯片傳送至裝置控制模塊102,裝置控制模塊102連接著與汽車的原車主機(jī)上的功能裝置,根據(jù)控制芯片的語音指令所指代的功能相應(yīng)地控制實(shí)現(xiàn)該功能所需要的功能裝置。例如,假設(shè)語音指令為“左轉(zhuǎn)向燈以及左轉(zhuǎn)向燈的面板指示燈協(xié)同閃爍”,則裝置控制模塊102需要先檢測(cè)是否連接到左轉(zhuǎn)向燈以及面板指示燈上,若已連接上,則控制其以同樣的閃爍頻率進(jìn)行閃爍。
本發(fā)明的技術(shù)方案中,首先采集用戶輸入的語音口令;然后根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令,以獲得對(duì)應(yīng)的語音指令;最后根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能。本發(fā)明使用戶可以在保障安全駕駛的前提下,實(shí)現(xiàn)與車輛語音終端的交互操作,以達(dá)到操作目的。同時(shí),本發(fā)明簡化了用戶與車載語音終端之間的交互操作,避免了繁瑣的交互操作步驟,改善了用戶的使用體驗(yàn)。
進(jìn)一步地,在本發(fā)明車載語音交互方法第一實(shí)施例的基礎(chǔ)上,提出車載語音交互方法第二實(shí)施例,參照?qǐng)D3,所述第二實(shí)施例與第一實(shí)施例之間的區(qū)別在于,所述根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令的步驟之前還包括:
步驟s40,當(dāng)基于默認(rèn)的語音數(shù)據(jù)包無法識(shí)別語音口令時(shí),提取語音口令的語音特征;
步驟s50,將語音特征與預(yù)設(shè)的方言語音數(shù)據(jù)包進(jìn)行特征比對(duì),獲取符合語音特征的目標(biāo)語音數(shù)據(jù)包;
步驟s60,基于目標(biāo)語音數(shù)據(jù)包識(shí)別語音口令。
本實(shí)施例中默認(rèn)的語音數(shù)據(jù)包是普通話數(shù)據(jù)包,假設(shè)用戶不會(huì)講述普通話,而只會(huì)具有地方特色的方言;或者用戶的自然語言中同時(shí)夾雜著普通話與方言,由于車載語音終端普通話數(shù)據(jù)包無法與方言口令進(jìn)行數(shù)據(jù)匹配,因此會(huì)產(chǎn)生無法識(shí)別語音口令的情況。此時(shí)將無法識(shí)別的語音口令中的語音特征提取出來,作為特征比對(duì)的參考數(shù)據(jù)。所述語音特征,指的是語音口令中語音語調(diào),發(fā)音平仄,聲律形式等特征信息。將所述特征信息集合模擬出相應(yīng)的特征模型,并與預(yù)設(shè)的方言語音數(shù)據(jù)包進(jìn)行特征對(duì)比。所述方言語音數(shù)據(jù)包可以是車載語音終端預(yù)設(shè)的,也可以是用戶自行下載應(yīng)用的語音數(shù)據(jù)包。通過與方言語音數(shù)據(jù)包進(jìn)行特征對(duì)比,查詢出符合該語音特征的目標(biāo)語音數(shù)據(jù)包。所述目標(biāo)語音數(shù)據(jù)包指的是與用戶方言語音口令的語音特征相符合的方言語音數(shù)據(jù)包。應(yīng)用目標(biāo)語音數(shù)據(jù)包所包含的方言語音數(shù)據(jù)庫,結(jié)合原先未能正確識(shí)別的語音口令,重新進(jìn)行語音識(shí)別,以解析出語音口令的語義。
進(jìn)一步地,在本發(fā)明車載語音交互方法第二實(shí)施例的基礎(chǔ)上,提出車載語音交互方法第三實(shí)施例,參照?qǐng)D4,所述第三實(shí)施例與第二實(shí)施例之間的區(qū)別在于,所述根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能步驟之前還包括:
步驟s70,當(dāng)檢測(cè)到語音指令所指代的功能與當(dāng)前的使用場(chǎng)景相違背時(shí),提示用戶進(jìn)行語音確認(rèn)操作。
用戶的語音指令本身可能存在與當(dāng)前的使用場(chǎng)景不符或者矛盾的功能需求。例如,當(dāng)前汽車啟動(dòng)了低溫制冷模式的空調(diào)功能,證明當(dāng)前用戶對(duì)汽車內(nèi)的溫度不滿,功能需求為降低汽車室內(nèi)溫度。假設(shè)此時(shí)用戶通過語音交互發(fā)出“啟動(dòng)空調(diào)的制熱模式功能”的語音指令,車載語音終端檢測(cè)到該語音指令是啟動(dòng)空調(diào)制熱模式,而當(dāng)前汽車的使用場(chǎng)景為正執(zhí)行空調(diào)制冷模式,用戶的語音指令與當(dāng)前的使用場(chǎng)景代表著不同的相互矛盾的功能需求。此時(shí),車載語音終端會(huì)通過揚(yáng)聲器或喇叭提示用戶進(jìn)行語音確認(rèn)操作,以進(jìn)一步明確用戶真正的功能需求,確定語音指令的正確性。
進(jìn)一步地,在本發(fā)明車載語音交互方法第三實(shí)施例的基礎(chǔ)上,提出車載語音交互方法第四實(shí)施例,參照?qǐng)D5,所述第四實(shí)施例與第三實(shí)施例之間的區(qū)別在于,所述根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能的步驟包括:
步驟s31,根據(jù)語音指令所指代的功能,獲取執(zhí)行該功能的控制權(quán)限;
步驟s32,基于控制權(quán)限控制汽車執(zhí)行該功能。
參照?qǐng)D1,控制功能裝置實(shí)現(xiàn)對(duì)應(yīng)功能需求需要首先需要取得預(yù)執(zhí)行功能的權(quán)限允許。由于車載語音終端本質(zhì)上屬于駕駛輔助裝置,無法直接參與到汽車正常功能的執(zhí)行過程中。因此車載語音終端需要得到汽車的控制權(quán)限才能響應(yīng)用戶語音指令的功能。只有獲得功能執(zhí)行的控制權(quán)限,車載語音終端才能正常地控制汽車的功能部件,否則,即使車載語音終端能解析出語音指令所要執(zhí)行的功能,也無法真正實(shí)現(xiàn)該功能。
例如,用戶通過語音交互發(fā)出“打開雨刮器”的語音指令,該語音指令所要執(zhí)行的是啟動(dòng)雨刮器。正常情況下,雨刮器的啟動(dòng)是通過用戶手動(dòng)操作雨刮器的觸發(fā)控件實(shí)現(xiàn)的。而在本實(shí)施例中,車載語音終端要想控制該雨刮器,首先必須連接到雨刮器的觸發(fā)控件上。車載語音終端查詢
是否獲取到雨刮器的控制權(quán)限(即是否連接上雨刮器的專用線束)。假設(shè)車載語音終端能夠正常地獲取到雨刮器的控制權(quán)限,則基于該控制權(quán)限控制雨刮器的啟動(dòng)狀態(tài),從而實(shí)現(xiàn)語音指令所指代的“打開雨刮器”的功能。
進(jìn)一步地,在本發(fā)明車載語音交互方法第四實(shí)施例的基礎(chǔ)上,提出車載語音交互方法第五實(shí)施例,參照?qǐng)D6,所述第五實(shí)施例與第四實(shí)施例之間的區(qū)別在于,所述基于控制權(quán)限控制汽車執(zhí)行該功能的步驟包括:
步驟s321,當(dāng)檢測(cè)到控制權(quán)限不足和/或控制權(quán)限獲取失敗時(shí),向用戶發(fā)出最高控制權(quán)限請(qǐng)求;
步驟s322,當(dāng)檢測(cè)到用戶基于最高權(quán)限請(qǐng)求的確認(rèn)指令時(shí),獲取汽車的最高控制權(quán)限;
步驟s323,基于最高控制權(quán)限控制汽車執(zhí)行語音指令所指代的功能。
在車載語音終端控制汽車執(zhí)行對(duì)應(yīng)功能的過程中,可能會(huì)存在控制權(quán)限不足以執(zhí)行對(duì)應(yīng)功能的情況;或者控制權(quán)限被占用或被禁用導(dǎo)致獲取權(quán)限失敗的情況。若發(fā)生上述狀況,為實(shí)現(xiàn)語音指令的功能需求,車載語音終端需要向用戶發(fā)出最高控制權(quán)限請(qǐng)求。向用戶發(fā)出最高控制權(quán)限請(qǐng)求,一方面是為了征求用戶的意向,以得到用戶的認(rèn)可;另一方面是為了從最高控制權(quán)限的角度出發(fā),避免出現(xiàn)權(quán)限不足導(dǎo)致無法執(zhí)行對(duì)應(yīng)功能的現(xiàn)象發(fā)生。
當(dāng)用戶認(rèn)可了車載語音終端獲取最高控制權(quán)限的請(qǐng)求,可通過語音交互的方式發(fā)出確認(rèn)請(qǐng)求的確認(rèn)指令,而車載語音終端基于該確認(rèn)指令,獲取汽車的最高控制權(quán)限。由于經(jīng)過了用戶的確認(rèn)指令,車載語音終端在獲取最高控制權(quán)限不會(huì)出現(xiàn)獲取失敗的情況,而一旦獲取到最高控制權(quán)限,就不會(huì)出現(xiàn)權(quán)限不足的現(xiàn)象,從而正常執(zhí)行語音指令所指代的功能。
進(jìn)一步地,在本發(fā)明車載語音交互方法第五實(shí)施例的基礎(chǔ)上,提出車載語音交互方法第六實(shí)施例,參照?qǐng)D7,所述第六實(shí)施例與第五實(shí)施例之間的區(qū)別在于,所述車載語音交互方法還包括:
步驟s80,當(dāng)汽車無法正常執(zhí)行語音指令對(duì)應(yīng)的功能時(shí),將該語音指令和本次執(zhí)行信息發(fā)送至后臺(tái)服務(wù)器進(jìn)行數(shù)據(jù)分析;
步驟s90,在接收后臺(tái)服務(wù)器基于語音指令和本次執(zhí)行信息的分析后獲取的異常結(jié)果后,根據(jù)異常結(jié)果執(zhí)行相應(yīng)的功能。
若汽車無法正常執(zhí)行語音指令對(duì)應(yīng)的功能,則證明當(dāng)前汽車在執(zhí)行其功能的時(shí)候遇到了異常事項(xiàng),比如汽車執(zhí)行其功能所依托的硬件設(shè)備出現(xiàn)故障或者語音指令所指代的功能違反了預(yù)設(shè)的汽車使用規(guī)定。此時(shí),出于對(duì)用戶體驗(yàn)和汽車安全的保障,需要將語音指令和本次的異常執(zhí)行信息發(fā)送到后臺(tái)服務(wù)器進(jìn)行數(shù)據(jù)分析,該步驟是為分析語音指令是否出現(xiàn)分析錯(cuò)誤和汽車無法正常執(zhí)行功能的原因,從而保障用戶體驗(yàn)和汽車安全。
后臺(tái)服務(wù)器對(duì)汽車發(fā)送的信息進(jìn)行分析后獲得對(duì)應(yīng)的分析結(jié)果,汽車接收該分析結(jié)果,并根據(jù)分析結(jié)果進(jìn)行對(duì)應(yīng)的處理,其處理過程可以包括重新執(zhí)行原來的功能或進(jìn)行故障反饋。
以下將通過舉例進(jìn)行解釋說明:
假設(shè)語音指令為“打開車艙后蓋”,在汽車正常行車狀態(tài)中,車艙后蓋是不能打開的,因?yàn)闀?huì)影響到正常的駕駛安全。故汽車無法正常執(zhí)行語音指令對(duì)應(yīng)的功能。此時(shí),汽車將該條語音指令以及本次執(zhí)行信息發(fā)送到后臺(tái)服務(wù)器進(jìn)行數(shù)據(jù)分析。后臺(tái)服務(wù)器根據(jù)本次執(zhí)行信息分析出無法正常執(zhí)行的緣由,從而返回一個(gè)提示信息,而車載語音終端接收該提示信息,通過揚(yáng)聲器向用戶進(jìn)行語音提示,告知該分析結(jié)果;或者語音指令為“打開霧燈”,而當(dāng)前霧燈裝置出現(xiàn)損壞無法正常控制,汽車會(huì)將語音指令以及霧燈裝置損壞的信息發(fā)送至后臺(tái)服務(wù)器,后臺(tái)服務(wù)器對(duì)其進(jìn)行數(shù)據(jù)分析后返回一個(gè)分析結(jié)果,告知用戶功能執(zhí)行異常的緣由,并提示用戶到對(duì)應(yīng)的維修部門進(jìn)行維修,以保障用戶體驗(yàn)和/或汽車的安全。
進(jìn)一步地,在本發(fā)明車載語音交互方法第六實(shí)施例的基礎(chǔ)上,提出車載語音交互方法第七實(shí)施例,所述第七實(shí)施例與第六實(shí)施例之間的區(qū)別在于,所述車載語音交互方法還包括:
在汽車基于語音指令執(zhí)行對(duì)應(yīng)的功能之后,當(dāng)接收到用戶針對(duì)該功能的糾錯(cuò)指令時(shí),更新該語音指令對(duì)應(yīng)的語義分析的數(shù)據(jù)庫。
在車輛語音交互終端基于語音指令執(zhí)行對(duì)應(yīng)的功能時(shí),若當(dāng)前執(zhí)行的功能不符合或違背了用戶的需求,用戶可通過糾錯(cuò)操作輸入糾錯(cuò)指令,該糾錯(cuò)操作可以是通過語音控制,也可以是基于感應(yīng)裝置的手動(dòng)控制等方式。糾錯(cuò)指令是對(duì)當(dāng)前汽車所執(zhí)行的功能的重新映射。由于當(dāng)前汽車所執(zhí)行的功能是基于上一次語音指令而執(zhí)行的,本次糾錯(cuò)指令是針對(duì)車輛語音終端對(duì)語音指令語義上的錯(cuò)誤分析進(jìn)行的糾正。例如上一次語音指令為“打開車燈”,當(dāng)前汽車所執(zhí)行的功能為啟動(dòng)霧燈裝置,即車載語音終端將“車燈”分析為“霧燈”,而在用戶的正常使用習(xí)慣中,“車燈”本身代表著遠(yuǎn)光燈,“打開車燈”的語義為“打開遠(yuǎn)光燈”。此時(shí),根據(jù)用戶對(duì)當(dāng)前所執(zhí)行的功能的糾錯(cuò),車載語音終端將在語義分析的數(shù)據(jù)庫中將“車燈”這一語音指令映射為“遠(yuǎn)光燈”這一信息。通過用戶的糾錯(cuò)指令,車載語音終端能夠完善車載語音終端對(duì)語音指令的語義分析機(jī)制,提高語義分析的精確度,以便貼合用戶的語言習(xí)慣,提高車載語音終端的工作效率,從而強(qiáng)化車載語音終端的智能化程度。
進(jìn)一步地,在本發(fā)明車載語音交互方法第七實(shí)施例的基礎(chǔ)上,提出車載語音交互方法第八實(shí)施例,所述第八實(shí)施例與第七實(shí)施例之間的區(qū)別在于,所述車載語音交互方法還包括:
當(dāng)檢測(cè)到用戶基于語義數(shù)據(jù)庫的更新操作時(shí),更新語義數(shù)據(jù)庫。
車載語音終端將用戶口令轉(zhuǎn)化為語音指令的過程,很大程度依托于語義數(shù)據(jù)庫的語義分析的功能支持。但現(xiàn)如今自然語言的形式不夠嚴(yán)謹(jǐn),不僅僅存在方言分歧,還存在語氣分歧,舊詞匯新涵義的分歧等等現(xiàn)象。因此車載語音終端需要保持對(duì)語義數(shù)據(jù)庫的數(shù)據(jù)更新。該更新操作可以由用戶指定更新,例如用戶在進(jìn)行語音交互中發(fā)現(xiàn)車載語音終端的語義分析頻繁出錯(cuò),或者用戶發(fā)現(xiàn)了新的詞匯涵義,通過手動(dòng)或語音交互的方式向車載語音終端發(fā)出更新語義數(shù)據(jù)庫的語音操作,從而通過互聯(lián)網(wǎng)或者數(shù)據(jù)包導(dǎo)入的方式實(shí)現(xiàn)語義數(shù)據(jù)庫的更新。
參照?qǐng)D4,圖4是本發(fā)明實(shí)施例方法涉及的硬件運(yùn)行環(huán)境的設(shè)備結(jié)構(gòu)示意圖。
車載語音終端可以以各種形式來實(shí)施。例如,本發(fā)明中描述的車載語音終端可以是包括諸如移動(dòng)電話、智能電話、筆記本電腦、數(shù)字廣播接收器、pda(個(gè)人數(shù)字助理)、pad(平板電腦)、pmp(便攜式多媒體播放器)等等終端以及諸如數(shù)字tv、微型臺(tái)式計(jì)算機(jī)等等的固定終端。然而,本領(lǐng)域技術(shù)人員將理解的是,除了特別用于移動(dòng)目的的元件之外,根據(jù)本發(fā)明的實(shí)施方式的構(gòu)造也能夠應(yīng)用于固定類型的終端。
作為一種計(jì)算機(jī)存儲(chǔ)介質(zhì)的存儲(chǔ)器中可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊以及車載語音交互程序。操作系統(tǒng)是管理和控制車載語音交互系統(tǒng)硬件和軟件資源的程序,支持車載語音交互程序以及其它軟件和/或程序的運(yùn)行。網(wǎng)絡(luò)通信模塊用于實(shí)現(xiàn)存儲(chǔ)器內(nèi)部各組件之間的通信,以及與車載語音交互系統(tǒng)中其它硬件和軟件之間通信。
本領(lǐng)域技術(shù)人員可以理解,圖1中示出的車載語音終端結(jié)構(gòu)并不構(gòu)成對(duì)車載語音終端的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
在圖1所示的車載語音交互系統(tǒng)中,人機(jī)交互接口101主要用于連接用戶與車載語音終端之間通信;車載語音交互系統(tǒng)包括:存儲(chǔ)器、處理器,通信總線以及存儲(chǔ)在所述存儲(chǔ)器上的車載語音交互程序,
采集用戶輸入的語音口令;
根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令,以獲得對(duì)應(yīng)的語音指令;
根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能。
優(yōu)選地,所述根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令的步驟之前還包括:
當(dāng)基于默認(rèn)的語音數(shù)據(jù)包無法識(shí)別語音口令時(shí),提取語音口令的語音特征;
將語音特征與預(yù)設(shè)的方言語音數(shù)據(jù)包進(jìn)行特征比對(duì),獲取符合語音特征的目標(biāo)語音數(shù)據(jù)包;
基于目標(biāo)語音數(shù)據(jù)包識(shí)別語音口令。
優(yōu)選地,所述根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能步驟之前還包括:
當(dāng)檢測(cè)到語音指令所指代的功能與當(dāng)前的使用場(chǎng)景相違背時(shí),提示用戶進(jìn)行語音確認(rèn)操作。
優(yōu)選地,所述根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能的步驟包括:
根據(jù)語音指令所指代的功能,獲取執(zhí)行該功能的控制權(quán)限;
基于控制權(quán)限控制汽車執(zhí)行該功能。
優(yōu)選地,所述基于控制權(quán)限控制汽車執(zhí)行該功能的步驟包括:
當(dāng)檢測(cè)到控制權(quán)限不足和/或控制權(quán)限獲取失敗時(shí),向用戶發(fā)出最高控制權(quán)限請(qǐng)求;
當(dāng)檢測(cè)到用戶基于最高權(quán)限請(qǐng)求的確認(rèn)指令時(shí),獲取汽車的最高控制權(quán)限;
基于最高控制權(quán)限控制汽車執(zhí)行語音指令所指代的功能。
優(yōu)選地,所述車載語音交互方法還包括:
當(dāng)汽車無法正常執(zhí)行語音指令對(duì)應(yīng)的功能時(shí),將該語音指令和本次執(zhí)行信息發(fā)送至后臺(tái)服務(wù)器進(jìn)行數(shù)據(jù)分析;
在接收后臺(tái)服務(wù)器基于語音指令和本次執(zhí)行信息的分析后獲取的異常結(jié)果后,根據(jù)異常結(jié)果執(zhí)行相應(yīng)的功能。
優(yōu)選地,所述車載語音交互方法還包括:
在汽車基于語音指令執(zhí)行對(duì)應(yīng)的功能之后,當(dāng)接收到用戶針對(duì)該功能的糾錯(cuò)指令時(shí),更新該語音指令對(duì)應(yīng)的語義分析的數(shù)據(jù)庫。
優(yōu)選地,所述車載語音交互方法還包括:
當(dāng)檢測(cè)到用戶基于語義數(shù)據(jù)庫的更新操作時(shí),更新語義數(shù)據(jù)庫。
本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有一個(gè)或者一個(gè)以上程序,所述一個(gè)或者一個(gè)以上程序還可被一個(gè)或者一個(gè)以上的處理器執(zhí)行以用于:
采集用戶輸入的語音口令;
根據(jù)預(yù)設(shè)的語義數(shù)據(jù)庫,分析語音口令,以獲得對(duì)應(yīng)的語音指令;
根據(jù)語音指令,控制汽車執(zhí)行語音指令所指代的功能。
本發(fā)明計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)具體實(shí)施方式與上述車載語音交互方法、終端及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)各實(shí)施例基本相同,在此不再贅述。
需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。
上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例方法可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如rom/ram、磁碟、光盤)中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),服務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
以上僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。