圖像處理設(shè)備、其控制方法、以及圖像處理系統(tǒng)的制作方法
【專利摘要】一種圖像處理設(shè)備、其控制方法、以及圖像處理系統(tǒng),圖像處理設(shè)備包括:圖像處理器;音頻輸入;存儲器,存儲至少一個簡單句子語音命令和與該簡單句子語音命令相應(yīng)的操作;通信裝置,與服務(wù)器通信,服務(wù)器分析描述性句子語音命令,并確定與該描述性句子語音命令相應(yīng)的操作;音頻處理器,如果與言語相應(yīng)的第一語音命令是簡單句子語音命令,則處理第一語音命令,并進(jìn)行與簡單句子語音命令相應(yīng)的操作,如果第一語音命令不是簡單句子語音命令,則將第一語音命令發(fā)送到通信裝置;控制器,如果服務(wù)器確定的關(guān)于第一語音命令的相應(yīng)操作與存儲在存儲器中的至少一個簡單句子語音命令之一相同,則顯示推薦存儲在存儲器中的簡單句子語音命令的第一向?qū)D像。
【專利說明】圖像處理設(shè)備、其控制方法、以及圖像處理系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]與示例性實施例一致的設(shè)備和方法涉及一種對圖像信號(包括從外部源接收的廣播信號)進(jìn)行處理以顯示圖像的圖像處理設(shè)備、該圖像處理設(shè)備的控制方法、以及圖像處理系統(tǒng),更具體地講,涉及一種感知用戶的言語并執(zhí)行與該言語相應(yīng)的功能或操作的圖像處理設(shè)備、該圖像處理設(shè)備的控制方法、以及圖像處理系統(tǒng)。
【背景技術(shù)】
[0002]圖像處理設(shè)備根據(jù)各種類型的圖像處理過程對從外部源接收的圖像信號或圖像數(shù)據(jù)進(jìn)行處理。圖像處理設(shè)備可在它自己的顯示面板上基于所處理的圖像信號顯示圖像,或者將所處理的圖像信號輸出到包括面板的顯示設(shè)備以基于圖像信號顯示圖像。也就是說,圖像處理設(shè)備可包括對圖像信號進(jìn)行處理的任何裝置,而不管它是否包括用于顯示圖像的面板。具有顯示面板的圖像處理設(shè)備的示例是電視(TV),而不具有顯示面板的圖像處理設(shè)備的示例是機(jī)頂盒。
[0003]隨著各種附加的擴(kuò)展功能隨技術(shù)發(fā)展而被連續(xù)地添加到圖像處理設(shè)備,將用戶的期望命令輸入到圖像處理設(shè)備的多種多樣的構(gòu)造和方法被相應(yīng)地提出。在現(xiàn)有技術(shù)中,當(dāng)用戶按下遙控器上的按鍵或按鈕時,遙控器將控制信號發(fā)送到圖像處理設(shè)備,以使得用戶的期望操作被執(zhí)行。目前,提出了基于用戶的期望對圖像處理設(shè)備進(jìn)行控制的各種構(gòu)造。例如,圖像處理設(shè)備檢測用戶的運動或語音,并對所檢測的數(shù)據(jù)進(jìn)行分析以執(zhí)行相關(guān)操作。
【發(fā)明內(nèi)容】
[0004]前述和/或其他方面可通過提供一種圖像處理設(shè)備來實現(xiàn),該圖像處理設(shè)備包括:圖像處理器,被構(gòu)造為對圖像信號進(jìn)行處理以顯示圖像;音頻輸入,被構(gòu)造為輸入用戶的言語;存儲器,被構(gòu)造為存儲至少一個簡單句子語音命令和與該簡單句子語音命令相應(yīng)的操作;通信裝置,被構(gòu)造為與服務(wù)器通信,其中,服務(wù)器對描述性句子語音命令進(jìn)行分析,并確定與該描述句子語音命令相應(yīng)的操作;音頻處理器,被構(gòu)造為:如果與所述言語相應(yīng)的第一語音命令是存儲在存儲器中的簡單句子語音命令,則對第一語音命令進(jìn)行處理以進(jìn)行存儲在存儲器中的與所述簡單句子語音命令相應(yīng)的操作,并且如果第一語音命令不是存儲在存儲器中的簡單句子語音命令,則將第一語音命令發(fā)送到通信裝置;以及控制器,被構(gòu)造為:如果服務(wù)器所確定的相應(yīng)操作是存儲在存儲器中的相應(yīng)操作,則顯示推薦存儲在存儲器中的與相應(yīng)操作相應(yīng)的簡單句子語音命令的向?qū)D像。
[0005]根據(jù)示例性實施例,存儲器可存儲簡單句子語音命令和相應(yīng)操作的列表,并且音頻處理器可檢索關(guān)于第一語音命令是否在該列表中的信息,如果沒有從該列表檢索到第一語音命令,則將第一語音命令發(fā)送到通信裝置。
[0006]根據(jù)示例性實施例的另一方面,控制器可根據(jù)從服務(wù)器基于第一語音命令發(fā)送的控制命令來確定與第一語音命令相應(yīng)的操作。
[0007]根據(jù)示例性實施例的另一方面,當(dāng)?shù)谝徽Z音命令是簡單句子語音命令時,當(dāng)言語被輸入到音頻輸入時的時刻到當(dāng)相應(yīng)操作被執(zhí)行時的時刻的時間可比當(dāng)?shù)谝徽Z音命令不是簡單句子語音命令時的所述時間更短。
[0008]根據(jù)示例性實施例,在預(yù)設(shè)的相應(yīng)操作設(shè)置為當(dāng)分別與多個言語相應(yīng)的多個語音命令被順序地輸入時執(zhí)行或者當(dāng)預(yù)設(shè)的第二語音命令被輸入時執(zhí)行的狀態(tài)下,當(dāng)所述多個語音命令被順序地輸入時,控制器可顯示推薦第二語音命令的向?qū)D像。
[0009]根據(jù)示例性實施例的另一方面,當(dāng)言語被輸入到音頻輸入時,通信裝置可與用于將言語轉(zhuǎn)換為文本的語音命令的言語到文本(STT)服務(wù)器通信,并且控制器可將該言語的音頻信號發(fā)送到STT服務(wù)器,并從STT服務(wù)器接收與該言語相應(yīng)的語音命令。
[0010]根據(jù)示例性實施例的一方面,圖像處理設(shè)備還可包括:顯示器,將由圖像處理器處理的圖像信號顯示為圖像。
[0011]根據(jù)示例性實施例的另一方面,提供一種圖像處理設(shè)備的控制方法,該方法包括:輸入用戶的言語;當(dāng)與該言語相應(yīng)的第一語音命令是存儲在圖像處理器中的簡單句子語音命令時,執(zhí)行存儲在圖像處理設(shè)備中的與該簡單句子語音命令相應(yīng)的操作;并且如果與該言語相應(yīng)的第一語音命令不是存儲在圖像處理器中的簡單句子語音命令,則將第一語音命令發(fā)送到服務(wù)器,其中,服務(wù)器對描述性句子語音命令進(jìn)行分析,并確定與該描述句子語音命令相應(yīng)的操作,如果服務(wù)器所確定的相應(yīng)操作是存儲在圖像處理設(shè)備中的相應(yīng)操作,則顯示推薦與該相應(yīng)操作相應(yīng)的簡單句子語音命令的向?qū)D像。
[0012]根據(jù)示例性實施例的另一方面,圖像處理設(shè)備可存儲簡單句子語音命令和相應(yīng)操作的列表,并且將第一語音命令發(fā)送到服務(wù)器的步驟包括:如果沒有從該列表檢索到第一語音命令,則發(fā)送第一語音命令。
[0013]根據(jù)示例性實施例的一方面,顯示推薦與相應(yīng)操作相應(yīng)的簡單句子語音命令的向?qū)D像的步驟可包括根據(jù)從服務(wù)器基于第一語音命令發(fā)送的控制命令來確定與第一語音命令相應(yīng)的操作。
[0014]根據(jù)示例性實施例的一方面,當(dāng)?shù)谝徽Z音命令是簡單句子語音命令時,從當(dāng)言語被輸入到音頻輸入時的時刻到當(dāng)相應(yīng)操作被執(zhí)行時的時刻的時間可比當(dāng)?shù)谝徽Z音命令不是簡單句子語音命令時的所述時間更短。
[0015]根據(jù)示例性實施例的一方面,顯示推薦與相應(yīng)操作相應(yīng)的簡單句子語音命令的向?qū)D像的步驟可包括:在預(yù)設(shè)的相應(yīng)操作被設(shè)置為當(dāng)分別與多個言語相應(yīng)的多個語音命令被順序地輸入時或者當(dāng)預(yù)設(shè)的第二語音命令被輸入時執(zhí)行的狀態(tài)下,當(dāng)所述多個語音命令被順序地輸入時,顯示推薦第二語音命令的向?qū)D像。
[0016]輸入用戶的言語的步驟可包括:將該言語的音頻信號發(fā)送到言語到文本(STT)服務(wù)器以將該言語轉(zhuǎn)換為文本的語音命令,并從STT服務(wù)器接收與該言語相應(yīng)的語音命令。
[0017]根據(jù)示例性實施例的另一方面,提供一種圖像處理系統(tǒng),該圖像處理系統(tǒng)包括:圖像處理設(shè)備,被構(gòu)造為對圖像信號進(jìn)行處理以顯示圖像;以及服務(wù)器,被構(gòu)造為與圖像處理設(shè)備通信,其中,圖像處理設(shè)備包括:音頻輸入,被構(gòu)造為輸入用戶的言語;存儲器,被構(gòu)造為存儲至少一個簡單句子語音命令和與該簡單句子語音命令相應(yīng)的操作;通信裝置,被構(gòu)造為與服務(wù)器通信,其中,服務(wù)器對描述性句子語音命令進(jìn)行分析,并確定與該描述性句子語音命令相應(yīng)的操作;音頻處理器,被構(gòu)造為如果與所述言語相應(yīng)的第一語音命令是存儲在存儲器中的簡單句子語音命令,則對第一語音命令進(jìn)行處理以進(jìn)行存儲在存儲器中的與該簡單句子語音命令相應(yīng)的操作,并且被構(gòu)造為如果第一語音命令不是存儲在存儲器中的簡單句子語音命令,則將第一語音命令發(fā)送到通信裝置;以及控制器,被構(gòu)造為如果服務(wù)器所確定的相應(yīng)操作是存儲在存儲器中的相應(yīng)操作,則顯示推薦存儲在存儲器中的與相應(yīng)操作相應(yīng)的簡單句子語音命令的向?qū)D像。
[0018]根據(jù)示例性實施例的另一方面,提供一種圖像處理設(shè)備,該圖像處理設(shè)備包括:顯示器;音頻輸入,被構(gòu)造為輸入用戶的言語;以及控制器,被構(gòu)造為如果與所述言語相應(yīng)的語音命令是簡單句子的第一語音命令和描述性句子的第二語音命令中的任何一個,則執(zhí)行預(yù)設(shè)的第一操作,其中,如果語音命令是第二語音命令,則控制器在顯示器上顯示推薦第一語音命令的向?qū)D像。
【專利附圖】
【附圖說明】
[0019]從以下結(jié)合附圖對示例性實施例進(jìn)行的描述,以上和/其他方面將變得明白并且更易于理解,其中:
[0020]圖1是示出根據(jù)第一示例性實施例的圖像處理設(shè)備的構(gòu)造的框圖。
[0021]圖2是示出圖1的顯示設(shè)備與服務(wù)器之間的交互的框圖。
[0022]圖3示出存儲在圖1的顯示設(shè)備中的與語音命令相應(yīng)的操作的列表。
[0023]圖4是示出圖1的顯示設(shè)備的控制方法的流程圖。
[0024]圖5示出圖1的顯示設(shè)備和交互服務(wù)器的控制過程。
[0025]圖6示出顯示在圖1的顯示設(shè)備上的向?qū)D像。
[0026]圖7示出根據(jù)第二示例性實施例的顯示在顯示設(shè)備上的向?qū)D像。
[0027]圖8是示出根據(jù)第三示例性實施例的顯示設(shè)備和服務(wù)器的構(gòu)造的框圖。
[0028]圖9是示出根據(jù)第四示例性實施例的顯示設(shè)備的音頻處理器的信號傳輸結(jié)構(gòu)的框圖。
【具體實施方式】
[0029]以下,將參照附圖詳細(xì)描述示例性實施例,以便被本領(lǐng)域的普通技術(shù)人員容易地認(rèn)識。示例性實施例可以以各種形式實施,而不限于在此所闡述的示例性實施例。為了清晰和簡潔,省去公知部分的描述,并且相似的標(biāo)號始終指示相似的元件。
[0030]圖1是示出根據(jù)第一示例性實施例的圖像處理設(shè)備100的構(gòu)造的框圖。
[0031]盡管將用自主地顯示圖像的顯示設(shè)備100示出本示例性實施例,但是不限于以下描述,本示例性實施例還可應(yīng)用于不自主地顯示圖像,而是將圖像信號或控制信號輸出到單獨的顯示設(shè)備的圖像處理設(shè)備。在本示例性實施例中,圖像處理設(shè)備100被構(gòu)造為TV,但是由于相同的原因,也可采用各種修改和改變。
[0032]如圖1所示,根據(jù)本示例性實施例的圖像處理設(shè)備100或顯示設(shè)備100從圖像源(未顯示)接收圖像信號。顯示設(shè)備100可接收不限于特定類型或特定特性的任何圖像信號。例如,顯示設(shè)備100可接收從廣播站的發(fā)射機(jī)(未顯示)發(fā)射的廣播信號,并對該廣播信號進(jìn)行調(diào)諧以顯示廣播圖像。
[0033]顯示設(shè)備100包括:圖像接收器110,從圖像源(未顯示)接收圖像信號;圖像處理器120,根據(jù)預(yù)設(shè)的圖像處理過程對圖像接收器110接收的圖像信號進(jìn)行處理;顯示器130,基于由圖像處理器120處理的圖像信號顯示圖像;通信裝置140,與外部裝置(諸如服務(wù)器10)通信;用戶輸入150,被用戶操縱;音頻輸入160,從外部源輸入語音或聲音;音頻處理器170,對輸入到音頻輸入160的語音或聲音進(jìn)行解釋和處理;存儲器180,存儲數(shù)據(jù)或信息;以及控制器190,控制顯示設(shè)備100的整體操作。
[0034]圖像接收器110通過電纜或無線地接收圖像信號或圖像數(shù)據(jù),并將該圖像信號或圖像數(shù)據(jù)發(fā)送到圖像處理器120。圖像接收器110可被構(gòu)造為與圖像信號的標(biāo)準(zhǔn)和顯示設(shè)備100的構(gòu)造相應(yīng)的各種類型。例如,圖像接收器110可根據(jù)復(fù)合視頻、分量視頻、超視頻、SCART、高清晰度多媒體接口(HDMI)、DisplayPort,、統(tǒng)一顯示接口(UDI)或無線HD標(biāo)準(zhǔn),接收射頻(RF)信號或各種圖像信號。當(dāng)圖像信號是廣播信號時,圖像接收器110包括通過每個信道對廣播信號進(jìn)行調(diào)諧的調(diào)諧器。
[0035]圖像處理器120對圖像接收器110接收的圖像信號執(zhí)行各種圖像處理過程。圖像處理器120將所處理的圖像信號輸出到顯示面板130,以使得基于圖像信號的圖像顯示在顯示面板130上。例如,當(dāng)圖像接收器110將廣播信號調(diào)諧到特定信道時,圖像處理器120從廣播信號提取與該信道相應(yīng)的圖像、音頻和可選數(shù)據(jù),將該數(shù)據(jù)調(diào)整到預(yù)設(shè)分辨率,并在顯示器130上顯示該數(shù)據(jù)。
[0036]圖像處理器120可執(zhí)行任何類型的圖像處理,例如,與圖像數(shù)據(jù)的圖像格式相應(yīng)的解碼、將交織的圖像數(shù)據(jù)轉(zhuǎn)換為逐行格式的去交織、將圖像數(shù)據(jù)調(diào)整為預(yù)設(shè)分辨率的縮放、改進(jìn)圖像質(zhì)量的降噪、細(xì)節(jié)增強(qiáng)、幀刷新速率轉(zhuǎn)換等。
[0037]圖像處理器120可被提供為集成多功能組件(諸如片上系統(tǒng)(S0C)),或者可被提供為通過將獨立地進(jìn)行單個處理的單獨組件安裝在印刷電路板上而形成的并且被嵌入在顯示設(shè)備100中的圖像處理器板(未顯示)。
[0038]顯示器130基于從圖像處理器120輸出的圖像信號顯示圖像。顯示器130可被構(gòu)造為使用液晶、等離子體、發(fā)光二極管、有機(jī)發(fā)光二極管、表面?zhèn)鲗?dǎo)電子發(fā)射器、納米碳管、納米晶體等的各種顯示模式,但不限于此。
[0039]根據(jù)顯示器130的顯示模式,顯示器130還可包括附加的組件。例如,當(dāng)處于使用液晶的顯示模式時,顯示器130包括液晶顯示面板(未顯示)、將光提供給顯示面板的背光單元(未顯示)以及驅(qū)動面板的面板驅(qū)動板(未顯示)。
[0040]通信裝置140執(zhí)行數(shù)據(jù)發(fā)送或接收,以使得顯示設(shè)備100與服務(wù)器10進(jìn)行雙向通信。通信裝置140通過電纜或者通過廣域網(wǎng)(WAN)或局域網(wǎng)(LAN)無線地或者在基于服務(wù)器10的通信協(xié)議的本地連接模式下與服務(wù)器10連接。
[0041]用戶輸入150通過用戶的操縱和輸入將各種預(yù)設(shè)的控制命令或信息發(fā)送到控制器190。用戶輸入150可被提供為菜單按鍵或安裝在顯示設(shè)備100外部的輸入面板,或者可被提供為與顯示設(shè)備100分離的遙控器??商鎿Q地,用戶輸入150可被構(gòu)造為具有顯示器130的單體。當(dāng)顯示器130是觸摸屏?xí)r,用戶可通過觸摸顯示在顯示器130上的輸入菜單(未顯示)來將預(yù)設(shè)命令發(fā)送到控制器190。
[0042]音頻輸入160可被構(gòu)造為麥克風(fēng),并且檢測在顯示設(shè)備100的外部環(huán)境下產(chǎn)生的各種聲音。由音頻輸入160檢測到的聲音包括用戶的言語和除了用戶之外的各種因素產(chǎn)生
的聲音。
[0043]音頻處理器170執(zhí)行顯示設(shè)備100所進(jìn)行的各種預(yù)設(shè)處理之中的對于輸入到音頻輸入160的語音或聲音的處理。這里,由音頻處理器170處理的術(shù)語“語音”是指輸入到音頻輸入160的任何聲音。當(dāng)圖像處理器120對圖像信號進(jìn)行處理時,圖像信號可包括由圖像處理器120處理的音頻數(shù)據(jù)。
[0044]當(dāng)語音或聲音被輸入到音頻輸入160時,音頻處理器170確定該語音或聲音是用戶的言語、還是由不同因素生成的聲音。這樣的確定可以根據(jù)各種方法進(jìn)行,沒有特別限制。例如,音頻處理器170可確定輸入的語音或聲音是否對應(yīng)于與人的語音相應(yīng)的波長或頻帶,或者是否對應(yīng)于預(yù)先指定的用戶的語音配置文件。
[0045]當(dāng)輸入的語音或聲音是用戶的言語時,音頻處理器170基于與該言語相應(yīng)的語音命令來執(zhí)行進(jìn)行預(yù)設(shè)的相應(yīng)操作的過程。這里,語音命令意指言語的內(nèi)容,將詳細(xì)描述言語的內(nèi)容。
[0046]本示例性實施例示出音頻處理器170和圖像處理器120是單獨的組件。然而,這樣的組件是為了方便而在功能上劃分的,以便闡明本示例性實施例,圖像處理器120和音頻處理器170在顯示設(shè)備100中可以不必分離。也就是說,顯示設(shè)備100可包括將圖像處理器120和音頻處理器170集成的信號處理器(未顯示)。
[0047]存儲器180存儲根據(jù)控制器190的控制的無限制的數(shù)據(jù)。存儲器180被構(gòu)造為非易失性存儲器,諸如閃存和硬盤驅(qū)動器,但不限于此。存儲器180被控制器190、圖像處理器120或音頻處理器170訪問,并且存儲在存儲器180中的數(shù)據(jù)可被讀取、記錄、修訂、刪除或更新。
[0048]當(dāng)用戶的言語通過音頻輸入160輸入時,控制器190控制音頻處理器170對輸入的言語進(jìn)行處理。這里,當(dāng)言語被輸入時,控制器190確定與該言語相應(yīng)的語音命令是簡單句子,還是描述性句子,并基于確定結(jié)果控制音頻處理器170或服務(wù)器10對該語音命令進(jìn)行處理。詳細(xì)地講,當(dāng)語音命令是簡單句子時,控制器190控制音頻處理器170對該語音命令進(jìn)行處理。當(dāng)語音命令是描述性句子時,控制器190通過通信裝置140將該語音命令發(fā)送到服務(wù)器10,以使得服務(wù)器10對該語音命令進(jìn)行處理。
[0049]圖2是示出顯示設(shè)備100與服務(wù)器20和30之間的交互的框圖。
[0050]如圖2所示,顯示設(shè)備100包括通信裝置140、音頻輸入160、音頻處理器170和控制器190。以上已參照圖1示出了這樣的構(gòu)造。這里,通信裝置140與將用戶的言語轉(zhuǎn)換為語音命令的言語到文本(STT)服務(wù)器20連接,交互服務(wù)器30對該語音命令進(jìn)行分析,并確定與該語音命令相應(yīng)的操作。
[0051]當(dāng)音頻信號被接收到時,STT服務(wù)器20對該音頻信號的波形進(jìn)行分析,并將該音頻信號的內(nèi)容產(chǎn)生為文本。當(dāng)從顯示設(shè)備10接收到用戶的言語的音頻時,STT服務(wù)器20將該音頻信號轉(zhuǎn)換為語音命令。
[0052]交互服務(wù)器30包括顯示設(shè)備100的與語音命令相應(yīng)的各種操作的數(shù)據(jù)庫。交互服務(wù)器30對從顯示設(shè)備100接收的語音命令進(jìn)行分析,并基于分析結(jié)果將用于進(jìn)行與該語音命令相應(yīng)的操作的控制信號發(fā)送到顯示設(shè)備100。
[0053]當(dāng)用戶的言語被輸入到音頻輸入160時,控制器160將該言語的音頻信號發(fā)送到STT服務(wù)器20,并從STT服務(wù)器20接收與該言語相應(yīng)的語音命令。
[0054]控制器190將從STT服務(wù)器20接收的語音命令發(fā)送到音頻處理器170,以使得音頻處理器170對該語音命令進(jìn)行處理。[0055]音頻處理器170包括可在顯示設(shè)備100中執(zhí)行的與多個語音命令相應(yīng)的各種操作或功能的列表或數(shù)據(jù)庫,該列表或數(shù)據(jù)被存儲在圖1的存儲器180中。音頻處理器170用所發(fā)送的語音命令搜索該列表以確定相應(yīng)的操作/或功能。當(dāng)從該列表檢索到相應(yīng)操作時,音頻處理器170對將進(jìn)行的操作進(jìn)行處理。稍后將詳細(xì)描述該列表。
[0056]該列表的語音命令包括簡短的簡單句子。如果輸入的語音命令不是簡單句子,而是描述性句子,則從該列表檢索不到該語音命令,因此,音頻處理器170可能無法確定相應(yīng)的操作。
[0057]當(dāng)語音命令是描述性句子時,也就是說,當(dāng)沒有從列表檢索到語音命令以使得音頻處理器170可能無法對該語音命令進(jìn)行處理時,控制器190將該語音命令發(fā)送到交互服務(wù)器30。交互服務(wù)器30對從顯示設(shè)備100接收的語音命令進(jìn)行分析以確定顯示設(shè)備100的與該語音命令相應(yīng)的操作或功能。交互服務(wù)器30將指導(dǎo)所確定的操作的控制信號發(fā)送到顯示設(shè)備100,以使得顯示設(shè)備100根據(jù)該控制信號進(jìn)行操作。
[0058]因此,顯示設(shè)備100的與用戶的言語相應(yīng)的預(yù)設(shè)操作被執(zhí)行。
[0059]選擇基于語音命令是簡單句子還是描述性句子對語音命令進(jìn)行處理的主題的過程可取決于顯示設(shè)備100的系統(tǒng)負(fù)荷和吞吐量。因為描述性句子是自然語言,所以機(jī)械地從描述性句子的語音命令提取用戶所期望的相應(yīng)操作相對困難。因此,因為可能難以以顯示設(shè)備100的有限資源,基于描述性句子對語音命令進(jìn)行分析,所以描述性句子的語音命令由交互服務(wù)器30處理以應(yīng)對言語的各種內(nèi)容。
[0060]然而,在設(shè)計時可各式各樣地改變和修改這樣的構(gòu)造,因此,顯示設(shè)備100可自主地執(zhí)行STT服務(wù)器20或交互服務(wù)器30的至少一個處理。例如,顯示設(shè)備100可代替服務(wù)器20和30自主地將用戶的言語轉(zhuǎn)換為語音命令或者對描述性句子的語音命令進(jìn)行分析。
[0061]通過這種構(gòu)造,控制器190控制用于確定與將被音頻處理器170或交互服務(wù)器30處理的、和用戶的言語相應(yīng)的語音命令相關(guān)的操作的處理。以下示例性實施例示出控制器190控制音頻處理器170確定顯示設(shè)備100的與簡單句子的語音命令相應(yīng)的操作。
[0062]圖3示出存儲在顯示設(shè)備100中的與語音命令相應(yīng)的操作的列表210。
[0063]如圖3所示,存儲器180存儲顯示設(shè)備100的與和用戶的言語相應(yīng)的語音命令相關(guān)的各種功能或操作的列表210。這里,術(shù)語“操作”意指顯示設(shè)備執(zhí)行并支持的任何類型的過程或功能。
[0064]音頻處理器170基于特定語音命令搜索列表210以確定與該語音命令相應(yīng)的操作。
[0065]本示例性實施例的列表210根據(jù)任何一種示例性原理或方法來構(gòu)造,因此,不限制本示例性實施例的范圍。此外,圖3的列表210示出單個命令與單個操作相應(yīng),這是為了便于簡要地描述本示例性實施例而提供的。在列表210上,多個命令實際上可與單個操作相應(yīng)。此外,為了便于區(qū)分命令和操作,使用列表210的數(shù)字。
[0066]例如,如果與用戶的言語相應(yīng)的語音命令是“開啟”,則音頻處理器170使用語音命令“開啟”來搜索列表210,從而驗證與語音命令“開啟”相應(yīng)的操作是“開啟系統(tǒng)”。
[0067]這里,音頻處理器170可考慮顯示設(shè)備100的當(dāng)前狀態(tài)來選擇性地執(zhí)行操作。如果顯示設(shè)備100當(dāng)前被啟動,則音頻處理器170不執(zhí)行操作“開啟系統(tǒng)”。相反,如果顯示設(shè)備100當(dāng)前被關(guān)閉,則音頻處理器170執(zhí)行啟動系統(tǒng)的操作。[0068]可替換地,如果在顯示設(shè)備100當(dāng)前正在顯示圖像時用戶說“安靜”,則音頻處理器170可確定與語音命令“安靜”相應(yīng)的操作是列表210上的“靜音”。然后,音頻處理器170將當(dāng)前顯示的圖像的音量調(diào)低到0,以使得靜音操作被執(zhí)行。
[0069]此外,如果在顯示設(shè)備100當(dāng)前正在顯示圖像時用戶說“我聽不到它”,則音頻處理器170確認(rèn)與語音命令“我聽不到它”相應(yīng)的操作是列表210上的“將音量調(diào)高五個級別”。然后,音頻處理器170將當(dāng)前顯示的圖像的音量調(diào)高五個級別。
[0070]這樣,音頻處理器170可控制與用戶的言語相應(yīng)的操作被執(zhí)行。
[0071]這里,列表210中的語音命令可用包括簡單字詞的簡單句子來構(gòu)造。通過將更多信息添加到列表210,列表210可以既包括簡單句子,又包括各種描述性句子。然而,隨著列表210的信息量增加,顯示設(shè)備100的系統(tǒng)負(fù)荷也增加,它花費更多的時間搜索列表210。此外,對于個人用戶使用的顯示設(shè)備100而言,將顯示設(shè)備100的列表210構(gòu)造為包括基于具有各種語言習(xí)慣的不同用戶的語音命令不是有效的。
[0072]因此,當(dāng)音頻處理器170難以對語音命令進(jìn)行處理時,控制器190進(jìn)行控制以使得該語音命令首先由音頻處理器170處理或者其次由交互服務(wù)器30處理。
[0073]如果語音命令是簡單句子,則僅由音頻處理器170對該語音命令進(jìn)行處理。然而,如果語音命令是描述性句子或以不同語言發(fā)出的命令,則音頻處理器170和交互服務(wù)器30都對該語音命令進(jìn)行處理。
[0074]例如,如果與用戶的言語相應(yīng)的語音命令是“音量低”,則控制器190將該語音命令發(fā)送到音頻處理器170,以使得音頻處理器170執(zhí)行與該語音命令相應(yīng)的操作。然而,如果列表210不包括語音命令“音量低”,則音頻處理器170可能無法確定與該語音命令“音量低”相應(yīng)的操作。在這種情況下,控制器190將語音命令發(fā)送到交互服務(wù)器30,以使得交互服務(wù)器30可對與該語音命令相應(yīng)的操作進(jìn)行分析。
[0075]當(dāng)作為分析的結(jié)果,交互服務(wù)器30確定操作是“音量+5”時,交互服務(wù)器30將進(jìn)行該操作的控制命令發(fā)送到顯示設(shè)備100??刂破?90根據(jù)從交互服務(wù)器30接收的控制命令來執(zhí)行將圖像的音量調(diào)高5個級別的操作。
[0076]如果與用戶的言語相應(yīng)的語音命令是“我聽不到它”,則因為該語音命令包括在列表210中,所以音頻處理器170立即確定列表210上的操作“音量+5”,而不將該語音命令發(fā)送到交互服務(wù)器30。
[0077]因此,關(guān)于從當(dāng)用戶的言語被輸入時的時刻到當(dāng)相應(yīng)操作被執(zhí)行時的時刻的時間,對描述性句子的語音命令進(jìn)行處理所花費的時間比對簡單句子的語音命令進(jìn)行處理所花費的時間更長,這可能對于當(dāng)使用顯示設(shè)備100時希望快速地執(zhí)行操作的用戶造成不便。
[0078]因此,本示例性實施例提出了以下方法。
[0079]如果與輸入到音頻輸入160的言語相應(yīng)的第一語音命令是描述性句子,則控制器190執(zhí)行由交互服務(wù)器30確定的與第一語音命令相應(yīng)的第一操作,并顯示推薦與第一操作相應(yīng)的簡單句子的第二語音命令的向?qū)D像。這里,第二語音命令可被確定為與列表210上的第一操作相應(yīng)的語音命令。也就是說,如果由交互服務(wù)器30確定的與描述性句子的語音命令相應(yīng)的操作是存儲在存儲器180中的操作,則控制器190顯示推薦與該操作相應(yīng)的簡單句子的語音命令的向?qū)D像。[0080]盡管通過第一語音命令或第二語音命令執(zhí)行第一操作,但是被顯示設(shè)備100自主地處理的第二語音命令執(zhí)行第一操作所花費的時間可比必須被交互服務(wù)器30處理的第一語音命令更短。向?qū)D像向用戶顯示執(zhí)行與第一語音命令相同的操作的第二語音命令,從而誘導(dǎo)用戶下次講出第二語音命令,而不是第一語音命令。
[0081]圖4是示出根據(jù)本示例性實施例的顯示設(shè)備100的控制方法的流程圖。這里,執(zhí)行顯示設(shè)備100的預(yù)設(shè)的第一操作的語音命令包括簡單句子的第一語音命令和描述性句子的第二語音命令。
[0082]如圖4所示,當(dāng)用戶的言語被接收到(操作S100)時,顯示設(shè)備100確定與所接收的言語相應(yīng)的語音命令是簡單句子的第一語音命令,還是描述性句子的第二語音命令(操作 S110)。
[0083]當(dāng)所接收的言語是簡單句子的第一語音命令時,顯示設(shè)備100根據(jù)預(yù)設(shè)的簡單句子處理過程來執(zhí)行與第一語音命令相應(yīng)的第一操作(操作S120)。
[0084]當(dāng)所接收的言語是描述性句子的第二語音命令時,顯示設(shè)備100根據(jù)預(yù)設(shè)的描述性句子處理過程來執(zhí)行與第二語音命令相應(yīng)的第一操作(操作S130)。此外,顯示設(shè)備100顯示向用戶推薦使用簡單句子的第一語音命令來代替使用第二語音命令來執(zhí)行相同的第一操作的向?qū)D像(S140)。
[0085]該方法可引導(dǎo)并誘導(dǎo)用戶使用簡單句子的語音命令,簡單句子的語音命令執(zhí)行操作所涉及的時間比描述性句子的語音命令更短。
[0086]這里,可使用各種簡單句子處理過程和描述性句子處理過程。例如,簡單句子處理過程是涉及僅由音頻處理器170對語音命令進(jìn)行處理的過程,而描述性句子處理過程是涉及由交互服務(wù)器30對語音命令進(jìn)行分析的過程。
[0087]圖5示出根據(jù)本示例性實施例的顯示設(shè)備100和交互服務(wù)器30的控制過程。
[0088]如圖5所示,顯示設(shè)備100接收用戶的言語(操作310)。顯示設(shè)備100將與所接收的用戶的言語相應(yīng)的音頻信號發(fā)送到STT服務(wù)器20 (操作320)。
[0089]STT服務(wù)器20將從顯示設(shè)備100發(fā)送的音頻信號轉(zhuǎn)換為文本的語音命令,并將所轉(zhuǎn)換的語音命令發(fā)送到顯示設(shè)備100 (操作330)。
[0090]顯示設(shè)備100從語音命令和相應(yīng)操作的列表210檢索從STT服務(wù)器20接收的語音命令,并確定與該語音命令相應(yīng)的操作(操作340)。當(dāng)與語音命令相應(yīng)的操作被檢索到時,顯示設(shè)備100執(zhí)行該操作。當(dāng)與語音命令相應(yīng)的操作未被檢索到時,顯示設(shè)備100將該語音命令發(fā)送到交互服務(wù)器30 (操作350)。
[0091]交互服務(wù)器30對語音命令進(jìn)行分析,并確定與該語音命令相應(yīng)的操作(操作360)。各種構(gòu)造和方法可用于對描述性句子的語音命令進(jìn)行分析,以使得交互服務(wù)器30確定相應(yīng)的操作。交互服務(wù)器30將執(zhí)行所確定的操作的控制命令發(fā)送到顯示設(shè)備(操作370)。
[0092]顯示設(shè)備100根據(jù)從交互服務(wù)器30接收的控制命令來執(zhí)行相應(yīng)的操作(操作380)。顯示設(shè)備100從列表檢索與所執(zhí)行的操作相應(yīng)的語音命令(操作390),并顯示推薦所檢索的語音命令的向?qū)D像(操作400)。
[0093]圖6示出顯示在顯示設(shè)備100上的向?qū)D像530。
[0094]如圖6所示,當(dāng)與語音命令相應(yīng)的操作被執(zhí)行時或者在該操作被執(zhí)行之后,向?qū)D像530可與和該操作相關(guān)的圖像520 —起顯示。
[0095]例如,考慮與簡單句子“音量調(diào)高”的語音命令相應(yīng)的操作被設(shè)置為“音量+3”,與描述性句子“請調(diào)高聲音”的語音命令也相應(yīng)地執(zhí)行相同的“音量+3”操作。在這種情況下,簡單句子的第一語音命令是“音量調(diào)高”,描述性句子的第二語音命令是“請調(diào)高聲音”,與第一語音命令和第二語音命令相應(yīng)的操作是“音量+3”。
[0096]當(dāng)在顯示設(shè)備100正在顯示內(nèi)容圖像510時從用戶輸入了語音命令的言語時,顯示設(shè)備100確定該語音命令是簡單句子還是描述性句子。
[0097]如果語音命令是“音量調(diào)高”,則顯示設(shè)備100可自主地檢索并確定與該語音命令相應(yīng)的操作“音量+3”。在這種情況下,顯示設(shè)備100可執(zhí)行將內(nèi)容圖像510的音量調(diào)高三個級別的操作,并與內(nèi)容圖像510 —起顯示與該操作相關(guān)的圖像520。相關(guān)圖像520可包括例如表示調(diào)高音量的視覺標(biāo)志。
[0098]另一方面,如果語音命令是“請調(diào)高聲音”,則顯示設(shè)備100難以自主地確定與該語音命令相應(yīng)的操作,并且在對描述性句子的語音命令的分析中涉及交互服務(wù)器30。在這種情況下,顯示設(shè)備100根據(jù)交互服務(wù)器30的分析和控制來執(zhí)行將內(nèi)容圖像510的音量調(diào)高三個級別的操作,并與內(nèi)容圖像510 —起顯示與該操作相關(guān)的圖像520。此外,顯示設(shè)備100將向用戶通知簡單句子“音量調(diào)高”的語音命令是執(zhí)行操作“音量+3”的向?qū)D像530與內(nèi)容圖像510—起顯示。
[0099]用戶通過向?qū)D像530認(rèn)識到語音命令“音量調(diào)高”可與“請調(diào)高聲音”轉(zhuǎn)換。因此,下次為了執(zhí)行操作“音量+3”,用戶發(fā)出“音量調(diào)高”,而不是“請調(diào)高聲音”,從而相對節(jié)省執(zhí)行該操作的時間。
[0100]可替換地,與前述示例性實施例不同,當(dāng)多個語音命令被順序地輸入時,可執(zhí)行特定操作。
[0101]圖7示出根據(jù)第二示例性實施例的顯示在顯示設(shè)備100上的向?qū)D像550。
[0102]如圖7所示,與語音命令“睡眠定時器”相應(yīng)的操作“關(guān)閉系統(tǒng)”涉及確定何時關(guān)閉系統(tǒng)。當(dāng)語音命令“睡眠定時器”和“一小時”被順序地輸入時,顯示設(shè)備100在從當(dāng)前時間起的一小時后執(zhí)行關(guān)閉操作。
[0103]此外,當(dāng)語音命令“睡眠定時器一小時”一次被輸入到顯示設(shè)備100時,可執(zhí)行相同的操作。也就是說,當(dāng)語音命令“睡眠定時器”和“一小時”被順序地輸入時,以及當(dāng)語音命令“睡眠定時器一小時”被一次輸入時,都可執(zhí)行在從當(dāng)前時間起的一小時后關(guān)閉顯示設(shè)備100的操作。
[0104]如果用戶順序地輸入分別與語音命令“睡眠定時器”和“一小時”相應(yīng)的命令,則顯示設(shè)備100根據(jù)這些語音命令執(zhí)行在一小時后關(guān)閉顯示設(shè)備100的操作,并顯示與該操作相關(guān)的圖像540。
[0105]此外,顯示設(shè)備100顯示推薦預(yù)設(shè)的語音命令“睡眠定時器一小時”以便簡單地執(zhí)行該操作的向?qū)D像550。
[0106]用戶看見向?qū)D像550,下次可相應(yīng)地輸入與語音命令“睡眠定時器一小時”相應(yīng)的命令,而不是順序地輸入分別與語音命令“睡眠定時器”和“一小時”相應(yīng)的命令。因此,顯示設(shè)備100可以以簡單的方式、更少的時間執(zhí)行相應(yīng)的操作。
[0107]在前述示例性實施例中,輸入到顯示設(shè)備100的用戶的言語被STT服務(wù)器30轉(zhuǎn)換為語音命令。此外,簡單句子處理過程是語音命令被顯示設(shè)備100的音頻處理器170自主地處理的過程,描述性句子處理過程是語音命令被交互服務(wù)器30處理并且處理結(jié)果被發(fā)送到顯示設(shè)備100的過程。
[0108]然而,這些示例性實施例不限于所示的示例,而是用于將用戶的言語轉(zhuǎn)換為語音命令的構(gòu)造和用于基于語音命令是簡單句子還是描述性句子來對語音命令進(jìn)行處理的代理可具有與前述示例性實施例中的那些結(jié)構(gòu)不同的結(jié)構(gòu)。
[0109]圖8是示出根據(jù)第三示例性實施例的顯示設(shè)備IOOa和服務(wù)器40的構(gòu)造的框圖。
[0110]如圖8所示,顯示設(shè)備IOOa包括通信裝置140a、音頻輸入160a、音頻處理器170a和控制器190a。
[0111]這里,音頻處理器170a包括STT轉(zhuǎn)換裝置171a和簡單句子命令處理器172a,其中,STT轉(zhuǎn)換裝置171a將從音頻輸入160a發(fā)送的言語轉(zhuǎn)換為語音命令,簡單句子命令處理器172a對簡單句子的語音命令進(jìn)行處理。
[0112]當(dāng)從用戶輸入言語時,音頻輸入160a將所輸入的言語的音頻信號發(fā)送到STT轉(zhuǎn)換裝置171a。STT轉(zhuǎn)換裝置171a對從音頻輸入160a發(fā)送的音頻信號進(jìn)行分析,并將該音頻信號轉(zhuǎn)換為包括該言語的內(nèi)容的語音命令。STT轉(zhuǎn)換裝置171a根據(jù)控制器190a的控制將所轉(zhuǎn)換的語音命令發(fā)送到簡單句子命令處理器172a。也就是說,STT轉(zhuǎn)換裝置171a可執(zhí)行與第一示例性實施例的STT服務(wù)器20的功能相同的功能。
[0113]簡單句子命令處理器172a像第一示例性實施例的音頻處理器170那樣確定與語音命令相應(yīng)的操作。簡單句子命令處理器172a根據(jù)控制器190a的控制對語音命令進(jìn)行分析,并根據(jù)分析結(jié)果執(zhí)行相應(yīng)的操作。以與如上所述的方式相同的方式分析并執(zhí)行語音命令,因此將省略它們的詳細(xì)描述。
[0114]如果語音命令是描述句子,則簡單句子命令處理器172a可能無法對該語音命令進(jìn)行處理。在這種情況下,控制器190a通過通信裝置140a將語音命令發(fā)送到交互服務(wù)器40。交互服務(wù)器40可執(zhí)行與第一示例性實施例的交互服務(wù)器30的功能相同的功能。
[0115]因此,顯示設(shè)備IOOa執(zhí)行與從交互服務(wù)器40接收的控制信號相應(yīng)的操作。
[0116]圖9是示出根據(jù)第四示例性實施例的顯示設(shè)備IOOb的音頻處理器171b的信號傳輸結(jié)構(gòu)的框圖。
[0117]如圖9所示,音頻處理器170b包括STT轉(zhuǎn)換裝置171b、簡單句子命令處理器172b和描述性句子命令處理器173b,其中,STT轉(zhuǎn)換裝置171b將從音頻輸入160b發(fā)送的用戶的言語轉(zhuǎn)換為語音命令,如果語音命令是簡單句子,則簡單句子命令處理器172b對由STT轉(zhuǎn)換裝置171b轉(zhuǎn)換的語音命令進(jìn)行處理,如果命令是描述性句子或自然語言命令,則描述性句子命令處理器173b對由STT轉(zhuǎn)換裝置171b轉(zhuǎn)換的語音命令進(jìn)行處理。音頻處理器170b不限于前述構(gòu)造,前述構(gòu)造僅僅是為了簡要地顯示與本示例性實施例直接相關(guān)聯(lián)的信息而提供的。
[0118]當(dāng)從用戶輸入言語時,音頻輸入160b將輸入的言語的音頻信號發(fā)送到STT轉(zhuǎn)換裝置171b。STT轉(zhuǎn)換裝置171b將從音頻輸入160b發(fā)送的言語轉(zhuǎn)換為包括該言語的內(nèi)容的語音命令。STT轉(zhuǎn)換裝置171b首先將所轉(zhuǎn)換的語音命令發(fā)送到簡單句子命令處理器172b。
[0119]簡單句子命令處理器172b像第一示例性實施例的音頻處理器170那樣確定與語音命令相應(yīng)的操作。簡單句子命令處理器172b根據(jù)控制器190b的控制對語音命令進(jìn)行分析,并根據(jù)分析結(jié)果執(zhí)行相應(yīng)的操作。
[0120]如果語音命令是描述性句子,則簡單句子命令處理器172b可能無法對該語音命令進(jìn)行處理。在這種情況下,控制器190b將語音命令發(fā)送到描述性句子命令處理器173b。
[0121]簡單句子命令處理器172b可執(zhí)行與圖8的簡單句子命令處理器172b基本上相同的功能。此外,描述性句子命令處理器173b執(zhí)行前述示例性實施例中交互服務(wù)器30和40所進(jìn)行的功能。
[0122]也就是說,與在前述示例性實施例中不同,根據(jù)本示例性實施例的顯示設(shè)備IOOb自主地基于用戶的言語轉(zhuǎn)換語音命令,并且在不與外部服務(wù)器20、30和40執(zhí)行數(shù)據(jù)/信號的發(fā)送和接收的情況下自主地對與該語音命令相應(yīng)的操作進(jìn)行分析。
[0123]即時在這種情況下,語音命令也首先被簡單句子命令處理器172b處理。此外,如果簡單句子命令處理器172b不能對語音命令進(jìn)行處理,則隨后該語音命令被描述性句子命令處理器173b處理。因此,第一示例性實施例的構(gòu)思也可應(yīng)用于本示例性實施例。
[0124]盡管已顯示并描述了幾個示例性實施例,但是本領(lǐng)域的技術(shù)人員將意識到,可以在不脫離本申請的原理和精神的情況下在這些示例性實施例中進(jìn)行改變,本申請的范圍在所附權(quán)利要求及其等同物中限定。
【權(quán)利要求】
1.一種圖像處理設(shè)備,包括: 圖像處理器,被構(gòu)造為對圖像信號進(jìn)行處理并顯示所處理的圖像; 音頻輸入,被構(gòu)造為輸入用戶的言語; 存儲器,被構(gòu)造為存儲至少一個簡單句子語音命令和與所述簡單句子語音命令相應(yīng)的操作; 通信裝置,被構(gòu)造為與服務(wù)器通信,其中,服務(wù)器對描述性句子語音命令進(jìn)行分析,并確定與所述描述性句子語音命令相應(yīng)的操作; 音頻處理器,被構(gòu)造為:如果與用戶的言語相應(yīng)的第一語音命令是存儲在存儲器中的簡單句子語音命令,則對第一語音命令進(jìn)行處理以進(jìn)行存儲在存儲器中的與所述簡單句子語音命令相應(yīng)的操作,并且如果第一語音命令不是存儲在存儲器中的簡單句子語音命令,則將第一語音命令發(fā)送到通信裝置;和 控制器,被構(gòu)造為:如果服務(wù)器所確定的關(guān)于第一語音命令的相應(yīng)操作與存儲在存儲器中的所述至少一個簡單句子語音命令之一相同,則顯示推薦存儲在存儲器中的簡單句子語音命令的第一向?qū)D像。
2.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,存儲器被構(gòu)造為存儲簡單句子語音命令和與所述簡單句子語音命令相應(yīng)的操作的列表,并且音頻處理器被構(gòu)造為:確定第一語音命令是否在所述列表中,如果第一語音命令不在所述列表中,則將第一語音命令發(fā)送到通信裝置。
3.根據(jù)權(quán)利要求2所述的圖像處理設(shè)備,其中,控制器根據(jù)從服務(wù)器基于第一語音命令發(fā)送的控制命令來確定與第一語音命令相應(yīng)的操作。
4.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,當(dāng)?shù)谝徽Z音命令是簡單句子語音命令時,從當(dāng)言語被輸入到音頻輸入時的時刻到當(dāng)相應(yīng)操作被執(zhí)行時的時刻的時間比當(dāng)?shù)谝徽Z音命令不是簡單句子語音命令時的所述時間更短。
5.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,在預(yù)設(shè)的相應(yīng)操作被設(shè)置為在分別與多個用戶言語相應(yīng)的多個語音命令被順序地輸入的情況下將被執(zhí)行或者在預(yù)設(shè)的第二語音命令被輸入的情況下將被執(zhí)行的狀態(tài)下,當(dāng)所述多個語音命令被順序地輸入時,控制器顯示推薦第二語音命令的第二向?qū)D像。
6.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中,當(dāng)用戶的言語被輸入到音頻輸入時,通信裝置與用于將用戶的言語轉(zhuǎn)換為文本的語音命令的言語到文本(STT)服務(wù)器通信,并且控制器將所述言語的音頻信號發(fā)送到STT服務(wù)器,并從STT服務(wù)器接收與所述言語相應(yīng)的語首命令。
7.根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,還包括:顯示器,將由圖像處理器處理的圖像信號顯示為圖像。
8.一種圖像處理設(shè)備的控制方法,所述方法包括: 輸入用戶的言語; 當(dāng)與用戶的言語相應(yīng)的第一語音命令是存儲在圖像處理設(shè)備中的簡單句子語音命令時,執(zhí)行存儲在圖像處理設(shè)備中的與所述簡單句子語音命令相應(yīng)的操作;和 如果與用戶的言語相應(yīng)的第一語音命令不是存儲在圖像處理設(shè)備中的簡單句子語音命令,則將第一語音命令發(fā)送到服務(wù)器,其中,服務(wù)器對描述性句子語音命令進(jìn)行分析,并確定與所述描述句子語音命令相應(yīng)的操作, 如果服務(wù)器所確定的關(guān)于第一語音命令的相應(yīng)操作與存儲在圖像處理設(shè)備中的至少一個簡單句子語音命令之一相同,則顯示推薦存儲在圖像處理設(shè)備中的簡單句子語音命令的第一向?qū)D像。
9.根據(jù)權(quán)利要求8所述的控制方法,其中,圖像處理設(shè)備存儲簡單句子語音命令和與所述簡單句子語音命令相應(yīng)的操作的列表,并且將第一語音命令發(fā)送到服務(wù)器的步驟包括:如果沒有從所述列表檢索到第一語音命令,則發(fā)送第一語音命令。
10.根據(jù)權(quán)利要求9所述的控制方法,其中,顯示推薦與相應(yīng)操作相應(yīng)的簡單句子語音命令的向?qū)D像的步驟包括根據(jù)從服務(wù)器基于第一語音命令發(fā)送的控制命令來確定與第一語音命令相應(yīng)的操作。
11.根據(jù)權(quán)利要求8所述的控制方法,其中,當(dāng)?shù)谝徽Z音命令是簡單句子語音命令時,從當(dāng)言語被輸入到音頻輸入時的時刻到當(dāng)相應(yīng)操作被執(zhí)行時的時刻的時間比當(dāng)?shù)谝徽Z音命令不是簡單句子語音命令時的所述時間更短。
12.根據(jù)權(quán)利要求8所述的控制方法,其中,顯示推薦與相應(yīng)操作相應(yīng)的簡單句子語音命令的向?qū)D像的步驟包括:在預(yù)設(shè)的相應(yīng)操作被設(shè)置為在分別與多個言語相應(yīng)的多個語音命令被順序地輸入的情況下將被執(zhí)行或者在預(yù)設(shè)的第二語音命令被輸入的情況下將被執(zhí)行的狀態(tài)下,當(dāng)所述多個語音命令被順序地輸入時,顯示推薦第二語音命令的向?qū)D像。
13.根據(jù)權(quán)利要求8所述的控制方法,其中,輸入用戶的言語的步驟包括:將所述言語的音頻信號發(fā)送到言語到文本(STT)服務(wù)器以將所述言語轉(zhuǎn)換為文本的語音命令,并從STT服務(wù)器接收與所述 言語相應(yīng)的語音命令。
【文檔編號】H04N21/472GK103945250SQ201410022968
【公開日】2014年7月23日 申請日期:2014年1月17日 優(yōu)先權(quán)日:2013年1月17日
【發(fā)明者】李周瑛, 樸相信, 樸鍾喆 申請人:三星電子株式會社