控制電子設(shè)備的方法和應(yīng)用該方法的電子設(shè)備的制作方法
【專利摘要】提供了電子設(shè)備及其控制方法。電子設(shè)備包括:顯示單元,其顯示圖像;動(dòng)作輸入單元,其使用電子設(shè)備的相機(jī)獲得用戶動(dòng)作;存儲(chǔ)單元,其存儲(chǔ)動(dòng)作數(shù)據(jù)庫,其中根據(jù)圖像的類型不同地映射與預(yù)定的用戶動(dòng)作相對(duì)應(yīng)的動(dòng)作任務(wù);以及控制單元,其識(shí)別通過動(dòng)作輸入單元輸入的用戶動(dòng)作,根據(jù)當(dāng)前顯示在顯示單元上的圖像的類型來執(zhí)行與識(shí)別到的用戶動(dòng)作相對(duì)應(yīng)的動(dòng)作任務(wù),并且控制顯示單元根據(jù)當(dāng)前顯示在顯示單元上的圖像的類型來顯示動(dòng)作輔助信息。
【專利說明】控制電子設(shè)備的方法和應(yīng)用該方法的電子設(shè)備
[0001] 本申請(qǐng)是申請(qǐng)日為2012年08月06日、申請(qǐng)?zhí)枮?01210276986. 6、發(fā)明名稱為"控 審IJ電子設(shè)備的方法和應(yīng)用該方法的電子設(shè)備"的發(fā)明專利申請(qǐng)的分案申請(qǐng)。
[0002] 相關(guān)申請(qǐng)的交叉引用
[0003] 本申請(qǐng)要求2011年8月5日向美國專利商標(biāo)局提交的第61/515, 459號(hào)美國專利 申請(qǐng)、W及2012年4月19日向韓國知識(shí)產(chǎn)權(quán)局提交的第10-2012-0040995號(hào)韓國專利申 請(qǐng)的權(quán)益,其公開通過引用并入本文。
【技術(shù)領(lǐng)域】
[0004] 與示范性實(shí)施例一致的方法和設(shè)備設(shè)及控制電子設(shè)備的方法W及應(yīng)用該方法的 電子設(shè)備,更具體地,設(shè)及對(duì)使用動(dòng)作識(shí)別模塊來識(shí)別用戶動(dòng)作的電子設(shè)備進(jìn)行控制的方 法,W及應(yīng)用該方法的電子設(shè)備。
【背景技術(shù)】
[0005] 隨著電子技術(shù)的發(fā)展,已經(jīng)開發(fā)并銷售了各種電子設(shè)備。具體地,包括電視在內(nèi)的 各種電子設(shè)備正被廣泛用于一般家庭。
[0006] 該些電子設(shè)備配備有各種功能,W滿足用戶的期望。因此,需要各種輸入方法W便 有效地使用電子設(shè)備的該些功能。例如,使用遙控器、鼠標(biāo)和觸摸板的輸入方法已經(jīng)應(yīng)用于 電子設(shè)備。
[0007] 然而,該些簡單的輸入方法對(duì)有效地使用電子設(shè)備的各種功能造成了限制。例如, 如果電子設(shè)備的所有功能只通過遙控器控制,則必然要增加遙控器上的按鈕的數(shù)量。
[000引此外,如果所有菜單都顯示在屏幕上,則用戶應(yīng)該逐一捜查復(fù)雜的菜單樹W選擇 期望的菜單,該可能給用戶造成不便。
[0009] 因此,需要更方便且更有效地控制電子設(shè)備的方法。
【發(fā)明內(nèi)容】
[0010] 一個(gè)或多個(gè)示范性實(shí)施例可W克服上述缺點(diǎn)和上面未描述的其他缺點(diǎn)。然而,應(yīng) 理解,一個(gè)或多個(gè)示范性實(shí)施例不需要克服上述缺點(diǎn),而且可W不克服上述任何問題。
[0011] 一個(gè)或多個(gè)示范性實(shí)施例提供了用于控制電子設(shè)備的方法,該方法識(shí)別用戶動(dòng)作 并有效執(zhí)行電子設(shè)備的任務(wù),W及提供了應(yīng)用該方法的電子設(shè)備。
[0012] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了一種用于控制電子設(shè)備的方法,該方法包 括;響應(yīng)于識(shí)別到的用戶動(dòng)作而選擇多個(gè)廣播信號(hào)之一;提供已選擇的廣播信號(hào);停止提 供已選擇的廣播信號(hào)并提供已存儲(chǔ)的內(nèi)容;重新識(shí)別具有與識(shí)別到的用戶動(dòng)作相同形式的 用戶動(dòng)作;W及響應(yīng)于重新識(shí)別的用戶動(dòng)作而改變顯示已提供的內(nèi)容的屏幕的至少一部 分。
[0013] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了一種用于控制電子設(shè)備的方法,該方法包 括;提供多個(gè)廣播信號(hào)當(dāng)中的一個(gè)廣播信號(hào)和已存儲(chǔ)的內(nèi)容之一;通過動(dòng)作識(shí)別模塊識(shí)別 用戶動(dòng)作;w及如果提供了廣播信號(hào),則響應(yīng)于識(shí)別到的用戶動(dòng)作而控制已提供的廣播信 號(hào)的音量等級(jí)或提供多個(gè)廣播信號(hào)當(dāng)中的另一個(gè)廣播信號(hào),W及如果提供了內(nèi)容,則響應(yīng) 于識(shí)別到的用戶動(dòng)作而改變顯示已提供的內(nèi)容的屏幕的至少一部分。
[0014] 廣播信號(hào)可W是從廣播接收單元接收到的廣播信號(hào),而且內(nèi)容可W是存儲(chǔ)在存儲(chǔ) 單元中的內(nèi)容、或者從外部終端輸入單元或網(wǎng)絡(luò)接口接收的內(nèi)容。
[0015] 內(nèi)容可W包括多個(gè)頁面,而且改變顯示已提供的內(nèi)容的屏幕的至少一部分可W包 括將顯示多個(gè)頁面當(dāng)中的一個(gè)頁面的屏幕改變?yōu)轱@示多個(gè)頁面當(dāng)中的另一個(gè)頁面的屏幕。
[0016] 改變顯示已提供的內(nèi)容的屏幕的至少一部分可W包括響應(yīng)于識(shí)別到的用戶動(dòng)作 的方向,將顯示多個(gè)頁面當(dāng)中的一個(gè)頁面的屏幕改變?yōu)轱@示多個(gè)頁面當(dāng)中的、位于該頁面 的上部、下部、左部或右部區(qū)域的另一個(gè)頁面的屏幕。
[0017] 內(nèi)容可W包括單一頁面,而且改變顯示已提供的內(nèi)容的屏幕的至少一部分可W包 括將顯示單一頁面的一部分的屏幕改變?yōu)轱@示單一頁面的另一部分的屏幕。
[0018] 改變顯示已提供的內(nèi)容的屏幕的至少一部分可W包括將顯示已提供的內(nèi)容的屏 幕改變?yōu)轱@示不同于該內(nèi)容的內(nèi)容的屏幕。
[0019] 該方法還可W包括通過語音識(shí)別模塊識(shí)別用戶語音,并且根據(jù)識(shí)別到的用戶語 音,提供多個(gè)廣播信號(hào)當(dāng)中的再一個(gè)廣播信號(hào)。
[0020] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了控制電子設(shè)備的方法,該方法包括提供第 一視頻數(shù)據(jù)和第一視頻數(shù)據(jù)的音頻數(shù)據(jù);響應(yīng)于識(shí)別到的用戶動(dòng)作而控制音頻數(shù)據(jù)的音量 等級(jí);停止提供第一視頻數(shù)據(jù)和音頻數(shù)據(jù)并提供第二視頻數(shù)據(jù);重新識(shí)別具有與識(shí)別到的 用戶動(dòng)作基本相同形式的用戶動(dòng)作;并且響應(yīng)于重新識(shí)別的用戶動(dòng)作而改變顯示第二視頻 數(shù)據(jù)的屏幕的至少一部分。
[0021] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了控制電子設(shè)備的方法,該方法包括提供分 別由多個(gè)源提供的視頻數(shù)據(jù)當(dāng)中的第一視頻數(shù)據(jù)W及從單一源提供的多個(gè)視頻數(shù)據(jù)當(dāng)中 的第二視頻數(shù)據(jù)之一;通過動(dòng)作識(shí)別模塊識(shí)別用戶動(dòng)作;而且如果提供了第一視頻數(shù)據(jù), 則響應(yīng)于識(shí)別到的用戶動(dòng)作而提供與由提供第一視頻數(shù)據(jù)的源不同的源提供的視頻數(shù)據(jù), 如果提供了第二視頻數(shù)據(jù),則響應(yīng)于識(shí)別到的用戶動(dòng)作而提供由單一源提供的多個(gè)視頻數(shù) 據(jù)當(dāng)中的與該第二視頻數(shù)據(jù)不同的視頻數(shù)據(jù)。
[0022] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了控制電子設(shè)備的方法,該方法包括;提供第 一視頻數(shù)據(jù)和第二視頻數(shù)據(jù)之一,第一視頻圖像在向電子設(shè)備供電之后重現(xiàn),第二視頻數(shù) 據(jù)在向電子設(shè)備供電之后、在電子設(shè)備通過用戶進(jìn)入一個(gè)模式之后重現(xiàn);通過動(dòng)作識(shí)別模 塊識(shí)別用戶動(dòng)作;如果提供第一視頻數(shù)據(jù),則響應(yīng)于識(shí)別到的用戶動(dòng)作而提供與在向電子 設(shè)備供電之后重現(xiàn)的第一視頻數(shù)據(jù)不同的視頻數(shù)據(jù),而且如果提供第二視頻數(shù)據(jù),則響應(yīng) 于識(shí)別到的用戶動(dòng)作而提供與在通過用戶進(jìn)入模式之后重現(xiàn)的第二視頻數(shù)據(jù)不同的視頻 數(shù)據(jù)。
[0023] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了控制電子設(shè)備的方法,該方法包括;提供多 個(gè)運(yùn)動(dòng)圖像中的一個(gè)運(yùn)動(dòng)圖像或多個(gè)圖像中的一個(gè)圖像之一;通過動(dòng)作識(shí)別模塊識(shí)別用戶 動(dòng)作;如果提供運(yùn)動(dòng)圖像,則響應(yīng)于識(shí)別到的用戶動(dòng)作而提供多個(gè)運(yùn)動(dòng)圖像中與已提供的 運(yùn)動(dòng)圖像不同的運(yùn)動(dòng)圖像,而且如果提供圖像,則響應(yīng)于識(shí)別到的用戶動(dòng)作而提供多個(gè)圖 像中與已提供的圖像不同的圖像。
[0024] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了電子設(shè)備,該電子識(shí)別包括;顯示單元,其 顯示多個(gè)廣播信號(hào)當(dāng)中的一個(gè)廣播信號(hào)和已存儲(chǔ)的內(nèi)容之一;動(dòng)作輸入單元,其接收用戶 動(dòng)作的輸入;W及控制器,如果提供廣播信號(hào),則控制器響應(yīng)于用戶動(dòng)作而控制已提供的廣 播信號(hào)的音量等級(jí)或者提供多個(gè)廣播信號(hào)中的另一個(gè)廣播信號(hào),而且如果提供內(nèi)容,則控 制器響應(yīng)于用戶動(dòng)作而改變顯示已提供的內(nèi)容的屏幕的至少一部分。
[0025] 內(nèi)容可W包括多個(gè)頁面,而且如果改變顯示已提供的內(nèi)容的屏幕的至少一部分, 則控制器可W將顯示多個(gè)頁面當(dāng)中的一個(gè)頁面的屏幕改變?yōu)轱@示多個(gè)頁面當(dāng)中的另一個(gè) 頁面的屏幕。
[0026] 如果改變顯示已提供的內(nèi)容的屏幕的至少一部分,則控制器可W將顯示多個(gè)頁面 當(dāng)中的一個(gè)頁面的屏幕改變?yōu)轱@示多個(gè)頁面當(dāng)中的、位于該頁面的上部、下部、左部或右部 區(qū)域的另一個(gè)頁面的屏幕。
[0027] 內(nèi)容可W包括單一頁面,而且如果改變顯示已提供的內(nèi)容的屏幕的至少一部分, 則控制器可W將顯示單一頁面的一部分的屏幕改變?yōu)轱@示單一頁面的另一部分的屏幕。 [002引電子設(shè)備還可W包括語音輸入單元,其接收用戶語音的輸入,而且控制器可W根 據(jù)用戶語音提供多個(gè)廣播信號(hào)當(dāng)中的另一個(gè)廣播信號(hào)。
[0029] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了電子設(shè)備,該電子設(shè)備包括顯示單元,其顯 示第一視頻數(shù)據(jù)或第二視頻數(shù)據(jù);音頻輸出單元,其提供第一視頻數(shù)據(jù)的音頻數(shù)據(jù);動(dòng)作 輸入單元,其接收用戶動(dòng)作的輸入;W及控制器,如果提供第一視頻數(shù)據(jù),則控制器響應(yīng)于 用戶動(dòng)作而控制第一視頻數(shù)據(jù)的音頻數(shù)據(jù)的音量等級(jí),而且如果提供第二視頻數(shù)據(jù),則控 制器響應(yīng)于用戶動(dòng)作而改變?cè)陲@示第二視頻數(shù)據(jù)的屏幕的至少一部分。
[0030] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了電子設(shè)備,該電子設(shè)備包括顯示單元,其顯 示多個(gè)運(yùn)動(dòng)圖像中的一個(gè)運(yùn)動(dòng)圖像或多個(gè)圖像中的一個(gè)圖像之一;動(dòng)作輸入單元,其接收 用戶動(dòng)作的輸入;W及控制器,如果提供運(yùn)動(dòng)圖像,則控制器響應(yīng)于用戶動(dòng)作而提供多個(gè)運(yùn) 動(dòng)圖像中與已提供的運(yùn)動(dòng)圖像不同的運(yùn)動(dòng)圖像,而且如果提供圖像,則控制器響應(yīng)于用戶 動(dòng)作而提供多個(gè)圖像中與已提供的圖像不同的圖像。
[0031] 根據(jù)示范性實(shí)施例的一個(gè)方面,提供了電子設(shè)備,該電子設(shè)備包括顯示單元,其顯 示分別由多個(gè)源提供的視頻數(shù)據(jù)當(dāng)中的第一視頻數(shù)據(jù)W及從單一源提供的多個(gè)視頻數(shù)據(jù) 當(dāng)中的第二視頻數(shù)據(jù)之一;動(dòng)作輸入單元,其接收用戶動(dòng)作的輸入;W及控制器,如果提供 第一視頻數(shù)據(jù),則控制器響應(yīng)于用戶動(dòng)作而提供與由提供第一視頻數(shù)據(jù)的源不同的源提供 的視頻數(shù)據(jù),如果提供第二視頻數(shù)據(jù),則控制器響應(yīng)于用戶動(dòng)作而提供由單一源提供的多 個(gè)視頻數(shù)據(jù)當(dāng)中與第二視頻數(shù)據(jù)不同的視頻數(shù)據(jù)。
【專利附圖】
【附圖說明】
[0032] 通過參照附圖詳細(xì)描述示范性實(shí)施例,上述和/或其他方面將更加清楚,附圖中:
[0033] 圖1至圖3是根據(jù)各種示范性實(shí)施例的、解釋根據(jù)電子設(shè)備的配置的框圖;
[0034] 圖4和圖5是示出對(duì)應(yīng)于語音任務(wù)和動(dòng)作任務(wù)的遙控器的按鈕的視圖;
[0035] 圖6至圖32是解釋用于執(zhí)行語音任務(wù)的方法的各種示例的視圖;
[0036] 圖33至圖58是解釋用于執(zhí)行動(dòng)作任務(wù)的方法的各種示例的視圖;
[0037] 圖59和圖60是根據(jù)各種示范性實(shí)施例的、解釋電子設(shè)備的控制方法的流程圖,該 電子設(shè)備通過將任務(wù)劃分為動(dòng)作任務(wù)和語音任務(wù)來控制任務(wù);
[003引圖61和圖62是示出根據(jù)示范性實(shí)施例的、關(guān)于電子設(shè)備的語音任務(wù)的語音UI的 視圖;
[0039] 圖63是示出根據(jù)示范性實(shí)施例的、關(guān)于電子設(shè)備的動(dòng)作任務(wù)的動(dòng)作UI的視圖;
[0040] 圖64至圖66是示出根據(jù)示范性實(shí)施例的、語音識(shí)別或動(dòng)作識(shí)別的視覺反饋的視 圖;
[0041] 圖67至圖69是根據(jù)各種示范性實(shí)施例的、解釋電子設(shè)備的控制方法的流程圖,該 電子設(shè)備提供語音UI和動(dòng)作UI ;
[0042] 圖70至圖78是根據(jù)各種示范性實(shí)施例的、解釋顯示用于解釋語音應(yīng)用的可運(yùn)行 圖標(biāo)的、電子設(shè)備的UI的方法的視圖;
[0043] 圖79是示出根據(jù)示范性實(shí)施例的、解釋顯示電子設(shè)備的UI的方法的流程圖;
[0044] 圖80至圖91是示出根據(jù)各種示范性實(shí)施例的、按照沿著向上、向下、向左和向右 方向的用戶動(dòng)作而改變的屏幕的視圖;
[0045] 圖92和圖93是示出根據(jù)各種示范性實(shí)施例的、解釋其屏幕按照用戶動(dòng)作改變的 電子設(shè)備的控制方法的流程圖;
[0046] 圖94至圖97是根據(jù)各種示范性實(shí)施例的、解釋用于執(zhí)行遙控模式、動(dòng)作任務(wù)模式 和語音任務(wù)模式的方法的視圖和流程圖;
[0047] 圖98是根據(jù)示范性實(shí)施例的、解釋使用移動(dòng)設(shè)備進(jìn)行語音識(shí)別的流程圖;
[0048] 圖99至圖104是根據(jù)示范性實(shí)施例的、解釋指向模式的視圖和流程圖;
[0049] 圖105至圖108是根據(jù)示范性實(shí)施例的、解釋在指向模式中輸入動(dòng)作的情況下的 顯示方法的視圖和流程圖;
[0化0] 圖109至圖111是根據(jù)示范性實(shí)施例的、解釋用于在語音任務(wù)模式中顯示項(xiàng)目的 方法的視圖和流程圖;
[0化1] 圖112至圖115是根據(jù)示范性實(shí)施例的、解釋具有彼此不同的色度的UI的視圖和 流程圖;
[0化2] 圖116至圖118是根據(jù)示范性實(shí)施例的、解釋執(zhí)行與除了顯示語音項(xiàng)目W外的命 令相對(duì)應(yīng)的任務(wù)的視圖和流程圖;
[0053] 圖119至圖121是根據(jù)示范性實(shí)施例的、解釋使用雙手將當(dāng)前模式改變?yōu)閯?dòng)作任 務(wù)模式的動(dòng)作啟動(dòng)命令的視圖和流程圖;
[0054] 圖122是根據(jù)示范性實(shí)施例的、解釋在多個(gè)用戶輸入動(dòng)作啟動(dòng)命令的情況下執(zhí)行 動(dòng)作任務(wù)模式的方法的流程圖;
[0055] 圖123至圖126是根據(jù)示范性實(shí)施例的、解釋使用語音識(shí)別分階段執(zhí)行任務(wù)的方 法的視圖和流程圖;
[0056] 圖127至圖129是根據(jù)示范性實(shí)施例的、解釋其名稱被部分顯示的可運(yùn)行圖標(biāo)的 運(yùn)行的視圖和流程圖;
[0057] 圖130至圖134是根據(jù)示范性實(shí)施例的、解釋按照特殊姿勢執(zhí)行任務(wù)的視圖和流 程圖;
[0化引圖135至圖137是根據(jù)示范性實(shí)施例的、解釋根據(jù)語音輸入方法而不同地顯示的 圖標(biāo)的視圖和流程圖;
[0化9] 圖138至圖142是根據(jù)示范性實(shí)施例的、解釋顯示文本輸入菜單的方法的視圖和 流程圖;
[0060] 圖143是根據(jù)示范性實(shí)施例的、解釋使用外部設(shè)備來執(zhí)行語音任務(wù)的方法的流程 圖;
[0061] 圖144至圖146是根據(jù)示范性實(shí)施例的、解釋在顯示屏幕上顯示可說出的命令的 情況下執(zhí)行語音任務(wù)的方法的視圖和流程圖;
[0062] 圖147是根據(jù)示范性實(shí)施例的、解釋自動(dòng)識(shí)別語音的方法的流程圖;
[0063] 圖148是根據(jù)示范性實(shí)施例的、解釋顯示候選列表的方法的流程圖擬及
[0064] 圖149是根據(jù)示范性實(shí)施例的、解釋指導(dǎo)語音識(shí)別錯(cuò)誤的UI的流程圖。
【具體實(shí)施方式】
[0065] 下文中,將參照附圖更加詳細(xì)地描述示范性實(shí)施例。
[0066] 在W下描述中,當(dāng)相同的參考標(biāo)記和相同的元素在不同的附圖中繪出時(shí),相同的 參考標(biāo)記用于相同的元素。說明書中定義的內(nèi)容,諸如詳細(xì)的結(jié)構(gòu)和元素,被提供W幫助理 解示范性實(shí)施例。因此,明顯的是,示范性實(shí)施例能夠在沒有該些具體定義的內(nèi)容的情況下 執(zhí)行。另外,由于相關(guān)技術(shù)中已知的功能或元件將由于不必要的細(xì)節(jié)而模糊示范性實(shí)施例, 因此將不對(duì)其進(jìn)行詳細(xì)描述。
[0067] 圖1是示出根據(jù)示范性實(shí)施例的電子設(shè)備100的示意性框圖。
[0068] 參照?qǐng)D1,電子設(shè)備100包括語音輸入單元110、動(dòng)作輸入單元120、存儲(chǔ)單元130 和控制單元140。電子設(shè)備100可W由智能電視(TV)、機(jī)頂盒、個(gè)人計(jì)算機(jī)(PC)或數(shù)字電 視實(shí)現(xiàn),但不限于智能電視(TV)、機(jī)頂盒、個(gè)人計(jì)算機(jī)(PC)或數(shù)字電視,其能夠連接到外部 網(wǎng)絡(luò)。
[0069] 語音輸入單元110接收由用戶說出(utter)的語音輸入。語音輸入單元110將輸 入的語音信號(hào)轉(zhuǎn)換成電信號(hào),并且將電信號(hào)輸出到控制單元140。例如,語音輸入單元110 可W由麥克風(fēng)實(shí)現(xiàn)。此外,語音輸入單元110可W由電子設(shè)備100中的內(nèi)部組件或外部設(shè) 備實(shí)現(xiàn)。外部設(shè)備語音輸入單元110可W通過有線或無線連接或通過網(wǎng)絡(luò)連接到電子設(shè)備 100。
[0070] 動(dòng)作(motion)輸入單元120接收通過拍攝用戶動(dòng)作獲得的圖像信號(hào)(例如,連續(xù) 帖),并將圖像信號(hào)提供給控制單元140。例如,動(dòng)作輸入單元120可W由包括鏡頭和圖像傳 感器的單元實(shí)現(xiàn)。動(dòng)作輸入單元120可W由電子設(shè)備100中的內(nèi)部組件或外部設(shè)備實(shí)現(xiàn)。 外部設(shè)備動(dòng)作輸入單元120可W通過有線或無線連接,或通過網(wǎng)絡(luò)連接到電子設(shè)備100。
[0071] 存儲(chǔ)單元130存儲(chǔ)用于驅(qū)動(dòng)和控制電子設(shè)備100的各種數(shù)據(jù)和程序。存儲(chǔ)單元 130存儲(chǔ)語音識(shí)別模塊和動(dòng)作識(shí)別模塊,語音識(shí)別模塊識(shí)別通過語音輸入單元110輸入的 語音,動(dòng)作識(shí)別模塊識(shí)別通過動(dòng)作輸入單元120輸入的動(dòng)作。
[0072] 存儲(chǔ)單元130可W包括語音數(shù)據(jù)庫和動(dòng)作數(shù)據(jù)庫。語音數(shù)據(jù)庫是指預(yù)定的語音W 及與預(yù)定的語音匹配的語音任務(wù)(voice task)記錄在其上的數(shù)據(jù)庫。動(dòng)作數(shù)據(jù)庫是指預(yù) 定的動(dòng)作W及與預(yù)定的動(dòng)作匹配的動(dòng)作任務(wù)(motion task)記錄在其上的數(shù)據(jù)庫。
[0073] 控制單元140控制語音輸入單元110、動(dòng)作輸入單元120和存儲(chǔ)單元130??刂茊?元140可W包括諸如中央處理單元(CPU)的硬件處理器、W及存儲(chǔ)用于控制電子設(shè)備100 的模塊和數(shù)據(jù)的只讀存儲(chǔ)器(ROM)和隨機(jī)存取存儲(chǔ)器(RAM)。
[0074] 如果語音通過語音輸入單元110輸入,則控制單元140使用語音識(shí)別模塊和語音 數(shù)據(jù)庫來識(shí)別語音。語音識(shí)別可W被劃分為孤立詞識(shí)別(isolated word recognition)、連 續(xù)語音識(shí)別(continuous speech reco即ition)和關(guān)鍵詞檢出(keyword spotting),孤立 詞識(shí)別通過根據(jù)輸入的語音的形式而區(qū)分詞來識(shí)別發(fā)出的語音,連續(xù)語音識(shí)別識(shí)別連續(xù)的 詞、連續(xù)的句子,W及對(duì)話語音(dialogic voice),關(guān)鍵詞檢出是介于孤立詞識(shí)別和連續(xù)語 音識(shí)別之間的中間類型并且通過檢測預(yù)定義的關(guān)鍵詞來識(shí)別語音。如果輸入了用戶語音, 則控制單元140通過從輸入的語音信號(hào)中檢測出用戶發(fā)出的語音的開始和結(jié)束來確定語 音段(voice section)??刂茊卧?40計(jì)算輸入的語音信號(hào)的能量、按照計(jì)算出的能量對(duì)語 音信號(hào)的能量水平進(jìn)行分類、并通過動(dòng)態(tài)編程來檢測語音段??刂茊卧?40通過檢測來自 檢測到的語音段內(nèi)的語音信號(hào)的音素(phoneme)(該是最小的語音單位)、基于聲學(xué)模型來 生成音素?cái)?shù)據(jù)。控制單元140通過將隱馬爾可夫模型(HMM)應(yīng)用到已生成的音素?cái)?shù)據(jù)來生 成文本信息。然而,上述語音識(shí)別方法僅僅是示例,而且可W使用其他語音識(shí)別方法。在上 述方法中,控制單元140識(shí)別包括在語音信號(hào)中的用戶語音。
[0075] 如果通過動(dòng)作輸入單元120輸入了動(dòng)作,則控制單元140使用動(dòng)作識(shí)別模塊和動(dòng) 作數(shù)據(jù)庫來識(shí)別動(dòng)作。動(dòng)作識(shí)別將與通過動(dòng)作輸入單元120輸入的用戶動(dòng)作相對(duì)應(yīng)的圖像 (例如,連續(xù)帖)劃分為背景和手區(qū)域(例如,張開手指或曲手握拳),并識(shí)別連續(xù)的手部動(dòng) 作。如果輸入了用戶動(dòng)作,則控制單元140 W帖為基礎(chǔ)存儲(chǔ)接收到的圖像,并且使用已存儲(chǔ) 的帖來感測用戶動(dòng)作的對(duì)象(例如,用戶的手)??刂茊卧?40通過感測帖中所包括的對(duì)象 的形狀、顏色和動(dòng)作中的至少一個(gè)來檢測對(duì)象??刂茊卧?40可W使用多個(gè)帖中所包括的 對(duì)象的位置來追蹤對(duì)象的動(dòng)作。
[0076] 控制單元140按照所追蹤的對(duì)象的形狀和動(dòng)作來確定該動(dòng)作。例如,控制單元 140使用對(duì)象的形狀、速度、位置和方向的變化中的至少一個(gè)來確定用戶動(dòng)作。用戶動(dòng) 作包括握一只手的抓動(dòng)作(grab motion)、利用一只手移動(dòng)顯示的光標(biāo)的指向移動(dòng)動(dòng)作 (pointing move motion)、在一個(gè)方向上W預(yù)定的速度或更快的速度移動(dòng)一只手的拍動(dòng)作 (slap motion)、水平或垂直搖動(dòng)一只手的搖動(dòng)動(dòng)作(shake motion)、W及旋轉(zhuǎn)一只手的旋 轉(zhuǎn)動(dòng)作。本公開的技術(shù)想法可W應(yīng)用于其他動(dòng)作。例如,用戶動(dòng)作還可W包括張開一只手 的張開動(dòng)作(spread motion)。
[0077] 控制單元140確定對(duì)象是否在預(yù)定時(shí)間(例如,800毫秒)內(nèi)離開預(yù)定區(qū)域(例 如,40厘米X40厘米的正方形),W便確定用戶動(dòng)作是指向(pointing)移動(dòng)動(dòng)作還是拍動(dòng) 作。如果對(duì)象在預(yù)定時(shí)間內(nèi)沒有離開預(yù)定區(qū)域,則控制單元140可W確定該用戶動(dòng)作是指 向移動(dòng)動(dòng)作。如果對(duì)象在預(yù)定時(shí)間內(nèi)離開預(yù)定區(qū)域,則控制單元140可W確定該用戶動(dòng)作 是拍動(dòng)作。另一個(gè)示例是,如果對(duì)象的速度低于預(yù)定速度(例如,30厘米/秒),則控制單 元140可W確定該用戶動(dòng)作是指向移動(dòng)動(dòng)作。如果對(duì)象的速度超過預(yù)定速度,則控制單元 140確定該用戶動(dòng)作是拍動(dòng)作。
[007引如上所述,控制單元140使用識(shí)別出的語音和動(dòng)作來執(zhí)行電子設(shè)備100的任務(wù)。電 子設(shè)備的任務(wù)包括由電子設(shè)備100執(zhí)行的至少一個(gè)功能,諸如頻道切換、音量控制、內(nèi)容回 放(例如,運(yùn)動(dòng)圖像、音樂或照片)、或互聯(lián)網(wǎng)瀏覽。
[0079] 下面將解釋通過控制單元140控制電子設(shè)備100的具體方法。
[0080] 圖2是示出根據(jù)示范性實(shí)施例的電子設(shè)備100的框圖。參照?qǐng)D2,電子設(shè)備100包 括語音輸入單元110、動(dòng)作輸入單元120、存儲(chǔ)單元130和控制單元140、廣播接收單元150、 外部端子輸入單元160、遙控信號(hào)接收單元170、網(wǎng)絡(luò)接口單元180和圖像輸出單元190。如 圖2所示,電子設(shè)備100可W由機(jī)頂盒、個(gè)人計(jì)算機(jī)等實(shí)現(xiàn)。
[0081] 圖2的語音輸入單元110、動(dòng)作輸入單元120、存儲(chǔ)單元130和控制單元140與圖 1的語音輸入單元110、動(dòng)作輸入單元120、存儲(chǔ)單元130和控制單元140相同,因此省略其 詳細(xì)描述。
[0082] 廣播接收單元150 W有線或無線方式從外部源接收廣播信號(hào)。廣播信號(hào)包括視 頻、音頻和附加數(shù)據(jù)(例如,電子節(jié)目指南巧PG))。廣播接收單元150可W從諸如地面波廣 播、有線廣播、衛(wèi)星廣播、互聯(lián)網(wǎng)廣播等的各種源接收廣播信號(hào)。
[0083] 外部端子輸入單元160從外部源接收視頻數(shù)據(jù)(例如,運(yùn)動(dòng)圖像或照片)和音頻 數(shù)據(jù)(例如,音樂)。外部端子輸入單元160可W包括高清晰度多媒體接口(HDMI)輸入端 子、分量輸入端子、PC輸入端子、USB輸入端子等中的至少一個(gè)。遙控信號(hào)接收單元170從 外部遙控器接收控制信號(hào)。遙控信號(hào)接收單元170可電子設(shè)備100的語音任務(wù)模式或 動(dòng)作任務(wù)模式接收遙控信號(hào)。網(wǎng)絡(luò)接口單元180可W在控制單元140的控制下將電子設(shè)備 100連接到外部設(shè)備(例如,服務(wù)器)。控制單元140可W從通過網(wǎng)絡(luò)接口單元180連接的 外部設(shè)備下載應(yīng)用,或者可W執(zhí)行網(wǎng)頁(web)瀏覽。網(wǎng)絡(luò)接口單元180可W提供W太網(wǎng)、無 線局域網(wǎng)182、藍(lán)牙等中的至少一個(gè)。
[0084] 圖像輸出單元190向外部顯示設(shè)備(例如,監(jiān)視器或TV)輸出通過廣播接收單元 150接收到的外部廣播信號(hào)、從外部端子輸入單元160輸入的視頻數(shù)據(jù)、或存儲(chǔ)在存儲(chǔ)單元 130中的視頻數(shù)據(jù)。圖像輸出單元190可W包括輸出端子,諸如HDMI、分量、復(fù)合、視頻圖形 陣列(VGA)、數(shù)字視頻接口值VI)、S-視頻等。
[0085] 圖3是示出根據(jù)又一示范性實(shí)施例的電子設(shè)備100的框圖。如圖3所示,電子設(shè) 備100包括語音輸入單元110、動(dòng)作輸入單元120、存儲(chǔ)單元130和控制單元140、廣播接收 單元150、外部端子輸入單元160、遙控信號(hào)接收單元170、網(wǎng)絡(luò)接口單元180、顯示單元193 和音頻輸出單元196。電子設(shè)備100可W是,但不限于,數(shù)字TV。
[0086] 圖3的語音輸入單元110、動(dòng)作輸入單元120、存儲(chǔ)單元130和控制單元140、廣播 接收單元150、外部端子輸入單元160、遙控信號(hào)接收單元170和網(wǎng)絡(luò)接口單元180與圖1 和圖2中具有相同參考標(biāo)記的那些單元相同,因此省略其詳細(xì)描述。
[0087] 顯示單元193顯示與通過廣播接收單元150接收到的廣播信號(hào)相對(duì)應(yīng)的圖像。顯 示單元193可W顯示通過外部端子輸入單元160輸入的圖像數(shù)據(jù)(例如,運(yùn)動(dòng)圖像)或存 儲(chǔ)在存儲(chǔ)單元中的視頻。顯示單元193可W在控制單元140的控制下顯示用于執(zhí)行語音任 務(wù)的語音輔助(assistance)信息和用于執(zhí)行動(dòng)作任務(wù)的動(dòng)作輔助信息。
[008引音頻輸出單元196在控制單元140的控制下輸出與廣播信號(hào)相對(duì)應(yīng)的音頻。音頻 輸出單元196可W包括揚(yáng)聲器196a、耳機(jī)輸出端子19化和S/PDIF輸出端子163c中的至少 一個(gè)。存儲(chǔ)單元130包括電源控制模塊130a、頻道控制模塊13化、音量控制模塊130c、外部 輸入控制模塊130d、屏幕控制模塊130e、音頻控制模塊130f、互聯(lián)網(wǎng)控制模塊130g、應(yīng)用模 塊13化、捜索控制模塊130i、用戶接口扣I)處理模塊130j、語音識(shí)別模塊13化、動(dòng)作識(shí)別 模塊1301、語音數(shù)據(jù)庫130m和動(dòng)作數(shù)據(jù)庫13化。該些模塊130a至13化可W通過軟件實(shí) 現(xiàn),w便執(zhí)行電源控制功能、頻道控制功能、音量控制功能、外部輸入控制功能、屏幕控制功 能、音頻控制功能、互聯(lián)網(wǎng)控制功能、應(yīng)用運(yùn)行功能、捜索控制功能和UI處理功能??刂茊?元140通過運(yùn)行存儲(chǔ)在存儲(chǔ)單元130中的軟件執(zhí)行相應(yīng)功能。
[0089] W下將參照附圖解釋各種示范性實(shí)施例。
[0090] 如果通過語音識(shí)別模塊13化識(shí)別到用戶語音,則控制單元140執(zhí)行可由遙控器控 制的任務(wù)當(dāng)中與識(shí)別到的用戶語音相對(duì)應(yīng)的語音任務(wù)。如果通過動(dòng)作識(shí)別模塊1301識(shí)別 到用戶動(dòng)作,則控制單元140執(zhí)行可由遙控器控制的任務(wù)當(dāng)中與識(shí)別到的用戶動(dòng)作相對(duì)應(yīng) 的動(dòng)作任務(wù)。語音任務(wù)和動(dòng)作任務(wù)可W通過利用遙控器上的按鈕進(jìn)行分類來被映射。
[0091] 語音任務(wù)是指可按照通過語音識(shí)別模塊識(shí)別到的語音進(jìn)行控制的任務(wù)。例如,語 音任務(wù)可W包括關(guān)閉電子設(shè)備100、頻道快捷切換(channel shortcut)、靜音、改變外部端 子、設(shè)置音量等級(jí)、輸入文本W(wǎng)及重現(xiàn)/停止圖像的功能中的至少一個(gè)。也就是說,具有能 夠由用戶語音發(fā)出的名稱或標(biāo)識(shí)符的各種任務(wù)或者需要輸入文本的任務(wù)可W被設(shè)置為語 音任務(wù)。
[0092] 動(dòng)作任務(wù)是指可按照通過動(dòng)作識(shí)別模塊識(shí)別到的動(dòng)作進(jìn)行控制的任務(wù)。例如, 動(dòng)作任務(wù)可W包括頻道改變、音量等級(jí)控制、屏幕導(dǎo)航、滑動(dòng)條控制和光標(biāo)指向(cursor pointing)。也就是說,能夠在各階段按照用戶動(dòng)作的類型和方向進(jìn)行控制的各種任務(wù)W及 使用光標(biāo)的任務(wù)可W被設(shè)置為動(dòng)作任務(wù)。
[0093] 如果通過語音識(shí)別模塊識(shí)別到用戶語音,則控制單元140執(zhí)行直接對(duì)應(yīng)于用戶語 音中所包括的言語(utterance)的語音任務(wù)。
[0094] 例如,控制單元140從用戶發(fā)出的語音中識(shí)別頻道標(biāo)識(shí)符。頻道標(biāo)識(shí)符用于識(shí)別 頻道,并且可W包括頻道名稱、頻道號(hào)碼和節(jié)目名稱中的至少一個(gè)。
[0095] 如果頻道標(biāo)識(shí)符如上所述被存儲(chǔ)在存儲(chǔ)單元130中的語音數(shù)據(jù)庫中,則控制單元 140使用語音數(shù)據(jù)庫執(zhí)行到與識(shí)別到的頻道標(biāo)識(shí)符相對(duì)應(yīng)的頻道的快捷切換。也就是說,如 果用戶說"11",則控制單元140確認(rèn)與"11"相對(duì)應(yīng)的語音任務(wù)是否記錄在語音數(shù)據(jù)庫中。 如果與"11"相對(duì)應(yīng)的語音任務(wù)是選擇頻道11的頻道快捷切換功能,則控制單元140執(zhí)行 到頻道11的快捷切換。
[0096] 如果通過動(dòng)作識(shí)別模塊識(shí)別到用戶動(dòng)作,則控制單元140按照用戶動(dòng)作的方向執(zhí) 行與用戶動(dòng)作相對(duì)應(yīng)的動(dòng)作任務(wù)。
[0097] 例如,如果通過動(dòng)作識(shí)別模塊識(shí)別到向上方向的拍動(dòng)作,則控制單元140可W從 動(dòng)作數(shù)據(jù)庫中確認(rèn)與向上方向的拍動(dòng)作相對(duì)應(yīng)的動(dòng)作任務(wù),并且可W執(zhí)行頻道改變W便將 當(dāng)前頻道改變?yōu)轭l道號(hào)碼增加預(yù)定數(shù)量(例如,1)的頻道。如果通過動(dòng)作識(shí)別模塊識(shí)別 到向下方向的拍動(dòng)作,則控制單元140可W從動(dòng)作數(shù)據(jù)庫中確認(rèn)與向下方向的拍動(dòng)作相對(duì) 應(yīng)的動(dòng)作任務(wù),并且可W執(zhí)行頻道改變W便將當(dāng)前頻道改變?yōu)轭l道號(hào)碼減少預(yù)定數(shù)量(例 如,1)的頻道。
[009引語音任務(wù)和動(dòng)作任務(wù)可W通過利用圖4和圖5中所示的遙控器上的按鈕進(jìn)行分類 來被映射。
[0099] 圖4示出了與執(zhí)行至少一個(gè)語音任務(wù)的命令相對(duì)應(yīng)的遙控器上的按鈕。也就 是說,在語音輸入被識(shí)別出的情況下執(zhí)行的任務(wù)可W對(duì)應(yīng)于通過遙控器上的按鈕之一執(zhí) 行的任務(wù)。例如,由遙控器上的電源按鈕401執(zhí)行的任務(wù)對(duì)應(yīng)于在語音"呼叫詞(call word)"(例如,"Ginny")或"電源"被識(shí)別出的情況下執(zhí)行的任務(wù)。因此,外部輸入按鈕 402對(duì)應(yīng)于語音"外部輸入"。此外,數(shù)字按鈕403對(duì)應(yīng)于所說出的號(hào)碼。此外,上一個(gè)頻道 (previous channel)按鈕404對(duì)應(yīng)于語音"上一個(gè)頻道"。靜音按鈕405對(duì)應(yīng)于語音"靜音" 或"取消靜音"。另外,頻道列表按鈕406對(duì)應(yīng)于語音"頻道列表"。智能中屯、(smart hub)/ 菜單/捜索/快速菜單/信息顯示按鈕407、返回按鈕408、退出按鈕409、社交網(wǎng)絡(luò)/3D圖 像提供按鈕410、幫助按鈕411 W及回放/暫停/停止/錄制按鈕412對(duì)應(yīng)于與它們各自名 稱相對(duì)應(yīng)的語音。
[0100] 圖5示出了與執(zhí)行至少一個(gè)動(dòng)作任務(wù)的動(dòng)作相對(duì)應(yīng)的遙控器上的按鈕。也就是 說,在動(dòng)作輸入被識(shí)別到的情況下執(zhí)行的任務(wù)可W對(duì)應(yīng)于按照遙控器上的按鈕之一執(zhí)行的 任務(wù)。例如,如圖5所示,按照音量向上/向下按鈕和頻道向上/向下按鈕421執(zhí)行的任務(wù) 對(duì)應(yīng)于向上、向下、向右和向左方向上的拍動(dòng)作被識(shí)別到的情況下執(zhí)行的任務(wù)。因此,向上、 向下、向左和向右方向按鈕422對(duì)應(yīng)于向上、向下、向左和向右方向的拍動(dòng)作。選擇按鈕423 可W對(duì)應(yīng)于抓動(dòng)作。如果屏上顯示(on screen display, 0SD)包括鍵指導(dǎo)化ey guide),貝Ij 功能按鈕425可W對(duì)應(yīng)于相應(yīng)鍵的指向動(dòng)作(pointing motion)。
[0101] 語音任務(wù)和動(dòng)作任務(wù)可W在不相互結(jié)合的情況下獨(dú)立改變電子設(shè)備100的設(shè)置。 也就是說,語音任務(wù)可W使用由語音識(shí)別模塊13化識(shí)別到的用戶語音來改變電子設(shè)備100 的設(shè)置,而且動(dòng)作任務(wù)可W使用由動(dòng)作識(shí)別模塊1301識(shí)別到的用戶動(dòng)作來改變電子設(shè)備 100的設(shè)置。
[0102] 控制單元140通過語音識(shí)別模塊13化和動(dòng)作識(shí)別模塊1301之一來識(shí)別用戶語音 和用戶動(dòng)作之一。如果通過語音識(shí)別模塊13化識(shí)別到用戶語音,則控制單元140分別運(yùn) 行具有內(nèi)容標(biāo)識(shí)符的多個(gè)內(nèi)容當(dāng)中的、具有與識(shí)別到的用戶語音相對(duì)應(yīng)的內(nèi)容標(biāo)識(shí)符的內(nèi) 容。如果通過動(dòng)作識(shí)別模塊1301識(shí)別到用戶動(dòng)作,則控制單元140按照用戶動(dòng)作的方向改 變多個(gè)內(nèi)容。
[0103] 該里所記載的內(nèi)容可W是廣播內(nèi)容。具體地,如果通過語音識(shí)別模塊13化識(shí)別到 用戶語音,則控制單元140分別將當(dāng)前廣播頻道改變?yōu)榫哂袕V播頻道標(biāo)識(shí)符的多個(gè)廣播頻 道當(dāng)中的、具有與識(shí)別到的用戶語音相對(duì)應(yīng)的廣播頻道標(biāo)識(shí)符的廣播頻道。頻道標(biāo)識(shí)符可 W包括頻道號(hào)碼、頻道名稱和節(jié)目名稱中的至少一個(gè)。
[0104] 如果通過動(dòng)作識(shí)別模塊1301識(shí)別到用戶動(dòng)作,則控制單元140按照用戶動(dòng)作的方 向分階段地(in地ase)改變多個(gè)廣播頻道。用戶動(dòng)作可W包括拍動(dòng)作。例如,如果識(shí)別到 的用戶動(dòng)作是向上方向上的拍動(dòng)作,則控制單元140執(zhí)行頻道改變,從而將當(dāng)前廣播頻道 改變?yōu)轭l道號(hào)碼增加預(yù)定數(shù)量的廣播頻道。如果識(shí)別到的用戶動(dòng)作是向下方向上的拍動(dòng) 作,則控制單元140執(zhí)行頻道改變,從而將當(dāng)前廣播頻道改變?yōu)轭l道號(hào)碼減少預(yù)定數(shù)量的 廣播頻道。
[0105] 內(nèi)容可W是圖像內(nèi)容、音樂內(nèi)容和照片內(nèi)容之一。如果內(nèi)容是圖像內(nèi)容、音樂內(nèi)容 和照片內(nèi)容之一,則內(nèi)容標(biāo)識(shí)符可W是內(nèi)容的名稱。
[0106] 如果內(nèi)容是圖像內(nèi)容、音樂內(nèi)容和照片內(nèi)容之一,則用戶動(dòng)作可W包括拍動(dòng)作。例 如,如果識(shí)別到的用戶動(dòng)作是向右方向上的拍動(dòng)作,則控制單元140可W將當(dāng)前內(nèi)容改變 為包括多個(gè)將被重現(xiàn)的內(nèi)容的內(nèi)容列表上的下一個(gè)內(nèi)容,而且如果識(shí)別到的用戶動(dòng)作是向 左方向上的拍動(dòng)作,則控制單元140可W將當(dāng)前內(nèi)容改變?yōu)閮?nèi)容列表上的前一個(gè)內(nèi)容。
[0107] 如果通過語音識(shí)別模塊13化識(shí)別到語音啟動(dòng)命令,則控制單元140將電子設(shè)備 100的模式改變?yōu)檎Z音任務(wù)模式,在該語音任務(wù)模式中,按照通過語音識(shí)別模塊13化識(shí)別 到的用戶語音來控制電子設(shè)備100。如果通過動(dòng)作識(shí)別模塊1301識(shí)別到動(dòng)作啟動(dòng)命令,貝U 控制單元140將電子設(shè)備100的模式改變?yōu)閯?dòng)作任務(wù)模式,在該動(dòng)作任務(wù)模式中,按照通過 動(dòng)作識(shí)別模塊1301識(shí)別到的用戶動(dòng)作來控制電子設(shè)備100。
[0108] 具體來說,控制單元140可遙控模式、語音任務(wù)模式和動(dòng)作任務(wù)模式之一操 作,在遙控模式中電子設(shè)備100由遙控設(shè)備(例如,遙控器)控制,在語音任務(wù)模式中電子 設(shè)備100根據(jù)語音來控制,在動(dòng)作任務(wù)模式中電子設(shè)備100根據(jù)動(dòng)作來控制。如果輸入啟 動(dòng)另一種模式的命令,則控制單元140可W將當(dāng)前模式改變?yōu)橄鄳?yīng)模式。
[0109] 如果在電子設(shè)備100處于遙控模式或動(dòng)作任務(wù)模式時(shí)通過語音識(shí)別模塊13化識(shí) 別到語音啟動(dòng)命令(觸發(fā)語音),則控制單元140將電子設(shè)備100的模式改變?yōu)檎Z音任務(wù) 模式。語音啟動(dòng)命令是包括與進(jìn)入語音任務(wù)模式的操作相匹配的詞的命令。例如,如果詞 "Ginny"被設(shè)置為語音啟動(dòng)命令,則當(dāng)識(shí)別到詞"Ginny"時(shí),控制單元140將電子設(shè)備100 的模式改變?yōu)檎Z音任務(wù)模式。關(guān)于語音啟動(dòng)命令的詞可W在電子設(shè)備100的配置模式中由 用戶直接改變,或者可W是在制造電子設(shè)備100時(shí)默認(rèn)定義的固定命令。
[0110] 在語音任務(wù)模式中,控制單元140使用語音數(shù)據(jù)庫來執(zhí)行與用戶發(fā)出的語音中所 包括的詞相對(duì)應(yīng)的語音任務(wù)。
[0111] 控制單元140可W保持語音任務(wù)模式直至識(shí)別到返回遙控模式的啟動(dòng)命令、模式 取消命令、或者改變?yōu)閯?dòng)作任務(wù)模式的動(dòng)作啟動(dòng)命令。如果在模式已經(jīng)改變?yōu)檎Z音任務(wù)模 式之后的預(yù)定時(shí)間(例如5分鐘)內(nèi)沒有識(shí)別到語音,則控制單元140可W自動(dòng)返回到遙 控模式。
[0112] 如果在處于遙控模式或語音任務(wù)模式時(shí)通過動(dòng)作識(shí)別模塊1301識(shí)別到動(dòng)作啟動(dòng) 命令(觸發(fā)動(dòng)作),則控制單元140將當(dāng)前模式改變?yōu)閯?dòng)作任務(wù)模式。動(dòng)作啟動(dòng)命令是進(jìn) 入動(dòng)作任務(wù)模式的預(yù)先設(shè)定的動(dòng)作。例如,如果水平地?fù)u動(dòng)(shake) -只手3至4次的動(dòng) 作被設(shè)置為動(dòng)作啟動(dòng)命令,則當(dāng)識(shí)別到該種動(dòng)作時(shí)控制單元140將模式改變?yōu)閯?dòng)作任務(wù)模 式。關(guān)于動(dòng)作啟動(dòng)命令的動(dòng)作可W在電子設(shè)備100的配置模式中由用戶直接改變,或者可 W是在制造電子設(shè)備100時(shí)默認(rèn)定義的固定動(dòng)作。
[0113] 在動(dòng)作任務(wù)模式中,控制單元140使用動(dòng)作數(shù)據(jù)庫來執(zhí)行與用戶動(dòng)作相對(duì)應(yīng)的動(dòng) 作任務(wù)??刂茊卧?40可W保持動(dòng)作任務(wù)模式直至識(shí)別到返回遙控模式的啟動(dòng)命令、模式 取消命令、或者改變?yōu)檎Z音任務(wù)模式的語音啟動(dòng)命令。如果在模式已經(jīng)改變?yōu)閯?dòng)作任務(wù)模 式之后的預(yù)定時(shí)間(例如5分鐘)內(nèi)沒有識(shí)別到動(dòng)作,則控制單元140可W自動(dòng)返回遙控 模式。
[0114] 控制單元140顯示包括指導(dǎo)語音識(shí)別的語音項(xiàng)目(item)的語音輔助信息W及包 括指導(dǎo)動(dòng)作識(shí)別的動(dòng)作項(xiàng)目的動(dòng)作輔助信息之一。如果識(shí)別到與語音輔助信息中所包括的 語音項(xiàng)目相對(duì)應(yīng)的命令之一,則控制單元140執(zhí)行與識(shí)別到的命令相對(duì)應(yīng)的語音任務(wù)。如 果識(shí)別到與動(dòng)作輔助信息中所包括的動(dòng)作項(xiàng)目相對(duì)應(yīng)的動(dòng)作之一,則控制單元140執(zhí)行與 識(shí)別到的動(dòng)作相對(duì)應(yīng)的動(dòng)作任務(wù)。
[0115] 具體來說,如果通過語音識(shí)別模塊13化識(shí)別到語音啟動(dòng)命令,則控制單元140可 W控制W顯示關(guān)于可由用戶語音控制的語音任務(wù)的語音項(xiàng)目。語音項(xiàng)目可W顯示與各種語 音任務(wù)相對(duì)應(yīng)的命令。因此,如果用戶說出某一命令,則用戶可w很容易地識(shí)別出哪個(gè)語音 任務(wù)將被執(zhí)行,從而可W更容易地執(zhí)行該語音任務(wù)。
[0116] 如果通過動(dòng)作識(shí)別模塊1301識(shí)別到動(dòng)作啟動(dòng)命令,則控制單元140可W控制W顯 示關(guān)于可由用戶動(dòng)作控制的動(dòng)作任務(wù)的動(dòng)作項(xiàng)目。語音項(xiàng)目可W顯示與各種動(dòng)作任務(wù)相對(duì) 應(yīng)的動(dòng)作。因此,如果用戶執(zhí)行某一動(dòng)作,則用戶可W很容易地識(shí)別哪個(gè)動(dòng)作任務(wù)將被執(zhí) 行,從而可W更容易地執(zhí)行該動(dòng)作任務(wù)。
[0117] 語音項(xiàng)目或動(dòng)作項(xiàng)目可W顯示在顯示屏幕的同一區(qū)域(例如,屏幕的下部)上。顯 示語音項(xiàng)目或動(dòng)作項(xiàng)目的區(qū)域可W與所顯示的圖像重疊。然而,該僅僅是示例,而且語音項(xiàng) 目和動(dòng)作項(xiàng)目可W在其他位置顯示或者W其他方法顯示。例如,語音項(xiàng)目或動(dòng)作項(xiàng)目可W 顯示在顯示屏幕的右部或左部。
[011引 電子設(shè)備100的任務(wù)可W被劃分為如下的由用戶語音控制的語音任務(wù)和由用戶 動(dòng)作控制的動(dòng)作任務(wù):
[0119] [表 1]
[0120]
【權(quán)利要求】
1. 一種電子設(shè)備,包括: 顯示單元,其顯示圖像; 動(dòng)作輸入單元,其使用電子設(shè)備的相機(jī)獲得用戶動(dòng)作; 存儲(chǔ)單元,其存儲(chǔ)動(dòng)作數(shù)據(jù)庫,其中根據(jù)圖像的類型不同地映射與預(yù)定的用戶動(dòng)作相 對(duì)應(yīng)的動(dòng)作任務(wù);以及 控制單元,其識(shí)別通過動(dòng)作輸入單元輸入的用戶動(dòng)作,根據(jù)當(dāng)前顯示在顯示單元上的 圖像的類型來執(zhí)行與識(shí)別到的用戶動(dòng)作相對(duì)應(yīng)的動(dòng)作任務(wù),并且控制顯示單元根據(jù)當(dāng)前顯 示在顯示單元上的圖像的類型來顯示動(dòng)作輔助信息。
2. 如權(quán)利要求1所述的電子設(shè)備,其中,如果所述圖像的類型是廣播圖像,則所述控制 單元響應(yīng)于識(shí)別到的用戶動(dòng)作執(zhí)行頻道改變功能或音量調(diào)節(jié)功能,而且如果所述圖像的類 型是網(wǎng)頁圖像,則所述控制單元響應(yīng)于識(shí)別到的用戶動(dòng)作執(zhí)行屏幕移動(dòng)功能。
3. 如權(quán)利要求2所述的電子設(shè)備,其中,所述用戶動(dòng)作是拍動(dòng)作。
4. 如權(quán)利要求3所述的電子設(shè)備,其中,在所述用戶動(dòng)作是沿上下方向的拍動(dòng)作的情 況下,如果所述圖像的類型是廣播圖像,則所述控制單元響應(yīng)于識(shí)別到的用戶動(dòng)作執(zhí)行頻 道改變功能, 而且如果所述圖像的類型是網(wǎng)頁圖像,則所述控制單元響應(yīng)于識(shí)別到的用戶動(dòng)作沿上 下方向執(zhí)行屏幕移動(dòng)功能。
5. 如權(quán)利要求3所述的電子設(shè)備,其中,在所述用戶動(dòng)作是沿左右方向的拍動(dòng)作的情 況下,如果所述圖像的類型是廣播圖像,則所述控制單元響應(yīng)于識(shí)別到的用戶動(dòng)作執(zhí)行音 量調(diào)節(jié)功能, 而且如果所述圖像的類型是網(wǎng)頁圖像,則所述控制單元響應(yīng)于識(shí)別到的用戶動(dòng)作沿左 右方向執(zhí)行屏幕移動(dòng)功能。
6. -種電子設(shè)備的控制方法,該方法包括: 根據(jù)當(dāng)前顯示在電子設(shè)備上的圖像的類型來顯示動(dòng)作輔助信息; 使用電子設(shè)備的相機(jī)獲得用戶動(dòng)作,并且通過動(dòng)作識(shí)別模塊識(shí)別用戶動(dòng)作;以及 根據(jù)當(dāng)前顯示在電子設(shè)備上的圖像的類型來執(zhí)行與用戶動(dòng)作相對(duì)應(yīng)的動(dòng)作任務(wù)。
7. 如權(quán)利要求6所述的控制方法,其中,如果所述圖像的類型是廣播圖像,則響應(yīng)于用 戶動(dòng)作執(zhí)行頻道改變功能或音量調(diào)節(jié)功能,而且如果所述圖像的類型是網(wǎng)頁圖像,則響應(yīng) 于用戶動(dòng)作執(zhí)行屏幕移動(dòng)功能。
8. 如權(quán)利要求7所述的控制方法,其中,所述用戶動(dòng)作是拍動(dòng)作。
9. 如權(quán)利要求8所述的控制方法,其中,在所述用戶動(dòng)作是沿上下方向的拍動(dòng)作的情 況下,如果所述圖像的類型是廣播圖像,則響應(yīng)于用戶動(dòng)作執(zhí)行頻道改變功能, 而且如果所述圖像的類型是網(wǎng)頁圖像,則響應(yīng)于用戶動(dòng)作沿上下方向執(zhí)行屏幕移動(dòng)功 能。
10. 如權(quán)利要求8所述的控制方法,其中,在所述用戶動(dòng)作是沿左右方向的拍動(dòng)作的情 況下,如果所述圖像的類型是廣播圖像,則響應(yīng)于用戶動(dòng)作執(zhí)行音量調(diào)節(jié)功能, 而且如果所述圖像的類型是網(wǎng)頁圖像,則響應(yīng)于用戶動(dòng)作沿左右方向執(zhí)行屏幕移動(dòng)功 能。
11. 如權(quán)利要求6所述的控制方法,其中,所述電子設(shè)備存儲(chǔ)動(dòng)作數(shù)據(jù)庫,其中根據(jù)圖 像的類型不同地映射與預(yù)定的用戶動(dòng)作相對(duì)應(yīng)的動(dòng)作任務(wù),而且, 使用動(dòng)作數(shù)據(jù)庫來執(zhí)行與用戶動(dòng)作相對(duì)應(yīng)的動(dòng)作任務(wù)。
【文檔編號(hào)】G06F3/0484GK104486679SQ201410806882
【公開日】2015年4月1日 申請(qǐng)日期:2012年8月6日 優(yōu)先權(quán)日:2011年8月5日
【發(fā)明者】金正根, 金裕泰, 俞升東, 韓尚珍, 柳熙涉 申請(qǐng)人:三星電子株式會(huì)社