移動(dòng)終端及其識(shí)別語音的方法
【專利摘要】本發(fā)明涉及一種移動(dòng)終端及其識(shí)別語音的方法。本發(fā)明的實(shí)施例涉及與服務(wù)器相連接的移動(dòng)終端的語音識(shí)別方法。語音識(shí)別方法可以包括:接收用戶的語音;將接收到的語音提供給被設(shè)置在服務(wù)器中的第一語音識(shí)別引擎和被設(shè)置在移動(dòng)終端中的第二語音識(shí)別引擎;獲取第一語音識(shí)別數(shù)據(jù)作為通過第一語音識(shí)別引擎識(shí)別接收到的語音的結(jié)果;獲取第二語音識(shí)別數(shù)據(jù)作為通過第二語音識(shí)別引擎識(shí)別接收到的語音的結(jié)果;基于第一和第二語音識(shí)別數(shù)據(jù)中的至少一個(gè)估計(jì)與用戶的意圖相對(duì)應(yīng)的功能;當(dāng)估計(jì)的功能需要個(gè)人信息時(shí)計(jì)算第一和第二語音識(shí)別數(shù)據(jù)之間的相似度;以及基于計(jì)算的相似度選擇第一和第二語音識(shí)別數(shù)據(jù)中的任意一個(gè)。
【專利說明】移動(dòng)終端及其識(shí)別語音的方法
【技術(shù)領(lǐng)域】
[0001]本公開涉及一種移動(dòng)終端,并且更加具體地,涉及一種具有語音識(shí)別功能的移動(dòng)終端及其語音識(shí)別方法。
【背景技術(shù)】
[0002]終端基于它的移動(dòng)性能夠被分類成移動(dòng)或者便攜式終端和固定終端。此外,移動(dòng)終端基于它是否能夠由用戶直接攜帶可以進(jìn)一步被分類成手持終端和車載終端。
[0003]例如,隨著它變成多功能的,能夠允許這樣的終端捕捉靜止圖像或運(yùn)動(dòng)圖像、播放音樂或視頻文件、玩游戲、接收廣播等,以便實(shí)現(xiàn)為綜合多媒體播放器。此外,可以考慮改進(jìn)終端的結(jié)構(gòu)或者軟件要素,以支持和增強(qiáng)終端的功能。
[0004]對(duì)于增強(qiáng)的示例,在移動(dòng)終端中使用各種算法能夠執(zhí)行語音識(shí)別功能。需要大量的數(shù)據(jù)計(jì)算量和資源以實(shí)現(xiàn)語音識(shí)別功能。由于此,已經(jīng)引入用于實(shí)現(xiàn)適當(dāng)?shù)馁Y源分布的分布式語音識(shí)別系統(tǒng)。然而,即使在這樣的分布式語音識(shí)別系統(tǒng)中,也已經(jīng)積極地進(jìn)行對(duì)于增強(qiáng)其語音識(shí)別結(jié)果的快速性和精確性的研究。
【發(fā)明內(nèi)容】
[0005]因此,本公開的目的是為了提供能夠增強(qiáng)語音識(shí)別結(jié)果的可靠性的移動(dòng)終端。
[0006]本公開的另一目的是為了提供一種移動(dòng)終端,當(dāng)執(zhí)行語音識(shí)別功能時(shí),該移動(dòng)終端能夠防止個(gè)人信息的泄露。
[0007]本公開的實(shí)施例涉及一種連接服務(wù)器的移動(dòng)終端的語音識(shí)別方法。語音識(shí)別方法可以包括:接收用戶的語音;將接收到的語音提供給在服務(wù)器中提供的第一語音識(shí)別引擎以及在移動(dòng)終端中提供的第二語音識(shí)別引擎;獲取第一語音識(shí)別數(shù)據(jù)作為通過第一語音識(shí)別引擎識(shí)別接收到的語音的結(jié)果;獲取第二語音識(shí)別數(shù)據(jù)作為通過第二語音識(shí)別引擎識(shí)別接收到的語音的結(jié)果;基于第一和第二語音識(shí)別數(shù)據(jù)中的至少一個(gè)來估計(jì)與用戶的意圖相對(duì)應(yīng)的功能;當(dāng)估計(jì)的功能需要個(gè)人信息時(shí),計(jì)算第一和第二語音識(shí)別數(shù)據(jù)之間的相似度;以及基于計(jì)算的相似度來選擇第一和第二語音識(shí)別數(shù)據(jù)中的任意一個(gè)。
[0008]根據(jù)實(shí)施例,語音識(shí)別方法可以進(jìn)一步包括:當(dāng)估計(jì)的功能不需要個(gè)人信息時(shí)忽略第二語音識(shí)別數(shù)據(jù)。
[0009]根據(jù)實(shí)施例,所述獲取第一語音識(shí)別數(shù)據(jù)可以包括:將用于請(qǐng)求第一語音識(shí)別數(shù)據(jù)的請(qǐng)求信號(hào)發(fā)送到服務(wù)器;以及響應(yīng)于請(qǐng)求信號(hào)從服務(wù)器接收第一語音識(shí)別數(shù)據(jù)。
[0010]根據(jù)實(shí)施例,語音識(shí)別方法可以進(jìn)一步包括:獲得在服務(wù)器和移動(dòng)終端之間連接的網(wǎng)絡(luò)的狀態(tài)信息;以及基于網(wǎng)絡(luò)的狀態(tài)信息來阻止第一語音識(shí)別數(shù)據(jù)的接收。此外,語音識(shí)別方法可以進(jìn)一步包括:當(dāng)阻止第一語音識(shí)別數(shù)據(jù)的接收時(shí),使用第二語音識(shí)別數(shù)據(jù)來執(zhí)行估計(jì)的功能。
[0011]根據(jù)實(shí)施例,語音識(shí)別方法可以進(jìn)一步包括顯示用于執(zhí)行個(gè)人信息保護(hù)功能的菜單按鈕;以及當(dāng)響應(yīng)于對(duì)菜單按鈕的觸摸輸入而執(zhí)行個(gè)人信息保護(hù)功能時(shí),阻止接收到的語音被提供給第一語音識(shí)別引擎。此外,語音識(shí)別方法可以進(jìn)一步包括使用所選擇的任意一個(gè)語音識(shí)別數(shù)據(jù)來執(zhí)行估計(jì)的功能。
[0012]根據(jù)實(shí)施例,所述獲取第二語音識(shí)別數(shù)據(jù)可以包括參考用于個(gè)人信息的數(shù)據(jù)庫來識(shí)別接收到的語音。
[0013]本公開的實(shí)施例涉及一種連接服務(wù)器的移動(dòng)終端。移動(dòng)終端可以包括麥克風(fēng),該麥克風(fēng)被配置成接收用戶的語音;通信單元,該通信單元被配置成將接收的語音發(fā)送到服務(wù)器,并且接收第一語音識(shí)別數(shù)據(jù),該第一語音識(shí)別數(shù)據(jù)作為通過在服務(wù)器中提供的第一語音識(shí)別引擎識(shí)別接收到的語音的結(jié)果而生成;第二語音識(shí)別引擎,該第二語音識(shí)別引擎被配置成生成第二語音識(shí)別數(shù)據(jù)作為識(shí)別接收到的語音的結(jié)果;以及控制器,該控制器被配置成基于第一和第二語音識(shí)別數(shù)據(jù)中的至少一個(gè)來估計(jì)與用戶的意圖相對(duì)應(yīng)的功能;以及當(dāng)估計(jì)的功能需要個(gè)人信息時(shí)計(jì)算第一和第二語音識(shí)別數(shù)據(jù)之間的相似度;以及基于計(jì)算的相似度來選擇第一和第二語音識(shí)別數(shù)據(jù)中的任意一個(gè)。
[0014]根據(jù)實(shí)施例,當(dāng)估計(jì)的功能不需要個(gè)人信息時(shí),控制器可以忽略第二語音識(shí)別數(shù)據(jù)。
[0015]根據(jù)實(shí)施例,控制器可以獲得在服務(wù)器和移動(dòng)終端之間連接的網(wǎng)絡(luò)的狀態(tài)信息,以及基于網(wǎng)絡(luò)的狀態(tài)信息來阻止第一語音識(shí)別數(shù)據(jù)的接收。此外,當(dāng)?shù)谝徽Z音識(shí)別數(shù)據(jù)的接收被阻止時(shí),控制器使用第二語音識(shí)別數(shù)據(jù)可以執(zhí)行估計(jì)的功能。
[0016]根據(jù)實(shí)施例,移動(dòng)終端可以進(jìn)一步包括顯示單元,該顯示單元被配置成顯示用于執(zhí)行個(gè)人信息保護(hù)功能的菜單按鈕。此外,當(dāng)響應(yīng)于對(duì)菜單按鈕的觸摸輸入而執(zhí)行個(gè)人信息保護(hù)功能時(shí),控制器可以阻止接收到的語音被提供給第一語音識(shí)別引擎。
[0017]根據(jù)實(shí)施例,控制器可以使用所選擇的任意一個(gè)語音識(shí)別數(shù)據(jù)來執(zhí)行估計(jì)的功倉泛。
[0018]根據(jù)實(shí)施例,第二語音識(shí)別引擎可以參考用于個(gè)人信息的數(shù)據(jù)庫來識(shí)別接收到的語音。
【專利附圖】
【附圖說明】
[0019]附圖被包括以提供本發(fā)明的進(jìn)一步理解,并且被并入到本說明書中且組成本說明書的一部分,所述附圖圖示了本發(fā)明的實(shí)施例并且連同描述一起用作解釋本發(fā)明的原理。
[0020]在附圖中:
[0021]圖1是圖示與本公開的實(shí)施例相關(guān)聯(lián)的移動(dòng)終端的框圖;
[0022]圖2A和圖2B是圖示與本公開相關(guān)聯(lián)的移動(dòng)終端的外觀的透視圖;
[0023]圖3是圖示根據(jù)本公開的實(shí)施例的語音識(shí)別系統(tǒng)的框圖;
[0024]圖4是用于解釋根據(jù)本公開的實(shí)施例的移動(dòng)終端的語音識(shí)別方法的流程圖;
[0025]圖5和圖6是用于解釋根據(jù)本公開的實(shí)施例的與是否接收到語音識(shí)別數(shù)據(jù)相關(guān)聯(lián)的移動(dòng)終端的語音識(shí)別方法的流程圖;
[0026]圖7是用于解釋根據(jù)本公開的實(shí)施例的與個(gè)人信息保護(hù)功能相關(guān)聯(lián)的移動(dòng)終端的語音識(shí)別方法的流程圖;
[0027]圖8是圖示應(yīng)用了圖7的語音識(shí)別方法的移動(dòng)終端的用戶界面的概念視圖;
[0028]圖9是用于解釋根據(jù)本公開的實(shí)施例的與對(duì)于語音識(shí)別數(shù)據(jù)的用戶選擇相關(guān)聯(lián)的移動(dòng)終端的語音識(shí)別方法的流程圖;以及
[0029]圖10是圖示應(yīng)用了圖9的語音識(shí)別方法的移動(dòng)終端的用戶界面的概念視圖?!揪唧w實(shí)施方式】
[0030]在下文中,將參考附圖詳細(xì)地描述本發(fā)明的優(yōu)選實(shí)施例,以達(dá)到本發(fā)明所屬領(lǐng)域的普通技術(shù)人員能夠容易地具體化本發(fā)明的程度。然而,可以以各種不同的形式實(shí)現(xiàn)本發(fā)明,并且因此,本發(fā)明不限于圖示的實(shí)施例。為了清楚地描述本發(fā)明,省略了與描述無關(guān)的部分,并且在整個(gè)說明書中相同的附圖標(biāo)記指定相同的組成元件。
[0031]在此公開的移動(dòng)終端可以包括便攜式電話、智能電話、膝上型計(jì)算機(jī)、數(shù)字廣播移動(dòng)終端、個(gè)人數(shù)字助理(PDA)、便攜式多媒體播放器(PMP)、導(dǎo)航儀等。然而,本領(lǐng)域的技術(shù)人員容易地理解的是,除了為移動(dòng)用途特別地配置的組成元件之外,根據(jù)以下描述的配置可以適用于諸如數(shù)字TV、臺(tái)式計(jì)算機(jī)等的固定終端。
[0032]圖1是圖示與本公開相關(guān)聯(lián)的移動(dòng)終端100的框圖。參考圖1,移動(dòng)終端100可以包括:無線通信單元110、音頻/視頻(A/V)輸入單元120、用戶輸入單元130、感測(cè)單元140、輸出單元150、存儲(chǔ)器160、接口單元170、控制器180、電源單元190等。然而,如圖1中圖示的組成元件不是必須要求的,并且可以利用比那些示出的元件更多或者更少的元件來實(shí)現(xiàn)移動(dòng)通信終端。
[0033]在下文中,將依序描述移動(dòng)終端100的組成元件110-190。
[0034]無線通信單元110可以包括一個(gè)或者多個(gè)元件,該一個(gè)或多個(gè)元件允許在移動(dòng)終端100和無線通信系統(tǒng)之間進(jìn)行無線電通信,或者允許在移動(dòng)終端100和移動(dòng)終端100所位于的網(wǎng)絡(luò)之間進(jìn)行無線電通信。例如,無線通信單元110可以包括廣播接收模塊111、移動(dòng)通信模塊112、無線因特網(wǎng)模塊113、短程通信模塊114、位置信息模塊115等。
[0035]廣播接收模塊111通過廣播信道從外部廣播管理服務(wù)器接收廣播信號(hào)和/或廣播關(guān)聯(lián)信息。廣播關(guān)聯(lián)信息可以指的是關(guān)于廣播信道、廣播節(jié)目、廣播服務(wù)提供商等的信息。也可以通過移動(dòng)通信網(wǎng)絡(luò)來提供廣播關(guān)聯(lián)信息。在這樣的情況下,可以由移動(dòng)通信模塊112接收廣播關(guān)聯(lián)信息。通過廣播接收模塊111接收到的廣播信號(hào)和廣播關(guān)聯(lián)信息可以被存儲(chǔ)在存儲(chǔ)器160中。
[0036]移動(dòng)通信模塊112通過移動(dòng)通信網(wǎng)絡(luò)將無線電信號(hào)傳送到基站、外部終端以及服務(wù)器中的至少一個(gè),和/或從基站、外部終端以及服務(wù)器中的至少一個(gè)接收無線電信號(hào)。無線電信號(hào)可以包括語音呼叫信號(hào)、視頻呼叫信號(hào)或根據(jù)文本和/或多媒體消息傳送和接收的各種類型的數(shù)據(jù)。
[0037]作為用于支持無線因特網(wǎng)接入的模塊的無線因特網(wǎng)模塊113可以被內(nèi)置在移動(dòng)終端100中,或者被外部地安裝到移動(dòng)終端100。可以使用各種無線因特網(wǎng)接入技術(shù),諸如WLAN (無線LAN)、W1-F1、Wibro (無線寬帶)、Wimax (全球微波接入互操作性)、HSDPA (高速下行鏈路分組接入)等。
[0038]短程通信模塊114指的是用于支持短程通信的模塊??梢允褂酶鞣N短程通信技術(shù),諸如藍(lán)牙、射頻識(shí)別(RFID)、紅外數(shù)據(jù)協(xié)會(huì)(IrDA)、超寬帶(UWB)、紫蜂(ZigBee)等。
[0039]位置信息模塊115是用于獲取移動(dòng)終端100的位置的模塊,并且存在著作為代表性示例的GPS模塊。[0040]隨后,參考圖1,A/V (音頻/視頻)輸入單元120接收音頻或者視頻信號(hào),并且A/V (音頻/視頻)輸入單元120可以包括相機(jī)121、麥克風(fēng)122等。相機(jī)121在視頻電話呼叫或者圖像捕捉模式中處理由圖像傳感器獲得的圖像幀,諸如靜止或者活動(dòng)圖像。已處理的圖像幀可以被顯示在顯示單元151上。由相機(jī)121處理的圖像幀可以被存儲(chǔ)在存儲(chǔ)器160中或者通過無線通信單元110被傳送到外部設(shè)備。根據(jù)移動(dòng)終端的使用環(huán)境可以提供兩個(gè)或者更多相機(jī)121。
[0041]麥克風(fēng)122在電話呼叫模式、記錄模式、語音識(shí)別模式等中通過麥克風(fēng)接收外部音頻信號(hào),并且將音頻信號(hào)處理成電子語音數(shù)據(jù)。已處理的語音數(shù)據(jù)可以被轉(zhuǎn)換成在電話呼叫模式中通過移動(dòng)通信模塊112可傳送到移動(dòng)通信基站的格式,并且被輸出。麥克風(fēng)122可以實(shí)現(xiàn)各種類型的噪聲消除算法,以消除在接收外部音頻信號(hào)的處理期間生成的噪聲。
[0042]用戶輸入單元130可以生成用于控制終端100的操作的輸入數(shù)據(jù)。用戶輸入單元130可以配置有鍵盤、圓頂開關(guān)、觸摸板(壓力/電容)、轉(zhuǎn)向輪(jog wheel)、轉(zhuǎn)向開關(guān)等。
[0043]感測(cè)單元140檢測(cè)用戶接觸的存在或者不存在、以及諸如打開或者關(guān)閉配置的移動(dòng)終端100的當(dāng)前狀態(tài)、移動(dòng)終端100的位置、移動(dòng)終端100的方位、移動(dòng)終端100的加速或者減速等,并且生成用于控制移動(dòng)終端100的操作的感測(cè)信號(hào)。例如,當(dāng)移動(dòng)終端100是滑蓋電話類型時(shí),感測(cè)單元140可以感測(cè)滑蓋電話的打開或者關(guān)閉配置。此外,感測(cè)單元140可以感測(cè)是否從電源單元190供應(yīng)電力、或者外部設(shè)備是否被耦合到接口單元170。
[0044]感測(cè)單元140可以包括接近傳感器141。此外,感測(cè)單元140可以包括用于感測(cè)對(duì)于顯示單元151的觸摸操作的觸摸傳感器(未示出)。
[0045]觸摸傳感器可以被實(shí)現(xiàn)為觸摸膜、觸摸片、觸摸板等。觸摸傳感器可以被配置成將施加給顯示單元151的特定部分的壓力、或者從顯示單元151的特定部分生成的電容轉(zhuǎn)換為電輸入信號(hào)。觸摸傳感器可以被配置成不僅感測(cè)被觸摸的位置和被觸摸的區(qū)域,而且感測(cè)觸摸壓力。
[0046]當(dāng)觸摸傳感器和顯示單元151形成夾層結(jié)構(gòu)時(shí),顯示單元151可以被用作輸入裝置,而不是輸出裝置。顯示單元151可以被稱為“觸摸屏”。
[0047]當(dāng)存在通過觸摸屏的觸摸輸入時(shí),對(duì)應(yīng)的信號(hào)可以被傳送到觸摸控制器(未示出)。觸摸控制器處理從觸摸傳感器傳遞的信號(hào),然后將與被處理的信號(hào)相對(duì)應(yīng)的數(shù)據(jù)傳送到控制器180。因此,控制器180可以感測(cè)到已經(jīng)觸摸了顯示單元151的哪個(gè)區(qū)域。
[0048]當(dāng)觸摸屏是電容類型時(shí),通過根據(jù)感測(cè)對(duì)象的接近度的電磁場(chǎng)變化來檢測(cè)感測(cè)對(duì)象的接近。觸摸屏可以被分類為接近傳感器141。
[0049]接近傳感器141指的是在沒有機(jī)械接觸的情況下使用電磁場(chǎng)或者紅外線來檢測(cè)感測(cè)對(duì)象的存在或者不存在的傳感器。接近傳感器141具有比接觸傳感器更長(zhǎng)的壽命和更加增強(qiáng)的實(shí)用性。接近傳感器141可以包括透光型光電傳感器、直接反射型光電傳感器、鏡反射型光電傳感器、高頻振蕩接近傳感器、電容型接近傳感器、磁型接近傳感器、紅外線接近傳感器等。
[0050]在下文中,為了便于簡(jiǎn)要解釋起見,密切地靠近觸摸屏而沒有接觸的行為將會(huì)被稱為“接近觸摸”,而指示器實(shí)質(zhì)上接觸觸摸屏的行為將會(huì)被稱為“接觸觸摸”。
[0051]接近傳感器141感測(cè)接近觸摸和接近觸摸模式(例如,距離、方向、速度、時(shí)間、位置、移動(dòng)狀態(tài)等)。可以向觸摸屏上輸出與感測(cè)到的接近觸摸和感測(cè)到的接近觸摸模式有關(guān)的信息。
[0052]輸出單元150可以生成與視覺、聽覺、觸覺有關(guān)的輸出。輸出單元150可以包括顯示單元151、音頻輸出模塊152、報(bào)警單元153、觸覺模塊154等。
[0053]顯示單元151可以顯示(輸出)在移動(dòng)終端100中處理的信息。例如,當(dāng)移動(dòng)終端100在電話呼叫模式下操作時(shí),顯示單元151可以顯示與電話呼叫有關(guān)的用戶界面(UI)或者圖形用戶界面(GUI)。當(dāng)移動(dòng)終端100在視頻呼叫模式或者圖像捕捉模式下操作時(shí),顯示單元151可以顯示捕捉的圖像、接收到的圖像、U1、⑶I等。
[0054]顯示單元151可以包括液晶顯示器(IXD)、薄膜晶體管液晶顯示器(TFT-1XD)、有機(jī)發(fā)光二極管(OLED)顯示器、柔性顯示器、三維(3D)顯示器、以及電子墨水顯示器中的至少一個(gè)。
[0055]包括在顯示單元151中的顯示器(或者顯示裝置)中的至少一個(gè)可以被配置為透明的或者透光型,以允許用戶通過其觀看外部。其可以被稱為透明顯示器。典型的透明顯示器的示例可以是透明OLED (TOLED)等。顯示單元151的背面結(jié)構(gòu)也可以被配置為透光型。在此配置下,用戶能夠通過由移動(dòng)終端主體的顯示單元151占據(jù)的區(qū)域來觀看定位在移動(dòng)終端主體的后側(cè)的對(duì)象。
[0056]根據(jù)移動(dòng)終端100的實(shí)現(xiàn),可以存在兩個(gè)或者更多顯示單元151。例如,多個(gè)顯示單元151分別可以以單獨(dú)的或者一體化的方式被放置在一個(gè)表面上,或者可以被分別放置在不同的表面上。
[0057]音頻輸出模塊152可以在呼叫接收模式、呼叫撥打模式、記錄模式、語音選擇模式、廣播接收模式等中輸出從無線通信單元110接收到的或者存儲(chǔ)在存儲(chǔ)器160中的音頻數(shù)據(jù)。音頻輸出模塊152可以輸出與在移動(dòng)終端100中執(zhí)行的功能有關(guān)的音頻信號(hào)(例如,告警接收到呼叫或者接收到消息等的聲音)。音頻輸出模塊152可以包括接收器、揚(yáng)聲器、蜂鳴器等。
[0058]報(bào)警單元153輸出用于通知來自于移動(dòng)終端100的事件的發(fā)生的信號(hào)。從移動(dòng)終端100發(fā)生的事件的示例可以包括接收到呼叫、接收到消息、鍵信號(hào)輸入、觸摸輸入等。報(bào)警單元153不僅可以輸出視頻或者音頻信號(hào),而且可以輸出其他類型的信號(hào),諸如以振動(dòng)的方式通知事件的發(fā)生的信號(hào)。因?yàn)榭梢酝ㄟ^顯示單元151或者音頻輸出單元152輸出視頻或者音頻信號(hào),所以顯示單元151和音頻輸出模塊152可以被分類為報(bào)警單元153的一部分。
[0059]觸覺模塊154生成用戶能夠感覺的各種觸覺效果。通過觸覺模塊154生成的觸覺效果的代表性示例可以包括振動(dòng)。通過觸覺模塊154生成的振動(dòng)可以具有可控制的強(qiáng)度、可控制的模式等。例如,可以以合成的方式或者以順序的方式輸出不同的振動(dòng)。
[0060]觸覺模塊154可以生成各種觸覺效果,不僅包括振動(dòng),而且包括相對(duì)于被觸摸的皮膚表面垂直移動(dòng)的針的布置、通過噴射端口或者吸入端口的空氣噴射力或者空氣吸入力、通過皮膚表面的觸摸、與電極的接觸、通過諸如靜電力的刺激的效果、使用吸熱裝置或者發(fā)熱裝置而再現(xiàn)冷或者熱的感覺等。
[0061]觸覺模塊154可以被配置成通過用戶的直接接觸,或者使用手指或者手的用戶肌肉感覺來傳送觸覺效果。根據(jù)移動(dòng)終端100的配置,可以提供兩個(gè)或者更多觸覺模塊154。
[0062]存儲(chǔ)器160可以存儲(chǔ)用于操作控制器180的程序,或者暫時(shí)地存儲(chǔ)輸入/輸出數(shù)據(jù)(例如,電話簿、消息、靜止圖像、運(yùn)動(dòng)圖像等)。存儲(chǔ)器160可以存儲(chǔ)與在觸摸屏上執(zhí)行觸摸輸入時(shí)輸出的各種模式的振動(dòng)和聲音有關(guān)的數(shù)據(jù)。
[0063]使用包括閃存型、硬盤型、多媒體卡微型、存儲(chǔ)卡型(例如,SD或者DX存儲(chǔ)器)、隨機(jī)存取存儲(chǔ)器(RAM)、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)、只讀存儲(chǔ)器(ROM)、電可擦除可編程只讀存儲(chǔ)器(EEPR0M)、可編程只讀存儲(chǔ)器(PR0M)、磁存儲(chǔ)器、磁盤、光盤等的任何類型的適合的存儲(chǔ)介質(zhì)可以實(shí)現(xiàn)存儲(chǔ)器160。此外,移動(dòng)終端100可以操作在因特網(wǎng)上執(zhí)行存儲(chǔ)器160的存儲(chǔ)功能的網(wǎng)絡(luò)存儲(chǔ)器。
[0064]接口單元170通常可以被實(shí)現(xiàn)成與將便攜式終端與外部設(shè)備對(duì)接。接口單元170可以允許接收來自于外部設(shè)備的數(shù)據(jù),將電力遞送給移動(dòng)終端100的每個(gè)組件,或者將來自于移動(dòng)終端100的數(shù)據(jù)傳送到外部設(shè)備。例如,接口單元170可以包括有線/無線頭戴式耳機(jī)端口、外部充電器端口、有線/無線數(shù)據(jù)端口、存儲(chǔ)卡端口、用于耦合具有識(shí)別模塊的裝置的端口、音頻輸入/輸出(I/O)端口、視頻I/O端口、耳機(jī)端口等。
[0065]識(shí)別模塊可以被配置為用于存儲(chǔ)認(rèn)證使用移動(dòng)終端100的權(quán)限所需要的各種信息的芯片,其可以包括用戶身份模塊(ΠΜ)、訂戶身份模塊(SM)等。此外,可以用一種類型的智能卡實(shí)現(xiàn)具有識(shí)別模塊的裝置(在下文中,被稱為“識(shí)別裝置”)。因此,識(shí)別裝置可以經(jīng)由端口耦合到移動(dòng)終端100。
[0066]接口單元170可以用作當(dāng)移動(dòng)終端100被連接到外部托架時(shí)將電力從外部托架供應(yīng)到移動(dòng)終端100的路徑,或者將用戶從托架輸入的各種命令信號(hào)傳輸?shù)揭苿?dòng)終端100的路徑。從托架輸入的這樣的各種命令信號(hào)或者電力可以作為用于識(shí)別移動(dòng)終端100已經(jīng)被精確地安裝到托架的信號(hào)而操作。
[0067]控制器180通??刂埔苿?dòng)終端100的整體操作。例如,控制器180執(zhí)行與電話呼口4、數(shù)據(jù)通信、視頻呼叫等有關(guān)的控制和處理??刂破?80可以包括多媒體模塊181,該多媒體模塊181提供多媒體重放。多媒體模塊181可以被配置為控制器180的部分或者單獨(dú)的組件。控制器180能夠執(zhí)行模式識(shí)別處理,以便將觸摸屏上的書寫或者繪圖輸入識(shí)別為文本或者圖像。
[0068]電源單元190可以在控制器180的控制下接收外部電力或內(nèi)部電力,以提供各種組件所需要的電力。
[0069]使用軟件、硬件、或者其任何組合在計(jì)算機(jī)或者類似裝置可讀介質(zhì)中可以實(shí)現(xiàn)在此描述的各種實(shí)施例。
[0070]對(duì)于硬件實(shí)現(xiàn),它可以通過使用專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理裝置(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、處理器、控制器、微控制器和被設(shè)計(jì)成執(zhí)行在此描述的功能的電子單元中的至少一個(gè)來實(shí)現(xiàn)。在一些情況下,可以在控制器180本身中實(shí)現(xiàn)這樣的實(shí)施例。
[0071]對(duì)于軟件實(shí)現(xiàn),可以與允許執(zhí)行至少一個(gè)功能或者操作的單獨(dú)的軟件模塊一起來實(shí)現(xiàn)諸如過程或者功能的實(shí)施例。通過以任何適合的編程語言編寫的軟件應(yīng)用能夠?qū)崿F(xiàn)軟件代碼。軟件代碼可以被存儲(chǔ)在存儲(chǔ)器160中并且由控制器180執(zhí)行。
[0072]在下文中,將描述處理對(duì)移動(dòng)終端100的用戶輸入的方法。
[0073]用戶輸入單元130被操縱以接收用于控制移動(dòng)終端100的操作的命令,并且可以包括多個(gè)操縱單元。操縱單元可以被共同地指定為操縱部分,并且如果它是允許用戶利用觸感執(zhí)行操縱的觸覺方式,則可以采用任何方法。
[0074]各種視覺信息可以被顯示在顯示單元151上??梢砸宰址?、數(shù)字、符號(hào)、圖形、圖標(biāo)等的形式顯示視覺信息。對(duì)于視覺信息的輸入,可以利用預(yù)定的布置顯示字符、數(shù)字、符號(hào)、圖形、以及圖標(biāo)中的至少一個(gè),以便以鍵盤的形式來實(shí)現(xiàn)。這樣的鍵盤可以被稱為所謂的“軟鍵”。
[0075]顯示單元151可以在整個(gè)區(qū)域上進(jìn)行操作或者通過劃分成多個(gè)區(qū)域來進(jìn)行操作。在后述情況下,多個(gè)區(qū)域可以被配置成以相關(guān)聯(lián)的方式進(jìn)行操作。例如,輸出窗口和輸入窗口可以分別被顯示在顯示單元151的上部分和下部分上。輸出窗口和輸入窗口分別可以是被分配以輸出或者輸入信息的區(qū)域。在輸入窗口上輸出軟鍵,在該軟鍵上顯不用于輸入電話號(hào)碼等的數(shù)字。當(dāng)軟鍵被觸摸時(shí),與被觸摸的軟鍵相對(duì)應(yīng)的數(shù)字被顯示在輸出窗口上。當(dāng)?shù)谝徊倏v單元被操縱時(shí),將試圖進(jìn)行對(duì)于顯示在輸出窗口上的電話號(hào)碼的電話呼叫連接,或者顯示在輸出窗口上的文本將被輸入到應(yīng)用。
[0076]顯示單元151或者觸摸板可以被配置成感測(cè)觸摸滾動(dòng)。通過滾動(dòng)顯示單元151或者觸摸板,用戶可以移動(dòng)顯示在顯示單元151上的對(duì)象,例如,被放置在圖標(biāo)上的光標(biāo)或者指示器等。此外,當(dāng)在顯示單元151或者觸摸板上移動(dòng)手指時(shí),通過手指移動(dòng)的路徑可以被視覺地顯示在顯示單元151上。這對(duì)于編輯顯示在顯示單元151上的圖像來說可以是有用的。
[0077]為了應(yīng)對(duì)在預(yù)定的時(shí)間段內(nèi)一起觸摸顯示單元151和觸摸板的情況,可以實(shí)現(xiàn)終端100的一個(gè)功能。對(duì)于被一起觸摸的情況,存在當(dāng)用戶使用他的或者她的拇指和食指夾住移動(dòng)終端100的主體時(shí)的情況。例如,對(duì)于在移動(dòng)終端100中實(shí)現(xiàn)的上述功能之一,可以存在對(duì)于顯示單元151或者觸摸板的激活或者去激活。
[0078]圖2A和圖2B是圖示與本公開有關(guān)的移動(dòng)終端100的外觀的透視圖。圖2A是圖示移動(dòng)終端100的如視圖和側(cè)視圖,并且圖2B是圖不移動(dòng)終端100的后視圖和另一側(cè)視圖。
[0079]參考圖2A,在此公開的移動(dòng)終端100被設(shè)置具有直板式終端主體。然而,本發(fā)明不僅限于這種類型的終端,而且可應(yīng)用于諸如滑蓋式、折疊式、旋轉(zhuǎn)式、旋蓋式等的各種結(jié)構(gòu)的終端,在其中,以相對(duì)可移動(dòng)的方式相互組合兩個(gè)或者多個(gè)主體。
[0080]終端主體包括形成終端的外觀的殼體(外殼、外罩、蓋等)。在該實(shí)施例中,殼體可以被劃分為前殼體101和后殼體102。各種電子組件可以被集成在前殼體101和后殼體102之間形成的空間中。至少一個(gè)中間殼體可以被附加地設(shè)置在前殼體101和后殼體102之間。
[0081]殼體可以通過注模成型合成樹脂來形成,或者也可以由諸如不銹鋼(STS)^i(Ti)等的金屬材料來形成。
[0082]顯示單元151、音頻輸出模塊152、相機(jī)121、用戶輸入單元130(參考圖1)、麥克風(fēng)122、接口 170等可以被布置在終端主體上,主要在前殼體101上。
[0083]顯示單元151占據(jù)前殼體101的大部分。音頻輸出單元152和相機(jī)121被設(shè)置在與顯示單元151的兩端中的一端相鄰的區(qū)域上,并且用戶輸入單元131和麥克風(fēng)122被設(shè)置在與其另一端相鄰的區(qū)域上。用戶接口 132和接口 170等可以被設(shè)置在前殼體101和后殼體102的橫向表面上。
[0084]用戶輸入單元130被操縱以接收用于控制便攜式終端100的操作的命令。用戶輸入單元130可以包括多個(gè)操縱單元131、132。[0085]第一和第二操縱單元131、132可以接收各種命令。例如,第一操縱單元131可以被用于接收命令,諸如開始、結(jié)束、滾動(dòng)等。第二操縱單元132可以被用于接收命令,諸如控制從音頻輸出單元152輸出的音量級(jí)別、或者將其切換到顯示單元151的觸摸識(shí)別模式。
[0086]參考圖2B,相機(jī)121’可以被附加地安裝在終端主體的后表面,即,后殼體102上。后相機(jī)121’具有大體上與前相機(jī)121 (參考圖2A)的方向相對(duì)的圖像捕捉方向,并且可以具有與前相機(jī)121的像素不同數(shù)目的像素。
[0087]例如,前相機(jī)121可以被配置成具有相對(duì)少量的像素,并且后相機(jī)121’可以被配置成具有相對(duì)大量的像素。因此,在前相機(jī)121被用于視頻通信的情況下,當(dāng)用戶捕捉他的或者她自己的面部并且將其實(shí)時(shí)地發(fā)送到另一方時(shí),這能夠減少傳輸數(shù)據(jù)的大小。另一方面,后相機(jī)121’可以被用于存儲(chǔ)高質(zhì)量圖像的用途。
[0088]另一方面,相機(jī)121、121’可以被以可旋轉(zhuǎn)的和可彈出的方式設(shè)置在終端主體中。
[0089]閃光燈123和鏡子124可以被附加地設(shè)置為與后相機(jī)121’相鄰。當(dāng)利用相機(jī)121’捕捉對(duì)象時(shí),閃光燈123朝著該對(duì)象發(fā)光。當(dāng)通過使用后相機(jī)121’捕捉他自己或者她自己(以自拍模式)時(shí),鏡子124允許用戶以反射的方式看著他或者她自己的面部等。
[0090]后音頻輸出單元152’可以被附加地設(shè)置在終端主體的后表面上。后音頻輸出單元152’與前音頻輸出單元152 (參考圖2A) —起能夠?qū)崿F(xiàn)立體聲功能,并且其也可以被用于實(shí)現(xiàn)電話呼叫期間的揚(yáng)聲器電話模式。
[0091]用于接收廣播信號(hào)的天線116可以被附加地設(shè)置在終端主體的橫向表面上。組成廣播接收模塊111 (參考圖1)的部分的天線116可以被設(shè)置成從終端主體中拉出。
[0092]用于將電力供應(yīng)給便攜式終端100的電源單元190可以被安裝在終端主體上。電源單元190可以被配置成合并在終端主體中,或者可直接地從終端主體的外部拆卸。
[0093]用于檢測(cè)觸摸的觸摸板135可以被附加地安裝在后殼體102上。與顯示單元151(參考圖2A)相類似地,可以以透光型來配置觸摸板135。可替選地,用于顯示視覺信息的后顯示單元可以被附加地安裝在觸摸板135上。這時(shí),可以通過觸摸板135來控制顯示在前顯示單元151和后顯示單元的兩個(gè)表面上的信息。
[0094]可以與前殼體101的顯示單元151協(xié)同地操作觸摸板135。觸摸板135可以被平行地設(shè)置在顯示單元151的后側(cè)。觸摸板135可以具有與顯示單元151相同的大小或者比顯示單元151小的大小。
[0095]圖3是圖示根據(jù)本公開的實(shí)施例的語音識(shí)別系統(tǒng)的框圖。參考圖3,語音識(shí)別系統(tǒng)可以包括通過網(wǎng)絡(luò)相互連接的服務(wù)器200和移動(dòng)終端300,以使用分布式資源處理語音識(shí)另O。換言之,語音識(shí)別系統(tǒng)可以實(shí)現(xiàn)分布式語音識(shí)別技術(shù)。
[0096]服務(wù)器200可以包括第一語音識(shí)別引擎210和第一數(shù)據(jù)庫220。第一語音識(shí)別引擎210可以參考第一數(shù)據(jù)庫220識(shí)別由移動(dòng)終端300提供的語音,在該第一數(shù)據(jù)庫220中以一般信息指定信息域。結(jié)果,第一語音識(shí)別引擎210可以生成第一語音識(shí)別數(shù)據(jù)。服務(wù)器200可以將由第一語音識(shí)別引擎210生成的第一語音識(shí)別數(shù)據(jù)發(fā)送到移動(dòng)終端300。
[0097]移動(dòng)終端300可以包括麥克風(fēng)310、第二語音識(shí)別引擎320、第二數(shù)據(jù)庫330、通信單元340、顯示單元350、以及控制器360。麥克風(fēng)310可以接收用戶的語音。第二語音識(shí)別引擎320可以參考第二數(shù)據(jù)庫330識(shí)別通過麥克風(fēng)310接收到的語音,在該第二數(shù)據(jù)庫330中以個(gè)人信息指定信息域。結(jié)果,第二語音識(shí)別引擎320可以生成第二語音識(shí)別數(shù)據(jù)。通信單元340可以通過麥克風(fēng)310將接收到的語音發(fā)送到服務(wù)器200,并且響應(yīng)于其從服務(wù)器接收第一語音識(shí)別數(shù)據(jù)。顯示單元350可以顯示與語音識(shí)別相關(guān)聯(lián)的各種信息和控制菜單。控制器360可以控制與語音識(shí)別相關(guān)聯(lián)的移動(dòng)終端的整體操作。
[0098]在下文中,將會(huì)詳細(xì)地描述第一和第二語音識(shí)別引擎210、310的語音識(shí)別處理。為了便于解釋,第一和第二語音識(shí)別引擎210、310被共同地稱為語音識(shí)別引擎,并且第一和第二數(shù)據(jù)庫220、330被共同地稱為數(shù)據(jù)庫,并且第一和第二語音識(shí)別數(shù)據(jù)被共同地稱為語音識(shí)別數(shù)據(jù)。
[0099]語音識(shí)別引擎在數(shù)據(jù)庫的信息域中使用語音識(shí)別算法分析接收到(輸入)的語音的意義和上下文。為此,使用語音至文本(STT)算法,語音可以被轉(zhuǎn)換成文本形式的數(shù)據(jù)并且被存儲(chǔ)在數(shù)據(jù)庫中。
[0100]使用語音識(shí)別算法可以將用戶的語音轉(zhuǎn)換成多個(gè)數(shù)據(jù)。在這樣的情況下,語音識(shí)別引擎可以確定用于多個(gè)數(shù)據(jù)的識(shí)別率,并且選擇多個(gè)數(shù)據(jù)當(dāng)中的具有最高識(shí)別率的數(shù)據(jù)作為語音識(shí)別結(jié)果。
[0101]圖4是用于解釋根據(jù)本公開的實(shí)施例的移動(dòng)終端300的語音識(shí)別方法的流程圖。參考圖4,執(zhí)行通過麥克風(fēng)310接收用戶的語音的處理(S102)。
[0102]接下來,執(zhí)行將接收到的語音提供給第一語音識(shí)別引擎210和第二語音識(shí)別引擎320的處理(S104)??梢酝ㄟ^麥克風(fēng)310將語音發(fā)送到服務(wù)器200,并且將其提供給第一語音識(shí)別引擎210。這時(shí),根據(jù)網(wǎng)絡(luò)狀態(tài)可以阻止到服務(wù)器200的語音傳輸。
[0103]然后,執(zhí)行獲取第一語音識(shí)別數(shù)據(jù)作為通過第一語音識(shí)別引擎識(shí)別語音的結(jié)果的處理(S106)。可以從服務(wù)器200接收第一語音識(shí)別數(shù)據(jù)。這時(shí),根據(jù)網(wǎng)絡(luò)狀態(tài)可以阻止來自于服務(wù)器200的語音識(shí)別。此外,執(zhí)行獲取第二語音識(shí)別數(shù)據(jù)作為通過第二語音識(shí)別引擎320識(shí)別語音的結(jié)果的處理(S108)。
[0104]接下來,執(zhí)行基于第一和第二語音識(shí)別數(shù)據(jù)中的至少一個(gè)來估計(jì)與用戶的意圖相對(duì)應(yīng)的功能的處理(S110 )。例如,通過口語理解(SLU )工作可以估計(jì)與用戶的意圖相對(duì)應(yīng)的功能。SLU工作指的是從語音識(shí)別的句子中提取有意義的信息以推斷用戶的意圖,主要是,提取諸如主要行為、言語動(dòng)作、所命名的實(shí)體等的信息。在此,主要?jiǎng)幼鞅硎驹谟脩舻恼f話中透露的用戶想要采取的特定行為,并且言語動(dòng)作表示諸如人、地點(diǎn)、組織、時(shí)間等的關(guān)鍵字信息。
[0105]接下來,執(zhí)行確定所估計(jì)的功能是否要求個(gè)人信息(例如,聯(lián)系人信息等)的處理(S112)。例如,執(zhí)行電話呼叫功能需要呼叫對(duì)象的個(gè)人信息。當(dāng)所估計(jì)的功能要求個(gè)人信息時(shí),執(zhí)行當(dāng)所估計(jì)的功能要求個(gè)人信息時(shí)計(jì)算第一和第二語音識(shí)別數(shù)據(jù)之間的相似度的處理(S114)。在此,相似度能夠表示在相互比較的文本內(nèi)多個(gè)字符或者單詞彼此一致的比率。例如,當(dāng)“ABCD”與“ABCF”相比較時(shí),四個(gè)字符中的三個(gè)相同但是一個(gè)是不同的,并且因此,相似度可以被計(jì)算為75%。
[0106]執(zhí)行將計(jì)算的相似度與預(yù)定的基準(zhǔn)值(例如,80%)進(jìn)行比較的處理(S116)。當(dāng)計(jì)算的相似度小于基準(zhǔn)值時(shí),即,當(dāng)確定在第一和第二語音識(shí)別數(shù)據(jù)之間存在大的差異時(shí),執(zhí)行從第一和第二語音識(shí)別數(shù)據(jù)中選擇第一語音識(shí)別數(shù)據(jù)的處理(S118)。因此,所選擇的第一語音識(shí)別數(shù)據(jù)可以被用于執(zhí)行所估計(jì)的功能。這時(shí),通過所選擇的第一語音識(shí)別數(shù)據(jù)可以修改或者補(bǔ)充所估計(jì)的功能以用于其執(zhí)行。[0107]相反地,當(dāng)計(jì)算的相似度等于或者大于基準(zhǔn)值時(shí),即,當(dāng)確定在第一和第二語音識(shí)別數(shù)據(jù)中存在小的差異時(shí),執(zhí)行從第一和第二語音識(shí)別數(shù)據(jù)中選擇第二語音識(shí)別數(shù)據(jù)的處理(S120)。因此,所選擇的第二語音識(shí)別數(shù)據(jù)可以被用于執(zhí)行所估計(jì)的功能。這時(shí),通過所選擇的第二語音識(shí)別數(shù)據(jù)可以修改或者補(bǔ)充所估計(jì)的功能以用于其執(zhí)行。
[0108]另一方面,當(dāng)估計(jì)的功能不需要個(gè)人信息時(shí)執(zhí)行忽略第二語音識(shí)別數(shù)據(jù)的處理(S122)。因此,第一語音識(shí)別數(shù)據(jù)可以被用于執(zhí)行所估計(jì)的功能。
[0109]如上所述,根據(jù)本公開,在通過相互補(bǔ)充的遠(yuǎn)程語音識(shí)別引擎(第一語音識(shí)別引擎)和本地語音識(shí)別引擎(第二語音識(shí)別引擎)獲得的語音識(shí)別結(jié)果當(dāng)中,可以選擇和使用通過預(yù)定算法確定為具有高可靠性的語音識(shí)別結(jié)果,從而增強(qiáng)移動(dòng)終端300的語音識(shí)別率。
[0110]此外,根據(jù)本公開,當(dāng)在語音識(shí)別處理期間所估計(jì)的功能要求個(gè)人信息時(shí),可以使用通過本地語音識(shí)別引擎獲得的語音識(shí)別結(jié)果,從而防止與個(gè)人信息相關(guān)聯(lián)的語音被遠(yuǎn)程語音識(shí)別弓I擎識(shí)別。換言之,可以防止個(gè)人信息被泄露。
[0111]此外,根據(jù)本公開,能夠在網(wǎng)絡(luò)的故障狀態(tài)期間忽略遠(yuǎn)程語音識(shí)別引擎的語音識(shí)別結(jié)果,以消除從遠(yuǎn)程語音識(shí)別引擎接收語音識(shí)別結(jié)果所需要的延遲,從而增強(qiáng)語音識(shí)別的處理速度。
[0112]圖5和圖6是用于解釋根據(jù)本公開的實(shí)施例的與是否接收語音識(shí)別數(shù)據(jù)相關(guān)聯(lián)的移動(dòng)終端300的語音識(shí)別方法的流程圖。
[0113]參考圖5,首先,執(zhí)行獲得服務(wù)器200和移動(dòng)終端300之間所建立的網(wǎng)絡(luò)的狀態(tài)的處理(S210)。可以基于傳輸速度、數(shù)據(jù)分組損失率等獲得網(wǎng)絡(luò)的狀態(tài)。
[0114]然后,執(zhí)行確定網(wǎng)絡(luò)的狀態(tài)是否差的處理(S220)。當(dāng)網(wǎng)絡(luò)狀態(tài)差時(shí),執(zhí)行阻止從服務(wù)器200接收第一語音識(shí)別數(shù)據(jù)的處理(S230)。
[0115]參考圖6,首先,執(zhí)行將對(duì)于第一語音識(shí)別數(shù)據(jù)的請(qǐng)求信號(hào)發(fā)送到服務(wù)器200的處理(S310)??梢皂憫?yīng)于請(qǐng)求信號(hào)從服務(wù)器200接收第一語音識(shí)別數(shù)據(jù)。
[0116]接下來,執(zhí)行確定在預(yù)定的響應(yīng)時(shí)間內(nèi)是否接收到第一語音識(shí)別數(shù)據(jù)的處理(S320)。當(dāng)在預(yù)定的響應(yīng)時(shí)間內(nèi)沒有接收到第一語音識(shí)別數(shù)據(jù)時(shí),執(zhí)行將取消信號(hào)發(fā)送到服務(wù)器的處理,該取消信號(hào)用于取消對(duì)于第一語音識(shí)別數(shù)據(jù)的請(qǐng)求(S330)。服務(wù)器200可以根據(jù)取消信號(hào)終止第一語音識(shí)別數(shù)據(jù)的生成和傳輸。
[0117]圖7是用于解釋根據(jù)本公開的實(shí)施例的與個(gè)人信息保護(hù)功能相關(guān)聯(lián)的移動(dòng)終端300的語音識(shí)別方法的流程圖。參考圖7,執(zhí)行在語音識(shí)別模式中顯示用于執(zhí)行個(gè)人信息保護(hù)功能的菜單按鈕的處理(S410)。響應(yīng)于對(duì)菜單按鈕的觸摸輸入可以執(zhí)行個(gè)人信息保護(hù)功倉泛。
[0118]接下來,執(zhí)行確定是否執(zhí)行個(gè)人信息保護(hù)功能的處理(S420)。當(dāng)個(gè)人信息保護(hù)功能被執(zhí)行時(shí),可以阻止從用戶接收到的語音被提供給第一語音識(shí)別引擎210。這意指阻止用戶的語音被發(fā)送到服務(wù)器200。
[0119]圖8是圖示應(yīng)用了圖7的語音識(shí)別方法的移動(dòng)終端300的用戶界面的概念視圖。參考圖8,控制器360能夠控制顯示單元350以顯示與語音識(shí)別相關(guān)聯(lián)的屏幕圖像351。屏幕圖像351可以包括用于指示語音識(shí)別模式正被執(zhí)行的指導(dǎo)信息352、用于執(zhí)行個(gè)人信息保護(hù)功能的菜單按鈕353等。[0120]當(dāng)感測(cè)到對(duì)353的觸摸輸入時(shí),控制器360可以執(zhí)行個(gè)人信息保護(hù)功能。當(dāng)在個(gè)人信息保護(hù)功能的執(zhí)行期間通過麥克風(fēng)310接收到用戶的語音時(shí),控制器360可以阻止接收到的語音被提供給第一語音識(shí)別引擎210,并且將其提供給第二語音識(shí)別引擎320。
[0121]第二語音識(shí)別引擎320可以參考第一數(shù)據(jù)庫220識(shí)別接收到的語音,在該第一數(shù)據(jù)庫220中以個(gè)人信息指定信息域,并且第二語音識(shí)別引擎320可以將語音識(shí)別結(jié)果傳輸?shù)娇刂破?60??刂破?60可以基于第二語音識(shí)別引擎320的語音識(shí)別結(jié)果來估計(jì)和執(zhí)行與用戶的意圖相對(duì)應(yīng)的功能。例如,當(dāng)識(shí)別到從用戶接收的“打電話給Kim Tae-Heui”時(shí),控制器360可以估計(jì)和執(zhí)行電話呼叫功能。此外,控制器360可以控制顯示單元350以顯示與電話呼叫功能相關(guān)聯(lián)的屏幕圖像354。
[0122]然而,為了執(zhí)行電話呼叫功能,要求作為個(gè)人信息的聯(lián)系人信息“Kim Tae-Heui”。在這樣的情況下,可以使用菜單按鈕353手動(dòng)地執(zhí)行個(gè)人信息保護(hù)功能,不將與個(gè)人信息相關(guān)聯(lián)的語音發(fā)送到服務(wù)器200。
[0123]圖9是用于解釋根據(jù)本公開的實(shí)施例的與語音識(shí)別數(shù)據(jù)的用戶選擇相關(guān)聯(lián)的移動(dòng)終端300的語音識(shí)別方法的流程圖。參考圖9,執(zhí)行顯示第一和第二語音識(shí)別數(shù)據(jù)作為第一和第二語音識(shí)別引擎210、310的語音識(shí)別的結(jié)果的處理(S510)。
[0124]接下來,執(zhí)行響應(yīng)于觸摸輸入來選擇第一和第二語音識(shí)別數(shù)據(jù)中的任意一個(gè)的處理(S520)。然后,執(zhí)行使用所選擇的任意一個(gè)語音識(shí)別數(shù)據(jù)并且執(zhí)行所估計(jì)的功能的處理(S530)。
[0125]圖10是圖示應(yīng)用了圖9的語音識(shí)別方法的移動(dòng)終端300的用戶界面的概念視圖。參考圖10,控制器360可以控制顯示單元350以顯示與語音識(shí)別相關(guān)聯(lián)的屏幕圖像451。屏幕圖像451可以包括指導(dǎo)信息452、第一和第二語音識(shí)別數(shù)據(jù)453、454等。
[0126]例如,作為識(shí)別從用戶接收的語音“打電話給Kim Tae-Heui”的結(jié)果,以文本形式的第一和第二語音識(shí)別數(shù)據(jù)453、454,諸如“打電話給Kim Tae-Hui ”和“打電話給KimTae-Heui”,可以被以文本形式顯示。這時(shí),在第一和第二語音識(shí)別數(shù)據(jù)453、454中的不同的字符或者單詞可以被突出。例如,“Hui”和“Heui”的粗度、顏色、傾斜、以及字體可以被改變以區(qū)別其它的字符。另外地,諸如下劃線、陰影等的圖形效果可以被提供給“Hui”和“Heui”。結(jié)果,用戶能夠以相對(duì)的方式直觀地識(shí)別出什么是更加適合于他或者她的意圖的語音識(shí)別數(shù)據(jù)。
[0127]控制器360可以響應(yīng)于觸摸輸入選擇第一和第二語音識(shí)別數(shù)據(jù)453、454中的任意一個(gè)。此外,控制器360可以基于所選擇的任意一個(gè)語音識(shí)別數(shù)據(jù)來估計(jì)和執(zhí)行與用戶的意圖相對(duì)應(yīng)的功能。例如,當(dāng)識(shí)別到諸如“打電話給Kim Tae-Heui”的語音識(shí)別數(shù)據(jù)454時(shí),控制器360可以估計(jì)并且執(zhí)行電話呼叫功能。
[0128]根據(jù)本公開,在通過相互補(bǔ)充的遠(yuǎn)程語音識(shí)別引擎(第一語音識(shí)別引擎)和本地語音識(shí)別引擎(第二語音識(shí)別引擎)而獲得的語音識(shí)別結(jié)果當(dāng)中,可以選擇和使用通過預(yù)定的算法確定為具有高可靠性的語音識(shí)別結(jié)果,從而增強(qiáng)移動(dòng)終端的語音識(shí)別率。
[0129]此外,根據(jù)本公開,當(dāng)在語音識(shí)別處理期間所估計(jì)的功能要求個(gè)人信息時(shí),可以使用通過本地語音識(shí)別引擎獲得的語音識(shí)別結(jié)果,從而防止與個(gè)人信息相關(guān)聯(lián)的語音被遠(yuǎn)程語音識(shí)別引擎識(shí)別。換言之,能夠防止個(gè)人信息被泄露。
[0130]此外,根據(jù)本公開,在網(wǎng)絡(luò)的故障狀態(tài)期間能夠忽略遠(yuǎn)程語音識(shí)別引擎的語音識(shí)別結(jié)果,以消除從遠(yuǎn)程語音識(shí)別引擎接收語音識(shí)別結(jié)果所需要的延遲,從而增強(qiáng)語音識(shí)別的處理速度。
[0131]根據(jù)本公開的實(shí)施例,可以在寫入程序的介質(zhì)上將前述方法實(shí)現(xiàn)為通過處理器可讀的代碼。處理器可讀介質(zhì)的示例可以包括R0M、RAMXD_R0M、磁帶、軟盤、光學(xué)數(shù)據(jù)存儲(chǔ)設(shè)備等,并且也包括以載波形式實(shí)現(xiàn)(例如,經(jīng)由互聯(lián)網(wǎng)的傳輸)的裝置。
[0132]根據(jù)上述實(shí)施例的配置和方法將不會(huì)以有限的方式應(yīng)用于前述的移動(dòng)終端,并且每個(gè)實(shí)施例的全部或者部分可以被選擇性地組合,并且被配置成對(duì)其進(jìn)行各種修改。
【權(quán)利要求】
1.一種與服務(wù)器相連接的移動(dòng)終端的語音識(shí)別方法,所述方法包括: 接收用戶的語音; 將接收到的語音提供給在所述服務(wù)器中提供的第一語音識(shí)別引擎以及在所述移動(dòng)終端中提供的第二語音識(shí)別引擎; 獲取第一語音識(shí)別數(shù)據(jù)作為通過所述第一語音識(shí)別引擎識(shí)別所述接收到的語音的結(jié)果; 獲取第二語音識(shí)別數(shù)據(jù)作為通過所述第二語音識(shí)別引擎識(shí)別所述接收到的語音的結(jié)果; 基于所述第一和第二語音識(shí)別數(shù)據(jù)中的至少一個(gè)來估計(jì)與用戶的意圖相對(duì)應(yīng)的功倉泛; 當(dāng)估計(jì)的功能需要個(gè)人信息時(shí),計(jì)算所述第一和第二語音識(shí)別數(shù)據(jù)之間的相似度;以及 基于計(jì)算的相似度來選擇所述第一和第二語音識(shí)別數(shù)據(jù)中的任意一個(gè)。
2.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括: 當(dāng)估計(jì)的功能不需要個(gè)人信息時(shí),忽略所述第二語音識(shí)別數(shù)據(jù)。`
3.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取第一語音識(shí)別數(shù)據(jù)包括: 將用于請(qǐng)求所述第一語音識(shí)別數(shù)據(jù)的請(qǐng)求信號(hào)發(fā)送到所述服務(wù)器;以及 響應(yīng)于所述請(qǐng)求信號(hào),從所述服務(wù)器接收所述第一語音識(shí)別數(shù)據(jù)。
4.根據(jù)權(quán)利要求3所述的方法,進(jìn)一步包括: 獲得在所述服務(wù)器和所述移動(dòng)終端之間連接的網(wǎng)絡(luò)的狀態(tài)信息;以及 基于所述網(wǎng)絡(luò)的狀態(tài)信息來阻止所述第一語音識(shí)別數(shù)據(jù)的接收。
5.根據(jù)權(quán)利要求4所述的方法,進(jìn)一步包括: 當(dāng)阻止所述第一語音識(shí)別數(shù)據(jù)的接收時(shí),使用所述第二語音識(shí)別數(shù)據(jù)來執(zhí)行估計(jì)的功倉泛。
6.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括: 顯示用于執(zhí)行個(gè)人信息保護(hù)功能的菜單按鈕;以及 當(dāng)響應(yīng)于對(duì)所述菜單按鈕的觸摸輸入而執(zhí)行所述個(gè)人信息保護(hù)功能時(shí),阻止所述接收到的語音被提供給所述第一語音識(shí)別引擎。
7.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括: 使用所選擇的任意一個(gè)語音識(shí)別數(shù)據(jù)來執(zhí)行估計(jì)的功能。
8.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取第二語音識(shí)別數(shù)據(jù)包括: 參考用于所述個(gè)人信息的數(shù)據(jù)庫來識(shí)別所述接收到的語音。
9.一種與服務(wù)器相連接的移動(dòng)終端,包括: 麥克風(fēng),所述麥克風(fēng)被配置成接收用戶的語音; 通信單元,所述通信單元被配置成將接收到的語音發(fā)送到所述服務(wù)器,以及接收第一語音識(shí)別數(shù)據(jù),所述第一語音識(shí)別數(shù)據(jù)作為通過在所述服務(wù)器中提供的第一語音識(shí)別引擎識(shí)別所述接收到的語音的結(jié)果而生成; 第二語音識(shí)別引擎,所述第二語音識(shí)別引擎被配置成生成第二語音識(shí)別數(shù)據(jù)作為識(shí)別所述接收到的語音的結(jié)果;以及控制器,所述控制器被配置成基于所述第一和第二語音識(shí)別數(shù)據(jù)中的至少一個(gè)來估計(jì)與用戶的意圖相對(duì)應(yīng)的功能,以及當(dāng)估計(jì)的功能需要個(gè)人信息時(shí)計(jì)算所述第一和第二語音識(shí)別數(shù)據(jù)之間的相似度,以及基于計(jì)算的相似度來選擇所述第一和第二語音識(shí)別數(shù)據(jù)中的任意一個(gè)。
10.根據(jù)權(quán)利要求9所述的移動(dòng)終端,其中,當(dāng)估計(jì)的功能不需要個(gè)人信息時(shí),所述控制器忽略所述第二語音識(shí)別數(shù)據(jù)。
11.根據(jù)權(quán)利要求9所述的移動(dòng)終端,其中,所述控制器獲得在所述服務(wù)器和所述移動(dòng)終端之間連接的網(wǎng)絡(luò)的狀態(tài)信息,以及基于所述網(wǎng)絡(luò)的狀態(tài)信息來阻止所述第一語音識(shí)別數(shù)據(jù)的接收。
12.根據(jù)權(quán)利要求10所述的移動(dòng)終端,其中,當(dāng)所述第一語音識(shí)別數(shù)據(jù)的接收被阻止時(shí),所述控制器使用所述第二語音識(shí)別數(shù)據(jù)來執(zhí)行估計(jì)的功能。
13.根據(jù)權(quán)利要求9所述的移動(dòng)終端,進(jìn)一步包括: 顯示單元,所述顯示單元被配置成顯示用于執(zhí)行個(gè)人信息保護(hù)功能的菜單按鈕。
14.根據(jù)權(quán)利要求13所述的移動(dòng)終端,其中,當(dāng)響應(yīng)于對(duì)所述菜單按鈕的觸摸輸入而執(zhí)行所述個(gè)人信息保護(hù)功能時(shí),所述控制器阻止所述接收到的語音被提供給所述第一語音識(shí)別引擎。
15.根據(jù)權(quán)利要求9所述的移動(dòng)終端,其中,所述控制器使用所選擇的任意一個(gè)語音識(shí)別數(shù)據(jù)來執(zhí)行估計(jì)的功能。
16.根據(jù)權(quán)利要求9所述的移動(dòng)終端,其中,所述第二語音識(shí)別引擎參考用于所述個(gè)人信息的數(shù)據(jù)庫來識(shí)別所述接收到``的語音。
【文檔編號(hào)】G06F9/44GK103533154SQ201310269078
【公開日】2014年1月22日 申請(qǐng)日期:2013年6月28日 優(yōu)先權(quán)日:2012年6月28日
【發(fā)明者】金珠姬, 李賢燮, 李俊燁, 崔正奎 申請(qǐng)人:Lg電子株式會(huì)社