欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

車輛自動語音識別系統(tǒng)的優(yōu)先化內(nèi)容加載的制作方法

文檔序號:12598529閱讀:235來源:國知局
車輛自動語音識別系統(tǒng)的優(yōu)先化內(nèi)容加載的制作方法與工藝

本發(fā)明涉及加載車輛自動語音識別(ASR)系統(tǒng)的內(nèi)容,并且更具體地,涉及基于一個或多個用戶的系統(tǒng)交互歷史來選擇性地加載內(nèi)容。



背景技術(shù):

個人數(shù)據(jù)內(nèi)容的大小持續(xù)增加,這往往導(dǎo)致針對車輛自動語音識別(ASR)系統(tǒng)的問題。目前,車輛ASR系統(tǒng)的內(nèi)容可基于非專用標準或通用標準(諸如字母順序)來加載,直到達到系統(tǒng)存儲器的存儲極限。即使可能加載所有的內(nèi)容,但這可能并不是人們所期望的,因為如果大多數(shù)內(nèi)容不被請求,那么系統(tǒng)性能可能會受到負面影響。如果個人數(shù)據(jù)的大小過于龐大而不能被加載并且不可由ASR系統(tǒng)完全訪問,則用戶命令則可能不被理解,因為隨著數(shù)據(jù)量的逐漸增大,語音識別的精確度往往降低。因此,在用戶請求未被理解時,用戶可能變得沮喪,因為請求的內(nèi)容項目是隨機可用的,而不是隨時可用的。



技術(shù)實現(xiàn)要素:

根據(jù)本發(fā)明的一個實施例,提供了一種加載車輛自動語音識別(ASR)系統(tǒng)內(nèi)容的方法。車輛ASR系統(tǒng)包括處理器和存儲器。該方法包括跟蹤請求的內(nèi)容項目,建立相關(guān)內(nèi)容項目的計數(shù),使用該相關(guān)內(nèi)容項目的計數(shù)來計算請求的內(nèi)容項目與相關(guān)內(nèi)容項目的似然準則,并且基于該似然準則對內(nèi)容項目的加載進行優(yōu)先級排序,使得所請求的內(nèi)容項目與相關(guān)內(nèi)容項目優(yōu)先于非請求內(nèi)容項目或者非相關(guān)內(nèi)容項目被加載到車輛ASR系統(tǒng)的存儲器中。

根據(jù)本發(fā)明的另一實施例,提供了一種加載車輛自動語音識別(ASR)系統(tǒng)內(nèi)容的方法。車輛ASR系統(tǒng)包括處理器和存儲器。該方法包括跟蹤請求的內(nèi)容項目以及將所請求的內(nèi)容項目分類為多個內(nèi)容項目類別。內(nèi)容項目類別包括媒體內(nèi)容項目、電話內(nèi)容項目以及導(dǎo)航內(nèi)容項目。該方法還包括從每個內(nèi)容項目類別選擇性地加載內(nèi)容項目,使得具有較高計數(shù)的請求的內(nèi)容項目先于具有較低計數(shù)的請求的內(nèi)容項目被加載到車輛ASR系統(tǒng)的存儲器上。

附圖說明

下文將結(jié)合附圖對本發(fā)明的一個或多個實施例進行描述,其中,相同的標記表示相同的元件,并且其中:

圖1是描繪語音用戶接口和通信系統(tǒng)的一個實施例的框圖,該通信系統(tǒng)能夠利用本發(fā)明所公開的方法,并且能夠為發(fā)明所公開的方法提供輸入;

圖2是描繪自動語音識別(ASR)系統(tǒng)的一個實施例的框圖;以及

圖3是示出可與圖1和圖2中示出的通信系統(tǒng)和ASR系統(tǒng)一起使用的方法步驟的流程圖。

具體實施方式

下面描述的加載車輛自動語音識別(ASR)系統(tǒng)的內(nèi)容的方法可以利用有關(guān)一個或多個用戶的交互歷史的ASR系統(tǒng)知識。交互歷史以及其它有關(guān)信息可用來對更可能被用戶請求的內(nèi)容項目進行優(yōu)先級排序。由于有助于確保最可能呈現(xiàn)的內(nèi)容隨時可用(而不是隨機可用),ASR系統(tǒng)的精確度以及語音交互的有效性可改善用戶體驗。通常,用戶僅訪問和/或請求約20%的內(nèi)容,所以通過優(yōu)選地限制被加載內(nèi)容,ASR系統(tǒng)特性可得以改進。

圖1描繪了基于語音的用戶接口和通信系統(tǒng)10的一個實施例,其可用于通過移動設(shè)備、車輛自身或另一基于陸地或基于云的應(yīng)用程序來提供各種內(nèi)容項目。內(nèi)容項目可以免提的方式提供給車輛駕駛員。一些實施例能夠被實現(xiàn)為提供可能需要一些與移動設(shè)備的交互的免提體驗,例如將其置于收聽模式,而其它實施例能夠執(zhí)行成完全免提的,例如當移動設(shè)備在用戶的口袋、錢包或者公務(wù)包中,而無需與設(shè)備進行身體接觸。

在所示的實施例中,車輛12的駕駛員與車上已安裝的聲音用戶接口14進行語音交互,該接口經(jīng)由短程無線連接與駕駛員移動設(shè)備16通信,在本例中,移動設(shè)備16為蜂窩電話。移動設(shè)備16可以是任何可攜帶的設(shè)備,其能夠使用無論是微處理器還是一些更簡單或更復(fù)雜的電路來進行無線通信和數(shù)字處理。因此,移動設(shè)備包括蜂窩電話、PDA、膝上電腦、筆記本、上網(wǎng)本以及其它個人電子設(shè)備。圖1描繪的蜂窩電話16通常指的是智能電話,假設(shè)它允許用戶向智能電話增加軟件應(yīng)用程序(app),以實現(xiàn)電話之外的功能。電話16包括觸摸屏接口、一個或多個手動按鈕、麥克風、揚聲器以及內(nèi)部電路(硬件),該內(nèi)部電路包括微處理器、用于存儲軟件和數(shù)據(jù)的存儲器以及通信電路,該通信電路至少包括如藍牙和/或WiFi的短程無線通信技術(shù)諸,而且還包括諸如用于CDMA以及GSM的蜂窩芯片組的蜂窩通信技術(shù)或者其它標準化技術(shù)。如果需要的話,移動設(shè)備16的這些不同部件可以是常規(guī)部件,因而此處不再單獨示出或者描述。

除移動設(shè)備硬件之外,蜂窩電話16還可包括移動語音平臺(MVP)18,該移動語音平臺(MVP)18包括在移動設(shè)備上運行的軟件。MVP 18可包括語音平臺內(nèi)核(SPK)20以及應(yīng)用程序接口組(AIS)22,上述兩者都是包括諸多計算機指令的程序模塊,當設(shè)備的處理器執(zhí)行這些計算機指令時,其執(zhí)行各自的模塊功能。與在移動設(shè)備本身上提供自動語音處理(ASR)不同,遠程定位(移動式和基于云的)的語音服務(wù)可以提供移動式和基于云的、經(jīng)常被使用的內(nèi)容項目24,但是在一些實施例中,在接入或者不接入遠程定位語音模塊、語法和計算設(shè)施的情況下,ASR可以車輛12的硬件上執(zhí)行。移動設(shè)備16還包括操作系統(tǒng)(OS)26,其提供根一級的功能,包括例如應(yīng)用程序之間的通信機制以及設(shè)備硬件和在設(shè)備16上運行的軟件模塊及應(yīng)用程序之間的輸入/輸出(IO)接口連接。在OS的這些硬件接口功能中,包括:由設(shè)備所使用的通信協(xié)議,以與用于提供移動式和基于云的內(nèi)容項目24的各種語音服務(wù)、以及可以通過因特網(wǎng)或其它網(wǎng)絡(luò)技術(shù)獲得的其它服務(wù)進行通信。經(jīng)常地,來自移動設(shè)備16的內(nèi)容項目24可上傳至并存儲在位于車輛12硬件內(nèi)的存儲器中。雖然在圖1中僅作為示意圖顯示在車輛外面,但是作為語音用戶接口10一部分的移動設(shè)備16的典型使用將涉及移動設(shè)備位于車內(nèi)的情形,例如當駕駛員在路面上操作車輛時。

總體上,使用移動語音平臺18或另一車輛、云或陸上模塊的免提接入服務(wù)將涉及執(zhí)行完整的語音會話,而無需進行任何實體交互。這廣泛地包括:從用戶請求的內(nèi)容項目接收語音輸入,從響應(yīng)于該語音輸入的上下文的服務(wù)獲取該內(nèi)容項目,并且將該內(nèi)容項目本身提供給用戶或者將作為呈現(xiàn)的語音響應(yīng)的內(nèi)容項目提供給用戶。使用圖1中的車輛12,駕駛員(用戶)可以與移動設(shè)備交互,例如,以通過用戶接口14執(zhí)行語音會話。這可包括:車內(nèi)用戶接口14與移動設(shè)備16之間建立短程無線連接,例如,該連接隨后允許使用用戶接口14的麥克風和揚聲器分別用于從駕駛員或其他乘員接收和向其呈現(xiàn)語音。語音輸入可以在這種短程無線連接上通過諸如Bluetooth或WiFi的數(shù)字通信協(xié)議、作為數(shù)字化語音被發(fā)送。駕駛員還可與車輛硬件交互,以執(zhí)行語音會話,以下將對其進行詳細描述。

在示出的實施例中,車輛12被描繪為運動型多用途汽車(SUV),但是,應(yīng)當理解的是,也可以使用任何其它車輛,包括:客車、卡車、摩托車、休閑車(RV)、海洋船舶、飛機等。在圖1中一般性地示出了一些車輛電子設(shè)備28,其包括遠程信息處理單元30、麥克風32、一個或多個按鈕或者其它控制輸入34、音頻系統(tǒng)36、視覺顯示器38和GPS模塊40以及一定數(shù)量的車輛系統(tǒng)模塊(VSM)42。麥克風32和一個或多個按鈕或者其它控制輸入34可以用來形成用戶接口14。一些此類設(shè)備可直接連接至遠程信息處理單元,諸如,例如,麥克風32和按鈕34,而其它此類設(shè)備可使用一個或多個網(wǎng)絡(luò)連接(諸如,通信總線44或娛樂總線46)間接連接。合適的網(wǎng)絡(luò)連接的實例包括控制器局域網(wǎng)(CAN)、面向媒體的系統(tǒng)傳輸(MOST)、本地互連網(wǎng)絡(luò)(LIN)、本地局域網(wǎng)(LAN)及其它適當?shù)倪B接,諸如,以太網(wǎng)(Ethernet)或其它遵守公知的ISO、SAE和IEEE標準和規(guī)范的網(wǎng)絡(luò)等。

遠程信息處理單元30可以是原始裝備制造商(OEM)安裝的(嵌入的)設(shè)備或者售后市場設(shè)備,其安裝在車輛中并且在無線載波系統(tǒng)14上并且通過無線網(wǎng)絡(luò)進行無線語音和/或數(shù)據(jù)通信。這使車輛能夠與呼叫中心、其它具備遠程信息處理能力的車輛或某種其它實體或設(shè)備進行通信。遠程信息處理單元優(yōu)選地使用無線電傳輸來建立與無線載波系統(tǒng)14的通信信道(語音信道和/或數(shù)據(jù)信道),使得語言傳輸和/或數(shù)據(jù)傳輸在信道上被發(fā)送和接收。通過同時提供語音與數(shù)據(jù)通信,遠程信息處理單元30使車輛能夠提供許多不同的內(nèi)容項目,包括那些有關(guān)導(dǎo)航、電話、緊急救助、車輛診斷、媒體和信息娛樂等內(nèi)容項目。通過數(shù)據(jù)連接(諸如通過數(shù)據(jù)信道上的分組數(shù)據(jù)傳輸)或者通過使用本領(lǐng)域已知技術(shù)中的語音信道可以發(fā)送數(shù)據(jù)。對于同時涉及語音通信(例如,使用呼叫中心處的實時顧問或語音響應(yīng)單元)和數(shù)據(jù)通信(例如,向呼叫中心提供GPS位置數(shù)據(jù)或車輛診斷數(shù)據(jù))的組合服務(wù),系統(tǒng)可以通過語音信道來使用單個呼叫,并且可以通過語音信道根據(jù)需要在語音和數(shù)據(jù)傳輸之間切換,并且這可以使用本領(lǐng)域技術(shù)人員已知的技術(shù)來完成。

根據(jù)一個實施例,遠程信息處理單元30利用根據(jù)GSM標準、CDMA標準或者LTE標準的蜂窩通信,因此包括類似免提呼叫的用于語音通信的標準的蜂窩芯片組50、用于數(shù)據(jù)傳輸?shù)臒o線調(diào)制解調(diào)器、電子信息處理設(shè)備或處理器52、包括存儲器54的一個或多個數(shù)字存儲設(shè)備以及雙天線56。應(yīng)當理解,調(diào)制解調(diào)器既可以通過被存儲在遠程信息處理單元中的軟件來實現(xiàn)并且由處理器52來執(zhí)行,又可以是位于遠程信息處理單元30的內(nèi)部或外部的、單獨的硬件部件。調(diào)制解調(diào)器可以使用任意數(shù)目的不同標準或協(xié)議(諸如LTE、EVDO、CDMA、GPRS和EDGE)來操作。車輛與其它聯(lián)網(wǎng)的設(shè)備之間的無線網(wǎng)絡(luò)還可使用遠程信息處理單元30來執(zhí)行。為此目的,遠程信息處理單元30可以被配置成根據(jù)一種或多種無線協(xié)議(其包括短程無線通信(SRWC),諸如IEEE 802.11協(xié)議、WiMAX、ZigBeeTM、直接Wi-Fi、藍牙或近場通信(NFC))中的任一個來以無線方式通信。當被用于諸如TCP/IP的分組交換數(shù)據(jù)通信時,遠程信息處理單元可以配置有靜態(tài)IP地址或可以建立,以自動地從網(wǎng)絡(luò)上的諸如路由器的另一設(shè)備或從網(wǎng)絡(luò)地址服務(wù)器接收被指配的IP地址。

處理器52可以是能夠處理電子指令的任何一種設(shè)備,包括微處理器、微控制器、主機處理器、控制器、車輛通信處理器以及專用集成電路(ASIC)。它可以是僅用于遠程信息處理單元30的專用處理器,或是被其它車輛系統(tǒng)共享的處理器。處理器52執(zhí)行各種類型的數(shù)字存儲指令,諸如存儲在存儲器54中的軟件或固件程序,它們使遠程信息處理單元能夠于提供多種服務(wù)。例如,處理器52可以執(zhí)行程序或處理數(shù)據(jù),以實現(xiàn)此處所討論的方法的至少一部分。

在一個實施例中,處理器52和遠程信息處理單元30的存儲器54充當用于ASR系統(tǒng)的處理器和存儲器。然而,應(yīng)理解的是,ASR系統(tǒng)存儲器可以包括來自未示出的各種來源的多個存儲器設(shè)備。相應(yīng)地,一種或多種類型的存儲器54可包括非易失性存儲器、驅(qū)動器、大容量存儲設(shè)備,并且可以包括任意合適的軟件、算法和/或子程序,該子程序提供具有存儲、組織以及允許檢索內(nèi)容的能力的數(shù)據(jù)存儲部件。存儲器54可包括單一部件或多個共同作用的分立部件。存儲器54可專門用于與遠程信息處理單元30一起使用,然而在其它實例中,存儲器54可以被車輛12的車載或車外其他系統(tǒng)共享。

遠程信息處理單元30可用于提供不同范圍的內(nèi)容項目,通常涉及到車輛的無線通信和/或來自車輛的無線通信。此類內(nèi)容項目可包括但不限于:諸如分路段顯示路線的內(nèi)容項目、地址列表和其它與導(dǎo)航相關(guān)的服務(wù),這些服務(wù)結(jié)合基于GPS車輛導(dǎo)航模塊40來提供;車輛診斷內(nèi)容項目,例如,安全氣囊展開通知和其它急救或路邊救助相關(guān)的通知及服務(wù),其可結(jié)合一個或多個碰撞傳感器接口模塊(諸如車身控制模塊(未示出))以及使用一個或多個診斷模塊的診斷報告來提供;以及信息娛樂相關(guān)內(nèi)容項目(例如,媒體內(nèi)容項目和基于應(yīng)用程序的內(nèi)容項目),在其中音樂、網(wǎng)頁、電影、電視節(jié)目、應(yīng)用程序、視頻游戲和/或其它信息由信息娛樂模塊(未示出)或者遠程信息處理單元30本身下載,并被存儲以供當前或以后播放。上述列舉的內(nèi)容項目決不是遠程信息處理裝置30的所有能力的窮舉性列舉,而是簡單地列舉遠程信息處理裝置30能夠提供的一些內(nèi)容項目。而且,除了來自遠程信息處理單元,內(nèi)容項目還可以直接地或者間接地來自各種其它來源。此外,應(yīng)當理解的是,如上所述的模塊中至少一些可采取軟件指令的形式來實施,這些軟件指令被保存在遠程信息處理單元30的內(nèi)部或者外部,它們可以是位于遠程信息處理單元30的內(nèi)部或外部的硬件部件,或它們可以是集成系統(tǒng)和/或彼此共享或與位于整個車輛中的其它系統(tǒng)共享,在此僅列幾種可能。在模塊作為位于遠程信息處理單元30的外部的VSM 42被實施的情況下,它們可以利用車輛總線44和遠程信息處理單元交換數(shù)據(jù)和命令。

GPS模塊40可以從GPS衛(wèi)星的星座58接收無線電信號。模塊40可通過這些信號來確定車輛位置,該車輛位置被用于向車輛駕駛員提供導(dǎo)航和其它位置相關(guān)的服務(wù)。導(dǎo)航信息可以在顯示器38(或車輛內(nèi)的其它顯示器)上呈現(xiàn),或諸如在提供逐向路線導(dǎo)航時口頭呈現(xiàn)。導(dǎo)航內(nèi)容項目可使用專用車載導(dǎo)航模塊(其可以是GPS模塊40的一部分)來提供,或者一些或所有導(dǎo)航內(nèi)容項目可以通過遠程信息處理單元30來提供,其中,將位置信息發(fā)送至遠程位置,目的是用于向車輛提供請求的目的地、導(dǎo)航地圖、地圖注釋(興趣點、餐館等)、路徑計算等等。位置信息可以被提供至呼叫中心或其它遠程計算機系統(tǒng)(諸如計算機60)以用于其它目的(諸如車隊管理)。還可以通過遠程信息處理單元30從呼叫中心將新的或更新的地圖數(shù)據(jù)下載至GPS模塊40。

除了音頻系統(tǒng)36和GPS模塊40,車輛12還可包括采用電子硬件部件形式的其它車輛系統(tǒng)模塊(VSM)42,它們位于整個車輛中且通常從一個或多個傳感器接收輸入,并且使用所感測的輸入來執(zhí)行診斷功能、監(jiān)視功能、控制功能、報告功能和/或其它功能。每個VSM 42優(yōu)選地通過通信總線44連接到其它VSMs以及遠程信息處理單元30,并且可以被編程來運行車輛系統(tǒng)以及子系統(tǒng)診斷測試。作為實例,一個VSM 42可以是發(fā)動機控制模塊(ECM),其控制發(fā)動機操作的各個方面,諸如燃料點火和點火時間,另一VSM 42可以是動力系統(tǒng)控制模塊,其調(diào)節(jié)車輛動力系統(tǒng)的一個或多個部件的操作,并且另一VSM 42可以是車身控制模塊,其支配位于整個車輛中的各種電氣部件,諸如車輛的電源門鎖和前燈。根據(jù)一個實施例,發(fā)動機控制模塊配備有車載診斷(OBD)特征,這些特征可提供大量的實時數(shù)據(jù),諸如從包括車輛排放傳感器的各種傳感器接收的數(shù)據(jù),并提供一系列標準化診斷故障代碼(DTC),這就允許技術(shù)員快速識別并修補車輛內(nèi)的故障。正如本領(lǐng)域技術(shù)人員所理解的,上述VSM僅是可以用于車輛12的一些模塊的實例,許多其它的模塊也是可能的。

車輛電子設(shè)備28還包括用戶接口14,所述用戶接口為車輛乘員提供用于提供和/或接收信息的裝置,包括麥克風32、按鈕34、音頻系統(tǒng)36和視覺顯示器38。正如本文所使用的,術(shù)語“用戶接口”廣義地包括任何適當形式的電子設(shè)備,包括硬件和軟件部件,其位于車輛上并使得車輛使用者能與車輛部件通信或通過車輛部件進行通信。麥克風32向遠程信息處理單元30提供音頻輸入,使得駕駛者或其它乘員能夠通過無線載波系統(tǒng)62提供語音命令并且進行免提呼叫。為了這個目的,它可以利用本領(lǐng)域已知的人機接口(HMI)技術(shù)連接到車載自動語音處理單元。按鈕34允許人工用戶輸入進入遠程信息處理單元30以啟動無線電話呼叫并提供其它數(shù)據(jù)、響應(yīng)或控制輸入。獨立按鈕可以用于啟動呼叫中心的緊急呼叫與常規(guī)服務(wù)援助呼叫。音頻系統(tǒng)36可以向車輛乘員提供媒體內(nèi)容項目且可以是專用的獨立系統(tǒng)或是主車輛音頻系統(tǒng)的一部分。根據(jù)本文所示的具體實施例,音頻系統(tǒng)36可操作地聯(lián)接到車輛總線44和娛樂總線46,且可以提供AM、FM以及衛(wèi)星無線電廣播、CD、DVD以及其它多媒體功能。此功能可以結(jié)合上述信息娛樂模塊或獨立于上述信息娛樂模塊提供。視覺顯示器38優(yōu)選是圖形顯示器,諸如儀表板上的觸摸屏或從擋風玻璃映出的仰視顯示器,并可以用于提供多種輸入和輸出功能。也可以利用各種其它車輛用戶接口,因為圖1的接口僅僅是一個具體實施方式的實例。

無線載波系統(tǒng)62優(yōu)選是蜂窩式電話系統(tǒng),該蜂窩式電話系統(tǒng)包括多個蜂窩塔64(僅示出一個)、一個或多個移動交換中心(MSC)66以及連接無線載波系統(tǒng)62與陸地網(wǎng)絡(luò)68所需的任何其它網(wǎng)絡(luò)部件。每個蜂窩塔64包括發(fā)送和接收天線以及基站,來自不同蜂窩塔的基站直接或經(jīng)由諸如基站控制器的中間設(shè)備連接到移動交換中心66。蜂窩系統(tǒng)62可以采用任何合適的通信技術(shù),包括例如,模擬技術(shù)(例如,AMPS),或諸如CDMA(例如,CDMA2000)或GSM/GPRS的數(shù)字技術(shù)。如本領(lǐng)域技術(shù)人員將理解的,各種蜂窩塔/基站/MSC布置是可能的且可以與無線系統(tǒng)62一起使用。例如,基站和蜂窩塔可以共同位于相同位置處或者可以彼此相距較遠,每個基站可負責單個蜂窩塔或者單個基站可服務(wù)多個蜂窩塔,且多個基站可聯(lián)接到單個MSC,這里僅列舉一些可能的布置。

除了使用無線載波系統(tǒng)62,還可以使用衛(wèi)星通信形式的不同無線載波系統(tǒng)來提供與車輛的單向或雙向通信。這可以用一個或多個通信衛(wèi)星70和上行鏈路傳輸站72來完成。單向通信可以是例如衛(wèi)星無線電服務(wù),其中節(jié)目編排內(nèi)容(新聞、音樂等)由傳輸站72接收,打包以便上傳,然后發(fā)送給衛(wèi)星70,衛(wèi)星70將該節(jié)目廣播給用戶。雙向通信可以是例如衛(wèi)星電話服務(wù),使用衛(wèi)星70來在車輛12和傳輸站72之間中繼電話通信。如果使用,則該衛(wèi)星電話可以在無線載波系統(tǒng)62之外使用或替代無線載波系統(tǒng)62而使用。

陸地網(wǎng)絡(luò)68可以是常規(guī)的陸上電信網(wǎng)絡(luò),其可連接到一個或多個陸地線路電話,并可以將無線載波系統(tǒng)62連接到諸如用于提供內(nèi)容項目24的基于移動和云的應(yīng)用程序以及其它計算機或服務(wù)器60(諸如位于住所的個人計算機或其它設(shè)施)。例如,陸地網(wǎng)絡(luò)68可以包括公共交換電話網(wǎng)絡(luò)(PSTN),例如用于提供硬線電話、分組交換數(shù)據(jù)通信以及互聯(lián)網(wǎng)基礎(chǔ)設(shè)施。陸地網(wǎng)絡(luò)68的一個或多個部分可以通過使用標準有線網(wǎng)絡(luò)、光纖或其它光網(wǎng)絡(luò)、線纜網(wǎng)絡(luò)、電力線、其它無線網(wǎng)絡(luò)諸如無線局域網(wǎng)(WLAN)、提供寬帶無線接入(BWA)的網(wǎng)絡(luò)或它們的任意組合實施。此外,圖1中所示的語音和云內(nèi)容項目不需要經(jīng)由陸地網(wǎng)絡(luò)68提供,而可以包括無線電話設(shè)備,使得其可以直接與無線網(wǎng)絡(luò)(諸如無線載波系統(tǒng)62)通信。

計算機60可以是可經(jīng)由專用或公共網(wǎng)絡(luò)(例如,互聯(lián)網(wǎng))訪問的多臺計算機之一。每臺這種計算機60可以用于一個或多個目的,例如可由車輛經(jīng)用戶接口14/移動設(shè)備16通過無線載波系統(tǒng)62,和/或經(jīng)遠程信息處理單元30訪問的網(wǎng)頁服務(wù)器。其它這種可訪問的計算機60可以是例如:服務(wù)中心計算機,其中,診斷信息和其它車輛數(shù)據(jù)可以經(jīng)由遠程信息處理單元30從車輛上傳;客戶端計算機,由車輛擁有者或其它遠程信息處理服務(wù)訂戶使用,用于諸如訪問或接收車輛數(shù)據(jù)或設(shè)置或配置訂戶偏好或控制車輛功能的目的;或第三方庫,車輛數(shù)據(jù)或其它信息從所述第三方庫提供或提供給所述第三方庫。計算機60還可以用于提供互聯(lián)網(wǎng)連接,例如DNS服務(wù)或網(wǎng)絡(luò)地址服務(wù)器,其使用DHCP或其它合適的協(xié)議來分配IP地址給車輛12和/或移動設(shè)備16。當被車輛擁有者作為客戶端計算機60使用時,例如在住所內(nèi),則可以使用任何適當?shù)亩叹嚯x無線通信技術(shù)例如藍牙或任何802.11協(xié)議在移動設(shè)備16與計算機60之間提供無線連接。

參考圖1所標識的語音服務(wù)和內(nèi)容項目的提供可以以各種方式實施,且在一些實施例中可以被唯一地設(shè)計或包含設(shè)計為用于支持語音用戶接口10的特定語法或模型。在其他實施例中,一般化云ASR服務(wù)被用作車輛ASR;也就是說,其中的一個,雖然它可以允許對于語音識別引擎的特定語言模型和其他通用配置進行參數(shù)規(guī)定,但是其卻并不使用為用戶語音會話所期望的會話上下文而定制的語法。如圖1所示,移動設(shè)備16的移動語音平臺18與車輛12的用戶接口14之間可發(fā)生語音交互,該用戶接口14通常包括車輛ASR系統(tǒng)或是車輛ASR系統(tǒng)的一部分,這將在下文進一步詳細說明。

現(xiàn)轉(zhuǎn)到圖2,其示出了可以與本發(fā)明公開的方法結(jié)合使用的車輛ASR系統(tǒng)210的示例性架構(gòu)。通常,車輛乘員為了下面一個或多個基本目的用言辭與ASR系統(tǒng)進行交互:訓(xùn)練系統(tǒng)以理解車輛乘員的特定語音;存儲離散語音,諸如說出的用戶標簽或說出的控制詞語(如數(shù)字或關(guān)鍵字);或識別車輛乘員的語音,用于任何適當?shù)哪康?,諸如請求可包括各種語音撥號操作、菜單導(dǎo)航、轉(zhuǎn)錄、服務(wù)請求、車輛設(shè)備或設(shè)備功能控制等等在內(nèi)的內(nèi)容項目。通常,ASR系統(tǒng)從人的語音中提取聲學(xué)數(shù)據(jù),將該聲學(xué)數(shù)據(jù)與存儲的子詞語數(shù)據(jù)進行對照和對比,選擇能與其它選擇的子詞語連接的適當子詞語,并輸出連接后的子詞語或詞語以用于后處理,諸如口述或轉(zhuǎn)錄、通信錄撥號、存儲到存儲器、訓(xùn)練ASR模型或適配參數(shù)等等。

ASR系統(tǒng)通常是本領(lǐng)域技術(shù)人員已知的,且圖2僅示出一個具體示例性的ASR系統(tǒng)210。系統(tǒng)210包括接收語音的設(shè)備(諸如遠程信息處理麥克風32)和聲學(xué)接口33(諸如遠程信息處理單元30的具有模數(shù)轉(zhuǎn)換器以將語音轉(zhuǎn)換為聲學(xué)數(shù)據(jù)的聲卡)。系統(tǒng)210還包括存儲器(諸如遠程信息處理存儲器54),用于存儲聲學(xué)數(shù)據(jù)以及存儲語音識別軟件和內(nèi)容項目數(shù)據(jù)庫;以及處理器(諸如遠程信息處理處理器52),以處理聲學(xué)數(shù)據(jù)。處理器與存儲器一起并聯(lián)合以下模塊來正常運行:一個或多個前端處理器或預(yù)處理器軟件模塊212,用于將語音的聲學(xué)數(shù)據(jù)流解析成參數(shù)表示,諸如聲學(xué)特征;一個或多個解碼器軟件模塊214,用于解碼聲學(xué)特征以產(chǎn)生與輸入語音話語相對應(yīng)的數(shù)字子詞語或詞語輸出數(shù)據(jù);以及一個或多個后處理器軟件模塊216,以用于將來自解碼器模塊214的輸出數(shù)據(jù)用于任何適當目的。

系統(tǒng)210還可以從任何其它適當?shù)囊纛l源31接收語音,該音頻源31可以如實線所示地直接與預(yù)處理器軟件模塊212通信或經(jīng)由聲學(xué)接口33與預(yù)處理器軟件模塊212間接通信。音頻源31可以包括例如音頻的遠程信息處理源,諸如語音郵件系統(tǒng),或任何類型的其它遠程信息處理服務(wù)或基于應(yīng)用程序的服務(wù)。

一個或多個模塊或模型可以用作解碼器模塊214的輸入。首先,語法和/或詞匯模型218可提供管理哪個詞語邏輯上可以在其他詞語之后以形成正確語句的規(guī)則。從廣義上講,語法可以定義系統(tǒng)210在任意給定時間在任意給定ASR模式中期望的詞匯總體。例如,如果系統(tǒng)210處在用于訓(xùn)練命令的訓(xùn)練模式,則語法模型218可以包括系統(tǒng)210已知和使用的所有命令。在另一個實例中,如果系統(tǒng)210處于主菜單模式,則有效的語法模型218可以包括系統(tǒng)210期望的所有主菜單命令,如呼叫、撥號、退出、刪除、目錄等。其次,聲學(xué)模型220可以幫助選擇與來自預(yù)處理器模塊212的輸入相對應(yīng)的最可能的子詞語或詞語。第三,詞語模型222和語句/語言模型224可以在將選擇的子詞語或詞語排列成詞語或語句上下文時提供規(guī)則、語法和/或語義。另外,語句/語言模型224可以定義系統(tǒng)210在任意給定時間在任意給定ASR模式中期望的語句總體,和/或可以提供管理哪些語句邏輯上可以在其它語句之后以形成正確擴展語音的規(guī)則等。

根據(jù)替換性示例性實施例,ASR系統(tǒng)210的部分或全部可以駐留在處于遠離車輛12的位置處諸如呼叫中心的計算設(shè)備上,并可使用該計算設(shè)備來處理ASR系統(tǒng)210的部分或全部。例如,語法模型、聲學(xué)模型等可存儲在呼叫中心的服務(wù)器存儲器和/或數(shù)據(jù)庫中,并通信到車輛遠程信息處理單元30以用于車內(nèi)語音處理。換句話說,ASR系統(tǒng)210可以駐留在遠程信息處理單元30中,以任何期望方式分布在呼叫中心和車輛12,和/或駐留在呼叫中心。

首先,從人的語音中提取聲學(xué)數(shù)據(jù),其中,用戶對著麥克風32說話,麥克風32將話語轉(zhuǎn)換成電信號,并將此信號通信到聲學(xué)接口33。麥克風32中的聲音響應(yīng)元件捕獲用戶的語音話語作為空氣壓力的變化,并將該話語轉(zhuǎn)換成諸如直流電流或電壓的模擬電信號的相應(yīng)變化。聲學(xué)接口33接收模擬電信號,首先對該模擬電信號進行采樣,從而在離散時刻捕獲該模擬信號的值,然后對其量化從而在每個采樣時刻將模擬信號的幅值轉(zhuǎn)換為連續(xù)的數(shù)字語音數(shù)據(jù)流。換句話說,聲學(xué)接口33將模擬電信號轉(zhuǎn)換成數(shù)字電信號。數(shù)字數(shù)據(jù)是二進制位,其在遠程信息處理存儲器54中進行緩沖,然后由遠程信息處理處理器52進行處理,或可以在由處理器52最初接收時實時處理。

第二,預(yù)處理器模塊212可以將連續(xù)的數(shù)字語音數(shù)據(jù)流變換為聲學(xué)參數(shù)的離散序列。更具體地,處理器52可以執(zhí)行預(yù)處理器模塊212,以將數(shù)字語音數(shù)據(jù)分段為例如10-30ms持續(xù)時間的交疊的語音或聲學(xué)幀。幀對應(yīng)于聲學(xué)子詞語,例如音節(jié)、半音節(jié)、單音、雙連音、音素等。預(yù)處理器模塊212還進行語音分析,以從每一幀內(nèi)從乘員的語音提取聲學(xué)參數(shù),諸如隨時間變化的特征向量。乘員語音中的話語可以被表示為這些特征向量的序列。例如,如本領(lǐng)域技術(shù)人員所知的,可以提取特征向量,且特征向量可以包括,例如,音高、能線圖、光譜屬性和/或倒頻譜系數(shù),這些可以通過執(zhí)行幀的傅里葉變換以及使用余弦變換對聲譜進行解相關(guān)來獲得。覆蓋特定語音持續(xù)時間的聲學(xué)幀和對應(yīng)參數(shù)被連接成待解碼的未知語音測試模式。

第三,處理器可以執(zhí)行解碼器模塊214,以處理每個測試模式的進入特征向量。解碼器模塊214也被稱為識別引擎或分類器,并使用存儲的已知語音參考模式。如測試模式,參考模式也被定義為相關(guān)聲學(xué)幀與相應(yīng)參數(shù)的連接。解碼器模塊214將待識別的子詞語測試模式與存儲的子詞語參考模式的聲學(xué)特征向量進行對照和對比,評估它們之間的差異或相似度的大小,并且最終使用判決邏輯選擇最佳匹配子詞語作為識別后的子詞語。通常,最佳匹配子詞語是這樣的子詞語:其和通過本領(lǐng)域技術(shù)人員已知的分析和識別子詞語的各種技術(shù)中的任一種確定的與該測試模式具有最小不相似度的或最有可能是該測試模式所存儲的已知參考模式相對應(yīng)。這些技術(shù)可以包括動態(tài)時間規(guī)整分類器、人工智能技術(shù)、神經(jīng)網(wǎng)絡(luò)、自由音素識別器和/或概率模式匹配器,例如隱馬氏模型(HMM)引擎。

在一個實例中,語音識別解碼器214用適當?shù)穆晫W(xué)模型、語法和算法處理特征向量以生成參考模式的N-最佳列表。如本文所使用的,術(shù)語參考模式可與模型、波形、模板、富信號模型、示例、假設(shè)或其它類型參考互換。參考模式可以包括代表一個或多個詞語或子詞語的一系列特征向量,并且可以基于特定說話者、說話風格和聽得見的環(huán)境狀況。本領(lǐng)域技術(shù)人員將認識到,可以通過ASR系統(tǒng)適當?shù)膮⒖寄J接?xùn)練生成參考模式并將其存儲在存儲器中。本領(lǐng)域技術(shù)人員還將認識到,可以操縱所存儲的參考模式,其中基于參考模式訓(xùn)練與ASR系統(tǒng)的實際使用之間的語音輸入信號中的差異而調(diào)整參考模式的參數(shù)值。例如,基于不同車輛乘員或不同聲學(xué)狀況的有限量的訓(xùn)練數(shù)據(jù),針對一位車輛乘員或某些聲學(xué)狀況而訓(xùn)練的一組參考模式可以被調(diào)整并存儲為針對不同車輛乘員或不同聲學(xué)狀況的另一組參考模式。換句話說,參考模式不一定要固定,且可以在語音識別期間被調(diào)整。

使用詞匯內(nèi)語法以及任何適當解碼器算法和聲學(xué)模型,處理器從存儲器訪問了解釋該測試模式的若干參考模式。例如,處理器可以生成且在存儲器中存儲N-最佳詞匯結(jié)果或參考模式的列表以及相應(yīng)的參數(shù)值。示例性參數(shù)值可以包括詞匯的N-最佳列表中的每個參考模式的信賴分數(shù)以及相關(guān)段持續(xù)時間、可能性分數(shù)、信號噪聲比(SNR)值等??梢园凑諈?shù)值大小的下降排列詞匯的N-最佳列表。例如,具有最高信賴分數(shù)的詞匯參考模式是第一最佳參考模式等。一旦建立了被識別的子詞串,這些子詞語就可以用于利用詞語模型222的輸入構(gòu)建詞語,并利用來自語言模型224的輸入構(gòu)建語句。

最終,后處理器軟件模塊216可以接收來自解碼器模塊214的輸出數(shù)據(jù)以用于任何適當?shù)哪康摹T谝粋€實例中,后處理器軟件模塊216可以從單個或多個詞語參考模式的N-最佳列表中識別或選擇參考模式之一作為被識別的語音。在另一個實例中,后處理器模塊216可以用于將聲學(xué)數(shù)據(jù)轉(zhuǎn)換為文本或數(shù)字,以用于ASR系統(tǒng)的其它方面或其它車輛系統(tǒng)。在又一個實例中,后處理器模塊216可以用于向解碼器214或預(yù)處理器212提供訓(xùn)練反饋。更具體地,后處理器軟件模塊216可以用于為解碼器模塊214訓(xùn)練聲學(xué)模型,或者訓(xùn)練預(yù)處理器模塊212的適應(yīng)參數(shù)。

可以計算機程序產(chǎn)品中實施該方法或其一部分,該計算機程序產(chǎn)品包括在計算機可讀介質(zhì)中承載供一個或多個系統(tǒng)中的一臺或多臺計算機的一個或多個處理器使用以實施一個或多個方法步驟的指令。計算機程序產(chǎn)品可包括:一個或多個軟件程序,其包括源代碼、目標代碼、可執(zhí)行代碼或其它格式的程序指令;一個或多個固件程序;或硬件描述語言(HDL)文件;以及任何程序相關(guān)的數(shù)據(jù)。所述數(shù)據(jù)可以包括數(shù)據(jù)結(jié)構(gòu)、查找表或任何其它適當格式的數(shù)據(jù)。所述程序指令可以包括程序模塊、例程、程序、對象、部件等??梢栽谝慌_計算機上或者在彼此通信的多臺計算機上執(zhí)行計算機程序。

程序可以承載在計算機可讀介質(zhì)上,所述計算機可讀介質(zhì)可以是非瞬時的且可以包括一個或多個存儲設(shè)備、制品等。示例性計算機可讀介質(zhì)包括:計算機系統(tǒng)存儲器,例如,RAM(隨機存取存儲器)、ROM(只讀存儲器);半導(dǎo)體存儲器,例如,EPROM(可擦除可編程ROM)、EEPROM(電可擦除可編程ROM)、閃存;磁盤或光盤或磁帶;和/或其它。計算機可讀介質(zhì)還可包括計算機到計算機的連接,例如,當通過網(wǎng)絡(luò)或另一個通信連接(有線、無線或其組合)傳輸或提供數(shù)據(jù)時。上述實例的任意組合也包括在計算機可讀介質(zhì)的范圍內(nèi)。因此,應(yīng)當理解的是,可以通過能夠執(zhí)行與所公開的方法的一個或多個步驟相對應(yīng)的指令的任何電子產(chǎn)品和/或設(shè)備至少部分地執(zhí)行該方法

現(xiàn)轉(zhuǎn)到圖3,提出了一種對車輛ASR系統(tǒng)內(nèi)容的加載進行優(yōu)先級排序的方法310。在一些實施例中,所述方法310或其部分可接入或利用來自所述基于語音的用戶接口和通信系統(tǒng)10的各個部分的內(nèi)容項目,且所述方法310或其部分可完成涉及自動語音識別系統(tǒng)210的不同部分和/或過程。所述方法310可包括比下文描述更多或更少的步驟,一些步驟是可選的,且各步驟的順序可與詳細描述的不同。熟練的技術(shù)人員將理解在產(chǎn)生用于執(zhí)行對車輛自動語音識別系統(tǒng)內(nèi)容加載進行優(yōu)先級排序的方法的算法和/或其它程序或過程中所涉及的設(shè)計靈活性,因此,可采用方法步驟或方法步驟的部分的任何可操作組合。

從步驟312開始,所述方法跟蹤請求的內(nèi)容項目。內(nèi)容項目可包括各媒體內(nèi)容項目、電話內(nèi)容項目、導(dǎo)航內(nèi)容項目、基于應(yīng)用程序的內(nèi)容項目、和/或車輛診斷內(nèi)容項目。內(nèi)容項目可包括任何用戶ASR系統(tǒng)請求,包括但不限于通過用戶移動設(shè)備、歌曲、播放列表、藝術(shù)家、廣播電臺、音樂類型、媒體流來源、視頻、地址、分路段顯示路線、車輛診斷請求等特定語音撥號或語音輸入請求。所述內(nèi)容項目可以是專用于特定用戶的自動語音識別系統(tǒng),以便由此形成個性化系統(tǒng)交互歷史?;蛘?,所述內(nèi)容項目可以是由許多不同用戶所請求。內(nèi)容項目可來自車載源(諸如來自GPS模塊40),可來自車外源(諸如可從呼叫中心轉(zhuǎn)接或由呼叫中心管理的車輛診斷內(nèi)容項目),或者可來自第三方源(諸如電子郵件提供商或應(yīng)用程序),僅舉幾例。在一些實施例中,來自車外源和第三方源的內(nèi)容項目可經(jīng)由遠程信息處理單元30訪問。在一個優(yōu)選實施例中,所請求的內(nèi)容項目按源進行計數(shù)。例如,如果一名用戶38次請求將Rolling StonesTM作為內(nèi)容項目,其中15次經(jīng)由SpotifyTM訪問,且其中23次經(jīng)由MyMediaTM訪問,所請求的項目可包括下列各項:Rolling Stones38次,Spotify15次,以及MyMedia23次。進一步地,應(yīng)當理解的是,請求SpotifyTM和MyMediaTM可以是它們本身中的內(nèi)容項目。

步驟314涉及建立相關(guān)內(nèi)容項目的計數(shù)。相關(guān)內(nèi)容項目可包括一項請求內(nèi)容項目的總和,該請求內(nèi)容項目可以是或者可以不是按如上所述的源計數(shù),例如,且相關(guān)內(nèi)容項目也可包括來自不同內(nèi)容項目類別或單個內(nèi)容項目類別的不同子目錄的內(nèi)容項目。繼續(xù)上述實例,一項Rolling StonesTM SpotifyTM請求和一項Rolling StonesTM MyMediaTM請求可能是相關(guān)內(nèi)容項目,或與Rolling StonesTM請求相關(guān)的內(nèi)容項目可包括但不限于經(jīng)典搖滾廣播電臺或音樂流媒體、包括Rolling StonesTM的歌曲、Rolling StonesTM的視頻等的播放列表。在另一實例中,如果你請求分路段顯示路線獲得Jane′s house,則相關(guān)內(nèi)容項目可包括來自Jane、Jane的電話聯(lián)系信息等的電子郵件或文本消息。下面進一步詳細描述內(nèi)容項目如何相關(guān)聯(lián)的其它實例。

步驟316是可選的,且涉及對請求的內(nèi)容項目和相關(guān)內(nèi)容項目進行分類。在一個實施例中,內(nèi)容項目可分類為一定數(shù)量的內(nèi)容項目類別,包括但不限于媒體內(nèi)容項目、電話內(nèi)容項目,及導(dǎo)航內(nèi)容項目。在另一個實施例中,內(nèi)容項目類別可進一步包括車輛診斷內(nèi)容項目和其它基于應(yīng)用程序的內(nèi)容項目。其它內(nèi)容項目類別當然是可能的。本文中所列舉的內(nèi)容項目類別僅為實例,且進一步地,其可以不是互相排斥的。在一個實施例中,內(nèi)容項目類別可具有一個或多個子類別。舉一些例子,媒體內(nèi)容項目類別可在藝術(shù)家、播放列表、類型等中進行細分。電話內(nèi)容項目類別可在個人聯(lián)系人、收藏聯(lián)系人、家庭成員等中進行細分。導(dǎo)航內(nèi)容項目類別可在收藏地址、與聯(lián)系人姓名相關(guān)聯(lián)的地址、最近地址等中進行細分。

內(nèi)容項目類別和/或任何子類別可用于幫助限定相關(guān)內(nèi)容項目。在一個實施例中,相關(guān)內(nèi)容項目可由包括多個內(nèi)容項目類別的類別內(nèi)分布限定,其中每個內(nèi)容項目類別包括一個或多個子類別。類別內(nèi)分布涉及基于內(nèi)容項目是否在同一內(nèi)容項目類別的相關(guān)內(nèi)容項目。繼續(xù)上述實例,Gimmie Shelter(歌曲)可以是基于類別內(nèi)分布與Let it Bleed(專輯)、Rolling StonesTM(藝術(shù)家)及經(jīng)典搖滾(類型)相關(guān)的內(nèi)容項目,其中歌曲、專輯、藝術(shù)家、類型是媒體內(nèi)容項目類別的各子類別。在另一實施例中,相關(guān)內(nèi)容項目可由類別內(nèi)分布限定,其中關(guān)于特定主題的內(nèi)容項目被認為是相關(guān)的,都但是事實上它們可能在不同的內(nèi)容項目類別下。重申上述實例,如果你請求分路段顯示路線獲得″Jane′s house″(導(dǎo)航內(nèi)容項目),則相關(guān)內(nèi)容項目可包括來自Jane的電子郵件或文本消息(基于應(yīng)用程序的內(nèi)容項目)、Jane的電話聯(lián)系信息(電話內(nèi)容項目)等。所述方法310也可使用類別間分布和類別內(nèi)分布的組合。

所述方法中的步驟318涉及使用相關(guān)內(nèi)容項目計數(shù)來計算用于所請求的內(nèi)容項目和相關(guān)內(nèi)容項目的似然準則。在一個實施例中,計算似然準則可簡單涉及對相關(guān)內(nèi)容項目的計數(shù)進行排序。例如,如果所述內(nèi)容項目計數(shù)較高(例如,Rolling StonesTM38次計數(shù)請求高于BeatlesTM35次請求),則步驟318可確定給定內(nèi)容項目的似然準則高于另一內(nèi)容項目。計算似然準則可考慮確定何時添加內(nèi)容項目,其中最近添加的內(nèi)容項目比其它內(nèi)容項目具有更高的似然準則。最新添加的內(nèi)容項目可能已經(jīng)在最后一天、最后三天等被添加,且可以是至少部分基于用戶添加內(nèi)容的頻率,例如,通過保持N個最近添加內(nèi)容項目的列表和在添加更近期添加的內(nèi)容項時移除相比不是最近的內(nèi)容項目。計算似然準則可涉及根據(jù)特定算法的設(shè)計,給予內(nèi)容項目一定的概率值、排序、比值、百分比等。計算似然準則通常可以被認為是開發(fā)用于為一個或多個用戶開發(fā)系統(tǒng)交互歷史的知識庫的方式。

步驟320涉及基于所述似然準則對內(nèi)容項目的加載進行優(yōu)先級排序。為了讓用戶隨時訪問而不是隨機訪問,內(nèi)容項目可加載到存儲器54上。因而,通過基于似然準則對內(nèi)容項目進行優(yōu)先級排序,更可能的是,先前請求的內(nèi)容項目或相關(guān)內(nèi)容項目能夠隨時可用。如果似然準則是跟蹤的內(nèi)容項目和相關(guān)內(nèi)容項目的排序列表的形式,例如,則內(nèi)容加載將根據(jù)所述排序列表進行優(yōu)先級排序。如果似然準則考慮內(nèi)容項目是否最近已被添加,例如,則內(nèi)容加載可基于所述內(nèi)容的新近度進行優(yōu)先級排序。

步驟322涉及選擇性地加載內(nèi)容項目。在一個實施例中,內(nèi)容項目可選擇性地從每個內(nèi)容項目類別加載,從而具有較高計數(shù)的內(nèi)容項目先于具有較低計數(shù)的內(nèi)容項目被加載到車輛ASR系統(tǒng)的存儲器上??苫陉P(guān)于步驟320所描述的優(yōu)先級來選擇性地加載內(nèi)容項目。該步驟還可以包括將加載到存儲器(諸如ASR系統(tǒng)存儲器54)中的內(nèi)容項目的量限制為所請求的內(nèi)容項目和相關(guān)內(nèi)容項目。通常,存儲器限制為大約10000個內(nèi)容項目,并且在一個實施例中,大約一半的存儲器專用于可選擇地加載的內(nèi)容項目或優(yōu)先加載的內(nèi)容項目,并且剩余一半可以不被加載或可以被任意加載。限制可選擇性加載或根據(jù)優(yōu)先級加載的內(nèi)容項目的量可有益于ASR系統(tǒng)的某些方面,包括語法模型、對話流和多道識別。內(nèi)容項目加載可取決于所實現(xiàn)的數(shù)據(jù)庫結(jié)構(gòu)和與系統(tǒng)相關(guān)聯(lián)的算法或方法。如果所述系統(tǒng)包括可實時查詢數(shù)據(jù)庫,則有可能請求特定類別中所有的內(nèi)容項目(諸如藝術(shù)家、播放列表或類型),例如,并且存儲所有返回的結(jié)果。在其它實施例中,可存在盲序加載過程,其中每個內(nèi)容項目依次被加載,且系統(tǒng)決定是將其保存還是丟棄。這種過濾程序必須遞歸地執(zhí)行,每一道識別有一個較寬的過濾程序,直到達到所期望的限度為止。其它系統(tǒng)實施方式、算法等當然是可能的。

步驟324是可選的,且涉及對內(nèi)容項目類別進行優(yōu)先級排序。在一個實施例中,所述內(nèi)容項目類別可按照具有較高計數(shù)的總內(nèi)容項目先于具有較低計數(shù)的總內(nèi)容項目的加載內(nèi)容項目類別進行優(yōu)先級排序。例如,如果用戶請求相對于媒體內(nèi)容項目成比例數(shù)目的電話內(nèi)容項目,則該方法可以相應(yīng)地成比例地調(diào)整分配給每個內(nèi)容項目的存儲的量。可選地,如果默認分配是4000個電話聯(lián)系人和6000首歌曲用于選擇性加載,但是用戶從電話和媒體內(nèi)容項目類別請求相等數(shù)量的內(nèi)容項目,則該分配可以轉(zhuǎn)換為5000個電話內(nèi)容項目和5000首歌曲。

步驟326是可選步驟,其涉及基于一個或多個用戶交互歷史來適配車輛ASR系統(tǒng),例如ASR系統(tǒng)210。如上所述,根據(jù)優(yōu)先級排序選擇性地加載或加載的內(nèi)容項可能是有利的,因為每個對話步驟的優(yōu)化內(nèi)容可以提高其自身的識別,并且可以減少任務(wù)完成次數(shù)。此外,似然準則可添加至語法模型218(例如,有限狀態(tài)語法)、詞語模型222,或語句/語言模型224,并且被整合到置信度得分中。似然準則可被添加到識別結(jié)果的結(jié)果列表,因此,可以重新計算結(jié)果列表的置信度得分。進一步地,似然準則可與多道識別一起使用。在一個實施例中,在第一道識別中,如果完全識別嘗試失敗,則系統(tǒng)可嘗試理解所述類別或預(yù)期用戶動作,并基于特定類別或子類別的內(nèi)容項目執(zhí)行第二道識別或第三道識別。通過限制所述內(nèi)容項目類別,此類別的更多內(nèi)容項目可被選擇地加載。例如,兩道識別可使當媒體內(nèi)容項目超過時,可被給定對話步驟或用戶順序加載的所述大小,例如,可以啟用兩道識別,使得當媒體內(nèi)容項目的數(shù)量超過對于給定的對話步驟或用戶輪次可以加載的大小時,其中內(nèi)容量太大而不能被完全加載,針對可選擇地加載的兩道話語識別,僅執(zhí)行所述媒體內(nèi)容項目的孤立上下文。在另一實施例中,對話流可被適應(yīng)。如果ASR系統(tǒng)多次不識別用戶請求,這一現(xiàn)象有可能發(fā)生,因為在當前對話步驟中可獲得有限的內(nèi)容,則所述ASR系統(tǒng)可通知用戶將所述請求分成更小的步驟,使得ASR系統(tǒng)中的每一步驟具有選擇性地加載的內(nèi)容項目分布。在另一實施例中,可形成信息性提示。例如,如果ASR系統(tǒng)不能識別用戶請求,這種情況有可能再次發(fā)生,因為在當前對話步驟中可獲得有限的內(nèi)容,系統(tǒng)可通知用戶這種局限性及如何去克服。例如,系統(tǒng)可以響應(yīng),“好吧,對不起。我可能還不知道這首歌曲。我可以識別藝術(shù)家或播放列表。你想要我做些什么?”一旦用戶選擇想要的歌曲的藝術(shù)家或者手動地選擇,所述歌曲就將變成跟蹤式請求內(nèi)容項目。

在本方法310的一個實施例中,每個內(nèi)容項目類別就所述優(yōu)先級和/或內(nèi)容項目的選擇性加載具有不同的域規(guī)則的設(shè)置。進一步地,在一些實施方案中可以優(yōu)選僅將域規(guī)則應(yīng)用于特定內(nèi)容項目類別。在一個實施例中,更受歡迎的內(nèi)容項目類別具有域規(guī)則,而其它內(nèi)容項目類別不具有,從而使得所述受歡迎的內(nèi)容項目類別選擇性地加載,之后是其它內(nèi)容項目的一般的或任意的加載。在一些實施例中,域規(guī)則一般可與似然準則一致。

例如,用于媒體內(nèi)容項目類別的域規(guī)則可包括首先加載最近添加的媒體內(nèi)容項目,然后由類別內(nèi)分布裝載,媒體內(nèi)容項目從狹義的子類別到廣義的子類別(例如:藝術(shù)家、播放列表、類型)。隨后,可以被用于加載基于應(yīng)用程序的內(nèi)容項目(例如:加載在流傳輸應(yīng)用源中請求的,在廣播元數(shù)據(jù)源中觀察或在這些源之一中贊同為喜歡的請求的或相關(guān)的內(nèi)容項目)。最后,所述媒體域規(guī)則可加載剩余的(或該剩余的子集)媒體內(nèi)容項目,直到滿足內(nèi)容項目或媒體內(nèi)容項目的閾值量。

用于電話內(nèi)容項目類別的域規(guī)則可包括加載所有聯(lián)系人名稱,該聯(lián)系人名稱曾由用戶通過語音或通過電話諸如移動設(shè)備16(例如,類別內(nèi)分布)請求,加載最近添加的聯(lián)系人,如果可獲得所述信息,且最終加載曾通過其它源請求的聯(lián)系人名稱(例如,類別間分布)諸如消息應(yīng)用、電子郵件,或其它可獲得聯(lián)系人信息或名稱的通信源。最后,所述電話域規(guī)則可加載剩余的(或該剩余的子集)電話內(nèi)容項目,直到滿足內(nèi)容項目或電話內(nèi)容項目的閾值量。

用于導(dǎo)航內(nèi)容項目類別的域規(guī)則可包括加載所有曾由用戶通過語音或通過諸如GPS模塊40(例如,類別間分布)的導(dǎo)航系統(tǒng)請求的目的地,可通過其它內(nèi)容項目類別跟蹤,諸如基于應(yīng)用程序的可加載至用戶移動設(shè)備上諸如移動設(shè)備16的GPS服務(wù)或應(yīng)用程序,包括收藏、最近添加,或類似列表??杉虞d在所請求目的地領(lǐng)域中的目的地??杉虞d類似類型的目的地(例如,相關(guān)內(nèi)容項目諸如所有興趣點的餐館或加油站)。所有從個人內(nèi)容可獲得的目的地可被加載,諸如與電話內(nèi)容項目諸如聯(lián)系人名稱(例如類別內(nèi)分布)相關(guān)的地址。最后,所述導(dǎo)航域規(guī)則可加載剩余的(或該剩余的子集)導(dǎo)航內(nèi)容項目,直到滿足內(nèi)容項目或?qū)Ш絻?nèi)容項目的閾值量。

可以理解前面是本發(fā)明的一個或多個實施例的描述。本發(fā)明不限于在此公開的特殊的實施方案,而是由下面的權(quán)利要求書來唯一限定。此外,包含在前面描述中的聲明涉及具體的實施例,不能解釋為限定本發(fā)明的范圍或限定權(quán)利要求所使用的術(shù)語,該術(shù)語或措詞在上面進行了的特別限定的情況除外。各種其他的實施例和已公開實施例的各種變化以及修改對熟悉本領(lǐng)域的技術(shù)人員而言顯而易見。各種其它的實施例、各種變化和修改都應(yīng)為附屬權(quán)利要求的范圍之內(nèi)。

如本說明書和權(quán)利要求中使用,術(shù)語“e.g.,”、“for example”、“for instance”、“such as”及“l(fā)ike”和動詞“comprising”、“having”、“including”以及它們的其他動詞形式,當與一個或多個元件或其它條目列表結(jié)合使用時每個都應(yīng)被理解為是開放式,意味著所述列表不應(yīng)被看作排除了其它,附加元件或條目。其它術(shù)語采用其最廣泛的合理含義來解釋,用于要求有不同解釋的上下文時除外。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
浑源县| 富阳市| 瓮安县| 秦皇岛市| 东源县| 佛冈县| 蒙城县| 高淳县| 延边| 陇川县| 巢湖市| 四会市| 永和县| 皋兰县| 长宁区| 潢川县| 大名县| 诸暨市| 松桃| 龙胜| 阿瓦提县| 抚州市| 建宁县| 巨野县| 许昌县| 怀集县| 应用必备| 房山区| 广东省| 孝感市| 视频| 雷州市| 宣汉县| 山西省| 锡林浩特市| 左云县| 剑阁县| 清丰县| 山阴县| 奇台县| 册亨县|