專利名稱:用于在話音應(yīng)用環(huán)境中的模態(tài)之間切換的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及自動(dòng)話音系統(tǒng)領(lǐng)域,尤其涉及在為交互式文本交換 擴(kuò)展的話音應(yīng)用環(huán)境中的模態(tài)之間的切換。
背景技術(shù):
交互式語音應(yīng)答(IVR)系統(tǒng)常常用來經(jīng)由通信網(wǎng)絡(luò)的語音信道 提供自動(dòng)客戶服務(wù)。IVR系統(tǒng)允許快速、有效以及自動(dòng)地處理常規(guī) 的客戶請(qǐng)求。當(dāng)請(qǐng)求是非常規(guī)的或者當(dāng)呼叫方對(duì)于IVR系統(tǒng)有困難 時(shí),可以從IVR系統(tǒng)轉(zhuǎn)到客戶服務(wù)代表。甚至當(dāng)需要人工交互時(shí), IVR系統(tǒng)可以獲取諸如賬號(hào)和呼叫理由的必要的初步信息,該信息 可以確保呼叫方^皮路由至適當(dāng)?shù)娜斯ご砗痛_保將人與人之間的交 互時(shí)間減少到最小。IVR系統(tǒng)的成功使用允許呼叫中心最低限度地 配備人員,同時(shí)客戶在等待隊(duì)列中花費(fèi)相對(duì)短的時(shí)間就能被提供高 級(jí)別的服務(wù)。
IVR系統(tǒng),尤其是具有自然語言理解(NLU)能力和/或強(qiáng)大的 上下文無關(guān)文法的穩(wěn)固IVR系統(tǒng),代表著巨大的財(cái)政和技術(shù)投資。 此投資包括購(gòu)買和維護(hù)IVR基礎(chǔ)設(shè)施硬件、IVR基礎(chǔ)設(shè)施軟件以及 在此基礎(chǔ)設(shè)施上執(zhí)行的語音應(yīng)用的費(fèi)用。額外的和重要的重復(fù)性費(fèi) 用可能涉及維護(hù)足夠數(shù)量的語音質(zhì)量信道以處理預(yù)期的呼叫容量。 而且,這些信道中的每一個(gè)都消耗語音服務(wù)器的可用端口,所述語 音服務(wù)器具有有限數(shù)量的昂貴端口 。每個(gè)信道還消耗在呼叫方與IVR 系統(tǒng)之間建立語音質(zhì)量信道所需的 一 些帶寬。
在共同未決專利申請(qǐng)No.11/612,996中詳細(xì)描述了一種用于擴(kuò)展 IVR基礎(chǔ)設(shè)施以允許基于文本的交互式服務(wù)的創(chuàng)新的解決方案,其 標(biāo)題為 "Using an Automated Speech Application Environment to
Automatically Provide Text-Based Interactive Services"。 更具體地, 此共同未決申請(qǐng)教示了一種聊天機(jī)器人對(duì)象,稱為Chatbot,它能夠 動(dòng)態(tài)地將接收自文本交換客戶機(jī)的文本轉(zhuǎn)換成可由語音服務(wù)器使用 的輸入,并且能夠動(dòng)態(tài)地將來自語音服務(wù)器的輸出轉(zhuǎn)換成針對(duì)客戶 機(jī)適當(dāng)格式化的文本。從語音服務(wù)器的觀點(diǎn)看,與文本交換客戶機(jī) 的基于文本的交互通過與用來處理基于語音的交互相同的方式和相 同的硬件/軟件被處理。該共同未決的解決方案考慮了在模態(tài) (modality)之間切換的可能性,沒有中斷之前存在的通信會(huì)話,這 是該申請(qǐng)的主題。
應(yīng)當(dāng)理解,用于提供語音和文本交換服務(wù)的傳統(tǒng)解決方案在單 獨(dú)且不同的服務(wù)器中實(shí)現(xiàn)各個(gè)服務(wù)。這些服務(wù)器中的每一個(gè)都將包 括為特定模態(tài)定制的服務(wù)器特定應(yīng)用。例如,控制基于語音的交互 的基于VoiceXML的應(yīng)用可以在話音服務(wù)器上執(zhí)行,控制基于文本 的交互的不同的基于XML的應(yīng)用可以在文本交換服務(wù)器上執(zhí)行。
從文本會(huì)話轉(zhuǎn)移到語音會(huì)話或與之相反的任何嘗試都將需要兩 個(gè)不同的服務(wù)器、應(yīng)用以及通信會(huì)話相互之間同步。例如,如果語 音會(huì)話將被切換到文本會(huì)話,那么新的文本會(huì)話將不得不在用戶和 文本交換服務(wù)器之間被啟動(dòng)。該文本交換服務(wù)器將必須為該會(huì)話啟 動(dòng)文本交換應(yīng)用的實(shí)例。接著,關(guān)于該語音會(huì)話的狀態(tài)信息將不得 不被轉(zhuǎn)送到文本交換服務(wù)器和/或文本交換應(yīng)用。最后,將需要退出 在話音服務(wù)器執(zhí)行的話音應(yīng)用以及終止話音服務(wù)器與用戶之間的原 始語音會(huì)話。
沒有已知的系統(tǒng)或系統(tǒng)組為動(dòng)態(tài)的通信內(nèi)會(huì)話提供將允許從文 本交換模態(tài)切換到語音模態(tài)以及反之亦然的模態(tài)切換能力。而且, 不存在有關(guān)甚至是希望在自動(dòng)通信會(huì)話期間在文本交換模態(tài)和語音 模態(tài)之間動(dòng)態(tài)切換的已知教示,或許是由于認(rèn)為這種能力天生具有 復(fù)雜化的性質(zhì)。
發(fā)明內(nèi)容
一種解決方案允許參加自動(dòng)通信會(huì)話的參與者在文本交換交互 和基于語音的交互之間以及與之相反的過程之間隨意地動(dòng)態(tài)切換, 并且不打擾自動(dòng)通信會(huì)話的對(duì)話狀態(tài)。進(jìn)一步,該解決方案允許參 與者為該通信會(huì)話建立雙模式,其接收輸入和/或提供輸出給不同的 裝置,這些裝置中每個(gè)與不同的模態(tài)相關(guān)聯(lián)。因此,雙模通信會(huì)話 不同于多模通信會(huì)話。在多模通信會(huì)話中,多個(gè)交互模態(tài)與單個(gè)裝 置/客戶機(jī)應(yīng)用相關(guān)聯(lián)。特別地,所述解決方案可以額外地允許用戶 在通信會(huì)話期間動(dòng)態(tài)切換到多模交互模式和自多模交互模式進(jìn)行切 換。所述解決方案允許以對(duì)于控制會(huì)話對(duì)話的自動(dòng)服務(wù)器透明的方 式和以對(duì)于會(huì)話控制應(yīng)用透明的方式進(jìn)行交互模式的切換。
本解決方案可以被實(shí)現(xiàn)在為基于文本的交互式服務(wù)擴(kuò)展的話音
應(yīng)用環(huán)境的上下文中。話音應(yīng)用環(huán)境可以包括聊天機(jī)器人(Chatbot) 服務(wù)器,該服務(wù)器管理聊天機(jī)器人對(duì)象或Chatbot。 Chatbot能夠?qū)⒔?br>
入,以及將來自語音服務(wù)器的輸出動(dòng)態(tài)地轉(zhuǎn)換為針對(duì)客戶機(jī)適當(dāng)格 式化的文本。語音服務(wù)器的文本輸入API可以用于直接接受文本, 因此在文本交換客戶機(jī)的輸出與語音服務(wù)器的輸入之間所需要的轉(zhuǎn) 換可以少至沒有。語音服務(wù)器的輸出可以是語音標(biāo)記格式,Chatbot 可以從其中提取文本(也即,去除標(biāo)記標(biāo)簽),該文本傳送到文本 交換客戶機(jī)。
本發(fā)明可以根據(jù)與此處所呈現(xiàn)的素材一致的多個(gè)方面被實(shí)現(xiàn)。 例如,本發(fā)明的一個(gè)方面可以包括一種用于在涉及語音服務(wù)器的對(duì) 話會(huì)話中動(dòng)態(tài)切換模態(tài)的方法。在該方法中,對(duì)話會(huì)話可以建立在 用戶和在語音服務(wù)器內(nèi)執(zhí)行的話音應(yīng)用之間。在對(duì)話會(huì)話期間,用 戶可以使用原始模態(tài)進(jìn)行交互,該原始模態(tài)是話音模態(tài)、文本交換 模態(tài)或包括文本交換模態(tài)的多模模態(tài)。話音應(yīng)用可以使用話音模態(tài) 進(jìn)行交互。可以檢測(cè)將原始模態(tài)變成為不同模態(tài)的模態(tài)切換觸發(fā)器。 切換到不同模態(tài)的模態(tài)轉(zhuǎn)變可以對(duì)于語音服務(wù)器和話音應(yīng)用透明。 從語音服務(wù)器輸出的語音標(biāo)記也可以被動(dòng)態(tài)地轉(zhuǎn)換為文本交換消 息。話音應(yīng)用可以是缺少固有文本交換能力的標(biāo)準(zhǔn)話音應(yīng)用。
本發(fā)明的另一方面可以包括一種用于在涉及語音服務(wù)器的對(duì)話 會(huì)話中動(dòng)態(tài)切換模態(tài)的不同方法??梢宰R(shí)別自動(dòng)對(duì)話會(huì)話涉及文本
交換客戶機(jī)和話音應(yīng)用。該對(duì)話會(huì)話還可以涉及Chatbot服務(wù)器和語 音服務(wù)器。在該對(duì)話會(huì)話期間,文本交換客戶機(jī)可以通過第一通信 信道與Chatbot服務(wù)器交換文本交換消息。在第二通信信道,Chatbot 服務(wù)器可以發(fā)送語音服務(wù)器通過文本輸入API能夠使用的文本。語 音服務(wù)器可以將與語音文法匹配的文本返回給Chatbot服務(wù)器。 Chatbot服務(wù)器可以將語音服務(wù)器的輸出動(dòng)態(tài)地轉(zhuǎn)換為可由話音應(yīng)用 使用的輸入。然后,它得出可由文本交換客戶機(jī)使用的對(duì)應(yīng)的文本 消息。Chatbot服務(wù)器可以檢測(cè)模態(tài)切換觸發(fā)器。該檢測(cè)能夠促使自 動(dòng)建立Chatbot服務(wù)器與語音裝置之間的第三通信信道。此后,用于 自動(dòng)對(duì)話會(huì)話的雙向語音消息可以通過第二通信信道和第三通信信 道的組合在語音裝置與語音服務(wù)器之間被傳送。
本發(fā)明的還 一 個(gè)方面可以包括 一 種用于提供文本交換服務(wù)的系 統(tǒng),其包括文本交換客戶機(jī)、語音客戶機(jī)、話音應(yīng)用環(huán)境、Chatbot 服務(wù)器以及模態(tài)切換引擎。文本交換客戶機(jī)可以通過文本交換信道 發(fā)送和接收實(shí)時(shí)文本交換。語音客戶機(jī)可以通過語音信道發(fā)送和接 收話音。話音應(yīng)用環(huán)境可以包括允許用戶通過語音信道實(shí)時(shí)交互的 自動(dòng)話音應(yīng)答應(yīng)用。Chatbot服務(wù)器可以建立涉及文本交換客戶機(jī)和 自動(dòng)話音應(yīng)答應(yīng)用的通信會(huì)話。Chatbot服務(wù)器可以將話音應(yīng)用所提 供的語音標(biāo)記消息動(dòng)態(tài)地轉(zhuǎn)換為文本消息。語音服務(wù)器的文本輸入 API可以允許語音服務(wù)器使用文本。模態(tài)切換引擎可以動(dòng)態(tài)切換模 態(tài),其中用戶與自動(dòng)話音應(yīng)答應(yīng)用交互。動(dòng)態(tài)才莫態(tài)切換可以切換文
本交換客戶機(jī)和/或語音客戶機(jī)的激活狀態(tài)。例如,當(dāng)發(fā)生模態(tài)切換 時(shí),之前與文本交換客戶機(jī)交互的用戶能夠與諸如電話裝置的語音 客戶機(jī)無縫地進(jìn)行交互。
應(yīng)當(dāng)注意,本發(fā)明的多個(gè)方面可以被實(shí)現(xiàn)為用于控制計(jì)算設(shè)備 以實(shí)現(xiàn)此處所述功能的程序,或者實(shí)現(xiàn)為用于使得計(jì)算設(shè)備執(zhí)行與
此處所述步驟對(duì)應(yīng)的過程的程序。此程序可以通過將其存儲(chǔ)在磁盤、 光盤、半導(dǎo)體存儲(chǔ)器、任何其他記錄介質(zhì)來提供,或者也可以作為 通過載波傳送的數(shù)字編碼信號(hào)來提供。所述程序可以是單個(gè)程序或 者可以實(shí)現(xiàn)為多個(gè)子程序,子程序中的每一個(gè)在單個(gè)計(jì)算裝置內(nèi)交 互或者在網(wǎng)絡(luò)空間上以分布的形式交互。
此處所詳細(xì)描述的方法也可以是至少部分地由服務(wù)代理和/或服 務(wù)代理所操縱的機(jī)器響應(yīng)于服務(wù)請(qǐng)求所執(zhí)行的方法。
在附圖中示出了目前優(yōu)選的實(shí)施例,不過應(yīng)當(dāng)理解,本發(fā)明并 不局限于所示出的具體安排和結(jié)構(gòu)。
圖1是用于允許在不中斷當(dāng)前通信會(huì)話的情況下在文本和語音
模態(tài)之間平滑用戶切換的Chatbot服務(wù)器的系統(tǒng)的示意圖。
圖2是示出了根據(jù)此處所公開的發(fā)明安排的實(shí)施例在涉及語音
客戶機(jī)、文本交換客戶機(jī)、語音客戶機(jī)、Chatbot服務(wù)器、語音服務(wù)
器和應(yīng)用服務(wù)器的通信會(huì)話期間進(jìn)行模態(tài)切換的處理流程圖。
圖3是根據(jù)此處所公開的發(fā)明安排的實(shí)施例用于為話音應(yīng)用環(huán)
境提供無縫模態(tài)切換能力的系統(tǒng)的示意圖。
具體實(shí)施例方式
圖1是用于允許在不中斷當(dāng)前通信會(huì)話的情況下在文本和語音 模態(tài)之間平滑用戶切換的Chatbot服務(wù)器114的系統(tǒng)100的示意圖。 可以理解,通信會(huì)話是在人和自動(dòng)話音使能應(yīng)用119之間的,不考 慮正在使用的模態(tài)。系統(tǒng)100允許在文本交換接口 110和語音接口 112之間的切換,每個(gè)接口都與話音使能應(yīng)用119通信,其中所述切 換不中斷正在進(jìn)行的通信會(huì)話的對(duì)話狀態(tài)。
話音使能應(yīng)用119可以是VoiceXML應(yīng)用,例如經(jīng)常配置在聯(lián) 系中心的用于交互式語音應(yīng)答系統(tǒng)UVR)的應(yīng)用。文本交換客戶機(jī) 接口 110可以是用于任何類型的文本交換通信的接口 ,所述文本交
換通信例如即時(shí)消息(IM)通信,聊天通信,使用SAMETIME、 TRILLIAN、 YAHOO! MESSENGER的文本消息傳遞,等等。語音 接口 112可以是在其上發(fā)生實(shí)時(shí)話音通信的任何接口 。例如,接口 112可以包括但不限于電話輸入/輸出U/0)接口、移動(dòng)通信裝置
(例如,蜂窩電話)I/0接口、雙向無線1/0接口和/或網(wǎng)際協(xié)議語音
(VOIP )接口 。
語音服務(wù)器118,像大部分語音服務(wù)器一樣,可以包括文本模式 接口 106,該接口通常由開發(fā)者、系統(tǒng)維護(hù)人員和/或話音識(shí)別引擎 的訓(xùn)練員使用。例如, 一套專有的、受限的或標(biāo)準(zhǔn)化的(例如MRCPv2 INTERPRET)應(yīng)用程序接口 (API)可以用于接口 106。這套通常不 能在生產(chǎn)環(huán)境中使用或訪問的API可以被激活以創(chuàng)建消耗計(jì)算資源 比語音信道少得多的文本輸入信道,通常與在生產(chǎn)環(huán)境中操作的語 音服務(wù)器118建立語音信道。大部分情況下,文本模式接口 106是 在生成語音服務(wù)器118內(nèi)現(xiàn)存的,但是處于休眠。接口 106可以被 激活以與Chatbot服務(wù)器進(jìn)行基于文本的交互。
接口 106的使用以對(duì)于應(yīng)用服務(wù)器108透明的方式發(fā)生,因此 對(duì)應(yīng)用119沒有影響。也即,與語音輸入相反,應(yīng)用119和應(yīng)用服 務(wù)器108保持不知道語音服務(wù)器118正在通過接口 106處理文本輸 入。由語音服務(wù)器118產(chǎn)生并且被發(fā)送到Chatbot服務(wù)器114的輸出 在任一情況下都可以是相同的。而且,由應(yīng)用服務(wù)器108產(chǎn)生并且 被發(fā)送到ChatboU良務(wù)器114的輸出可以是相同的。因此,多個(gè)通信 會(huì)話可以被應(yīng)用服務(wù)器108同時(shí)處理,其中一個(gè)或多個(gè)是使用接口 106的基于文本的會(huì)話,其他的是基于語音的會(huì)話。系統(tǒng)100可以在 不改變應(yīng)用服務(wù)器108基礎(chǔ)結(jié)構(gòu)(以及假設(shè)存在接口 106,不改變語 音服務(wù)器118)并且不改變?cè)捯羰鼓軕?yīng)用119的代碼的情況下被實(shí) 現(xiàn)。這是真的,即使應(yīng)用119可能缺少對(duì)文本交換交互的明確編碼 支持并且可能在沒有本公開發(fā)明的情況下不能支持這種交互。此外, 文本交換接口 110可以是任何現(xiàn)成的不需要修改以如在系統(tǒng)100中 所示操作的文本交換軟件。
在系統(tǒng)100中,Chatbot服務(wù)器114可以取來121與它執(zhí)行的話 音使能應(yīng)用119相關(guān)聯(lián)的語音標(biāo)記123。 Chatbot服務(wù)器114也可以 中繼來自接口 110的原文輸入120以通過接口 106發(fā)送可由語音服 務(wù)器118使用的文本122。語音服務(wù)器118可以將此輸入與識(shí)別文法 進(jìn)行匹配并產(chǎn)生用于Chatbot服務(wù)器114的文本輸出124。當(dāng)Chatbot 服務(wù)器114執(zhí)行所述應(yīng)用時(shí)可以使用此輸出124。應(yīng)用119處理此輸
出,該輸出可以產(chǎn)生響應(yīng)輸出,通常以語音標(biāo)記^a的形式,例如
VoiceXML (其可以進(jìn)一步利用W3C話音合成標(biāo)記語言或SSML )。 當(dāng)執(zhí)行文本交換操作時(shí),可以繞過由語音服務(wù)器118執(zhí)行的常規(guī)話 音合成操作。Chatbot服務(wù)器114可以將響應(yīng)輸出從標(biāo)記動(dòng)態(tài)地轉(zhuǎn)換 為由接口 110處理的原文輸出126。例如,包括在標(biāo)記標(biāo)簽之間的原 文內(nèi)容可以從應(yīng)用119標(biāo)記中提取出來(也即,標(biāo)記標(biāo)簽可以省略) 并且被包括在文本126消息中。
從接口 110內(nèi)部,用戶可以選擇被轉(zhuǎn)移130到不同的通信模態(tài) 和/或到實(shí)時(shí)接線員,其導(dǎo)致Chatbot服務(wù)器114執(zhí)行切換操作。此 切換可以按對(duì)于應(yīng)用服務(wù)器108和應(yīng)用119透明的方式發(fā)生并且當(dāng) 前通信會(huì)話的對(duì)話狀態(tài)可以被無縫地維持。
為了舉例說明,轉(zhuǎn)移請(qǐng)求130可以是將交互接口從文本交換接 口 110變成語音接口 112的請(qǐng)求。語音接口 112可以通過諸如電話 的單獨(dú)裝置來提供。當(dāng)接收到請(qǐng)求130時(shí),Chatbot服務(wù)器l"可以 發(fā)送連接終止通知131到接口 110。接著,Chatbot服務(wù)器114可以 開放其自身與語音接口 112之間的語音信道,通過該語音信道可以 傳送可選的介紹性通知132。然后,語音輸入134可以被作為輸入 136路由至Chatbot服務(wù)器114。 Chatbot服務(wù)器將該語音輸入136發(fā) 送至語音服務(wù)器,該語音服務(wù)器產(chǎn)生文本結(jié)果138。 Chatbot服務(wù)器 在處理結(jié)果138之后可以生成發(fā)送(未示出)到語音服務(wù)器118的 新標(biāo)記,該語音服務(wù)器返回(未示出)語音輸出。該語音輸出可以 被Chatbot服務(wù)器114作為語音輸出140傳送到語音接口 112。
接著,到代理的轉(zhuǎn)移請(qǐng)求可以從接口 112 ^皮發(fā)送。該請(qǐng)求142
可以指定優(yōu)選語音通信還是實(shí)時(shí)文本交換,假設(shè)實(shí)時(shí)文本交換的選
項(xiàng)可用。實(shí)時(shí)文本交換請(qǐng)求142可以促使Chatbot服務(wù)器114將交互 才妄口乂人4妻口 112切換為4矣口 110。
當(dāng)接收到代理轉(zhuǎn)移請(qǐng)求142時(shí),Chatbot服務(wù)器114可以通過適 當(dāng)?shù)耐ㄐ判诺肋B接144用戶到實(shí)時(shí)代理116。該代理116可以自動(dòng)地 接收來自Chatbot服務(wù)器114的關(guān)于當(dāng)前通信會(huì)話的信息。例如,用 戶的姓名、帳戶信息等類似信息可以呈現(xiàn)給代理116,從而縮短人與 人之間的通信時(shí)間。
應(yīng)當(dāng)注意,可選的通知131和132可以直接來自Chatbot服務(wù)器 114而不是來自語音服務(wù)器118或來自應(yīng)用119。還應(yīng)當(dāng)注意,可以 向Chatbot服務(wù)器114做出從語音接口 112返回到文本轉(zhuǎn)移接口 110 的轉(zhuǎn)移請(qǐng)求(未示出),該Chatbot服務(wù)器以基本上相同的方式操作 并且不中斷正在與語音服務(wù)器118繼續(xù)的對(duì)話。
此外,模態(tài)改變可以從應(yīng)用119啟動(dòng)。例如,應(yīng)用119可以確 定通過語音信道轉(zhuǎn)移到實(shí)時(shí)接線員的條件是否滿足。Chatbot服務(wù)器 114可以檢測(cè)這些條件并且可以在需要時(shí)自動(dòng)開放到語音接口 112 的信道。
在一種預(yù)期安排中,系統(tǒng)100可以實(shí)現(xiàn)雙模以及多模通信。雙 模通信同時(shí)激活接口 110和112。從服務(wù)器118的輸出既可以作為經(jīng) 由接口 112的語音輸出也可以作為經(jīng)由接口 110的文本輸出來提供。
多模通信允許通過單個(gè)接口傳送語音和文本兩種輸入/輸出。例 如,文本交換接口 110可以是能夠接收話音輸入和提供話音輸出的 多模接口。多模輸出(例如,文本和話音)可以通過多模接口 110
來呈現(xiàn)。
圖2是示出了根據(jù)此處所公開的發(fā)明安排的實(shí)施例在涉及語音 客戶機(jī)202、文本交換客戶機(jī)204、 Chatbot服務(wù)器206、語音服務(wù)器 208和應(yīng)用服務(wù)器209的通信會(huì)話期間進(jìn)行模態(tài)切換的處理流程圖 200。
語音服務(wù)器208可以包括通常由開發(fā)者、系統(tǒng)維護(hù)人員和/或話 音識(shí)別引擎訓(xùn)練員使用的文本輸入API。這套通常不能在生產(chǎn)環(huán)境中
使用或訪問的API可以被激活以允許語音服務(wù)器208直接使用文本, 其所需要的計(jì)算資源比處理服務(wù)器208通常接收的語音輸入所需要 的計(jì)算資源少得多。
正如所示,客戶機(jī)204可以將請(qǐng)求210發(fā)送到Chatbot服務(wù)器206 以初始化文本模態(tài)信道。Chatbot服務(wù)器206可以發(fā)送信道初始化消 息212到語音服務(wù)器208以建立會(huì)話。服務(wù)器208可以肯定地響應(yīng), 使得在服務(wù)器206和208之間建立信道214。接著,Chatbot服務(wù)器 206可以與客戶機(jī)204建立所請(qǐng)求的文本信道216。在步驟216之后, Chatbot服務(wù)器206可以發(fā)送請(qǐng)求217到應(yīng)用服務(wù)器209,其使得實(shí) 例化話音使能應(yīng)用。也即,應(yīng)用標(biāo)記220可以被傳送到Chatbot服務(wù) 器206用于執(zhí)行。
當(dāng)Chatbot服務(wù)器206執(zhí)行話音使能應(yīng)用119時(shí),應(yīng)用啟動(dòng)提示 221可以發(fā)生。服務(wù)器206可以將由應(yīng)用119提供的標(biāo)記轉(zhuǎn)換222 為純文本,由被發(fā)送到客戶機(jī)204的文本提示224表示。例如,提 示(prompt) 221可以#1寫入標(biāo)記中并且可以包括
<炎X本J: </炎示〉。 轉(zhuǎn)換222可以提取文本上下文(省略標(biāo)記標(biāo)簽)并且生成4又包括該 文本上下文的文本4是示224。客戶才幾204可以通過文本信道對(duì)該4是示 做出響應(yīng)226。服務(wù)器206可以中繼響應(yīng)228至語音服務(wù)器208,該 響應(yīng)228可以與響應(yīng)226 —致。語音服務(wù)器208可以通過編程式動(dòng) 作230將響應(yīng)228與語音文法進(jìn)行匹配,從而產(chǎn)生文本結(jié)果232。語 音服務(wù)器208可以將文本結(jié)果232傳送給Chatbot服務(wù)器206。當(dāng) Chatbot服務(wù)器206執(zhí)行執(zhí)行應(yīng)用119的應(yīng)用邏輯243時(shí)使用此輸出 232,結(jié)果生成標(biāo)記。Chatbot服務(wù)器206可以將包含在生成的標(biāo)記 中的原文內(nèi)容轉(zhuǎn)換236為發(fā)送到客戶機(jī)204的文本結(jié)果237。
可以以這種方式繼續(xù)交互,直到客戶機(jī)204發(fā)送切換代碼238 到Chatbot服務(wù)器206。該切換代碼238可以指定將發(fā)生從文本交換 模態(tài)到語音模態(tài)的模態(tài)切換??梢蕴峁┯糜谡Z音裝置202的電話號(hào)
碼。也可以從先前存儲(chǔ)的配置文件或?qū)υ挄?huì)話存儲(chǔ)中查找該電話號(hào)
碼。 一旦Chatbot服務(wù)器206找到號(hào)碼204,它就可以呼叫語音客戶 機(jī)202,從而建立242語音信道。接著,與客戶機(jī)204通信的原始信 道可以選擇性地關(guān)閉243。也即,允許同時(shí)存在的來自每個(gè)客戶機(jī) 202-204的文本和語音輸入/輸出用于共同通信會(huì)話。
可以將語音輸入244從語音客戶機(jī)202傳送到Chatbot服務(wù)器 206, Chatbot服務(wù)器206將語音輸入245中繼到語音服務(wù)器208。語 音服務(wù)器208可以話音識(shí)別該輸入245并且提供識(shí)別結(jié)果248給 Chatbot服務(wù)器206。執(zhí)行話音使能應(yīng)用可以將應(yīng)用邏輯應(yīng)用250到 結(jié)果,生成被傳送到語音服務(wù)器208的標(biāo)記252。語音輸出254可以 從標(biāo)記252中生成,標(biāo)記252被作為語音輸出255通過Chatbot服務(wù) 器206傳送到語音客戶機(jī)202。
最后,客戶機(jī)202可以發(fā)送結(jié)束會(huì)話請(qǐng)求260到Chatbot服務(wù)器 206, Chatbot服務(wù)器關(guān)閉到語音服務(wù)器208的信道262以及信道264。
境提供無縫模態(tài)切換能力的系統(tǒng)的示意圖。
為了舉例說明,可以使用原始模態(tài)在客戶機(jī)302和應(yīng)用342之 間建立通信會(huì)話。所述原始模態(tài)可以是語音模態(tài),該語音模態(tài)使用 語音接口 319通過信道371連接到Chatbot服務(wù)器320,其通過信道 372連接到語音服務(wù)器330,其依次連接到應(yīng)用服務(wù)器340。原始模 態(tài)也可以是文本交換模態(tài),該文本交換模態(tài)使用文本交換接口 318 通過信道370連接到Chatbot服務(wù)器320,其最后連接到應(yīng)用服務(wù)器 340。
有時(shí)在通信會(huì)話期間可以發(fā)生模態(tài)切換事件。該事件促使接口 318和319中的一個(gè)或多個(gè)的激活狀態(tài)發(fā)生改變。例如,從文本到語 音的模態(tài)切換可以包括動(dòng)態(tài)地開放語音信道371和關(guān)閉文本交換信 道370。從語音到文本的模態(tài)切換可以包括動(dòng)態(tài)地開放文本交換信道 370和關(guān)閉信道371。任何一種方式,信道372都保持開放且不變, 并且模態(tài)變化可以按對(duì)于應(yīng)用服務(wù)器340或執(zhí)行IVR應(yīng)用342完全
透明的方式發(fā)生。
在一種安排中,模態(tài)切換可以是客戶302經(jīng)由激活的接口 318 或319發(fā)起的。用戶可以輸入特殊切換代碼或命令,例如"切換語 音"或"切換文本"。Chatbot服務(wù)器320的切換引擎323可以解釋 該代碼并且執(zhí)行適當(dāng)切換動(dòng)作。模態(tài)切換可以要求被傳送到Chatbot 服務(wù)器320的電話號(hào)碼或其他標(biāo)識(shí)符。例如,當(dāng)從接口318切換到 接口 319時(shí),可以提供與接口 319相關(guān)聯(lián)的電話號(hào)碼(例如,切換 語音"555-2222")。可選地,客戶302或者當(dāng)前對(duì)話會(huì)話的配置信 息可以保存在數(shù)據(jù)存儲(chǔ)328中。該配置信息可以包括相關(guān)的聯(lián)系號(hào) 碼,例如用于連接到語音裝置314的電話號(hào)碼。
在另一種安排中,模態(tài)切換可以由服務(wù)器340發(fā)起。例如IVR 應(yīng)用可以發(fā)起與人工代理談話的轉(zhuǎn)移請(qǐng)求,例如如下
<form id=,,formr,〉 <transfer name=,,xfer"
dest=,,sip:nextagent@9.22.92.23,, bridge=,,false,, connccttimcout=,,5s,, maxtime=,,60s" aai=,,appdata,7〉 </form〉
該轉(zhuǎn)移請(qǐng)求可以停止執(zhí)行應(yīng)用342并且可以用信號(hào)通知Chatbot服務(wù) 器320將啟動(dòng)的動(dòng)作。Chatbot服務(wù)器320可以將當(dāng)前使用的接口 318 或319和/或信道370或371與將啟動(dòng)的動(dòng)作進(jìn)行比較。當(dāng)需要不同 的接口時(shí),可以由Chatbot服務(wù)器320啟動(dòng)模態(tài)切換動(dòng)作。
例如,文本交換接口 318可以是活躍的并且可以通過語音信道 啟動(dòng)到實(shí)時(shí)代理的轉(zhuǎn)移。Chatbot服務(wù)器320可以傳送顯示在接口 318 中的到客戶302的超級(jí)鏈接。點(diǎn)擊該超級(jí)鏈接可以表示同意Chatbot 服務(wù)器320初始化語音會(huì)話。Chatbot服務(wù)器320可以查找之前存儲(chǔ) 的用戶偏好以確定呼叫哪個(gè)號(hào)碼來建立語音信道371。當(dāng)沒有可用于
Chatbot服務(wù)器320的這種號(hào)碼時(shí),也可以提示用戶輸入電話號(hào)碼。 一旦Chatbot服務(wù)器320建立了語音信道371,信道370可以關(guān)閉, 并且Chatbot服務(wù)器320可以通過合并信道371和信道372而脫離。 應(yīng)用服務(wù)器340可以接著執(zhí)行轉(zhuǎn)移。
如所示,圖3的系統(tǒng)包括網(wǎng)絡(luò)360,網(wǎng)絡(luò)360可通信地鏈接通信 裝置310、Chatbot服務(wù)器320、應(yīng)用服務(wù)器340以及企業(yè)服務(wù)器350。 網(wǎng)絡(luò)360可以包括任何類型的組件,有線的和/或無線的,其共同允 許將包含在載波中的數(shù)字編碼信息從任意可通信鏈接的組件傳送到 任意其他可通信鏈接的部分。
通信裝置310可以是將客戶302鏈接到網(wǎng)絡(luò)360的任何通信裝 置。裝置310可以包括,例如移動(dòng)電話、有線電話、計(jì)算機(jī)、筆記 本、平板電腦、個(gè)人數(shù)字助理(PDA)、可戴式計(jì)算裝置、娛樂系 統(tǒng)、互動(dòng)媒體裝置等等。裝置310的特定類別包括文本交換裝置312、 語音通信裝置314以及多模裝置316。
文本交換裝置312可以是能夠?qū)崟r(shí)進(jìn)行交互式文本交換的計(jì)算 裝置。這些文本交換包括在線聊天、即時(shí)消息傳遞和文本消息傳遞。 通信裝置314可以是任何能夠通過網(wǎng)絡(luò)360進(jìn)行實(shí)時(shí)語音通信的裝 置。其包括基于VoIP的通信、傳統(tǒng)的電路交換通信、雙向無線通信 等等。多模裝置316是能夠參加文本交換和語音通信的裝置。 一些 多模裝置316每次限制在一種通信模式,而其他的多模裝置能夠同 時(shí)通過多種模式進(jìn)行通信。
Chatbot服務(wù)器320可以是VoiceXML服務(wù)器或等同的裝置,其 將來自裝置310的文本交換消息動(dòng)態(tài)地轉(zhuǎn)換為可由語音服務(wù)器330 使用的消息。允許語音服務(wù)器330接受文本的文本輸入API 344的 使用可以允許來自設(shè)備310的文本直接被語音服務(wù)器330使用。 Chatbot服務(wù)器320也可以將來自語音服務(wù)器330的輸出動(dòng)態(tài)地轉(zhuǎn)換 為可由話音應(yīng)用使用的輸出,并且接著使得其在接口 318中可以呈 現(xiàn)。
對(duì)于每個(gè)管理的通信會(huì)話,Chatbot服務(wù)器320可以實(shí)例化 Chatbot對(duì)象324。 Chatbot對(duì)象324可以包括SIP服務(wù)器端程序 (servlet)以及一個(gè)或多個(gè)解釋器,例如呼叫控制可擴(kuò)展標(biāo)記語言 (CCXML)解釋器、語音可擴(kuò)展標(biāo)記語言(VoiceXML)解釋器、 可擴(kuò)展超文本標(biāo)記語言(XML)加語音配置文件(X+V)解釋器、 話音應(yīng)用語言標(biāo)簽(SALT)解釋器、媒體源控制協(xié)議(MCRP)解 釋器、為客戶定制的標(biāo)記解釋器等等。SIP服務(wù)器端程序可以將進(jìn)入 的SIP請(qǐng)求映射到適當(dāng)?shù)慕忉屍鳌?br>
由Chatbot對(duì)象324處理的通信會(huì)話可以涉及多個(gè)不同的通信信 道,例如信道370和信道372。信道370可以是建立在Chatbot服務(wù) 器320與裝置310之間的通信信道。信道372可以是建立在Chatbot 服務(wù)器320與語音服務(wù)器330之間的通信信道。可以理解,應(yīng)用服 務(wù)器340不知道客戶302與服務(wù)器320通信所使用的通信模態(tài)和信 道類型。特定的文本輸入API 344可以被用來允許語音服務(wù)器330 直接使用由Chatbot服務(wù)器320提供的原文輸入。
服務(wù)器320的轉(zhuǎn)換引擎322可以執(zhí)行任何需要的轉(zhuǎn)換以將來自 文本交換裝置312的輸出改變成可由語音服務(wù)器330使用的輸入。 通常,對(duì)于語音服務(wù)器330使用的文本不需要大量的轉(zhuǎn)換,其經(jīng)由 API 344提供對(duì)文本模式交互功能的訪問??梢岳斫?,文本模式交互 功能通常由開發(fā)者在測(cè)試和開發(fā)階段使用,但是此處在運(yùn)行時(shí)間正 被用來允許語音服務(wù)器330直接處理文本。例如,互聯(lián)網(wǎng)工程任務(wù) 組(IETF)標(biāo)準(zhǔn)媒體源控制協(xié)議版本2 (MRCPv2)包含用于話音識(shí) 別器資源的文本模式解釋功能,稱為INTERPRET,該功能允許語音 服務(wù)器330直接處理文本
應(yīng)用服務(wù)器340通常會(huì)生成諸如VoiceXML輸出的語音標(biāo)記輸 出,語音服務(wù)器330將該輸出轉(zhuǎn)換為音頻輸出。轉(zhuǎn)換引擎322可以 從該語在^
曰
370傳送到通信裝置310。
應(yīng)用服務(wù)器340可以是采用標(biāo)準(zhǔn)化的運(yùn)行時(shí)間平臺(tái)的模塊化組 件的應(yīng)用服務(wù)器。應(yīng)用服務(wù)器340可以代表多級(jí)環(huán)境中的中間設(shè)備 服務(wù)器。該運(yùn)行時(shí)間平臺(tái)可以為開發(fā)分布式、多級(jí)、基于Web的應(yīng) 用提供功能性。該運(yùn)行時(shí)間平臺(tái)還可以包括服務(wù)、應(yīng)用編程接口和 協(xié)議的標(biāo)準(zhǔn)集。也即,該運(yùn)行時(shí)間平臺(tái)可以允許開發(fā)者創(chuàng)建在多個(gè) 平臺(tái)之間可擴(kuò)展和可移動(dòng)的企業(yè)應(yīng)用。該運(yùn)行時(shí)間平臺(tái)可以包括描 述了所需的應(yīng)用程序接口 ( API)和兼容策略的相關(guān)技術(shù)規(guī)范的集合。
在一個(gè)實(shí)施例中,該運(yùn)行平臺(tái)可以是JAVA2平臺(tái)企業(yè)版本 (J2EE)軟件平臺(tái)。因此,應(yīng)用服務(wù)器340可以是J2EE兼容應(yīng)用服 務(wù)器,例如來自紐約州Armonk的國(guó)際商業(yè)機(jī)器公司的WEBSPHERE 應(yīng)用服務(wù)器、來自加利福尼亞州圣何塞的BEA系統(tǒng)公司的BEA WEBLOGIC應(yīng)用服務(wù)器、來自喬治亞州亞特蘭大的JBoss公司的 JBOSS應(yīng)用服務(wù)器、來自O(shè)bject Web聯(lián)盟的JOnAS應(yīng)用服務(wù)器等等。 該運(yùn)行時(shí)間平臺(tái)不是要被解釋為限制在這點(diǎn)上,這里也可以設(shè)想諸 如.NET軟件平臺(tái)的其他軟件平臺(tái)。
IVR應(yīng)用342可以是允許主叫方互動(dòng)和從企業(yè)服務(wù)器350的數(shù)據(jù) 庫(kù)接收信息的應(yīng)用。到VoiceXML服務(wù)器320 (已經(jīng)為Chatbot 320 進(jìn)行了擴(kuò)展)的訪問可以接受使用按鍵音信號(hào)的用戶輸入、語音輸 入和文本輸入。IVR應(yīng)用342可以以單個(gè)VoiceXML應(yīng)用的形式向 用戶提供信息,該單個(gè)VoiceXML應(yīng)用可以被包括DTMF、語音和 聊天的任何模態(tài)所使用。語音標(biāo)記也可以直接被傳送到轉(zhuǎn)換引擎 322,在轉(zhuǎn)換引擎322處語音標(biāo)記被轉(zhuǎn)換為接口 318中可呈現(xiàn)的文本。
IVR應(yīng)用342可以呈現(xiàn)一系列的提示給用戶,并且可以根據(jù)之前 建立的對(duì)話菜單接收和處理提示響應(yīng)。可以由位于遠(yuǎn)程的語音服務(wù) 器330提供話音處理操作,例如文本到話音操作、話音到文本操作、 主叫方識(shí)別操作以及語音授權(quán)操作。沒有Chatbot服務(wù)器320的介入, IVR應(yīng)用342將不能與文本交換裝置312進(jìn)行交互,這是因?yàn)镮VR 應(yīng)用缺少用于處理文本交換輸入/輸出的本地編碼。
本發(fā)明可以凈皮實(shí)現(xiàn)在硬件、軟件或硬件與軟件的組合中。本發(fā) 明可以在一個(gè)計(jì)算^l系統(tǒng)中以集中的方式^皮實(shí)現(xiàn),或者以分布的方 式實(shí)現(xiàn),在分布方式中不同的元件分布在多個(gè)互聯(lián)的計(jì)算機(jī)系統(tǒng)中。適合于執(zhí)行此處所述方法的任何類型的計(jì)算機(jī)系統(tǒng)或其他設(shè)備都是 適用的。硬件和軟件的典型組合可以是具有計(jì)算機(jī)程序的通用計(jì)算 機(jī)系統(tǒng),當(dāng)加載并執(zhí)行該計(jì)算機(jī)程序時(shí),其控制該計(jì)算機(jī)系統(tǒng)使得 其執(zhí)行此處所述的方法。
本發(fā)明也可以被包含在計(jì)算機(jī)程序產(chǎn)品中,該計(jì)算機(jī)程序產(chǎn)品 包括能夠?qū)崿F(xiàn)此處所述方法的所有特征,并且當(dāng)加載入計(jì)算機(jī)系統(tǒng) 時(shí),其能夠執(zhí)行這些方法。在本上下文中的計(jì)算機(jī)程序是指以任意 語言、代碼或符號(hào)表示的一套指令的表達(dá),這些指令旨在促使具有 信息處理能力的系統(tǒng)直接執(zhí)行特定功能或者在下述之一 或二者之后
執(zhí)行特定功能a)轉(zhuǎn)換到另一種語言、代碼或符號(hào);b)以不同的 素材形式重新生成。
權(quán)利要求
1.一種用于在涉及語音服務(wù)器的對(duì)話會(huì)話中動(dòng)態(tài)切換模態(tài)的方法,包括在用戶和話音應(yīng)用之間建立對(duì)話會(huì)話,其中在所述對(duì)話會(huì)話期間,所述用戶使用原始模態(tài)進(jìn)行交互;檢測(cè)模態(tài)切換觸發(fā)器;以及將所述原始模態(tài)改變?yōu)椴煌谒鲈寄B(tài)的第二模態(tài),其中到所述第二模態(tài)的模態(tài)轉(zhuǎn)變對(duì)于由所述話音應(yīng)用所使用的語音服務(wù)器是透明的并且對(duì)于所述話音應(yīng)用是透明的,其中所述原始模態(tài)和所述第二模態(tài)選自包括話音模態(tài)、文本交換模態(tài)以及包括話音模態(tài)和文本交換模態(tài)的多模模態(tài)的模態(tài)組,并且其中所述原始模態(tài)和所述第二模態(tài)之一是所述文本交換模態(tài)。
2. 根據(jù)權(quán)利要求1所述的方法,其中所述文本交換模態(tài)包括在 線聊天模態(tài)、即時(shí)消息傳遞模態(tài)以及文本消息傳遞模態(tài)中的至少之
3. 根據(jù)權(quán)利要求1所述的方法,其中文本交換客戶機(jī)是現(xiàn)成的 未改裝的客戶機(jī),以及其中所述話音應(yīng)用是缺少固有文本交換能力 的基于VoiceXML的應(yīng)用。
4. 根據(jù)權(quán)利要求1所述的方法,其中在所述對(duì)話會(huì)話期間的通 信涉及Chatbot服務(wù)器、文本交換客戶機(jī)和語音客戶機(jī)。
5. 根據(jù)權(quán)利要求4所述的方法,其中在所述對(duì)話會(huì)話期間,所 述文本交換客戶機(jī)在第一通信信道上與所述Chatbot服務(wù)器交換文 本交換消息,所述語音服務(wù)器在第二通信信道上與所述Chatbot服務(wù) 器交換消息,以及所述語音客戶機(jī)在第三通信信道上與所述Chatbot 服務(wù)器交換基于語音的消息,其中所述改變步驟改變所述第一通信 信道和所述第三通信信道至少之一 的激活狀態(tài)。
6. 根據(jù)權(quán)利要求5所述的方法,其中在所述對(duì)話會(huì)話期間,所 述第一通信信道和所述第三通信信道中只有一個(gè)是同時(shí)激活的。
7. 根據(jù)權(quán)利要求1所述的方法,其中所迷用戶輸入在原始模態(tài) 中寫入的消息中所提供的切換代碼,其中所述切換代碼使得所述模 態(tài)切換觸發(fā)器激發(fā)。
8. —種用于在涉及語音服務(wù)器的對(duì)話會(huì)話中動(dòng)態(tài)切換模態(tài)的方 法,包括識(shí)別文本交換客戶機(jī)與話音應(yīng)用之間的自動(dòng)對(duì)話會(huì)話,其中在所 述對(duì)話會(huì)話期間的通信涉及Chatbot服務(wù)器和語音服務(wù)器,其中在所 述對(duì)話會(huì)話期間,所述文本交換客戶機(jī)在第一通信信道上與所述 Chatbot服務(wù)器交換文本交換消息,所述語音服務(wù)器在第二通信信道 上與所迷Chatbot服務(wù)器交換消息,其中所述語音服務(wù)器使用允許語 音服務(wù)器直接使用文本輸入的文本接口 ,其中所述Chatbot服務(wù)器將 由語音服務(wù)器生成的語音標(biāo)記動(dòng)態(tài)地轉(zhuǎn)換為被提供到所述文本交換 客戶才幾的文本;所述Chatbot服務(wù)器檢測(cè)模態(tài)切換觸發(fā)器;以及 在所述Chatbot服務(wù)器與語音裝置之間自動(dòng)地建立第三通信信 道,其中用于所述自動(dòng)對(duì)話會(huì)話的雙向語音消息此后在所述語音裝 置與所迷話音應(yīng)用之間傳送。
9. 根據(jù)權(quán)利要求8所述的方法,其中所述話音應(yīng)用保持不知道 用戶輸入的消息是來源于所述第一通信信道還是所述第二通信信 道,并且保持不知道自動(dòng)生成的輸出是被傳送到所述文本交換客戶 機(jī)還是被傳送到所述語音裝置。
10. 根據(jù)權(quán)利要求8所述的方法,其中所述文本交換客戶機(jī)是現(xiàn) 成的未改裝的客戶機(jī),并且其中所述話音應(yīng)用是缺少固有文本交換 能力的未改裝的話音使能應(yīng)用。
11. 根據(jù)權(quán)利要求8所述的方法,還包括響應(yīng)于檢測(cè)所述模態(tài)切換觸發(fā)器,自動(dòng)地關(guān)閉所述第 一通信信道。
12. 根據(jù)權(quán)利要求8所述的方法,其中所述模態(tài)切換觸發(fā)器是與 所述語音裝置的電話號(hào)碼相關(guān)聯(lián)的,所述方法還包括所述Chatbot服務(wù)器自動(dòng)呼叫所述電話號(hào)碼以建立所述第三通信 信道。
13. 根據(jù)權(quán)利要求12所述的方法,其中所述電話號(hào)碼包含在通 過所述文本交換客戶機(jī)輸入的文本交換消息內(nèi)被傳送到所述Chatbot 服務(wù)器。
14. 根據(jù)權(quán)利要求12所述的方法,其中在由所述Chatbot服務(wù) 器維護(hù)的數(shù)據(jù)存儲(chǔ)中自動(dòng)查找所述電話號(hào)碼,其中在所述數(shù)據(jù)存儲(chǔ) 內(nèi),所述電話號(hào)碼涉及所述文本交換客戶^/L的用戶、與所述文本交換客戶機(jī)相關(guān)聯(lián)的唯 一 標(biāo)識(shí)符、與所述文本交換客戶機(jī)所駐留的計(jì) 算設(shè)備相關(guān)聯(lián)的唯一標(biāo)識(shí)符以及與所述對(duì)話會(huì)話相關(guān)聯(lián)的唯一標(biāo)識(shí) 符中的至少一個(gè)。
15. 根據(jù)權(quán)利要求8所述的方法,其中所述話音應(yīng)用的編程式動(dòng) 作啟動(dòng)所述模態(tài)切換觸發(fā)器。
16. 根據(jù)權(quán)利要求8所述的方法,還包括同時(shí)維持所述第一通信信道、所述第二通信信道和所述第三通信信道,其中來自所述第 一通信信道的文本交換輸入和來自所述第三 通信信道的語音消息輸入在所述第二通信信道上被傳送到所述語音服務(wù)器。
17. 根據(jù)權(quán)利要求16所述的方法,其中所述第一通信信道和所 述第三通信信道是相同的信道,在該信道上多模信息被傳送到包括文本模態(tài)和話音模態(tài)的多模裝置。
18. 根據(jù)權(quán)利要求16所述的方法,其中所述第一通信信道和所 述第三通信信道是不同的信道,并且其中所述文本交換客戶機(jī)相比 于所述語音裝置與不同的通信信道相關(guān)聯(lián)。
19. 一種用于提供文本交換服務(wù)的系統(tǒng),包括 文本交換客戶機(jī),配置用于在文本交換信道上發(fā)送和接收實(shí)時(shí)文本交換;語音客戶機(jī),配置用于在語音信道上發(fā)送和接收話音; 話音應(yīng)用環(huán)境,配置用于執(zhí)行允許用戶在語音信道上進(jìn)行實(shí)時(shí)交互的自動(dòng)話音應(yīng)答應(yīng)用;Chatbot服務(wù)器,配置用于建立涉及所述文本交換客戶機(jī)和所述 自動(dòng)話音應(yīng)答應(yīng)用的通信會(huì)話,其中所述Chatbot服務(wù)器能夠在所述 通信會(huì)話期間,以對(duì)于所述文本交換客戶機(jī)和所述自動(dòng)話音應(yīng)答應(yīng) 用透明的方式,動(dòng)態(tài)地轉(zhuǎn)換所述文本交換客戶機(jī)和所述話音應(yīng)答應(yīng) 用之間的消息;以及模態(tài)切換引擎,配置用于動(dòng)態(tài)地切換用戶與所述自動(dòng)話音應(yīng)答應(yīng) 用進(jìn)行交互通過的模態(tài),其中動(dòng)態(tài)模態(tài)切換器切換所述文本交換客 戶機(jī)和所述語音客戶機(jī)中至少 一 個(gè)的激活狀態(tài)。
20.根據(jù)權(quán)利要求19所述的系統(tǒng),其中文本交換接口是現(xiàn)成的 未改裝的接口 ,其中所述語音客戶機(jī)是現(xiàn)成的軟件應(yīng)用和電話裝置 中的至少之一,并且其中所述自動(dòng)話音應(yīng)答應(yīng)用是缺少固有文本交 換能力的基于VoiceXML的應(yīng)用。
全文摘要
本解決方案包括一種用于在涉及語音服務(wù)器的對(duì)話會(huì)話中動(dòng)態(tài)切換模態(tài)的方法和系統(tǒng)。在該方法中,可以在用戶和話音應(yīng)用之間建立對(duì)話會(huì)話。在對(duì)話會(huì)話期間,該用戶可以使用原始模態(tài)進(jìn)行交互,該原始模態(tài)是話音模態(tài)、文本交換模態(tài)或包括文本交換模態(tài)的多模模態(tài)。話音應(yīng)用可以使用話音模態(tài)進(jìn)行交互??梢詸z測(cè)將原始模態(tài)改變?yōu)椴煌B(tài)的模態(tài)切換觸發(fā)器。到第二模態(tài)的模態(tài)轉(zhuǎn)變對(duì)于話音應(yīng)用可以是透明的。話音應(yīng)用可以是缺少固有文本交換能力的標(biāo)準(zhǔn)的基于VoiceXML的話音應(yīng)用。
文檔編號(hào)H04M3/50GK101207656SQ20071019273
公開日2008年6月25日 申請(qǐng)日期2007年11月16日 優(yōu)先權(quán)日2006年12月19日
發(fā)明者B·D·曼戴利亞, V·S·穆爾, W·L·努斯比克爾, W·V·達(dá)帕爾瑪 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司