欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

會(huì)話控制器的制作方法

文檔序號(hào):6561967閱讀:126來源:國知局
專利名稱:會(huì)話控制器的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種對(duì)使用者的說話輸出回答或答復(fù)的會(huì)話控制器。
背景技術(shù)
開發(fā)了對(duì)使用者的說話輸出回答或答復(fù)的傳統(tǒng)會(huì)話控制器來應(yīng)用到各種情形。
期望會(huì)話控制器對(duì)一個(gè)人的問題提出建議。例如,在這個(gè)人和孩子呆在家里時(shí)出現(xiàn)問題(例如,疾病或受傷)的情況下,如果在這個(gè)人旁邊有一個(gè)顧問,則這個(gè)人會(huì)感覺安定。尤其是,如果該顧問具有關(guān)于醫(yī)藥和心理學(xué)的專業(yè)知識(shí),這會(huì)增加這個(gè)人的安定感。
我們可以假設(shè)使用會(huì)話控制器作為能夠?qū)σ粋€(gè)人的問題提出建議的技術(shù)。但是,因?yàn)闀?huì)話控制器具有這樣的一個(gè)特性回答或答復(fù)的輸出完全取決于人的說話,會(huì)話控制器給人提出建議是困難的。例如,在由于這個(gè)人不知所措而其說話內(nèi)容不緊密結(jié)合的情況下,這個(gè)人的說話內(nèi)容由于沒有主題等而變得不清楚。由此,傳統(tǒng)的會(huì)話控制器不能明白使用者說話的內(nèi)容從而不能輸出適合于他/她的問題的回答或答復(fù)。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種會(huì)話控制器,即使使用者說話內(nèi)容不清楚或缺少連貫性也能對(duì)使用者輸出適合于想要的主題的答復(fù)句子。
為了達(dá)到所述目的,本發(fā)明提供一種會(huì)話控制器,用于根據(jù)使用者說話輸出答復(fù)句子,包括計(jì)劃存儲(chǔ)器單元,用于存儲(chǔ)多個(gè)計(jì)劃,其中每個(gè)計(jì)劃具有一答復(fù)句子和一條或多條下一候選指定信息,其中所述一條或多條下一候選指定信息用于指定將要在答復(fù)句子后輸出的下一候選答復(fù)句子;以及計(jì)劃會(huì)話單元,用于根據(jù)第一使用者說話選擇存儲(chǔ)在所述計(jì)劃存儲(chǔ)器單元中的一個(gè)計(jì)劃,并輸出所選擇的計(jì)劃具有的答復(fù)句子,并且根據(jù)第二使用者說話選擇所述計(jì)劃具有的一條下一候選指定信息,且基于所選擇的那條下一候選指定信息輸出下一候選答復(fù)句子;其中,一些計(jì)劃具有一個(gè)解釋性句子所分割成的多個(gè)答復(fù)句子。
例如,假設(shè)將一個(gè)解釋性句子分成四個(gè)答復(fù)句子A、B、C、D,并且將分別具有所述四個(gè)答復(fù)句子A、B、C、D的四個(gè)計(jì)劃P1、P2、P3、P4存儲(chǔ)在所述計(jì)劃存儲(chǔ)器單元。進(jìn)一步假定計(jì)劃P1具有答復(fù)句子A以及用于指定計(jì)劃P2的下一候選指定信息,計(jì)劃P2具有答復(fù)句子B以及用于指定計(jì)劃P3的下一候選指定信息,計(jì)劃P3具有答復(fù)句子C以及用于指定計(jì)劃P4的下一候選指定信息,且計(jì)劃P4具有答復(fù)句子D以及用于指定所述那個(gè)解釋性句子的結(jié)束的下一候選指定信息。在這種情形下,所述計(jì)劃會(huì)話單元根據(jù)使用者說話以及各下一候選指定信息以這個(gè)順序輸出答復(fù)句子A、B、C、D。結(jié)果,會(huì)話控制器可以提供所述那個(gè)解釋性句子給使用者。
根據(jù)本發(fā)明,所述會(huì)話控制器可以根據(jù)使用者說話輸出劃分成多個(gè)答復(fù)句子的一個(gè)解釋性句子,從而以預(yù)定的順序輸出所述答復(fù)句子。
在本發(fā)明的優(yōu)選實(shí)施例中,所述計(jì)劃會(huì)話單元在接收與所述下一候選答復(fù)句子無關(guān)的所述第二使用者說話或不清楚所述第二使用者說話與所述下一候選答復(fù)句子之間是否存在關(guān)系時(shí),保留所述下一候選答復(fù)句子的輸出,然后在接收與所保留的下一候選答復(fù)句子相關(guān)的第三使用者說話時(shí)輸出所保留的下一候選答復(fù)句子。
根據(jù)上述實(shí)施例,當(dāng)使用者的興趣轉(zhuǎn)移到不同于相關(guān)聯(lián)的解釋性句子的其他的主題句子時(shí),所述會(huì)話控制器可以保留所述相關(guān)聯(lián)的解釋性句子的輸出。相反,當(dāng)使用者的興趣回到所述相關(guān)聯(lián)的解釋性句子時(shí),所述會(huì)話控制器可以從所述相關(guān)聯(lián)的解釋性句子的保留部分恢復(fù)所述相關(guān)聯(lián)的解釋性句子的輸出。
在本發(fā)明的優(yōu)選實(shí)施例中,所述會(huì)話控制器還包括對(duì)話空間會(huì)話單元,其用于根據(jù)第二使用者說話輸出關(guān)于與所保留的下一候選答復(fù)句子不相關(guān)的主題的答復(fù)句子。
根據(jù)所述實(shí)施例,當(dāng)使用者想要談?wù)摬煌谙嚓P(guān)聯(lián)的解釋性句子的主題的另一主題時(shí),所述會(huì)話控制器可以保留所述相關(guān)聯(lián)的解釋性句子的輸出,并且根據(jù)關(guān)于另外的主題的使用者說話對(duì)使用者作出響應(yīng)。然后,當(dāng)使用者的興趣返回到所述相關(guān)聯(lián)的解釋性句子時(shí),所述會(huì)話控制器可以從所述相關(guān)聯(lián)的解釋性句子的保留部分恢復(fù)所述相關(guān)聯(lián)的解釋性句子的輸出。因此,所述會(huì)話控制器可以從所述相關(guān)聯(lián)的解釋性句子的開始至末尾執(zhí)行所述相關(guān)聯(lián)的解釋性句子的輸出,同時(shí),在輸出所述相關(guān)聯(lián)的解釋性句子期間根據(jù)使用者說話插入關(guān)于另一主題的會(huì)話,所述另一主題不同于所述相關(guān)聯(lián)的解釋性句子的主題。
在本發(fā)明的優(yōu)選實(shí)施例中,所述會(huì)話控制器還包括會(huì)話繼續(xù)單元,其用于在沒有輸出所述關(guān)于與所保留的下一候選答復(fù)句子不相關(guān)的主題的答復(fù)句子時(shí),根據(jù)所述第二使用者說話輸出一答復(fù)句子以繼續(xù)使用者與會(huì)話控制器之間的會(huì)話。
根據(jù)所述實(shí)施例,當(dāng)所述計(jì)劃會(huì)話單元或?qū)υ捒臻g會(huì)話單元不能輸出答復(fù)句子時(shí),所述會(huì)話繼續(xù)單元輸出一答復(fù)句子以繼續(xù)使用者與會(huì)話控制器之間的會(huì)話。因此,所述會(huì)話控制器在使用者說話的內(nèi)容不清楚時(shí)可以保留所述相關(guān)聯(lián)的解釋性句子的輸出,并在使用者的興趣返回到所述相關(guān)聯(lián)的解釋性句子時(shí),從所述相關(guān)聯(lián)的解釋性句子的保留部分恢復(fù)所述相關(guān)聯(lián)的解釋性句子的輸出。


圖1是根據(jù)本發(fā)明的范例實(shí)施例的會(huì)話控制器的框圖;圖2是根據(jù)本發(fā)明的范例實(shí)施例的語音識(shí)別單元的框圖;圖3是根據(jù)本發(fā)明的范例實(shí)施例的單詞假定提煉部分的處理時(shí)序圖;圖4是根據(jù)本發(fā)明的范例實(shí)施例的語音識(shí)別單元的操作的流程圖;圖5是根據(jù)本發(fā)明的范例實(shí)施例的會(huì)話控制器的部分放大框圖;圖6是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的字符串與從該字符串中所提取的詞素之間的關(guān)系的圖;圖7是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的說話的句子類型、代表說話的句子類型的字母表中的兩個(gè)以上的字母、以及說話的句子的例子的圖。
圖8是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的存儲(chǔ)在說話類型數(shù)據(jù)庫中的字典的細(xì)節(jié)的圖;圖9是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的在會(huì)話數(shù)據(jù)庫中建立的層次結(jié)構(gòu)的細(xì)節(jié)的圖;圖10是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的在會(huì)話數(shù)據(jù)庫中建立的層次結(jié)構(gòu)中的主題辨別信息的提煉的圖;圖11是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的形成在會(huì)話數(shù)據(jù)庫中的主題標(biāo)題的內(nèi)容的圖;圖12是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的與形成在會(huì)話數(shù)據(jù)庫中的主題標(biāo)題相關(guān)聯(lián)的答復(fù)句子的類型的圖;圖13是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的與主題辨別信息相關(guān)聯(lián)的主題標(biāo)題、答復(fù)句子和下一計(jì)劃指派信息的內(nèi)容的圖;圖14是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的計(jì)劃空間的圖;圖15是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的計(jì)劃轉(zhuǎn)換的一個(gè)例子的圖;圖16是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的計(jì)劃轉(zhuǎn)換的另一個(gè)例子的圖;圖17是圖示說明根據(jù)本發(fā)明的范例實(shí)施例的計(jì)劃會(huì)話控制處理的細(xì)節(jié)的圖;圖18是根據(jù)本發(fā)明的范例實(shí)施例的會(huì)話控制單元中的主處理的流程圖;圖19是根據(jù)本發(fā)明的范例實(shí)施例的計(jì)劃會(huì)話控制處理的一部分的流程圖;圖20是根據(jù)本發(fā)明的范例實(shí)施例的計(jì)劃會(huì)話控制處理的其余部分的流程圖;圖21是根據(jù)本發(fā)明的范例實(shí)施例的基本控制狀態(tài)的轉(zhuǎn)換圖;圖22是根據(jù)本發(fā)明的范例實(shí)施例的對(duì)話空間會(huì)話控制處理的流程圖。
具體實(shí)施例方式
下面將參照?qǐng)D1-22描述本發(fā)明的范例實(shí)施例。在所述范例實(shí)施例中,本發(fā)明提出的會(huì)話控制器用于輸出對(duì)使用者說話的回答以及和使用者建立會(huì)話。
(1.會(huì)話控制器的結(jié)構(gòu))(1-1.總結(jié)構(gòu))會(huì)話控制器1中包括諸如計(jì)算機(jī)或工作站的信息處理器,或?qū)?yīng)于信息處理器的硬件。信息處理器具有中央處理單元(CPU)、主存儲(chǔ)器(隨機(jī)訪問存儲(chǔ)器RAM)、只讀存儲(chǔ)器(ROM)、輸入輸出設(shè)備(I/O設(shè)備)、以及外部存儲(chǔ)設(shè)備,例如硬盤。在ROM或外部存儲(chǔ)設(shè)備中存儲(chǔ)有用于使信息處理器作為會(huì)話控制器1工作的程序,以及用于使信息處理器執(zhí)行會(huì)話控制方法的程序。所述CPU讀取在主存儲(chǔ)器上的程序并執(zhí)行程序,從而實(shí)現(xiàn)會(huì)話控制器1或會(huì)話控制方法。注意到,所述程序可以存儲(chǔ)在計(jì)算機(jī)可讀程序記錄介質(zhì)或外部設(shè)備中,所述計(jì)算機(jī)可讀程序記錄介質(zhì)為例如磁盤、光盤、磁光盤、高密度光盤(CD)或數(shù)字視頻光盤(DVD),所述外部設(shè)備為例如應(yīng)用服務(wù)提供商(ASP)的服務(wù)器。在這種情況下,所述CPU從計(jì)算機(jī)可讀程序記錄介質(zhì)或外部設(shè)備讀取程序到主存儲(chǔ)器上并執(zhí)行所述程序。
如圖1所示,會(huì)話控制器1包括輸入單元100、語音識(shí)別單元200、會(huì)話控制單元300、句子分析單元400、會(huì)話數(shù)據(jù)庫500、輸出單元600、和語音識(shí)別字典存儲(chǔ)器700。
(1-1-1.輸入單元)輸入單元100接收由使用者提供的輸入信息(使用者說話)。輸入單元100將所接收的說話對(duì)應(yīng)的語音作為語音信號(hào)輸出給語音識(shí)別單元200。注意到,輸入單元100可以是用于輸入字符信息的鍵盤或觸摸板。在這種情況下,省略語音識(shí)別單元200。
(1-1-2.語音識(shí)別單元)語音識(shí)別單元200,根據(jù)說話的內(nèi)容,識(shí)別與在輸入單元100所接收到的說話的內(nèi)容對(duì)應(yīng)的字符串。具體地,語音識(shí)別單元200在從輸入單元100接收到語音信號(hào)時(shí),基于所述的語音信號(hào)將所接收到的語音信號(hào)與會(huì)話數(shù)據(jù)庫500及存儲(chǔ)于語音識(shí)別字典存儲(chǔ)器700中的字典相比較。然后,語音識(shí)別單元200將基于所述語音信號(hào)所估計(jì)的語音識(shí)別結(jié)果輸出到會(huì)話控制單元300。語音識(shí)別單元200向會(huì)話控制單元300請(qǐng)求獲取會(huì)話數(shù)據(jù)庫500的存儲(chǔ)器內(nèi)容,然后接收會(huì)話控制單元300根據(jù)語音識(shí)別單元200的請(qǐng)求而檢索到的會(huì)話數(shù)據(jù)庫500的存儲(chǔ)器內(nèi)容。注意到,語音識(shí)別單元200可以直接檢索會(huì)話數(shù)據(jù)庫500的存儲(chǔ)器內(nèi)容。
(1-1-2-1.語音識(shí)別單元的結(jié)構(gòu))
如圖2所示,語音識(shí)別單元200包括特征提取部分200A、緩沖存儲(chǔ)器(BM)200B、單詞檢索部分200C、緩沖存儲(chǔ)器(BM)200D、候選確定部分200E、和單詞假定提煉部分200F。單詞檢索部分200C和單詞假定提煉部分200F連接到語音識(shí)別字典存儲(chǔ)器700。候選確定部分200E經(jīng)會(huì)話控制單元300連接到會(huì)話數(shù)據(jù)庫500。
語音識(shí)別字典存儲(chǔ)器700中存儲(chǔ)音素隱馬爾可夫模型(phoneme hiddenmarkov model,音素HMM)。音素HMM具有各種狀態(tài),其中每種狀態(tài)包括下面的信息(a)狀態(tài)號(hào);(b)可接受的上下文類;(c)前面狀態(tài)和后續(xù)狀態(tài)的列表;(d)輸出概率分布密度的參數(shù);以及(e)自轉(zhuǎn)換概率和到后續(xù)狀態(tài)的轉(zhuǎn)換概率。在所述范例實(shí)施例中,音素HMM是通過轉(zhuǎn)變規(guī)定的說話者混合HMM而產(chǎn)生的,以識(shí)別相應(yīng)分布是由哪些說話者得到的。輸出概率分布函數(shù)具有包括34維對(duì)角協(xié)方差矩陣的混合高斯分布。語音識(shí)別字典存儲(chǔ)器700中進(jìn)一步存儲(chǔ)單詞字典。每個(gè)字符串都存儲(chǔ)在單詞字典中,每個(gè)字符串都代表了怎樣逐個(gè)單詞的在音素HMM中讀取單詞。
說話者的語音在輸入到麥克之后輸入到特征提取部分200A,然后轉(zhuǎn)變成語音信號(hào)。特征提取部分200A在對(duì)輸入語音信號(hào)執(zhí)行A/D轉(zhuǎn)換后從語音信號(hào)中提取特征參數(shù),然后輸出特征參數(shù)到緩沖存儲(chǔ)器200B??梢蕴岢龈鞣N用于提取特征參數(shù)的方法。例如,特征提取部分200A執(zhí)行LPC分析以提取34維特征參數(shù),該34維特征參數(shù)包括對(duì)數(shù)冪、16維對(duì)數(shù)倒頻譜系數(shù)、Δ對(duì)數(shù)冪、以及16維Δ對(duì)數(shù)倒頻譜系數(shù)。成熟的提取的特征參數(shù)經(jīng)緩沖存儲(chǔ)器200B輸入到單詞檢索部分200C。
單詞檢索部分200C,基于從特征提取部分200A輸入的特征參數(shù)和存儲(chǔ)在語音識(shí)別字典存儲(chǔ)器700中的音素HMM和單詞字典,通過使用一次通過Viterbi解碼方法檢索單詞假定,然后計(jì)算相似性。單詞檢索部分200C每次逐個(gè)音素HMM狀態(tài)的計(jì)算單詞中的相似性和語音發(fā)起的相似性。更具體地,每個(gè)相關(guān)聯(lián)的單詞的標(biāo)識(shí)號(hào)、每次相關(guān)聯(lián)的單詞的語音發(fā)起時(shí)間、以及每個(gè)相關(guān)聯(lián)的單詞發(fā)出之前發(fā)出的之前的單詞,都計(jì)算相似性。單詞檢索部分200C可以排除所計(jì)算的相似性中具有最低相似性的單詞假定以減少計(jì)算機(jī)吞吐量。單詞檢索部分200C經(jīng)緩沖存儲(chǔ)器200D輸出檢索到的單詞假定、與檢索到的單詞假定相關(guān)聯(lián)的相似性、以及關(guān)于語音發(fā)起時(shí)間之后經(jīng)過的時(shí)間的信息(如,幀數(shù)量)到候選確定部分200E和單詞假定提煉部分200F。
候選確定部分200E參照會(huì)話控制單元300將檢索到的單詞假定和規(guī)定的對(duì)話空間中的主題辨別信息相比較,然后確定所檢索到的單詞假定中是否存在與主題辨別信息一致的一個(gè)單詞假定。如果存在這樣一個(gè)單詞假定,則候選確定部分200E將該單詞假定作為識(shí)別結(jié)果輸出到會(huì)話控制單元300。如果沒有這樣一個(gè)單詞假定,則候選確定部分200E要求單詞假定提煉部分200F對(duì)檢索到的單詞假定進(jìn)行提煉。
下面將描述候選確定部分200E的操作。假設(shè)下面的情況(a)單詞檢索部分200C輸出多個(gè)單詞假定(“KANTAKU(重申)”、“KATAKU(申辯)”、以及“KANTOKU(電影導(dǎo)演)”)以及分別與多個(gè)單詞假定相關(guān)聯(lián)的多個(gè)相似性(識(shí)別度)到候選確定部分200E;(b)所述規(guī)定的對(duì)話空間是關(guān)于電影的空間;(c)所述主題辨別信息包括“KANTOKU(電影導(dǎo)演)”;(d)“KANTAKU(重申)”的相似性在多個(gè)相似性中具有最高值;以及(e)“KANTOKU(電影導(dǎo)演)”的相似性在多個(gè)相似性中具有最低值。
候選確定部分200E將檢索到的單詞假定與規(guī)定對(duì)話空間中的主題辨別信息進(jìn)行比較,然后確定一個(gè)單詞假定“KANTOKU(電影導(dǎo)演)”與所述主題辨別信息一致。候選確定部分200E將該單詞假定“KANTOKU(電影導(dǎo)演)”作為識(shí)別結(jié)果輸出給會(huì)話控制單元300。由于這樣的處理,相對(duì)于另外的單詞假定“KANTAKU(重申)”和“KATAKU(申辯)”,優(yōu)先選擇了與主題“電影”相關(guān)聯(lián)的、說話者當(dāng)前發(fā)出的單詞假定“KANTOKU(電影導(dǎo)演)”,而單詞假定“KANTAKU(重申)”和“KATAKU(申辯)”的相似性具有比“KANTOKU(電影導(dǎo)演)”的相似性更高的值。結(jié)果,候選確定部分200E可以輸出對(duì)話上下文中的識(shí)別結(jié)果。
另一方面,如果沒有這樣一個(gè)單詞假定,則候選確定部分200E要求單詞假定提煉部分200F對(duì)檢索到的單詞假定進(jìn)行提煉。單詞假定提煉部分200F基于單詞檢索部分200C經(jīng)由緩沖存儲(chǔ)器200D輸出的檢索到的單詞假定,參考在語音識(shí)別字典存儲(chǔ)器700中存儲(chǔ)的統(tǒng)計(jì)語言模型,然后對(duì)檢索到的單詞假定進(jìn)行提煉,以便從說話者在不同的語音發(fā)起時(shí)間開始發(fā)出且在同一語音終止時(shí)間結(jié)束發(fā)出的相同的單詞的單詞假定中選擇一個(gè)單詞假定。該單詞假定在每次每個(gè)相關(guān)聯(lián)的相同單詞的頭部音素上下文的時(shí)候從不同的語音發(fā)起時(shí)間到同一的語音終止時(shí)間計(jì)算的相似性中具有最高的相似性。在所述范例實(shí)施例中,定義表示三個(gè)音素串的頭部音素上下文,所述三個(gè)音素包括對(duì)于在所述相關(guān)聯(lián)的相同單詞之前的單詞的單詞假定的末尾音素以及對(duì)于所述相關(guān)聯(lián)的相同單詞的單詞假定的第一和第二音素。在所述提煉之后,單詞假定提煉部分200F將在所有提煉的單詞假定的單詞串中具有最高相似性的單詞假定的一個(gè)單詞串作為識(shí)別結(jié)果輸出到會(huì)話控制單元300。
下面參照?qǐng)D3描述由單詞假定提煉部分200F所執(zhí)行的單詞提煉處理。
假設(shè)作為第(i-1)個(gè)單詞W(i-1)的單詞假定有六個(gè)假定Wa、Wb、Wc、Wd、We、Wf,第i個(gè)單詞Wi包括音素串a(chǎn)1、a2、……an,其中第i個(gè)單詞Wi在第(i-1)個(gè)單詞W(i-1)之后。還假設(shè)前三個(gè)假定Wa、Wb、Wc和后三個(gè)假定Wd、We、Wf的末尾音素分別與末尾音素“x”、“y”相同。如果在同一語音終止時(shí)間te,三個(gè)假定具有三個(gè)在前的假定Wa、Wb、Wc,而一個(gè)假定具有三個(gè)在前的假定Wd、We、Wf,則單詞假定提煉部分200F從具有相互相同的頭部音素上下文的前三個(gè)假定中選擇具有最高相似性的一個(gè)假定,然后排除另外兩個(gè)假定。
在上面的例子中,因?yàn)楹竺娴囊粋€(gè)假定的頭部音素上下文不同于前三個(gè)假定的頭部音素的上下文,即,后面一個(gè)假定的在前假定的末尾音素“y”不同于前面三個(gè)假定的在前假定的末尾音素“x”,單詞假定提煉部分200F并沒有排除后面的一個(gè)假定。單詞假定提煉部分200F每個(gè)在前假定的末尾音素留下一個(gè)假定。
可以定義頭部音素上下文,該頭部音素上下文表示包括對(duì)于相關(guān)聯(lián)的相同單詞之前的單詞的單詞假定的末尾音素的多音素串,包括對(duì)于相關(guān)聯(lián)的相同單詞之前的單詞的單詞假定的至少一個(gè)音素的音素串,包括對(duì)于相關(guān)聯(lián)的相同單詞的單詞假定的第一音素的音素串。
特征提取部分200A、單詞檢索部分200C、候選確定部分200E、以及單詞假定提煉部分200F的每一個(gè)都由諸如微型計(jì)算機(jī)之類的計(jì)算機(jī)構(gòu)成。緩沖存儲(chǔ)器200B、200D以及語音識(shí)別字典存儲(chǔ)器700每一個(gè)都由諸如硬盤之類的存儲(chǔ)單元構(gòu)成。
在所述范例實(shí)施例中,代替使用單詞檢索部分200C和單詞假定提煉部分200F來執(zhí)行語音識(shí)別,語音識(shí)別單元200可以由音素比較部分和語音識(shí)別部分組成,其中所述音素比較部分配置為參照音素HMM,所述語音識(shí)別部分配置為通過參照根據(jù)“一次通過動(dòng)態(tài)規(guī)劃(One Pass DP)”算法的統(tǒng)計(jì)語言模型來執(zhí)行語音識(shí)別。
在上述范例實(shí)施例中,代替語音識(shí)別單元200,組成會(huì)話控制器1的一部分的會(huì)話數(shù)據(jù)庫500和語音識(shí)別字典存儲(chǔ)器700,這些元件可以形成獨(dú)立于會(huì)話控制器1的語音識(shí)別裝置。
(1-1-2-2.語音識(shí)別單元的操作)將參照?qǐng)D4描述語音識(shí)別單元200的操作。
在步驟S401,當(dāng)語音識(shí)別單元200從輸入單元100接收語音信號(hào)時(shí),其對(duì)包含在所接收的語音信號(hào)中的語音進(jìn)行特征分析以產(chǎn)生特征參數(shù)。在步驟S402,語音識(shí)別單元200將所產(chǎn)生的特征參數(shù)與存儲(chǔ)在語音識(shí)別字典存儲(chǔ)器700中的音素HMM和語言模型進(jìn)行比較,然后檢索一定數(shù)量的單詞假定并計(jì)算所述單詞假定的相似性。在步驟S403,語音識(shí)別單元200將所檢索的單詞假定與規(guī)定對(duì)話空間內(nèi)的主題辨別信息進(jìn)行比較。在步驟S404,語音識(shí)別單元200確定所檢索的單詞假定中是否存在與主題辨別信息一致的一個(gè)單詞假定。如果存在這樣一個(gè)單詞假定,則語音識(shí)別單元200將該單詞假定作為識(shí)別結(jié)果輸出到會(huì)話控制單元300(步驟S405)。如果不存在這樣一個(gè)單詞假定,則語音識(shí)別單元200根據(jù)所計(jì)算的單詞假定的相似性,將具有最高相似性的一個(gè)單詞假定作為識(shí)別結(jié)果輸出到會(huì)話控制單元300(步驟S406)。
(1-1-3.語音識(shí)別字典存儲(chǔ)器)語音識(shí)別字典存儲(chǔ)器700存儲(chǔ)與其中的標(biāo)準(zhǔn)語音信號(hào)相對(duì)應(yīng)的字符串。當(dāng)進(jìn)行比較時(shí),語音識(shí)別單元200為與所接收到的語音信號(hào)相對(duì)應(yīng)的字符串識(shí)別一個(gè)單詞假定,然后將該識(shí)別的單詞假定作為字符串信號(hào)(識(shí)別結(jié)果)輸出給會(huì)話控制單元300。
(1-1-4.句子分析單元)下面將參照?qǐng)D5描述句子分析單元400的結(jié)構(gòu)。
句子分析單元400分析在輸入單元100或語音識(shí)別單元200處識(shí)別的字符串。句子分析單元400包括字符串識(shí)別部分410、詞素提取部分420、詞素?cái)?shù)據(jù)庫430、輸入類型確定部分440、和說話類型數(shù)據(jù)庫450。字符串識(shí)別部分410將在輸入單元100或語音識(shí)別單元200處識(shí)別的字符串劃分成片段。片段是指在不破壞語法意義的程度下盡可能多地劃分字符串而產(chǎn)生的句子。具體地,當(dāng)字符串包括超過一定級(jí)別的時(shí)間間隔時(shí),該字符串標(biāo)識(shí)部分410在那部分劃分該字符串。該字符串識(shí)別部分410將所產(chǎn)生的字符串輸出到詞素提取部分420和輸入類型確定部分440。下面將要描述的“字符串”是指一個(gè)句子的字符串。
(1-1-4-1.詞素提取單元)基于由在字符串識(shí)別部分410的劃分而產(chǎn)生的句子的字符串,詞素提取部分420從該句子的字符串中提取構(gòu)成該字符串的最小單元的詞素作為第一詞素信息。在所述范例實(shí)施例中,詞素是指在字符串中顯示的單詞結(jié)構(gòu)的最小單元。單詞結(jié)構(gòu)的最小單元可以是例如包括名詞、形容詞和動(dòng)詞的語音的一部分。
在所述范例實(shí)施例中,如圖6所示,在m1、m2、m3......處示出詞素。更詳細(xì)地,當(dāng)從字符串識(shí)別部分410接收字符串時(shí),詞素提取部分420將所接收到的字符串與存儲(chǔ)在詞素?cái)?shù)據(jù)庫430中的詞素組(將所述詞素組準(zhǔn)備為詞素字典,其中,對(duì)于屬于語音的各部分的每個(gè)詞素描述方向單詞、讀法、和部分語音)進(jìn)行比較。在比較時(shí),詞素提取部分420從字符串中提取與所存儲(chǔ)的詞素組中的一些匹配的詞素(m1、m2......)。除了所提取的詞素之外的詞素(n1、n2、n3......)可以例如是輔助動(dòng)詞。
詞素提取部分420將所提取的詞素作為第一詞素信息輸出到主題辨別信息檢索部分350。注意到,不需要結(jié)構(gòu)化第一詞素信息。在所述范例實(shí)施例中,結(jié)構(gòu)化是指基于語音的部分對(duì)包含在字符串中的詞素進(jìn)行分類和排列。例如,將字符串劃分成詞素,然后以諸如主語、賓語和謂語之類的規(guī)定的順序排列詞素。所述范例實(shí)施例即使使用結(jié)構(gòu)化的第一詞素信息也可以實(shí)現(xiàn)。
(1-1-4-2.輸入類型確定單元)輸入類型確定部分440基于在字符串識(shí)別部分410識(shí)別的字符串,確定說話的內(nèi)容的類型(說話類型)。在所述范例實(shí)施例中,所述說話類型是用于識(shí)別所述說話的內(nèi)容的類型的信息,并且是指例如圖7中所示的“說話的句子的類型”中的一個(gè)。
在上述范例實(shí)施例中,“說話的句子的類型”包括陳述句(DDeclaration),時(shí)間句子(TTime),位置句子(LLocation),否定的句子(NNegation)等,如圖7所示。這些類型的句子以肯定句和疑問句形成。陳述句是指表示使用者的意見或想法的句子。在所述范例實(shí)施例中,例如,圖7中所示的句子“我喜歡Sato”是肯定句。位置句子是指包括位置的概念的句子。時(shí)間句子是指包括時(shí)間的概念的句子。否定句是指否定陳述句的句子。圖7示出了“說話的句子的類型”的示例性句子。
在所述范例實(shí)施例中,當(dāng)輸入類型確定部分440確定“說話的句子的類型”時(shí),輸入類型確定部分440使用陳述性表達(dá)字典來確定其是陳述句、否定性表達(dá)字典來確定其是否定句等等,如圖8中所示。具體地,當(dāng)從字符串識(shí)別部分410接收字符串時(shí),輸入類型確定部分440基于字符串將所接收的字符串與存儲(chǔ)在說話類型數(shù)據(jù)庫450中的字典進(jìn)行比較。當(dāng)比較時(shí),輸入類型確定部分440從所述字符串中提取與所述字典相關(guān)的元素。
基于所提取的元素,輸入類型確定部分440確定“說話的句子的類型”。當(dāng)字符串包括例如聲明一個(gè)事件的元素時(shí),輸入類型確定部分440確定包括所述元素的字符串是陳述句。輸入類型確定部分440輸出所確定的“說話的句子的類型”到答復(fù)檢索部分380。
(1-1-5.會(huì)話數(shù)據(jù)庫)下面將參照?qǐng)D9描述會(huì)話數(shù)據(jù)庫500中存儲(chǔ)的數(shù)據(jù)的結(jié)構(gòu)。
如圖9所示,會(huì)話數(shù)據(jù)庫500存儲(chǔ)多條用于識(shí)別會(huì)話的主題的主題辨別信息810。各條主題辨別信息810與另外一條主題辨別信息810相關(guān)聯(lián)。例如,如果識(shí)別了一條主題辨別信息C(810),則也識(shí)別了與該條主題辨別信息C(810)相關(guān)聯(lián)的三條主題辨別信息A(810)、B(810)、D(810)。
在所述范例實(shí)施例中,一條主題辨別信息是指將由使用者輸入的內(nèi)容或?qū)⑤敵鼋o使用者的答復(fù)句子相關(guān)的關(guān)鍵詞。
各條主題辨別信息810與一個(gè)或多個(gè)主題標(biāo)題820相關(guān)聯(lián)。各個(gè)主題標(biāo)題820由一個(gè)字符、多個(gè)字符串、或通過結(jié)合這些所形成的詞素構(gòu)成。各個(gè)主題標(biāo)題820與將要輸出給使用者的答復(fù)句子830相關(guān)聯(lián)。多個(gè)答復(fù)類型分別與答復(fù)句子830相關(guān)聯(lián),各個(gè)答復(fù)類型表示所述答復(fù)句子830的類型。
下面將描述一條主題辨別信息810與另外一條主題辨別信息810之間的關(guān)聯(lián)性。在所述范例實(shí)施例中,信息X與信息Y之間的關(guān)聯(lián)是指,如果讀出信息X,則可以讀出與信息X關(guān)聯(lián)的信息Y。例如,將在信息X的數(shù)據(jù)中存儲(chǔ)有用于讀取信息Y的信息(例如,指示了存儲(chǔ)了信息Y的地址的指針,存儲(chǔ)了信息Y的物理存儲(chǔ)器地址,或者存儲(chǔ)了信息Y的邏輯地址)的狀態(tài)稱為“信息Y與信息X關(guān)聯(lián)”。
在所述范例實(shí)施例中,如圖10所示,以相對(duì)于另外一條主題辨別信息的清楚的關(guān)系,作為上位概念、下位概念、同義詞或反義詞(未示出)存儲(chǔ)各條主題辨別信息。例如,作為主題辨別信息810A(電影)的上位概念的主題辨別信息810B(娛樂)與主題辨別信息810A相關(guān)聯(lián)并存儲(chǔ)在高于主題辨別信息810A(電影)的上層中。
還有,作為主題辨別信息810A(電影)的下位概念的主題辨別信息810C1(電影導(dǎo)演)、主題辨別信息810C2(領(lǐng)銜主演)、主題辨別信息810C3(發(fā)行公司)、主題辨別信息810C4(上映時(shí)間)、主題辨別信息810D1(七個(gè)日本武士)、主題辨別信息810D2(亂)、主題辨別信息810D3(保鏢)......都與主題辨別信息810A(電影)相關(guān)聯(lián),且存儲(chǔ)在低于主題辨別信息810A(電影)的下層。
同義詞900與主題辨別信息810A(電影)相關(guān)聯(lián)。例如,同義詞900(工作、內(nèi)容、電影院)作為主題辨別信息810A的關(guān)鍵詞“電影”的同義詞而存儲(chǔ)。由此,在關(guān)鍵詞“電影”沒有包含于說話中的情況下,如果關(guān)鍵詞“工作”、“內(nèi)容”、“電影院”中至少一個(gè)包含于所述說話中,則會(huì)話控制器1可以將主題辨別信息810A作為包含于所述說話中的主題辨別信息處理。
當(dāng)會(huì)話控制器1識(shí)別主題辨別信息810時(shí),會(huì)話控制器1可以參照會(huì)話數(shù)據(jù)庫500所存儲(chǔ)的內(nèi)容,以高速檢索且提取與識(shí)別的主題辨別信息810相關(guān)聯(lián)的另外的主題辨別信息810以及主題辨別信息810的主題標(biāo)題820或答復(fù)句子830。
下面將參照?qǐng)D11描述主題標(biāo)題820的數(shù)據(jù)結(jié)構(gòu)。
主題辨別信息810D1、主題辨別信息810D2、主題辨別信息810D3......分別包括主題標(biāo)題8201、8202、......、主題標(biāo)題8203、8204、......、主題標(biāo)題8205、8206、......。在所述范例實(shí)施例中,如圖11所示,各個(gè)主題標(biāo)題820由第一辨別信息1001、第二辨別信息1002、以及第三辨別信息1003構(gòu)成。第一辨別信息1001指的是構(gòu)成主題的主要詞素。例如,第一辨別信息1001可以是句子的主語。第二辨別信息1002指的是具有與第一辨別信息1001的緊密相關(guān)性的詞素。例如,第二辨別信息1002可以是句子的賓語。第三辨別信息1003指的是說明賓語的動(dòng)作的詞素或修飾名詞的詞素等。例如,第三辨別信息1003可以是動(dòng)詞、副詞或形容詞。注意到,即使從這些辨別信息理解了句子的內(nèi)容,第一辨別信息1001、第二辨別信息1002、以及第三辨別信息1003可以有另外的含義(語音的其他部分)。
如圖11所示,當(dāng)例如主語是“七個(gè)日本武士”,形容詞是“有趣的”時(shí),主題標(biāo)題8202(第二詞素信息)包括包含于第一辨別信息1001中的詞素“七個(gè)日本武士”以及包含于第三辨別信息1003中的詞素“有趣的”。注意到,在第二辨別信息1002中顯示“*”是因?yàn)橹黝}標(biāo)題8202沒有包含第二辨別信息1002的項(xiàng)中的任何詞素。
主題標(biāo)題8202(七個(gè)日本武士;*,有趣的)具有“七個(gè)日本武士是有趣的”的含義。下面,第一辨別信息1001、第二辨別信息1002、以及第三辨別信息1003以從左至右的順序包含在主題標(biāo)題8202的括號(hào)中。當(dāng)主題標(biāo)題820不包含辨別信息的項(xiàng)中的任何詞素時(shí),在那部分顯示“*”。
注意到,構(gòu)成主題標(biāo)題820的辨別信息可能具有另外的辨別信息(例如第四辨別信息)。
將參照?qǐng)D12描述答復(fù)句子830。如圖12所示,將答復(fù)句子830分類成不同的類型(響應(yīng)的類型),如,陳述(DDeclaration),時(shí)間(TTime),位置(LLocation),否定(NNegation),以使答復(fù)適用于由使用者所提供的說話的句子的類型。在“A”處表示肯定句,而在“Q”處表示疑問句。
將參照?qǐng)D13描述主題辨別信息810的數(shù)據(jù)結(jié)構(gòu)。如圖13所示,主題辨別信息810“Sato”與多個(gè)主題標(biāo)題(820)1-1、1-2、......相關(guān)聯(lián)。主題標(biāo)題(820)1-1、1-2、......分別與答復(fù)句子(830)1-1、1-2、......相關(guān)聯(lián)。答復(fù)句子830是對(duì)于各種響應(yīng)類型所準(zhǔn)備的。
當(dāng)主題標(biāo)題(820)1-1例如是(Sato;*;喜歡){這些是提取的包含于“我喜歡Sato”中的詞素}時(shí),與主題標(biāo)題(820)1-1相關(guān)聯(lián)的答復(fù)句子(830)1-1包括(DA陳述性的肯定句“我也喜歡Sato”)和(TA時(shí)間肯定性句子“我喜歡正在擊球的Sato”)。下面將要描述的答復(fù)檢索部分380參照輸入類型確定部分440的輸出,檢索與主題標(biāo)題820相關(guān)聯(lián)的答復(fù)句子830中的一個(gè)。
各條下一計(jì)劃指定信息840與各個(gè)答復(fù)句子830相關(guān)聯(lián)。下一計(jì)劃指定信息840是用于指定響應(yīng)使用者的說話將要優(yōu)先輸出的答復(fù)句子(后面稱為下一答復(fù)句子)的信息。如果下一計(jì)劃指定信息840是用于確定下一答復(fù)句子的信息,則我們可以定義任何信息為下一計(jì)劃指定信息840。例如,將用于確定存儲(chǔ)在會(huì)話數(shù)據(jù)庫500中的所有答復(fù)句子的至少一個(gè)的答復(fù)句子ID定義為下一計(jì)劃指定信息840。
在所述范例實(shí)施例中,將下一計(jì)劃指定信息840描述為用于由答復(fù)句子確定下一答復(fù)句子的信息(例如,答復(fù)句子ID)。但是,下一計(jì)劃指定信息840可以是用于由主題辨別信息810和主題標(biāo)題820確定下一答復(fù)句子的信息。例如,將主題辨別信息ID和主題標(biāo)題ID定義為下一計(jì)劃指定信息840。在這種情況下,因?yàn)閷⒍鄠€(gè)答復(fù)句子指定為下一答復(fù)句子,將下一答復(fù)句子稱為下一答復(fù)句子組。將包含于下一答復(fù)句子組中的任何答復(fù)句子輸出為答復(fù)句子。
(1-1-6.會(huì)話控制單元)下面將參照?qǐng)D5描述會(huì)話控制單元300的結(jié)構(gòu)。
會(huì)話控制單元300控制會(huì)話控制器1中的結(jié)構(gòu)元件(語音識(shí)別單元200、句子分析單元400、會(huì)話數(shù)據(jù)庫500、輸出單元600、和語音識(shí)別字典存儲(chǔ)器700)之間的數(shù)據(jù)傳遞,且具有響應(yīng)使用者說話確定并輸出答復(fù)句子的功能。
如圖5所示,會(huì)話控制單元300包括管理部分310、計(jì)劃會(huì)話處理部分320、對(duì)話空間會(huì)話控制處理部分330、以及CA會(huì)話處理部分340。
(1-1-6-1.管理部分)
管理部分310存儲(chǔ)對(duì)話歷史且具有更新對(duì)話歷史的功能。管理部分310還具有根據(jù)來自主題辨別信息檢索部分350、省略句補(bǔ)充部分360、主題檢索部分370和/或答復(fù)檢索部分380的要求發(fā)送部分或全部對(duì)話歷史給主題辨別信息檢索部分350、省略句補(bǔ)充部分360、主題檢索部分370和/或答復(fù)檢索部分380的功能。
(1-1-6-2.計(jì)劃會(huì)話處理部分)計(jì)劃會(huì)話處理部分320執(zhí)行計(jì)劃且具有根據(jù)所述計(jì)劃建立使用者與會(huì)話控制器1之間的會(huì)話的功能。注意的是,所述計(jì)劃是指按照規(guī)定的順序提供預(yù)定的答復(fù)給使用者。
計(jì)劃會(huì)話處理部分320還具有響應(yīng)使用者的說話按照規(guī)定的順序輸出所述預(yù)定答復(fù)的功能。
如圖14中所示,計(jì)劃空間1401中包括多個(gè)計(jì)劃1402(計(jì)劃1、2、3、4)。計(jì)劃空間1401是存儲(chǔ)在會(huì)話數(shù)據(jù)庫500中的一組所述多個(gè)計(jì)劃1402。會(huì)話控制器1選擇預(yù)先定義的一個(gè)計(jì)劃1402以在起動(dòng)會(huì)話控制器1或起動(dòng)會(huì)話時(shí)使用,或響應(yīng)各使用者說話的內(nèi)容在計(jì)劃空間1401中隨機(jī)選擇任一計(jì)劃1402。然后,會(huì)話控制器1通過使用所選擇的計(jì)劃1402輸出與使用者說話相對(duì)應(yīng)的答復(fù)句子。
如圖15所示,各計(jì)劃1402中包括答復(fù)句子1501以及與答復(fù)句子1501相關(guān)聯(lián)的下一計(jì)劃指定信息1502。下一計(jì)劃指定信息1502是用于指定的一個(gè)計(jì)劃1402的信息,該計(jì)劃1402包含將要在與該下一計(jì)劃指定信息1502相關(guān)聯(lián)的答復(fù)句子1501之后向使用者輸出的一個(gè)答復(fù)句子(下一候選答復(fù)句子)1501。計(jì)劃1(1402)中包括執(zhí)行計(jì)劃1時(shí)會(huì)話控制器1輸出的答復(fù)句子A(1501),以及與所述答復(fù)句子A(1501)相關(guān)聯(lián)的下一計(jì)劃指定信息1502。下一計(jì)劃指定信息1502是用于確定計(jì)劃2(1402)的信息(ID002),計(jì)劃2(1402)包括作為對(duì)所述答復(fù)句子A(1501)的下一候選答復(fù)句子的答復(fù)句子B(1501)。以同樣的方式,計(jì)劃2(1402)中包括答復(fù)句子B(1501)和與答復(fù)句子B(1501)相關(guān)聯(lián)的下一計(jì)劃指定信息1502。下一計(jì)劃指定信息1502是用于確定另一計(jì)劃的信息(ID043),該另一計(jì)劃包括作為對(duì)所述答復(fù)句子B(1501)的下一候選答復(fù)句子的另一答復(fù)句子。
因此,計(jì)劃1402通過下一計(jì)劃指定信息1502相互鏈接,這實(shí)現(xiàn)了將一系列內(nèi)容輸出給使用者的計(jì)劃會(huì)話。即,通過將一個(gè)人想要告訴的內(nèi)容(說明性的句子、聲明句子、質(zhì)問等)劃分為多個(gè)答復(fù)句子,然后作為計(jì)劃準(zhǔn)備所述分割的答復(fù)句子的順序,就能夠響應(yīng)使用者的說話,按順序向使用者提供答復(fù)句子。注意到,響應(yīng)對(duì)于在前的答復(fù)句子的使用者說話,不需要將包含于由下一計(jì)劃指定信息1502所指定的計(jì)劃1402中的答復(fù)句子1501馬上輸出給使用者。例如,在與使用者進(jìn)行關(guān)于除了當(dāng)前計(jì)劃的一個(gè)之外的主題的對(duì)話之后,會(huì)話控制器1可以將包含于由下一計(jì)劃指定信息1502所指定的計(jì)劃1402中的答復(fù)句子輸出給使用者。
在圖15中所示的答復(fù)句子1501與圖13中所示的答復(fù)句子830的一個(gè)對(duì)應(yīng)。還有,在圖15中所示的下一計(jì)劃指定信息1502與圖13中所示的下一計(jì)劃指定信息840對(duì)應(yīng)。
在圖15中將計(jì)劃1402之間的鏈接限定到一維矩陣。如圖16所示,計(jì)劃1′(1402)中包括答復(fù)句子A′(1501)和分別與包含于計(jì)劃2′、3′中的兩個(gè)答復(fù)句子B′、C′(1501)相關(guān)聯(lián)的兩條下一計(jì)劃指定信息1502(ID002′、003′)。會(huì)話控制器1二選一地選擇答復(fù)句子B′、C′(1501)中的一個(gè)并在將答復(fù)句子A′(1501)輸出給使用者之后完成計(jì)劃1′(1402)。因此,計(jì)劃1402之間的鏈接可以是樹形的陣列或是網(wǎng)狀陣列。
每個(gè)計(jì)劃1402具有一條或多條下一計(jì)劃指定信息1502。注意到,用于會(huì)話的結(jié)束的計(jì)劃1402中可以沒有下一計(jì)劃指定信息1502。
如圖17所示,計(jì)劃14021、14022、14023、14024分別與用于通知使用者關(guān)于危機(jī)管理的信息的答復(fù)句子15011、15012、15013、15014對(duì)應(yīng)。答復(fù)句子15011、15012、15013、15014作為總體構(gòu)成連貫的句子(說明性句子)。計(jì)劃14021、14022、14023、14024中包括ID數(shù)據(jù)17021、17022、17023、17024,其分別具有值1000-01、1000-02、1000-03、1000-04。注意到,在ID數(shù)據(jù)的連字符之后的數(shù)字表示相關(guān)聯(lián)的計(jì)劃的輸出順序。計(jì)劃14021、14022、14023、14024中還包括下一計(jì)劃指定信息15021、15022、15023、15024,其分別具有值1000-02、1000-03、1000-04、1000-0F。在下一計(jì)劃指定信息15024的連字符之下的數(shù)字“0F”表示答復(fù)句子15014是連貫的句子的末尾,因?yàn)樵诖饛?fù)句子15014之后沒有要輸出的計(jì)劃。
在這個(gè)例子中,如果使用者說話是“請(qǐng)告訴我當(dāng)發(fā)生大地震時(shí)所應(yīng)用的危機(jī)管理”,則計(jì)劃會(huì)話處理部分320開始執(zhí)行該系列計(jì)劃。更詳細(xì)地,當(dāng)計(jì)劃會(huì)話處理部分320接收使用者說話“請(qǐng)告訴我當(dāng)發(fā)生大地震時(shí)所應(yīng)用的危機(jī)管理”時(shí),計(jì)劃會(huì)話處理部分320檢索計(jì)劃空間1401并檢查是否有包括與所述使用者說話對(duì)應(yīng)的答復(fù)句子15011的計(jì)劃14021。這里,包含于計(jì)劃14021中的使用者說話字符串17011對(duì)應(yīng)于使用者說話“請(qǐng)告訴我當(dāng)發(fā)生大地震時(shí)所應(yīng)用的危機(jī)管理”。
如果計(jì)劃會(huì)話處理部分320發(fā)現(xiàn)計(jì)劃14021,則計(jì)劃會(huì)話處理部分320檢索包含于計(jì)劃14021中的答復(fù)句子15011。然后,計(jì)劃會(huì)話處理部分320輸出答復(fù)句子15011作為對(duì)使用者說話的答復(fù),且參照下一計(jì)劃指定信息15021確定下一候選答復(fù)句子。
接下來,當(dāng)計(jì)劃會(huì)話處理部分320在輸出答復(fù)句子15011之后經(jīng)輸出單元100、語音識(shí)別單元200等接收另一個(gè)使用者說話時(shí),計(jì)劃會(huì)話處理部分320檢查是否輸出由下一計(jì)劃指定信息15021所指定的計(jì)劃14022中所包含的答復(fù)句子15012。更具體地,計(jì)劃會(huì)話處理部分320將所接收到的使用者說話與和答復(fù)句子15012相關(guān)聯(lián)的使用者說話字符串17012或主題標(biāo)題820(圖17中未示出)比較。如果它們彼此相關(guān),則計(jì)劃會(huì)話處理部分320輸出答復(fù)句子15012作為對(duì)使用者說話的答復(fù),且參照下一計(jì)劃指定信息15022確定下一候選答復(fù)句子。
用同樣的方式,計(jì)劃會(huì)話處理部分320根據(jù)一系列使用者說話發(fā)送計(jì)劃14023、14024并輸出答復(fù)句子15013、15014。計(jì)劃會(huì)話處理部分320在答復(fù)句子15014的輸出完成的時(shí)候結(jié)束計(jì)劃執(zhí)行。因此,計(jì)劃會(huì)話處理部分320可以通過依次執(zhí)行計(jì)劃14021、14022、14023、14024以預(yù)先定義的順序向使用者提供會(huì)話內(nèi)容。
(1-1-6-3.對(duì)話空間會(huì)話控制處理部分)如圖5所示,對(duì)話空間會(huì)話控制處理部分330包括主題辨別信息檢索部分350、省略句補(bǔ)充部分360、主題檢索部分370以及答復(fù)檢索部分380。管理部分310控制會(huì)話控制單元300的整體。
對(duì)話歷史是用于確定使用者與會(huì)話控制器1之間的會(huì)話的主題與題目的信息,且包括發(fā)現(xiàn)的主題辨別信息、發(fā)現(xiàn)的主題標(biāo)題、使用者輸入句子主題辨別信息、以及答復(fù)句子主題辨別信息中的至少一個(gè)。發(fā)現(xiàn)的主題辨別信息、發(fā)現(xiàn)的主題標(biāo)題、答復(fù)句子主題辨別信息不限于由最后的會(huì)話所定義的信息。它們可以是在指定的過去的時(shí)段期間變成它們的信息或是它們的積累記錄。
(1-1-6-3-1.主題辨別信息檢索部分)主題辨別信息檢索部分350將在詞素提取部分420所提取的第一詞素信息與多條主題辨別信息相比較,且從所述多條主題辨別信息中檢索與構(gòu)成第一詞素信息的部分的詞素對(duì)應(yīng)的一條主題辨別信息。具體地,當(dāng)從詞素提取部分420收到的第一詞素信息是兩個(gè)詞素“Sato”和“喜歡”時(shí),主題辨別信息檢索部分350將所收到的第一詞素信息與主題辨別信息組進(jìn)行比較。
在比較時(shí),當(dāng)主題辨別信息組包括構(gòu)成第一詞素信息部分的詞素(例如“Sato”)作為發(fā)現(xiàn)的主題標(biāo)題820focus時(shí),主題辨別信息檢索部分350輸出發(fā)現(xiàn)的主題標(biāo)題820focus給答復(fù)檢索部分380。這里,使用參考號(hào)碼820focus以區(qū)分上次檢索的主題標(biāo)題820與另一個(gè)主題標(biāo)題820。另一方面,當(dāng)主題辨別信息組不包括構(gòu)成第一詞素信息部分的詞素作為發(fā)現(xiàn)的主題標(biāo)題820focus時(shí),主題辨別信息檢索部分350基于第一詞素信息確定使用者輸入句子主題辨別信息,且輸出所接收到的第一詞素信息及確定的使用者輸入句子主題辨別信息到省略句補(bǔ)充部分360。這里,使用者輸入句子主題辨別信息指的是對(duì)應(yīng)于一個(gè)詞素的主題辨別信息,該詞素為在包含于第一詞素信息中的詞素中與使用者所說的內(nèi)容有關(guān)的詞素或可能與使用者所說的內(nèi)容有關(guān)的詞素。
(1-1-6-3-2.省略句補(bǔ)充部分)省略句補(bǔ)充部分360利用上次所檢索的主題辨別信息810(以后稱為“發(fā)現(xiàn)的主題辨別信息”)以及包含于在前答復(fù)句子中的主題辨別信息810(以后稱為“答復(fù)句子主題辨別信息”),通過補(bǔ)充第一詞素信息產(chǎn)生各種補(bǔ)充的第一詞素信息。例如,如果使用者說話是“喜歡”,則省略句補(bǔ)充部分360增加發(fā)現(xiàn)的主題辨別信息“Sato”到第一詞素信息“喜歡”且產(chǎn)生補(bǔ)充的第一詞素信息“Sato,喜歡”。
即,用作為“W”的第一詞素信息,以及作為“D”的一組發(fā)現(xiàn)的主題辨別信息和答復(fù)句子主題辨別信息,省略句補(bǔ)充部分360增加組“D”的一個(gè)或多個(gè)元素到第一詞素信息“W”且產(chǎn)生補(bǔ)充的第一詞素信息。
用這種方式,當(dāng)利用第一詞素信息所構(gòu)成的句子作為日語是省略句且是不清楚的時(shí)候,省略句補(bǔ)充部分360可以使用組“D”以增加組“D”的一個(gè)或多個(gè)元素(例如Sato)到第一詞素信息“W”。結(jié)果,省略句補(bǔ)充部分360可以使第一詞素信息“喜歡”進(jìn)入補(bǔ)充的第一詞素信息“Sato,喜歡”。這里,補(bǔ)充的第一詞素信息“Sato,喜歡”對(duì)應(yīng)于使用者說話“我喜歡Sato”。
即,即使使用者說話的內(nèi)容形成一個(gè)省略句,省略句補(bǔ)充部分360也可以通過使用組“D”補(bǔ)充該省略句。結(jié)果,即使當(dāng)由第一詞素信息組成的句子是省略句時(shí),省略句補(bǔ)充部分360可以使該句子成為正確的日語。
基于組“D”,省略句補(bǔ)充部分360檢索與補(bǔ)充的第一詞素信息相關(guān)的主題標(biāo)題820。當(dāng)省略句補(bǔ)充部分360發(fā)現(xiàn)與補(bǔ)充的第一詞素信息相關(guān)的主題標(biāo)題820時(shí),省略句補(bǔ)充部分360輸出所述主題標(biāo)題820到答復(fù)檢索部分380。答復(fù)檢索部分380可以基于在省略句補(bǔ)充部分360處檢索到的適當(dāng)?shù)闹黝}標(biāo)題820輸出最適合于使用者說話的內(nèi)容的答復(fù)句子830。
省略句補(bǔ)充部分360不限于增加組“D”到第一詞素信息。基于所發(fā)現(xiàn)的主題標(biāo)題,省略句補(bǔ)充部分360可以增加包含于構(gòu)成主題標(biāo)題的第一辨別信息、第二辨別信息、和第三辨別信息中的任何一個(gè)的詞素到所提取的第一詞素信息。
(1-1-6-3-3.主題檢索部分)當(dāng)省略句補(bǔ)充部分360沒有確定主題標(biāo)題820時(shí),主題檢索部分370將第一詞素信息與和使用者輸入句子主題辨別信息相關(guān)聯(lián)的主題標(biāo)題820相比較,并且從主題標(biāo)題820之中檢索最適于第一詞素信息的主題標(biāo)題820。
更詳細(xì)地,當(dāng)主題檢索部分370從省略句補(bǔ)充部分360接收檢索命令信號(hào)時(shí),主題檢索部分370基于包含于所接收到的檢索命令信號(hào)中的使用者輸入句子主題辨別信息和第一詞素信息,從與使用者輸入句子主題辨別信息相關(guān)聯(lián)的主題標(biāo)題820之中檢索最適于第一詞素信息的主題標(biāo)題820。主題檢索部分370將所檢索到的主題標(biāo)題820作為檢索結(jié)果信號(hào)輸出到答復(fù)檢索部分380。
例如,如圖13所示,由于所接收到的第一詞素信息“Sato,喜歡”包括主題辨別信息810“Sato”,所以主題檢索部分370確定主題辨別信息810“Sato”且將與主題辨別信息810“Sato”相關(guān)聯(lián)的主題標(biāo)題(820)1-1、1-2、......與所接收到的第一詞素信息“Sato,喜歡”進(jìn)行比較。
基于比較的結(jié)果,主題檢索部分370從主題標(biāo)題(820)1-1、1-2、......中檢索與所接收到的第一詞素信息“Sato,喜歡”相一致的主題標(biāo)題(820)1-1“Sato;*;喜歡”。主題檢索部分370將所檢索到的主題標(biāo)題(820)1-1“Sato;*;喜歡”作為檢索結(jié)果信號(hào)輸出到答復(fù)檢索部分380。
(1-1-6-3-4.答復(fù)檢索部分)基于在省略句補(bǔ)充部分360或主題檢索部分370所檢索的主題標(biāo)題820,答復(fù)檢索部分380檢索與主題標(biāo)題相關(guān)聯(lián)的答復(fù)句子。還有,基于在主題檢索部分370所檢索的主題標(biāo)題820,答復(fù)檢索部分380將與主題標(biāo)題820相關(guān)聯(lián)的不同的響應(yīng)類型與在輸入類型確定部分440所確定的說話類型相比較。當(dāng)比較時(shí),答復(fù)檢索部分380從響應(yīng)類型之中檢索與所確定的說話類型相一致的響應(yīng)類型。
例如,如圖13所示,當(dāng)在主題檢索部分370所檢索的主題標(biāo)題是主題標(biāo)題1-1“Sato;*;喜歡”時(shí),答復(fù)檢索部分380從與主題標(biāo)題1-1相關(guān)聯(lián)的答復(fù)句子1-1(DA,TA等)之中確定響應(yīng)類型(DA),該響應(yīng)類型(DA)與在輸入類型確定部分440所確定的說話的句子的類型(如DA)相一致。當(dāng)確定響應(yīng)類型(DA)時(shí),答復(fù)檢索部分380基于響應(yīng)類型(DA)檢索與所確定的響應(yīng)類型(DA)相關(guān)聯(lián)的答復(fù)句子1-1“我也喜歡Sato”。
這里,在“DA”、“TA”等中的“A”是指肯定形式。當(dāng)說話類型和響應(yīng)類型包括“A”時(shí),表示對(duì)某件事的肯定。說話類型和響應(yīng)類型可以包括“DQ”、“TQ”等的類型。在“DQ”、“TQ”等中的“Q”是指關(guān)于一件事的疑問。
當(dāng)響應(yīng)類型是疑問形式(Q)時(shí),將與這種響應(yīng)類型相關(guān)聯(lián)的答復(fù)句子作成肯定形式(A)。以肯定形式(A)建立的答復(fù)句子可以是用于答復(fù)問題的句子。例如,當(dāng)說話的句子是“你曾經(jīng)操作過硬幣游戲機(jī)嗎?”時(shí),說話的句子的說話類型是疑問形式(Q)。與疑問形式(Q)相關(guān)聯(lián)的答復(fù)句子例如可以是“我以前操作過硬幣游戲機(jī)”(肯定形式(A))。
另一方面,當(dāng)響應(yīng)類型是肯定形式(A)時(shí),將與該響應(yīng)類型相關(guān)聯(lián)的答復(fù)句子作成疑問形式(Q)。以疑問形式(Q)建立的答復(fù)句子可以是用于反問說話的內(nèi)容的疑問句或用于找出某件事的疑問句。例如,當(dāng)說話的句子是“我喜歡玩硬幣游戲機(jī)”時(shí),該說話的句子的說話類型是肯定形式(A)。與肯定形式(A)相關(guān)聯(lián)的答復(fù)句子例如可以是“你喜歡玩彈球盤嗎?”(用于找出某件事的疑問句(Q))。
答復(fù)檢索部分380將所檢索到的答復(fù)句子作為答復(fù)句子信號(hào)輸出到管理部分310。在從答復(fù)檢索部分380接收到答復(fù)句子信號(hào)時(shí),管理部分310將所接收到的答復(fù)句子信號(hào)輸出到輸出單元600。
(1-1-6-4.CA會(huì)話處理部分)當(dāng)計(jì)劃會(huì)話處理部分320或?qū)υ捒臻g會(huì)話控制處理部分330沒有確定對(duì)使用者的答復(fù)句子時(shí),CA會(huì)話處理部分340輸出答復(fù)句子,使得會(huì)話控制器1可以根據(jù)使用者說話的內(nèi)容繼續(xù)與使用者說話。
下面將參照?qǐng)D1再次描述會(huì)話控制器1的結(jié)構(gòu)。
(1-1-7.輸出單元)輸出單元600輸出在答復(fù)檢索部分380檢索到的答復(fù)句子。輸出單元600可以是例如揚(yáng)聲器或顯示器。具體地,當(dāng)從答復(fù)檢索部分380接收到答復(fù)句子時(shí),輸出單元600基于答復(fù)句子用聲音輸出所接收到的答復(fù)句子(例如,我也喜歡Sato)。
下面將參照?qǐng)D18到圖22描述會(huì)話控制器1的操作。
當(dāng)會(huì)話控制單元300接收使用者說話時(shí),執(zhí)行圖18中所示的主處理。在執(zhí)行主處理時(shí),將對(duì)所接收的使用者說話的答復(fù)句子輸出以建立使用者與會(huì)話控制器1之間的會(huì)話(對(duì)話)。
在步驟S1801,計(jì)劃會(huì)話處理部分320執(zhí)行計(jì)劃會(huì)話控制處理。計(jì)劃會(huì)話控制處理是用于執(zhí)行計(jì)劃的處理。
下面將參照?qǐng)D19、20描述計(jì)劃會(huì)話控制處理的一個(gè)例子。
在步驟S1901,計(jì)劃會(huì)話處理部分320檢查基本控制狀態(tài)信息。將關(guān)于計(jì)劃的執(zhí)行是否完成的信息作為基本控制狀態(tài)信息存儲(chǔ)于某存儲(chǔ)區(qū)域。采用基本控制狀態(tài)信息來描述計(jì)劃的基本控制狀態(tài)。
如圖21所示,稱為場(chǎng)景的計(jì)劃類型具有四個(gè)基本控制狀態(tài)(連結(jié)、取消、保持、以及繼續(xù))(1)連結(jié)當(dāng)使用者說話與正在執(zhí)行的計(jì)劃1402相關(guān)時(shí),更具體地,與對(duì)應(yīng)于計(jì)劃1402的主題標(biāo)題820或例句1701相關(guān)時(shí),在基本控制狀態(tài)信息中設(shè)置連結(jié)。在連結(jié)中,計(jì)劃會(huì)話處理部分320完成計(jì)劃1402然后轉(zhuǎn)移到與由下一計(jì)劃指定信息1502所指定的答復(fù)句子1501相對(duì)應(yīng)的另一計(jì)劃1402。
(2)取消當(dāng)確定使用者說話的內(nèi)容要求計(jì)劃1402的完成或確定使用者的興趣轉(zhuǎn)移到不同于正在執(zhí)行的計(jì)劃的事情時(shí),在基本控制狀態(tài)信息中設(shè)置取消。在取消中,計(jì)劃會(huì)話處理部分320檢索除了要取消的那個(gè)計(jì)劃1402外,是否存在與使用者說話相對(duì)應(yīng)的另一計(jì)劃1402。如果存在這樣的另一計(jì)劃1402,則計(jì)劃會(huì)話處理部分320開始該另一計(jì)劃1402的執(zhí)行。如果不存在這樣的另一計(jì)劃1402,則計(jì)劃會(huì)話處理部分320結(jié)束一系列計(jì)劃的執(zhí)行。
(3)保持在使用者說話與正在執(zhí)行的計(jì)劃1402不相關(guān)時(shí),更具體地,與對(duì)應(yīng)于計(jì)劃1402的主題標(biāo)題820或例句1701不相關(guān),且使用者說話不對(duì)應(yīng)于基本控制狀態(tài)“取消”時(shí),在基本控制狀態(tài)信息中設(shè)置保持。
在保持中,計(jì)劃會(huì)話處理部分320確定在接收使用者說話時(shí)是否再次執(zhí)行處于待處理/停止?fàn)顟B(tài)的計(jì)劃1402。如果使用者說話不適于計(jì)劃1402的再次執(zhí)行(如,使用者說話與對(duì)應(yīng)于該計(jì)劃1402的主題標(biāo)題820或例句1701不相關(guān)),則計(jì)劃會(huì)話處理部分320開始執(zhí)行另一計(jì)劃1402或執(zhí)行后面將要描述的對(duì)話空間會(huì)話控制處理(步驟S1802)。如果使用者說話適于計(jì)劃1402的再次執(zhí)行,則計(jì)劃會(huì)話處理部分320基于所存儲(chǔ)的下一計(jì)劃指定信息1502輸出答復(fù)句子1501。
還有,在保持中,如果使用者說話與相關(guān)聯(lián)的計(jì)劃1402不相關(guān),則計(jì)劃會(huì)話處理部分320檢索另一計(jì)劃1402以便輸出一個(gè)答復(fù)句子,該答復(fù)句子不同于與相關(guān)聯(lián)的計(jì)劃1402對(duì)應(yīng)的答復(fù)句子1501,或者執(zhí)行對(duì)話對(duì)話空間控制處理。但是,如果使用者說話再次與相關(guān)聯(lián)的計(jì)劃1402相關(guān),則計(jì)劃會(huì)話處理部分320再次執(zhí)行相關(guān)聯(lián)的計(jì)劃1402。
(4)繼續(xù)當(dāng)使用者說話與包含于正在執(zhí)行的計(jì)劃1402中的答復(fù)句子1501不相關(guān)、使用者說話的內(nèi)容不對(duì)應(yīng)于基本控制狀態(tài)“取消”、且要基于使用者說話來進(jìn)行解釋的使用者的意圖不清楚時(shí),在基本控制狀態(tài)信息中設(shè)置繼續(xù)。
在繼續(xù)中,計(jì)劃會(huì)話處理部分320確定在接收使用者說話時(shí)是否再次執(zhí)行處于待處理/停止?fàn)顟B(tài)的計(jì)劃1402。如果使用者說話不適于計(jì)劃1402的再次執(zhí)行,則計(jì)劃會(huì)話處理部分320執(zhí)行下面將描述的CA會(huì)話控制處理,從而輸出用于引起使用者的說話的答復(fù)句子。
在步驟S1902,計(jì)劃會(huì)話處理部分320確定在基本控制狀態(tài)信息中設(shè)置的基本控制狀態(tài)是否是連結(jié)。如果基本控制狀態(tài)是連結(jié),則處理進(jìn)行到步驟S1903。在步驟S1903,計(jì)劃會(huì)話處理部分320確定答復(fù)句子1501是否是正在執(zhí)行的計(jì)劃1402中的最后的答復(fù)句子。
如果答復(fù)句子1501是最后的答復(fù)句子,則處理進(jìn)行到步驟S1904。在步驟S1904,因?yàn)橛?jì)劃會(huì)話處理部分320已經(jīng)傳遞了要答復(fù)使用者的所有內(nèi)容,計(jì)劃會(huì)話處理部分320在計(jì)劃空間中檢索以確定是否開始另一計(jì)劃1402。在步驟S1905,計(jì)劃會(huì)話處理部分320確定在計(jì)劃空間中是否存在與使用者說話對(duì)應(yīng)的另一計(jì)劃1402。如果不存在另一計(jì)劃1402,則因?yàn)闆]有任何計(jì)劃1402要提供給使用者,計(jì)劃會(huì)話處理部分320結(jié)束計(jì)劃會(huì)話控制處理。
如果存在另一計(jì)劃1402,則處理進(jìn)行到步驟S1906。在步驟S1906中,計(jì)劃會(huì)話處理部分320轉(zhuǎn)移到另一計(jì)劃1402,以開始執(zhí)行該另一計(jì)劃1402(包含于所述另一計(jì)劃1402中的答復(fù)句子的輸出)。
在步驟S1908中,計(jì)劃會(huì)話處理部分320輸出包含于相關(guān)聯(lián)的計(jì)劃1402中的答復(fù)句子1501。答復(fù)句子1501作為對(duì)使用者說話的答復(fù)輸出,其提供要發(fā)送到使用者的信息。計(jì)劃會(huì)話處理部分320在步驟S1908中已經(jīng)結(jié)束答復(fù)句子輸出的時(shí)候結(jié)束計(jì)劃會(huì)話控制處理。
另一方面,在步驟S1903,如果答復(fù)句子1501不是最后的答復(fù)句子,則處理進(jìn)行到步驟S1907。在步驟S1907中,計(jì)劃會(huì)話處理部分320轉(zhuǎn)移到與所輸出的答復(fù)句子1501之后的答復(fù)句子1501(即由下一計(jì)劃指定信息1502所確定的答復(fù)句子1501)相對(duì)應(yīng)的計(jì)劃1402。然后,處理進(jìn)行到步驟S1908。
在步驟S1902,如果基本控制狀態(tài)不是連結(jié),則處理進(jìn)行到步驟S1909。在步驟S1909,計(jì)劃會(huì)話處理部分320確定在基本控制狀態(tài)信息中設(shè)置的基本控制狀態(tài)是否是取消。如果基本控制狀態(tài)是取消,則因?yàn)闆]有要繼續(xù)的計(jì)劃1402,處理進(jìn)行到步驟S1904。如果基本控制狀態(tài)不是取消,則處理進(jìn)行到步驟S1910。
在步驟S1910,計(jì)劃會(huì)話處理部分320確定在基本控制狀態(tài)信息中設(shè)置的基本控制狀態(tài)是否是保持。如果基本控制狀態(tài)是保持,計(jì)劃會(huì)話處理部分320檢索使用者是否對(duì)處于待處理/停止?fàn)顟B(tài)的計(jì)劃1402感興趣。如果使用者對(duì)計(jì)劃1402感興趣,則計(jì)劃會(huì)話處理部分320再次執(zhí)行處于待處理/停止?fàn)顟B(tài)的計(jì)劃1402。
更詳細(xì)地,如圖20所示,在步驟S2001計(jì)劃會(huì)話處理部分320檢索處于待處理/停止?fàn)顟B(tài)的計(jì)劃1402,然后在步驟S2002確定使用者說話是否與所述處于待處理/停止?fàn)顟B(tài)的計(jì)劃1402相關(guān)。如果使用者說話與所述計(jì)劃1402相關(guān),則處理進(jìn)行到步驟S2003。在步驟S2003,計(jì)劃會(huì)話處理部分320轉(zhuǎn)移到與使用者說話相關(guān)的計(jì)劃1402,然后處理進(jìn)行到步驟S1908。因此,計(jì)劃會(huì)話處理部分320能夠根據(jù)使用者說話再次執(zhí)行處于待處理/停止?fàn)顟B(tài)的計(jì)劃1402,這可以將預(yù)先準(zhǔn)備的包含于計(jì)劃1402的所有內(nèi)容傳遞給使用者。如果使用者說話與所述計(jì)劃1402無關(guān),則處理進(jìn)行到步驟S1904。
在步驟S1910,如果基本控制狀態(tài)不是保持,則因?yàn)榛究刂茽顟B(tài)是繼續(xù),計(jì)劃會(huì)話處理部分320結(jié)束計(jì)劃會(huì)話控制處理而不輸出答復(fù)句子。
如圖18所示,當(dāng)結(jié)束計(jì)劃會(huì)話控制處理時(shí),會(huì)話控制單元300執(zhí)行對(duì)話空間會(huì)話控制處理(步驟S1802)。注意到,當(dāng)在計(jì)劃會(huì)話控制處理中輸出答復(fù)句子(步驟S1801)時(shí),會(huì)話控制單元300直接執(zhí)行基本控制信息更新處理(步驟S1804)而不執(zhí)行對(duì)話空間會(huì)話控制處理(步驟S1802)和CA會(huì)話控制處理(步驟S1803),然后結(jié)束主處理。
如圖22所示,在步驟S2201,輸入單元100接收使用者提供的使用者說話。更具體地,輸入單元100接收攜帶了使用者說話的聲音。輸入單元100將與所接收的說話內(nèi)容對(duì)應(yīng)的語音作為語音信號(hào)輸出到語音識(shí)別單元200。注意到,輸入單元100可以接收由使用者輸入的字符串(例如以文本格式輸入的字符數(shù)據(jù))代替聲音。在這種情況下,輸入單元100是用于輸入字符信息的諸如鍵盤或觸摸板之類的字符輸入設(shè)備。
在步驟S2202,語音識(shí)別單元200基于由輸入設(shè)備100所檢索到的說話內(nèi)容,識(shí)別與所述說話內(nèi)容對(duì)應(yīng)的字符串。更具體地,語音識(shí)別單元200在從輸入單元100接收到語音信號(hào)時(shí),識(shí)別與所述語音信號(hào)對(duì)應(yīng)的單詞假定(候選)。然后,語音識(shí)別單元200檢索與所識(shí)別的單詞假定對(duì)應(yīng)的字符串并將所檢索到的字符串輸出到會(huì)話控制單元300(對(duì)話空間會(huì)話控制處理部分330)作為字符串信號(hào)。
在步驟S2203,字符串識(shí)別部分410將在語音識(shí)別單元200識(shí)別的字符串劃分成片段。片段是指在不破壞語法意義的程序上盡可能多地劃分字符串而產(chǎn)生的句子。更詳細(xì)地,當(dāng)字符串包括超過一定級(jí)別的時(shí)間間隔時(shí),字符串識(shí)別部分410在那部分劃分所述字符串。字符串識(shí)別部分410將所產(chǎn)生的字符串輸出到詞素提取部分420和輸入類型確定部分440。優(yōu)選的是,在從鍵盤輸入字符串的情況下,字符串識(shí)別部分410在有標(biāo)點(diǎn)符號(hào)或空格的部分劃分字符串。
在步驟S2204,基于在字符串識(shí)別部分410識(shí)別的字符串,詞素提取部分420提取構(gòu)成字符串的最小單元的詞素作為第一詞素信息。更詳細(xì)地,當(dāng)從字符串識(shí)別部分410接收字符串時(shí),詞素提取部分420將所接收到的字符串與預(yù)先存儲(chǔ)在詞素?cái)?shù)據(jù)庫430中的詞素組相比較。將所述詞素組準(zhǔn)備為詞素字典,在該詞素字典中,對(duì)于屬于語音的相應(yīng)部分的每個(gè)詞素描述方向單詞、讀法、部分語音、和屈折形式。在比較時(shí),詞素提取部分420從所接收到的字符串中提取與所存儲(chǔ)的詞素組中的一些匹配的詞素(m1、m2......)。詞素提取部分420輸出所提取的詞素到主題辨別信息檢索部分350作為第一詞素信息。
在步驟S2205,輸入類型確定部分440基于在字符串識(shí)別部分410識(shí)別的字符串,確定說話類型。具體地,當(dāng)從字符串識(shí)別部分410接收字符串時(shí),輸入類型確定部分440基于所述字符串將所接收的字符串與存儲(chǔ)在說話類型數(shù)據(jù)庫450中的字典進(jìn)行比較。當(dāng)比較時(shí),輸入類型確定部分440從所述字符串中提取與所述字典相關(guān)的元素。基于所提取的元素,輸入類型確定部分440確定各提取的元素屬于哪個(gè)類型的說話句子。輸入類型確定部分440輸出所確定的說話的句子的類型到答復(fù)檢索部分380。
在步驟S2206,主題辨別信息檢索部分350將在詞素提取部分420所提取的第一詞素信息與發(fā)現(xiàn)的主題標(biāo)題820focus相比較。如果構(gòu)成第一詞素信息的部分的詞素與所述發(fā)現(xiàn)的主題標(biāo)題820focus相關(guān),則主題辨別信息檢索部分350輸出所述發(fā)現(xiàn)的主題標(biāo)題820focus給答復(fù)檢索部分380。如果構(gòu)成第一詞素信息的部分的詞素與所述發(fā)現(xiàn)的主題標(biāo)題820focus不相關(guān),則主題辨別信息檢索部分350輸出所接收到的第一詞素信息及使用者輸入句子主題辨別信息到省略句補(bǔ)充部分360作為檢索命令信號(hào)。
在步驟S2207,省略句補(bǔ)充部分360基于從主題辨別信息檢索部分350接收到第一詞素信息,增加發(fā)現(xiàn)的主題辨別信息和答復(fù)句子主題辨別信息到接收到第一詞素信息。更具體地,用作為“W”的第一詞素信息,以及作為“D”的一組發(fā)現(xiàn)的主題辨別信息和答復(fù)句子主題辨別信息,省略句補(bǔ)充部分360增加組“D”的一個(gè)或多個(gè)元素到第一詞素信息“W”且產(chǎn)生補(bǔ)充的第一詞素信息。然后,省略句補(bǔ)充部分360將所述補(bǔ)充的第一詞素信息和與所述組“D”相關(guān)聯(lián)的所有主題標(biāo)題820比較,并檢索與所述補(bǔ)充的第一詞素信息相關(guān)的主題標(biāo)題820。如果存在與所述補(bǔ)充的第一詞素信息相關(guān)的主題標(biāo)題820,則省略句補(bǔ)充部分360輸出所述主題標(biāo)題820到答復(fù)檢索部分380。如果不存在與所述補(bǔ)充的第一詞素信息相關(guān)的主題標(biāo)題820,則省略句補(bǔ)充部分360輸出所述第一詞素信息及使用者輸入句子主題辨別信息到主題檢索部分370。
在步驟S2208,主題檢索部分370將所述第一詞素信息與所述使用者輸入句子主題辨別信息相比較,并且從主題標(biāo)題820之中檢索最適于所述第一詞素信息的主題標(biāo)題820。更詳細(xì)地,當(dāng)主題檢索部分370從省略句補(bǔ)充部分360接收檢索命令信號(hào)時(shí),主題檢索部分370基于包含于所接收到的檢索命令信號(hào)中的使用者輸入句子主題辨別信息和第一詞素信息,從與使用者輸入句子主題辨別信息相關(guān)聯(lián)的主題標(biāo)題820之中檢索最適于第一詞素信息的主題標(biāo)題820。主題檢索部分370將所檢索到的主題標(biāo)題820輸出到答復(fù)檢索部分380作為檢索結(jié)果信號(hào)。
在步驟S2209,基于在主題辨別信息檢索部分350、省略句補(bǔ)充部分360或主題檢索部分370檢索到的主題標(biāo)題820,答復(fù)檢索部分380將與主題標(biāo)題820相關(guān)聯(lián)的不同類型的響應(yīng)與在輸入類型確定部分440所確定的說話的類型相比較。當(dāng)比較時(shí),答復(fù)檢索部分380從響應(yīng)的類型之中檢索與所確定的說話類型相一致的響應(yīng)類型。例如,當(dāng)答復(fù)檢索部分380從主題檢索部分370接收檢索結(jié)果信號(hào)并從輸入類型確定部分440接收說話類型時(shí),答復(fù)檢索部分380基于與所接收的檢索結(jié)果信號(hào)以及所接收的說話類型對(duì)應(yīng)的主題標(biāo)題,在與所述主題標(biāo)題相關(guān)聯(lián)的響應(yīng)類型之中確定與說話類型(如DA)相一致的響應(yīng)類型。
在步驟S2210,答復(fù)檢索部分380經(jīng)管理部分310將在步驟S2209檢索到的答復(fù)句子830輸出到輸出單元600。當(dāng)輸出單元600從管理部分310接收答復(fù)句子830時(shí),輸出單元600輸出所接收到的答復(fù)句子830。
如圖18所示,當(dāng)結(jié)束對(duì)話空間會(huì)話控制處理時(shí),會(huì)話控制單元300執(zhí)行CA會(huì)話控制處理(步驟S1803)。注意到,當(dāng)在對(duì)話空間會(huì)話控制處理中輸出了答復(fù)句子(步驟S1802)時(shí),會(huì)話控制單元300直接執(zhí)行基本控制信息更新處理(步驟S1804)而不執(zhí)行CA會(huì)話控制處理(步驟S1803),然后結(jié)束主處理。
在CA會(huì)話控制處理中,會(huì)話控制單元300確定使用者說話是用于解釋某事的說話、用于確定某事的說話、用于控訴或攻擊某事的說話、或不同于上述的說話,然后輸出與使用者說話內(nèi)容對(duì)應(yīng)的答復(fù)句子以及確定結(jié)果。由此,即使在計(jì)劃會(huì)話控制處理或?qū)υ捒臻g會(huì)話控制處理中沒有輸出適合于使用者說話的答復(fù)句子,會(huì)話控制單元300也可以輸出允許會(huì)話流繼續(xù)的橋接答復(fù)句子。
在步驟S1804中,會(huì)話控制單元300執(zhí)行基本控制信息更新處理,在基本控制信息更新處理中,當(dāng)計(jì)劃會(huì)話處理部分320輸出答復(fù)句子時(shí),會(huì)話控制單元300的管理單元310在基本控制信息中設(shè)置連結(jié)。當(dāng)計(jì)劃會(huì)話處理部分320停止輸出答復(fù)句子時(shí),管理單元310在基本控制信息中設(shè)置取消。當(dāng)對(duì)話空間會(huì)話控制處理部分330輸出答復(fù)句子時(shí),管理單元310在基本控制信息中設(shè)置保持。當(dāng)CA會(huì)話處理部分340輸出答復(fù)句子時(shí),管理單元310在基本控制信息中設(shè)置繼續(xù)。
在計(jì)劃會(huì)話控制處理中參考在基本控制信息更新處理中設(shè)置的基本控制信息(步驟S1801),來繼續(xù)或再開始一個(gè)計(jì)劃。如上所述,通過每當(dāng)接收到使用者說話時(shí)執(zhí)行主處理,會(huì)話控制器1可以根據(jù)使用者說話執(zhí)行一個(gè)預(yù)先準(zhǔn)備的計(jì)劃,并對(duì)不包含于計(jì)劃中的主題進(jìn)行準(zhǔn)確的響應(yīng)。
權(quán)利要求
1.一種會(huì)話控制器,用于根據(jù)使用者說話輸出答復(fù)句子,包括計(jì)劃存儲(chǔ)器單元,用于存儲(chǔ)多個(gè)計(jì)劃,其中每個(gè)計(jì)劃具有一答復(fù)句子和一條或多條下一候選指定信息,所述一條或多條下一候選指定信息用于指定將要在答復(fù)句子之后輸出的下一候選答復(fù)句子;以及計(jì)劃會(huì)話單元,用于根據(jù)第一使用者說話選擇存儲(chǔ)在所述計(jì)劃存儲(chǔ)器單元中的一個(gè)計(jì)劃且輸出所選擇的計(jì)劃具有的答復(fù)句子,以及根據(jù)第二使用者說話選擇所述計(jì)劃具有的一條下一候選指定信息,并基于所選擇的那條下一候選指定信息輸出下一候選答復(fù)句子,其中,一些計(jì)劃具有一解釋性句子所分割成的多個(gè)答復(fù)句子。
2.根據(jù)權(quán)利要求1所述的會(huì)話控制器,其中,所述計(jì)劃會(huì)話單元在接收到與所述下一候選答復(fù)句子不相關(guān)的所述第二使用者說話或不清楚所述第二使用者說話與所述下一候選答復(fù)句子之間是否存在關(guān)系時(shí),保留所述下一候選答復(fù)句子的輸出,然后在接收到與所保留的下一候選答復(fù)句子相關(guān)的第三使用者說話時(shí)輸出所保留的下一候選答復(fù)句子。
3.根據(jù)權(quán)利要求2所述的會(huì)話控制器,還包括對(duì)話空間會(huì)話單元,用于根據(jù)第二使用者說話輸出關(guān)于與所保留的下一候選答復(fù)句子不相關(guān)的主題的答復(fù)句子。
4.根據(jù)權(quán)利要求3所述的會(huì)話控制器,還包括會(huì)話繼續(xù)單元,用于在沒有輸出所述關(guān)于與所保留的下一候選答復(fù)句子不相關(guān)的主題的答復(fù)句子時(shí),根據(jù)所述第二使用者說話輸出一答復(fù)句子以繼續(xù)使用者與會(huì)話控制器之間的會(huì)話。
全文摘要
會(huì)話控制器根據(jù)使用者說話輸出答復(fù)句子。所述會(huì)話控制器包括會(huì)話數(shù)據(jù)庫和會(huì)話控制單元。所述會(huì)話數(shù)據(jù)庫存儲(chǔ)多個(gè)計(jì)劃。各個(gè)計(jì)劃具有一答復(fù)句子和用于指定將要在所述答復(fù)句子之后輸出的下一候選答復(fù)句子的一條或多條下一計(jì)劃指定信息。所述會(huì)話控制單元根據(jù)使用者說話選擇存儲(chǔ)在所述會(huì)話數(shù)據(jù)庫中的一個(gè)計(jì)劃并輸出所選擇計(jì)劃具有的答復(fù)句子。然后,所述會(huì)話控制單元根據(jù)下一使用者說話選擇所述計(jì)劃具有的一條下一計(jì)劃指定信息,并基于所選擇的那條下一計(jì)劃指定信息輸出下一候選答復(fù)句子。一些計(jì)劃具有一個(gè)解釋性句子所分割成的多個(gè)答復(fù)句子。
文檔編號(hào)G06F3/01GK1953057SQ20061013579
公開日2007年4月25日 申請(qǐng)日期2006年10月20日 優(yōu)先權(quán)日2005年10月21日
發(fā)明者黃聲揚(yáng), 勝倉裕 申請(qǐng)人:阿魯策株式會(huì)社, 株式會(huì)社PtoPA
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
万州区| 石河子市| 大城县| 宝兴县| 中西区| 德庆县| 阿鲁科尔沁旗| 福安市| 遂溪县| 高要市| 长治县| 西乡县| 玉林市| 景谷| 临武县| 图片| 瑞安市| 恩平市| 务川| 张家港市| 昭觉县| 刚察县| 昌平区| 靖宇县| 皮山县| 晴隆县| 廊坊市| 台中市| 旺苍县| 尤溪县| 柏乡县| 泸水县| 南乐县| 辽阳市| 高平市| 湄潭县| 涪陵区| 都江堰市| 潼关县| 巴马| 郴州市|