欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

檢索方法、檢索系統(tǒng)以及自然語言理解系統(tǒng)的制作方法

文檔序號(hào):6386510閱讀:342來源:國知局
專利名稱:檢索方法、檢索系統(tǒng)以及自然語言理解系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種檢索技術(shù),特別是涉及一種對(duì)結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行全文檢索的檢索方法、檢索系統(tǒng)以及自然語言理解系統(tǒng)。
背景技術(shù)
在計(jì)算機(jī)的自然語言理解(Nature Language Understanding)中,通常會(huì)使用特定的語法來抓取用戶的輸入語句的意圖或信息。因此,若數(shù)據(jù)庫中儲(chǔ)存有足夠多的用戶輸入語句的數(shù)據(jù),便能做到合理的判斷。在現(xiàn)有的作法中,有一種是利用內(nèi)置的固定詞列表來抓取用戶的輸入語句,而固定詞列表中包含了特定的意圖或信息所使用的特定用語,而用戶需依照此特定用語來表達(dá)其意圖或信息,其意圖或信息才能被系統(tǒng)正確識(shí)別。然而,迫使用戶去記住固定詞列表的每個(gè)特定用語是相當(dāng)不人性化的作法。例如現(xiàn)有技術(shù)使用固定詞列表的實(shí)施方式,要求用戶在詢問天氣的時(shí)候必須說“上海(或北京)明天(或后天)天氣如何? ”,而若用戶使用其他比較自然的口語化表達(dá)也想詢問天氣狀況時(shí),比如是“上海明天怎么樣啊?”,因?yàn)檎Z句中未出現(xiàn)“天氣”,所以現(xiàn)有技術(shù)就會(huì)理解成“上海有個(gè)叫明天的地方”,這樣顯然沒有抓到用戶的真正意圖。另外,用戶所使用的語句種類是十分復(fù)雜的,并且又時(shí)常有所變化,甚至有時(shí)用戶可能會(huì)輸入錯(cuò)誤的語句,在此情況下必須要藉由模糊匹配的方式來抓取用戶的輸入語句。因此,僅提供僵化輸入規(guī)則的固定詞列表所能達(dá)到的效果就更差了。此外,當(dāng)利用自然語言理解來處理多種類型的用戶意圖時(shí),有些相異的意圖的語法結(jié)構(gòu)卻是相同的,例如當(dāng)用戶的輸入語句為"我要看三國演義",其用戶意圖有可能是想看三國演義的電影,或是想看三國演義的書,因此通常在此情況中,便會(huì)匹配到兩種可能意圖來讓用戶做選擇。然而,在很多情況下,提供不必要的可能意圖來讓用戶做選擇是十分多余且沒效率的。例如,當(dāng)用戶的輸入語句為〃我想看超級(jí)星光大道〃時(shí),將使用者的意圖匹配為看超級(jí)星光大道的書或者畫作是十分沒必要的(因?yàn)槌?jí)星光大道是電視節(jié)目)。再者,一般而言,在全文檢索中所獲得的搜尋結(jié)果是非結(jié)構(gòu)化的數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)內(nèi)的信息是分散且不具關(guān)聯(lián)的,例如,在google或百度等搜尋引擎輸入關(guān)鍵字后,所獲得的網(wǎng)頁搜尋結(jié)果就是非結(jié)構(gòu)化數(shù)據(jù),因?yàn)樗褜そY(jié)果必須通過人為的逐項(xiàng)閱讀才能找到當(dāng)中的有用信息,而這樣的作法不僅浪費(fèi)用戶的時(shí)間,而且可能漏失想要的信息,所以在實(shí)用性上會(huì)受到很大的限制。

發(fā)明內(nèi)容
本發(fā)明提供一種檢索方法以及檢索系統(tǒng),其對(duì)結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行全文檢索,而使全文檢索所獲得的搜尋結(jié)果是非常有意義的結(jié)構(gòu)化的數(shù)據(jù)。本發(fā)明又提供一種自然語言理解系統(tǒng),藉由對(duì)結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行全文檢索來輔助判斷用戶的請(qǐng)求信息所表示的意圖。本發(fā)明提出一種檢索系統(tǒng),其包括結(jié)構(gòu)化數(shù)據(jù)庫以及搜尋引擎。結(jié)構(gòu)化數(shù)據(jù)庫儲(chǔ)存多個(gè)記錄。搜尋引擎對(duì)結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行全文檢索,其中結(jié)構(gòu)化數(shù)據(jù)庫每個(gè)記錄內(nèi)部的所包含的數(shù)值數(shù)據(jù)相互間具有關(guān)聯(lián)性,且數(shù)值數(shù)據(jù)共同用以表達(dá)來自用戶的請(qǐng)求信息對(duì)該記錄的意圖。該搜尋引擎用以對(duì)該結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行一全文檢索,其中在該數(shù)值數(shù)據(jù)被匹配時(shí),對(duì)應(yīng)于該數(shù)值數(shù)據(jù)的指引數(shù)據(jù)被輸出以確認(rèn)該請(qǐng)求信息的意圖。本發(fā)明提出一種自然語言理解系統(tǒng),其包括自然語言處理器、知識(shí)輔助理解模塊以及檢索系統(tǒng)。自然語言處理器將用戶的請(qǐng)求信息,分析成至少一可能意圖語法數(shù)據(jù),每一可能意圖語法數(shù)據(jù)包括至少一關(guān)鍵字及意圖數(shù)據(jù)。耦接至自然語言處理器的知識(shí)輔助理解模塊用以求得至少一可能意圖語法數(shù)據(jù)中的確定意圖語法數(shù)據(jù),以表達(dá)用戶的請(qǐng)求信息的意圖。前述檢索系統(tǒng)包括結(jié)構(gòu)化數(shù)據(jù)庫以及搜尋引擎。結(jié)構(gòu)化數(shù)據(jù)庫儲(chǔ)存多個(gè)記錄。搜尋引擎對(duì)結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行全文檢索。知識(shí)輔助理解模塊傳送關(guān)鍵字給檢索系統(tǒng),藉由檢索系統(tǒng)的回應(yīng),以輔助求得確定意圖語法數(shù)據(jù)。本發(fā)明提出一種檢索方法,此方法首先提供結(jié)構(gòu)化數(shù)據(jù)庫,此結(jié)構(gòu)化數(shù)據(jù)庫儲(chǔ)存多個(gè)記錄。而后,對(duì)結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行全文檢索。根據(jù)本發(fā)明的一實(shí)施例中,前述的每個(gè)記錄包括了標(biāo)題欄,此標(biāo)題欄內(nèi)包括至少一分欄,每一分欄包括指引欄以及數(shù)值欄,前述記錄的指引欄儲(chǔ)存指引數(shù)據(jù),前述記錄的數(shù)值欄儲(chǔ)存數(shù)值數(shù)據(jù)。根據(jù)本發(fā)明的一實(shí)施例中,前述的每個(gè)記錄還包括內(nèi)容欄,前述記錄的內(nèi)容欄儲(chǔ)存前述記錄的內(nèi)容細(xì)節(jié)數(shù)據(jù)。根據(jù)本發(fā)明的一實(shí)施例中,當(dāng)前述記錄的標(biāo)題欄中儲(chǔ)存有多個(gè)分欄的數(shù)據(jù)時(shí),于各分欄的數(shù)據(jù)間儲(chǔ)存第一特殊字符,用以分隔各分欄的數(shù)據(jù),于指引欄與數(shù)值欄的數(shù)據(jù)間儲(chǔ)存第二特殊字符,用以分隔指引欄與數(shù)值欄的數(shù)據(jù)。根據(jù)本發(fā)明的一實(shí)施例中,標(biāo)題欄中的分欄具有固定位數(shù)。基于上述,本發(fā)明藉由將用戶的請(qǐng)求信息所包括的關(guān)鍵字,來對(duì)結(jié)構(gòu)化數(shù)據(jù)庫中具有特定數(shù)據(jù)結(jié)構(gòu)的記錄進(jìn)行全文檢索,以輔助判斷出用戶在請(qǐng)求信息中所表示的意圖。為使本發(fā)明的上述特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉實(shí)施例,并結(jié)合附圖詳細(xì)說明如下。


圖1為根據(jù)本發(fā)明的一實(shí)施例的自然語言理解系統(tǒng)的方塊圖。圖2為根據(jù)本發(fā)明的一實(shí)施例的自然語言處理器對(duì)用戶的各種請(qǐng)求信息的分析結(jié)果的示意圖。圖3A是根據(jù)本發(fā)明的一實(shí)施例的結(jié)構(gòu)化數(shù)據(jù)庫所儲(chǔ)存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄的示意圖。圖3B是根據(jù)本發(fā)明的另一實(shí)施例的結(jié)構(gòu)化數(shù)據(jù)庫所儲(chǔ)存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄的示意圖。圖3C是根據(jù)本發(fā)明的另一實(shí)施例的指引數(shù)據(jù)儲(chǔ)存表格所儲(chǔ)存的指引數(shù)據(jù)的示意圖。圖4A為根據(jù)本發(fā)明的一實(shí)施例的檢索方法的流程圖。圖4B為根據(jù)本發(fā)明的另一實(shí)施例的自然語言理解系統(tǒng)工作過程的流程圖。
圖5A是依照本發(fā)明一實(shí)施例所繪示的自然語言對(duì)話系統(tǒng)的方塊圖。圖5B是依照本發(fā)明一實(shí)施例所繪示的自然語言理解模塊的方塊圖。圖5C是依照本發(fā)明另一實(shí)施例所繪示的自然語言對(duì)話系統(tǒng)的方塊圖。圖6是依照本發(fā)明一實(shí)施例所繪示的修正語音應(yīng)答的方法流程圖。圖7A是依照本發(fā)明一實(shí)施例所繪示的自然語言對(duì)話系統(tǒng)的方塊圖。圖7B是依照本發(fā)明另一實(shí)施例所繪示的自然語言對(duì)話系統(tǒng)的方塊圖。圖8是依照本發(fā)明一實(shí)施例所繪示的自然語言對(duì)話方法流程圖。圖9為依據(jù)本發(fā)明一實(shí)施例的移動(dòng)終端裝置的系統(tǒng)示意圖。圖10為依據(jù)本發(fā)明一實(shí)施例的信息系統(tǒng)的系統(tǒng)示意圖。圖11為依據(jù)本發(fā)明一實(shí)施例的基于語音識(shí)別的選擇方法的流程圖。圖12是依照本發(fā)明一實(shí)施例所繪示的語音操控系統(tǒng)的方塊圖。圖13所示是語音操控系統(tǒng)的方塊圖。圖14是依照本發(fā)明一實(shí)施例所繪示的語音操控方法的流程圖。附圖符號(hào)說明100 自然語言理解系統(tǒng)102,505,705 :請(qǐng)求信息104 :分析結(jié)果106:可能意圖語法數(shù)據(jù)108 :關(guān)鍵字110:回應(yīng)結(jié)果112:意圖數(shù)據(jù)114:確定意圖語法數(shù)據(jù)116 :分析結(jié)果輸出模塊200 :檢索系統(tǒng)220 :結(jié)構(gòu)化數(shù)據(jù)庫240 :搜尋引擎260:檢索接口單元280:指引數(shù)據(jù)儲(chǔ)存表格300 自然語言處理器302 :記錄304 :標(biāo)題欄306:內(nèi)容欄308 :分欄310:指引欄312 :數(shù)值欄314 :來源欄316 :熱度欄400 :知識(shí)輔助理解模塊S41(TS450 :根據(jù)本發(fā)明一實(shí)施例的檢索方法的步驟
S51(TS570 :根據(jù)本發(fā)明一實(shí)施例的自然語言理解系統(tǒng)工作過程的步驟500、500’、700、700’ 自然語言對(duì)話系統(tǒng)501、701 :語首輸入503,703 :解析結(jié)果507,707 :語音應(yīng)答5O9JO9 :特征語義510、710 :語音取樣模塊511、711 :候選列表520、520’、720、720’ 自然語言理解模塊522、722 :語音識(shí)別模塊524、724 自然語言處理模塊526、726 :語音合成模塊S602、S604、S606、S608、S610、S612 :修正語音應(yīng)答的方法各步驟702 :語音綜合處理模塊730 :特性數(shù)據(jù)庫740:自然語言數(shù)據(jù)庫S802 S890 :根據(jù)本發(fā)明一實(shí)施例的自然語言對(duì)話方法各步驟900、1010 :移動(dòng)終端裝置910、1011 :語音接收單元920、1013 :數(shù)據(jù)處理單元930、1015 :顯示單元940 :存儲(chǔ)單元1000 :信息系統(tǒng)1020 :伺服器SPl :第一語音SP2 :第二語音S110(TS1190:依據(jù)本發(fā)明一實(shí)施例的基于語音識(shí)別的選擇方法的流程圖1200、1300 :語音操控系統(tǒng)1210:輔助啟動(dòng)裝置1212、1222 :無線傳輸模塊1214 :觸發(fā)模塊1216:無線充電電池I2I62:電池單元12164:無線充電模塊1220、1320 :移動(dòng)終端裝置1221 :語音系統(tǒng)1224 :語音取樣模塊1226 :語音合成模塊1227:語音輸出接口
1228 :通訊模塊1230 (云端)伺服器1232 :語音理解模塊12322 :語音識(shí)別模塊12324 :語音處理模塊
具體實(shí)施例方式由于現(xiàn)有運(yùn)用固定詞列表的實(shí)施方式只能提供僵化的輸入規(guī)則,對(duì)于用戶多變的輸入語句的判斷能力十分不足,所以常導(dǎo)致對(duì)用戶的意圖判斷錯(cuò)誤而找不到所需的信息、或是因?yàn)榕袛嗔Σ蛔愣敵霾槐匾男畔⒔o用戶等問題。此外,現(xiàn)有的搜尋引擎只能對(duì)用戶提供分散、且相關(guān)不強(qiáng)的搜尋結(jié)果,于是用戶還要花時(shí)間逐條檢視才能過濾出所需信息,不僅浪費(fèi)時(shí)間而且可能漏失所需信息。本發(fā)明即針對(duì)現(xiàn)有技術(shù)的前述問題提出一結(jié)構(gòu)化數(shù)據(jù)的檢索方法與系統(tǒng),在結(jié)構(gòu)化數(shù)據(jù)提供特定的欄位來儲(chǔ)存不同類型的數(shù)據(jù)元素,俾提供用戶使用自然語音輸入信息進(jìn)行檢索時(shí),能快速且正確地判斷用戶的意圖,進(jìn)而提供所需信息予用戶、或提供更精確訊息供其選取。圖1為根據(jù)本發(fā)明的一實(shí)施例的自然語言理解系統(tǒng)的方塊圖。如圖1所示,自然語言理解系統(tǒng)100包括檢索系統(tǒng)200、自然語言處理器300以及知識(shí)輔助理解模塊400,知識(shí)輔助理解模塊400耦接自然語言處理器300以及檢索系統(tǒng)200,檢索系統(tǒng)200還包括結(jié)構(gòu)化數(shù)據(jù)庫220、搜尋引擎240以及檢索接口單元260,其中搜尋引擎240耦接結(jié)構(gòu)化數(shù)據(jù)庫220以及檢索接口單元260。在本實(shí)施例中,檢索系統(tǒng)200包括有檢索接口單元260,但非以限定本發(fā)明,某些實(shí)施例中可能沒有檢索接口單元260,而以其他方式使搜尋弓I擎240對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索。當(dāng)用戶對(duì)自然語言理解系統(tǒng)100發(fā)出請(qǐng)求信息102時(shí),自然語言處理器300可分析請(qǐng)求信息102,并在將所分析的可能意圖語法數(shù)據(jù)106送往知識(shí)輔助理解模塊400,其中可能意圖語法數(shù)據(jù)106包含關(guān)鍵字108與意圖數(shù)據(jù)112。隨后,知識(shí)輔助理解模塊400取出可能意圖語法數(shù)據(jù)106中的關(guān)鍵字108并送往檢索系統(tǒng)200并將意圖數(shù)據(jù)112儲(chǔ)存在知識(shí)輔助理解模塊400內(nèi)部,而檢索系統(tǒng)200中的搜尋引擎240將依據(jù)關(guān)鍵字108對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索之后,再將全文檢索的回應(yīng)結(jié)果110回傳至知識(shí)輔助理解模塊400。接著,知識(shí)輔助理解模塊400依據(jù)回應(yīng)結(jié)果110對(duì)所儲(chǔ)存的意圖數(shù)據(jù)112進(jìn)行比對(duì),并將所求得的確定意圖語法數(shù)據(jù)114送往分析結(jié)果輸出模塊106,而分析結(jié)果輸出模塊116再依據(jù)確定意圖語法數(shù)據(jù)114,傳送分析結(jié)果104至伺服器,隨后在查詢到用戶所需的數(shù)據(jù)后將其送給用戶。上述的分析結(jié)果輸出模塊116可視情況與其他模塊相結(jié)合,例如在一實(shí)施例中可并入知識(shí)輔助理解模塊400中、或是在另一實(shí)施例中分離于自然語言理解系統(tǒng)100而位于伺服器(包含自然語言理解系統(tǒng)100者)中,于是伺服器將直接接收意圖語法數(shù)據(jù)114再進(jìn)行處理。此外,知識(shí)輔助理解模塊400可將意圖數(shù)據(jù)112儲(chǔ)存在模塊內(nèi)部的儲(chǔ)存裝置中、在自然語言理解系統(tǒng)100中、伺服器中(包含自然語言理解系統(tǒng)100者)、或是在任何可供知識(shí)輔助理解模塊400可以擷取到的儲(chǔ)存器中,本發(fā)明對(duì)此并不加以限定。再者,自然語言理解系統(tǒng)100包括檢索系統(tǒng)200、自然語言處理器300以及知識(shí)輔助理解模塊400可以用硬件、軟件、固件、或是上述方式的各種結(jié)合方式來構(gòu)筑,本發(fā)明亦未對(duì)此進(jìn)行限制。前述自然語言理解系統(tǒng)100可以位于云端伺服器中,也可以位于區(qū)域網(wǎng)路中的伺服器,甚或是位于個(gè)人計(jì)算機(jī)、移動(dòng)計(jì)算機(jī)裝置(如筆記型計(jì)算機(jī))或移動(dòng)通訊裝置(如手機(jī))等。自然語言理解系統(tǒng)100或檢索系統(tǒng)200中的各構(gòu)件也不一定需設(shè)置在同一機(jī)器中,而可視實(shí)際需要分散在不同裝置或系統(tǒng)通過各種不同的通訊協(xié)定來連結(jié)。例如,自然語言理解處理器300及知識(shí)輔助理解模塊400可配置于同一智能型手機(jī)內(nèi),而檢索系統(tǒng)200可配置在另一云端伺服器中;或者是,檢索接口單元260、自然語言理解處理器300及知識(shí)輔助理解模塊400可配置于同一筆記型計(jì)算機(jī)內(nèi),而搜尋引擎240及結(jié)構(gòu)化數(shù)據(jù)庫220可配置于區(qū)域網(wǎng)路中的另一伺服器中。此外,當(dāng)自然語言理解系統(tǒng)100皆位于伺服器時(shí)(不論是云端伺服器或區(qū)域網(wǎng)路伺服器),可以將檢索系統(tǒng)200、自然語言理解處理器300、以及知識(shí)輔助理解模塊400配置不同的計(jì)算機(jī)主機(jī)中,并由伺服器主系統(tǒng)來統(tǒng)籌其相互間的訊息與數(shù)據(jù)的傳送。當(dāng)然,檢索系統(tǒng)200、自然語言理解處理器300、以及知識(shí)輔助理解模塊400亦可視實(shí)際需求而將其中兩者或全部合并在一計(jì)算機(jī)主機(jī)中,本發(fā)明并不對(duì)這部分的配置進(jìn)行限制。在本發(fā)明的實(shí)施例中,用戶可以用各種方式來向自然語言處理器300發(fā)出請(qǐng)求信息,例如用說話的語音輸入或是文字描述等方式來發(fā)出請(qǐng)求信息。舉例來說,若自然語言理解系統(tǒng)100是位于云端或區(qū)域網(wǎng)路中的伺服器(未顯示)內(nèi),則用戶可先藉由移動(dòng)裝置(例如手機(jī)、PDA、平板計(jì)算機(jī)或類似系統(tǒng))來輸入請(qǐng)求信息102,接著再通過電信系統(tǒng)業(yè)者來將請(qǐng)求信息102傳送至伺服器中的自然語言理解系統(tǒng)100,來讓自然語言處理器300進(jìn)行請(qǐng)求信息102的分析,最后伺服器于確認(rèn)用戶意圖后,再通過分析結(jié)果輸出模塊116將對(duì)應(yīng)的分析結(jié)果104通過伺服器的處理后,將用戶所請(qǐng)求的信息傳回用戶的移動(dòng)裝置。舉例來說,請(qǐng)求信息102可以是用戶希望藉由自然語言理解系統(tǒng)100來求得答案的問題(例如"明天上海的天氣怎么樣啊〃),而自然語言理解系統(tǒng)100在分析出用戶的意圖是查詢上海明天的天氣時(shí),將通過分析結(jié)果輸出模塊116將所查詢的天氣數(shù)據(jù)作為輸出結(jié)果104送給用戶。此夕卜,若用戶對(duì)自然語言理解系統(tǒng)100所下的指令為〃我要看讓子彈飛〃、〃我想聽一起走過的日子〃時(shí),因?yàn)椤白屪訌楋w”或“一起走過的日子”可能包含不同的領(lǐng)域,所以自然語言處理器300會(huì)將用戶的請(qǐng)求信息102分析成一個(gè)或一個(gè)以上的可能意圖語法數(shù)據(jù)106,此可能意圖語法數(shù)據(jù)106包括有關(guān)鍵字108及意圖數(shù)據(jù)112,然后再經(jīng)由對(duì)檢索系統(tǒng)220中的結(jié)構(gòu)化數(shù)據(jù)240進(jìn)行全文檢索后,進(jìn)而確認(rèn)用戶的意圖。進(jìn)一步來說,當(dāng)用戶的請(qǐng)求信息102為〃明天上海怎么樣啊?〃時(shí),自然語言處理器300經(jīng)過分析后,可產(chǎn)生一個(gè)可能意圖語法數(shù)據(jù)106 "〈queryweather〉,〈city〉=上海,〈時(shí)間 >=明天"。在一實(shí)施例中,如果自然語言理解系統(tǒng)100認(rèn)為用戶的意圖已相當(dāng)明確,便可以直接將用戶的意圖(亦即查詢明天上海的天氣)通過分析結(jié)果輸出模塊116輸出分析結(jié)果104至伺服器,而伺服器可在查詢到用戶所指定的天氣候傳送給用戶。又例如,當(dāng)用戶的請(qǐng)求信息102為〃我要看三國演義〃時(shí),自然語言處理器300經(jīng)過分析后,可產(chǎn)生出三個(gè)可能意圖語法數(shù)據(jù)106 〃〈readbook>,〈bookname〉=三國演義”;〃〈watchTV>,〈TVname〉=三國演義〃;以及
〃〈watchfilm>,〈filmname〉=三國演義"。這是因?yàn)榭赡芤鈭D語法數(shù)據(jù)106中的關(guān)鍵字108(亦即“三國演義”)可能屬于不同的領(lǐng)域,亦即書籍(〈readbook〉)、電視劇(〈watchTV〉)、以及電影(〈readfilm〉)三個(gè)領(lǐng)域,所以一個(gè)請(qǐng)求信息102可分析成多個(gè)可能意圖語法數(shù)據(jù)106,因此需要通過知識(shí)輔助理解模塊400做進(jìn)一步分析,來確認(rèn)用戶的意圖。再舉另一個(gè)例子來說,若用戶輸入"我要看讓子彈飛〃時(shí),因其中的〃讓子彈飛〃有可能是電影名稱或是書名稱,所以也可能出現(xiàn)至少以下兩個(gè)可能意圖語法數(shù)據(jù)106 〃〈readbook>,〈bookname〉=讓子彈飛〃;以及〃〈watchfilm>,〈filmname〉=讓子彈飛”;其分別屬于書籍與電影兩個(gè)領(lǐng)域。上述的可能意圖語法數(shù)據(jù)106隨后需通過知識(shí)輔助理解模塊400做進(jìn)一步分析,并從中求得確定意圖語法數(shù)據(jù)114,來表達(dá)用戶的請(qǐng)求信息的明確意圖。當(dāng)知識(shí)輔助理解模塊400分析可能意圖語法數(shù)據(jù)106時(shí),知識(shí)輔助理解模塊400可通過檢索接口 206傳送關(guān)鍵字108 (例如上述的“三國演義”或“讓子彈飛”)給檢索系統(tǒng)200。檢索系統(tǒng)200中的結(jié)構(gòu)化數(shù)據(jù)庫220儲(chǔ)存了具有特定數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄,而搜尋引擎240能藉由檢索接口單元260所接收的關(guān)鍵字108來對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索,并將全文檢索所獲得的回應(yīng)結(jié)果回傳給知識(shí)輔助理解模塊400,隨后知識(shí)輔助理解模塊400便能藉由此回應(yīng)結(jié)果110來求得確定意圖語法數(shù)據(jù)114。至于對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索以確定意圖語法數(shù)據(jù)114的細(xì)節(jié),將在后面通過圖3A、圖3B與相關(guān)段落做更詳細(xì)的描述。 在本發(fā)明的概念中,自然語言理解系統(tǒng)100能先擷取用戶的請(qǐng)求信息102中的關(guān)鍵字108,并藉由結(jié)構(gòu)化數(shù)據(jù)庫220的全文檢索結(jié)果來判別關(guān)鍵字108的領(lǐng)域?qū)傩裕缟鲜鲚斎搿拔乙慈龂萘x”時(shí),會(huì)產(chǎn)生分別屬于書籍、電視劇、電影三個(gè)領(lǐng)域的可能意圖語法數(shù)據(jù)106,隨后再進(jìn)一步分析并確認(rèn)用戶的明確意圖。因此用戶能夠很輕松地以口語化方式來表達(dá)出其意圖或信息,而不需要特別熟記特定用語,例如現(xiàn)有作法中關(guān)于固定詞列表的特定用語。圖2為根據(jù)本發(fā)明的一實(shí)施例的自然語言處理器300對(duì)用戶的各種請(qǐng)求信息的分析結(jié)果的示意圖。如圖2所示,當(dāng)用戶的請(qǐng)求信息102為〃明天上海的天氣怎么樣啊〃時(shí),自然語言處理器300經(jīng)過分析后,可產(chǎn)生出可能意圖語法數(shù)據(jù)106為"〈queryweather〉,〈city〉=上海,〈時(shí)間 >=明天”其中意圖數(shù)據(jù)112為"〈queryweather〉"、而關(guān)鍵字108為〃上海〃與〃明天〃。由于經(jīng)自然語言處理器300的分析后只取得一組意圖語法數(shù)據(jù)106(查詢天氣〈queryweather〉),因此在一實(shí)施例中,知識(shí)輔助理解模塊400可直接取出關(guān)鍵字108〃上?!ㄅc〃明天〃作為分析結(jié)果104送往伺服器來查詢天氣的信息(例如查詢明天上海天氣概況、包含氣象、氣溫…等信息),而不需要對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索來判定用戶意圖。當(dāng)然,在一實(shí)施例中,仍可對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索做更精確的用戶意圖判定,本領(lǐng)域的技術(shù)人員可依據(jù)實(shí)際需求進(jìn)行變更。此外,當(dāng)用戶的請(qǐng)求信息102為〃我要看讓子彈飛〃時(shí),因?yàn)榭僧a(chǎn)生出兩個(gè)可能意圖語法數(shù)據(jù)106:
〃〈readbook>,〈bookname〉=讓子彈飛〃;以及〃〈watchfilm>,〈filmname〉=讓子彈飛";與兩個(gè)對(duì)應(yīng)的意圖數(shù)據(jù)112〃〈readbook>〃與"〈watchf以及兩個(gè)相同的關(guān)鍵字108〃讓子彈飛〃,來表示其意圖可能是看〃讓子彈飛〃的書籍或是看〃讓子彈飛〃的電影。為進(jìn)一步確認(rèn)用戶的意圖,將通過知識(shí)輔助理解模塊400傳送關(guān)鍵字108〃讓子彈飛〃給檢索接口單元260,接著搜尋引擎240便藉由此關(guān)鍵字108〃讓子彈飛〃來對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索,以確認(rèn)"讓子彈飛"應(yīng)該是書名稱或是電影名稱,藉以確認(rèn)用戶的意圖。再者,當(dāng)用戶的請(qǐng)求信息102為〃我想聽一起走過的日子〃時(shí),可產(chǎn)生出兩個(gè)可能意圖語法數(shù)據(jù)106 //<playmusic>, <singer>= 一起走過,<songname>=日子";〃〈playmusic>,〈songname〉= 一起走過的日子";

兩個(gè)對(duì)應(yīng)的相同的意圖數(shù)據(jù)112〃〈playmusic>〃、以及兩組對(duì)應(yīng)的關(guān)鍵字108〃 一起走過〃與〃日子〃及〃 一起走過的日子〃,來分別表示其意圖可能是聽歌手〃 一起走過〃所唱的歌曲〃日子〃、或是聽歌曲〃 一起走過的日子〃,此時(shí)知識(shí)輔助理解模塊400可傳送第一組關(guān)鍵字108〃 一起走過〃與〃日子〃以及第二組關(guān)鍵字〃 一起走過的日子〃給檢索接口單元260,來確認(rèn)是否有〃一起走過〃這位歌手來唱的〃日子〃這首歌(第一組關(guān)鍵字所隱含的用戶意圖)、或是否有"一起走過的日子"這首歌(第二組關(guān)鍵字所隱含的用戶意圖),藉以確認(rèn)用戶的意圖。然而,本發(fā)明并不限于在此所表示的各可能意圖語法數(shù)據(jù)與意圖數(shù)據(jù)所對(duì)應(yīng)的格式與名稱。圖3A是根據(jù)本發(fā)明的一實(shí)施例的結(jié)構(gòu)化數(shù)據(jù)庫220所儲(chǔ)存的具有特定數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄的示意圖。一般而言,在一些現(xiàn)有的全文檢索作法中,所獲得的搜尋結(jié)果是非結(jié)構(gòu)化的數(shù)據(jù)(例如通過google或百度所搜尋的結(jié)果),因其搜尋結(jié)果的各項(xiàng)信息是分散且不具關(guān)聯(lián)的,所以用戶必須再對(duì)各項(xiàng)信息逐一檢視,因此造成實(shí)用性的限制。然而,在本發(fā)明的概念中,能藉由結(jié)構(gòu)化數(shù)據(jù)庫來有效增進(jìn)檢索的效率與正確性。因?yàn)楸景l(fā)明所揭示的結(jié)構(gòu)化數(shù)據(jù)庫中的每個(gè)記錄內(nèi)部所包含的數(shù)值數(shù)據(jù)相互間具有關(guān)聯(lián)性,且這些數(shù)值數(shù)據(jù)共同用以表達(dá)來自用戶的請(qǐng)求信息對(duì)該記錄的意圖。于是在搜尋引擎對(duì)結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行一全文檢索時(shí),可在記錄的數(shù)值數(shù)據(jù)被匹配時(shí),輸出對(duì)應(yīng)于該數(shù)值數(shù)據(jù)的指引數(shù)據(jù)以確認(rèn)該請(qǐng)求信息的意圖。這部分的實(shí)施細(xì)節(jié)將通過下列實(shí)例作更進(jìn)一步的描述。在本發(fā)明的實(shí)施例中,結(jié)構(gòu)化數(shù)據(jù)庫220所儲(chǔ)存的每個(gè)記錄302包括標(biāo)題欄304及內(nèi)容欄306,標(biāo)題欄304內(nèi)包括多個(gè)分欄308,各分欄包括指引欄310以及數(shù)值欄312,所述多個(gè)記錄302的指引欄310用以儲(chǔ)存指引數(shù)據(jù),而所述多個(gè)記錄302的數(shù)值欄用312以儲(chǔ)存數(shù)值數(shù)據(jù)。在此以圖3A所示的記錄I來舉例說明,記錄I的標(biāo)題欄304中的各分欄308分別儲(chǔ)存了^singerguid :劉德華 〃、^songnameguid 一起走過的日子〃;及 〃songtypeguid 港臺(tái),粵語,流行";各分欄308的指引欄310分別儲(chǔ)存了指引數(shù)據(jù)〃singerguid〃、〃songnameguid〃及"songtypeguid〃、而其對(duì)應(yīng)分欄308的數(shù)值欄312則分別儲(chǔ)存了數(shù)值數(shù)據(jù)〃劉德華〃、〃 一起走過的日子〃及〃港臺(tái),粵語,流行〃。指引數(shù)據(jù)"singerguid"代表數(shù)值數(shù)據(jù)〃劉德華〃的領(lǐng)域種類為歌手名稱(singer),指引數(shù)據(jù)"songnameguid"代表數(shù)值數(shù)據(jù)〃一起走過的日子〃的領(lǐng)域種類為歌曲名稱(song),指引數(shù)據(jù)"songtypeguid"代表數(shù)值數(shù)據(jù)〃港臺(tái),粵語,流行"的領(lǐng)域種類為歌曲類型(song type)。在此的各指引數(shù)據(jù)實(shí)際上可分別用不同的特定一串?dāng)?shù)字或字符來表示,在本發(fā)明中不以此為限。記錄I的內(nèi)容欄306則是儲(chǔ)存了 〃一起走過的日子〃這首歌的歌詞內(nèi)容或儲(chǔ)存其他的數(shù)據(jù)(例如作曲/詞者…等),然而各記錄的內(nèi)容欄306中的真實(shí)數(shù)據(jù)并非本發(fā)明所強(qiáng)調(diào)的重點(diǎn),因此在圖3A中僅示意性地來描述。前述的實(shí)施例中,每個(gè)記錄包括標(biāo)題欄304及內(nèi)容欄306,且標(biāo)題欄304內(nèi)的分欄308包括指引欄310以及數(shù)值欄312,但非以限定本發(fā)明,某些實(shí)施例中也可以沒有內(nèi)容欄306,甚或是有些實(shí)施例中可以沒有指引欄310。除此之外,在本發(fā)明的實(shí)施例中,于各分欄308的數(shù)據(jù)間儲(chǔ)存有第一特殊字符來分隔各分欄308的數(shù)據(jù),于指引欄310與該數(shù)值欄312的數(shù)據(jù)間儲(chǔ)存有第二特殊字符來分隔指引欄與數(shù)值欄的數(shù)據(jù)。舉例來說,如圖3A所示,"singerguid〃與〃劉德華〃之間、"songnameguid"與〃 一起走過的日子〃之間、以及"songtypeguid"與〃港臺(tái),粵語,流行〃之間是利用第二特殊字符〃"來做分隔,而記錄I的各分欄308間是利用第一特殊字符〃 I "來做分隔,然而本發(fā)明并不限于以〃"或〃 I "來做為用以分隔的特殊字符。另一方面,在本發(fā)明的實(shí)施例中,標(biāo)題欄304中的各分欄308可具有固定位數(shù),例如各分欄308的固定位數(shù)可以是32個(gè)字符,而其中的指引欄310的固定位數(shù)可以是7或8個(gè)位(最多用來指引128或256種不同的指引數(shù)據(jù)),此外,因第一特殊字符與第二特殊字符所需要的位數(shù)可以是固定的,所以分欄308的固定位數(shù)在扣除指引欄310、第一特殊字符、第二特殊字符所占去的位數(shù)后,剩下的位數(shù)便可悉數(shù)用來儲(chǔ)存數(shù)值欄312的數(shù)值數(shù)據(jù)。再者,由于分欄308的位數(shù)固定,加上分欄308儲(chǔ)存數(shù)據(jù)的內(nèi)容可如圖3A所示依序?yàn)橹敢龣?10(指引數(shù)據(jù)的 指標(biāo))、第一特殊字符、數(shù)值欄312的數(shù)值數(shù)據(jù)、第二特殊字符,而且如前所述,這四個(gè)數(shù)據(jù)的位數(shù)量也是固定的,于是在實(shí)作上可跳過指引欄310的位(例如跳過前7或8個(gè)位)、以及第二特殊字符的位數(shù)(例如再跳過I個(gè)字符,亦即8個(gè)位)后,再扣掉第一特殊字符所占的位數(shù)(例如最后I個(gè)字符、8個(gè)位)之后,最后便可直接取得數(shù)值欄312的數(shù)值數(shù)據(jù)(例如在記錄I的第一個(gè)分欄308中直接取出數(shù)值數(shù)據(jù)“劉德華”),接著再進(jìn)行所需的領(lǐng)域種類判斷即可。于是,在目前所取出的數(shù)值數(shù)據(jù)比對(duì)完畢后(不論是否比對(duì)成功與否),可以再依據(jù)上述取出數(shù)值數(shù)據(jù)的方式取出下一個(gè)分欄308的數(shù)值數(shù)據(jù)(例如在記錄I的第二個(gè)分欄308中直接取出數(shù)值數(shù)據(jù)“一起走過的日子”),來進(jìn)行比對(duì)領(lǐng)域種類的比對(duì)。上述取出數(shù)值數(shù)據(jù)的方式可以從記錄I開始進(jìn)行比對(duì),并在比對(duì)完記錄I所有的數(shù)值數(shù)據(jù)后,再取出記錄2的標(biāo)題欄308中第一個(gè)分欄308的數(shù)值數(shù)據(jù)(例如“馮小剛”)進(jìn)行比對(duì)。上述比對(duì)程序?qū)⒊掷m(xù)進(jìn)行,直到所有記錄的數(shù)值數(shù)據(jù)都被比對(duì)過為止。應(yīng)注意的是,上述的分欄308的位數(shù)、以及指引欄310、第一特殊字符、第二特殊字符個(gè)使用的位數(shù)可依實(shí)際應(yīng)用改變,本發(fā)明對(duì)此并未加以限制。前述利用比對(duì)來取出數(shù)值數(shù)據(jù)的方式只是一種實(shí)施例,但非用以限定本發(fā)明,另一實(shí)施例可以使用全文檢索的方式來進(jìn)行。此外,上述跳過指引欄310、第二特殊字符、第一特殊字符的實(shí)作方式,可以使用位平移(例如除法)來達(dá)成,此部分的實(shí)施可以用硬件、軟件、或兩者搭配的方式進(jìn)行,本領(lǐng)域技術(shù)人員可依計(jì)實(shí)際需求而變更。在本發(fā)明的另一實(shí)施例中,標(biāo)題欄304中的各分欄308可具有固定位數(shù),分欄308中的指引欄310可具有另一固定位數(shù),并且標(biāo)題欄304中可不包括第一特殊字符以及第二特殊字符,由于各分欄308以及各指引欄310的位數(shù)為固定,所以可利用跳過特定位數(shù)的方式或是使用位平移(例如除法)的方式來直接取出各分欄308中的指引數(shù)據(jù)或數(shù)值數(shù)據(jù)。應(yīng)注意的是,由于前面已提到分欄308具有一定的位數(shù),所以可以在自然語言理解系統(tǒng)100中(或是包含自然語言理解系統(tǒng)100的伺服器中)使用計(jì)數(shù)器來記錄目前所比對(duì)的是某一記錄的某分欄308。此外,比對(duì)的記錄亦可使用另一計(jì)數(shù)器來儲(chǔ)存其順序。舉例來說,當(dāng)分別使用一第一計(jì)數(shù)器記錄來表示目前所比對(duì)的記錄順序、并使用一第二計(jì)數(shù)器來表示目前所比對(duì)的分欄順序時(shí),若目前比對(duì)的是圖3A的記錄2的第3個(gè)分欄308 (亦即比對(duì)“fiIenameguid:華誼兄”)時(shí),第一計(jì)數(shù)器所儲(chǔ)存的數(shù)值將是2 (表示目前比對(duì)的是記錄2),第二計(jì)數(shù)器所儲(chǔ)存的數(shù)值則為3 (表示目前比對(duì)的是第3個(gè)分欄308)。再者,上述僅以7或8個(gè)位儲(chǔ)存指引欄310的指引數(shù)據(jù)的方式,系希望將分欄308的大多數(shù)位都用來儲(chǔ)存數(shù)值數(shù)據(jù),而實(shí)際的指引數(shù)據(jù)則可通過這7、8個(gè)位當(dāng)作指標(biāo),再據(jù)以從檢索系統(tǒng)220所儲(chǔ)存的指引數(shù)據(jù)表格280中讀取實(shí)際的指引數(shù)據(jù)。于是,在實(shí)際操作時(shí),除了可直接取出數(shù)值數(shù)據(jù)進(jìn)行比對(duì)之外,亦可在產(chǎn)生匹配結(jié)果時(shí),直接依據(jù)上述兩個(gè)計(jì)數(shù)器的數(shù)值,直接取出指引數(shù)據(jù)作為回應(yīng)結(jié)果110送給知識(shí)輔助理解模塊400。舉例來說,當(dāng)記錄6的第2個(gè)分欄308 (亦即“songnameguid:背叛”)匹配成功時(shí),將得知目前的第一計(jì)數(shù)器/第二計(jì)數(shù)器的數(shù)值分別為6與2,因此可以依據(jù)這兩個(gè)數(shù)值前往儲(chǔ)存圖3C所示的指引數(shù)據(jù)儲(chǔ)存表格280,由記錄6的分欄2查詢出指引數(shù)據(jù)為“songnameguid”。在一實(shí)施例中,可以將分欄308的位樹固定后,再將分欄308的所有位都用來儲(chǔ)存數(shù)值數(shù)據(jù),于是可以完全除去指引欄、第一特殊字符、第二特殊字符,而搜尋引擎240只要知道每越過固定位數(shù)就是另一個(gè)分欄308,并在第二計(jì)數(shù)器中加一即可(當(dāng)然,每換下一個(gè)記錄進(jìn)行檢索時(shí)亦需將第一計(jì)數(shù)器的儲(chǔ)存值加一),這樣可以提供更多的位數(shù)來儲(chǔ)存數(shù)值數(shù)據(jù)。再舉一個(gè)實(shí)例來說明比對(duì)產(chǎn)生匹配結(jié)果時(shí),回傳匹配記錄110至知識(shí)輔助理解模塊400做進(jìn)一步處理的過程。對(duì)應(yīng)于上述記錄302的數(shù)據(jù)結(jié)構(gòu),在本發(fā)明的實(shí)施例中,當(dāng)用戶的請(qǐng)求信息102為〃我要看讓子彈飛〃時(shí),可產(chǎn)生出兩個(gè)可能意圖語法數(shù)據(jù)106:〃〈readbook>,〈bookname〉=讓子彈飛〃;與〃〈watchfilm>,〈filmname〉=讓子彈飛";搜尋引擎240便藉由檢索接口單元260所接收的關(guān)鍵字108〃讓子彈飛〃來對(duì)圖3A的結(jié)構(gòu)化數(shù)據(jù)庫220所儲(chǔ)存的記錄的標(biāo)題欄304進(jìn)行全文檢索。全文檢索中,在標(biāo)題欄304中找到了儲(chǔ)存有數(shù)值數(shù)據(jù)〃讓子彈飛〃的記錄5,因此產(chǎn)生了匹配結(jié)果。接下來,檢索系統(tǒng)200將回傳記錄5標(biāo)題欄304中,對(duì)應(yīng)于關(guān)鍵字108“讓子彈飛”的指引數(shù)據(jù)“filmnameguid”作為匹配記錄Iio并回傳至知識(shí)輔助理解模塊400。由于在記錄5的標(biāo)題欄中,包含對(duì)應(yīng)數(shù)值數(shù)據(jù)〃讓子彈飛〃的指引數(shù)據(jù)"filmnameguid〃,所以知識(shí)輔助理解模塊400藉由比對(duì)記錄5的指引數(shù)據(jù)"filmnameguid"與上述可能意圖語法數(shù)據(jù)106先前已儲(chǔ)存的意圖數(shù)據(jù)112〃〈watchfilm>〃或〃〈readbook>〃,便能判斷出此次請(qǐng)求信息的確定意圖語法數(shù)據(jù)114為〃〈watchfilm>,〈filmname〉=讓子彈飛〃(因?yàn)槎及癴ilm”在其中)。換句話說,此次用戶的請(qǐng)求信息102中所描述數(shù)據(jù)"讓子彈飛"是電影名稱,而數(shù)據(jù)用戶的請(qǐng)求信息102的意圖為看電影〃讓子彈飛〃,而非閱讀書籍。
再舉一個(gè)實(shí)例作更進(jìn)一步的說明。當(dāng)用戶的請(qǐng)求信息102為〃我想聽一起走過的日子〃時(shí),可產(chǎn)生出兩個(gè)可能意圖語法數(shù)據(jù)106://<playmusic>, <singer>= 一起走過,<songname>=日子";與〃〈playmusic>,〈songname〉= 一起走過的日子";搜尋引擎240便藉由檢索接口單元260所接收的兩組關(guān)鍵字108:〃 一起走過〃與〃日子〃;以及〃一起走過的日子〃來對(duì)圖3A的結(jié)構(gòu)化數(shù)據(jù)庫220所儲(chǔ)存的記錄的標(biāo)題欄304進(jìn)行全文檢索。由于全文檢索中,并未在所有記錄的標(biāo)題欄304中找到對(duì)應(yīng)于第一組關(guān)鍵字108" —起走過〃與〃日子〃的匹配結(jié)果,而是找到了對(duì)應(yīng)于第二組關(guān)鍵字108〃 一起走過的日子〃的記錄1,于是檢索系統(tǒng)200將記錄I標(biāo)題欄304中對(duì)應(yīng)于第二組關(guān)鍵字108的指引數(shù)據(jù)"songnameguid",作為匹配記錄110且回傳至知識(shí)輔助理解模塊400。接下來,知識(shí)輔助理解模塊400在接收對(duì)應(yīng)數(shù)值數(shù)據(jù)〃 一起走過的日子〃的指引數(shù)據(jù)"songnameguid"后,便與可能意圖語法數(shù)據(jù)106 (亦即〃〈playmusic>,〈singer〉= 一起走過,〈songname〉=日子"與"〈playmusic〉,〈songname〉= 一起走過的日子〃)中的意圖數(shù)據(jù)112 (亦即〈singer〉、〈songname〉等)進(jìn)行比對(duì),于是便發(fā)現(xiàn)此次用戶的請(qǐng)求信息102中并未描述有歌手名稱的數(shù)據(jù),而是描述有歌曲名稱為〃 一起走過的日子〃的數(shù)據(jù)(因?yàn)橹挥小磗ongname〉比對(duì)成功)。所以,知識(shí)輔助理解模塊400可藉由上述比對(duì)而判斷出此次請(qǐng)求信息102的確定意圖語法數(shù)據(jù)114為〃〈playmusic>,〈songname〉= 一起走過的日子〃,而用戶的請(qǐng)求信息102的意圖為聽歌曲〃 一起走過的日子"。在本發(fā)明的另一實(shí)施例中,檢索而得的匹配記錄110可以是與關(guān)鍵字108完全匹配的全匹配記錄、或是與關(guān)鍵字108部分匹配的部分匹配記錄。舉例來說,如果用戶的請(qǐng)求信息102為〃我想聽蕭敬騰的背叛〃,同樣地,自然語言處理器300經(jīng)過分析后,產(chǎn)生出兩個(gè)可能意圖語法數(shù)據(jù)106:〃〈playmusic>,〈singer〉=蕭敬騰,〈songname〉=背叛〃;及〃〈playmusic>,〈songname〉=蕭敬騰的背叛”;并傳送兩組關(guān)鍵字108:〃蕭敬騰〃與〃背叛〃;以及〃蕭敬騰的背叛〃;給檢索接口單元260,搜尋引擎240接著藉由檢索接口單元260所接收的關(guān)鍵字108來對(duì)圖3A的結(jié)構(gòu)化數(shù)據(jù)庫220所儲(chǔ)存的記錄302的標(biāo)題欄304進(jìn)行全文檢索。由于在全文檢索中,對(duì)應(yīng)第二組關(guān)鍵字108"蕭敬騰的背叛〃并未匹配到任何記錄,但是對(duì)應(yīng)第一組關(guān)鍵字108〃蕭敬騰〃與〃背叛〃找到了記錄6與記錄7的匹配結(jié)果。由于第二組關(guān)鍵字108"蕭敬騰〃與〃背叛〃僅與記錄6中的數(shù)值數(shù)據(jù)〃蕭敬騰相匹配,而未匹配到其他數(shù)值數(shù)據(jù)〃楊宗緯〃及〃曹格〃,因此記錄6為部分匹配記錄(請(qǐng)注意上述對(duì)應(yīng)請(qǐng)求信息102〃我要看讓子彈飛〃的記錄5以及對(duì)應(yīng)請(qǐng)求信息〃我想聽一起走過的日子〃的記錄I皆為部分匹配記錄),而關(guān)鍵字〃蕭敬騰〃與〃背叛〃完全匹配了記錄7的數(shù)值數(shù)據(jù)(因?yàn)榈诙M關(guān)鍵字108〃蕭敬騰〃與〃背叛〃皆匹配成功),所以記錄7為完全匹配記錄。在本發(fā)明的實(shí)施例中,當(dāng)該檢索接口單元260輸出多個(gè)匹配記錄110至知識(shí)輔助理解模塊400時(shí),可依序輸出全匹配記錄(亦即全部的數(shù)值數(shù)據(jù)都被匹配)及部分匹配記錄(亦即僅有部分的數(shù)值數(shù)據(jù)被匹配)的匹配記錄110,其中全匹配記錄的優(yōu)先順序大于部分匹配記錄的優(yōu)先順序。因此,在檢索接口單元260輸出記錄6與記錄7的匹配記錄110時(shí),記錄7的輸出優(yōu)先順序會(huì)大于記錄6的輸出優(yōu)先順序,因?yàn)橛涗?全部的數(shù)值數(shù)據(jù)〃蕭敬騰〃與〃背叛〃都產(chǎn)生匹配結(jié)果,但記錄6還包含〃楊宗緯〃與〃曹格〃未產(chǎn)生匹結(jié)果。也就是說,結(jié)構(gòu)化數(shù)據(jù)庫220中所儲(chǔ)存的記錄對(duì)其請(qǐng)求信息102中的關(guān)鍵字108的匹配程度越高,越容易優(yōu)先被輸出,以便用戶進(jìn)行查閱或挑選對(duì)應(yīng)的確定意圖語法數(shù)據(jù)114。在另一實(shí)施例中,可直接輸出優(yōu)先順序最高的記錄所對(duì)應(yīng)的匹配記錄110,做為確定意圖語法數(shù)據(jù)114之用。前述非以限定本發(fā)明,因?yàn)樵诹硪粚?shí)施例中可能采取只要搜尋到有匹配記錄即輸出的方式(例如,以〃我想聽蕭敬騰的背叛〃為請(qǐng)求信息102而言,當(dāng)檢索到記錄6即產(chǎn)生匹配結(jié)果時(shí),即輸出記錄6對(duì)應(yīng)的指引數(shù)據(jù)做匹配記錄110),而沒有包含優(yōu)先順序的排序,以加快檢索的速度。在另一實(shí)施例中,可對(duì)優(yōu)先順序最高的記錄,直接執(zhí)行其對(duì)應(yīng)的處理方式并提供予用戶。例如當(dāng)優(yōu)先順序最高的為播放三國演義的電影時(shí),可直接播放電影與用戶。此外,若優(yōu)先順序最高的為蕭敬騰演唱的背叛時(shí),可直接將此歌曲播放與用戶。應(yīng)注意的是,本發(fā)明在此僅作說明,并非對(duì)此加以限定。在本發(fā)明的再一實(shí)施例中,如果用戶的請(qǐng)求信息102為〃我要聽劉德華的背叛",則其可能意圖語法數(shù)據(jù)106的其中之一為〃〈playmusic>,〈singer〉=劉德華,〈songname〉=背叛”;若檢索接口單元260將關(guān)鍵字108"劉德華〃與〃背叛〃輸入搜尋引擎240,并不會(huì)在圖3的數(shù)據(jù)庫中找到任何的匹配結(jié)果。在本發(fā)明的又一實(shí)施例中,檢索接口單元260可分別將關(guān)鍵字108〃劉德華〃以及〃背叛〃輸入搜尋引擎240,并且分別對(duì)應(yīng)求得〃劉德華〃是歌手名稱(指引數(shù)據(jù)singerguid)以及〃背叛〃是歌曲名稱(指引數(shù)據(jù)songnameguid,且歌手可能是曹格或是蕭敬騰、楊宗緯與曹格合唱)。此時(shí),自然語言理解系統(tǒng)100可進(jìn)一步提醒用戶“背叛這首歌曲是否為蕭敬騰所唱(依據(jù)記錄7的匹配結(jié)果)?”,或者,“是否為蕭敬騰、楊宗緯與曹格所合唱(依據(jù)記錄6的匹配結(jié)果)?”。在本發(fā)明的再一實(shí)施例中,結(jié)構(gòu)化數(shù)據(jù)庫220所儲(chǔ)存記錄可還包括有來源欄314及熱度欄316。如圖3B所示的數(shù)據(jù)庫,其除了圖3A的各項(xiàng)欄位之外,還包含來源欄314及熱度欄316。各記錄的來源欄314用以儲(chǔ)存此記錄是出自哪一個(gè)結(jié)構(gòu)化數(shù)據(jù)庫(在此圖式中僅顯示結(jié)構(gòu)化數(shù)據(jù)庫220,而實(shí)際上可存在更多不同的結(jié)構(gòu)化數(shù)據(jù)庫)、或是哪一個(gè)用戶、伺服器所提供的來源值。并且,自然語言理解系統(tǒng)100可根據(jù)用戶在之前的請(qǐng)求訊息102中所透漏的喜好,來檢索特定來源的結(jié)構(gòu)化數(shù)據(jù)庫(例如以請(qǐng)求信息102中的關(guān)鍵字進(jìn)行全文檢索產(chǎn)生匹配時(shí),便對(duì)該記錄的熱度值加一)。而各記錄302的熱度欄316用以儲(chǔ)存此記錄302的搜尋熱度值或是熱門程度值(例如該記錄在特定時(shí)間里被單一用戶、特定用戶群組、所有用戶的匹配次數(shù)或機(jī)率),以供知識(shí)輔助理解模塊400判斷用戶意圖時(shí)的參考。詳細(xì)而論,當(dāng)用戶的請(qǐng)求信息102為〃我要看三國演義〃時(shí),自然語言處理器300經(jīng)過分析后,可產(chǎn)生出多個(gè)可能意圖語法數(shù)據(jù)106 〃〈readbook>,〈bookname〉=三國演義”;〃〈watchTV>,〈TVname〉=三國演義〃;以及〃〈watchfilm>,〈filmname〉=三國演義"。
若自然語言理解系統(tǒng)100在用戶的請(qǐng)求信息102的歷史記錄中(例如利用通過熱度欄316儲(chǔ)存該筆記錄302被某用戶所點(diǎn)選的次數(shù)),統(tǒng)計(jì)出其大部份的請(qǐng)求為看電影,則自然語言理解系統(tǒng)100可針對(duì)儲(chǔ)存電影記錄的結(jié)構(gòu)化數(shù)據(jù)庫來做檢索(此時(shí)來源欄314中的來源值,是記錄儲(chǔ)存電影記錄的結(jié)構(gòu)化數(shù)據(jù)庫的代碼),從而可優(yōu)先判定〃〈watchfilm>,〈filmname〉=三國演義〃為確定意圖語法數(shù)據(jù)114。舉例來說,在一實(shí)施例中亦可在每個(gè)記錄302被匹配一次,就可在后面的熱度欄316加一,作為用戶的歷史記錄。于是在依據(jù)關(guān)鍵字108 “三國演義”做全文檢索時(shí),可以從所有匹配結(jié)果中挑選熱度欄316中數(shù)值最高的記錄302,作為判斷用戶意圖之用。在一實(shí)施例中,若自然語言理解系統(tǒng)100在關(guān)鍵字108〃三國演義〃的檢索結(jié)果中,判定對(duì)應(yīng)〃三國演義〃這出電視節(jié)目的記錄的熱度欄316所儲(chǔ)存的搜尋熱度值最高,則便可優(yōu)先判定〃〈watchTV>,〈TVname〉=三國演義〃為確定意圖語法數(shù)據(jù)114。此外,上述對(duì)熱度欄316所儲(chǔ)存數(shù)值的變更方式,可通過自然語言理解系統(tǒng)100所在的計(jì)算機(jī)系統(tǒng)進(jìn)行變更,本發(fā)明對(duì)此并不加以限制。此外、熱度欄316的數(shù)值亦可隨時(shí)間遞減,以表示用戶對(duì)某項(xiàng)記錄302的熱度已逐漸降低,本發(fā)明對(duì)這部分亦不加以限制。再舉另一個(gè)實(shí)例來說,在另一實(shí)施例中,由于用戶可能在某段時(shí)間中特別喜歡看三國演義的電視劇,由于電視劇的長度可能很長而用戶無法短時(shí)間看完,因此在短時(shí)間中可能重復(fù)點(diǎn)選(假設(shè)每匹配一次就將熱度欄316內(nèi)的數(shù)值加一的話),因此造成某個(gè)記錄302被重復(fù)匹配,這部分都可通過分析熱度欄316的數(shù)據(jù)而得知。再者,在另一實(shí)施例中,電信業(yè)者也可以利用熱度欄316來表示某一來源所提供數(shù)據(jù)被取用的熱度,而此數(shù)據(jù)供應(yīng)者的編碼可以用來源欄314進(jìn)行儲(chǔ)存。舉例來說,若某位供應(yīng)“三國演義電視劇”的供應(yīng)者的被點(diǎn)選的機(jī)率最高,所以當(dāng)某用戶輸入“我要看三國演義”的請(qǐng)求信息102時(shí),雖然在對(duì)圖3B的數(shù)據(jù)庫進(jìn)行全文檢索時(shí)會(huì)找到閱讀三國演義的書籍(記錄8)、觀看三國演義電視劇(記錄9)、觀看三國演義電影(記錄10)三個(gè)匹配結(jié)果,但由于熱度欄316中的數(shù)據(jù)顯示觀看三國演義電視劇是現(xiàn)在最熱門的選項(xiàng)(亦即記錄8、9、10的熱度欄的數(shù)值分別為2、5、8),所以將先提供記錄10的指引數(shù)據(jù)做匹配記錄110輸出至知識(shí)輔助理解系統(tǒng)400,作為判定用戶意圖的最優(yōu)先選項(xiàng)。在一實(shí)施例中,可同時(shí)將來源欄314的數(shù)據(jù)顯示給用戶,讓用戶判斷他所想要觀看的電視劇是否為某位供應(yīng)者所提供。應(yīng)注意的是,上述對(duì)來源欄314所儲(chǔ)存數(shù)據(jù)以及其變更方式,亦可通過自然語言理解系統(tǒng)100所在的計(jì)算機(jī)系統(tǒng)進(jìn)行變更,本發(fā)明對(duì)此并不加以限制。明顯的,本發(fā)明所揭示的結(jié)構(gòu)化數(shù)據(jù)庫中的每個(gè)記錄內(nèi)部所包含的數(shù)值數(shù)據(jù)相互間具有關(guān)聯(lián)性(例如記錄I中的數(shù)值數(shù)據(jù)“劉德華”、“一起走過的日子”、“港臺(tái),粵語,流行”都是用來描述記錄I的特征),且這些數(shù)值數(shù)據(jù)共同用以表達(dá)來自用戶的請(qǐng)求信息對(duì)該記錄的意圖(例如對(duì)“一起走過的日子”產(chǎn)生匹配結(jié)果時(shí),表示用戶的意圖可能是對(duì)記錄I的數(shù)據(jù)存取),于是在搜尋引擎對(duì)結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行全文檢索時(shí),可在記錄的數(shù)值數(shù)據(jù)被匹配時(shí),輸出對(duì)應(yīng)于該數(shù)值數(shù)據(jù)的指引數(shù)據(jù)(例如輸出“songnameguid”作為回應(yīng)結(jié)果110),進(jìn)而確認(rèn)該請(qǐng)求信息的意圖(例如在知識(shí)輔助理解模塊中進(jìn)行比對(duì))?;谏鲜鍪痉缎詫?shí)施例所揭示或教示的內(nèi)容,圖4A為根據(jù)本發(fā)明的一實(shí)施例的檢索方法的流程圖。請(qǐng)參閱圖4,本發(fā)明的實(shí)施例的檢索方法包括以下步驟提供結(jié)構(gòu)化數(shù)據(jù)庫,且結(jié)構(gòu)化數(shù)據(jù)庫儲(chǔ)存多個(gè)記錄(步驟S410);
接收至少一關(guān)鍵字(步驟S420);藉由關(guān)鍵字來對(duì)多個(gè)記錄的標(biāo)題欄進(jìn)行全文檢索(步驟S430)。舉例來說,將關(guān)鍵字108輸入檢索接口單元260來讓搜尋引擎240對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220所儲(chǔ)存的多個(gè)記錄302的標(biāo)題欄304進(jìn)行全文檢索,至于檢索方式可如對(duì)圖3A或圖3B所進(jìn)行的檢索方式、或是不變更其精神的方式來進(jìn)行;判斷全文檢索是否有匹配結(jié)果(步驟S440)。舉例來說,藉由搜尋引擎240來判斷此關(guān)鍵字108所對(duì)應(yīng)的全文檢索是否有匹配結(jié)果;以及若有匹配結(jié)果,依序輸出全匹配記錄及部分匹配記錄(步驟S450)。舉例來說,若結(jié)構(gòu)化數(shù)據(jù)庫220中有記錄匹配此關(guān)鍵字108,則檢索接口單元260依序輸出匹配此關(guān)鍵字108的全匹配記錄及部分匹配記錄中的指引數(shù)據(jù)(可通過對(duì)圖3C的指引數(shù)據(jù)儲(chǔ)存表格280而取得)作為匹配記錄Iio送往知識(shí)輔助理解系統(tǒng)400,其中全匹配記錄的優(yōu)先順序大于部分匹配記錄的優(yōu)先順序。前述的流程步驟非以限定本發(fā)明,有些步驟是可以忽略或移除,例如,在本發(fā)明的另一實(shí)施例中,可藉由位于檢索系統(tǒng)200外的匹配判斷模塊(未繪示于圖中)來執(zhí)行步驟S440 ;或是在本發(fā)明的另一實(shí)施例中,可忽略上述步驟S450,其依序輸出全匹配記錄及部分匹配記錄的動(dòng)作可以藉由位于檢索系統(tǒng)200外的匹配結(jié)果輸出模塊(未繪示于圖中),來執(zhí)行步驟S450中依序輸出全匹配記錄及部分匹配記錄的動(dòng)作?;谏鲜鍪痉缎詫?shí)施例所揭示或教示的內(nèi)容,圖4B為根據(jù)本發(fā)明的另一實(shí)施例的自然語言理解系統(tǒng)100工作過程的流程圖。請(qǐng)參閱圖4B,本發(fā)明的另一實(shí)施例的自然語言理解系統(tǒng)100工作過程包括以下步驟接收請(qǐng)求信息(步驟S510)。舉例來說,用戶將具有語音內(nèi)容或文字內(nèi)容的請(qǐng)求信息102傳送至自然語言理解系統(tǒng)100 ;提供結(jié)構(gòu)化數(shù)據(jù)庫,且結(jié)構(gòu)化數(shù)據(jù)庫儲(chǔ)存多個(gè)記錄(步驟S520);將請(qǐng)求信息語法化(步驟S530)。舉例來說,自然語言處理器300分析用戶的請(qǐng)求信息102后,進(jìn)而轉(zhuǎn)為對(duì)應(yīng)的可能意圖語法數(shù)據(jù)106 ;辨別關(guān)鍵字的可能屬性(步驟S540)。舉例來說,知識(shí)輔助理解模塊400辨別出可能意圖語法數(shù)據(jù)106中的至少一關(guān)鍵字108的可能屬性,例如,關(guān)鍵字108〃三國演義〃可能是書、電影及電視節(jié)目;藉由關(guān)鍵字108來對(duì)多個(gè)記錄的標(biāo)題欄304進(jìn)行全文檢索(步驟S550)。舉例來說,將關(guān)鍵字108輸入檢索接口單元260來讓搜尋引擎240對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220所儲(chǔ)存的多個(gè)記錄的標(biāo)題欄304進(jìn)行全文檢索;判斷全文檢索是否有匹配結(jié)果(步驟S560)。舉例來說,藉由搜尋引擎240來判斷此關(guān)鍵字108所對(duì)應(yīng)的全文檢索是否有匹配結(jié)果;若有匹配結(jié)果,依序輸出全匹配記錄及部分匹配記錄(步驟S570)所對(duì)應(yīng)的指引數(shù)據(jù)為匹配記錄110。舉例來說,若結(jié)構(gòu)化數(shù)據(jù)庫220中有記錄匹配此關(guān)鍵字108,則檢索接口單元260依序輸出匹配此關(guān)鍵字108的全匹配記錄及部分匹配記錄所對(duì)應(yīng)的指引數(shù)據(jù)為匹配記錄110,其中全匹配記錄的優(yōu)先順序大于部分匹配記錄的優(yōu)先順序;以及依序輸出對(duì)應(yīng)的確定意圖語法數(shù)據(jù)(步驟S580)。舉例來說,知識(shí)輔助理解模塊400藉由依序輸出的全匹配記錄及部分匹配記錄,藉以輸出對(duì)應(yīng)的確定意圖語法數(shù)據(jù)114。前述的流程步驟非以限定本發(fā)明,有些步驟是可以忽略或移除。綜上所述,本發(fā)明藉由取出用戶的請(qǐng)求信息所包括的關(guān)鍵字,并且針對(duì)結(jié)構(gòu)化數(shù)據(jù)庫中的具有數(shù)據(jù)結(jié)構(gòu)的記錄的標(biāo)題欄來進(jìn)行全文檢索,若產(chǎn)生匹配結(jié)果,便可判斷出關(guān)鍵字所屬的領(lǐng)域種類,藉以確定用戶在請(qǐng)求信息所表示的意圖。接下來針對(duì)以上結(jié)構(gòu)化數(shù)據(jù)庫在語音識(shí)別上的應(yīng)用做更多的說明。首先針對(duì)在自然語言對(duì)話系統(tǒng)中,根據(jù)用戶的語音輸入來修正錯(cuò)誤的語音應(yīng)答,并進(jìn)一步找出其他可能的答案來回報(bào)給用戶的應(yīng)用做說明。雖然現(xiàn)今的移動(dòng)通訊裝置已可提供自然語言對(duì)話功能,以讓用戶發(fā)出語音來和移動(dòng)通訊裝置溝通。然而在目前的語音對(duì)話系統(tǒng),當(dāng)用戶的語音輸入不明確時(shí),由于同一句語音輸入可能意指多個(gè)不同的意圖或目的,故系統(tǒng)容易會(huì)輸出不符合語音輸入的語音應(yīng)答。因此在很多對(duì)話情境中,用戶難以得到符合其意圖的語音應(yīng)答。為此,本發(fā)明提出一種修正語音應(yīng)答的方法以及自然語言對(duì)話系統(tǒng),其中自然語言對(duì)話系統(tǒng)可根據(jù)用戶的語音輸入來修至錯(cuò)誤的語音應(yīng)答,并進(jìn)一步找出其他可能的答案來回報(bào)給用戶。為了使本發(fā)明的內(nèi)容更為明了,以下特舉實(shí)施例作為本發(fā)明確實(shí)能夠據(jù)以實(shí)施的范例。圖5A是依照本發(fā)明一實(shí)施例所繪示的自然語言對(duì)話系統(tǒng)的方塊圖。請(qǐng)參照?qǐng)D5A,自然語言對(duì)話系統(tǒng)500包括語音取樣模塊510、自然語言理解模塊520、以及語音合成數(shù)據(jù)庫530。在一實(shí)施例中,語音取樣模塊510用以接收語音輸入501 (例如來自用戶的語音),隨后對(duì)其進(jìn)行解析而產(chǎn)生解析結(jié)果503,而自然語言理解模塊520會(huì)對(duì)解析結(jié)果503進(jìn)行解析而取得其中的請(qǐng)求信息505,并在找到符合請(qǐng)求信息505的答案后,依據(jù)此答案通過對(duì)語音合成數(shù)據(jù)庫130進(jìn)行對(duì)應(yīng)的語音查詢,再輸出所查詢的語音作為對(duì)應(yīng)于語音輸入501的語音應(yīng)答507予用戶。其中,倘若自然語言理解模塊520所作出的語音應(yīng)答505不符合語音輸入501中的請(qǐng)求信息505時(shí)(例如用戶輸入另一個(gè)語音輸入指示此事),自然語言理解模塊520會(huì)修正原本的答案,并輸出另一個(gè)語音應(yīng)答507予用戶。前述自然語言對(duì)話系統(tǒng)500中的各構(gòu)件可配置在同一機(jī)器中。舉例而言,語音取樣模塊510與自然語言理解模塊520例如是配置于同一電子裝置。其中,電子裝置可以是移動(dòng)電話(Cell phone)、個(gè)人數(shù)位助理(Personal Digital Assistant, PDA)手機(jī)、智能型手機(jī)(Smart phone)等移動(dòng)通訊裝置、掌上型計(jì)算機(jī)(Pocket PC)、平板型計(jì)算機(jī)(TabletPC)、筆記型計(jì)算機(jī)、個(gè)人計(jì)算機(jī)、或是其他具備通訊功能或安裝有通訊軟件的電子裝置,在此并不限制其范圍。此外,上述電子裝置可使用Android操作系統(tǒng)、Microsoft操作系統(tǒng)、Android操作系統(tǒng)、Linux操作系統(tǒng)等等,不限于此。當(dāng)然,前述自然語言對(duì)話系統(tǒng)500中的各構(gòu)件也不一定需設(shè)置在同一機(jī)器中,而可分散在不同裝置或系統(tǒng)并通過各種不同的通訊協(xié)定來連結(jié)。舉例而言,自然語言理解模塊520可以位于云端伺服器中,也可以位于區(qū)域網(wǎng)路中的伺服器。此外,自然語言理解模塊520中的各構(gòu)件也可分散在不同的機(jī)器,例如自然語言理解模塊520中的各構(gòu)件可位于與語音取樣模塊510相同或不同的機(jī)器。在本實(shí)施例中,語音取樣模塊510用以接收語音輸入,此語音取樣模塊510可以為麥克風(fēng)(Microphone)等接收音訊的裝置,而語音輸入501可以是來自用戶的語音。自然語言理解模塊520會(huì)接收從語音取樣模塊510傳來的語音輸入501,以對(duì)語音輸入501進(jìn)行解析而產(chǎn)生解析結(jié)果503。并且,自然語言理解模塊120會(huì)根據(jù)解析結(jié)果503中的一個(gè)或多個(gè)特征語義505 (例如圖1A中所提到的關(guān)鍵字108等)來產(chǎn)生至少一個(gè)包含至少一個(gè)候選答案的候選列表111,然后再從這些候選答案中找出較符合特征語義109的答案,進(jìn)而輸出語音應(yīng)答107予用戶。由于語音應(yīng)答105輸出與用戶后,他/她可能認(rèn)為目前所新的答案的不符合他的需求、或者需要再輸入更多的選擇(例如語音應(yīng)答105輸出的是多個(gè)選項(xiàng)要求用戶駔進(jìn)一步選擇)…等,所以用戶會(huì)再輸入另一個(gè)語音。是以,如果用戶輸入另一個(gè)語音的話,自然語言理解模塊520會(huì)接著依據(jù)用戶所輸入的另一個(gè)語音輸入501判斷先前所輸出的語音應(yīng)答507是否正確;若為否,則自然語言理解模塊520還會(huì)從上述候選列表511中找出另一個(gè)候選答案,并據(jù)以產(chǎn)生新的語音應(yīng)答507提供予用戶。這部分的細(xì)節(jié)將通過圖5B做更進(jìn)一步的描述。此外,本實(shí)施例的自然語言理解模塊520可由一個(gè)或數(shù)個(gè)邏輯門組合而成的硬件電路來實(shí)作?;蛘?,在本發(fā)明另一實(shí)施例中,自然語言理解模塊520可以通過計(jì)算機(jī)程序碼來實(shí)作。舉例來說,自然語言理解模塊520例如是由程序語言所撰寫的程序碼片段來實(shí)作于應(yīng)用程序、操作系統(tǒng)或驅(qū)動(dòng)程序等,而這些程序碼片段儲(chǔ)存在儲(chǔ)存單元中,并藉由處理單元來執(zhí)行。為了使本領(lǐng)域的技術(shù)人員進(jìn)一步了解本實(shí)施例的自然語言理解模塊520,底下舉實(shí)例來進(jìn)行說明。然,本發(fā)明在此僅為舉例說明,并不以此為限,例如運(yùn)用硬件、軟件、固件、或是此三種實(shí)施方式的混合搭配等方式,皆可運(yùn)用來實(shí)施本發(fā)明。圖5B是依照本發(fā)明一實(shí)施例所繪示的自然語言理解模塊520的方塊圖。請(qǐng)參照?qǐng)D5B,本實(shí)施例的自然語言理解模塊520可包括語音識(shí)別模塊522、自然語言處理模塊524以及語音合成模塊526。其中,語音識(shí)別模塊522會(huì)接收從語音取樣模塊510傳來的對(duì)語音輸入501進(jìn)行解析的解析結(jié)果503,并轉(zhuǎn)換成一個(gè)或多個(gè)特征語義509(例如圖1A的關(guān)鍵字108或字句等)。自然語言處理 模塊524則可再對(duì)這些特征語義509進(jìn)行解析,而獲得至少一個(gè)候選列表511 (例如通過圖1A的檢索系統(tǒng)200對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索,并在取得回應(yīng)110且對(duì)意圖數(shù)據(jù)112比對(duì)后產(chǎn)生確定意圖語法數(shù)據(jù)114,最后由分析結(jié)果輸出模塊116所送出的分析結(jié)果104),并且會(huì)從候選列表511中選出一個(gè)較符合語音輸入501的答案以做為回報(bào)答案(例如挑選全匹配記錄…等)。由于此回報(bào)答案是自然語言理解模塊520在內(nèi)部分析而得的答案,所以還必須將轉(zhuǎn)換成語音輸出才能輸出予用戶,于是語音合成模塊526會(huì)依據(jù)回報(bào)答案來查詢語音合成數(shù)據(jù)庫530,而此語音合成數(shù)據(jù)庫530例如是記錄有文字以及其對(duì)應(yīng)的語音信息,可使得語音合成模塊526能夠找出對(duì)應(yīng)于回報(bào)答案的語音,藉以合成出第一語音應(yīng)答507。之后,語音合成模塊126可將合成的語音通過語音輸出接口(未繪示),其中語音輸出接口例如為喇叭、揚(yáng)聲器、或耳機(jī)等裝置輸出,藉以輸出語音予用戶。舉例來說,若用戶輸入的是“我要看三國演義”的語音輸入501話,語音識(shí)別模塊522會(huì)接收從語音取樣模塊510傳來的對(duì)語音輸入501進(jìn)行解析的解析結(jié)果503,然后轉(zhuǎn)換成例如是包含關(guān)鍵字108 “三國演義”的特征語義509。自然語言處理模塊524則可再對(duì)這個(gè)特征語義509 “三國演義”進(jìn)行解析,例如通過圖1A的檢索系統(tǒng)200對(duì)結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索,并在取得回應(yīng)110且對(duì)意圖數(shù)據(jù)112比對(duì)后產(chǎn)生確定意圖語法數(shù)據(jù)114,最后由分析結(jié)果輸出模塊116所送出的分析結(jié)果104,而產(chǎn)生包含“三國演義“的三個(gè)意圖選項(xiàng)的候選答案,并將其整合成一候選列表511 (亦即包含“看書”、“看電視劇”、以及“看電影”三個(gè)選項(xiàng)),接著再從候選列表511的這三個(gè)意圖選項(xiàng)中選出一個(gè)熱度欄最高的答案(例如挑選圖1A的記錄10)做為回報(bào)答案。在一實(shí)施例中,可以直接執(zhí)行熱度欄最高者的所對(duì)應(yīng)的方式,例如直接播放蕭敬騰所演唱的“背叛”予用戶,本發(fā)明并不對(duì)此加以限制。此外,自然語言處理模塊524還可藉由解析后續(xù)所接收的另一個(gè)語音輸入501 (因?yàn)榕c先前的語音輸入501運(yùn)用同樣的方式饋入語音取樣模塊510),而判斷前次的回報(bào)答案是否正確,此語音是用戶針對(duì)先前提供予用戶的語音應(yīng)答507所做的回應(yīng),其包含用戶認(rèn)為先前的語音應(yīng)答507正確與否的信息。倘若上述回報(bào)答案表示用戶認(rèn)為回報(bào)答案(亦即先前通過語音應(yīng)答507傳達(dá)給用戶者)不正確,自然語言處理模塊524還會(huì)選擇上述候選列表511中的其他答案,并依據(jù)所選擇的結(jié)果,通過語音合成模塊526產(chǎn)生第二語音應(yīng)答507 (因?yàn)橐餐瑯油ㄟ^先前傳送語音應(yīng)答507的方式播放予用戶)。接著,語音合成模塊526可將合成的第二語音應(yīng)答507亦通過語音輸出接口輸出予用戶。延續(xù)先前用戶輸入“我要看三國演義”的例子來說,若用戶想要看三國演義的電視劇,所以先前輸出與用戶的圖1A記錄10的選項(xiàng)(因?yàn)槭强础叭龂萘x”的電影)就不是用戶想要的,所以用戶可能輸入“我要看三國演義電視劇”、或是“我不要看三國演義電影”…等作為第二語音輸入501。于是第二語音輸入501將在解析而取得其請(qǐng)求信息505 (或是特征語義509)后,輸出“我現(xiàn)在為您播放三國演義電視劇”的第二語音應(yīng)答507 (如果用戶想觀看三國演義電視劇)、或是輸出“您想要的是哪個(gè)選項(xiàng)”(如果用戶只否定目前選項(xiàng))的第二語音應(yīng)答507,并搭配候選列表511其他的選項(xiàng)供用戶選取。此外,在一實(shí)施例中,先前的語音應(yīng)答507所輸出的是候選列表111的某個(gè)選項(xiàng)給用戶供其判定是否其所想要的信息時(shí),此時(shí)用戶將輸入此判定的“肯`定“或“否定”的請(qǐng)求信息505。例如“請(qǐng)播放電影”、“這不是我要的東西”…等訊息。于是第二語音輸入501將在解析而取得其請(qǐng)求信息505后,輸出“我現(xiàn)在為您播放三國演義電影”的第二語音應(yīng)答507 (如果用戶想觀看三國演義電影)、或是輸出“您想要的是哪個(gè)選項(xiàng)”(如果用戶只否定目前選項(xiàng))的第二語音應(yīng)答507,并搭配輸出候選列表511其他的選項(xiàng)供用戶選取。再者,在另一實(shí)施例中,若是依照優(yōu)先順序(例如全匹配、部分匹配…)顯示候選列表511與用戶時(shí),用戶所輸入的第二語音輸入501可能包含“選擇”的訊息。例如顯示“觀看三國演義書籍”、“觀看三國演義電視劇”、以及“觀看三國演義電影”三個(gè)選項(xiàng)給用戶做選擇時(shí),用戶可能輸入“我要看電影”、或是“我要第三個(gè)選項(xiàng)”…等第二語音輸入時(shí),將在分析第二語音輸入501的請(qǐng)求信息505并發(fā)現(xiàn)用戶的意圖后(例如選擇觀看電影),于是第二語音輸入501將在解析而取得其請(qǐng)求信息505后,輸出“我現(xiàn)在為您播放三國演義電影”的第二語音應(yīng)答507 (如果用戶想觀看三國演義電影)然后直接播放電影予用戶、或是輸出“您想要的是閱讀三國演義書籍”(如果所選擇的是看書)的第二語音應(yīng)答507,并搭配顯示三國演義的電子書予用戶的動(dòng)作。在本實(shí)施例中,前述自然語言理解模塊520中的語音識(shí)別模塊522、自然語言處理模塊524以及語音合成模塊526可與語音取樣模塊510配置在同一機(jī)器中。在其他實(shí)施例中,語音識(shí)別模塊522、自然語言處理模塊524以及語音合成模塊526亦可分散在不同的機(jī)器(例如計(jì)算機(jī)系統(tǒng)、伺服器或類似裝置/系統(tǒng))中。例如圖5C所示的自然語言理解模塊520’,語音合成模塊526可與語音取樣模塊510配置在同一機(jī)器502,而語音識(shí)別模塊522、自然語言處理模塊524可配置在另一機(jī)器。以下即搭配上述搭配圖5A的自然語言對(duì)話系統(tǒng)500來說明修正語音應(yīng)答507的方法。圖6是依照本發(fā)明一實(shí)施例所繪示的修正語音應(yīng)答507的方法流程圖。在本實(shí)施例中的修正語音應(yīng)答507的方法中,當(dāng)用戶認(rèn)為目前所播放的語音應(yīng)答507不符合其先前所輸入的請(qǐng)求信息505時(shí),會(huì)再輸入另一個(gè)語音輸入501并饋入語音取樣模塊510,隨后再由自然語言理解模塊520分析而得知先前播放予用戶的語音應(yīng)答507并不符合用戶的意圖時(shí),自然語言理解模塊520可再次輸出另一個(gè)語音應(yīng)答507,藉以修正原本的語音應(yīng)答507。為了方便說明,在此僅舉圖5A的自然語言對(duì)話系統(tǒng)500為例,但本實(shí)施例的修正語音應(yīng)答507的方法亦可適用于上述圖5C的自然語言對(duì)話系統(tǒng)500’。請(qǐng)同時(shí)參照?qǐng)D5A及圖6,于步驟S602中,語音取樣模塊510會(huì)接收第一語音輸入(亦同樣通過語音輸入501的方向饋入語音取樣模塊510)。其中,第一語音輸入501例如是來自用戶的語音,且第一語音輸入501還可具有用戶的請(qǐng)求信息105。具體而言,來自用戶的第一語音輸入501可以是詢問句、命令句或其他請(qǐng)求信息505等,例如「我要看三國演義」、「我要聽忘情水的音樂」或「今天溫度幾度」等等。于步驟S604中,自然語言理解模塊520會(huì)解析第一語音輸入501中所包括的至少一個(gè)特征語義509,而獲得候選列表511,其中候選列表511具有一個(gè)或多個(gè)候選答案。詳細(xì)而言,自然語言理解模塊520會(huì)解析第一語音輸入501,而獲得第一語音輸入501的一個(gè)或多個(gè)特征語義509。在此,特征語義509例如是自然語言理解模塊520解析第一語音輸入501后,所得到的關(guān)鍵字或請(qǐng)求信息等。舉例來說,當(dāng)用戶的第一語音輸入501為「我要看三國演義」時(shí),自然語言理解模塊520經(jīng)過分析后所獲得的特征語義509例如是「『三國演義』、『看』」。又例如,當(dāng)用戶的第一語音輸入501為「我要聽忘情水的歌」時(shí),自然語言理解模塊520經(jīng)過分析后所獲得的特征語 義509例如是「『忘情水』、『聽』、『歌』」。接后,自然語言理解模塊520可依據(jù)上述特征語義509自搜尋數(shù)據(jù)庫(例如搜尋引擎等)進(jìn)行查詢,而獲得至少一筆搜尋結(jié)果,據(jù)以做為候選列表511中的各個(gè)候選答案。至于選擇候選答案的方式可如圖1A所述,在此不予以贅述。由于一個(gè)特征語義509(例如圖1A的關(guān)鍵字108)可能屬于不同的知識(shí)領(lǐng)域或?qū)傩?例如電影類、書籍類、音樂類或游戲類等等),且同一知識(shí)領(lǐng)域或?qū)傩灾幸嗫蛇M(jìn)一步分成多種類別(例如同一電影或書籍名稱的不同作者、同一歌曲名稱的不同演唱者、同一游戲名稱的不同版本等等),故針對(duì)一個(gè)特征語義509而言,自然語言理解模塊520可在搜尋數(shù)據(jù)庫中查詢到一筆或多筆相關(guān)于此特征語義509的搜尋結(jié)果,其中每一筆搜尋結(jié)果中可包括相關(guān)于此特征語義509的各類指引信息(例如以“蕭敬騰”、“背叛”為關(guān)鍵字108在圖3A、3B的結(jié)構(gòu)化數(shù)據(jù)庫220進(jìn)行全文檢索時(shí),將得到兩組匹配結(jié)果)。其中,指引信息例如是在搜尋結(jié)果中,除了特征語義509以外的其他關(guān)鍵字等等。因此從另一觀點(diǎn)來看,當(dāng)用戶所輸入的第一語音輸入501具有多個(gè)特征語義509時(shí)(例如可解析出的關(guān)鍵字108越多),則表示用戶的請(qǐng)求信息505較明確,使得自然語言理解模塊520較能查詢到與請(qǐng)求信息505接近的搜尋結(jié)果。舉例來說,當(dāng)特征語義509為「三國演義」時(shí),自然語言理解模塊520所查訊到的搜尋結(jié)果例如是關(guān)于「...『三國演義』...『電視劇』」的數(shù)據(jù)、「...『三國演義』...『小說』」的數(shù)據(jù)、「...『三國演義』...『羅貫中』...『小說』」的數(shù)據(jù),其中『電視劇』、『羅貫中』及『小說』為所列舉的指引信息。又例如,當(dāng)特征語義509為「『忘情水』『音樂』」時(shí),自然語言理解模塊520所查訊到的搜尋結(jié)果例如關(guān)于「...『忘情水』...『音樂』...『劉德華』」的數(shù)據(jù)、「...『忘情水』...『音樂』...『李翊君』」的數(shù)據(jù)、「...『忘情水』...『音樂』...『歌詞』」的數(shù)據(jù),其中『劉德華』、『李翊君』及『歌詞』為所列舉的指引信息。換言之,每一筆搜尋結(jié)果可包括特征語義509以及相關(guān)于特征語義的指引信息,而自然語言理解模塊520會(huì)依據(jù)所查詢到的搜尋結(jié)果,將搜尋結(jié)果中所包括的數(shù)據(jù)轉(zhuǎn)換成候選答案,并將候選答案記錄于候選列表511中,以供后續(xù)步驟使用。于步驟S606中,自然語言理解模塊520會(huì)自候選列表511中選擇至少一候選答案中作為回報(bào)答案,并依據(jù)回報(bào)答案,輸出對(duì)應(yīng)的第一語音應(yīng)答507。在本實(shí)施例中,自然語言理解模塊520可按照優(yōu)先順序排列候選列表中的候選答案,并依據(jù)此優(yōu)先順序自候選列表中選出回報(bào)答案,據(jù)以輸出第一語音應(yīng)答507。舉例來說,當(dāng)特征語義509為「三國演義」時(shí),假設(shè)自然語言理解模塊520查詢到很多筆關(guān)于「...『三國演義』...『書籍』」的數(shù)據(jù),其次為「...『三國演義』...『音樂』」的數(shù)據(jù),而關(guān)于「...『三國演義』...『電視劇』」的數(shù)據(jù)最少,則自然語言理解模塊520會(huì)將「三國演義的書籍」做為第一優(yōu)先候選答案,「三國演義的音樂」做為第二優(yōu)先候選答案,「三國演義的電視劇」做為第三優(yōu)先候選答案。其他細(xì)節(jié)前面已提過,在此不予贅述。接著,于步驟S608,語音取樣模塊510會(huì)接收第二語音輸入501,而自然語言理解模塊520會(huì)解析此第二語音輸入501,并判斷先前所選出的回報(bào)答案是否正確。在此,語音取樣模塊510會(huì)對(duì)第二語音輸入501進(jìn)行解析,以解析出第二語音輸入501所包括的特征語義509 (因?yàn)閷⒔?jīng)由標(biāo)號(hào)509的方向由語音取樣模塊522輸出至自然語言處理模塊524),其中此特征語義509例如是用戶進(jìn)一步提供的關(guān)鍵字(例如時(shí)間、意圖、知識(shí)領(lǐng)域或?qū)傩缘鹊?。并且,當(dāng)?shù)诙Z音輸入501中的特征語義509不符合回報(bào)答案中所相關(guān)的指引信息時(shí),自然語言理解模塊520則會(huì)判斷先前所選出的回報(bào)答案為不正確。至于判斷第二語音輸入501的請(qǐng)求信息505包含的是“正確”或“否定”第一語音應(yīng)答507的方式前面已提過,在此不予贅述。進(jìn)一步而言,自然語言理解模塊520所解析的第二語音輸入501可包括或不包括明確的特征語義509。舉 例來說,語音取樣模塊510例如是接收到來自用戶所說的「我不是指三國演義的書籍」(情況A)、「我不是指三國演義的書籍,我是指三國演義的電視劇」(情況B)、「我是指三國演義的電視劇」(情況C)等等。上述情況A中的特征語義509例如為「『不是』『三國演義』『書籍』」,情況B中的特征語義509例如為「『不是』『三國演義』『書籍』,『是』『三國演義』『電視劇』」,而情況C中的特征語義509例如為「『是』『三國演義』『電視劇』J。為了方便說明,上述僅列舉情況A、B及C為例,但本實(shí)施例并不限于此。接著,自然語言理解模塊520會(huì)依據(jù)上述第二語音輸入501所包括的特征語義509,來判斷回報(bào)答案中相關(guān)的指引信息是否正確。也就是說,倘若斷回報(bào)答案為「三國演義的書籍」,而上述特征語義509為「『三國演義』『電視劇』」,則自然語言理解模塊520會(huì)判斷回報(bào)答案中相關(guān)的指引信息(即『書籍』)不符合來自用戶第二語音輸入501的特征語義509 (即『電視劇』),藉以判斷回報(bào)答案不正確。類似地,倘若斷回報(bào)答案為「三國演義的書籍」,而上述特征語義509為『不是』『三國演義』『書籍』」,則自然語言理解模塊520亦會(huì)判斷出回報(bào)答案不正確。當(dāng)自然語言理解模塊520解析第二語音輸入501之后,判斷之前輸出的第一語音應(yīng)答501為正確時(shí),則如步驟S610所示,自然語言理解模塊120會(huì)做出對(duì)應(yīng)于第二語音輸Λ 501的回應(yīng)。舉例來說,假設(shè)來自用戶的第二語音輸入501為「是的,是三國演義的書籍」,則自然語言理解模塊520可以是輸出「正在幫您開啟三國演義的書籍」的第二語音應(yīng)答507?;蛘?,自然語言理解模塊520可在播放第二語音應(yīng)答507的同時(shí),直接通過處理單元(未繪示)來載入三國演義的書籍內(nèi)容。然而,當(dāng)自然語言 理解模塊520解析第二語音輸入501之后,判斷之前輸出的第一語音應(yīng)答507不正確時(shí),則如步驟S612所示,自然語言理解模塊520會(huì)自候選列表511中選擇候選答案中的另一者,并依據(jù)所選擇的結(jié)果輸出第二語音應(yīng)答507。在此,倘若用戶所提供的第二語音輸入501中不具有明確的特征語義509 (如上述情況A的第二語音輸入501),則自然語言理解模塊520可從候選列表511中選出另一個(gè)候選答案。或者,倘若用戶所提供的第二語音輸入501中具有明確的特征語義509 (如上述情況B及C的第二語音輸入501),則自然語言理解模塊520可直接依據(jù)用戶所指引的特征語義509,在從候選列表511中選出另一個(gè)候選答案。另一方面,倘若用戶所提供的第二語音輸入501中具有明確的特征語義509(如上述情況B及C的第二語音輸入),但自然語言理解模塊520在候選列表511中查無符合此特征語義509的指引信息的候選答案,則自然語言理解模塊520會(huì)輸出第三語音應(yīng)答507,例如「查無此書」或「我不知道」等。為了使本領(lǐng)域的技術(shù)人員進(jìn)一步了解本實(shí)施例的修正語音應(yīng)答的方法以及自然語言對(duì)話系統(tǒng),以下再舉一實(shí)施例進(jìn)行詳細(xì)的說明。首先,假設(shè)語音取樣模塊510接收的第一語音輸入501為「我要看三國演義」(步驟S602),接著,自然語言理解模塊520可解析出為「『看』『三國演義』」的特征語義509,并獲得具有多個(gè)候選答案的候選列表511,其中每一個(gè)候選答案具有相關(guān)的指引信息(步驟S604),如表一所不。表一
權(quán)利要求
1.一種檢索系統(tǒng),包括 一結(jié)構(gòu)化數(shù)據(jù)庫,用以儲(chǔ)存具有一數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄;以及 ー搜尋引擎,用以對(duì)該結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行一全文檢索, 其中該數(shù)據(jù)結(jié)構(gòu)包括一標(biāo)題欄,該標(biāo)題欄內(nèi)包括至少一分欄,每一分欄包括一指引欄以及ー數(shù)值欄,該些記錄的該指引欄儲(chǔ)存一指引數(shù)據(jù),該些記錄的該數(shù)值欄儲(chǔ)存一數(shù)值數(shù)據(jù)。
2.如權(quán)利要求1所述的檢索系統(tǒng),其中該數(shù)據(jù)結(jié)構(gòu)還包括一內(nèi)容欄,該些記錄的該內(nèi)容欄儲(chǔ)存各該些記錄的內(nèi)容細(xì)節(jié)數(shù)據(jù)。
3.如權(quán)利要求1所述的檢索系統(tǒng),其中當(dāng)該些記錄的該標(biāo)題欄中儲(chǔ)存有多個(gè)該分欄的數(shù)據(jù)時(shí),于各該分欄的數(shù)據(jù)間儲(chǔ)存ー第一特殊字符,用以分隔各該分欄的數(shù)據(jù),于該指引欄與該數(shù)值欄的數(shù)據(jù)間儲(chǔ)存ー第二特殊字符,用以分隔該指引欄與該數(shù)值欄的數(shù)據(jù)。
4.如權(quán)利要求1所述的檢索系統(tǒng),其中該標(biāo)題欄中的該分欄具有固定位數(shù)。
5.如權(quán)利要求1所述的檢索系統(tǒng),還包括一檢索接ロ単元,耦接該搜尋引擎,用以接收至少ー關(guān)鍵字來傳送給該搜尋引擎,藉以讓該搜尋引擎對(duì)該些記錄的該標(biāo)題欄進(jìn)行該全文檢索,以及反應(yīng)該搜尋引擎的一匹配結(jié)果,輸出該些記錄中的至少ー檢索匹配記錄。
6.如權(quán)利要求5所述的檢索系統(tǒng),其中該檢索匹配記錄為與該至少一關(guān)鍵字完全匹配的一全匹配記錄或與該至少一關(guān)鍵字部分匹配的一部分匹配記錄。
7.如權(quán)利要求6所述的檢索系統(tǒng),其中當(dāng)該檢索接ロ單元輸出多個(gè)檢索匹配記錄吋,其依序輸出該全匹配記錄及該部分匹配記錄,其中該全匹配記錄的優(yōu)先順序大于該部分匹配記錄的優(yōu)先順序。
8.ー種自然語言理解系統(tǒng),包括 一自然語言處理器,用以將ー用戶的一請(qǐng)求信息,分析成至少一可能意圖語法數(shù)據(jù),每一可能意圖語法數(shù)據(jù)包括至少ー關(guān)鍵字及一意圖數(shù)據(jù); 一知識(shí)輔助理解模塊,耦接該自然語言處理器,用以求得該至少一可能意圖語法數(shù)據(jù)中的一確定意圖語法數(shù)據(jù),以表達(dá)該用戶的該請(qǐng)求信息的意圖;以及 一檢索系統(tǒng),包括 一結(jié)構(gòu)化數(shù)據(jù)庫,用以儲(chǔ)存具有一數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄;以及 ー搜尋引擎,用以對(duì)該結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行一全文檢索,該數(shù)據(jù)結(jié)構(gòu)包括ー標(biāo)題欄,該標(biāo)題欄內(nèi)包括至少一分欄,每一分欄包括一指引欄以及一數(shù)值欄,該些記錄的該指引欄儲(chǔ)存一指引數(shù)據(jù),該些記錄的該數(shù)值欄儲(chǔ)存ー數(shù)值數(shù)據(jù), 其中,該知識(shí)輔助理解模塊傳送該關(guān)鍵字給該檢索系統(tǒng),藉由該檢索系統(tǒng)的回應(yīng),以輔助求得該確定意圖語法數(shù)據(jù)。
9.如權(quán)利要求8所述的自然語言理解系統(tǒng),其中該數(shù)據(jù)結(jié)構(gòu)還包括一內(nèi)容欄,該些記錄的該內(nèi)容欄儲(chǔ)存各該些記錄的內(nèi)容細(xì)節(jié)數(shù)據(jù)。
10.如權(quán)利要求8所述的自然語言理解系統(tǒng),其中當(dāng)該些記錄的該標(biāo)題欄中儲(chǔ)存有多個(gè)該分欄的數(shù)據(jù)時(shí),于各該分欄的數(shù)據(jù)間儲(chǔ)存ー第一特殊字符,用以分隔各該分欄的數(shù)據(jù),于該指引欄與該數(shù)值欄的數(shù)據(jù)間儲(chǔ)存ー第二特殊字符,用以分隔該指引欄與該數(shù)值欄的數(shù)據(jù)。
11.如權(quán)利要求8所述的自然語言理解系統(tǒng),其中該標(biāo)題欄中的該分欄具有固定位數(shù)。
12.如權(quán)利要求8所述的自然語言理解系統(tǒng),其中該檢索系統(tǒng)還包括一檢索接ロ単元,耦接該搜尋引擎以及該知識(shí)輔助理解模塊,用以接收該關(guān)鍵字來傳送給該搜尋引擎,藉以讓該搜尋引擎對(duì)該些記錄的該標(biāo)題欄進(jìn)行該全文檢索,以及反應(yīng)該搜尋引擎的一匹配結(jié)果,輸出該些記錄中的至少ー檢索匹配記錄,該知識(shí)輔助理解模塊藉由比對(duì)該至少ー檢索匹配記錄中該標(biāo)題欄所儲(chǔ)存的該指引數(shù)據(jù)與該至少一可能意圖語法數(shù)據(jù)所包括的該意圖數(shù)據(jù),從而判斷出該用戶的該請(qǐng)求信息的意圖。
13.如權(quán)利要求12所述的自然語言理解系統(tǒng),其中該檢索匹配記錄為與該關(guān)鍵字完全匹配的一全匹配記錄或與該關(guān)鍵字部分匹配的一部分匹配記錄。
14.如權(quán)利要求13所述的自然語言理解系統(tǒng),其中當(dāng)該檢索接ロ單元輸出多個(gè)檢索匹配記錄時(shí),其依序輸出該全匹配記錄及該部分匹配記錄,其中該全匹配記錄的優(yōu)先順序大于該部分匹配記錄的優(yōu)先順序。
15.—種檢索方法,包括 提供一結(jié)構(gòu)化數(shù)據(jù)庫,該結(jié)構(gòu)化數(shù)據(jù)庫儲(chǔ)存具有一數(shù)據(jù)結(jié)構(gòu)的多個(gè)記錄;以及 對(duì)該結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行一全文檢索, 其中該數(shù)據(jù)結(jié)構(gòu)包括一標(biāo)題欄,該標(biāo)題欄內(nèi)包括至少一分欄,每一分欄包括一指引欄以及ー數(shù)值欄,該些記錄的該指引欄儲(chǔ)存一指引數(shù)據(jù),該些記錄的該數(shù)值欄儲(chǔ)存一數(shù)值數(shù)據(jù)。
16.如權(quán)利要求15所述的檢索方法,其中該數(shù)據(jù)結(jié)構(gòu)還包括一內(nèi)容欄,該些記錄的該內(nèi)容欄儲(chǔ)存各該些記錄的內(nèi)容細(xì)節(jié)數(shù)據(jù)。
17.如權(quán)利要求15所述的檢索方法,其中當(dāng)該些記錄的該標(biāo)題欄中儲(chǔ)存有多個(gè)該分欄的數(shù)據(jù)時(shí),于各該分欄的數(shù)據(jù)間儲(chǔ)存ー第一特殊字符,用以分隔各該分欄的數(shù)據(jù),于該指引欄與該數(shù)值欄的數(shù)據(jù)間儲(chǔ)存ー第二特殊字符,用以分隔該指引欄與該數(shù)值欄的數(shù)據(jù)。
18.如權(quán)利要求15所述的檢索方法,其中該標(biāo)題欄中的該分欄具有固定位數(shù)。
19.如權(quán)利要求15所述的檢索方法,其中對(duì)該結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行全文檢索的步驟,還包括 接收至少一關(guān)鍵字; 藉由該關(guān)鍵字來對(duì)該些記錄的該標(biāo)題欄進(jìn)行該全文檢索;以及 若該全文檢索有一匹配結(jié)果,輸出該些記錄中的至少ー檢索匹配記錄。
20.如權(quán)利要求19所述的檢索方法,其中該檢索匹配記錄為與該關(guān)鍵字完全匹配的一全匹配記錄或與該關(guān)鍵字部分匹配的一部分匹配記錄。
21.如權(quán)利要求20所述的檢索方法,其中輸出該些記錄中的該些檢索匹配記錄的步驟,還包括 依序輸出該全匹配記錄及該部分匹配記錄, 其中該全匹配記錄的優(yōu)先順序大于該部分匹配記錄的優(yōu)先順序。
22.—種檢索系統(tǒng),包括 一結(jié)構(gòu)化數(shù)據(jù)庫,用以儲(chǔ)存多個(gè)記錄,其中每個(gè)記錄內(nèi)部的所包含的數(shù)值數(shù)據(jù)相互間具有關(guān)聯(lián)性,且數(shù)值數(shù)據(jù)共同用以表達(dá)來自用戶的請(qǐng)求信息對(duì)該記錄的意圖;以及 ー搜尋引擎,用以對(duì)該結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行一全文檢索,其中在該數(shù)值數(shù)據(jù)被匹配時(shí),對(duì)應(yīng)于該數(shù)值數(shù)據(jù)的指引數(shù)據(jù)被輸出以確認(rèn)該請(qǐng)求信息的意圖。
23.如權(quán)利要求22所述的檢索系統(tǒng),其中該記錄還包括一內(nèi)容欄,且該內(nèi)容欄儲(chǔ)存對(duì)應(yīng)的該記錄的內(nèi)容細(xì)節(jié)數(shù)據(jù)。
24.如權(quán)利要求22所述的檢索系統(tǒng),其中該記錄包括一標(biāo)題欄,該標(biāo)題欄內(nèi)包括至少一分欄,每一分欄包括一指引欄以及一數(shù)值欄,該些記錄的該指引欄儲(chǔ)存該指引數(shù)據(jù),該些記錄的該數(shù)值欄儲(chǔ)存該數(shù)值數(shù)據(jù)。
25.如權(quán)利要求24所述的檢索系統(tǒng),其中當(dāng)該記錄的該標(biāo)題欄中儲(chǔ)存有多個(gè)該分欄的數(shù)據(jù)時(shí),于各該分欄的數(shù)據(jù)間儲(chǔ)存ー第一特殊字符,用以分隔各該分欄的數(shù)據(jù),于該指引欄與該數(shù)值欄的數(shù)據(jù)間儲(chǔ)存ー第二特殊字符,用以分隔該指引欄與該數(shù)值欄的數(shù)據(jù)。
26.如權(quán)利要求24所述的檢索系統(tǒng),其中該標(biāo)題欄中的該分欄具有固定位數(shù)。
27.如權(quán)利要求22所述的檢索系統(tǒng),其中該搜尋引擎是依據(jù)ー關(guān)鍵字對(duì)該些記錄的該標(biāo)題欄進(jìn)行該全文檢索,以及反應(yīng)該搜尋引擎的一匹配結(jié)果,輸出該些記錄中的至少ー檢索匹配記錄。
28.如權(quán)利要求27所述的檢索系統(tǒng),其中該檢索匹配記錄為與該至少一關(guān)鍵字完全匹配的一全匹配記錄或與該至少一關(guān)鍵字部分匹配的一部分匹配記錄。
29.如權(quán)利要求28所述的檢索系統(tǒng),其中當(dāng)多個(gè)檢索匹配記錄被匹配時(shí),依序輸出該全匹配記錄及該部分匹配記錄,其中該全匹配記錄的優(yōu)先順序大于該部分匹配記錄的優(yōu)先順序。
30.如權(quán)利要求27所述的檢索系統(tǒng),還包含一檢索接ロ単元,耦接該搜尋引擎,用以接收至少一關(guān)鍵字來傳送給該搜尋引擎。
全文摘要
一種檢索方法、檢索系統(tǒng)以及自然語言理解系統(tǒng),此檢索系統(tǒng)包括結(jié)構(gòu)化數(shù)據(jù)庫以及搜尋引擎。結(jié)構(gòu)化數(shù)據(jù)庫包含多個(gè)記錄,其中每個(gè)記錄包括標(biāo)題欄以及內(nèi)容欄,而標(biāo)題欄內(nèi)包括至少一分欄,每一分欄包括指引欄以及數(shù)值欄。前述記錄的指引欄儲(chǔ)存指引數(shù)據(jù)、數(shù)值欄儲(chǔ)存數(shù)值數(shù)據(jù)、內(nèi)容欄則儲(chǔ)存內(nèi)容細(xì)節(jié)數(shù)據(jù)。搜尋引擎針對(duì)用戶請(qǐng)求信息所產(chǎn)生的關(guān)鍵字,對(duì)結(jié)構(gòu)化數(shù)據(jù)庫的記錄進(jìn)行全文檢索,并將檢索結(jié)果傳送至一知識(shí)輔助理解模塊以確定用戶的意圖,并在確認(rèn)用戶意圖后將用戶所要的信息回傳給用戶。
文檔編號(hào)G06F17/30GK103049567SQ20121059306
公開日2013年4月17日 申請(qǐng)日期2012年12月31日 優(yōu)先權(quán)日2012年12月31日
發(fā)明者張國峰, 朱逸斐 申請(qǐng)人:威盛電子股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
桂林市| 拉孜县| 南通市| 浦县| 建湖县| 江川县| 贵南县| 昌吉市| 佛学| 夏津县| 调兵山市| 佛冈县| 黔西县| 三江| 龙陵县| 青神县| 县级市| 明水县| 德庆县| 温泉县| 清苑县| 横峰县| 南召县| 温州市| 乃东县| 长泰县| 邯郸县| 贵溪市| 新源县| 鲁山县| 汤原县| 南川市| 黔西县| 循化| 井冈山市| 灯塔市| 曲松县| 新津县| 册亨县| 宜兰市| 孟州市|