問(wèn)答系統(tǒng)及其問(wèn)答處理方法
【專利摘要】本發(fā)明公開(kāi)了一種問(wèn)答系統(tǒng)及其問(wèn)答處理方法,所述方法包括:?jiǎn)柎鹣到y(tǒng)在接收到用戶發(fā)送的詢問(wèn)語(yǔ)句后,確定出該詢問(wèn)語(yǔ)句所屬的領(lǐng)域,并加載與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置;針對(duì)加載的領(lǐng)域參數(shù)配置中的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽?。粡呐c該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出與所有抽取出的詢問(wèn)信息的取值相匹配的內(nèi)容,作為該詢問(wèn)語(yǔ)句的回答進(jìn)行返回。應(yīng)用本發(fā)明,可提高問(wèn)答系統(tǒng)的領(lǐng)域可擴(kuò)展性。
【專利說(shuō)明】問(wèn)答系統(tǒng)及其問(wèn)答處理方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)技術(shù),尤其涉及一種問(wèn)答系統(tǒng)及其問(wèn)答處理方法。
【背景技術(shù)】
[0002]問(wèn)答系統(tǒng)是信息檢索系統(tǒng)的一種高級(jí)形式,可以用準(zhǔn)確、簡(jiǎn)潔的自然語(yǔ)言回答用戶用自然語(yǔ)言表達(dá)的問(wèn)答查詢服務(wù)請(qǐng)求(本文中也稱為詢問(wèn)語(yǔ)句),具體是對(duì)詢問(wèn)語(yǔ)句作出反應(yīng),查詢相關(guān)領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)并給出回答。實(shí)際應(yīng)用中,主要存在兩類查詢相關(guān)領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)的技術(shù):基于結(jié)構(gòu)化數(shù)據(jù)的類查詢推理技術(shù)、基于非結(jié)構(gòu)化或半結(jié)構(gòu)化的類搜索技術(shù)。
[0003]其中,在基于結(jié)構(gòu)化數(shù)據(jù)的類查詢推理技術(shù)中,首先需要對(duì)用自然語(yǔ)言表達(dá)的詢問(wèn)語(yǔ)句進(jìn)行形式化處理,得到該詢問(wèn)語(yǔ)句所包含的、用于回答該詢問(wèn)語(yǔ)句所需的形式化的詢問(wèn)信息;然后,根據(jù)得到的形式化的詢問(wèn)信息,在具有結(jié)構(gòu)化數(shù)據(jù)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中進(jìn)行查詢和推理,產(chǎn)生與詢問(wèn)信息的取值相匹配的回答內(nèi)容。其中,對(duì)詢問(wèn)語(yǔ)句的形式化處理具體是指對(duì)詢問(wèn)語(yǔ)句進(jìn)行詢問(wèn)信息抽取,即從詢問(wèn)語(yǔ)句中抽取出的詢問(wèn)信息的取值是計(jì)算機(jī)程序可理解的。例如,若詢問(wèn)語(yǔ)句為“明天北京的天氣怎么樣? ”,則可以將該詢問(wèn)語(yǔ)句形式化處理為類似{服務(wù)類別=“weather”、城市=“北京市”、時(shí)間=“2013年12月9日” }的表示形式的詢問(wèn)信息。若當(dāng)詢問(wèn)語(yǔ)句為“金牛座這周的運(yùn)勢(shì)怎么樣? ”,則可以將該詢問(wèn)語(yǔ)句形式化處理為類似{服務(wù)類別=“astro”,星座=“金牛座”,時(shí)間段=“2013年12月9日至2013年12月15日” }的表示形式的詢問(wèn)信息。
[0004]現(xiàn)有的問(wèn)答系統(tǒng)主要是封閉領(lǐng)域系統(tǒng),即專注于回答特定領(lǐng)域的問(wèn)題。其中,問(wèn)答系統(tǒng)中的問(wèn)答處理裝置能夠針對(duì)屬于特定領(lǐng)域的詢問(wèn)語(yǔ)句進(jìn)行信息抽取。具體地,在接收到待查詢的詢問(wèn)語(yǔ)句后,問(wèn)答系統(tǒng)中的問(wèn)答處理裝置對(duì)接收的詢問(wèn)語(yǔ)句進(jìn)行詢問(wèn)信息抽取,若接收的詢問(wèn)語(yǔ)句屬于該問(wèn)答處理裝置所針對(duì)的特定領(lǐng)域,則可以從接收的詢問(wèn)語(yǔ)句中抽取出詢問(wèn)信息的取值,進(jìn)而,問(wèn)答系統(tǒng)可以根據(jù)抽取出的詢問(wèn)信息的取值,在問(wèn)答系統(tǒng)中所配置的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中進(jìn)行查詢和推理,得到與詢問(wèn)信息的取值相匹配的內(nèi)容,并作為與該詢問(wèn)語(yǔ)句的回答。
[0005]事實(shí)上,對(duì)于屬于不同領(lǐng)域的詢問(wèn)語(yǔ)句,用于回答詢問(wèn)語(yǔ)句所需的詢問(wèn)信息往往會(huì)存在很大差異。因此,在對(duì)詢問(wèn)語(yǔ)句進(jìn)行形式化過(guò)程中,對(duì)于屬于不同領(lǐng)域的詢問(wèn)語(yǔ)句,從中抽取出詢問(wèn)信息的信息抽取方式也存在差異。也就是說(shuō),若現(xiàn)有的問(wèn)答系統(tǒng)接收的詢問(wèn)語(yǔ)句不屬于問(wèn)答處理裝置所針對(duì)的特定領(lǐng)域,則現(xiàn)有的問(wèn)答系統(tǒng)中的問(wèn)答處理裝置將無(wú)法從接收的詢問(wèn)語(yǔ)句中抽取出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息的取值;繼而,問(wèn)答系統(tǒng)也就無(wú)法給出該詢問(wèn)語(yǔ)句的回答。
[0006]因此,為了使得問(wèn)答系統(tǒng)可以支持多領(lǐng)域的問(wèn)答查詢服務(wù)請(qǐng)求,現(xiàn)有技術(shù)中提出可以針對(duì)各個(gè)領(lǐng)域各自開(kāi)發(fā)出相應(yīng)的問(wèn)答處理裝置,并將開(kāi)發(fā)出的針對(duì)各個(gè)領(lǐng)域的問(wèn)答處理裝置集成到一個(gè)龐大的詢問(wèn)系統(tǒng)中,使得該龐大的問(wèn)答系統(tǒng)在通過(guò)文本分類的方法識(shí)別出詢問(wèn)語(yǔ)句的所屬的領(lǐng)域后,可以從其所集成的各問(wèn)答處理裝置中選取與其該領(lǐng)域相對(duì)應(yīng)的問(wèn)答處理裝置進(jìn)行詢問(wèn)信息的抽取,并根據(jù)抽取出的詢問(wèn)信息的取值從與詢問(wèn)語(yǔ)句所屬的領(lǐng)域相對(duì)應(yīng)的領(lǐng)域數(shù)據(jù)知識(shí)庫(kù)中查找出回答內(nèi)容。
[0007]然而,在上述集成的問(wèn)答系統(tǒng)中,每多支持一種領(lǐng)域的問(wèn)答查詢服務(wù)請(qǐng)求,就需要開(kāi)發(fā)針對(duì)該新增領(lǐng)域的問(wèn)答處理裝置。而事實(shí)上,針對(duì)特定領(lǐng)域的問(wèn)答處理裝置的開(kāi)發(fā),需要針對(duì)從該領(lǐng)域的詢問(wèn)語(yǔ)句中抽取出詢問(wèn)信息的信息抽取方式,編寫(xiě)實(shí)現(xiàn)代碼,而這需要較長(zhǎng)的開(kāi)發(fā)周期。因此,對(duì)于集成了多個(gè)問(wèn)答處理裝置的問(wèn)答系統(tǒng),其開(kāi)發(fā)周期長(zhǎng),大大限制了問(wèn)答系統(tǒng)的領(lǐng)域可擴(kuò)展性。
[0008]綜上所述,現(xiàn)有的問(wèn)答系統(tǒng)存在領(lǐng)域可擴(kuò)展性差的不足;因此,有必要提供一種可以提高問(wèn)答系統(tǒng)的領(lǐng)域可擴(kuò)展性的問(wèn)答處理方法。
【發(fā)明內(nèi)容】
[0009]本發(fā)明實(shí)施例提供了一種問(wèn)答系統(tǒng)及其問(wèn)答處理方法,可支持多領(lǐng)域的詢問(wèn)語(yǔ)句的處理,提高了問(wèn)答系統(tǒng)的領(lǐng)域可擴(kuò)展性。
[0010]根據(jù)本發(fā)明的一個(gè)方面,提供了一種問(wèn)答系統(tǒng)的問(wèn)答處理方法,包括:
[0011]問(wèn)答系統(tǒng)在接收到用戶發(fā)送的詢問(wèn)語(yǔ)句后,確定出該詢問(wèn)語(yǔ)句所屬的領(lǐng)域,并加載與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置;
[0012]針對(duì)加載的領(lǐng)域參數(shù)配置中的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽??;
[0013]從與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出與所有抽取出的詢問(wèn)信息的取值相匹配的內(nèi)容,作為該詢問(wèn)語(yǔ)句的回答進(jìn)行返回。
[0014]較佳地,所述與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置是預(yù)先設(shè)置的:
[0015]收集預(yù)定數(shù)量的屬于該領(lǐng)域的詢問(wèn)語(yǔ)句;并
[0016]針對(duì)收集的每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息后,對(duì)于每個(gè)確定出的詢問(wèn)信息,確定該詢問(wèn)信息的信息類型;并將確定出的信息類型作為該詢問(wèn)語(yǔ)句所涉及的信息類型;
[0017]將收集的屬于該領(lǐng)域的所有詢問(wèn)語(yǔ)句共同涉及的信息類型確定為與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置中所包含的信息類型。
[0018]較佳地,在所述以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽取后,還包括:
[0019]若從該詢問(wèn)語(yǔ)句中沒(méi)有抽取出該信息類型的詢問(wèn)信息,則將該信息類型作為該詢問(wèn)語(yǔ)句所缺少的信息類型進(jìn)行記錄;以及
[0020]在所述從與所述領(lǐng)域參數(shù)配置相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出與所有抽取出的詢問(wèn)信息的取值相匹配的內(nèi)容之前,還包括:
[0021]若記錄有該詢問(wèn)語(yǔ)句所缺少的信息類型,則所述問(wèn)答系統(tǒng)根據(jù)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,向所述用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息;并在接收到用戶根據(jù)所述提示信息發(fā)送的補(bǔ)充信息后,針對(duì)該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從所述補(bǔ)充信息中進(jìn)行該信息類型的詢問(wèn)信息的抽取。
[0022]較佳地,在所述問(wèn)答系統(tǒng)根據(jù)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,向所述用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息之前,還包括:[0023]針對(duì)記錄的該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,若進(jìn)一步判斷出該信息類型是設(shè)置于所述領(lǐng)域參數(shù)配置中的具有默認(rèn)取值的詢問(wèn)信息的信息類型,則將該默認(rèn)取值作為抽取出的該信息類型的詢問(wèn)信息的取值,并將記錄的該信息類型進(jìn)行刪除。
[0024]較佳地,所述詢問(wèn)信息的信息類型包括:日期時(shí)間型、地名型、數(shù)值型、列舉型、正則型、社區(qū)信息型;以及
[0025]所述對(duì)于每個(gè)確定出的詢問(wèn)信息,確定該詢問(wèn)信息的信息類型,具體包括:
[0026]對(duì)于每個(gè)確定出的詢問(wèn)信息,若預(yù)先設(shè)置的該領(lǐng)域的關(guān)鍵詞列表中存在與該詢問(wèn)信息的取值相同的關(guān)鍵詞,則確定該詢問(wèn)信息的信息類型為列舉型;
[0027]若該詢問(wèn)信息的取值與所述地名型相對(duì)應(yīng)的地名列表中記錄的地名相同,則確定該詢問(wèn)信息的信息類型為地名型;
[0028]若該詢問(wèn)信息的取值與所述社區(qū)信息型相對(duì)應(yīng)的社區(qū)信息列表中記錄的社區(qū)信息相同,則確定該詢問(wèn)信息的信息類型為社區(qū)信息型;
[0029]若該詢問(wèn)信息的美國(guó)信息交換標(biāo)準(zhǔn)代碼ASCII碼處于數(shù)字ASCII碼范圍內(nèi),則確定該詢問(wèn)信息的信息類型為數(shù)值型;并在數(shù)值型的詢問(wèn)信息的取值符合日期時(shí)間型的格式時(shí),進(jìn)一步確定該詢問(wèn)信息的信息類型為日期時(shí)間型;在數(shù)值型的詢問(wèn)信息的取值符合設(shè)定的正則表達(dá)式時(shí),進(jìn)一步確定該詢問(wèn)信息的信息類型為正則型。
[0030]根據(jù)本發(fā)明的另一個(gè)方面,還提供了一種問(wèn)答系統(tǒng),包括:
[0031]所屬領(lǐng)域確定模塊,用于在問(wèn)答系統(tǒng)接收到用戶發(fā)送的詢問(wèn)語(yǔ)句后,確定出該詢問(wèn)語(yǔ)句所屬的領(lǐng)域;
[0032]領(lǐng)域參數(shù)配置加載模塊,用于根據(jù)所述所屬領(lǐng)域確定模塊確定出的領(lǐng)域,加載與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置;
[0033]詢問(wèn)信息抽取模塊,用于根據(jù)所述領(lǐng)域參數(shù)配置加載模塊加載的領(lǐng)域參數(shù)配置,針對(duì)該領(lǐng)域參數(shù)配置中的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從所述詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽取;
[0034]詢問(wèn)語(yǔ)句回答模塊,用于根據(jù)所述所屬領(lǐng)域確定模塊確定出的領(lǐng)域,確定該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù);并根據(jù)所述詢問(wèn)信息抽取模塊抽取出的詢問(wèn)信息的取值,從確定的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出相匹配的內(nèi)容,作為所述詢問(wèn)語(yǔ)句的回答進(jìn)行返回。
[0035]較佳地,所述問(wèn)答系統(tǒng)還包括:
[0036]領(lǐng)域參數(shù)配置設(shè)置模塊,用于針對(duì)所述問(wèn)答系統(tǒng)所支持的每個(gè)領(lǐng)域,收集預(yù)定數(shù)量的屬于該領(lǐng)域的詢問(wèn)語(yǔ)句;并針對(duì)收集的每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息后,對(duì)于每個(gè)確定出的詢問(wèn)信息,確定該詢問(wèn)信息的信息類型;并將確定出的信息類型作為該詢問(wèn)語(yǔ)句所涉及的信息類型;將收集的屬于該領(lǐng)域的所有詢問(wèn)語(yǔ)句共同涉及的信息類型確定為與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置中所包含的信息類型。
[0037]較佳地,所述問(wèn)答系統(tǒng)還包括:詢問(wèn)信息補(bǔ)充模塊;
[0038]所述詢問(wèn)信息抽取模塊還用于針對(duì)由所述領(lǐng)域參數(shù)配置加載模塊加載的領(lǐng)域參數(shù)配置中的每個(gè)信息類型,若從所述詢問(wèn)語(yǔ)句中沒(méi)有抽取出該信息類型的詢問(wèn)信息,則將該信息類型作為該詢問(wèn)語(yǔ)句所缺少的信息類型進(jìn)行記錄;以及
[0039]所述詢問(wèn)信息補(bǔ)充模塊,用于獲取所述詢問(wèn)信息抽取模塊記錄的所述詢問(wèn)語(yǔ)句所缺少的信息類型,并根據(jù)記錄的所述詢問(wèn)語(yǔ)句所缺少的信息類型向所述用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息;并在接收到所述用戶根據(jù)所述提示信息發(fā)送的補(bǔ)充信息后,針對(duì)所述詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從所述補(bǔ)充信息中進(jìn)行該信息類型的詢問(wèn)信息的抽取,并將抽取的詢問(wèn)信息發(fā)送至所述詢問(wèn)信息抽取模塊。
[0040]較佳地,所述詢問(wèn)信息補(bǔ)充模塊還用于在所述獲取所述詢問(wèn)信息抽取模塊記錄的所述詢問(wèn)語(yǔ)句所缺少的信息類型后,針對(duì)獲取的該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,若進(jìn)一步判斷出該信息類型是設(shè)置于所述領(lǐng)域參數(shù)配置中的具有默認(rèn)取值的詢問(wèn)信息的信息類型,則將該默認(rèn)取值作為抽取出的該信息類型的詢問(wèn)信息的取值,并將記錄的該信息類型進(jìn)行刪除。
[0041]較佳地,所述詢問(wèn)信息的信息類型包括:日期時(shí)間型、地名型、數(shù)值型、列舉型、正則型、社區(qū)信息型;以及
[0042]所述領(lǐng)域參數(shù)配置設(shè)置模塊具體用于在針對(duì)收集的每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息后,對(duì)于每個(gè)確定出的詢問(wèn)信息,若預(yù)先設(shè)置的該領(lǐng)域的關(guān)鍵詞列表中存在與該詢問(wèn)信息的取值相同的關(guān)鍵詞,則確定該詢問(wèn)信息的信息類型為列舉型;若該詢問(wèn)信息的取值與所述地名型相對(duì)應(yīng)的地名列表中記錄的地名相同,則確定該詢問(wèn)信息的信息類型為地名型;若該詢問(wèn)信息的取值與所述社區(qū)信息型相對(duì)應(yīng)的社區(qū)信息列表中記錄的社區(qū)信息相同,則確定該詢問(wèn)信息的信息類型為社區(qū)信息型;若該詢問(wèn)信息的ASCII碼處于數(shù)字ASCII碼范圍內(nèi),則確定該詢問(wèn)信息的信息類型為數(shù)值型;并在數(shù)值型的詢問(wèn)信息的取值符合日期時(shí)間型的格式時(shí),進(jìn)一步確定該詢問(wèn)信息的信息類型為日期時(shí)間型;在數(shù)值型的詢問(wèn)信息的取值符合設(shè)定的正則表達(dá)式時(shí),進(jìn)一步確定該詢問(wèn)信息的信息類型為正則型。
[0043]本發(fā)明實(shí)施例的技術(shù)方案中,在確定出詢問(wèn)語(yǔ)句的所屬的領(lǐng)域后,問(wèn)答系統(tǒng)可以加載與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置;繼而,針對(duì)加載的領(lǐng)域參數(shù)配置中預(yù)先存儲(chǔ)的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽??;并從與加載的領(lǐng)域參數(shù)配置相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出與所有抽取出的詢問(wèn)信息的取值相匹配的內(nèi)容,作為該詢問(wèn)語(yǔ)句的回答。這樣,對(duì)于屬于不同領(lǐng)域的詢問(wèn)語(yǔ)句,可以采用同一種信息抽取方式進(jìn)行相同信息類型的詢問(wèn)信息的抽取,因此,問(wèn)答系統(tǒng)每多支持一種領(lǐng)域的問(wèn)答查詢服務(wù)請(qǐng)求,只需針對(duì)該領(lǐng)域進(jìn)行領(lǐng)域參數(shù)配置的設(shè)置即可,無(wú)需再針對(duì)該新增領(lǐng)域進(jìn)行與該新增領(lǐng)域相對(duì)應(yīng)的問(wèn)答處理裝置的開(kāi)發(fā),大大縮短了開(kāi)發(fā)周期,提高了問(wèn)答系統(tǒng)的領(lǐng)域可擴(kuò)展性。
【專利附圖】
【附圖說(shuō)明】
[0044]圖1為本發(fā)明實(shí)施例的領(lǐng)域參數(shù)配置的設(shè)置流程示意圖;
[0045]圖2為本發(fā)明實(shí)施例的問(wèn)答系統(tǒng)的問(wèn)答處理方法的流程示意圖;
[0046]圖3為本發(fā)明實(shí)施例的問(wèn)答系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0047]為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下參照附圖并舉出優(yōu)選實(shí)施例,對(duì)本發(fā)明進(jìn)一步詳細(xì)說(shuō)明。然而,需要說(shuō)明的是,說(shuō)明書(shū)中列出的許多細(xì)節(jié)僅僅是為了使讀者對(duì)本發(fā)明的一個(gè)或多個(gè)方面有一個(gè)透徹的理解,即便沒(méi)有這些特定的細(xì)節(jié)也可以實(shí)現(xiàn)本發(fā)明的這些方面。
[0048]本申請(qǐng)使用的“模塊”、“系統(tǒng)”等術(shù)語(yǔ)旨在包括與計(jì)算機(jī)相關(guān)的實(shí)體,例如但不限于硬件、固件、軟硬件組合、軟件或者執(zhí)行中的軟件。例如,模塊可以是,但并不僅限于:處理器上運(yùn)行的進(jìn)程、處理器、對(duì)象、可執(zhí)行程序、執(zhí)行的線程、程序和/或計(jì)算機(jī)。舉例來(lái)說(shuō),計(jì)算設(shè)備上運(yùn)行的應(yīng)用程序和此計(jì)算設(shè)備都可以是模塊。一個(gè)或多個(gè)模塊可以位于執(zhí)行中的一個(gè)進(jìn)程和/或線程內(nèi)。
[0049]本發(fā)明的發(fā)明人發(fā)現(xiàn),對(duì)于屬于不同領(lǐng)域的兩個(gè)詢問(wèn)語(yǔ)句,雖然回答該兩個(gè)詢問(wèn)語(yǔ)句所需的詢問(wèn)信息會(huì)存在很大的差異,但不同的詢問(wèn)信息在信息類型上可能是相同的。例如,對(duì)于屬于天氣領(lǐng)域的詢問(wèn)語(yǔ)句“明天北京的天氣怎么樣?”、以及屬于星座領(lǐng)域的詢問(wèn)語(yǔ)句“金牛座這周的運(yùn)勢(shì)怎么樣?”,該兩個(gè)詢問(wèn)語(yǔ)句中都涉及到日期時(shí)間,且需抽取的詢問(wèn)信息中也都涉及到日期時(shí)間信息的抽取。
[0050]因此,本發(fā)明的發(fā)明人考慮到,可以收集各領(lǐng)域的詢問(wèn)語(yǔ)句、以及回答詢問(wèn)語(yǔ)句所需的詢問(wèn)信息,并從中歸納定義出一些基礎(chǔ)的信息類型,例如,可以基于詢問(wèn)信息的具體取值歸納定義出:日期時(shí)間型、地名型、數(shù)值型、列舉型、正則型、社區(qū)信息型、是否型等信息類型;并針對(duì)每個(gè)信息類型,設(shè)置與該信息類型相對(duì)應(yīng)的信息抽取方式。這樣,在確定出回答詢問(wèn)語(yǔ)句所需的各詢問(wèn)信息的信息類型后,針對(duì)每種信息類型,可以直接調(diào)取與該信息類型相對(duì)應(yīng)的信息抽取方式,從詢問(wèn)語(yǔ)句中對(duì)屬于該信息類型的詢問(wèn)信息進(jìn)行抽取。這樣,對(duì)于屬于不同領(lǐng)域的兩個(gè)詢問(wèn)語(yǔ)句,若回答這兩個(gè)詢問(wèn)語(yǔ)句所需的各詢問(wèn)信息中存在部分相同的信息類型,則針對(duì)相同的每個(gè)信息類型,可以采用相同的信息抽取方式來(lái)進(jìn)行該信息類型的詢問(wèn)信息的抽??;同樣地,對(duì)于每個(gè)詢問(wèn)語(yǔ)句,若回答該詢問(wèn)語(yǔ)句所需的各詢問(wèn)信息中存在屬于同一信息類型的不同詢問(wèn)信息,也可以采用相同的信息抽取方式抽取出屬于該信息類型的不同詢問(wèn)信息的取值。
[0051]進(jìn)一步地,本發(fā)明的發(fā)明人還考慮到,可以根據(jù)定義的信息類型,針對(duì)問(wèn)答系統(tǒng)支持的每個(gè)領(lǐng)域,確定出用于回答屬于該領(lǐng)域的詢問(wèn)語(yǔ)句所必須包含的詢問(wèn)信息及其信息類型;并針對(duì)每個(gè)領(lǐng)域,可以預(yù)先設(shè)置與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置,在設(shè)置的領(lǐng)域參數(shù)配置中存儲(chǔ)了回答屬于該領(lǐng)域的詢問(wèn)語(yǔ)句所必須包含的詢問(wèn)信息及其信息類型。這樣,每多支持一種領(lǐng)域的問(wèn)答查詢服務(wù)請(qǐng)求,只需針對(duì)該領(lǐng)域進(jìn)行領(lǐng)域參數(shù)配置的設(shè)置即可,無(wú)需再針對(duì)該新增領(lǐng)域進(jìn)行與該新增領(lǐng)域相對(duì)應(yīng)的問(wèn)答處理裝置的開(kāi)發(fā),大大縮短了開(kāi)發(fā)周期,提高了問(wèn)答系統(tǒng)的領(lǐng)域可擴(kuò)展性。
[0052]下面結(jié)合附圖詳細(xì)說(shuō)明本發(fā)明的技術(shù)方案。
[0053]本發(fā)明實(shí)施例中,在對(duì)詢問(wèn)語(yǔ)句進(jìn)行問(wèn)答處理之前,需預(yù)先定義若干個(gè)信息類型,并針對(duì)每個(gè)信息類型,設(shè)置與該信息類型相對(duì)應(yīng)的信息抽取方式。
[0054]具體地,可以預(yù)先收集設(shè)定數(shù)量的屬于不同領(lǐng)域的詢問(wèn)語(yǔ)句后,針對(duì)每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息;并根據(jù)所有確定出的詢問(wèn)信息的具體取值,基于XML (extensible Markup Language,可擴(kuò)展標(biāo)記語(yǔ)言)規(guī)范或其他語(yǔ)法規(guī)則,歸納定義出:日期時(shí)間型、地名型、數(shù)值型、列舉型、正則型、社區(qū)信息型等設(shè)定種類數(shù)量的信息類型。例如,可以將領(lǐng)域內(nèi)的特有詞(如餐飲界的各大菜系、籃球職業(yè)聯(lián)賽的各球隊(duì)名等)作為列舉型的詢問(wèn)信息;可以將符合某些特征的信息(如車牌號(hào)、電話號(hào)碼)作為正則型的詢問(wèn)信息;可以將涉及用戶的社區(qū)信息作為社區(qū)信息型的詢問(wèn)信息等等。然后,針對(duì)歸納定義出的每個(gè)信息類型,設(shè)置與該信息類型相對(duì)應(yīng)的信息抽取方式。其中,與該信息類型相對(duì)應(yīng)的信息抽取方式具體是由本領(lǐng)域技術(shù)人員根據(jù)常用的信息抽取技術(shù)手段進(jìn)行設(shè)置的,用于從詢問(wèn)語(yǔ)句中抽取出計(jì)算機(jī)可理解的、屬于該信息類型的詢問(wèn)信息。事實(shí)上,詢問(wèn)信息的取值具體可以是從詢問(wèn)語(yǔ)句中抽取出的字符串形式的詢問(wèn)信息;與信息類型相對(duì)應(yīng)的信息抽取方式具體可以表現(xiàn)為計(jì)算機(jī)程序代碼。
[0055]例如,對(duì)于詢問(wèn)語(yǔ)句中采用自然語(yǔ)言表達(dá)的詞語(yǔ),如“今天”、“明天”、“本周”、“2014-01-01”、“01.01.2014”等符合日期時(shí)間型的格式的詞語(yǔ),都可以采用與日期時(shí)間型相對(duì)應(yīng)的信息抽取方式從詢問(wèn)語(yǔ)句中進(jìn)行日期時(shí)間型的詢問(wèn)信息的提取并轉(zhuǎn)化為計(jì)算機(jī)可理解的日期。例如,可以采用與日期時(shí)間型相對(duì)應(yīng)的信息抽取方式,從詢問(wèn)語(yǔ)句“今天北京的天氣怎么樣? ”提取出“今天”,并將提取出的“今天”轉(zhuǎn)化為當(dāng)天具體的日期“2014年01月01日”后作為該詢問(wèn)語(yǔ)句中的日期時(shí)間型的詢問(wèn)信息的取值。
[0056]實(shí)際應(yīng)用中,地名一般可以劃分為五個(gè)級(jí)別:國(guó)家、省份、地市、區(qū)、街道。因此,對(duì)于詢問(wèn)語(yǔ)句中涉及地名的詞語(yǔ),則可以采用與地名型相對(duì)應(yīng)的信息抽取方式從詢問(wèn)語(yǔ)句中進(jìn)行地名型的詢問(wèn)信息的提取并轉(zhuǎn)化為計(jì)算機(jī)可理解的格式。例如,抽取出的地名型的詢問(wèn)信息可以具體表現(xiàn)為“國(guó)家、省份、地市、區(qū)、街道”的五級(jí)格式,例如,“中國(guó)、山東、青島、市南區(qū)、珠海一路”;當(dāng)然,在不出現(xiàn)地名歧義的前提下,抽取出的地名型的詢問(wèn)信息也可以表現(xiàn)為“省份、地市、區(qū)、街道”的四級(jí)格式,或包括更少級(jí)別的格式。
[0057]對(duì)于詢問(wèn)語(yǔ)句中涉及數(shù)值型的詞語(yǔ),則可以采用與數(shù)值型相對(duì)應(yīng)的信息抽取方式從詢問(wèn)語(yǔ)句中進(jìn)行數(shù)值型的詢問(wèn)信息的提取并轉(zhuǎn)化為計(jì)算機(jī)可理解的格式。例如,可以將計(jì)算機(jī)可理解的數(shù)字“360”直接提取為數(shù)值型的詢問(wèn)信息的取值,也可以將文字表達(dá)的數(shù)值型詞語(yǔ)“八百六”轉(zhuǎn)化為數(shù)字“860”后作為數(shù)值型的詢問(wèn)信息的取值。
[0058]實(shí)際應(yīng)用中,詢問(wèn)語(yǔ)句可能會(huì)涉及其所屬的領(lǐng)域中特有的沒(méi)有規(guī)律的列舉型詞語(yǔ),例如,餐飲界的各大菜系,或籃球職業(yè)聯(lián)賽各球隊(duì)隊(duì)名等。因此,對(duì)于涉及列舉型詞語(yǔ)的詢問(wèn)語(yǔ)句,則可以采用與列舉型相對(duì)應(yīng)的信息抽取方式,結(jié)合問(wèn)答系統(tǒng)中預(yù)先設(shè)置的該領(lǐng)域的關(guān)鍵詞列表,從詢問(wèn)語(yǔ)句中提取出與該關(guān)鍵詞列表中的關(guān)鍵詞相同的內(nèi)容,并可以直接將提取出的內(nèi)容作為列舉型的詢問(wèn)信息的取值。事實(shí)上,對(duì)于領(lǐng)域中特有的沒(méi)有規(guī)律的列舉型詞語(yǔ),可能會(huì)存在別名,因此,對(duì)于具有別名的列舉型詞語(yǔ),也可以將該列舉型詞語(yǔ)的別名設(shè)置在該領(lǐng)域的關(guān)鍵詞列表中。
[0059]進(jìn)一步地,在對(duì)詢問(wèn)語(yǔ)句進(jìn)行問(wèn)答處理之前,還需針對(duì)問(wèn)答系統(tǒng)所支持的每個(gè)領(lǐng)域,基于上述定義的信息類型,預(yù)先設(shè)置與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置,具體流程如圖1所示,包括如下步驟:
[0060]SlOl:收集預(yù)定數(shù)量的屬于該領(lǐng)域的詢問(wèn)語(yǔ)句,并針對(duì)收集的每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息。
[0061]其中,針對(duì)問(wèn)答系統(tǒng)所支持的每個(gè)領(lǐng)域,屬于該領(lǐng)域的詢問(wèn)語(yǔ)句、以及回答收集的詢問(wèn)語(yǔ)句所需的詢問(wèn)信息均是由本領(lǐng)域技術(shù)人員收集的;且收集的詢問(wèn)語(yǔ)句的具體內(nèi)容、以及收集的詢問(wèn)語(yǔ)句的數(shù)量均是由本領(lǐng)域技術(shù)人員根據(jù)經(jīng)驗(yàn)進(jìn)行選取和調(diào)整設(shè)定的,目的是為了保證后續(xù)能夠根據(jù)收集的內(nèi)容確定出回答屬于該領(lǐng)域的詢問(wèn)語(yǔ)句所必須包含的詢問(wèn)信息的信息類型。
[0062]S102:對(duì)于每個(gè)確定出的詢問(wèn)信息,確定該詢問(wèn)信息的信息類型,并將確定出的信息類型作為該詢問(wèn)語(yǔ)句所涉及的信息類型。
[0063]具體地,針對(duì)收集的屬于該領(lǐng)域的每個(gè)詢問(wèn)語(yǔ)句,可以根據(jù)回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息的具體取值,確定出該詢問(wèn)信息的信息類型,并將確定出的信息類型作為該詢問(wèn)語(yǔ)句所涉及的信息類型。其中,詢問(wèn)信息的信息類型是基于預(yù)先統(tǒng)計(jì)的詢問(wèn)信息的具體內(nèi)容所定義的,可以包括:日期時(shí)間型、地名型、數(shù)值型、列舉型、正則型、社區(qū)信息型等。
[0064]例如,對(duì)于每個(gè)確定出的詢問(wèn)信息,若預(yù)先設(shè)置的該領(lǐng)域的關(guān)鍵詞列表中存在與該詢問(wèn)信息的取值相同的關(guān)鍵詞,則可以確定該詢問(wèn)信息的信息類型為列舉型。若該詢問(wèn)信息的取值與地名型相對(duì)應(yīng)的地名列表中記錄的地名相同,即該詢問(wèn)信息的具體取值涉及到了國(guó)家城市等地名信息,則可以確定該詢問(wèn)信息的信息類型為地名型。若該詢問(wèn)信息的取值與所述社區(qū)信息型相對(duì)應(yīng)的社區(qū)信息列表中記錄的社區(qū)信息相同,則可以確定該詢問(wèn)信息的信息類型為社區(qū)信息型。若該詢問(wèn)信息的ASCII (American Standard Code forInformation Interchange,美國(guó)信息交換標(biāo)準(zhǔn)代碼)碼處于數(shù)字ASCII碼范圍內(nèi),則可以確定該詢問(wèn)信息的信息類型為數(shù)值型。若該詢問(wèn)信息的取值與日期時(shí)間型相對(duì)應(yīng)的日期時(shí)間列表中記錄的關(guān)鍵詞相同,則可以確定該詢問(wèn)信息的信息類型為日期時(shí)間型。進(jìn)一步地,在確定詢問(wèn)信息的信息類型為數(shù)值型之后,還可以進(jìn)一步判斷該數(shù)值型的詢問(wèn)信息的取值是否符合日期時(shí)間型的格式,若是,則可以確定該詢問(wèn)信息的信息類型為日期時(shí)間型;同理,可以進(jìn)一步判斷該數(shù)值型的詢問(wèn)信息的取值是否符合設(shè)定的正則表達(dá)式,若是,則可以確定該詢問(wèn)信息的信息類型為正則型。
[0065]S103:將收集的屬于該領(lǐng)域的所有詢問(wèn)語(yǔ)句共同涉及的信息類型確定為與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置中所包含的信息類型。
[0066]具體地,針對(duì)收集的屬于該領(lǐng)域的每個(gè)詢問(wèn)語(yǔ)句,將該詢問(wèn)語(yǔ)句所涉及的信息類型與其他詢問(wèn)語(yǔ)句所涉及的信息類型進(jìn)行比較,從中確定出共同涉及的信息類型。實(shí)際應(yīng)用中,由于屬于該領(lǐng)域的所有詢問(wèn)語(yǔ)句共同涉及的信息類型可以在一定程度上反映出回答該領(lǐng)域的詢問(wèn)語(yǔ)句所必須包含的關(guān)鍵信息的信息類型;在從詢問(wèn)語(yǔ)句中抽取出的詢問(wèn)信息包含了所有關(guān)鍵信息時(shí),問(wèn)答系統(tǒng)能夠根據(jù)詢問(wèn)信息查找出該詢問(wèn)語(yǔ)句的回答內(nèi)容。因此,可以將收集的屬于該領(lǐng)域的所有詢問(wèn)語(yǔ)句共同涉及的信息類型作為回答該領(lǐng)域的詢問(wèn)語(yǔ)句所必須包含的詢問(wèn)信息的信息類型,并確定為與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置中所包含的信息類型(本文中也可簡(jiǎn)稱為該領(lǐng)域所涉及的信息類型)。
[0067]更優(yōu)地,還可以在步驟SlOl,確定出回答各詢問(wèn)語(yǔ)句所需的詢問(wèn)信息之后,統(tǒng)計(jì)出回答收集的所有詢問(wèn)語(yǔ)句所需包含的共同的詢問(wèn)信息;繼而,針對(duì)統(tǒng)計(jì)出的每個(gè)詢問(wèn)信息,確定出該詢問(wèn)信息的信息類型。這樣,進(jìn)一步地,可以將統(tǒng)計(jì)出的詢問(wèn)信息的信息類型確定為與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置中所包含的信息類型;還可以將統(tǒng)計(jì)出的回答收集的所有詢問(wèn)語(yǔ)句所需包含的共同的詢問(wèn)信息,確定為與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置中所包含的詢問(wèn)信息。
[0068]實(shí)際應(yīng)用中,對(duì)于屬于不同的領(lǐng)域的詢問(wèn)語(yǔ)句,包含的詢問(wèn)信息可能屬于相同的信息類型,但對(duì)于詢問(wèn)信息的具體取值的要求存在差異。所以,更優(yōu)地,在設(shè)置與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置的過(guò)程中,還可以對(duì)該領(lǐng)域所涉及的信息類型進(jìn)行限定,以此來(lái)增加問(wèn)答系統(tǒng)中各個(gè)領(lǐng)域的區(qū)分度,并使得抽取出的該信息類型的詢問(wèn)信息的取值定位更精確,提高問(wèn)答系統(tǒng)的查詢效率。例如,可以對(duì)采用與數(shù)值型相對(duì)應(yīng)的信息抽取方式抽取出的詢問(wèn)信息的取值范圍進(jìn)行限定,或?qū)Σ捎门c地名型相對(duì)應(yīng)的信息抽取方式抽取出的詢問(wèn)信息的級(jí)別進(jìn)行限定等。
[0069]基于上述預(yù)先定義的信息類型、以及為各領(lǐng)域設(shè)置的領(lǐng)域參數(shù)配置和領(lǐng)域知識(shí)數(shù)據(jù)庫(kù),本發(fā)明實(shí)施例提供了一種問(wèn)答系統(tǒng)的問(wèn)答處理方法,具體流程如圖2所示,包括如下步驟:
[0070]S201:問(wèn)答系統(tǒng)在接收到用戶發(fā)送的詢問(wèn)語(yǔ)句后,確定出該詢問(wèn)語(yǔ)句所屬的領(lǐng)域。
[0071]具體地,在用戶通過(guò)客戶端訪問(wèn)問(wèn)答系統(tǒng)并發(fā)送詢問(wèn)語(yǔ)句后,問(wèn)答系統(tǒng)可以采用本領(lǐng)域技術(shù)人員常用的技術(shù)手段對(duì)接收的詢問(wèn)語(yǔ)句進(jìn)行文本分類,確定出該詢問(wèn)語(yǔ)句所屬的領(lǐng)域。例如,可以將接收的詢問(wèn)語(yǔ)句的具體內(nèi)容與預(yù)先設(shè)置的各領(lǐng)域(包括該問(wèn)答系統(tǒng)所支持的、以及不支持的領(lǐng)域)的關(guān)鍵詞進(jìn)行匹配,計(jì)算出該詢問(wèn)語(yǔ)句與各領(lǐng)域的相似度后,將相似度最大或超過(guò)設(shè)定閾值的領(lǐng)域確定為該詢問(wèn)語(yǔ)句的所屬的領(lǐng)域,其中,關(guān)于詢問(wèn)語(yǔ)句與各領(lǐng)域的關(guān)鍵詞的匹配、以及與各領(lǐng)域的相似度的計(jì)算均可采用本領(lǐng)域技術(shù)人員常用的技術(shù)手段,在此不再詳述。
[0072]S202:問(wèn)答系統(tǒng)進(jìn)而加載與確定出的領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置。
[0073]具體地,問(wèn)答系統(tǒng)可以根據(jù)確定出的該詢問(wèn)語(yǔ)句所屬的領(lǐng)域,加載與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置。實(shí)際應(yīng)用中,預(yù)先設(shè)置在問(wèn)答系統(tǒng)中的領(lǐng)域參數(shù)配置是有限的,也就是說(shuō),問(wèn)答系統(tǒng)僅能對(duì)屬于其可支持的領(lǐng)域的詢問(wèn)語(yǔ)句進(jìn)行問(wèn)答處理。因此,在本步驟中,對(duì)于不屬于問(wèn)答系統(tǒng)所支持的領(lǐng)域的問(wèn)答查詢服務(wù)請(qǐng)求,則無(wú)法加載與確定出的領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置。這樣,在實(shí)際應(yīng)用中,在問(wèn)答系統(tǒng)無(wú)法加載領(lǐng)域參數(shù)配置時(shí),可以向客戶端返回提示語(yǔ),向客戶提示該問(wèn)答系統(tǒng)所支持的領(lǐng)域有哪些、以及如何使用該問(wèn)答系統(tǒng)等內(nèi)容。
[0074]S203:針對(duì)加載的領(lǐng)域參數(shù)配置中的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽取。
[0075]實(shí)際應(yīng)用中,領(lǐng)域參數(shù)配置中的每個(gè)信息類型具體指回答屬于與領(lǐng)域參數(shù)配置相對(duì)應(yīng)的領(lǐng)域的詢問(wèn)語(yǔ)句所必須包含的詢問(wèn)信息的信息類型,即該領(lǐng)域所涉及的信息類型。因此,在本步驟中,問(wèn)答系統(tǒng)可以在從加載的領(lǐng)域參數(shù)配置中獲取預(yù)先存儲(chǔ)的信息類型后,可以針對(duì)獲取的每個(gè)信息類型,調(diào)取預(yù)先設(shè)置的與該信息類型相對(duì)應(yīng)的信息抽取方式后,對(duì)接收的詢問(wèn)語(yǔ)句進(jìn)行該信息類型的詢問(wèn)信息的抽取。若從該詢問(wèn)語(yǔ)句中沒(méi)有抽取到該信息類型的詢問(wèn)信息,即沒(méi)有得到該信息類型的詢問(wèn)信息的具體取值,則可以將該信息類型作為該詢問(wèn)語(yǔ)句所缺少的信息類型進(jìn)行記錄。
[0076]這樣,在執(zhí)行步驟S204之前,可以檢測(cè)是否記錄有該詢問(wèn)語(yǔ)句所缺少的信息類型;若該詢問(wèn)語(yǔ)句沒(méi)有缺少的信息類型,則可以執(zhí)行步驟S204。
[0077]否則,問(wèn)答系統(tǒng)可以根據(jù)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,向用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息;并在接收到用戶根據(jù)提示信息發(fā)送的補(bǔ)充信息后,針對(duì)該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從補(bǔ)充信息中進(jìn)行該信息類型的詢問(wèn)信息的抽取。其中,問(wèn)答系統(tǒng)可以向用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息之后,等待用戶根據(jù)提示信息發(fā)送補(bǔ)充信息。若在設(shè)定時(shí)間內(nèi)沒(méi)有接收到補(bǔ)充信息,則可以結(jié)束本次問(wèn)答處理。這樣,可以避免問(wèn)答系統(tǒng)因缺少部分信息導(dǎo)致無(wú)法查找出回答、或是查找出的回答不是用戶想要的結(jié)果,提高了問(wèn)答系統(tǒng)給出回答的準(zhǔn)確度。而且,通過(guò)向用戶返回提示語(yǔ),可以增加問(wèn)答系統(tǒng)與用戶之間的交互,使得問(wèn)答系統(tǒng)的服務(wù)更加人性化的同時(shí),且通過(guò)定位更加準(zhǔn)確的詢問(wèn)信息可提高問(wèn)答系統(tǒng)給出回答的效率。
[0078]實(shí)際應(yīng)用中,對(duì)于每個(gè)領(lǐng)域,回答屬于該領(lǐng)域的詢問(wèn)語(yǔ)句所必須包含的詢問(wèn)信息中,可能會(huì)存在有些詢問(wèn)信息是具有默認(rèn)取值的。其中的默認(rèn)取值具體是指在屬于該領(lǐng)域的詢問(wèn)語(yǔ)句的查詢過(guò)程中因?yàn)槭褂昧?xí)慣而隱含的內(nèi)容。因此,更優(yōu)地,在針對(duì)問(wèn)答系統(tǒng)所支持的每個(gè)領(lǐng)域,設(shè)置與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置的過(guò)程中,還可以在該領(lǐng)域參數(shù)配置中設(shè)置具有默認(rèn)取值的詢問(wèn)信息,并確定出該具有默認(rèn)取值的詢問(wèn)信息的信息類型。這樣,在確定出接收的詢問(wèn)語(yǔ)句所缺少的信息類型之后,在問(wèn)答系統(tǒng)根據(jù)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,向用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息之前,還可以針對(duì)記錄的該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,進(jìn)一步判斷該缺少的信息類型是否為設(shè)置于該領(lǐng)域參數(shù)配置中的具有默認(rèn)取值的詢問(wèn)信息的信息類型,若是,則問(wèn)答系統(tǒng)可以將該默認(rèn)取值作為抽取出的該信息類型的詢問(wèn)信息的取值,并將記錄的該信息類型進(jìn)行刪除。否則,問(wèn)答系統(tǒng)可以根據(jù)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,向用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息。這樣,問(wèn)答系統(tǒng)就無(wú)需再針對(duì)有默認(rèn)取值的詢問(wèn)信息返回提示信息,可以減少返回提示信息的次數(shù),提高問(wèn)答系統(tǒng)給出回答的效率。
[0079]由于在用戶首次發(fā)送的詢問(wèn)語(yǔ)句所包含的詢問(wèn)信息較少的情況下,可能會(huì)出現(xiàn)多次提示用戶補(bǔ)充信息的現(xiàn)象,因此,為了進(jìn)一步提高問(wèn)答系統(tǒng)給出回答的效率,更優(yōu)地,在問(wèn)答系統(tǒng)根據(jù)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,每次向用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息之后,還可以對(duì)返回提示信息的次數(shù)進(jìn)行計(jì)數(shù)。這樣,問(wèn)答系統(tǒng)可以在下一次檢測(cè)到記錄有該詢問(wèn)語(yǔ)句所缺少的信息類型之后、在根據(jù)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,向用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息之前,可以先將返回提示信息的次數(shù)與設(shè)定次數(shù)進(jìn)行比較,若返回提示信息的次數(shù)多于設(shè)定次數(shù),則可以判定已經(jīng)出現(xiàn)多次提醒,并結(jié)束本次問(wèn)答處理;否則,繼續(xù)向用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息。這樣,可以通過(guò)限制返回提示信息的次數(shù),避免反復(fù)多次向用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息,導(dǎo)致用戶體驗(yàn)大幅下降。其中,關(guān)于如何檢測(cè)已經(jīng)返回提示信息的次數(shù)為本領(lǐng)域技術(shù)人員所公知的常識(shí),在此不再贅述。
[0080]實(shí)際應(yīng)用中,對(duì)于問(wèn)答系統(tǒng)可支持的每個(gè)領(lǐng)域,回答屬于該領(lǐng)域的詢問(wèn)語(yǔ)句所需的各詢問(wèn)信息之間可能會(huì)存在依賴關(guān)系,即某一詢問(wèn)信息的取值發(fā)生變化時(shí)會(huì)影響到其他詢問(wèn)信息的取值。因此,更優(yōu)地,針對(duì)問(wèn)答系統(tǒng)可支持的每個(gè)領(lǐng)域,在與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置的設(shè)置過(guò)程中,可以為該領(lǐng)域所涉及的每種信息類型的詢問(wèn)信息設(shè)置相應(yīng)的依賴關(guān)系屬性。這樣,可以在針對(duì)加載的領(lǐng)域參數(shù)配置中的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中抽取出該信息類型的詢問(wèn)信息后,可以進(jìn)一步根據(jù)該信息類型的詢問(wèn)信息的依賴關(guān)系屬性,確定出與該信息類型的詢問(wèn)信息具有依賴關(guān)系的詢問(wèn)信息及其信息類型;并以與確定出的信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行詢問(wèn)信息的抽取。這樣,可以使得回答系統(tǒng)根據(jù)更多的詢問(wèn)信息給出更加完整的、準(zhǔn)確度更高的回答。
[0081]實(shí)際應(yīng)用中,在針對(duì)問(wèn)答系統(tǒng)所支持的每個(gè)領(lǐng)域的領(lǐng)域參數(shù)配置中包含了回答收集的所有詢問(wèn)語(yǔ)句所需包含的共同的詢問(wèn)信息的情況下,具體地,可以針對(duì)加載的領(lǐng)域參數(shù)配置中的每個(gè)詢問(wèn)信息,以與該詢問(wèn)信息的信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行該詢問(wèn)信息的抽取。這樣,可以將從詢問(wèn)語(yǔ)句中沒(méi)有抽取到取值的詢問(wèn)信息作為該詢問(wèn)語(yǔ)句所缺少的詢問(wèn)信息進(jìn)行記錄;繼而,可以采用如同上述針對(duì)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型所進(jìn)行的后續(xù)處理方式,針對(duì)該詢問(wèn)語(yǔ)句所缺少的詢問(wèn)信息,進(jìn)行提示信息的返回、以及對(duì)根據(jù)提示信息所返回的補(bǔ)充信息進(jìn)行該詢問(wèn)語(yǔ)句所缺少的詢問(wèn)信息的抽取,在此不再贅述。
[0082]S204:從與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出與所有抽取出的詢問(wèn)信息的取值相匹配的內(nèi)容,作為該詢問(wèn)語(yǔ)句的回答進(jìn)行返回。
[0083]具體地,問(wèn)答系統(tǒng)可以通過(guò)加載的領(lǐng)域參數(shù)配置中預(yù)先設(shè)置的數(shù)據(jù)接口,訪問(wèn)與加載的領(lǐng)域參數(shù)配置相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù),從中查找出與所有抽取出的詢問(wèn)信息的取值都匹配的內(nèi)容后,將查找出的內(nèi)容作為該詢問(wèn)語(yǔ)句的回答,并返回至用戶所在的客戶端。其中,與加載的領(lǐng)域參數(shù)配置相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)具體可以是存儲(chǔ)在問(wèn)答系統(tǒng)中可通過(guò)數(shù)據(jù)接口直接訪問(wèn)的內(nèi)部數(shù)據(jù)、或者通過(guò)遠(yuǎn)程數(shù)據(jù)接口與問(wèn)答系統(tǒng)相連的外部數(shù)據(jù)。
[0084]基于上述問(wèn)答系統(tǒng)的問(wèn)答處理方法,本發(fā)明實(shí)施例還提供了一種問(wèn)答系統(tǒng),如圖3所示,包括:所屬領(lǐng)域確定模塊301、領(lǐng)域參數(shù)配置加載模塊302、詢問(wèn)信息抽取模塊303、詢問(wèn)語(yǔ)句回答模塊304。
[0085]其中,所屬領(lǐng)域確定模塊301用于在問(wèn)答系統(tǒng)接收到用戶發(fā)送的詢問(wèn)語(yǔ)句后,確定出該詢問(wèn)語(yǔ)句所屬的領(lǐng)域。
[0086]領(lǐng)域參數(shù)配置加載模塊302用于根據(jù)所屬領(lǐng)域確定模塊301確定出的領(lǐng)域,加載與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置。
[0087]詢問(wèn)信息抽取模塊303用于根據(jù)領(lǐng)域參數(shù)配置加載模塊302加載的領(lǐng)域參數(shù)配置,針對(duì)該領(lǐng)域參數(shù)配置中的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽取。
[0088]詢問(wèn)語(yǔ)句回答模塊304用于根據(jù)所屬領(lǐng)域確定模塊301確定出的領(lǐng)域,確定與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù);并根據(jù)詢問(wèn)信息抽取模塊303抽取出的詢問(wèn)信息的取值,從確定的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出相匹配的內(nèi)容,作為該詢問(wèn)語(yǔ)句的回答進(jìn)行返回。
[0089]本發(fā)明實(shí)施例中,該問(wèn)答系統(tǒng)還可以包括:領(lǐng)域參數(shù)配置設(shè)置模塊305。
[0090]領(lǐng)域參數(shù)配置設(shè)置模塊305用于針對(duì)問(wèn)答系統(tǒng)所支持的每個(gè)領(lǐng)域,收集預(yù)定數(shù)量的屬于該領(lǐng)域的詢問(wèn)語(yǔ)句;并針對(duì)收集的每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息后,對(duì)于每個(gè)確定出的詢問(wèn)信息,確定該詢問(wèn)信息的信息類型;并將確定出的信息類型作為該詢問(wèn)語(yǔ)句所涉及的信息類型;將收集的屬于該領(lǐng)域的所有詢問(wèn)語(yǔ)句共同涉及的信息類型確定為與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置中所包含的信息類型。其中,領(lǐng)域參數(shù)配置設(shè)置模塊305確定出的詢問(wèn)信息的信息類型可以包括:日期時(shí)間型、地名型、數(shù)值型、列舉型、正則型、社區(qū)信息型等。
[0091]例如,針對(duì)每個(gè)領(lǐng)域,領(lǐng)域參數(shù)配置設(shè)置模塊305可以在針對(duì)收集的每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息后,對(duì)于每個(gè)確定出的詢問(wèn)信息,若該詢問(wèn)信息的取值與預(yù)先設(shè)置的該領(lǐng)域的列表類關(guān)鍵詞相同,則確定該詢問(wèn)信息的信息類型為列舉型。若該詢問(wèn)信息的取值與地名型相對(duì)應(yīng)的地名列表中記錄的地名相同,即該詢問(wèn)信息的具體取值涉及到了國(guó)家城市等地名信息,則可以確定該詢問(wèn)信息的信息類型為地名型。若該詢問(wèn)信息的取值與所述社區(qū)信息型相對(duì)應(yīng)的社區(qū)信息列表中記錄的社區(qū)信息相同,則可以確定該詢問(wèn)信息的信息類型為社區(qū)信息型。若該詢問(wèn)信息的ASCII碼處于數(shù)字ASCII碼范圍內(nèi),則可以確定該詢問(wèn)信息的信息類型為數(shù)值型。若該詢問(wèn)信息的取值與日期時(shí)間型相對(duì)應(yīng)的日期時(shí)間列表中記錄的關(guān)鍵詞相同,則可以確定該詢問(wèn)信息的信息類型為日期時(shí)間型。進(jìn)一步地,在確定詢問(wèn)信息的信息類型為數(shù)值型之后,還可以進(jìn)一步判斷該數(shù)值型的詢問(wèn)信息的取值是否符合日期時(shí)間型的格式,若是,則可以確定該詢問(wèn)信息的信息類型為日期時(shí)間型;同理,可以進(jìn)一步判斷該數(shù)值型的詢問(wèn)信息的取值是否符合設(shè)定的正則表達(dá)式,若是,則可以確定該詢問(wèn)信息的信息類型為正則型。
[0092]更優(yōu)地,本發(fā)明實(shí)施例中的詢問(wèn)信息抽取模塊303還用于針對(duì)由領(lǐng)域參數(shù)配置加載模塊302加載的領(lǐng)域參數(shù)配置中的每個(gè)信息類型,若從接收的詢問(wèn)語(yǔ)句中沒(méi)有抽取到該信息類型的詢問(wèn)信息,則可以將該信息類型作為該詢問(wèn)語(yǔ)句所缺少的信息類型進(jìn)行記錄。這樣,相應(yīng)地,該問(wèn)答系統(tǒng)還可以包括:詢問(wèn)信息補(bǔ)充模塊306。
[0093]其中,詢問(wèn)信息補(bǔ)充模塊306用于獲取詢問(wèn)信息抽取模塊303記錄的接收的詢問(wèn)語(yǔ)句所缺少的信息類型,并可以根據(jù)詢問(wèn)信息抽取模塊303所記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,向用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息;并在接收到用戶根據(jù)提示信息發(fā)送的補(bǔ)充信息后,針對(duì)該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從補(bǔ)充信息中進(jìn)行該信息類型的詢問(wèn)信息的抽取,并將抽取的詢問(wèn)信息發(fā)送至所述詢問(wèn)信息抽取模塊。
[0094]作為一種更優(yōu)的實(shí)施方式,領(lǐng)域參數(shù)配置設(shè)置模塊306還用于針對(duì)該問(wèn)答系統(tǒng)所支持的每個(gè)領(lǐng)域,設(shè)置具有默認(rèn)取值的詢問(wèn)信息,并確定出該具有默認(rèn)取值的詢問(wèn)信息的信息類型。這樣,詢問(wèn)信息補(bǔ)充模塊306可以在獲取詢問(wèn)信息抽取模塊303記錄的接收的詢問(wèn)語(yǔ)句所缺少的信息類型之后,針對(duì)獲取的該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,若進(jìn)一步判斷該缺少的信息類型為設(shè)置于該領(lǐng)域參數(shù)配置中的具有默認(rèn)取值的詢問(wèn)信息的信息類型,則可以將該默認(rèn)取值作為抽取出的該信息類型的詢問(wèn)信息的取值,并將記錄的該信息類型進(jìn)行刪除。這樣,問(wèn)答系統(tǒng)就無(wú)需再針對(duì)有默認(rèn)取值的詢問(wèn)信息返回提示信息,可以減少返回提示信息的次數(shù),提高問(wèn)答系統(tǒng)給出回答的效率。
[0095]更優(yōu)地,領(lǐng)域參數(shù)配置設(shè)置模塊306還可以用于針對(duì)該問(wèn)答系統(tǒng)所支持的每個(gè)領(lǐng)域,為該領(lǐng)域所涉及的每種信息類型的詢問(wèn)信息設(shè)置相應(yīng)的依賴關(guān)系屬性。這樣,詢問(wèn)信息抽取模塊303在針對(duì)加載的領(lǐng)域參數(shù)配置中的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中抽取出該信息類型的詢問(wèn)信息后,還可以進(jìn)一步根據(jù)該信息類型的詢問(wèn)信息的依賴關(guān)系屬性,確定出與該信息類型的詢問(wèn)信息具有依賴關(guān)系的詢問(wèn)信息及其信息類型;并以與確定出的信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行詢問(wèn)信息的抽取。這樣,可以使得回答系統(tǒng)根據(jù)更多的詢問(wèn)信息給出更加完整的、準(zhǔn)確度更高的回答。
[0096]本發(fā)明的技術(shù)方案中,在確定出詢問(wèn)語(yǔ)句的所屬的領(lǐng)域后,問(wèn)答系統(tǒng)可以加載與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置;繼而,針對(duì)加載的領(lǐng)域參數(shù)配置中預(yù)先存儲(chǔ)的每個(gè)信息類型,可以調(diào)取預(yù)先設(shè)置的與該信息類型相對(duì)應(yīng)的信息抽取方式,對(duì)該詢問(wèn)語(yǔ)句進(jìn)行該信息類型的詢問(wèn)信息的抽?。徊呐c加載的領(lǐng)域參數(shù)配置相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出與所有抽取出的詢問(wèn)信息相匹配的內(nèi)容,作為該詢問(wèn)語(yǔ)句的回答。這樣,由于對(duì)于屬于不同領(lǐng)域的詢問(wèn)語(yǔ)句,可以采用同一種信息抽取方式進(jìn)行相同信息類型的詢問(wèn)信息的抽取,和處理引導(dǎo)流程。因此,問(wèn)答系統(tǒng)每多支持一種領(lǐng)域的問(wèn)答查詢服務(wù)請(qǐng)求,只需針對(duì)該領(lǐng)域進(jìn)行領(lǐng)域參數(shù)配置的設(shè)置即可,無(wú)需再針對(duì)該新增領(lǐng)域進(jìn)行與該新增領(lǐng)域相對(duì)應(yīng)的問(wèn)答處理裝置的開(kāi)發(fā),大大縮短了開(kāi)發(fā)周期,提高了問(wèn)答系統(tǒng)的領(lǐng)域可擴(kuò)展性。
[0097]本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,該程序可以存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,如:R0M/RAM、磁碟、光盤(pán)等。
[0098]以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本【技術(shù)領(lǐng)域】的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以作出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
【權(quán)利要求】
1.一種問(wèn)答系統(tǒng)的問(wèn)答處理方法,其特征在于,包括: 問(wèn)答系統(tǒng)在接收到用戶發(fā)送的詢問(wèn)語(yǔ)句后,確定出該詢問(wèn)語(yǔ)句所屬的領(lǐng)域,并加載與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置; 針對(duì)加載的領(lǐng)域參數(shù)配置中的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽?。? 從與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出與所有抽取出的詢問(wèn)信息的取值相匹配的內(nèi)容,作為該詢問(wèn)語(yǔ)句的回答進(jìn)行返回。
2.如權(quán)利要求1所述的方法,其特征在于,所述與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置是預(yù)先設(shè)置的: 收集預(yù)定數(shù)量的屬于該領(lǐng)域的詢問(wèn)語(yǔ)句;并 針對(duì)收集的每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息后,對(duì)于每個(gè)確定出的詢問(wèn)信息,確定該詢問(wèn)信息的信息類型;并將確定出的信息類型作為該詢問(wèn)語(yǔ)句所涉及的信息類型; 將收集的屬于該領(lǐng)域的所有詢問(wèn)語(yǔ)句共同涉及的信息類型確定為與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置中所包含的信息類型。
3.如權(quán)利要求2所述的方法,其特征在于,在所述以與該信息類型相對(duì)應(yīng)的信息抽取方式從該詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽取后,還包括: 若從該詢問(wèn)語(yǔ)句中沒(méi)有抽取出該信息類型的詢問(wèn)信息,則將該信息類型作為該詢問(wèn)語(yǔ)句所缺少的信息類型進(jìn)行記錄;以及 在所述從與所述領(lǐng)域參數(shù)配置相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出與所有抽取出的詢問(wèn)信息的取值相匹配的內(nèi)容之前,還包括: 若記錄有該詢問(wèn)語(yǔ)句所缺少的信息類型,則所述問(wèn)答系統(tǒng)根據(jù)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,向所述用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息;并在接收到用戶根據(jù)所述提示信息發(fā)送的補(bǔ)充信息后,針對(duì)該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從所述補(bǔ)充信息中進(jìn)行該信息類型的詢問(wèn)信息的抽取。
4.如權(quán)利要求3所述的方法,其特征在于,在所述問(wèn)答系統(tǒng)根據(jù)記錄的該詢問(wèn)語(yǔ)句所缺少的信息類型,向所述用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息之前,還包括: 針對(duì)記錄的該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,若進(jìn)一步判斷出該信息類型是設(shè)置于所述領(lǐng)域參數(shù)配置中的具有默認(rèn)取值的詢問(wèn)信息的信息類型,則將該默認(rèn)取值作為抽取出的該信息類型的詢問(wèn)信息的取值,并將記錄的該信息類型進(jìn)行刪除。
5.如權(quán)利要求2-4任一所述的方法,其特征在于,所述詢問(wèn)信息的信息類型包括:日期時(shí)間型、地名型、數(shù)值型、列舉型、正則型、社區(qū)信息型;以及 所述對(duì)于每個(gè)確定出的詢問(wèn)信息,確定該詢問(wèn)信息的信息類型,具體包括: 對(duì)于每個(gè)確定出的詢問(wèn)信息,若預(yù)先設(shè)置的該領(lǐng)域的關(guān)鍵詞列表中存在與該詢問(wèn)信息的取值相同的關(guān)鍵詞,則確定該詢問(wèn)信息的信息類型為列舉型; 若該詢問(wèn)信息的取值與所述地名型相對(duì)應(yīng)的地名列表中記錄的地名相同,則確定該詢問(wèn)信息的信息類型為地名型; 若該詢問(wèn)信息的取值與所述社區(qū)信息型相對(duì)應(yīng)的社區(qū)信息列表中記錄的社區(qū)信息相同,則確定該詢問(wèn)信息的信息類型為社區(qū)信息型;若該詢問(wèn)信息的美國(guó)信息交換標(biāo)準(zhǔn)代碼ASCII碼處于數(shù)字ASCII碼范圍內(nèi),則確定該詢問(wèn)信息的信息類型為數(shù)值型;并在數(shù)值型的詢問(wèn)信息的取值符合日期時(shí)間型的格式時(shí),進(jìn)一步確定該詢問(wèn)信息的信息類型為日期時(shí)間型;在數(shù)值型的詢問(wèn)信息的取值符合設(shè)定的正則表達(dá)式時(shí),進(jìn)一步確定該詢問(wèn)信息的信息類型為正則型。
6.—種問(wèn)答系統(tǒng),其特征在于,包括: 所屬領(lǐng)域確定模塊,用于在問(wèn)答系統(tǒng)接收到用戶發(fā)送的詢問(wèn)語(yǔ)句后,確定出該詢問(wèn)語(yǔ)句所屬的領(lǐng)域; 領(lǐng)域參數(shù)配置加載模塊,用于根據(jù)所述所屬領(lǐng)域確定模塊確定出的領(lǐng)域,加載與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置; 詢問(wèn)信息抽取模塊,用于根據(jù)所述領(lǐng)域參數(shù)配置加載模塊加載的領(lǐng)域參數(shù)配置,針對(duì)該領(lǐng)域參數(shù)配置中的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從所述詢問(wèn)語(yǔ)句中進(jìn)行該信息類型的詢問(wèn)信息的抽??; 詢問(wèn)語(yǔ)句回答模塊,用于根據(jù)所述所屬領(lǐng)域確定模塊確定出的領(lǐng)域,確定該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù);并根據(jù)所述詢問(wèn)信息抽取模塊抽取出的詢問(wèn)信息的取值,從確定的領(lǐng)域知識(shí)數(shù)據(jù)庫(kù)中查找出相匹配的內(nèi)容,作為所述詢問(wèn)語(yǔ)句的回答進(jìn)行返回。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,還包括: 領(lǐng)域參數(shù)配置設(shè)置模塊,用于針對(duì)所述問(wèn)答系統(tǒng)所支持的每個(gè)領(lǐng)域,收集預(yù)定數(shù)量的屬于該領(lǐng)域的詢問(wèn)語(yǔ)句;并針對(duì)收集的每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息后,對(duì)于每個(gè)確定出的詢問(wèn)信息,確定該詢問(wèn)信息的信息類型;并將確定出的信息類型作為該詢問(wèn)語(yǔ)句所涉及的信息類型;將收集的屬于該領(lǐng)域的所有詢問(wèn)語(yǔ)句共同涉及的信息類型確定為與該領(lǐng)域相對(duì)應(yīng)的領(lǐng)域參數(shù)配置中所包含的信息類型。
8.如權(quán)利要求6所述的系統(tǒng),其特征在于,還包括:詢問(wèn)信息補(bǔ)充模塊; 所述詢問(wèn)信息抽取模塊還用于針對(duì)由所述領(lǐng)域參數(shù)配置加載模塊加載的領(lǐng)域參數(shù)配置中的每個(gè)信息類型,若從所述詢問(wèn)語(yǔ)句中沒(méi)有抽取出該信息類型的詢問(wèn)信息,則將該信息類型作為該詢問(wèn)語(yǔ)句所缺少的信息類型進(jìn)行記錄;以及 所述詢問(wèn)信息補(bǔ)充模塊,用于獲取所述詢問(wèn)信息抽取模塊記錄的所述詢問(wèn)語(yǔ)句所缺少的信息類型,并根據(jù)記錄的所述詢問(wèn)語(yǔ)句所缺少的信息類型向所述用戶返回補(bǔ)充詢問(wèn)語(yǔ)句的提示信息;并在接收到所述用戶根據(jù)所述提示信息發(fā)送的補(bǔ)充信息后,針對(duì)所述詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,以與該信息類型相對(duì)應(yīng)的信息抽取方式從所述補(bǔ)充信息中進(jìn)行該信息類型的詢問(wèn)信息的抽取,并將抽取的詢問(wèn)信息發(fā)送至所述詢問(wèn)信息抽取模塊。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于, 所述詢問(wèn)信息補(bǔ)充模塊還用于在所述獲取所述詢問(wèn)信息抽取模塊記錄的所述詢問(wèn)語(yǔ)句所缺少的信息類型后,針對(duì)獲取的該詢問(wèn)語(yǔ)句所缺少的每個(gè)信息類型,若進(jìn)一步判斷出該信息類型是設(shè)置于所述領(lǐng)域參數(shù)配置中的具有默認(rèn)取值的詢問(wèn)信息的信息類型,則將該默認(rèn)取值作為抽取出的該信息類型的詢問(wèn)信息的取值,并將記錄的該信息類型進(jìn)行刪除。
10.如權(quán)利要求7-9任一所述的系統(tǒng),其特征在于,所述詢問(wèn)信息的信息類型包括:日期時(shí)間型、地名型、數(shù)值型、列舉型、正則型、社區(qū)信息型;以及 所述領(lǐng)域參數(shù)配置設(shè)置模塊具體用于在針對(duì)收集的每個(gè)詢問(wèn)語(yǔ)句,確定出回答該詢問(wèn)語(yǔ)句所需的詢問(wèn)信息后,對(duì)于每個(gè)確定出的詢問(wèn)信息,若預(yù)先設(shè)置的該領(lǐng)域的關(guān)鍵詞列表中存在與該詢問(wèn)信息的取值相同的關(guān)鍵詞,則確定該詢問(wèn)信息的信息類型為列舉型;若該詢問(wèn)信息的取值與所述地名型相對(duì)應(yīng)的地名列表中記錄的地名相同,則確定該詢問(wèn)信息的信息類型為地名型;若該詢問(wèn)信息的取值與所述社區(qū)信息型相對(duì)應(yīng)的社區(qū)信息列表中記錄的社區(qū)信息相同,則確定該詢問(wèn)信息的信息類型為社區(qū)信息型;若該詢問(wèn)信息的ASCII碼處于數(shù)字ASCII碼范圍內(nèi) ,則確定該詢問(wèn)信息的信息類型為數(shù)值型;并在數(shù)值型的詢問(wèn)信息的取值符合日期時(shí)間型的格式時(shí),進(jìn)一步確定該詢問(wèn)信息的信息類型為日期時(shí)間型;在數(shù)值型的詢問(wèn)信息的取值符合設(shè)定的正則表達(dá)式時(shí),進(jìn)一步確定該詢問(wèn)信息的信息類型為正則型。
【文檔編號(hào)】G06F17/30GK103902672SQ201410102933
【公開(kāi)日】2014年7月2日 申請(qǐng)日期:2014年3月19日 優(yōu)先權(quán)日:2014年3月19日
【發(fā)明者】司德譚 申請(qǐng)人:微夢(mèng)創(chuàng)科網(wǎng)絡(luò)科技(中國(guó))有限公司