1.一種信息處理方法,包括:
將知識庫中的知識分組,以獲得多個(gè)知識集,每個(gè)知識集與一知識類別相關(guān)聯(lián),每個(gè)知識集的知識點(diǎn)包括問句和相關(guān)聯(lián)的答案,其中所述問句包括標(biāo)準(zhǔn)問及其擴(kuò)展問;以及
依據(jù)賬戶所需的知識類別為賬戶指派所述多個(gè)知識集中的至少一個(gè)知識集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
2.如權(quán)利要求1所述的信息處理方法,其特征在于,還包括:
基于由用戶針對一賬戶提供的知識點(diǎn)制備用于該賬戶的自定義知識集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
3.如權(quán)利要求2所述的信息處理方法,其特征在于,所述基于由用戶針對一賬戶提供的知識點(diǎn)制備用于該賬戶的自定義知識集包括:
為用戶提供的每一知識點(diǎn)建立該知識點(diǎn)的標(biāo)準(zhǔn)問。
4.如權(quán)利要求3所述的信息處理方法,其特征在于,所述基于由用戶針對一賬戶提供的知識點(diǎn)制備用于該賬戶的自定義知識集還包括:
為建立的標(biāo)準(zhǔn)問擴(kuò)展出若干擴(kuò)展問。
5.如權(quán)利要求4所述的信息處理方法,其特征在于,所述擴(kuò)展問采用以下方式建立:
提供抽象語義數(shù)據(jù)庫,所述抽象語義數(shù)據(jù)庫包括多個(gè)抽象語義表達(dá)式,所述抽象語義表達(dá)式包括缺失語義成分;
根據(jù)所述抽象語義數(shù)據(jù)庫對所述標(biāo)準(zhǔn)問進(jìn)行抽象語義推薦處理,當(dāng)獲得與所述標(biāo)準(zhǔn)問對應(yīng)的一個(gè)或多個(gè)抽象語義表達(dá)式時(shí),從所述標(biāo)準(zhǔn)問中提取與一個(gè)或多個(gè)抽象語義表達(dá)式的缺失語義成分對應(yīng)的內(nèi)容,并將提取的內(nèi)容填充到對應(yīng)的缺失語義成分中以得到與所述標(biāo)準(zhǔn)問對應(yīng)的一個(gè)或多個(gè)具體語義表達(dá)式,所述具體語義表達(dá)式作為所述標(biāo)準(zhǔn)問的擴(kuò)展問。
6.如權(quán)利要求5所述的信息處理方法,其特征在于,所述抽象語義推薦處理包括:
對所述標(biāo)準(zhǔn)問進(jìn)行分詞處理,得到若干單詞,所述單詞為語義規(guī)則詞或非語義規(guī)則詞;
分別對每個(gè)非語義規(guī)則詞進(jìn)行詞性標(biāo)注處理,得到每個(gè)非語義規(guī)則詞的詞性信息;
分別對每個(gè)語義規(guī)則詞進(jìn)行詞類判斷處理,得到每個(gè)語義規(guī)則詞的詞類信息;
根據(jù)所述詞性信息和詞類信息對抽象語義數(shù)據(jù)庫進(jìn)行搜索處理,得到與所述標(biāo)準(zhǔn)問匹配的抽象語義表達(dá)式。
7.如權(quán)利要求6所述的更新方法,其特征在于,所述抽象語義表達(dá)式還包括語義規(guī)則詞,與所述標(biāo)準(zhǔn)問匹配的抽象語義表達(dá)式滿足以下條件:
抽象語義表達(dá)式的缺失語義成分對應(yīng)的詞性包括標(biāo)準(zhǔn)問對應(yīng)的填充內(nèi)容的詞性;
抽象語義表達(dá)式和標(biāo)準(zhǔn)問中對應(yīng)的語義規(guī)則詞相同或?qū)儆谕辉~類;
抽象語義表達(dá)式的順序與標(biāo)準(zhǔn)問的表達(dá)順序相同。
8.如權(quán)利要求1所述的信息處理方法,其特征在于,所述為賬戶指派所述多個(gè)知識集中的至少一個(gè)知識集包括:
為第一賬戶指派所述多個(gè)知識集中的第一預(yù)定數(shù)目個(gè)知識集;以及
為第二賬戶指派所述多個(gè)知識集中的第二預(yù)定數(shù)目個(gè)知識集,所述第一預(yù)定數(shù)目個(gè)知識集與所述第二預(yù)定數(shù)目個(gè)知識集之間具有公共的知識集。
9.如權(quán)利要求2所述的信息處理方法,其特征在于,還包括:
針對來自預(yù)定賬戶的用戶問句,當(dāng)所述預(yù)定賬戶有相關(guān)聯(lián)的自定義知識集時(shí),首先利用所述自定義知識集為所述用戶問句執(zhí)行知識匹配以提供答案;
若匹配失敗,則利用該用戶的所指派知識集為所述用戶問句執(zhí)行知識匹配以提供答案。
10.如權(quán)利要求9所述的信息處理方法,其特征在于,所述為所述用戶問句執(zhí)行知識匹配包括:
將所述用戶問句與用于知識匹配的知識集中的問句執(zhí)行語義相似度計(jì)算,語義相似度高于閾值的問句中具有最高語義相似度的問句被確定為匹配問句,
所述信息處理方法還包括:
將與所述匹配問句相關(guān)聯(lián)的答案提供給用戶。
11.如權(quán)利要求9所述的信息處理方法,其特征在于,還包括:
若未找到匹配問句,則提供預(yù)設(shè)的答案。
12.如權(quán)利要求1所述的信息處理方法,其特征在于,每個(gè)賬戶與不同的領(lǐng)域的應(yīng)用相關(guān)聯(lián),每個(gè)賬戶的用戶問句經(jīng)由與該賬戶相關(guān)聯(lián)的應(yīng)用從用戶獲得,所有的應(yīng)用共用一個(gè)知識庫。
13.一種信息處理系統(tǒng),包括:
知識庫,所述知識庫中的知識用于為用戶問句提供應(yīng)答;
分組模塊,用于將所述知識庫中的知識分組,以獲得多個(gè)知識集,每個(gè)知識集與一知識類別相關(guān)聯(lián),每個(gè)知識集的知識點(diǎn)包括問句和相關(guān)聯(lián)的答案,其中所述問句包括標(biāo)準(zhǔn)問及其擴(kuò)展問;以及
指派模塊,用于為賬戶指派所述多個(gè)知識集中的至少一個(gè)知識集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
14.如權(quán)利要求13所述的信息處理系統(tǒng),其特征在于,還包括:
知識制備模塊,基于由用戶針對一賬戶提供的知識點(diǎn)制備用于該賬戶的自定義知識集,以用于來自該賬戶的用戶問句的問句應(yīng)答。
15.如權(quán)利要求14所述的信息處理系統(tǒng),其特征在于,所述知識制備模塊為用戶提供的每一知識點(diǎn)建立該知識點(diǎn)的標(biāo)準(zhǔn)問。
16.如權(quán)利要求15所述的信息處理系統(tǒng),其特征在于,所述知識制備模塊進(jìn)一步為建立的標(biāo)準(zhǔn)問擴(kuò)展出若干擴(kuò)展問。
17.如權(quán)利要求16所述的信息處理系統(tǒng),其特征在于,還包括:
抽象語義數(shù)據(jù)庫,所述抽象語義數(shù)據(jù)庫包括多個(gè)抽象語義表達(dá)式,所述抽象語義表達(dá)式包括缺失語義成分,
所述知識制備模塊根據(jù)所述抽象語義數(shù)據(jù)庫對所述標(biāo)準(zhǔn)問進(jìn)行抽象語義推薦處理,當(dāng)獲得與所述標(biāo)準(zhǔn)問對應(yīng)的一個(gè)或多個(gè)抽象語義表達(dá)式時(shí),從所述標(biāo)準(zhǔn)問中提取與一個(gè)或多個(gè)抽象語義表達(dá)式的缺失語義成分對應(yīng)的內(nèi)容,并將提取的內(nèi)容填充到對應(yīng)的缺失語義成分中以得到與所述標(biāo)準(zhǔn)問對應(yīng)的一個(gè)或多個(gè)具體語義表達(dá)式,所述具體語義表達(dá)式作為所述標(biāo)準(zhǔn)問的擴(kuò)展問。
18.如權(quán)利要求17所述的信息處理系統(tǒng),其特征在于,所述抽象語義推薦處理包括:
對所述標(biāo)準(zhǔn)問進(jìn)行分詞處理,得到若干單詞,所述單詞為語義規(guī)則詞或非語義規(guī)則詞;
分別對每個(gè)非語義規(guī)則詞進(jìn)行詞性標(biāo)注處理,得到每個(gè)非語義規(guī)則詞的詞性信息;
分別對每個(gè)語義規(guī)則詞進(jìn)行詞類判斷處理,得到每個(gè)語義規(guī)則詞的詞類信息;
根據(jù)所述詞性信息和詞類信息對抽象語義數(shù)據(jù)庫進(jìn)行搜索處理,得到與所述標(biāo)準(zhǔn)問匹配的抽象語義表達(dá)式。
19.如權(quán)利要求18所述的信息處理系統(tǒng),其特征在于,所述抽象語義表達(dá)式還包括語義規(guī)則詞,與所述標(biāo)準(zhǔn)問匹配的抽象語義表達(dá)式滿足以下條件:
抽象語義表達(dá)式的缺失語義成分對應(yīng)的詞性包括標(biāo)準(zhǔn)問對應(yīng)的填充內(nèi)容的詞性;
抽象語義表達(dá)式和標(biāo)準(zhǔn)問中對應(yīng)的語義規(guī)則詞相同或?qū)儆谕辉~類;
抽象語義表達(dá)式的順序與標(biāo)準(zhǔn)問的表達(dá)順序相同。
20.如權(quán)利要求13所述的信息處理系統(tǒng),其特征在于,所述分組模塊為第一賬戶指派所述多個(gè)知識集中的第一預(yù)定數(shù)目個(gè)知識集;以及為第二賬戶指派所述多個(gè)知識集中的第二預(yù)定數(shù)目個(gè)知識集,所述第一預(yù)定數(shù)目個(gè)知識集與所述第二預(yù)定數(shù)目個(gè)知識集之間具有公共的知識集。
21.如權(quán)利要求14所述的信息處理系統(tǒng),其特征在于,還包括:
匹配模塊,針對來自預(yù)定賬戶的用戶問句,當(dāng)所述預(yù)定賬戶有相關(guān)聯(lián)的自定義知識集時(shí),所述匹配模塊首先利用所述自定義知識集為所述用戶問句執(zhí)行知識匹配以提供答案,
若匹配失敗,則利用該用戶的所指派知識集為所述用戶問句執(zhí)行知識匹配以提供答案。
22.如權(quán)利要求21所述的信息處理系統(tǒng),其特征在于,所述匹配模塊包括:
語義相似度計(jì)算單元,用于將所述用戶問句與用于知識匹配的知識集中的問句執(zhí)行語義相似度計(jì)算,語義相似度高于閾值的問句中具有最高語義相似度的問句被確定為匹配問句,
所述信息處理系統(tǒng)還包括輸出模塊,用于將與所述匹配問句相關(guān)聯(lián)的答案提供給用戶。
23.如權(quán)利要求21所述的信息處理系統(tǒng),其特征在于,若未找到匹配問句,則所述輸出模塊提供預(yù)設(shè)的答案。
24.如權(quán)利要求13所述的信息處理系統(tǒng),其特征在于,每個(gè)賬戶與不同的領(lǐng)域的應(yīng)用相關(guān)聯(lián),每個(gè)賬戶的用戶問句經(jīng)由與該賬戶相關(guān)聯(lián)的應(yīng)用從用戶獲得,所有的應(yīng)用共用一個(gè)所述知識庫。