一種基于眾包的新型問答系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種互聯(lián)網(wǎng)數(shù)據(jù)處理技術(shù),尤其涉及一種基于眾包的新型問答系統(tǒng)。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)的快速發(fā)展,用戶獲取的信息越來越多,在Web2.0時(shí)期,用戶能夠通 過互聯(lián)網(wǎng)分享信息,其分享的內(nèi)容包括文字、圖片、視頻、網(wǎng)站和移動應(yīng)用,因此,信息數(shù)量 不斷增多的同時(shí)種類也不斷多元化?;ヂ?lián)網(wǎng)逐漸成為了信息數(shù)據(jù)的巨大載體,而大量的信 息數(shù)據(jù)帶來了一項(xiàng)挑戰(zhàn)--如何使用戶獲得真正需要的信息。
[0003] 搜索引擎作為一項(xiàng)信息檢索工具,能夠在指數(shù)增長級的大數(shù)據(jù)中,利用關(guān)鍵詞匹 配來過濾掉一定量的無用信息篩選出結(jié)果,但返回結(jié)果仍為上百萬的網(wǎng)頁鏈接,數(shù)量眾多 且形式單一,增大了篩選有效信息的難度。再者,搜索引擎采用的基于關(guān)鍵詞語義檢索的方 式對用戶輸入關(guān)鍵詞的要求高,若用戶不能輸入有效關(guān)鍵詞,查詢語句則無法準(zhǔn)確表達(dá)用 戶搜索需求,導(dǎo)致檢索結(jié)果不佳。
[0004] 問答系統(tǒng)彌補(bǔ)了搜索引擎的缺陷,能夠通過自然語言表達(dá)信息需求并獲得相對直 接的信息結(jié)果。早期的自動問答系統(tǒng),以人工智能技術(shù)對自然語言問題進(jìn)行分析,再檢索 文獻(xiàn)知識庫快速推理獲得高可信度答案。隨著問答領(lǐng)域研究的深入,發(fā)現(xiàn)自動問答系統(tǒng)能 夠較好解決事實(shí)性問題,但因?yàn)檎Z義的復(fù)雜性無法良好地處理一類復(fù)雜問題,事實(shí)性問題 是能夠得到一個(gè)客觀事實(shí)作為答案的問題,如"《哈利波特》的作者是誰? ",問題的答案為 J.K.羅琳,是一個(gè)實(shí)體人名,而目前提取實(shí)體答案的技術(shù)已經(jīng)很成熟,復(fù)雜類問題通常是沒 有標(biāo)準(zhǔn)答案的問題,如"北京哪家餐廳味道好?",這類問題的答案主觀性強(qiáng),依賴于傳統(tǒng)文 獻(xiàn)知識庫很難得出一個(gè)成體系的答案,最后,用戶不僅可能不滿意生成的答案,甚至還可能 無法獲取答案。而通過社區(qū)問答系統(tǒng)與自動問答系統(tǒng)不同的是,其研究內(nèi)容不僅與機(jī)器算 法相關(guān),也融入了人計(jì)算的相關(guān)技術(shù),能夠利用人群的語義理解能力和廣泛的背景知識儲 備給出答案解決復(fù)雜類問題。社區(qū)問答系統(tǒng)以一種一問多答服務(wù)平臺的方式,提供了用戶 以自然語言提出問題并作答的功能,通過簡單直接的方式滿足人們表達(dá)信息和獲取信息的 需求。社區(qū)問答系統(tǒng)中的問題通常都有多個(gè)回答,傳統(tǒng)的最佳答案篩選方式是由提問者只 采納一個(gè)回答作為最佳答案的方式,但受制于各個(gè)用戶之間的知識背景差異及局限性,致 使單個(gè)回答的最佳答案的質(zhì)量較為片面。綜上所述,問答系統(tǒng)以比搜索引擎更為自然的方 式服務(wù)用戶的信息需求,自動問答系統(tǒng)雖能夠快速獲取答案,但受制于語義分析技術(shù)難度 大、成本高;社區(qū)問答系統(tǒng)解決了自動問答系統(tǒng)的語義難點(diǎn),卻無法保證即時(shí)作答,而且社 區(qū)問答系統(tǒng)給出的單一回答較為片面。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明提供一種基于眾包的新型問答系統(tǒng),解決了現(xiàn)有的自動問答系統(tǒng)受制于語 義分析技術(shù)難度大、成本高的技術(shù)問題以及現(xiàn)有的社區(qū)問答系統(tǒng)無法保證即時(shí)的技術(shù)問 題。
[0006] 本發(fā)明提供一種基于眾包的新型問答系統(tǒng),所述系統(tǒng)包括:
[0007] 客戶端和服務(wù)器,所述客戶端包括問答模塊和智答模塊,所述服務(wù)器包括問答分 析模塊、中介模式?jīng)Q策模塊、數(shù)據(jù)源查詢模塊、優(yōu)化模塊,其中
[0008] 所述問答模塊與所述問答分析模塊相連,所述問答模塊用于獲取問答數(shù)據(jù)并將所 述問答數(shù)據(jù)發(fā)送給所述問答分析模塊,其中所述問答數(shù)據(jù)包括問題數(shù)據(jù)和回答數(shù)據(jù);
[0009] 所述問答分析模塊用于根據(jù)所述問答數(shù)據(jù)獲取關(guān)鍵詞組;
[0010] 所述中介模式?jīng)Q策模塊分別與所述問答分析模塊和所述數(shù)據(jù)源查詢模塊相連,所 述中介模式?jīng)Q策模塊用于根據(jù)所述問答分析模塊發(fā)送的關(guān)鍵詞組與預(yù)設(shè)的屬性候選集映 射生成中介模式;
[0011] 所述數(shù)據(jù)源查詢模塊用于根據(jù)所述中介模式生成數(shù)據(jù)源查詢語句,并根據(jù)所述數(shù) 據(jù)源查詢語句在多個(gè)數(shù)據(jù)源中檢索獲得實(shí)體數(shù)據(jù);
[0012] 所述優(yōu)化模塊分別與所述數(shù)據(jù)源查詢模塊和所述智答模塊相連,所述優(yōu)化模塊用 于將所述實(shí)體數(shù)據(jù)封裝為眾包任務(wù)并將所述眾包任務(wù)發(fā)送給所述智答模塊以使所述智答 模塊根據(jù)所述眾包任務(wù)獲得眾包反饋數(shù)據(jù),且所述優(yōu)化模塊還用于根據(jù)所述智答模塊反饋 的所述眾包反饋數(shù)據(jù)生成智答數(shù)據(jù);
[0013] 所述智答模塊用于根據(jù)所述眾包任務(wù)獲取所述眾包反饋數(shù)據(jù),并將所述眾包反饋 數(shù)據(jù)發(fā)送給所述優(yōu)化模塊以使所述優(yōu)化模塊生成智答數(shù)據(jù)。
[0014] 本發(fā)明的實(shí)施方案中,所述問答分析模塊具體用于:
[0015] 將所述問答數(shù)據(jù)進(jìn)行分詞處理,并在所述分詞處理中過濾停用詞;;
[0016] 將過濾后的詞語基于本體的概念樹進(jìn)行分類標(biāo)注,并記錄所述詞語在所述概念樹 中的頻率;
[0017] 根據(jù)所述詞語在所述概念樹中的分類生成關(guān)鍵詞組,所述關(guān)鍵詞組包括實(shí)體組、 概念組和關(guān)系組。
[0018] 本發(fā)明的實(shí)施方案中,所述中介模式?jīng)Q策模塊具體用于:所述中介模式?jīng)Q策模塊 具體用于:
[0019] 根據(jù)所述關(guān)鍵詞組中的詞語在所述概念樹中的頻率對所述關(guān)鍵詞組中的詞語進(jìn) 行排序,生成有序的關(guān)鍵詞組;
[0020] 將所述有序的關(guān)鍵詞組中的實(shí)體或概念與所述預(yù)設(shè)的屬性候選集進(jìn)行映射,確定 所述有序的關(guān)鍵詞組中實(shí)體或概念的屬性;
[0021] 根據(jù)所述關(guān)鍵詞組及所述有序的關(guān)鍵詞組中實(shí)體或概念的屬性生成中介模式。
[0022] 本發(fā)明的實(shí)施方案中,所述數(shù)據(jù)源查詢模塊具體用于:
[0023] 根據(jù)所述中介模式構(gòu)造查詢語句;
[0024] 將所述查詢語句重構(gòu)生成數(shù)據(jù)源查詢語句;
[0025] 將所述數(shù)據(jù)源查詢語句在所述多個(gè)數(shù)據(jù)源中進(jìn)行檢索獲得所述實(shí)體數(shù)據(jù)。
[0026] 本發(fā)明的實(shí)施方案中,所述優(yōu)化模塊具體用于:
[0027] 將所述實(shí)體數(shù)據(jù)進(jìn)行自動預(yù)處理,獲得中間智答數(shù)據(jù);
[0028] 將所述中間智答數(shù)據(jù)封裝為所述眾包任務(wù),并將所述眾包任務(wù)發(fā)送給所述智答模 塊以使所述智答模塊根據(jù)所述眾包任務(wù)生成所述眾包反饋數(shù)據(jù);
[0029] 根據(jù)所述智答模塊發(fā)送的所述眾包反饋數(shù)據(jù)生成智答數(shù)據(jù),并將所述智答數(shù)據(jù)發(fā) 送給所述智答模塊以使所述智答模塊顯示所述智答數(shù)據(jù)。
[0030] 本發(fā)明的實(shí)施方案中,所述智答模塊具體用于:
[0031] 對所述眾包任務(wù)進(jìn)行投票和/或輸入自定義值;
[0032] 根據(jù)所述眾包任務(wù)獲得的投票數(shù)和/或自定義值獲取眾包反饋數(shù)據(jù),并將所述眾 包反饋數(shù)據(jù)發(fā)送給所述優(yōu)化模塊以使所述優(yōu)化模塊根據(jù)所述眾包反饋數(shù)據(jù)中包含的投票 數(shù)和/或自定義值生成智答數(shù)據(jù);
[0033] 接收所述優(yōu)化模塊發(fā)送的所述智答數(shù)據(jù),并顯示所述智答數(shù)據(jù)。
[0034] 本發(fā)明的實(shí)施方案中,所述智答模塊還用于:
[0035] 當(dāng)所述眾包任務(wù)獲得的投票數(shù)和/或自定義值發(fā)生變化,則更新所述眾包任務(wù)獲 得的投票數(shù)和/或自定義值;
[0036] 根據(jù)更新后的所述眾包任務(wù)獲得的投票數(shù)和/或自定義值更新所述眾包反饋數(shù) 據(jù),并將更新后的眾包反饋數(shù)據(jù)發(fā)送給所述優(yōu)化模塊以使所述優(yōu)化模塊根據(jù)所述更新后的 眾包反饋數(shù)據(jù)更新所述智答數(shù)據(jù);
[0037] 接收所述優(yōu)化模塊發(fā)送的更新后的智答數(shù)據(jù),并顯示所述更新后的智答數(shù)據(jù)。
[0038] 本發(fā)明的實(shí)施方案中,所述優(yōu)化模塊還用于:
[0039] 接收所述智答模塊發(fā)送的所述更新后的眾包反饋數(shù)據(jù);
[0040] 根據(jù)所述更新后的所述眾包反饋數(shù)據(jù)更新所述智答數(shù)據(jù),并將更新后的智答數(shù)據(jù) 發(fā)送給所述智答模塊以