問答社區(qū)內(nèi)回答評價方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種問答社區(qū)內(nèi)回答評價方法,該方法包括:獲取問題及所述問題下對應(yīng)的所有回答內(nèi)容及與所述回答內(nèi)容相關(guān)的多維信息;基于對各維信息進行獨立加權(quán)的方式計算每個回答內(nèi)容的基本權(quán)重;綜合各維信息的相互影響,確定相應(yīng)的調(diào)權(quán)機制調(diào)節(jié)所述獲取的基本權(quán)重,得到每個回答內(nèi)容的最終權(quán)重;基于所述最終權(quán)重對所述所有回答內(nèi)容進行綜合評價。相應(yīng)地還提供了一種問答社區(qū)內(nèi)回答評價系統(tǒng)。本發(fā)明提供的方法和系統(tǒng)可以有效甄別對問題有價值的回答,提升問答平臺的用戶體驗。
【專利說明】問答社區(qū)內(nèi)回答評價方法和系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機網(wǎng)絡(luò)領(lǐng)域,尤其涉及一種問答社區(qū)內(nèi)回答評價方法和系統(tǒng)。
【背景技術(shù)】
[0002]目前,通過搜索平臺搜索相關(guān)的信息是用戶獲取信息的重要途徑,尤其在問答社區(qū)內(nèi)搜索問題、提出問題、回答問題、瀏覽問題或追加問題等,這已成為用戶間進行互動信息交流的重要方式。其中,常見的問答社區(qū)有百度知道、搜搜問問、新浪愛問等。
[0003]通常,問答社區(qū)內(nèi)各問題下回答內(nèi)容的展示順序主要基于以下兩種方式:1)僅按照回答問題的時間進行排序,即排名靠前展示的回答在時間上更靠近當(dāng)前搜索的時間;2)按照回答獲得的好評數(shù)進行排序,即同一問題下的回答獲得用戶的贊同數(shù)越多,其越靠前展示在問答社區(qū)。但是,這兩種方式各有其不足,對于第一種方式而言,由于靠前展示的回答不一定是最匹配該問題的回答,因此,用戶通常需要花費較長時間尋找所需要的回答,并且,這種方式隨著回答個數(shù)的遞增,其不足越明顯;對于第二種方式而言,基于贊同數(shù)對回答進行排序,這很容易遭到spam (電子垃圾)用戶的攻擊,使得那些對spam用戶直接有益的廣告內(nèi)容頂?shù)娇壳暗恼故疚恢?,從而造成對瀏覽該回答的用戶的誤導(dǎo)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供一種問答社區(qū)內(nèi)回答評價方法和系統(tǒng),可以有效提升問答平臺的用戶體驗。
[0005]根據(jù)本發(fā)明的一個方面,提供了一種問答社區(qū)內(nèi)回答評價方法,該方法包括:
[0006]獲取問題及所述問題下對應(yīng)的所有回答內(nèi)容及與所述回答內(nèi)容相關(guān)的多維信息;
[0007]通過納入回歸模型,基于對各維信息進行獨立加權(quán)的方式計算每個回答內(nèi)容的基本權(quán)重;
[0008]綜合各維信息的相互影響,確定相應(yīng)的調(diào)權(quán)機制調(diào)節(jié)所述獲取的基本權(quán)重,得到每個回答內(nèi)容的最終權(quán)重;
[0009]基于所述最終權(quán)重對所述所有回答內(nèi)容進行綜合評價。
[0010]根據(jù)本發(fā)明的另一個方面,還提供了一種問答社區(qū)內(nèi)回答評價系統(tǒng),包括:
[0011]信息獲取單元,用于獲取問題及所述問題下對應(yīng)的所有回答內(nèi)容及與所述回答內(nèi)容相關(guān)的多維信息;
[0012]基本權(quán)重計算單元,通過納入回歸模型,基于對各維信息進行獨立加權(quán)的方式計算每個回答內(nèi)容的基本權(quán)重;
[0013]權(quán)重調(diào)節(jié)單元,用于綜合各維信息的相互影響,確定相應(yīng)的調(diào)權(quán)機制調(diào)節(jié)所述獲取的基本權(quán)重,得到每個回答內(nèi)容的最終權(quán)重;
[0014]回答評價單元,基于所述最終權(quán)重對所述所有回答內(nèi)容進行綜合評價。
[0015]與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:[0016]I)本發(fā)明通過對回答信息的評估,有效甄別對問題有價值的回答,并將該回答優(yōu)先展現(xiàn)給瀏覽者和提問者,提升了問答平臺的用戶體驗;
[0017]2)本發(fā)明可以有效地防止垃圾信息(spam)用戶的攻擊,避免該類信息對瀏覽用戶造成誤導(dǎo)。
【專利附圖】
【附圖說明】
[0018]通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
[0019]圖1為根據(jù)本發(fā)明一個優(yōu)選實施例的問答社區(qū)內(nèi)回答評價方法流程圖;
[0020]圖2為本實施例所示的回答內(nèi)容的長度與對應(yīng)調(diào)權(quán)系數(shù)的曲線圖;
[0021]圖3為根據(jù)本發(fā)明優(yōu)選實施例的用戶等級和回答內(nèi)容的質(zhì)量的關(guān)系曲線圖;
[0022]圖4為本發(fā)明另一個優(yōu)選實施例的回答社區(qū)內(nèi)回答評價系統(tǒng)的示意性框圖。
【具體實施方式】
[0023]下面結(jié)合附圖對本發(fā)明作進一步詳細描述。
[0024]根據(jù)本發(fā)明的一個方面,提供了一種問答社區(qū)內(nèi)回答評價方法。需要說明的是,下文提到的權(quán)重和回答信息的質(zhì)量成正向關(guān)系,權(quán)重越高,代表回答信息的質(zhì)量越優(yōu)。所述回答信息的質(zhì)量主要從回答內(nèi)容、提交所述回答的用戶行為特征、瀏覽所述回答的用戶特征等信息進行綜合衡量。
[0025]請參考圖1,圖1為根據(jù)本發(fā)明一個優(yōu)選實施例的問答社區(qū)內(nèi)回答評價方法流程圖。
[0026]如圖1所示,本發(fā)明所提供的方法包括以下步驟:
[0027]步驟S101,獲取問題及所述問題下對應(yīng)的所有回答內(nèi)容及與所述回答內(nèi)容相關(guān)的
多維信息。
[0028]具體地,為了更好地對問答社區(qū)內(nèi)的回答信息的價值進行評價,基于網(wǎng)絡(luò)獲取問答社區(qū)內(nèi)所有問題及所述問題下對應(yīng)的所有回答內(nèi)容及相關(guān)信息,具體獲取的方式在此不作限制。
[0029]與所述回答內(nèi)容相關(guān)的多維信息主要包括:所述回答自身的特征信息、提交所述回答內(nèi)容的用戶特征信息、瀏覽所述問題及回答的用戶行為特征信息。其中,所述回答自身的特征信息包括非文本特性信息和文本特征信息;所述提交所述回答內(nèi)容的用戶特征信息包括用戶等級和用戶采納率;所述瀏覽所述問題及回答的用戶行為特征主要指該用戶對回答的評價性信息,例如常見的回答好評數(shù)、回答中的致謝語以及追問追答中的致謝語等,該信息可以刻畫該用戶對該回答的反饋信息。
[0030]其中,所述回答自身的特征信息中的文本特征信息主要包括:特殊標記特征、核心表意詞特征、疑問傾向特征和無意義特征、致謝傾向性特征。
[0031]其中,所述回答自身的特征信息中的非文本特征信息主要包括:所述回答內(nèi)容的長度信息、所述回答內(nèi)容的段落數(shù)目、富媒體特征信息或/和追問追答信息。其中,富媒體特征信息主要指回答內(nèi)容中諸如圖片、地圖等特征信息。
[0032]步驟S102,通過納入回歸模型,基于對各維信息進行獨立加權(quán)的方式計算每個回答內(nèi)容的基本權(quán)重。
[0033]具體地,獲取上述多維信息后,基于上述多維信息衡量每個回答內(nèi)容的質(zhì)量。更具體地,通過下述計算公式計算每個回答內(nèi)容的基本權(quán)重,即納入回歸模型,對所述各維信息進行線性加權(quán)計算。計算公式如下:
[0034]score^^radio! X (Iimesion1+*** Tadioi X (Iimesioni+*** radionX dimesionn
[0035]其中,radiop radio^ radion分別代表各維信息的調(diào)權(quán)因子,dimesion^(Iimesioni^dimesionn分別代表各維信息的權(quán)重,Scoreini表示基本權(quán)重。其中,所述調(diào)權(quán)因子和權(quán)重可以通過對各維信息中所包括的特征及主特征信息的窮舉、選擇、固化參數(shù)等方法予以確定。
[0036]所述各維信息主要指:所述回答自身的特征信息、提交所述回答內(nèi)容的用戶特征信息、瀏覽所述問題及回答的用戶行為特征信息。
[0037]通過上述公式的計算,可以獲取每一個回答內(nèi)容的基本權(quán)重,通過下文的調(diào)權(quán)處理,即可以獲取每一個回答內(nèi)容的最終權(quán)重。
[0038]步驟S103,綜合各維信息的相互影響,確定相應(yīng)的調(diào)權(quán)機制調(diào)節(jié)所述獲取的基本權(quán)重,得到每個回答內(nèi)容的最終權(quán)重。
[0039]具體地,所述各維信息的相互影響主要指各維信息對回答內(nèi)容的質(zhì)量所產(chǎn)生正面或負面的影響。所述調(diào)權(quán)機制則根據(jù)所述影響的正負面、影響力度進行加權(quán)或降權(quán),即在每個回答內(nèi)容的基本權(quán)重上確定相應(yīng)的調(diào)權(quán)系數(shù),包括加權(quán)或降權(quán)系數(shù),兩者的乘積即為最終獲得的權(quán)重。具體的計算公式可以參照下文:
[0040]Score=W1XwWmXscoreini
[0041]其中,Wp Wm表示調(diào)權(quán)系數(shù),Scoreini表示基本權(quán)重,score表示最終權(quán)重。
`[0042]其中,所述加權(quán)或降權(quán)系數(shù)與各維信息中的具體特征相關(guān),下文將進行詳述。
[0043]就上述回答自身的特征信息中的非文本特征信息而言,其中影響加權(quán)或降權(quán)系數(shù)的特征主要包括回答內(nèi)容的長度和回答內(nèi)容的段落。
[0044]分別而言,由于問答社區(qū)內(nèi)回答內(nèi)容的長度一般都是中等長度的內(nèi)容其質(zhì)量較高,過短長度的內(nèi)容通常包含的信息較片面,其質(zhì)量較低,過長的內(nèi)容則通常因為冗長而缺乏重點信息,因此,回答內(nèi)容的長度對回答內(nèi)容質(zhì)量的貢獻呈現(xiàn)出先增長后減少的趨勢。為了更好地體現(xiàn)長度與回答內(nèi)容質(zhì)量之間的關(guān)系,可以將所述關(guān)系曲線劃分為多個檔位來表示,并可以采用如下公式來計算所述回答內(nèi)容的長度所對應(yīng)的調(diào)權(quán)系數(shù):
[0045]
【權(quán)利要求】
1.一種問答社區(qū)內(nèi)的回答評價方法,該方法包括: a)獲取問題及所述問題下對應(yīng)的所有回答內(nèi)容及與所述回答內(nèi)容相關(guān)的多維信息; b)基于對各維信息進行獨立加權(quán)的方式計算每個回答內(nèi)容的基本權(quán)重; c)綜合各維信息的相互影響,確定相應(yīng)的調(diào)權(quán)機制調(diào)節(jié)所述獲取的基本權(quán)重,得到每個回答內(nèi)容的最終權(quán)重; d)基于所述最終權(quán)重對所述所有回答內(nèi)容進行綜合評價。
2.根據(jù)權(quán)利要求1所述的回答評價方法,其中,所述多維信息主要包括:所述回答自身的特征信息、提交所述回答內(nèi)容的用戶特征信息、瀏覽所述問題及回答的用戶行為特征信息。
3.根據(jù)權(quán)利要求2所述的回答評價方法,其中,所述回答自身的特征信息包括回答內(nèi)容的長度和回答內(nèi)容的段落數(shù)。
4.根據(jù)權(quán)利要求3所述的回答評價方法,其中,所述調(diào)權(quán)機制具體包括: 針對回答內(nèi)容的長度,采用多個檔位的線性加權(quán)確定所對應(yīng)的調(diào)權(quán)系數(shù); 針對回答內(nèi)容的段落數(shù),采用線性增加的形式計算所對應(yīng)的調(diào)權(quán)系數(shù)。
5.根據(jù)權(quán)利要求2所述的回答評價方法,其中,所述提交所述回答內(nèi)容的用戶特征信息包括用戶等級和用戶采納率。
6.根據(jù)權(quán)利要求5所述的回答評價方法,其中,所述調(diào)權(quán)機制具體包括: 針對用戶等級和用戶采納率,分別采用相應(yīng)的對數(shù)計算形式計算所對應(yīng)的調(diào)權(quán)系數(shù)。
7.根據(jù)權(quán)利要求2所述的回答評價方法,其中,所述回答自身的特征信息包括特殊標記特征、核心表意詞特征、疑問傾向特征和無意義特征、致謝傾向性特征。
8.根據(jù)權(quán)利要求7所述的回答評價方法,其中,所述調(diào)權(quán)機制具體包括: 針對所述特殊標記特征,直接進行加權(quán)處理; 針對所述核心表意詞特征,則通過生成核心詞表和匹配核心詞確定相應(yīng)調(diào)權(quán)系數(shù);針對所述疑問傾向特征和無意義特征,通過詞表匹配的形式,在有限的回答長度范圍內(nèi),命中關(guān)鍵詞串,進行相關(guān)的降權(quán)處理; 針對所述致謝傾向性特征,通過獲取表征評價信息的傾向性詞典以及將回答內(nèi)容與所述傾向性詞典進行匹配,進行相應(yīng)的加權(quán)處理。
9.根據(jù)權(quán)利要求2-8任一項所述的回答評價方法,其中,所述調(diào)權(quán)機制還包括: 若所述回答自身的特征信息的權(quán)重過低,降權(quán); 若提交所述回答內(nèi)容的用戶特征信息的權(quán)重過低,降權(quán); 若回答是推薦回答、最佳回答等,加權(quán); 若短回答內(nèi)容包含特殊標記的詞匯或者短語,加權(quán); 對于追問追答情況,根據(jù)不同的比例進行不同的加權(quán)。
10.根據(jù)權(quán)利要求2-8任一項所述的回答評價方法,其中,所述步驟b)具體包括: 通過納入回歸模型,基于對各維信息進行獨立加權(quán)的方式計算每個回答內(nèi)容的基本權(quán)重。
11.一種問答社區(qū)內(nèi)的回答評價系統(tǒng),包括: 信息獲取單元,用于獲取問題及所述問題下對應(yīng)的所有回答內(nèi)容及與所述回答內(nèi)容相關(guān)的多維信息;基本權(quán)重計算單元,基于對各維信息進行獨立加權(quán)的方式計算每個回答內(nèi)容的基本權(quán)重; 權(quán)重調(diào)節(jié)單元,用于綜合各維信息的相互影響,確定相應(yīng)的調(diào)權(quán)機制調(diào)節(jié)所述獲取的基本權(quán)重,得到每個回答內(nèi)容的最終權(quán)重; 回答評價單元,基于所述最終權(quán)重對所述所有回答內(nèi)容進行綜合評價。
12.根據(jù)權(quán)利要求11所述的回答評價系統(tǒng),其中,所述多維信息主要包括:所述回答自身的特征信息、提交所述回答內(nèi)容的用戶特征信息、瀏覽所述問題及回答的用戶行為特征信息。
13.根據(jù)權(quán)利要求12所述的回答評價系統(tǒng),其中,所述回答自身的特征信息包括回答內(nèi)容的長度和回答內(nèi)容的段落數(shù)。
14.根據(jù)權(quán)利要求13所述的回答評價系統(tǒng),其中,所述權(quán)重調(diào)節(jié)單元所確定的調(diào)權(quán)機制具體包括: 針對回答內(nèi)容的長度,采用多個檔位的線性加權(quán)確定所對應(yīng)的調(diào)權(quán)系數(shù); 針對回答內(nèi)容的段落數(shù),采用線性增加的形式計算所對應(yīng)的調(diào)權(quán)系數(shù)。
15.根據(jù)權(quán)利要求12所述的回答評價系統(tǒng),其中,所述提交所述回答內(nèi)容的用戶特征信息包括用戶等級和用戶采納率。
16.根據(jù)權(quán)利要求15所述的回答評價系統(tǒng),其中,所述調(diào)權(quán)機制具體包括: 針對用戶等級和用戶采納率,分別采用相應(yīng)的對數(shù)計算形式計算所對應(yīng)的調(diào)權(quán)系數(shù)。
17.根據(jù)權(quán)利要求12所述的回答評價系統(tǒng),其中,所述回答自身的特征信息包括特殊標記特征、核心表意詞特征、疑問傾向特征和無意義特征、致謝傾向性特征。
18.根據(jù)權(quán)利要求17所述的回答評價系統(tǒng),其中,所述調(diào)權(quán)機制具體包括: 針對所述特殊標記特征,直接進行加權(quán)處理; 針對所述核心表意詞特征,則通過生成核心詞表和匹配核心詞確定相應(yīng)調(diào)權(quán)系數(shù);針對所述疑問傾向特征和無意義特征,通過詞表匹配的形式,在有限的回答長度范圍內(nèi),命中關(guān)鍵詞串,進行相關(guān)的降權(quán)處理; 針對所述致謝傾向性特征,通過獲取表征評價信息的傾向性詞典以及將回答內(nèi)容與所述傾向性詞典進行匹配,進行相應(yīng)的加權(quán)處理。
19.根據(jù)權(quán)利要求12-18任一項所述的回答評價系統(tǒng),其中,所述調(diào)權(quán)機制還包括: 若所述回答自身的特征信息的權(quán)重過低,降權(quán); 若提交所述回答內(nèi)容的用戶特征信息的權(quán)重過低,降權(quán); 若回答是推薦回答、最佳回答等,加權(quán); 若短回答內(nèi)容包含特殊標記的詞匯或者短語,加權(quán); 對于追問追答情況,根據(jù)不同的比例進行不同的加權(quán)。
20.根據(jù)權(quán)利要求12-18任一項所述的回答評價系統(tǒng),其中,所述基本權(quán)重計算單元通過納入回歸模型,基于對各維信息進行獨立加權(quán)的方式計算每個回答內(nèi)容的基本權(quán)重。
【文檔編號】G06F17/30GK103729424SQ201310714726
【公開日】2014年4月16日 申請日期:2013年12月20日 優(yōu)先權(quán)日:2013年12月20日
【發(fā)明者】姚曄, 陳慶軒, 寧華麗, 郭宇霆 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司