本發(fā)明涉及自然語言處理,尤其涉及的是一種基于立場(chǎng)的摘要生成方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、摘要生成是一項(xiàng)重要的自然語言處理技術(shù),旨在從數(shù)據(jù)中生成簡(jiǎn)潔而信息豐富的文本摘要?,F(xiàn)有的摘要生成方法主要利用大語言模型對(duì)輸入的數(shù)據(jù)進(jìn)行總結(jié),但無特定立場(chǎng)或者明顯觀點(diǎn)。
2、然而在實(shí)際應(yīng)用中,并不需要大語言模型輸出千篇一律的總結(jié),而是需要輸出特定立場(chǎng)或者有顯明觀點(diǎn)的結(jié)論。
3、因此,現(xiàn)有的摘要生成方法無法滿足實(shí)際應(yīng)用中的多樣化需求,還有待改進(jìn)和發(fā)展。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明要解決的技術(shù)問題在于,針對(duì)現(xiàn)有技術(shù)的上述缺陷,提供一種基于立場(chǎng)的摘要生成方法、系統(tǒng)、終端及存儲(chǔ)介質(zhì),旨在解決現(xiàn)有的摘要生成方法無法生成特定立場(chǎng)的摘要數(shù)據(jù)的問題。
2、本發(fā)明解決問題所采用的技術(shù)方案如下:
3、第一方面,本發(fā)明實(shí)施例提供一種基于立場(chǎng)的摘要生成方法,所述方法包括:
4、獲取原始內(nèi)容、位于所述原始內(nèi)容中的目標(biāo)實(shí)體以及目標(biāo)立場(chǎng);
5、根據(jù)所述目標(biāo)立場(chǎng)從所述原始內(nèi)容中篩選出目標(biāo)內(nèi)容;
6、將所述目標(biāo)內(nèi)容、所述目標(biāo)實(shí)體以及所述目標(biāo)立場(chǎng)輸入已訓(xùn)練的摘要生成模型,得到關(guān)于所述目標(biāo)實(shí)體在所述目標(biāo)立場(chǎng)下的目標(biāo)摘要。
7、在一種實(shí)施方式中,根據(jù)所述目標(biāo)立場(chǎng)從所述原始內(nèi)容中篩選出目標(biāo)內(nèi)容,包括:
8、通過已訓(xùn)練的立場(chǎng)分類模型對(duì)所述原始內(nèi)容按照立場(chǎng)進(jìn)行分類;
9、根據(jù)所述目標(biāo)立場(chǎng)從分類后的內(nèi)容數(shù)據(jù)中篩選出目標(biāo)內(nèi)容。
10、在一種實(shí)施方式中,根據(jù)所述目標(biāo)立場(chǎng)從分類后的內(nèi)容數(shù)據(jù)中篩選出目標(biāo)內(nèi)容,包括:
11、根據(jù)所述目標(biāo)立場(chǎng)對(duì)分類后的內(nèi)容數(shù)據(jù)進(jìn)行初步篩選,判斷初步篩選出的數(shù)據(jù)量是否超過預(yù)設(shè)數(shù)量閾值;
12、若超過,則將初步篩選出的各內(nèi)容數(shù)據(jù)作為候選內(nèi)容數(shù)據(jù),獲取各所述候選內(nèi)容數(shù)據(jù)分別對(duì)應(yīng)的評(píng)選指標(biāo);其中,所述評(píng)選指標(biāo)包括概率值和文本多樣性至少一種指標(biāo);每一所述候選內(nèi)容數(shù)據(jù)的概率值是由已訓(xùn)練的立場(chǎng)分類模型計(jì)算出的所述候選內(nèi)容數(shù)據(jù)隸屬于所述目標(biāo)立場(chǎng)的概率值;文本多樣性指標(biāo)則可采用常用的distinct指標(biāo),其distinct(n)的定義為生成文本的長(zhǎng)度為n的不重復(fù)的短語的數(shù)量與生成文本長(zhǎng)度為n的短語的數(shù)量之比;
13、根據(jù)各所述評(píng)選指標(biāo)篩選若干所述候選內(nèi)容數(shù)據(jù)作為目標(biāo)內(nèi)容。
14、在一種實(shí)施方式中,將所述目標(biāo)內(nèi)容、所述目標(biāo)實(shí)體以及所述目標(biāo)立場(chǎng)輸入已訓(xùn)練的摘要生成模型,得到關(guān)于所述目標(biāo)實(shí)體在所述目標(biāo)立場(chǎng)下的目標(biāo)摘要,包括:
15、根據(jù)所述目標(biāo)內(nèi)容、所述目標(biāo)實(shí)體以及所述目標(biāo)立場(chǎng)進(jìn)行拼接,得到拼接數(shù)據(jù);
16、基于所述拼接數(shù)據(jù),通過所述已訓(xùn)練的摘要生成模型生成目標(biāo)摘要。
17、在一種實(shí)施方式中,根據(jù)所述目標(biāo)內(nèi)容、所述目標(biāo)實(shí)體以及所述目標(biāo)立場(chǎng)進(jìn)行拼接,得到拼接數(shù)據(jù),包括:
18、若所述目標(biāo)內(nèi)容為文本內(nèi)容,則根據(jù)所述文本內(nèi)容、所述目標(biāo)實(shí)體以及所述目標(biāo)立場(chǎng)進(jìn)行拼接,得到拼接數(shù)據(jù);
19、若所述目標(biāo)內(nèi)容為文本內(nèi)容及圖片,則根據(jù)所述文本內(nèi)容、所述圖片的圖像特征、所述目標(biāo)實(shí)體以及所述目標(biāo)立場(chǎng)進(jìn)行拼接,得到拼接數(shù)據(jù);
20、若所述目標(biāo)內(nèi)容為目標(biāo)表格數(shù)據(jù),則根據(jù)展平的所述目標(biāo)表格數(shù)據(jù)、所述目標(biāo)實(shí)體以及所述目標(biāo)立場(chǎng)進(jìn)行拼接,得到拼接數(shù)據(jù)。
21、在一種實(shí)施方式中,所述已訓(xùn)練的摘要生成模型的訓(xùn)練數(shù)據(jù)集包括若干訓(xùn)練實(shí)體分別對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)組,每一所述訓(xùn)練數(shù)據(jù)組的生成方法包括:
22、獲取一個(gè)訓(xùn)練內(nèi)容,通過預(yù)設(shè)的四元組生成模型識(shí)別所述訓(xùn)練內(nèi)容中的若干訓(xùn)練實(shí)體;其中,每一所述訓(xùn)練實(shí)體在所述訓(xùn)練內(nèi)容中均具有不同立場(chǎng)分別對(duì)應(yīng)的數(shù)據(jù);
23、針對(duì)每一所述訓(xùn)練實(shí)體,根據(jù)所述訓(xùn)練實(shí)體和所述訓(xùn)練內(nèi)容,生成各立場(chǎng)分別對(duì)應(yīng)的訓(xùn)練摘要;針對(duì)每一立場(chǎng),根據(jù)所述訓(xùn)練實(shí)體、所述訓(xùn)練內(nèi)容、立場(chǎng)以及立場(chǎng)對(duì)應(yīng)的所述訓(xùn)練摘要構(gòu)建四元組訓(xùn)練數(shù)據(jù),得到不同立場(chǎng)分別對(duì)應(yīng)的所述四元組訓(xùn)練數(shù)據(jù);
24、獲取所述訓(xùn)練內(nèi)容對(duì)應(yīng)的無立場(chǎng)的訓(xùn)練摘要,根據(jù)所述訓(xùn)練實(shí)體、所述訓(xùn)練內(nèi)容以及無立場(chǎng)對(duì)應(yīng)的所述訓(xùn)練摘要構(gòu)建三元組訓(xùn)練數(shù)據(jù);
25、根據(jù)所述三元組訓(xùn)練數(shù)據(jù)和全部所述四元組訓(xùn)練數(shù)據(jù),得到所述訓(xùn)練實(shí)體的訓(xùn)練數(shù)據(jù)組。
26、在一種實(shí)施方式中,所述四元組生成模型為大型語言模型。
27、在一種實(shí)施方式中,所述四元組訓(xùn)練數(shù)據(jù)的生成方法包括:
28、通過所述大型語言模型輸出初始四元組訓(xùn)練數(shù)據(jù);其中,所述初始四元組訓(xùn)練數(shù)據(jù)由訓(xùn)練實(shí)體,立場(chǎng),訓(xùn)練內(nèi)容,帶立場(chǎng)的訓(xùn)練摘要組成;
29、將所述初始四元組訓(xùn)練數(shù)據(jù)轉(zhuǎn)換為預(yù)設(shè)格式的四元組訓(xùn)練數(shù)據(jù)。
30、在一種實(shí)施方式中,獲取所述訓(xùn)練內(nèi)容對(duì)應(yīng)的無立場(chǎng)的訓(xùn)練摘要,包括:
31、基于所述訓(xùn)練內(nèi)容,通過基礎(chǔ)生成模型生成無立場(chǎng)的訓(xùn)練摘要。
32、在一種實(shí)施方式中,針對(duì)每一立場(chǎng),根據(jù)所述訓(xùn)練實(shí)體、所述訓(xùn)練內(nèi)容、立場(chǎng)以及立場(chǎng)對(duì)應(yīng)的所述訓(xùn)練摘要構(gòu)建四元組訓(xùn)練數(shù)據(jù),包括:
33、針對(duì)每一立場(chǎng),計(jì)算立場(chǎng)對(duì)應(yīng)的所述訓(xùn)練摘要的忠實(shí)度和立場(chǎng)一致性;
34、判斷所述忠實(shí)度和所述立場(chǎng)一致性是否滿足預(yù)設(shè)要求,若滿足,則根據(jù)所述訓(xùn)練實(shí)體、所述訓(xùn)練內(nèi)容、立場(chǎng)以及立場(chǎng)對(duì)應(yīng)的所述訓(xùn)練摘要構(gòu)建四元組訓(xùn)練數(shù)據(jù)。
35、在一種實(shí)施方式中,所述已訓(xùn)練的摘要生成模型的獲得方法包括:
36、獲取一個(gè)所述訓(xùn)練數(shù)據(jù)組,針對(duì)所述訓(xùn)練數(shù)據(jù)組中的每一所述四元組訓(xùn)練數(shù)據(jù),根據(jù)所述四元組訓(xùn)練數(shù)據(jù)中的所述訓(xùn)練實(shí)體、所述訓(xùn)練內(nèi)容以及立場(chǎng)生成訓(xùn)練拼接數(shù)據(jù),得到不同立場(chǎng)分別對(duì)應(yīng)的所述訓(xùn)練拼接數(shù)據(jù);
37、獲取預(yù)訓(xùn)練語言模型,通過所述預(yù)訓(xùn)練語言模型根據(jù)不同立場(chǎng)的所述訓(xùn)練拼接數(shù)據(jù),生成不同立場(chǎng)分別對(duì)應(yīng)的預(yù)測(cè)摘要;
38、根據(jù)無立場(chǎng)和不同立場(chǎng)的所述訓(xùn)練摘要,以及不同立場(chǎng)的所述預(yù)測(cè)摘要,計(jì)算所述預(yù)訓(xùn)練語言模型的損失值;
39、判斷所述預(yù)訓(xùn)練語言模型的損失值是否滿足訓(xùn)練要求,若不滿足,則根據(jù)所述預(yù)訓(xùn)練語言模型的損失值對(duì)所述預(yù)訓(xùn)練語言模型進(jìn)行參數(shù)更新;
40、繼續(xù)執(zhí)行獲取一個(gè)所述訓(xùn)練數(shù)據(jù)組的步驟,直至所述預(yù)訓(xùn)練語言模型的損失值滿足所述訓(xùn)練要求,得到所述已訓(xùn)練的摘要生成模型。
41、在一種實(shí)施方式中,所述預(yù)訓(xùn)練語言模型為序列到序列的小型語言模型。
42、在一種實(shí)施方式中,根據(jù)無立場(chǎng)和不同立場(chǎng)的所述訓(xùn)練摘要,以及不同立場(chǎng)的所述預(yù)測(cè)摘要,計(jì)算所述預(yù)訓(xùn)練語言模型的損失值,包括:
43、根據(jù)無立場(chǎng)和不同立場(chǎng)的所述訓(xùn)練摘要,以及不同立場(chǎng)的所述預(yù)測(cè)摘要,計(jì)算所述預(yù)訓(xùn)練語言模型的交叉熵?fù)p失值;
44、根據(jù)不同立場(chǎng)的所述訓(xùn)練摘要,計(jì)算所述預(yù)訓(xùn)練語言模型的kl散度損失值;
45、根據(jù)所述交叉熵?fù)p失值和所述kl散度損失值,計(jì)算所述預(yù)訓(xùn)練語言模型的損失值。
46、在一種實(shí)施方式中,根據(jù)所述交叉熵?fù)p失值和所述kl散度損失值,計(jì)算所述預(yù)訓(xùn)練語言模型的損失值,包括:
47、根據(jù)所述交叉熵?fù)p失值和所述kl散度損失值的加權(quán)和,計(jì)算所述預(yù)訓(xùn)練語言模型的損失值。
48、在一種實(shí)施方式中,根據(jù)無立場(chǎng)和不同立場(chǎng)的所述訓(xùn)練摘要,以及不同立場(chǎng)的所述預(yù)測(cè)摘要,計(jì)算所述預(yù)訓(xùn)練語言模型的交叉熵?fù)p失值,包括:
49、獲取無立場(chǎng)和不同立場(chǎng)的所述訓(xùn)練摘要中每個(gè)詞的生成概率分布的并集,得到第一并集數(shù)據(jù);
50、獲取不同立場(chǎng)的所述預(yù)測(cè)摘要中每個(gè)詞的生成概率分布的并集,得到第二并集數(shù)據(jù);
51、根據(jù)所述第一并集數(shù)據(jù)和所述第二并集數(shù)據(jù),計(jì)算所述預(yù)訓(xùn)練語言模型的交叉熵?fù)p失值。
52、在一種實(shí)施方式中,根據(jù)不同立場(chǎng)的所述訓(xùn)練摘要,計(jì)算所述預(yù)訓(xùn)練語言模型的kl散度損失值,包括:
53、針對(duì)每一立場(chǎng)的所述訓(xùn)練摘要,獲取立場(chǎng)的所述訓(xùn)練摘要中每個(gè)詞的生成概率分布;
54、根據(jù)不同立場(chǎng)的所述訓(xùn)練摘要中每個(gè)詞的生成概率分布,計(jì)算所述預(yù)訓(xùn)練語言模型的kl散度損失值。
55、在一種實(shí)施方式中,立場(chǎng)分類模型的訓(xùn)練數(shù)據(jù)集包括若干訓(xùn)練數(shù)據(jù)對(duì),每一所述訓(xùn)練數(shù)據(jù)對(duì)的生成方法包括:
56、獲取一個(gè)帶立場(chǎng)數(shù)據(jù);其中,所述帶立場(chǎng)數(shù)據(jù)的來源包括所述四元組訓(xùn)練數(shù)據(jù);
57、根據(jù)所述帶立場(chǎng)數(shù)據(jù)生成訓(xùn)練文本內(nèi)容和對(duì)應(yīng)的立場(chǎng)標(biāo)簽;
58、根據(jù)所述訓(xùn)練文本內(nèi)容和所述立場(chǎng)標(biāo)簽生成一個(gè)所述訓(xùn)練數(shù)據(jù)對(duì)。
59、第二方面,本發(fā)明實(shí)施例還提供一種基于立場(chǎng)的摘要生成系統(tǒng),所述系統(tǒng)包括:
60、獲取模塊,用于獲取原始內(nèi)容、位于所述原始內(nèi)容中的目標(biāo)實(shí)體以及目標(biāo)立場(chǎng);
61、篩選模塊,用于根據(jù)所述目標(biāo)立場(chǎng)從所述原始內(nèi)容中篩選出目標(biāo)內(nèi)容;
62、生成模塊,用于將所述目標(biāo)內(nèi)容、所述目標(biāo)實(shí)體以及所述目標(biāo)立場(chǎng)輸入已訓(xùn)練的摘要生成模型,得到關(guān)于所述目標(biāo)實(shí)體在所述目標(biāo)立場(chǎng)下的目標(biāo)摘要。
63、第三方面,本發(fā)明實(shí)施例還提供一種終端,所述終端包括有存儲(chǔ)器和一個(gè)以上處理器;所述存儲(chǔ)器存儲(chǔ)有一個(gè)以上的程序;所述程序包含用于執(zhí)行如上述任一所述的基于立場(chǎng)的摘要生成方法的指令;所述處理器用于執(zhí)行所述程序。
64、第四方面,本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有多條指令,所述指令適用于由處理器加載并執(zhí)行,以實(shí)現(xiàn)如上述任一所述的基于立場(chǎng)的摘要生成方法的步驟。
65、本發(fā)明的有益效果:本發(fā)明實(shí)施例通過獲取原始內(nèi)容中的目標(biāo)實(shí)體以及選定的目標(biāo)立場(chǎng),基于目標(biāo)立場(chǎng)從原始內(nèi)容中篩選出目標(biāo)內(nèi)容,將目標(biāo)內(nèi)容、目標(biāo)實(shí)體以及目標(biāo)立場(chǎng)輸入已訓(xùn)練的摘要生成模型,以自動(dòng)生成關(guān)于目標(biāo)實(shí)體在目標(biāo)立場(chǎng)下的目標(biāo)摘要。解決了現(xiàn)有的大型語言模型基于原始內(nèi)容無法輸出具有特定立場(chǎng)的摘要的問題,高度適用于信息摘要和觀點(diǎn)分析領(lǐng)域,并且可以為各種需要特定視角摘要的應(yīng)用場(chǎng)景提供有力支持。