本申請涉及人工智能,尤其涉及一種結(jié)合領(lǐng)域知識的文本生成方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、領(lǐng)域知識表示是利用計算機可理解的形式來捕捉和表達(dá)特定領(lǐng)域內(nèi)的知識,這在金融、醫(yī)藥等知識密集型領(lǐng)域尤為重要,它的應(yīng)用涉及到醫(yī)藥領(lǐng)域文本理解、金融、醫(yī)藥領(lǐng)域?qū)m梿柎鹣到y(tǒng)、金融、醫(yī)藥領(lǐng)域信息檢索等多個領(lǐng)域。目前,領(lǐng)域知識表示也有很多前沿應(yīng)用:
2、1)語義匹配:語義匹配是指在自然語言處理中,通過對文本進行語義表示,來判斷兩個文本之間的相似度或匹配程度。語義匹配在搜索引擎、推薦系統(tǒng)、智能客服等領(lǐng)域有著廣泛的應(yīng)用。
3、2)語義角色標(biāo)注:語義角色標(biāo)注是指對句子中的每個詞語進行語義角色的標(biāo)注,如主語、賓語、謂語等。語義角色標(biāo)注在自然語言理解、機器翻譯、問答系統(tǒng)等領(lǐng)域有著廣泛的應(yīng)用。
4、3)語義依存分析:語義依存分析是指對句子中的每個詞語進行語義依存關(guān)系的分析,如主謂關(guān)系、動賓關(guān)系等。語義依存分析在自然語言理解、機器翻譯、問答系統(tǒng)等領(lǐng)域有著廣泛的應(yīng)用。
5、4)語義推理:語義推理是指通過對文本進行語義表示,來進行邏輯推理、推斷和推理。語義推理在自然語言理解、問答系統(tǒng)、智能客服等領(lǐng)域有著廣泛的應(yīng)用。
6、與此同時,隨著領(lǐng)域知識表示應(yīng)用領(lǐng)域的發(fā)展,也存在數(shù)據(jù)稀缺、語義理解歧義的問題。
技術(shù)實現(xiàn)思路
1、本申請實施例的目的在于提出一種結(jié)合領(lǐng)域知識的文本生成方法、裝置、設(shè)備及存儲介質(zhì),以解決目前領(lǐng)域知識表示在應(yīng)用中存在數(shù)據(jù)稀缺、語義理解歧義的技術(shù)問題。
2、為了解決上述技術(shù)問題,本申請實施例提供一種結(jié)合領(lǐng)域知識的文本生成方法,采用了如下所述的技術(shù)方案:
3、獲取查詢文本數(shù)據(jù),對所述查詢文本數(shù)據(jù)進行預(yù)處理,得到預(yù)處理文本數(shù)據(jù);
4、將所述預(yù)處理文本數(shù)據(jù)輸入訓(xùn)練好的領(lǐng)域分類模型,得到文本語義特征向量和領(lǐng)域分類信息;
5、基于所述領(lǐng)域分類信息查詢對應(yīng)的預(yù)設(shè)領(lǐng)域詞表,根據(jù)所述預(yù)設(shè)領(lǐng)域詞表對所述文本語義特征向量進行標(biāo)注,得到增強文本語義向量;
6、將所述預(yù)處理文本數(shù)據(jù)、所述增強文本語義向量和所述領(lǐng)域分類信息輸入訓(xùn)練好的文本生成模型中進行語義預(yù)測,生成目標(biāo)文本。
7、為了解決上述技術(shù)問題,本申請實施例還提供一種結(jié)合領(lǐng)域知識的文本生成裝置,采用了如下所述的技術(shù)方案:
8、預(yù)處理模塊,用于獲取查詢文本數(shù)據(jù),對所述查詢文本數(shù)據(jù)進行預(yù)處理,得到預(yù)處理文本數(shù)據(jù);
9、領(lǐng)域分類模塊,用于將所述預(yù)處理文本數(shù)據(jù)輸入訓(xùn)練好的領(lǐng)域分類模型,得到文本語義特征向量和領(lǐng)域分類信息;
10、標(biāo)注模塊,用于基于所述領(lǐng)域分類信息查詢對應(yīng)的預(yù)設(shè)領(lǐng)域詞表,根據(jù)所述預(yù)設(shè)領(lǐng)域詞表對所述文本語義特征向量進行標(biāo)注,得到增強文本語義向量;
11、文本生成模塊,用于將所述預(yù)處理文本數(shù)據(jù)、所述增強文本語義向量和所述領(lǐng)域分類信息輸入訓(xùn)練好的文本生成模型中進行語義預(yù)測,生成目標(biāo)文本。
12、為了解決上述技術(shù)問題,本申請實施例還提供一種計算機設(shè)備,采用了如下所述的技術(shù)方案:
13、該計算機設(shè)備包括存儲器和處理器,所述存儲器中存儲有計算機可讀指令,所述處理器執(zhí)行所述計算機可讀指令時實現(xiàn)如上所述的結(jié)合領(lǐng)域知識的文本生成方法的步驟。
14、為了解決上述技術(shù)問題,本申請實施例還提供一種計算機可讀存儲介質(zhì),采用了如下所述的技術(shù)方案:
15、所述計算機可讀存儲介質(zhì)上存儲有計算機可讀指令,所述計算機可讀指令被處理器執(zhí)行時實現(xiàn)如上所述的結(jié)合領(lǐng)域知識的文本生成方法的步驟。
16、與現(xiàn)有技術(shù)相比,本申請主要有以下有益效果:
17、本申請?zhí)岢鲆环N結(jié)合領(lǐng)域知識的文本生成方法,對獲取的查詢文本數(shù)據(jù)進行預(yù)處理后輸入訓(xùn)練好的領(lǐng)域分類模型,得到文本語義特征向量和領(lǐng)域分類信息,然后根據(jù)預(yù)設(shè)領(lǐng)域詞表對文本語義特征向量進行標(biāo)注,得到增強文本語義向量,最后將預(yù)處理文本數(shù)據(jù)、增強文本語義向量和領(lǐng)域分類信息輸入訓(xùn)練好的文本生成模型中進行語義預(yù)測,生成目標(biāo)文本;本申請能夠?qū)Σ樵兾谋具M行領(lǐng)域識別,根據(jù)所屬領(lǐng)域進行識別,提高文本生成準(zhǔn)確率;對文本數(shù)據(jù)進行預(yù)處理,以及根據(jù)預(yù)設(shè)領(lǐng)域詞表對文本語義特征向量進行標(biāo)注,提高了待識別文本的質(zhì)量;通過文本生成模型對文本進行生成,能夠?qū)ξ谋菊Z義進行充分理解,進而提高文本生成的效率和準(zhǔn)確度。
1.一種結(jié)合領(lǐng)域知識的文本生成方法,其特征在于,包括下述步驟:
2.根據(jù)權(quán)利要求1所述的結(jié)合領(lǐng)域知識的文本生成方法,其特征在于,所述領(lǐng)域分類模型包括嵌入層、多尺度特征提取層、至少兩層特征編碼層和分類層,所述將所述預(yù)處理文本數(shù)據(jù)輸入訓(xùn)練好的領(lǐng)域分類模型,得到文本語義特征向量和領(lǐng)域分類信息的步驟包括:
3.根據(jù)權(quán)利要求2所述的結(jié)合領(lǐng)域知識的文本生成方法,其特征在于,所述至少兩層特征編碼層包括第一編碼層和第二編碼層,所述第一編碼層包括第一多頭注意力子層、第一特征融合子層、第一前饋子層和第一殘差連接子層,所述第二編碼層包括第二多頭注意力子層、第二特征融合子層、第二前饋子層和第二殘差連接子層;所述將所述文本多尺度特征輸入所述至少兩層特征編碼層,依次進行多尺度多頭注意力計算,得到多尺度融合特征的步驟具體包括:
4.根據(jù)權(quán)利要求1所述的結(jié)合領(lǐng)域知識的文本生成方法,其特征在于,所述根據(jù)所述預(yù)設(shè)領(lǐng)域詞表對所述文本語義特征向量進行標(biāo)注,得到增強文本語義向量的步驟包括:
5.根據(jù)權(quán)利要求1所述的結(jié)合領(lǐng)域知識的文本生成方法,其特征在于,所述文本生成模型包括知識層、嵌入層、可見層、編碼層和bart解碼層;所述將所述預(yù)處理文本數(shù)據(jù)、所述增強文本語義向量和所述領(lǐng)域分類信息輸入訓(xùn)練好的文本生成模型中進行語義預(yù)測,生成目標(biāo)文本的步驟包括:
6.根據(jù)權(quán)利要求5所述的結(jié)合領(lǐng)域知識的文本生成方法,其特征在于,所述將所述知識圖譜中的知識注入到所述預(yù)處理文本數(shù)據(jù)的文本句子中,形成句子樹的步驟包括:
7.根據(jù)權(quán)利要求1所述的結(jié)合領(lǐng)域知識的文本生成方法,其特征在于,在所述將所述預(yù)處理文本數(shù)據(jù)、所述增強文本語義向量和所述領(lǐng)域分類信息輸入訓(xùn)練好的文本生成模型中進行語義預(yù)測的步驟之前還包括:
8.一種結(jié)合領(lǐng)域知識的文本生成裝置,其特征在于,包括:
9.一種計算機設(shè)備,其特征在于,包括存儲器和處理器,所述存儲器中存儲有計算機可讀指令,所述處理器執(zhí)行所述計算機可讀指令時實現(xiàn)如權(quán)利要求1至7中任一項所述的結(jié)合領(lǐng)域知識的文本生成方法的步驟。
10.一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)上存儲有計算機可讀指令,所述計算機可讀指令被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至7中任一項所述的結(jié)合領(lǐng)域知識的文本生成方法的步驟。