本發(fā)明涉及文本處理,特別是涉及一種產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、產(chǎn)業(yè)鏈知識圖譜包括企業(yè)與產(chǎn)業(yè)鏈鏈點、企業(yè)與產(chǎn)品、鏈點與鏈點之間的三元組關(guān)系,在企業(yè)產(chǎn)業(yè)鏈知識圖譜中進(jìn)行實體和屬性關(guān)系的抽取,能夠獲取到若干企業(yè)對象和產(chǎn)品的關(guān)聯(lián)關(guān)系。企業(yè)產(chǎn)業(yè)鏈信息在企業(yè)風(fēng)險評估、風(fēng)險傳導(dǎo)以及行業(yè)關(guān)聯(lián)性分析等諸多方面均有著至關(guān)重要的參考價值。在現(xiàn)有的一些企業(yè)公開文件中,往往會透露出其所關(guān)聯(lián)的一些企業(yè)的產(chǎn)業(yè)鏈關(guān)系,例如,在企業(yè)所發(fā)布的公開文件中,用戶可以查看到該企業(yè)所銷售產(chǎn)品的材料來源以及銷售去向等,從而確定出該企業(yè)所關(guān)聯(lián)的一些企業(yè)和產(chǎn)品,然而,根據(jù)這些公開文件僅能對產(chǎn)業(yè)鏈關(guān)系作片面的了解,且由于產(chǎn)業(yè)鏈知識圖譜的數(shù)據(jù)缺乏,也無法獲取到全面的產(chǎn)業(yè)鏈信息,企業(yè)風(fēng)險評估和行業(yè)關(guān)聯(lián)性分析的可靠性不能保證。
技術(shù)實現(xiàn)思路
1、針對上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:
2、一種產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,所述方法包括如下步驟:
3、針對企業(yè)對象的給定產(chǎn)品,根據(jù)給定產(chǎn)品對應(yīng)的企業(yè)對象中的若干產(chǎn)品描述文本,通過關(guān)鍵詞抽取模型抽取到若干第一產(chǎn)品關(guān)鍵詞。
4、根據(jù)每一第一產(chǎn)品關(guān)鍵詞對應(yīng)的tf-idf值和預(yù)設(shè)的tf-idf閾值,從若干第一產(chǎn)品關(guān)鍵詞中篩選出若干第二產(chǎn)品關(guān)鍵詞,并從預(yù)設(shè)文本庫中獲取若干第二產(chǎn)品關(guān)鍵詞對應(yīng)的若干目標(biāo)文本。
5、從若干目標(biāo)文本中抽取若干第三產(chǎn)品關(guān)鍵詞,并生成特征向量輸入至目標(biāo)神經(jīng)網(wǎng)絡(luò)預(yù)測模型中,獲取到給定產(chǎn)品對應(yīng)的目標(biāo)類別標(biāo)簽,以根據(jù)預(yù)設(shè)的產(chǎn)業(yè)鏈映射表獲取到企業(yè)對象對應(yīng)的目標(biāo)產(chǎn)業(yè)鏈;所述產(chǎn)業(yè)鏈映射表包括若干組一一對應(yīng)的預(yù)設(shè)類別標(biāo)簽和預(yù)設(shè)產(chǎn)業(yè)鏈。
6、計算任一第二產(chǎn)品關(guān)鍵詞和每一第三產(chǎn)品關(guān)鍵詞的關(guān)鍵詞相似度,當(dāng)存在關(guān)鍵詞相似度大于預(yù)設(shè)相似度閾值時,確定第二產(chǎn)品關(guān)鍵詞自身和對應(yīng)的第三產(chǎn)品關(guān)鍵詞具有匹配關(guān)系。
7、當(dāng)具有匹配關(guān)系的第二產(chǎn)品關(guān)鍵詞的數(shù)量與第二產(chǎn)品關(guān)鍵詞的總數(shù)量的比值大于預(yù)設(shè)比例閾值時,根據(jù)確定出的給定產(chǎn)品在目標(biāo)產(chǎn)業(yè)鏈中對應(yīng)的目標(biāo)鏈點,將企業(yè)對象、給定產(chǎn)品與目標(biāo)鏈點進(jìn)行融合掛接,以實現(xiàn)對產(chǎn)業(yè)鏈知識圖譜的擴(kuò)展。
8、本發(fā)明至少具有以下有益效果:
9、本發(fā)明提供了一種產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,首先根據(jù)給定產(chǎn)品在對應(yīng)的企業(yè)對象中的若干產(chǎn)品描述文本,抽取出若干第一產(chǎn)品關(guān)鍵詞,然后根據(jù)每一第一產(chǎn)品關(guān)鍵詞的重要程度,篩選出若干第二產(chǎn)品關(guān)鍵詞,從預(yù)設(shè)文本庫中獲取第二產(chǎn)品關(guān)鍵詞對應(yīng)的目標(biāo)文本,從若干目標(biāo)文本中抽取若干第三產(chǎn)品關(guān)鍵詞,以提高給定產(chǎn)品相關(guān)詞匯的全面性,根據(jù)若干第三產(chǎn)品關(guān)鍵詞獲取到給定產(chǎn)品對應(yīng)的目標(biāo)類別標(biāo)簽,并根據(jù)目標(biāo)類別標(biāo)簽映射得到企業(yè)對象對應(yīng)的目標(biāo)產(chǎn)業(yè)鏈,也即,獲取到了企業(yè)對象所屬行業(yè)對應(yīng)的產(chǎn)業(yè)鏈,獲取與任一第三產(chǎn)品關(guān)鍵詞的關(guān)鍵詞相似度大于預(yù)設(shè)相似度閾值的第二產(chǎn)品關(guān)鍵詞的數(shù)量,當(dāng)該數(shù)量與第二產(chǎn)品關(guān)鍵詞的總數(shù)量的比值大于預(yù)設(shè)比例閾值時,表明第二產(chǎn)品關(guān)鍵詞與第三產(chǎn)品關(guān)鍵詞的相同數(shù)量或相似數(shù)量較多,能夠合理地將獲取到的目標(biāo)產(chǎn)業(yè)鏈確定為給定產(chǎn)品對應(yīng)的產(chǎn)業(yè)鏈,此時將企業(yè)對象、給定產(chǎn)品與目標(biāo)產(chǎn)業(yè)鏈中的目標(biāo)鏈點進(jìn)行融合掛接,能夠?qū)崿F(xiàn)對產(chǎn)業(yè)鏈知識圖譜的準(zhǔn)確可靠擴(kuò)展,進(jìn)而有利于企業(yè)對象對全領(lǐng)域產(chǎn)品和其他企業(yè)對象的了解,以便于后續(xù)的企業(yè)風(fēng)險評估和行業(yè)關(guān)聯(lián)性分析。
1.一種產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,其特征在于,所述方法包括如下步驟:
2.根據(jù)權(quán)利要求1所述的產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,其特征在于,所述通過關(guān)鍵詞抽取模型抽取到若干第一產(chǎn)品關(guān)鍵詞,還包括如下步驟:
3.根據(jù)權(quán)利要求1所述的產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,其特征在于,通過如下步驟獲取目標(biāo)文本:
4.根據(jù)權(quán)利要求3所述的產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,其特征在于,通過以下步驟獲取第一待處理文本對應(yīng)的第一文本優(yōu)先級:
5.根據(jù)權(quán)利要求3所述的產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,其特征在于,通過以下步驟獲取第一待處理文本對應(yīng)的第二文本優(yōu)先級:
6.根據(jù)權(quán)利要求1所述的產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,其特征在于,通過如下步驟獲取目標(biāo)神經(jīng)網(wǎng)絡(luò)預(yù)測模型:
7.根據(jù)權(quán)利要求1所述的產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,其特征在于,任一第二產(chǎn)品關(guān)鍵詞和任一第三產(chǎn)品關(guān)鍵詞的關(guān)鍵詞相似度符合如下條件:
8.根據(jù)權(quán)利要求1所述的產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法,其特征在于,通過如下步驟確定出給定產(chǎn)品在目標(biāo)產(chǎn)業(yè)鏈中對應(yīng)的目標(biāo)鏈點:
9.一種非瞬時性計算機(jī)可讀存儲介質(zhì),所述存儲介質(zhì)中存儲有至少一條指令或至少一段程序,其特征在于,所述至少一條指令或所述至少一段程序由處理器加載并執(zhí)行以實現(xiàn)如權(quán)利要求1-8中任意一項所述的產(chǎn)業(yè)鏈知識圖譜擴(kuò)展方法。
10.一種電子設(shè)備,其特征在于,包括處理器和權(quán)利要求9中所述的非瞬時性計算機(jī)可讀存儲介質(zhì)。