欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于GPT4的網(wǎng)安領(lǐng)域知識(shí)增強(qiáng)方法和系統(tǒng)

文檔序號(hào):40449914發(fā)布日期:2024-12-27 09:14閱讀:13來(lái)源:國(guó)知局
一種基于GPT4的網(wǎng)安領(lǐng)域知識(shí)增強(qiáng)方法和系統(tǒng)

本發(fā)明涉及網(wǎng)絡(luò)安全的,具體為一種基于gpt4的網(wǎng)安領(lǐng)域知識(shí)增強(qiáng)方法和系統(tǒng)。


背景技術(shù):

1、gpt(generative?pre-training?transformer)系列模型是由openai開(kāi)發(fā)的一系列自然語(yǔ)言處理(nlp)模型,通常叫做大語(yǔ)言模型,旨在通過(guò)深度學(xué)習(xí)技術(shù)理解和生成人類語(yǔ)言。這些模型基于transformer架構(gòu),通過(guò)大量文本數(shù)據(jù)的預(yù)訓(xùn)練和微調(diào)(fine-tuning)來(lái)提高其性能和靈活性。

2、問(wèn)答系統(tǒng)kgqan通過(guò)識(shí)別用戶問(wèn)題的語(yǔ)義來(lái)查詢知識(shí)圖譜回答用戶問(wèn)題,它具體實(shí)現(xiàn)方法分為三個(gè)步驟:(i)問(wèn)題理解:從問(wèn)題中提取實(shí)體和關(guān)系并生成抽象表示;通過(guò)訓(xùn)練seq2seq神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)如何從自然語(yǔ)言問(wèn)題中提取形式抽象表示。對(duì)于用戶的輸入通過(guò)訓(xùn)練好的seq2seq模型,提取問(wèn)題中存在的實(shí)體和關(guān)系并生成抽象表示;另外預(yù)測(cè)期望的數(shù)據(jù)類型和未知的語(yǔ)義類型來(lái)幫助后續(xù)過(guò)濾目標(biāo)知識(shí)圖譜中的實(shí)體信息,以提高答案的準(zhǔn)確性。將數(shù)據(jù)類型預(yù)測(cè)定義為分類任務(wù),使用深度神經(jīng)網(wǎng)絡(luò)對(duì)用戶問(wèn)題預(yù)測(cè)數(shù)據(jù)和語(yǔ)義類型,其中預(yù)期的數(shù)據(jù)類型可以是日期、數(shù)字、布爾值或字符串。(ii)鏈接:這其中分為節(jié)點(diǎn)鏈接和關(guān)系鏈接,將目標(biāo)知識(shí)圖譜中節(jié)點(diǎn)、關(guān)系各自與他們的描述結(jié)合,識(shí)別目標(biāo)知識(shí)圖譜和問(wèn)題的抽象描述語(yǔ)義上最接近的節(jié)點(diǎn)與關(guān)系,實(shí)現(xiàn)將抽象表示映射到目標(biāo)知識(shí)圖譜中相應(yīng)的實(shí)體和關(guān)系,以構(gòu)造知識(shí)圖譜查詢;(iii)過(guò)濾:過(guò)濾目標(biāo)知識(shí)圖譜中不符合所預(yù)測(cè)的數(shù)據(jù)類型或者語(yǔ)義類型的節(jié)點(diǎn)與關(guān)系。將過(guò)濾后的節(jié)點(diǎn)、關(guān)系獲取所有可能有效組合生成的一組知識(shí)圖譜子圖,計(jì)算出這一組子圖的分?jǐn)?shù)返回前k個(gè)作為答案返回給用戶。

3、上述系統(tǒng)通過(guò)模型識(shí)別用戶問(wèn)題中存在的所有三元組并在目標(biāo)知識(shí)圖譜中查找最相關(guān)的三元組,最終將三元組進(jìn)行拓展獲得子知識(shí)圖譜返回給用戶。這種方法識(shí)別出的用戶問(wèn)題中的三元組并未考慮專業(yè)領(lǐng)域知識(shí),因此返回的信息可能包含過(guò)多無(wú)關(guān)的知識(shí)。過(guò)度的冗余導(dǎo)致返回給用戶的信息精確度不高,用戶還需要從獲得的信息中檢索是否包含有效信息,導(dǎo)致系統(tǒng)可用性差。

4、此外,上述問(wèn)答系統(tǒng)解決的核心問(wèn)題是圖譜查詢,且不論其圖譜查詢的正確性和精確度如何,即使正確且精準(zhǔn)查詢到了對(duì)應(yīng)信息,也是以知識(shí)圖譜的形式返回給用戶,但由于知識(shí)圖譜其為結(jié)構(gòu)化組織信息的特性,返回的信息可讀性差,用戶門檻高,難以追求用戶體驗(yàn)感。


技術(shù)實(shí)現(xiàn)思路

1、(一)解決的技術(shù)問(wèn)題

2、針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種基于gpt4的網(wǎng)安領(lǐng)域知識(shí)增強(qiáng)方法和系統(tǒng),將網(wǎng)安領(lǐng)域的知識(shí)圖譜作為gpt-4的外部知識(shí)庫(kù),通過(guò)與gpt-4不斷進(jìn)行交互的方式來(lái)行成gpt-4推理鏈,讓它利用自身強(qiáng)大的推理能力逐步推理出知識(shí)圖譜中與問(wèn)題最相關(guān)的信息,同時(shí)結(jié)合gpt-4強(qiáng)大的知識(shí)儲(chǔ)備對(duì)獲取到的有效信息繼續(xù)解析和處理,從而實(shí)現(xiàn)對(duì)自身的網(wǎng)安領(lǐng)域知識(shí)增強(qiáng)。

3、(二)技術(shù)方案

4、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于gpt4的網(wǎng)安領(lǐng)域知識(shí)增強(qiáng)方法,包括以下步驟:

5、預(yù)處理知識(shí)圖譜獲取實(shí)體向量;

6、獲取用戶所輸入問(wèn)題的關(guān)鍵要素,得到嵌入向量;獲取所有實(shí)體向量與嵌入向量之間的語(yǔ)義相似度得分,語(yǔ)義相似度得分最高的實(shí)體為語(yǔ)義最相近實(shí)體;

7、設(shè)置閾值,如果語(yǔ)義最相近實(shí)體的語(yǔ)義相似度得分仍然低于閾值,則轉(zhuǎn)向大模型問(wèn)答處理;若語(yǔ)義最相近實(shí)體的語(yǔ)義相似度得分實(shí)體高于閾值,且不止一個(gè)實(shí)體的語(yǔ)義相似度得分高于閾值,將語(yǔ)義最相近實(shí)體判定為問(wèn)題的對(duì)應(yīng)實(shí)體,并開(kāi)啟知識(shí)圖譜閱讀,然后進(jìn)行g(shù)pt-4的推理鏈處理。

8、進(jìn)一步地,所述預(yù)處理知識(shí)圖譜獲取實(shí)體向量的方法,包括以下步驟:

9、將知識(shí)圖譜中所有的實(shí)體節(jié)點(diǎn)進(jìn)行提取,然后通過(guò)詞嵌入的方式將每個(gè)實(shí)體映射為一個(gè)高維空間中的實(shí)體向量,完成實(shí)體嵌入過(guò)程,然后構(gòu)建實(shí)體向量庫(kù)來(lái)存儲(chǔ)該知識(shí)圖譜中所有實(shí)體向量。

10、進(jìn)一步地,所述得到嵌入向量的方法,包括以下步驟:

11、將用戶給出的問(wèn)題中的主體作為關(guān)鍵要素,采用詞嵌入方法將關(guān)鍵要素轉(zhuǎn)化成對(duì)應(yīng)的嵌入向量。

12、進(jìn)一步地,所述獲取所有實(shí)體向量與嵌入向量之間的語(yǔ)義相似度得分的方法,包括以下步驟:

13、所述獲取所有實(shí)體向量與嵌入向量之間的語(yǔ)義相似度得分的方法,包括以下步驟:

14、通過(guò)計(jì)算嵌入向量和實(shí)體向量之間的余弦相似度得到語(yǔ)義相似度得分,計(jì)算方法如下:

15、嵌入向量和實(shí)體向量的余弦相似度的計(jì)算公式為:

16、

17、其中:

18、a和b是兩個(gè)非零向量;

19、a·b表示a和b的點(diǎn)積;

20、‖a‖和‖b‖分別表示向量a和b的歐幾里得范數(shù);

21、得到嵌入向量和實(shí)體向量之間的夾角余弦值,夾角余弦值作為實(shí)體的語(yǔ)義相似度得分,然后根據(jù)語(yǔ)義相似度得分進(jìn)行排序,從而匹配出語(yǔ)義最相近實(shí)體。

22、進(jìn)一步地,所述gpt-4的推理鏈,包括以下步驟:

23、最優(yōu)關(guān)系推理:通過(guò)模板查詢出該實(shí)體節(jié)點(diǎn)關(guān)聯(lián)的所有關(guān)系,所有關(guān)系經(jīng)過(guò)序列化處理后輸入gpt-4,讓gpt-4根據(jù)用戶輸入的問(wèn)題來(lái)推理出所有關(guān)系中的最相關(guān)關(guān)系;

24、相關(guān)三元組推理:根據(jù)gpt-4推理出的最相關(guān)關(guān)系,查詢出包含該實(shí)體-最相關(guān)關(guān)系對(duì)的所有三元組,經(jīng)過(guò)序列化處理后輸入gpt-4,讓gpt-4根據(jù)用戶輸入的問(wèn)題,進(jìn)一步推理出與問(wèn)題相關(guān)的所有三元組;

25、迭代決策:根據(jù)找出的所有三元組信息是否足夠支撐gpt-4回答用戶的問(wèn)題來(lái)決策是否繼續(xù)迭代。

26、進(jìn)一步地,所述根據(jù)找出的所有三元組信息是否足夠支撐gpt-4回答用戶的問(wèn)題來(lái)決策是否繼續(xù)迭代的方法,包括以下步驟:

27、若當(dāng)前獲取到的信息還不足以回答問(wèn)題,gpt-4繼續(xù)迭代直到獲取足夠的信息;如果當(dāng)前信息足夠,則不進(jìn)行迭代,直接完成領(lǐng)域知識(shí)增強(qiáng)。

28、本發(fā)明的一種基于gpt4的網(wǎng)安領(lǐng)域知識(shí)增強(qiáng)系統(tǒng),包括:

29、知識(shí)圖譜預(yù)處理模塊:用于預(yù)處理知識(shí)圖譜獲取實(shí)體向量;

30、用戶問(wèn)題處理模塊:負(fù)責(zé)接收用戶輸入的問(wèn)題,進(jìn)行關(guān)鍵要素選取,并生成嵌入向量;

31、相似度計(jì)算模塊:計(jì)算嵌入向量與實(shí)體向量的語(yǔ)義相似度得分,以確定語(yǔ)義最相近實(shí)體;

32、閾值判定模塊:設(shè)置閾值來(lái)決定是否在知識(shí)圖譜中找到合適的實(shí)體;若語(yǔ)義最相近實(shí)體的語(yǔ)義相似度得分實(shí)體高于閾值,且不止一個(gè)實(shí)體的語(yǔ)義相似度得分高于閾值,將語(yǔ)義最相近實(shí)體判定為問(wèn)題的對(duì)應(yīng)實(shí)體;

33、知識(shí)圖譜閱讀模塊:在確定語(yǔ)義最相近實(shí)體后,進(jìn)行知識(shí)圖譜閱讀,利用gpt-4進(jìn)行推理鏈處理,生成最終的回答。

34、(三)有益效果

35、與現(xiàn)有技術(shù)相比,本發(fā)明提供了一種基于gpt4的網(wǎng)安領(lǐng)域知識(shí)增強(qiáng)方法和系統(tǒng),具備以下有益效果:本發(fā)明首次將gpt-4應(yīng)用到網(wǎng)安領(lǐng)域的智能問(wèn)答系統(tǒng),通過(guò)將網(wǎng)安領(lǐng)域的知識(shí)圖譜作為gpt-4的外部知識(shí)庫(kù)實(shí)現(xiàn)了對(duì)它的領(lǐng)域知識(shí)增強(qiáng),使其完美適配網(wǎng)安領(lǐng)域;

36、本發(fā)明提出了一種全新的從知識(shí)圖譜中獲取信息的方法——gpt-4的推理鏈,通過(guò)不斷與gpt-4鏈接交互,利用其推理能力逐步獲取信息,最終又能利用獲取的信息對(duì)自身進(jìn)行知識(shí)增強(qiáng)。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
宜宾县| 孙吴县| 交城县| 宝清县| 开鲁县| 密云县| 临夏市| 玛多县| 任丘市| 仙桃市| 潞西市| 长春市| 昌乐县| 包头市| 兴山县| 农安县| 祥云县| 托克逊县| 敖汉旗| 商都县| 朝阳县| 沈丘县| 靖西县| 长寿区| 金川县| 宣化县| 航空| 屏东市| 仁怀市| 池州市| 陵水| 洪湖市| 沈阳市| 体育| 平陆县| 浦县| 宜都市| 高唐县| 嘉兴市| 太仆寺旗| 双辽市|