本發(fā)明屬于人工智能,具體而言,涉及描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法與系統(tǒng)。
背景技術(shù):
1、現(xiàn)有技術(shù)中,借助斯坦福ai小鎮(zhèn)開源模擬虛擬醫(yī)院,患者、護(hù)士和醫(yī)生都是由大型語言模型驅(qū)動(dòng)的智能體,在虛擬醫(yī)院中模擬了治療患者疾病的整個(gè)封閉循環(huán)的關(guān)鍵環(huán)節(jié):發(fā)病、分診、掛號(hào)、咨詢、體檢、診斷、取藥、康復(fù)和院后隨訪。智能體醫(yī)生可以在沒有手動(dòng)標(biāo)記數(shù)據(jù)的情況下,僅僅用少量真實(shí)病例數(shù)據(jù)進(jìn)行迭代進(jìn)化,隨著時(shí)間的推移不斷提高了治療性能,最后獲得較高的診斷準(zhǔn)確性。
2、隨著人工智能日益發(fā)展,僅僅使用人類手工來篩查文獻(xiàn)、閱讀文獻(xiàn)與標(biāo)注文獻(xiàn)等工作,不僅耗費(fèi)巨大人力資源,而且難以實(shí)現(xiàn)文獻(xiàn)的即時(shí)追蹤。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)問題,本發(fā)明提供描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法與系統(tǒng)。
2、第一方面,本發(fā)明提供了描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法,包括:
3、利用rpa機(jī)器人構(gòu)建文獻(xiàn)自動(dòng)化查詢機(jī)器人,運(yùn)行文獻(xiàn)自動(dòng)化查詢系統(tǒng),文獻(xiàn)自動(dòng)化查詢機(jī)器人根據(jù)關(guān)鍵詞執(zhí)行文獻(xiàn)自動(dòng)化查詢與下載任務(wù);
4、構(gòu)建基于大模型的文獻(xiàn)自動(dòng)化閱讀智能體機(jī)器人,利用智能體機(jī)器人進(jìn)行文獻(xiàn)自動(dòng)化閱讀;文獻(xiàn)自動(dòng)化閱讀機(jī)器人執(zhí)行文獻(xiàn)閱讀任務(wù)、文獻(xiàn)摘要提取任務(wù)與文獻(xiàn)相關(guān)性系數(shù)計(jì)算任務(wù);
5、分別提取專題數(shù)據(jù)庫中的文獻(xiàn)與已知文獻(xiàn)的特征向量,計(jì)算專題數(shù)據(jù)庫中的文獻(xiàn)與已知文獻(xiàn)的特征向量的第一相關(guān)性系數(shù);
6、篩選專題數(shù)據(jù)庫中的文獻(xiàn)與已知文獻(xiàn)的第一相關(guān)性系數(shù)大于第一設(shè)定值的文獻(xiàn)并保存為第一中間文獻(xiàn);
7、構(gòu)建基于大模型的圖像自動(dòng)化比對(duì)智能體機(jī)器人并運(yùn)行,計(jì)算第一中間文獻(xiàn)所記載的圖形與已知文獻(xiàn)的圖形的第二相關(guān)性系數(shù);
8、篩選第一中間文獻(xiàn)中與已知文獻(xiàn)的第二相關(guān)性系數(shù)大于第二設(shè)定值的第一中間文獻(xiàn)并保存為第二中間文獻(xiàn);
9、構(gòu)建基于大模型的文獻(xiàn)關(guān)鍵詞自動(dòng)化摘錄智能體機(jī)器人并運(yùn)行,對(duì)第二中間文獻(xiàn)中的文獻(xiàn)關(guān)鍵詞進(jìn)行摘錄,并保存在數(shù)據(jù)庫中;
10、利用rpa機(jī)器人構(gòu)建數(shù)字化地圖自動(dòng)化標(biāo)注機(jī)器人并運(yùn)行,對(duì)數(shù)據(jù)庫中的文獻(xiàn)關(guān)鍵詞進(jìn)行自動(dòng)化提取并在數(shù)字地圖上進(jìn)行自動(dòng)化標(biāo)注,得到描述已知文獻(xiàn)所載方案的影響力擴(kuò)散與發(fā)展趨勢(shì)的數(shù)字化動(dòng)態(tài)地圖。
11、第二方面,本發(fā)明提供了描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建系統(tǒng),包括查詢單元、閱讀單元、第一相關(guān)性系數(shù)計(jì)算單元、第一篩選單元、第二相關(guān)性系數(shù)計(jì)算單元、第二篩選單元、摘錄單元與標(biāo)注單元;
12、查詢單元,用于利用rpa機(jī)器人構(gòu)建文獻(xiàn)自動(dòng)化查詢機(jī)器人,運(yùn)行文獻(xiàn)自動(dòng)化查詢系統(tǒng),文獻(xiàn)自動(dòng)化查詢機(jī)器人根據(jù)關(guān)鍵詞執(zhí)行文獻(xiàn)自動(dòng)化查詢與下載任務(wù);
13、閱讀單元,用于構(gòu)建基于大模型的文獻(xiàn)自動(dòng)化閱讀智能體機(jī)器人,利用智能體機(jī)器人進(jìn)行文獻(xiàn)自動(dòng)化閱讀;文獻(xiàn)自動(dòng)化閱讀機(jī)器人執(zhí)行文獻(xiàn)閱讀任務(wù)、文獻(xiàn)摘要提取任務(wù)與文獻(xiàn)相關(guān)性系數(shù)計(jì)算任務(wù);
14、第一相關(guān)性系數(shù)計(jì)算單元,用于分別提取專題數(shù)據(jù)庫中的文獻(xiàn)與已知文獻(xiàn)的特征向量,計(jì)算專題數(shù)據(jù)庫中的文獻(xiàn)與已知文獻(xiàn)的特征向量的第一相關(guān)性系數(shù);
15、第一篩選單元,用于篩選專題數(shù)據(jù)庫中的文獻(xiàn)與已知文獻(xiàn)的第一相關(guān)性系數(shù)大于第一設(shè)定值的文獻(xiàn)并保存為第一中間文獻(xiàn);
16、第二相關(guān)性系數(shù)計(jì)算單元,用于構(gòu)建基于大模型的圖像自動(dòng)化比對(duì)智能體機(jī)器人并運(yùn)行,計(jì)算第一中間文獻(xiàn)所記載的圖形與已知文獻(xiàn)的圖形的第二相關(guān)性系數(shù);
17、第二篩選單元,用于篩選第一中間文獻(xiàn)中與已知文獻(xiàn)的第二相關(guān)性系數(shù)大于第二設(shè)定值的第一中間文獻(xiàn)并保存為第二中間文獻(xiàn);
18、摘錄單元,用于構(gòu)建基于大模型的文獻(xiàn)關(guān)鍵詞自動(dòng)化摘錄智能體機(jī)器人并運(yùn)行,對(duì)第二中間文獻(xiàn)中的文獻(xiàn)關(guān)鍵詞進(jìn)行摘錄,并保存在數(shù)據(jù)庫中;
19、標(biāo)注單元,用于利用rpa機(jī)器人構(gòu)建數(shù)字化地圖自動(dòng)化標(biāo)注機(jī)器人并運(yùn)行,對(duì)數(shù)據(jù)庫中的文獻(xiàn)關(guān)鍵詞進(jìn)行自動(dòng)化提取并在數(shù)字地圖上進(jìn)行自動(dòng)化標(biāo)注,得到描述已知文獻(xiàn)所載方案的影響力擴(kuò)散與發(fā)展趨勢(shì)的數(shù)字化動(dòng)態(tài)地圖。
20、在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進(jìn)。
21、進(jìn)一步,文獻(xiàn)自動(dòng)化查詢機(jī)器人根據(jù)關(guān)鍵詞執(zhí)行文獻(xiàn)自動(dòng)化查詢與下載任務(wù)時(shí),根據(jù)關(guān)鍵詞查找專題數(shù)據(jù)庫中的文獻(xiàn),將題目或者摘要包含關(guān)鍵詞的專題數(shù)據(jù)庫中的文獻(xiàn)下載至專題數(shù)據(jù)庫。
22、進(jìn)一步,分別提取專題數(shù)據(jù)庫中的文獻(xiàn)與已知文獻(xiàn)的特征向量,計(jì)算專題數(shù)據(jù)庫中的文獻(xiàn)與已知文獻(xiàn)的特征向量之間夾角的余弦相似度作為第一相關(guān)性系數(shù);如果專題數(shù)據(jù)庫中的文獻(xiàn)與已知文獻(xiàn)的特征向量之間夾角的余弦相似度大于第一設(shè)定閾值,則保留專題數(shù)據(jù)庫中的文獻(xiàn),否則不保留專題數(shù)據(jù)庫中的文獻(xiàn)。
23、進(jìn)一步,第二相關(guān)性系數(shù)包括外形相關(guān)性系數(shù)與圖片顏色相關(guān)系數(shù);若第一中間文獻(xiàn)所記載的圖形與已知文獻(xiàn)的圖形的外形相關(guān)性系數(shù)大于第二設(shè)定閾值,且圖片顏色相關(guān)系數(shù)均大于第三設(shè)定閾值,則第一中間文獻(xiàn)由該已知文獻(xiàn)發(fā)展得到。
24、進(jìn)一步,外形相關(guān)性系數(shù)根據(jù)尺度不變特征變換相關(guān)系數(shù)算法計(jì)算,包括:
25、分別在第一中間文獻(xiàn)所記載的圖形與已知文獻(xiàn)的圖形中提取出具有尺度不變性和旋轉(zhuǎn)不變性的特征點(diǎn);特征點(diǎn)包含了位置信息、尺度信息與方向信息;
26、通過特征點(diǎn)的描述子匹配兩張圖片中的特征點(diǎn);描述子為用于描述特征點(diǎn)周圍的像素信息的向量;
27、根據(jù)匹配的特征點(diǎn)數(shù)量與質(zhì)量計(jì)算外形相關(guān)性。
28、進(jìn)一步,采用距離度量的方法確定兩張圖片外形匹配程度作為外形相關(guān)性系數(shù);距離度量的方法包括計(jì)算特征點(diǎn)的歐式距離確定兩張圖片的外形相似度。
29、進(jìn)一步,圖片顏色相關(guān)系數(shù)根據(jù)顏色直方圖相交算法計(jì)算,包括:對(duì)于第一中間文獻(xiàn)所記載的每一張圖形與已知文獻(xiàn)的圖形,分別構(gòu)建顏色直方圖,統(tǒng)計(jì)圖像中每種顏色出現(xiàn)頻率,計(jì)算第一中間文獻(xiàn)所記載的每一張圖形與已知文獻(xiàn)的圖形的顏色直方圖相交系數(shù),作為圖片顏色相關(guān)系數(shù)。
30、進(jìn)一步,文獻(xiàn)關(guān)鍵詞包括文獻(xiàn)摘要關(guān)鍵詞、文獻(xiàn)中的作者、作者機(jī)構(gòu)、作者郵箱與文獻(xiàn)所屬行業(yè)。
31、本發(fā)明的有益效果是:本發(fā)明提出基于機(jī)器人流程化技術(shù)結(jié)合基于大模型的智能體機(jī)器人,融合可視化技術(shù),通過全自動(dòng)、智能化以及高效率地追蹤全球文獻(xiàn),對(duì)技術(shù)文獻(xiàn)在全球的傳播與擴(kuò)散實(shí)現(xiàn)無人值守模式的智能化及時(shí)追蹤,具有較高的學(xué)術(shù)價(jià)值與商業(yè)價(jià)值;本發(fā)明具有開發(fā)部署簡(jiǎn)單、集成化程度高、自動(dòng)化運(yùn)行、實(shí)時(shí)性追蹤和智能化分析等顯著優(yōu)點(diǎn),對(duì)查詢關(guān)鍵詞稍作修改,即可對(duì)任何一個(gè)新技術(shù)文獻(xiàn)在全球范圍的擴(kuò)散與發(fā)展趨勢(shì)進(jìn)行追蹤,因此本發(fā)明具有極強(qiáng)的可擴(kuò)展性。
1.描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法,其特征在于,文獻(xiàn)自動(dòng)化查詢機(jī)器人根據(jù)關(guān)鍵詞執(zhí)行文獻(xiàn)自動(dòng)化查詢與下載任務(wù)時(shí),根據(jù)關(guān)鍵詞查找專題數(shù)據(jù)庫中的文獻(xiàn),將題目或者摘要包含關(guān)鍵詞的專題數(shù)據(jù)庫中的文獻(xiàn)下載至專題數(shù)據(jù)庫。
3.根據(jù)權(quán)利要求1所述描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法,其特征在于,分別提取專題數(shù)據(jù)庫中的的文獻(xiàn)與已知文獻(xiàn)的特征向量,計(jì)算專題數(shù)據(jù)庫中的的文獻(xiàn)與已知文獻(xiàn)的特征向量之間夾角的余弦相似度作為第一相關(guān)性系數(shù);如果特征向量之間夾角的余弦相似度大于第一設(shè)定閾值,則保留專題數(shù)據(jù)庫中的文獻(xiàn),否則不保留專題數(shù)據(jù)庫中的文獻(xiàn)。
4.根據(jù)權(quán)利要求1所述描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法,其特征在于,第二相關(guān)性系數(shù)包括外形相關(guān)性系數(shù)與圖片顏色相關(guān)系數(shù);若第一中間文獻(xiàn)所記載的圖形與已知文獻(xiàn)所載的圖形的外形相關(guān)性系數(shù)大于第二設(shè)定閾值,且圖片顏色相關(guān)系數(shù)均大于第三設(shè)定閾值,則第一中間文獻(xiàn)由該已知文獻(xiàn)發(fā)展得到。
5.根據(jù)權(quán)利要求4所述描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法,其特征在于,外形相關(guān)性系數(shù)根據(jù)尺度不變特征變換相關(guān)系數(shù)算法計(jì)算,包括:
6.根據(jù)權(quán)利要求5所述描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法,其特征在于,采用距離度量的方法確定兩張圖片外形匹配程度作為外形相關(guān)性系數(shù);距離度量的方法包括計(jì)算特征點(diǎn)的歐式距離確定兩張圖片的外形相似度。
7.根據(jù)權(quán)利要求4所述描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法,其特征在于,圖片顏色相關(guān)系數(shù)根據(jù)顏色直方圖相交算法計(jì)算,包括:對(duì)于第一中間文獻(xiàn)所記載的每一張圖形與已知文獻(xiàn)的圖形,分別構(gòu)建顏色直方圖,統(tǒng)計(jì)圖像中每種顏色出現(xiàn)頻率,計(jì)算第一中間文獻(xiàn)所記載的每一張圖形與已知文獻(xiàn)的圖形的顏色直方圖相交系數(shù),作為圖片顏色相關(guān)系數(shù)。
8.根據(jù)權(quán)利要求1所述描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建方法,其特征在于,文獻(xiàn)關(guān)鍵詞包括文獻(xiàn)摘要關(guān)鍵詞、文獻(xiàn)中的作者、作者機(jī)構(gòu)、作者郵箱與文獻(xiàn)所屬行業(yè)。
9.描述文獻(xiàn)影響擴(kuò)散的數(shù)字化動(dòng)態(tài)地圖構(gòu)建系統(tǒng),其特征在于,包括查詢單元、閱讀單元、第一相關(guān)性系數(shù)計(jì)算單元、第一篩選單元、第二相關(guān)性系數(shù)計(jì)算單元、第二篩選單元、摘錄單元與標(biāo)注單元;