本專利涉及的信息技術(shù)主要圍繞專利數(shù)據(jù)庫(kù)的建設(shè)與管理,特別是一種基于國(guó)產(chǎn)自主可控環(huán)境的分布式專利檢索方法及系統(tǒng)。
背景技術(shù):
1、專利數(shù)據(jù)庫(kù)作為技術(shù)創(chuàng)新的重要載體,數(shù)據(jù)量正迅速增長(zhǎng)。然而,目前缺乏一個(gè)標(biāo)準(zhǔn)的、高效的專利數(shù)據(jù)架構(gòu)來(lái)應(yīng)對(duì)這種數(shù)據(jù)量的井噴式增長(zhǎng)。專利數(shù)據(jù)不僅數(shù)量龐大,形態(tài)各異,而且關(guān)聯(lián)錯(cuò)綜復(fù)雜,形成了一個(gè)龐大的網(wǎng)狀結(jié)構(gòu),給數(shù)據(jù)檢索和分析帶來(lái)了巨大挑戰(zhàn)。因此,構(gòu)建一個(gè)能夠支持海量數(shù)據(jù)處理、確保數(shù)據(jù)安全、具備高度可擴(kuò)展性且支持國(guó)產(chǎn)自主可控環(huán)境的專利數(shù)據(jù)架構(gòu),成為當(dāng)前迫切的需求。
2、盡管市場(chǎng)上存在多種智能專利檢索方法,但它們?cè)趪?guó)產(chǎn)自主可控環(huán)境下往往面臨算力或資源不足的困境。為了在有限的資源下實(shí)現(xiàn)高效、正確的專利檢索,需要結(jié)合新型的數(shù)據(jù)架構(gòu),采用先進(jìn)的算法和技術(shù)手段,在減少資源消耗的同時(shí),提高檢索的準(zhǔn)確性和效率。這樣的專利檢索方法將能夠更好地適應(yīng)國(guó)產(chǎn)自主可控環(huán)境的復(fù)雜需求。
3、針對(duì)當(dāng)前缺乏高效專利檢索系統(tǒng)的現(xiàn)狀,如何有效管理、存儲(chǔ)和分析這些龐大且復(fù)雜的數(shù)據(jù)成為了一個(gè)重要問(wèn)題,研制一款基于國(guó)產(chǎn)自主可控技術(shù)的專利檢索系統(tǒng)迫在眉睫。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提出了一種基于國(guó)產(chǎn)自主可控環(huán)境的分布式專利數(shù)據(jù)檢索方法及系統(tǒng),以針對(duì)性的解決現(xiàn)有技術(shù)中的問(wèn)題。本發(fā)明在資源有限的情況下(例如缺少gpu),通過(guò)優(yōu)化數(shù)據(jù)架構(gòu)和檢索方法,實(shí)現(xiàn)高效、準(zhǔn)確的專利數(shù)據(jù)檢索。本專利還涉及軟件工程的領(lǐng)域,特別是在研制國(guó)產(chǎn)自主可控的專利檢索系統(tǒng)時(shí),需要考慮如何設(shè)計(jì)友好的用戶界面、優(yōu)化操作流程、確保系統(tǒng)的穩(wěn)定性和安全性等問(wèn)題。
2、為解決上述技術(shù)問(wèn)題,本發(fā)明的具體技術(shù)方案如下:
3、一種基于國(guó)產(chǎn)自主可控環(huán)境的分布式專利檢索方法,其步驟包括:
4、1)建立一分布式專利數(shù)據(jù)架構(gòu),包括用于存儲(chǔ)專利結(jié)構(gòu)化數(shù)據(jù)的關(guān)系型數(shù)據(jù)庫(kù)、nosql數(shù)據(jù)庫(kù)和用于存儲(chǔ)專利非結(jié)構(gòu)化數(shù)據(jù)的高容量存儲(chǔ)服務(wù)器;所述關(guān)系型數(shù)據(jù)庫(kù)采用分布式多節(jié)點(diǎn)進(jìn)行信息存儲(chǔ);所述nosql數(shù)據(jù)庫(kù)中設(shè)有檢索引擎和用于緩存檢索結(jié)果的hash數(shù)據(jù)結(jié)構(gòu);
5、2)將同一核心國(guó)家的專利數(shù)據(jù)存儲(chǔ)到同一節(jié)點(diǎn)中,將各非核心國(guó)家的專利數(shù)據(jù)存儲(chǔ)到剩余節(jié)點(diǎn)中;所述節(jié)點(diǎn)中設(shè)有一主表和多個(gè)子表;所述主表用于存儲(chǔ)專利的核心信息,所述子表用于存儲(chǔ)與所述主表相關(guān)聯(lián)的專利信息及主表的主鍵;所述檢索引擎從各國(guó)家的專利數(shù)據(jù)中提取每一專利的關(guān)鍵字段、專利數(shù)據(jù)所在節(jié)點(diǎn)及所在主表的主鍵、從表的主鍵信息,構(gòu)建專利的索引及字典項(xiàng),其中作為字典項(xiàng)的字段包括受理國(guó)、專利類型、法律狀態(tài)信息、語(yǔ)種、分類號(hào)、許可類型、轉(zhuǎn)讓類型、技術(shù)領(lǐng)域、單位類型;
6、將各專利中的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)到所述高容量存儲(chǔ)服務(wù)器并創(chuàng)建一個(gè)多級(jí)索引體系,
7、將專利非結(jié)構(gòu)化數(shù)據(jù)在所述多級(jí)索引體系中的索引信息保存到所述索引中;
8、3)根據(jù)用戶輸入的檢索信息和檢索模式,在所述索引中查詢匹配的專利及其結(jié)構(gòu)化數(shù)據(jù)所在節(jié)點(diǎn)和非結(jié)構(gòu)化數(shù)據(jù)所在位置。
9、進(jìn)一步的,將所述主表、子表按照專利的公開(kāi)日時(shí)間戳進(jìn)行水平分表,將同一設(shè)定時(shí)間段內(nèi)的專利數(shù)據(jù)放到同一組水平分表中,并設(shè)定每張水平分表的數(shù)據(jù)量。
10、進(jìn)一步的,所述節(jié)點(diǎn)中設(shè)有動(dòng)態(tài)數(shù)據(jù)庫(kù)表與索引管理機(jī)制,用于監(jiān)控所在節(jié)點(diǎn)的狀態(tài)及數(shù)據(jù)增長(zhǎng)情況,當(dāng)數(shù)據(jù)增長(zhǎng)達(dá)到設(shè)定閾值后自動(dòng)觸發(fā)動(dòng)態(tài)調(diào)整流程,包括創(chuàng)建新的數(shù)據(jù)庫(kù)表、更新索引或進(jìn)行表分區(qū)。
11、進(jìn)一步的,構(gòu)建所述多級(jí)索引體系的方法為:首先按國(guó)別創(chuàng)建多個(gè)一級(jí)文件夾,然后在所述一級(jí)文件夾下按專利類型重建多個(gè)二級(jí)文件夾,在所述二級(jí)文件夾下以專利的公開(kāi)號(hào)順序組織三級(jí)文件夾,每個(gè)三級(jí)文件夾限定存儲(chǔ)設(shè)定數(shù)量的專利數(shù)據(jù);所述三級(jí)文件夾用于存儲(chǔ)專利的非結(jié)構(gòu)化數(shù)據(jù)。
12、進(jìn)一步的,所述核心信息包括專利標(biāo)題、類別、類型、受理國(guó)、語(yǔ)種、申請(qǐng)?zhí)?、申?qǐng)日、公開(kāi)號(hào)、公開(kāi)日、授權(quán)號(hào)、授權(quán)日、到期日、失效日、代理人、代理機(jī)構(gòu)、實(shí)審公告日、技術(shù)領(lǐng)域、發(fā)布狀態(tài)、瀏覽量、點(diǎn)贊量、收藏量、評(píng)論量、法律狀態(tài)及繳費(fèi)狀態(tài)信息;所述子表中存儲(chǔ)的專利信息包括摘要信息、權(quán)利要求信息、分類號(hào)簇信息、同族成員信息、專利附圖附件信息、法律信息、申請(qǐng)人組信息、引用信息以及其他信息。
13、進(jìn)一步的,所述關(guān)鍵字段包括在全文檢索功能中涉及到的字段以及在列表展示中的信息字段;在全文檢索功能中涉及到的字段包括所述關(guān)系型數(shù)據(jù)庫(kù)的關(guān)聯(lián)主鍵、所述主表的唯一標(biāo)識(shí)和所述子表的唯一標(biāo)識(shí);在列表展示中的信息字段包括標(biāo)題信息、摘要信息、國(guó)別信息、分類信息、全文信息、申請(qǐng)信息、附件信息、公開(kāi)信息、權(quán)利要求信息、分類號(hào)信息。
14、進(jìn)一步的,所述檢索模式包括一般檢索、高級(jí)檢索和語(yǔ)義檢索。
15、進(jìn)一步的,對(duì)各檢索模式的檢索結(jié)果進(jìn)行規(guī)約處理,使其格式統(tǒng)一。
16、一種基于國(guó)產(chǎn)自主可控環(huán)境的分布式專利檢索系統(tǒng),其特征在于,包括語(yǔ)料管理模塊、系統(tǒng)管理模塊和檢索模塊;
17、所述語(yǔ)料管理模塊采用分布式專利數(shù)據(jù)架構(gòu),包括用于存儲(chǔ)專利結(jié)構(gòu)化數(shù)據(jù)的關(guān)系型數(shù)據(jù)庫(kù)、nosql數(shù)據(jù)庫(kù)和用于存儲(chǔ)專利非結(jié)構(gòu)化數(shù)據(jù)的高容量存儲(chǔ)服務(wù)器;所述關(guān)系型數(shù)據(jù)庫(kù)采用分布式多節(jié)點(diǎn)進(jìn)行信息存儲(chǔ);所述nosql數(shù)據(jù)庫(kù)中設(shè)有檢索引擎和用于緩存檢索結(jié)果的hash數(shù)據(jù)結(jié)構(gòu);
18、所述系統(tǒng)管理模塊,用于將同一核心國(guó)家的專利數(shù)據(jù)存儲(chǔ)到同一節(jié)點(diǎn)中,將各非核心國(guó)家的專利數(shù)據(jù)存儲(chǔ)到剩余節(jié)點(diǎn)中;所述節(jié)點(diǎn)中設(shè)有一主表和多個(gè)子表;所述主表用于存儲(chǔ)專利的核心信息,所述子表用于存儲(chǔ)與所述主表相關(guān)聯(lián)的專利信息及主表的主鍵;所述檢索引擎從各國(guó)家的專利數(shù)據(jù)中提取每一專利的關(guān)鍵字段、專利數(shù)據(jù)所在節(jié)點(diǎn)及所在主表的主鍵、從表的主鍵信息,構(gòu)建專利的索引及字典項(xiàng),其中作為字典項(xiàng)的字段包括受理國(guó)、專利類型、法律狀態(tài)信息、語(yǔ)種、分類號(hào)、許可類型、轉(zhuǎn)讓類型、技術(shù)領(lǐng)域、單位類型;將各專利中的非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)到所述高容量存儲(chǔ)服務(wù)器并創(chuàng)建一個(gè)多級(jí)索引體系,將專利非結(jié)構(gòu)化數(shù)據(jù)在所述多級(jí)索引體系中的索引信息保存到所述索引中;
19、所述檢索模塊,用于根據(jù)用戶輸入的檢索信息和檢索模式,在所述索引中查詢匹配的專利及其結(jié)構(gòu)化數(shù)據(jù)所在節(jié)點(diǎn)和非結(jié)構(gòu)化數(shù)據(jù)所在位置。
20、本發(fā)明提供了一種基于國(guó)產(chǎn)自主可控環(huán)境的分布式專利數(shù)據(jù)架構(gòu),包括:
21、結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)與非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)兩個(gè)核心部分。在結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)方面,本發(fā)明巧妙地結(jié)合了支持國(guó)產(chǎn)化自主可控的關(guān)系型數(shù)據(jù)庫(kù)和nosql數(shù)據(jù)庫(kù)的優(yōu)勢(shì)。該種關(guān)系型數(shù)據(jù)庫(kù)以其結(jié)構(gòu)化、存儲(chǔ)容量大、穩(wěn)定性強(qiáng)、易于擴(kuò)展和維護(hù)和事務(wù)處理能力突出等特點(diǎn),成為存儲(chǔ)專利信息的理想選擇。而nosql數(shù)據(jù)庫(kù)則以其搜索和分析的高效性和靈活性,為專利數(shù)據(jù)的檢索提供了強(qiáng)大的支持。通過(guò)兩者的結(jié)合,既保證了數(shù)據(jù)的安全性和一致性,又提高了數(shù)據(jù)的檢索效率。
22、進(jìn)一步地,采用支持上述數(shù)據(jù)庫(kù)的國(guó)產(chǎn)化自主可控分布式解決方案。對(duì)專利基本信息、專利法律信息、專利分類、專利附件、專利摘要、專利引用信息、專利申請(qǐng)人,專利繳費(fèi)等信息以及系統(tǒng)所需基本的用戶、角色、菜單等信息進(jìn)行表結(jié)構(gòu)的拆分、重組及設(shè)計(jì)。對(duì)關(guān)系型數(shù)據(jù)庫(kù)采用分布式多節(jié)點(diǎn)及分表的技術(shù)手段,將專利相關(guān)表和系統(tǒng)所需基本表進(jìn)行存儲(chǔ),實(shí)現(xiàn)不同類型數(shù)據(jù)的物理隔離。
23、在詳細(xì)分析全球?qū)@麛?shù)量分布的基礎(chǔ)上,我們優(yōu)化了專利數(shù)據(jù)存儲(chǔ)策略,將按國(guó)別分類調(diào)整為聚焦七大核心國(guó)家,它們顯著主導(dǎo)專利申請(qǐng)。對(duì)于專利數(shù)量較少的其余國(guó)家,則統(tǒng)一歸入一個(gè)分布式節(jié)點(diǎn),以便更有效地管理和突出主要趨勢(shì)及領(lǐng)先國(guó)家的地位。
24、在每一存儲(chǔ)節(jié)點(diǎn)中,針對(duì)專利數(shù)據(jù)字段繁多的特點(diǎn),根據(jù)數(shù)據(jù)的屬性和訪問(wèn)模式,采用垂直拆分的方式將數(shù)據(jù)分布到多個(gè)物理表中。垂直拆分是將原來(lái)一個(gè)有很多列的表拆分成多個(gè)表。這種拆分方式主要關(guān)注于數(shù)據(jù)列的劃分,旨在減少單個(gè)表的字段數(shù)量,從而優(yōu)化數(shù)據(jù)庫(kù)的性能。垂直拆分通常把不常用的字段表單獨(dú)存放到一個(gè)表中,這樣可以減少常用查詢中的字段數(shù)量,提高查詢效率。在本系統(tǒng)中,主表主要存儲(chǔ)專利的核心信息,包括專利標(biāo)題、類別、類型、受理國(guó)、語(yǔ)種、申請(qǐng)?zhí)?、申?qǐng)日、公開(kāi)號(hào)、公開(kāi)日、授權(quán)號(hào)、授權(quán)日、到期日、失效日、代理人、代理機(jī)構(gòu)、實(shí)審公告日、技術(shù)領(lǐng)域、發(fā)布狀態(tài)、瀏覽量、點(diǎn)贊量、收藏量、評(píng)論量、法律狀態(tài)及繳費(fèi)狀態(tài)等信息。值得注意的是,主表雖可能不涵蓋全面信息,但設(shè)計(jì)為能迅速鏈接至子表并關(guān)聯(lián)外鍵,確保即時(shí)訪問(wèn)全量專利數(shù)據(jù)?;谠摳咝Ъ軜?gòu),用戶可直接在主表中檢索并獲取列表所需的精準(zhǔn)內(nèi)容,無(wú)需繁瑣操作即可洞察全球?qū)@植技昂诵膰?guó)家趨勢(shì)。
25、子表則用于存儲(chǔ)與主表相關(guān)聯(lián)的其他信息,包括幾個(gè)維度:摘要信息、權(quán)利要求信息、分類號(hào)簇信息、同族成員信息、專利附圖附件信息、法律信息、申請(qǐng)人組信息、引用信息以及其他信息等。對(duì)于其他無(wú)法成組或成規(guī)模的單條信息,我們將其統(tǒng)一整合至一張綜合信息表中,以全面覆蓋如發(fā)明人、價(jià)值評(píng)分、國(guó)際申請(qǐng)?jiān)斍?、資助記錄、獎(jiǎng)勵(lì)信息及密級(jí)等級(jí)等多元化內(nèi)容。這種設(shè)計(jì)確保了信息的集中管理和高效查詢,便于用戶快速檢索到所需的具體條目。后續(xù)在專利審查及繳費(fèi)中會(huì)進(jìn)行更新專利的法律狀態(tài),查看專利的詳情頁(yè)時(shí),也會(huì)對(duì)這些數(shù)據(jù)進(jìn)行相應(yīng)的加工展示。這種拆分方式不僅降低了單個(gè)表的復(fù)雜度與數(shù)據(jù)量,提高了數(shù)據(jù)管理的靈活性,還有助于優(yōu)化查詢性能,加快數(shù)據(jù)處理速度。
26、進(jìn)一步地,將上述主子表按照專利的公開(kāi)日時(shí)間戳進(jìn)行水平分表,例如將2015-2017年之間申請(qǐng)的專利數(shù)據(jù)放到一組水平分表中,每張表數(shù)據(jù)量嚴(yán)格控制在2000萬(wàn)條以內(nèi),以優(yōu)化性能與管理效率。就此實(shí)現(xiàn)了數(shù)據(jù)的物理隔離。這種隔離方式具有多重優(yōu)勢(shì),首先確保了數(shù)據(jù)的隱私性和安全性得到嚴(yán)密保護(hù),從而有效防范了數(shù)據(jù)泄露的風(fēng)險(xiǎn)。同時(shí),它還能顯著減少不同數(shù)據(jù)之間的相互影響和潛在干擾,保障了數(shù)據(jù)處理的準(zhǔn)確性和可靠性。更為值得一提的是,在面對(duì)特殊情況下可能出現(xiàn)的宕機(jī)事件時(shí),這種隔離機(jī)制展現(xiàn)出強(qiáng)大的容錯(cuò)性,即使某一部分發(fā)生故障,其他部分依然能夠正常運(yùn)行,確保了應(yīng)用此套架構(gòu)系統(tǒng)的整體穩(wěn)定性和可用性。
27、對(duì)nosql數(shù)據(jù)庫(kù)本發(fā)明同樣展現(xiàn)出了卓越的創(chuàng)新性。一方面是使用檢索引擎支撐檢索方法,另一方面是使用緩存庫(kù)對(duì)每一次的檢索結(jié)果進(jìn)行存儲(chǔ),方便下次同樣的檢索條件能夠迅速獲取數(shù)據(jù)。
28、進(jìn)一步地,在檢索引擎中使用同樣的國(guó)別加時(shí)間戳的形式進(jìn)行節(jié)點(diǎn)分布及分索引建立,區(qū)別是不需要對(duì)索引進(jìn)行垂直拆分。與傳統(tǒng)的將所有字段都存儲(chǔ)在一個(gè)索引中的做法不同,本發(fā)明采用了更為精細(xì)化的索引策略,它只提取了專利數(shù)據(jù)中檢索需求的關(guān)鍵字段,包括在全文檢索功能中涉及到的字段如:關(guān)系型數(shù)據(jù)庫(kù)的關(guān)聯(lián)主鍵,專利數(shù)據(jù)主表和子表的唯一標(biāo)識(shí),以及在列表展示中的信息字段,如:標(biāo)題信息、摘要信息、國(guó)別信息、分類信息、全文信息、申請(qǐng)信息、附件信息、公開(kāi)信息、權(quán)利要求信息、分類號(hào)信息等。這種索引策略的優(yōu)勢(shì)在于,當(dāng)用戶輸入查詢條件時(shí),系統(tǒng)能夠迅速地在索引中定位到相關(guān)的數(shù)據(jù),如果需要數(shù)據(jù)的全集,可以通過(guò)存儲(chǔ)的主鍵關(guān)聯(lián)至相應(yīng)的關(guān)系型數(shù)據(jù)庫(kù)存儲(chǔ)節(jié)點(diǎn)進(jìn)行獲取,不僅提高了檢索速度,還能夠精確地匹配用戶需求,從而大大提升了用戶滿意度。
29、在服務(wù)啟動(dòng)時(shí)將數(shù)據(jù)庫(kù)中常用且基本不做更改的字典項(xiàng)(如:受理國(guó)、專利類型、法律狀態(tài)信息、語(yǔ)種、分類號(hào)、許可類型、轉(zhuǎn)讓類型、技術(shù)領(lǐng)域、單位類型等)存儲(chǔ)到檢索引擎中,并且一旦字典項(xiàng)被修改,同步更新索引中的字典項(xiàng),并且會(huì)存儲(chǔ)具有時(shí)效性的不同用戶不同檢索條件的結(jié)果,當(dāng)用戶在很短的時(shí)間內(nèi)檢索同一條件,能快速反饋給用戶,提高用戶的體驗(yàn)度。
30、進(jìn)一步地,設(shè)計(jì)一個(gè)高效的緩存策略,利用hash數(shù)據(jù)結(jié)構(gòu)來(lái)存儲(chǔ)和檢索基于各種條件的查詢結(jié)果。具體做法是,將用戶發(fā)起的查詢條件(如關(guān)鍵詞、時(shí)間范圍、分類標(biāo)簽等)通過(guò)一定的編碼規(guī)則(如哈希、序列化等)轉(zhuǎn)換為鍵,然后將查詢結(jié)果(通常是數(shù)據(jù)列表、對(duì)象集合或聚合統(tǒng)計(jì)結(jié)果)作為值存儲(chǔ)在對(duì)應(yīng)的hash中。為了控制緩存的生命周期,避免緩存數(shù)據(jù)無(wú)限期地占用內(nèi)存資源,我們會(huì)在每次緩存數(shù)據(jù)時(shí),為該緩存項(xiàng)設(shè)置一個(gè)具體的過(guò)期時(shí)間,比如一小時(shí)。這樣,當(dāng)緩存項(xiàng)達(dá)到其設(shè)定的過(guò)期時(shí)間后,會(huì)自動(dòng)將其從內(nèi)存中刪除,為新的緩存數(shù)據(jù)騰出空間。通過(guò)這種方式,不僅能夠?yàn)槲覀兲峁┮粋€(gè)快速、靈活的緩存解決方案,還能夠幫助我們自動(dòng)管理緩存數(shù)據(jù)的生命周期,確保緩存的有效性和最新性,從而優(yōu)化應(yīng)用程序的性能和響應(yīng)速度。同時(shí),其分布式特性和高可用性設(shè)計(jì)也使得這種緩存機(jī)制能夠輕松應(yīng)對(duì)大規(guī)模并發(fā)訪問(wèn)和分布式部署的需求。
31、在面對(duì)專利數(shù)據(jù)快速增長(zhǎng)的嚴(yán)峻挑戰(zhàn)時(shí),本發(fā)明獨(dú)創(chuàng)性地引入了一套智能的動(dòng)態(tài)數(shù)據(jù)庫(kù)表與索引管理機(jī)制。該機(jī)制通過(guò)實(shí)時(shí)運(yùn)行的守護(hù)線程或外掛腳本,緊密監(jiān)控?cái)?shù)據(jù)庫(kù)節(jié)點(diǎn)的狀態(tài)及數(shù)據(jù)增長(zhǎng)情況。一旦發(fā)現(xiàn)數(shù)據(jù)接近預(yù)設(shè)的閾值(如2000萬(wàn)條記錄),系統(tǒng)將自動(dòng)觸發(fā)動(dòng)態(tài)調(diào)整流程,包括創(chuàng)建新的數(shù)據(jù)庫(kù)表、調(diào)整現(xiàn)有索引或進(jìn)行表分區(qū)等,以確保數(shù)據(jù)庫(kù)性能不受影響。
32、此外,為了優(yōu)化檢索效率并確保數(shù)據(jù)的全面覆蓋,通過(guò)實(shí)時(shí)監(jiān)聽(tīng)節(jié)點(diǎn)狀態(tài),統(tǒng)計(jì)表或索引數(shù)量,構(gòu)建檢索地圖或檢索字典。通過(guò)檢索地圖的直觀展示,用戶能夠輕松在頁(yè)面中瀏覽到各個(gè)國(guó)家對(duì)應(yīng)的數(shù)據(jù)分布情況、專利數(shù)據(jù)量,以及這些數(shù)據(jù)的最后更新日期等信息。這一功能極大地增強(qiáng)了系統(tǒng)內(nèi)數(shù)據(jù)分布的可視化效果,為檢索操作提供了精準(zhǔn)的導(dǎo)航,也為用戶提供了便捷的信息概覽與數(shù)據(jù)新鮮度的即時(shí)反饋。在后續(xù)的檢索過(guò)程中,系統(tǒng)會(huì)首先通過(guò)檢索地圖對(duì)檢索式進(jìn)行分析,快速定位到可能包含目標(biāo)數(shù)據(jù)的表或索引,從而大大提高了檢索的準(zhǔn)確性和效率。
33、通過(guò)這種創(chuàng)新的動(dòng)態(tài)擴(kuò)展與智能檢索相結(jié)合的方式,本發(fā)明不僅有效應(yīng)對(duì)了數(shù)據(jù)增長(zhǎng)帶來(lái)的存儲(chǔ)和檢索挑戰(zhàn),還顯著提升了系統(tǒng)的適應(yīng)性和可擴(kuò)展性,確保了系統(tǒng)在面對(duì)持續(xù)增長(zhǎng)的數(shù)據(jù)量時(shí)依然能夠保持高效、穩(wěn)定的運(yùn)行狀態(tài)。
34、針對(duì)非結(jié)構(gòu)化數(shù)據(jù)(如專利附圖和附件),我們?cè)O(shè)計(jì)了一套高效且集中的存儲(chǔ)管理方案。該方案依托一臺(tái)高容量存儲(chǔ)服務(wù)器,確保數(shù)據(jù)的安全集中存儲(chǔ)。采用先進(jìn)的文件管理中間件,該中間件不僅支持國(guó)產(chǎn)自主可控環(huán)境,還優(yōu)化了文件存取效率。我們構(gòu)建了多級(jí)索引體系,首先按國(guó)別劃分一級(jí)文件夾,隨后按專利類型細(xì)分二級(jí)文件夾,最后以公開(kāi)號(hào)順序組織三級(jí)文件夾,每個(gè)文件夾限定存儲(chǔ)一萬(wàn)個(gè)專利的數(shù)據(jù),該文件夾中包含了所有完整的專利非結(jié)構(gòu)化數(shù)據(jù),以此策略有序分布文件至不同路徑。新文件上傳時(shí),系統(tǒng)自動(dòng)賦予其格式加時(shí)間戳的唯一名稱,并即時(shí)更新至關(guān)系型數(shù)據(jù)庫(kù)及檢索引擎節(jié)點(diǎn)中的路徑信息,確保文件在系統(tǒng)中擁有獨(dú)一無(wú)二的身份標(biāo)識(shí)與精確定位。這一設(shè)計(jì)不僅簡(jiǎn)化了文件的管理流程,還極大地提升了文件的訪問(wèn)速度與效率。
35、本發(fā)明提供了一種基于國(guó)產(chǎn)自主可控環(huán)境的分布式專利數(shù)據(jù)檢索方法,包括:
36、在應(yīng)用上述專利數(shù)據(jù)架構(gòu)的基礎(chǔ)上,本發(fā)明的檢索方法可以分為一般檢索方法、高級(jí)檢索方法及語(yǔ)義檢索方法。無(wú)論是哪種檢索方式,都依賴于數(shù)據(jù)在存儲(chǔ)時(shí)保留的索引信息、元數(shù)據(jù)、關(guān)鍵詞等信息,除此之外,一般檢索方法依賴關(guān)鍵詞匹配,高級(jí)檢索依賴元數(shù)據(jù)和查詢語(yǔ)法解析,語(yǔ)義檢索依賴文本語(yǔ)義信息和機(jī)器學(xué)習(xí)模型。這些檢索方法均遵循一套高效的數(shù)據(jù)獲取邏輯,首先通過(guò)數(shù)據(jù)架構(gòu)預(yù)設(shè)的數(shù)據(jù)歸約規(guī)則精準(zhǔn)鎖定目標(biāo)數(shù)據(jù)庫(kù),從而避免了對(duì)龐大分布式數(shù)據(jù)庫(kù)進(jìn)行全面遍歷的繁瑣過(guò)程,實(shí)現(xiàn)了在特定小范圍數(shù)據(jù)集上的精準(zhǔn)檢索。此外,本發(fā)明巧妙結(jié)合了nosql數(shù)據(jù)庫(kù)技術(shù),將可能的檢索結(jié)果預(yù)先緩存,顯著縮短了后續(xù)在相同檢索條件下的響應(yīng)時(shí)間,并有效降低了資源消耗。最后,為了確保系統(tǒng)的一致性和可擴(kuò)展性,本發(fā)明統(tǒng)一了三種檢索方法的輸入輸出參數(shù),確保了數(shù)據(jù)歸約的一致性,為后續(xù)的功能銜接奠定了堅(jiān)實(shí)基礎(chǔ)。
37、在一般檢索方法中,允許用戶根據(jù)特定的條件來(lái)縮小檢索范圍,從而提高檢索結(jié)果的精確性和效率。記錄用戶的搜索歷史,以便用戶能夠快速重新檢索之前的查詢。在用戶輸入關(guān)鍵詞時(shí),根據(jù)用戶輸入的內(nèi)容實(shí)時(shí)提供相關(guān)的聯(lián)想詞或短語(yǔ),幫助用戶更準(zhǔn)確地表達(dá)搜索意圖。對(duì)專利數(shù)據(jù)庫(kù)中的各類信息進(jìn)行索引優(yōu)化,采用倒排索引、分布式存儲(chǔ)等技術(shù),提高檢索速度。將查詢條件與專利數(shù)據(jù)集的各個(gè)部分進(jìn)行精準(zhǔn)匹配,并運(yùn)用相關(guān)性評(píng)估模型,計(jì)算每個(gè)匹配項(xiàng)與查詢條件的相關(guān)性得分。根據(jù)專利的類型、領(lǐng)域、技術(shù)關(guān)鍵詞等將檢索結(jié)果進(jìn)行自動(dòng)分類,并提供各類別的統(tǒng)計(jì)數(shù)據(jù),如數(shù)量、分布等。這有助于用戶更全面地了解檢索結(jié)果,并快速定位到感興趣的內(nèi)容。允許用戶在初次檢索結(jié)果的基礎(chǔ)上進(jìn)一步縮小搜索范圍或更改搜索條件。為了提高二次檢索的效率,系統(tǒng)可以保存用戶的初次搜索條件,并允許用戶直接在這些條件上進(jìn)行修改和調(diào)整,如添加/刪除關(guān)鍵詞、調(diào)整權(quán)重等,以提高檢索的靈活性和效率。支持對(duì)整個(gè)文檔或數(shù)據(jù)集的全面搜索,確保用戶能夠找到所有相關(guān)的內(nèi)容。允許用戶在檢索結(jié)果中根據(jù)特定的條件進(jìn)行篩選和排序。在檢索結(jié)果中突出顯示與搜索關(guān)鍵詞相關(guān)的內(nèi)容,幫助用戶快速定位到感興趣的信息。為了提高高亮提示的視覺(jué)效果和可讀性,系統(tǒng)可以采用醒目的顏色、字體和樣式來(lái)突出顯示相關(guān)內(nèi)容,并提供關(guān)閉高亮提示的選項(xiàng)以滿足不同用戶的需求。
38、在高級(jí)檢索方法中,提供全面的專利檢索工具,使其能夠高效、精準(zhǔn)地定位所需信息。首先,支持專利大分類的篩選及統(tǒng)計(jì)功能,確保用戶能夠迅速定位到感興趣的專利領(lǐng)域,并了解該領(lǐng)域的專利分布和趨勢(shì)。為了滿足用戶更為精細(xì)化的檢索需求,引入動(dòng)態(tài)構(gòu)建布爾類型檢索式的能力。用戶可以根據(jù)自身需求,自由組合不同的邏輯操作符,以及括號(hào)嵌套,從而構(gòu)建出復(fù)雜而精確的檢索式。同時(shí),提供豐富的字段選項(xiàng),使用戶能夠針對(duì)不同字段構(gòu)建檢索邏輯,實(shí)現(xiàn)更為精準(zhǔn)的檢索。在匹配模式上,既支持精準(zhǔn)匹配也支持模糊匹配。精準(zhǔn)匹配能夠幫助用戶快速找到與查詢關(guān)鍵詞完全匹配的專利,而模糊匹配則能夠擴(kuò)大搜索范圍,發(fā)現(xiàn)與查詢關(guān)鍵詞相關(guān)或相似的專利。用戶可以根據(jù)實(shí)際需求靈活切換匹配模式,以獲得最佳的檢索效果。此外,允許用戶進(jìn)行更復(fù)雜的查詢組合。用戶可以將多個(gè)檢索式組合在一起,形成更為復(fù)雜的查詢條件,從而更全面地覆蓋所需的專利信息。用戶操作流程如下:
39、1.用戶輸入查詢條件,
40、用戶根據(jù)自己的需求選擇合適的字段(例如標(biāo)題、摘要、權(quán)利要求、發(fā)明人等),并使用邏輯操作符(and,or,not)和括號(hào)來(lái)構(gòu)建布爾類型的檢索表達(dá)式。
41、2.構(gòu)建檢索表達(dá)式
42、用戶可以通過(guò)界面提供的工具動(dòng)態(tài)構(gòu)建檢索表達(dá)式,例如:title:"新能源汽車"and?abstract:"電池技術(shù)"(inventor:"張三"or?inventor:"李四")and?classification:ipc/a61k。
43、3.檢索系統(tǒng)的處理:
44、解析檢索表達(dá)式:系統(tǒng)首先解析用戶輸入的檢索表達(dá)式,識(shí)別其中的字段、操作符和值。拆分檢索表達(dá)式:系統(tǒng)進(jìn)一步拆分表達(dá)式中的各個(gè)部分,將其與存儲(chǔ)的數(shù)據(jù)進(jìn)行匹配。匹配存儲(chǔ)結(jié)果:系統(tǒng)會(huì)將每個(gè)查詢條件與數(shù)據(jù)庫(kù)中的專利記錄進(jìn)行比較。這里涉及到的主要存儲(chǔ)結(jié)果包括:專利基本信息:如專利號(hào)、申請(qǐng)日期、公開(kāi)日期等。專利詳情:包括摘要、權(quán)利要求、說(shuō)明書等。專利法律信息:如專利狀態(tài)、權(quán)利轉(zhuǎn)移記錄等。專利分類:國(guó)際專利分類(ipc)、合作專利分類(cpc)等。專利附件:如附圖、照片等。專利摘要:摘要文本。專利引用信息:引用和被引用的專利列表。專利申請(qǐng)人:申請(qǐng)人名稱、地址等信息。
45、4.匹配過(guò)程
46、精準(zhǔn)匹配:如果用戶選擇了精準(zhǔn)匹配,則系統(tǒng)只返回那些完全符合查詢條件的專利記錄。
47、模糊匹配:如果用戶選擇了模糊匹配,則系統(tǒng)可能會(huì)使用近義詞擴(kuò)展、同義詞表、自然語(yǔ)言處理技術(shù)等手段來(lái)擴(kuò)展搜索范圍,以捕獲更多相關(guān)專利。
48、5.組合多個(gè)檢索式用戶還可以創(chuàng)建多個(gè)檢索式,并使用更復(fù)雜的邏輯來(lái)組合這些檢索式,以進(jìn)一步縮小或擴(kuò)大搜索范圍。
49、6.顯示檢索結(jié)果最終,系統(tǒng)將按照用戶的指定排序方式(如相關(guān)性、申請(qǐng)日期、公開(kāi)日期等)展示檢索結(jié)果。
50、用戶還可以對(duì)檢索結(jié)果進(jìn)行進(jìn)一步的篩選、排序或分析。通過(guò)這種方式,用戶可以高效、精準(zhǔn)地定位到自己感興趣的專利信息。
51、在語(yǔ)義檢索方法中,關(guān)鍵字搜索側(cè)重于單詞的直接匹配,而語(yǔ)義搜索則更深入地理解并匹配查詢?cè)~的含義。特別是在專利搜索場(chǎng)景下,雖然語(yǔ)義搜索可能不直接返回與查詢?cè)~完全相同的匹配項(xiàng),但它能更好地捕捉用戶的真正意圖,從而提供更加貼合需求的信息。語(yǔ)義搜索整合了自然語(yǔ)言處理技術(shù),例如容錯(cuò)拼寫檢查、詞匯切分與規(guī)范化,確保即使輸入略有偏差也能獲得有效結(jié)果。利用先進(jìn)的矢量搜索技術(shù),系統(tǒng)能夠識(shí)別并返回與查詢含義高度相關(guān)的文檔。在國(guó)產(chǎn)自主可控環(huán)境下,鑒于算力和資源限制,采用了優(yōu)化策略來(lái)提高檢索效率。具體來(lái)說(shuō),通過(guò)預(yù)先生成專利文檔的向量表示并存儲(chǔ)在數(shù)據(jù)庫(kù)中,減少了實(shí)時(shí)計(jì)算的需求。檢索時(shí),系統(tǒng)即時(shí)生成與用戶查詢相對(duì)應(yīng)的向量,并迅速找出數(shù)據(jù)庫(kù)中最相似的文檔,通過(guò)計(jì)算相似度來(lái)評(píng)估語(yǔ)義相關(guān)性。用戶可以通過(guò)自定義配置語(yǔ)義計(jì)算和檢索系統(tǒng)組件來(lái)創(chuàng)建個(gè)性化的智能檢索算法。在這個(gè)過(guò)程中,用戶可以訓(xùn)練模型,并選擇最適合的算法進(jìn)行語(yǔ)義檢索,以生成高度個(gè)性化的檢索結(jié)果。這樣的設(shè)計(jì)確保了用戶可以根據(jù)自身需求定制檢索體驗(yàn)。
52、本發(fā)明提供了一種基于國(guó)產(chǎn)自主可控環(huán)境的分布式專利數(shù)據(jù)檢索系統(tǒng),包括:
53、語(yǔ)料管理模塊,用于管理專利數(shù)據(jù),包括對(duì)全量數(shù)據(jù)和增量數(shù)據(jù)的管理,實(shí)現(xiàn)對(duì)專利數(shù)據(jù)的新增、修改、刪除等數(shù)據(jù)更新操作。提供對(duì)專利列表的概覽和單篇專利的詳覽。提供專利數(shù)據(jù)列表概覽和每篇專利的詳覽接口服務(wù)。
54、所述語(yǔ)料管理模塊專門針對(duì)專利數(shù)據(jù)進(jìn)行精心設(shè)計(jì)的管理策略。實(shí)現(xiàn)新增、修改、刪除等基礎(chǔ)的數(shù)據(jù)更新操作,確保了專利數(shù)據(jù)的實(shí)時(shí)性和準(zhǔn)確性,而且采用上述先進(jìn)的存儲(chǔ)結(jié)構(gòu)來(lái)優(yōu)化數(shù)據(jù)的處理流程。在新增專利數(shù)據(jù)時(shí),系統(tǒng)會(huì)根據(jù)預(yù)設(shè)的存儲(chǔ)邏輯,將復(fù)雜的專利數(shù)據(jù)精準(zhǔn)地切分為多個(gè)維度,并逐一進(jìn)行精細(xì)化的數(shù)據(jù)保存。這種分步保存的策略不僅提高了數(shù)據(jù)處理效率,還有效地保證了數(shù)據(jù)的完整性和可訪問(wèn)性,為后續(xù)的查詢和分析打下了堅(jiān)實(shí)的基礎(chǔ)。
55、為了更好地支持?jǐn)?shù)據(jù)的動(dòng)態(tài)更新,該模塊特別對(duì)專利語(yǔ)料庫(kù)的全量數(shù)據(jù)和增量數(shù)據(jù)進(jìn)行了精細(xì)化的數(shù)據(jù)管理設(shè)計(jì)。無(wú)論是整體的數(shù)據(jù)更新還是部分?jǐn)?shù)據(jù)的增量更新,系統(tǒng)都能迅速而準(zhǔn)確地完成,保證了數(shù)據(jù)的時(shí)效性和準(zhǔn)確性。用戶在使用本模塊時(shí),可以通過(guò)強(qiáng)大的查詢功能,輕松獲取所需的數(shù)據(jù)信息。系統(tǒng)支持以列表形式展示數(shù)據(jù)的關(guān)鍵字段,用戶還可以根據(jù)實(shí)際需求,通過(guò)簡(jiǎn)單的配置操作改變顯示的字段,從而滿足多樣化的數(shù)據(jù)查看需求。此外,該模塊還提供了多個(gè)篩選項(xiàng),用戶可以根據(jù)需要自由組合這些篩選項(xiàng),對(duì)檢索結(jié)果進(jìn)行精確的篩選。這種靈活的篩選機(jī)制極大地提高了檢索的效率和準(zhǔn)確性,使用戶能夠迅速定位到所需的信息。最后,為了增強(qiáng)數(shù)據(jù)管理的靈活性和可控性,本模塊還支持?jǐn)?shù)據(jù)的發(fā)布和撤回發(fā)布操作。用戶可以根據(jù)實(shí)際需要,將錄入的數(shù)據(jù)進(jìn)行發(fā)布或撤回發(fā)布,為前臺(tái)檢索端提供靈活的數(shù)據(jù)展示控制。這種設(shè)計(jì)不僅滿足了用戶對(duì)數(shù)據(jù)管理的多樣化需求,還提高了系統(tǒng)的整體性能和用戶體驗(yàn)。
56、檢索模塊,在應(yīng)用上述專利數(shù)據(jù)檢索方法的基礎(chǔ)上,提供檢索結(jié)果展示與瀏覽、專利精準(zhǔn)推送、專利聚類推送、檢索結(jié)果評(píng)分等功能。
57、進(jìn)一步地,所述檢索模塊在應(yīng)用上述檢索方法的基礎(chǔ)上,進(jìn)一步集成了聯(lián)想檢索、多語(yǔ)種檢索等高級(jí)功能,為用戶提供更為智能、便捷的專利檢索體驗(yàn)。該模塊支持用戶通過(guò)輸入文本或?qū)@暾?qǐng)?zhí)?公開(kāi)號(hào)進(jìn)行專利檢索。其獨(dú)特的語(yǔ)義檢索技術(shù)能夠深入解析用戶輸入,按照語(yǔ)義近似程度輸出專利檢索結(jié)果,確保用戶能夠獲取到與其搜索意圖高度匹配的專利信息。在聯(lián)想檢索方面,當(dāng)用戶輸入某個(gè)檢索詞的一部分時(shí),系統(tǒng)會(huì)自動(dòng)在下拉列表中展示與該輸入詞具有語(yǔ)義相關(guān)性的其他詞語(yǔ)。這一功能不僅能夠幫助用戶更準(zhǔn)確地表達(dá)搜索意圖,還能有效提高檢索的效率和準(zhǔn)確性。
58、為了滿足更多語(yǔ)種用戶的需求,該模塊特別支持中英文兩個(gè)主要語(yǔ)種的互聯(lián)互通檢索功能。用戶無(wú)論輸入中文還是英文文本,系統(tǒng)都能自動(dòng)進(jìn)行翻譯,并用兩個(gè)語(yǔ)種的檢索內(nèi)容進(jìn)行檢索,最終返回雙語(yǔ)融合的檢索結(jié)果。這一功能打破了語(yǔ)言壁壘,使得用戶都能輕松獲取到更多所需的專利信息。此外,該模塊還支持按照不同業(yè)務(wù)場(chǎng)景對(duì)檢索結(jié)果進(jìn)行分類展示。用戶可以根據(jù)專利類型、標(biāo)簽等維度對(duì)結(jié)果進(jìn)行篩選和排序,以便快速定位到感興趣的內(nèi)容。同時(shí),系統(tǒng)還支持對(duì)檢索結(jié)果進(jìn)行語(yǔ)義相關(guān)性排序、用戶點(diǎn)擊量排序、最新發(fā)布排序等多種排序方式,以滿足用戶多樣化的檢索需求。
59、為了提高檢索結(jié)果的可讀性,該模塊還支持檢索詞在結(jié)果集中的高亮顯示功能。關(guān)鍵詞及分詞在結(jié)果集的特定字段中會(huì)以醒目的顏色進(jìn)行高亮,方便用戶快速識(shí)別和定位。同時(shí),高亮顯示的字段和顏色都可以根據(jù)用戶需求進(jìn)行靈活配置。為了進(jìn)一步提升用戶體驗(yàn),該模塊還提供了檢索策略訂閱功能。用戶可以在檢索過(guò)程中個(gè)性化定制自己關(guān)注的專利信息,并將檢索規(guī)則保存為訂閱策略。系統(tǒng)會(huì)根據(jù)用戶的訂閱策略定期推送相關(guān)專利數(shù)據(jù),并進(jìn)行聚類展示,幫助用戶及時(shí)了解最新的專利動(dòng)態(tài)。最后,該模塊還引入了檢索評(píng)分機(jī)制。通過(guò)對(duì)用戶檢索意圖與實(shí)際返回結(jié)果的匹配程度進(jìn)行評(píng)分,系統(tǒng)能夠不斷優(yōu)化檢索算法和策略,為用戶提供更為精準(zhǔn)、高效的專利檢索服務(wù)。同時(shí),這些評(píng)分?jǐn)?shù)據(jù)也能為后續(xù)的系統(tǒng)運(yùn)維和優(yōu)化提供有力支持。
60、系統(tǒng)管理模塊,提供用戶檢索日志保存,以及如專有詞、同義詞、敏感詞等優(yōu)化檢索效果的詞典配置,對(duì)檢索結(jié)果進(jìn)行置頂屏蔽等策略工具,以及對(duì)后臺(tái)基礎(chǔ)信息進(jìn)行維護(hù)的能力,包括用戶、權(quán)限、日志、數(shù)據(jù)導(dǎo)入導(dǎo)出等(數(shù)據(jù)導(dǎo)入導(dǎo)出字段和格式可配置)。
61、進(jìn)一步地,所述后臺(tái)管理模塊承擔(dān)了至關(guān)重要的角色,特別是在用戶檢索日志的保存與管理方面。引入實(shí)時(shí)流處理技術(shù)apache?flink,確保用戶每一次檢索行為都能被即時(shí)捕獲并傳輸至日志系統(tǒng)。同時(shí),采用aes加密手段對(duì)日志數(shù)據(jù)進(jìn)行加密存儲(chǔ),保障用戶隱私安全。其中記錄用戶的檢索行為,包括檢索關(guān)鍵詞、檢索時(shí)間戳以及用戶唯一標(biāo)識(shí)等核心信息。這些數(shù)據(jù)的積累,使系統(tǒng)能夠分析用戶的歷史搜索行為、點(diǎn)擊記錄和瀏覽習(xí)慣,并利用機(jī)器學(xué)習(xí)算法預(yù)測(cè)用戶的下一步搜索意圖打下了數(shù)據(jù)基礎(chǔ)。機(jī)器學(xué)習(xí)算法將基于用戶的偏好和行為模式,利用實(shí)時(shí)分析技術(shù),監(jiān)控用戶與搜索結(jié)果的交互行為(如點(diǎn)擊、停留時(shí)間等),動(dòng)態(tài)調(diào)整搜索結(jié)果的排序,確保用戶最感興趣或最相關(guān)的內(nèi)容優(yōu)先展示,實(shí)現(xiàn)上下文感知的智能推薦。有助于更好地理解用戶需求,提升用戶體驗(yàn)。此外,為了滿足不同用戶的個(gè)性化需求,后臺(tái)管理模塊支持專有詞、同義詞、敏感詞等詞典的靈活配置。用戶可以根據(jù)自身業(yè)務(wù)特點(diǎn),輕松添加、編輯或刪除相關(guān)詞匯,從而顯著提高檢索的準(zhǔn)確性和效率。這種高度可定制化的詞典配置功能,確保了檢索結(jié)果的精確性和針對(duì)性。
62、針對(duì)檢索結(jié)果的展示與控制,后臺(tái)管理模塊提供了強(qiáng)大的策略配置功能。用戶可以根據(jù)自己的需要,自定義檢索結(jié)果的置頂和屏蔽策略。并支持用戶在后臺(tái)為不同的檢索結(jié)果字段(如標(biāo)題、摘要、關(guān)鍵詞等)設(shè)置動(dòng)態(tài)權(quán)重,系統(tǒng)根據(jù)這些權(quán)重實(shí)時(shí)調(diào)整搜索結(jié)果排序,使得用戶可以更加靈活地控制哪些信息在結(jié)果中更為突出。這樣一來(lái),用戶關(guān)注的重要信息能夠優(yōu)先展示給用戶,而不需要的內(nèi)容則能夠被有效過(guò)濾,極大地提升了檢索結(jié)果的有效性和用戶滿意度。在專利基礎(chǔ)數(shù)據(jù)管理方面,后臺(tái)管理模塊同樣表現(xiàn)出色。它提供了可配置的字典管理功能,允許用戶根據(jù)實(shí)際需求配置分類號(hào)及其他專利基礎(chǔ)元數(shù)據(jù)的不同版本。這種靈活的配置方式,使得系統(tǒng)能夠適應(yīng)不同場(chǎng)景下的檢索需求,確保檢索結(jié)果的全面性和準(zhǔn)確性。
63、除了上述功能外,后臺(tái)管理模塊還提供了后臺(tái)系統(tǒng)的常規(guī)功能,如用戶注冊(cè)、登錄以及權(quán)限管理等。用戶可以通過(guò)注冊(cè)功能輕松進(jìn)入平臺(tái),而具體的操作權(quán)限則由系統(tǒng)管理員根據(jù)用戶角色和職責(zé)動(dòng)態(tài)分配。這種精細(xì)化的權(quán)限管理,確保了系統(tǒng)的安全性和穩(wěn)定性。最后,為了方便用戶處理大數(shù)據(jù)集,后臺(tái)管理模塊還提供了數(shù)據(jù)導(dǎo)入導(dǎo)出功能。用戶可以根據(jù)需要,將大量數(shù)據(jù)導(dǎo)入系統(tǒng)進(jìn)行分析處理,也可以將處理后的數(shù)據(jù)導(dǎo)出到指定格式和字段配置的文件中,以適應(yīng)不同的使用場(chǎng)景。這種高效的數(shù)據(jù)處理能力,極大地提升了用戶的工作效率。
64、與現(xiàn)有技術(shù)相比,本發(fā)明的積極效果為:
65、本發(fā)明不僅具備高效、準(zhǔn)確的數(shù)據(jù)檢索功能,還充分考慮了數(shù)據(jù)的安全性、合規(guī)性和可擴(kuò)展性,能夠在應(yīng)用上述數(shù)據(jù)架構(gòu)及檢索方法下,實(shí)現(xiàn)快速、準(zhǔn)確的專利檢索和分析。同時(shí),該系統(tǒng)還提供了友好的用戶界面和操作流程,方便用戶進(jìn)行專利檢索和數(shù)據(jù)分析工作。該系統(tǒng)的成功研制和應(yīng)用,將為國(guó)產(chǎn)自主可控環(huán)境下的科技創(chuàng)新提供有力支持。