本說明書涉及檔案管理領(lǐng)域,更具體地說,本技術(shù)涉及一種電子檔案數(shù)據(jù)管理系統(tǒng)控制方法及相關(guān)設(shè)備。
背景技術(shù):
1、隨著信息化的快速發(fā)展,電子檔案管理系統(tǒng)在各類組織中的應(yīng)用越來越廣泛。這些系統(tǒng)通過將紙質(zhì)檔案數(shù)字化并存儲(chǔ)于電子系統(tǒng)中,實(shí)現(xiàn)了檔案的高效管理和便捷查詢。然而,隨著時(shí)間的推移,電子檔案的數(shù)量不斷增加,如何高效地分類、存儲(chǔ)和檢索這些檔案成為一個(gè)重要的技術(shù)挑戰(zhàn)。
2、在現(xiàn)有技術(shù)中,電子檔案的管理方法通常包括將所有檔案數(shù)據(jù)按照一定的規(guī)則進(jìn)行分類并存儲(chǔ)于統(tǒng)一的存儲(chǔ)空間中。當(dāng)用戶進(jìn)行查詢時(shí),系統(tǒng)通過對(duì)所有存儲(chǔ)的檔案進(jìn)行搜索,以獲取符合查詢條件的檔案。然而,這種方式在檔案數(shù)量較少時(shí)效率尚可,但在檔案數(shù)量龐大時(shí),查詢效率和系統(tǒng)響應(yīng)速度會(huì)顯著下降,尤其是在面對(duì)高頻查詢的檔案時(shí),系統(tǒng)需要反復(fù)搜索大量數(shù)據(jù),造成資源浪費(fèi)和用戶體驗(yàn)的下降。此外,現(xiàn)有系統(tǒng)缺乏對(duì)用戶查詢行為的深度分析和預(yù)測(cè)能力,無法有效區(qū)分高頻訪問檔案與低頻訪問檔案,導(dǎo)致所有檔案的查詢過程都被一視同仁地處理,進(jìn)一步加劇了系統(tǒng)的負(fù)擔(dān)。
技術(shù)實(shí)現(xiàn)思路
1、在
技術(shù)實(shí)現(xiàn)要素:
部分中引入了一系列簡(jiǎn)化形式的概念,這將在具體實(shí)施方式部分中進(jìn)一步詳細(xì)說明。本技術(shù)的發(fā)明內(nèi)容部分并不意味著要試圖限定出所要求保護(hù)的技術(shù)方案的關(guān)鍵特征和必要技術(shù)特征,更不意味著試圖確定所要求保護(hù)的技術(shù)方案的保護(hù)范圍。
2、第一方面,本技術(shù)提出一種電子檔案數(shù)據(jù)管理系統(tǒng)控制方法,包括:
3、獲取電子檔案輸入數(shù)據(jù);
4、將電子檔案輸入數(shù)據(jù)按照預(yù)設(shè)分類規(guī)則進(jìn)行分類,以形成常規(guī)存儲(chǔ)檔案;
5、將電子檔案輸入數(shù)據(jù)按歷史查詢信息進(jìn)行分類,以形成臨時(shí)存儲(chǔ)檔案;
6、基于用戶查詢信息依次在所述臨時(shí)存儲(chǔ)檔案和所述常規(guī)存儲(chǔ)檔案中查詢,以獲取檔案查詢信息。
7、在一種可行的實(shí)施方式中,所述將電子檔案輸入數(shù)據(jù)按照預(yù)設(shè)分類規(guī)則進(jìn)行分類,以形成常規(guī)存儲(chǔ)檔案,包括:
8、對(duì)所述電子檔案輸入數(shù)據(jù)進(jìn)行預(yù)處理操作,以獲取預(yù)處理后電子檔案數(shù)據(jù);
9、計(jì)算所述預(yù)處理后電子檔案數(shù)據(jù)中每個(gè)詞語的tf-idf值,以獲取排名前n名的關(guān)鍵詞;
10、獲取所述前n名的關(guān)鍵詞的優(yōu)先級(jí)信息;
11、基于所述優(yōu)先級(jí)信息和所述前n名的關(guān)鍵詞的頻次信息調(diào)整所述前n名的關(guān)鍵詞的排序;
12、計(jì)算重新排序的前n名的關(guān)鍵詞與每個(gè)所述預(yù)設(shè)分類規(guī)則的匹配得分;
13、基于所述匹配得分確定目標(biāo)分類規(guī)則,以形成常規(guī)存儲(chǔ)檔案。
14、在一種可行的實(shí)施方式中,所述歷史查詢信息包括查詢者身份特征信息和檔案查詢?cè)儐栃畔ⅲ?/p>
15、所述將電子檔案輸入數(shù)據(jù)按歷史查詢信息進(jìn)行分類,以形成臨時(shí)存儲(chǔ)檔案,包括:
16、根據(jù)所述查詢者身份特征信息和所述檔案查詢?cè)儐栃畔?gòu)建身份分類信息和查詢偏好信息映射關(guān)系;
17、基于所述身份分類信息和查詢偏好信息映射關(guān)系對(duì)所述電子檔案輸入數(shù)據(jù)進(jìn)行分類,以形成臨時(shí)存儲(chǔ)檔案。
18、在一種可行的實(shí)施方式中,所述根據(jù)所述查詢者身份特征信息和所述檔案查詢?cè)儐栃畔?gòu)建身份分類信息和查詢偏好信息映射關(guān)系,包括:
19、對(duì)所述查詢者身份特征信息基于k-means算法進(jìn)行分組,以形成身份分類信息;
20、對(duì)所述檔案查詢?cè)儐栃畔⒉捎胒p-growth算法分析用戶查詢數(shù)據(jù),識(shí)別出查詢偏好信息;
21、將所述身份分類信息和所述查詢偏好信息進(jìn)行關(guān)聯(lián),以構(gòu)建身份分類信息和查詢偏好信息映射關(guān)系。
22、在一種可行的實(shí)施方式中,所述基于用戶查詢信息依次在所述臨時(shí)存儲(chǔ)檔案和所述常規(guī)存儲(chǔ)檔案中查詢,以獲取檔案查詢信息,包括:
23、基于用戶查詢信息首先在所述臨時(shí)存儲(chǔ)檔案中進(jìn)行初次查詢,以獲取初次查詢信息;
24、并將初次查詢結(jié)果反饋給查詢用戶;
25、在所述查詢用戶再次給出深度查詢指令的情況下,基于深度查詢執(zhí)行在所述常規(guī)存儲(chǔ)檔案中進(jìn)行深度查詢,以獲取補(bǔ)充查詢信息;
26、根據(jù)所述初次查詢信息和所述深度查詢信息確定所述檔案查詢信息。
27、在一種可行的實(shí)施方式中,所述初次查詢時(shí)基于緩存查詢方式進(jìn)行的,所述深度查詢時(shí)基于自然語言處理方式進(jìn)行的。
28、在一種可行的實(shí)施方式中,還包括:
29、基于下式確定所述臨時(shí)存儲(chǔ)檔案的生存周期ttemp:
30、
31、ttemp為臨時(shí)存儲(chǔ)檔案的生存周期;tbase為基礎(chǔ)保留時(shí)間;α為訪問頻率調(diào)整系數(shù);f為檔案的訪問頻率;fmax為系統(tǒng)中所有檔案的最大訪問頻率;β為最近訪問時(shí)間調(diào)整系數(shù);tlast為檔案最近一次訪問的時(shí)間距離當(dāng)前時(shí)間的天數(shù);tmax=為預(yù)設(shè)的最大時(shí)間跨度;γ為檔案重要性調(diào)整系數(shù);i為檔案的重要性等級(jí);δ為規(guī)定要求調(diào)整系數(shù);r為規(guī)定要求的保留時(shí)間延長(zhǎng)量。
32、第二方面、本技術(shù)提出一種電子檔案數(shù)據(jù)管理系統(tǒng)控制裝置,包括:
33、第一獲取單元,用于獲取電子檔案輸入數(shù)據(jù);
34、第一分類單元,用于將電子檔案輸入數(shù)據(jù)按照預(yù)設(shè)分類規(guī)則進(jìn)行分類,以形成常規(guī)存儲(chǔ)檔案;
35、第二分類單元,用于將電子檔案輸入數(shù)據(jù)按照預(yù)設(shè)分類歷史查詢信息進(jìn)行分類,以形成臨時(shí)存儲(chǔ)檔案;
36、第二獲取單元,用于基于用戶查詢信息依次在所述臨時(shí)存儲(chǔ)檔案和所述常規(guī)存儲(chǔ)檔案中查詢,以獲取檔案查詢信息。
37、第三方面,一種電子設(shè)備,包括:存儲(chǔ)器、處理器以及存儲(chǔ)在上述存儲(chǔ)器中并可在上述處理器上運(yùn)行的計(jì)算機(jī)程序,上述處理器用于執(zhí)行存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)如上述的第一方面任一項(xiàng)的電子檔案數(shù)據(jù)管理系統(tǒng)控制方法的步驟。
38、第四方面,本技術(shù)還提出一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,上述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)第一方面任一項(xiàng)的電子檔案數(shù)據(jù)管理系統(tǒng)控制方法。
39、綜上,本技術(shù)實(shí)施例提出的電子檔案數(shù)據(jù)管理系統(tǒng)控制方法包括:獲取電子檔案輸入數(shù)據(jù);將電子檔案輸入數(shù)據(jù)按照預(yù)設(shè)分類規(guī)則進(jìn)行分類,以形成常規(guī)存儲(chǔ)檔案;將電子檔案輸入數(shù)據(jù)按歷史查詢信息進(jìn)行分類,以形成臨時(shí)存儲(chǔ)檔案;基于用戶查詢信息依次在所述臨時(shí)存儲(chǔ)檔案和所述常規(guī)存儲(chǔ)檔案中查詢,以獲取檔案查詢信息。本方案通過將電子檔案輸入數(shù)據(jù)分別按照預(yù)設(shè)分類規(guī)則和歷史查詢信息進(jìn)行分類,形成常規(guī)存儲(chǔ)檔案和臨時(shí)存儲(chǔ)檔案兩類存儲(chǔ)方式。常規(guī)存儲(chǔ)檔案用于有序地管理所有檔案數(shù)據(jù),而臨時(shí)存儲(chǔ)檔案則專門用于存儲(chǔ)基于歷史查詢信息預(yù)測(cè)出的高頻訪問檔案。這樣,系統(tǒng)能夠首先在臨時(shí)存儲(chǔ)檔案中進(jìn)行快速查詢,極大提高了查詢的效率,減少了對(duì)全量數(shù)據(jù)的依賴。通過將檔案按歷史查詢信息進(jìn)行分類,本方案有效減少了頻繁訪問檔案的重復(fù)搜索時(shí)間和系統(tǒng)資源消耗。相比于傳統(tǒng)的統(tǒng)一存儲(chǔ)方法,這種方式能夠根據(jù)檔案的實(shí)際使用頻率動(dòng)態(tài)調(diào)整存儲(chǔ)策略,避免了對(duì)低頻檔案的重復(fù)檢索,節(jié)省了存儲(chǔ)資源并降低了系統(tǒng)負(fù)擔(dān)。本方案采用了分層查詢策略,在用戶發(fā)起查詢時(shí),系統(tǒng)首先在臨時(shí)存儲(chǔ)檔案中進(jìn)行快速查詢,并在必要時(shí)才進(jìn)入常規(guī)存儲(chǔ)檔案中進(jìn)行更全面的搜索。這一設(shè)計(jì)顯著縮短了查詢響應(yīng)時(shí)間,提升了用戶體驗(yàn)。此外,用戶可以根據(jù)需要進(jìn)一步觸發(fā)深度查詢,獲取更加全面的檔案信息。本方案根據(jù)用戶的歷史查詢行為對(duì)檔案進(jìn)行智能分類,使得系統(tǒng)能夠預(yù)測(cè)并提前準(zhǔn)備用戶可能需要的檔案。這種基于用戶行為的智能分類機(jī)制,使系統(tǒng)具有更強(qiáng)的適應(yīng)性和靈活性,能夠更好地滿足不同用戶的個(gè)性化需求。本方案的臨時(shí)存儲(chǔ)檔案是動(dòng)態(tài)生成和調(diào)整的,系統(tǒng)可以定期或在特定觸發(fā)條件下重新評(píng)估檔案的存儲(chǔ)方式。這種動(dòng)態(tài)調(diào)整機(jī)制確保了臨時(shí)存儲(chǔ)檔案始終包含最相關(guān)和最有可能被查詢的檔案,保持?jǐn)?shù)據(jù)的時(shí)效性。通過上述改進(jìn),本方案顯著提升了電子檔案管理系統(tǒng)的效率和用戶體驗(yàn),解決了現(xiàn)有技術(shù)中查詢速度慢、資源浪費(fèi)和缺乏針對(duì)性的難題,使得系統(tǒng)能夠更好地應(yīng)對(duì)大規(guī)模電子檔案管理的挑戰(zhàn)。