文件搜索方法、裝置、計算機存儲介質(zhì)及終端與流程

文檔序號：40544934發(fā)布日期：2025-01-03 11:04閱讀：10來源：國知局

本申請實施例涉及文件搜索，尤其涉及一種文件搜索方法、裝置、計算機存儲介質(zhì)及終端。

背景技術(shù)：

1、相關(guān)技術(shù)中office套件能夠通過標題中的關(guān)鍵詞檢索到所需要的文件，但是不能通過文件內(nèi)容檢索到所需要的文件。

技術(shù)實現(xiàn)思路

1、本申請實施例提供一種文件搜索方法、裝置、計算機存儲介質(zhì)及終端，能夠通過文件的內(nèi)容檢索到所需要的文件。

2、第一方面，本申請實施例提供一種文件搜索方法，所述文件搜索方法包括：

3、讀取目標文件的文件內(nèi)容；

4、對所述文件內(nèi)容進行分詞處理，得到分詞結(jié)果；

5、響應于搜索信息的輸入，根據(jù)所述搜索信息和所述分詞結(jié)果定位所述目標文件。

6、在一些實施例中，所述對所述文件內(nèi)容進行分詞處理，得到分詞結(jié)果，包括：

7、將所述文件內(nèi)容輸入文件解析器得到目標字符串；

8、對所述目標字符串進行分詞處理，得到分詞結(jié)果。

9、在一些實施例中，所述將所述文件內(nèi)容輸入文件解析器得到目標字符串，包括：

10、將所述文件內(nèi)容輸入所述文件解析器得到初始字符串；

11、對所述初始字符串進行優(yōu)化處理，得到目標字符串。

12、在一些實施例中，所述對所述文件內(nèi)容進行分詞處理，得到分詞結(jié)果，包括：

13、將所述文件內(nèi)容輸入分詞模型，得到分詞結(jié)果；

14、所述分詞模型包括：第一分詞子模型、第二分詞子模型以及第三分詞子模型；所述將所述文件內(nèi)容輸入分詞模型，得到分詞結(jié)果，包括：

15、將所述文件內(nèi)容輸入所述第一分詞子模型，得到第一詞向量；

16、將所述文件內(nèi)容輸入所述第二分詞子模型，得到第二詞向量；

17、將所述第一詞向量和所述第二詞向量拼接在一起，得到拼接詞向量；

18、將所述拼接詞向量輸入所述第三分詞子模型，得到分詞結(jié)果。

19、在一些實施例中，所述分詞模型還包括類型判斷子模型，所述第一分詞子模型有多個，對應不同類型的文件，在所述將所述文件內(nèi)容輸入所述第一分詞子模型，得到第一詞向量之前，所述方法還包括：

20、將所述文件內(nèi)容輸入所述類型判斷子模型，得到所述目標文件對應的類型；

21、根據(jù)所述目標文件對應的類型，調(diào)用對應的第一分詞子模型。

22、在一些實施例中，所述方法還包括：

23、獲取文件內(nèi)容樣本集，所述文件內(nèi)容樣本集包括多個文件內(nèi)容樣本，每個所述文件內(nèi)容樣本均事先標記有對應的分詞標簽；

24、將所述文件內(nèi)容樣本逐個輸入分詞模型，得到分詞模型輸出的分詞結(jié)果。

25、根據(jù)所述分詞標簽和所述分詞模型輸出的所述分詞結(jié)果，對所述分詞模型進行參數(shù)更新，直至滿足預定條件，停止訓練，得到訓練好的分詞模型。

26、在一些實施例中，所述根據(jù)所述分詞標簽和所述分詞模型輸出的所述分詞結(jié)果，對所述分詞模型進行參數(shù)更新，包括：

27、根據(jù)所述分詞標簽和所述分詞模型輸出的所述分詞結(jié)果，確定分詞損失；

28、根據(jù)所述分詞損失，對所述分詞模型進行參數(shù)更新，直至滿足預定條件，停止訓練，得到訓練好的所述分詞模型。

29、在一些實施例中，所述根據(jù)所述分詞標簽和所述分詞模型輸出的所述分詞結(jié)果，對所述分詞模型進行參數(shù)更新，包括：

30、若所述文件內(nèi)容樣本集中，只有不超過預定數(shù)量個所述文件內(nèi)容樣本輸入到所述分詞模型中得到的所述分詞結(jié)果和所述分詞標簽一致，對所述分詞模型進行參數(shù)更新；

31、若所述文件內(nèi)容樣本集中，有超過預定數(shù)量個所述文件內(nèi)容樣本輸入到所述分詞模型中得到的所述分詞結(jié)果和所述分詞標簽一致，結(jié)束訓練，得到訓練好的所述分詞模型。

32、第二方面，本申請實施例提供一種文件搜索裝置，所述文件搜索裝置包括：

33、讀取模塊，用于讀取目標文件的文件內(nèi)容；

34、分詞模塊，用于對所述文件內(nèi)容進行分詞處理，得到分詞結(jié)果；

35、定位模塊，用于響應于搜索信息的輸入，根據(jù)所述搜索信息和所述分詞結(jié)果定位所述目標文件。

36、第三方面，本申請實施例提供一種包含指令的計算機程序產(chǎn)品，當計算機程序產(chǎn)品在計算機或處理器上運行時，使得計算機或處理器執(zhí)行第一方面及第一方面的實施例中的方法步驟。

37、第四方面，本申請實施例提供一種計算機存儲介質(zhì)，計算機存儲介質(zhì)存儲有多條指令，指令適于由處理器加載并執(zhí)行第一方面及第一方面的實施例中的方法步驟。

38、第五方面，本申請實施例提供一種終端，終端包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序，處理器執(zhí)行程序時實現(xiàn)如第一方面及第一方面的實施例中的方法步驟。

39、本申請實施例提供的技術(shù)方案帶來的有益效果至少包括：

40、本申請實施例提供了一種文件搜索方法、裝置、計算機存儲介質(zhì)及終端，通過預先讀取目標文件的文件內(nèi)容，對文件內(nèi)容進行分詞處理得到分詞結(jié)果；在用戶輸入搜索信息時，響應于搜索信息的輸入，根據(jù)搜索信息和分詞結(jié)果定位目標文件。由于搜索信息可以與分詞處理的文件內(nèi)容進行比對，那么當搜索信息與文件內(nèi)容中的其中一分詞一致時，就可以直接通過此分詞定位到目標文件，從而通過搜索文件內(nèi)容定位目標文件。相比于現(xiàn)有技術(shù)，本申請的實施例除了能夠檢索到標題相似的目標文件外，還能夠檢索到內(nèi)容相似的目標文件，提高了目標文件關(guān)于搜索信息搜索的全面性。

技術(shù)特征：

1.一種文件搜索方法，其特征在于，所述文件搜索方法包括：

2.根據(jù)權(quán)利要求1所述的文件搜索方法，其特征在于，所述對所述文件內(nèi)容進行分詞處理，得到分詞結(jié)果，包括：

3.根據(jù)權(quán)利要求2所述的文件搜索方法，其特征在于，所述將所述文件內(nèi)容輸入文件解析器得到目標字符串，包括：

4.根據(jù)權(quán)利要求1所述的文件搜索方法，其特征在于，所述對所述文件內(nèi)容進行分詞處理，得到分詞結(jié)果，包括：

5.根據(jù)權(quán)利要求4所述的文件搜索方法，其特征在于，所述分詞模型還包括類型判斷子模型，所述第一分詞子模型有多個，對應不同類型的文件，在所述將所述文件內(nèi)容輸入所述第一分詞子模型，得到第一詞向量之前，所述方法還包括：

6.根據(jù)權(quán)利要求4所述的文件搜索方法，其特征在于，所述方法還包括：

7.根據(jù)權(quán)利要求6所述的文件搜索方法，其特征在于，所述根據(jù)所述分詞標簽和所述分詞模型輸出的所述分詞結(jié)果，對所述分詞模型進行參數(shù)更新，包括：

8.一種文件搜索裝置，其特征在于，所述文件搜索裝置包括：

9.一種計算機存儲介質(zhì)，其特征在于，

10.一種終端，其特征在于，

技術(shù)總結(jié)
本申請實施例公開了一種文件搜索方法、裝置、計算機存儲介質(zhì)及終端，通過預先讀取目標文件的文件內(nèi)容，對文件內(nèi)容進行分詞處理得到分詞結(jié)果；在用戶輸入搜索信息時，響應于搜索信息的輸入，根據(jù)搜索信息和分詞結(jié)果定位目標文件。由于搜索信息可以與分詞處理的文件內(nèi)容進行比對，那么當搜索信息與文件內(nèi)容中的其中一分詞一致時，就可以直接通過此分詞定位到目標文件，從而通過搜索文件內(nèi)容定位目標文件，相比于現(xiàn)有技術(shù)，本申請的實施例除了能夠檢索到標題相似的目標文件外，還能夠檢索到內(nèi)容相似的目標文件，提高了目標文件關(guān)于搜索信息搜索的全面性。

技術(shù)研發(fā)人員：韋慶龍
受保護的技術(shù)使用者：北京奇虎科技有限公司
技術(shù)研發(fā)日：
技術(shù)公布日：2025/1/2

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：韋慶龍
技術(shù)所有人：北京奇虎科技有限公司
我是此專利的發(fā)明人

上一篇：原料混裝自動混料機的制作方法
上一篇：一種高穩(wěn)定性晶體振蕩器的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構(gòu)動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

文件搜索方法、裝置、計算機存儲介質(zhì)及終端與流程

文件搜索方法、裝置、計算機存儲介質(zhì)及終端與流程