1.一種專利文件檢索方法,其特征在于,包括:
實(shí)時(shí)獲取檢索對(duì)象,所述檢索對(duì)象為用戶輸入的檢索詞或者檢索語段的全部內(nèi)容或者所述檢索語段的部分內(nèi)容;
確定所述檢索對(duì)象所在的當(dāng)前位置,所述當(dāng)前位置為多個(gè)預(yù)設(shè)模塊位置中的一個(gè)或者多個(gè)位置,其中,所述多個(gè)預(yù)設(shè)模塊位置與按照專利申請(qǐng)文件的文本內(nèi)容的組成結(jié)構(gòu)進(jìn)行拆分得到的多個(gè)內(nèi)容模塊一一對(duì)應(yīng);
基于所述檢索對(duì)象檢索所述當(dāng)前位置對(duì)應(yīng)的內(nèi)容模塊中包含所述檢索對(duì)象的專利文件;以及
實(shí)時(shí)顯示檢索到的專利文件。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在實(shí)時(shí)顯示檢索到的專利文件之后,所述方法還包括:
接收用戶輸入的刪選命令,所述刪選命令用于對(duì)顯示的專利文件進(jìn)行刪選;以及
基于所述刪選命令顯示刪選后的專利文件。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,在實(shí)時(shí)獲取檢索對(duì)象之前,所述方法還包括:
獲取數(shù)據(jù)庫中的專利申請(qǐng)文件;
根據(jù)專利申請(qǐng)文件的文本內(nèi)容的組成結(jié)構(gòu)對(duì)獲取的專利申請(qǐng)文件進(jìn)行拆分,得到所述多個(gè)內(nèi)容模塊;
對(duì)拆分得到的多個(gè)內(nèi)容模塊進(jìn)行標(biāo)識(shí);以及
將標(biāo)識(shí)后的多個(gè)內(nèi)容模塊保存到所述數(shù)據(jù)庫中。
4.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,實(shí)時(shí)獲取檢索對(duì)象包括:
獲取用戶輸入的檢索內(nèi)容;
將所述用戶輸入的檢索內(nèi)容的全部內(nèi)容作為所述檢索對(duì)象,或者,讀取用戶從所述檢索內(nèi)容中選定的部分內(nèi)容,將選定的部分內(nèi)容作為所述檢索對(duì)象。
5.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,在實(shí)時(shí)獲取檢索對(duì)象之后,所述方法還包括:
對(duì)所述檢索對(duì)象進(jìn)行分詞處理,得到分詞列表;
從所述分詞列表中剔除停用詞,
其中,基于所述檢索對(duì)象檢索所述當(dāng)前位置對(duì)應(yīng)的內(nèi)容模塊中包含所述檢索對(duì)象的專利文件包括:基于剔除停用詞后的分詞列表檢索所述當(dāng)前位置對(duì)應(yīng)的內(nèi)容模塊中包含所述剔除停用詞后的分詞列表的詞語的專利文件。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,在從所述分詞列表中剔除停用詞之后,所述方法還包括:
根據(jù)剔除停用詞后的分詞列表中的詞的數(shù)量和每個(gè)詞出現(xiàn)的次數(shù)計(jì)算每個(gè)詞的權(quán)重;
根據(jù)計(jì)算得到的每個(gè)詞的權(quán)重從所述剔除停用詞后的分詞列表中選擇用于檢索的詞語,
其中,基于所述檢索對(duì)象檢索所述當(dāng)前位置對(duì)應(yīng)的內(nèi)容模塊中包含所述檢索對(duì)象的專利文件包括:基于選擇的詞語檢索所述當(dāng)前位置對(duì)應(yīng)的內(nèi)容模塊中包含有所述選擇的詞語的專利文件。
7.一種專利文件檢索裝置,其特征在于,包括:
第一獲取單元,用于實(shí)時(shí)獲取檢索對(duì)象,所述檢索對(duì)象為用戶輸入的檢索詞或者檢索語段的全部內(nèi)容或者所述檢索語段的部分內(nèi)容;
確定單元,用于確定所述檢索對(duì)象所在的當(dāng)前位置,所述當(dāng)前位置為多個(gè)預(yù)設(shè)模塊位置中的一個(gè)或者多個(gè)位置,其中,所述多個(gè)預(yù)設(shè)模塊位置與按照專利申請(qǐng)文件的文本內(nèi)容的組成結(jié)構(gòu)進(jìn)行拆分得到的多個(gè)內(nèi)容模塊一一對(duì)應(yīng);
檢索單元,用于基于所述檢索對(duì)象檢索所述當(dāng)前位置對(duì)應(yīng)的內(nèi)容模塊中包含所述檢索對(duì)象的專利文件;以及
顯示單元,用于實(shí)時(shí)顯示檢索到的專利文件。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括:
接收單元,用于在實(shí)時(shí)顯示檢索到的專利文件之后,接收用戶輸入的刪選命令,所述刪選命令用于對(duì)顯示的專利文件進(jìn)行刪選;
所述顯示單元還用于基于所述刪選命令顯示刪選后的專利文件。
9.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述裝置還包括:
第二獲取單元,用于在實(shí)時(shí)獲取檢索對(duì)象之前,獲取數(shù)據(jù)庫中的專利申請(qǐng)文件;
拆分單元,用于根據(jù)專利申請(qǐng)文件的文本內(nèi)容的組成結(jié)構(gòu)對(duì)獲取的專利申請(qǐng)文件進(jìn)行拆分,得到所述多個(gè)內(nèi)容模塊;
標(biāo)識(shí)單元,用于對(duì)拆分得到的多個(gè)內(nèi)容模塊進(jìn)行標(biāo)識(shí);以及
存儲(chǔ)單元,用于將標(biāo)識(shí)后的多個(gè)內(nèi)容模塊保存到所述數(shù)據(jù)庫中。
10.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述第一獲取單元包括:
獲取模塊,用于獲取用戶輸入的檢索內(nèi)容;
確定模塊,用于將所述用戶輸入的檢索內(nèi)容的全部內(nèi)容作為所述檢索對(duì)象,或者,讀取用戶從所述檢索內(nèi)容中選定的部分內(nèi)容,將選定的部分內(nèi)容作為所述檢索對(duì)象。
11.根據(jù)權(quán)利要求7或8所述的裝置,其特征在于,所述裝置還包括:
分詞單元,用于在實(shí)時(shí)獲取檢索對(duì)象之后,對(duì)所述檢索對(duì)象進(jìn)行分詞處理,得到分詞列表;
剔除單元,用于從所述分詞列表中剔除停用詞,
其中,所述檢索單元包括:第一檢索模塊,用于基于剔除停用詞后的分詞列表檢索所述當(dāng)前位置對(duì)應(yīng)的內(nèi)容模塊中包含所述剔除停用詞后的分詞列表的詞語的專利文件。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還包括:
計(jì)算單元,用于在從所述分詞列表中剔除停用詞之后,根據(jù)剔除停用詞后的分詞列表中的詞的數(shù)量和每個(gè)詞出現(xiàn)的次數(shù)計(jì)算每個(gè)詞的權(quán)重;
選擇單元,用于根據(jù)計(jì)算得到的每個(gè)詞的權(quán)重從所述剔除停用詞后的分詞列表中選擇用于檢索的詞語,
其中,所述檢索單元包括:第二檢索模塊,用于基于選擇的詞語檢索所述當(dāng)前位置對(duì)應(yīng)的內(nèi)容模塊中包含有所述選擇的詞語的專利文件。
13.一種專利文件檢索系統(tǒng),其特征在于,包括:
模塊化數(shù)據(jù)庫,用于切分專利文本中的內(nèi)容并進(jìn)行模塊化存儲(chǔ);
詞匯抽取模塊,用于獲取用戶輸入的檢索內(nèi)容,并實(shí)時(shí)獲取所述檢索內(nèi)容中的檢索對(duì)象;
檢索模塊,用于確定所述檢索對(duì)象所在的當(dāng)前位置,并基于所述檢索對(duì)象從所述模塊化數(shù)據(jù)中檢索所述當(dāng)前位置對(duì)應(yīng)的內(nèi)容模塊中包含所述檢索對(duì)象的專利文件所述當(dāng)前位置為多個(gè)預(yù)設(shè)模塊位置中的一個(gè)或者多個(gè)位置,其中,所述多個(gè)預(yù)設(shè)模塊位置與按照專利申請(qǐng)文件的文本內(nèi)容的組成結(jié)構(gòu)進(jìn)行拆分得到的多個(gè)內(nèi)容模塊一一對(duì)應(yīng);以及
顯示模塊,用于實(shí)時(shí)顯示檢索到的專利文件。