欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種專利方案的挖掘系統(tǒng)及挖掘方法

文檔序號(hào):8487771閱讀:369來(lái)源:國(guó)知局
一種專利方案的挖掘系統(tǒng)及挖掘方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息技術(shù)領(lǐng)域,具體涉及一種信息挖掘系統(tǒng)及挖掘方法。
【背景技術(shù)】
[0002]隨著科技的發(fā)展,知識(shí)產(chǎn)權(quán)保護(hù)越來(lái)越為人所重視,而專利技術(shù)是知識(shí)產(chǎn)權(quán)保護(hù)的重要組成。它保護(hù)的是可應(yīng)用于工業(yè)實(shí)踐的創(chuàng)造性技術(shù)方案。人們?cè)谏暾?qǐng)專利前需要對(duì)技術(shù)方案進(jìn)行可專利性的判斷,通常這種判斷都是人工完成,通過(guò)與技術(shù)方案相關(guān)領(lǐng)域的技術(shù)人員對(duì)方案的解讀、分析和對(duì)現(xiàn)有技術(shù)的檢索和判斷,完成新技術(shù)方案可專利性的判斷。但是,可專利性判斷的精確程度會(huì)受到技術(shù)人員經(jīng)驗(yàn)水平和檢索程度的影響,如果需要準(zhǔn)確判斷技術(shù)方案的可專利性,顯然需要耗費(fèi)大量的人力物力和時(shí)間。而且在確定技術(shù)方案存在可專利性之后還要花費(fèi)一定的人力物力去撰寫(xiě)申請(qǐng)專利的材料。

【發(fā)明內(nèi)容】

[0003]為解決上述問(wèn)題,本發(fā)明提出一種專利方案的挖掘系統(tǒng),該系統(tǒng)能夠幫助發(fā)明人分析技術(shù)方案的可專利性,并自動(dòng)生成標(biāo)準(zhǔn)專利文件和專利報(bào)告。
[0004]本發(fā)明解決上述技術(shù)問(wèn)題的方案如下:
[0005]一種專利方案的挖掘系統(tǒng),包括用戶輸入單元,用于提交用戶技術(shù)方案的文本信息;
[0006]專利數(shù)據(jù)庫(kù),用于存儲(chǔ)所有已公開(kāi)專利文獻(xiàn)的文本化數(shù)據(jù),以及每條專利文獻(xiàn)的技術(shù)關(guān)鍵詞、技術(shù)領(lǐng)域,相近技術(shù)領(lǐng)域及標(biāo)準(zhǔn)化語(yǔ)句文檔;
[0007]語(yǔ)言判斷模塊,用于判斷文本語(yǔ)言種類;
[0008]語(yǔ)義分析單元,用于對(duì)文本信息進(jìn)行分詞解析、對(duì)分詞解析的結(jié)果進(jìn)行詞性標(biāo)記和依存文法解析;
[0009]語(yǔ)句轉(zhuǎn)換單元,用于把依存文法解析的結(jié)果轉(zhuǎn)換成標(biāo)準(zhǔn)化語(yǔ)句文檔;
[0010]關(guān)鍵詞提取模塊,用于從分詞結(jié)果中提取技術(shù)關(guān)鍵詞;
[0011]文本比較單元,用于標(biāo)準(zhǔn)化語(yǔ)句文檔之間的文本比對(duì);
[0012]報(bào)告生成單元,用于生成挖掘報(bào)告。
[0013]一種專利方案的挖掘方法,包括以下步驟:
[0014]A)用戶輸入技術(shù)方案文本信息;
[0015]B)語(yǔ)義分析單元根據(jù)語(yǔ)言判斷模塊判斷輸入文本信息的語(yǔ)言種類,使用相應(yīng)的語(yǔ)言的科技分詞引擎對(duì)文本信息進(jìn)行分詞解析,得到包含η個(gè)分詞s的文本隊(duì)列Q(Sl,S2,…,sn);然后,按語(yǔ)言讀寫(xiě)順序?qū)Ζ莻€(gè)分詞s進(jìn)行詞性標(biāo)記,然后,根據(jù)各分詞s的詞性、搭配和驅(qū)動(dòng)關(guān)系,將整個(gè)隊(duì)列Q做依存文法解析,得到含有依存文法標(biāo)記的文本隊(duì)列P ;
[0016]C)語(yǔ)句轉(zhuǎn)換單元以文本隊(duì)列P中的斷句標(biāo)點(diǎn)符號(hào)為標(biāo)記,把文本隊(duì)列P分割為多個(gè)語(yǔ)句,并根據(jù)相應(yīng)的語(yǔ)言的句式結(jié)構(gòu)對(duì)每個(gè)語(yǔ)句進(jìn)行線性文本描寫(xiě)轉(zhuǎn)換,使得每個(gè)語(yǔ)句都轉(zhuǎn)換成標(biāo)準(zhǔn)化語(yǔ)句,然后將轉(zhuǎn)換后的每個(gè)語(yǔ)句按順序連接,得到包含V條標(biāo)準(zhǔn)化語(yǔ)句Smt的用戶技術(shù)方案的標(biāo)準(zhǔn)化語(yǔ)句文檔D[Smtl,Sent2,…,Smtv];
[0017]D)通過(guò)關(guān)鍵詞提取模塊將文本隊(duì)列P中的標(biāo)記為介詞、副詞、助詞以及其他非技術(shù)詞語(yǔ)的分詞s濾除,同時(shí)查詢其他分詞在已公開(kāi)利文獻(xiàn)數(shù)據(jù)庫(kù)中的出現(xiàn)頻率,并根據(jù)出現(xiàn)頻率的高低從其他分詞中找出技術(shù)關(guān)鍵詞集合A [skl, sk2,…,skl];
[0018]E)通過(guò)檢索技術(shù)關(guān)鍵詞集合A中每個(gè)技術(shù)關(guān)鍵詞Sk在已公開(kāi)專利文獻(xiàn)數(shù)據(jù)庫(kù)中出現(xiàn)的頻率和個(gè)數(shù),選擇技術(shù)關(guān)鍵詞出現(xiàn)頻率最高和出現(xiàn)個(gè)數(shù)最多的技術(shù)領(lǐng)域作為該用戶技術(shù)方案的相同或最接近的技術(shù)領(lǐng)域,同時(shí)獲取該技術(shù)領(lǐng)域的關(guān)聯(lián)技術(shù)領(lǐng)域;
[0019]F)將相同或最接近的技術(shù)領(lǐng)域以及關(guān)聯(lián)技術(shù)領(lǐng)域中所有已公開(kāi)專利文獻(xiàn)的權(quán)利要求按步驟B)?C)進(jìn)行處理,得到相同或最接近的技術(shù)領(lǐng)域以及關(guān)聯(lián)技術(shù)領(lǐng)域中所有已公開(kāi)專利文獻(xiàn)的權(quán)利要求標(biāo)準(zhǔn)化語(yǔ)句文檔元素集合Gstd[Dpl,Dp2, Dp3…,Dpm],并存儲(chǔ)于數(shù)據(jù)庫(kù)中;
[0020]G)以標(biāo)準(zhǔn)化語(yǔ)句為最小比較單位,在文本比較單元中將標(biāo)準(zhǔn)化語(yǔ)句文檔D與元素集合Gstd中的所有元素逐一進(jìn)行文本比較,并記錄每個(gè)元素含有與標(biāo)準(zhǔn)化語(yǔ)句文檔D中的相同標(biāo)準(zhǔn)化語(yǔ)句的數(shù)量,以相同標(biāo)準(zhǔn)化語(yǔ)句的數(shù)最多的元素作為最接近的標(biāo)準(zhǔn)技術(shù)文檔Dpx;然后,按照以下步驟判斷技術(shù)方案的可專利性:
[0021]Gl)若標(biāo)準(zhǔn)化語(yǔ)句文檔D與最接近的標(biāo)準(zhǔn)技術(shù)文檔Dpx不存在文本差異,則判定技術(shù)方案無(wú)專利性,報(bào)告生成單元生成挖掘報(bào)告;否則轉(zhuǎn)步驟G2),
[0022]G2)若標(biāo)準(zhǔn)化語(yǔ)句文檔D中含有最接近的標(biāo)準(zhǔn)技術(shù)文檔Dpx中不存在的至少I(mǎi)個(gè)標(biāo)準(zhǔn)化語(yǔ)句Smtx,則查找元素集合Gstd中其他元素D p中是否存在該標(biāo)準(zhǔn)化語(yǔ)句S entx,如存在,則判定技術(shù)方案無(wú)專利性,同時(shí)報(bào)告生成單元生成挖掘報(bào)告,反之,則判定技術(shù)方案有專利性并通過(guò)報(bào)告生成單元生成挖掘報(bào)告,同時(shí)將標(biāo)準(zhǔn)化語(yǔ)句文檔D作為標(biāo)準(zhǔn)專利文檔輸出;若最接近的標(biāo)準(zhǔn)技術(shù)文檔Dpx含有標(biāo)準(zhǔn)化語(yǔ)句文檔D中所有標(biāo)準(zhǔn)化語(yǔ)句,且還含有其他標(biāo)準(zhǔn)化語(yǔ)句,則判定技術(shù)方案有專利性并通過(guò)報(bào)告生成單元生成報(bào)告,并將標(biāo)準(zhǔn)化語(yǔ)句文檔D作為標(biāo)準(zhǔn)專利文檔輸出。
[0023]相較于現(xiàn)有技術(shù),本發(fā)明的有益效果在于:
[0024]I)使用語(yǔ)義分析單元對(duì)用戶輸入的技術(shù)方案文本信息做分詞、詞性標(biāo)準(zhǔn)和依存文法解析,使得在對(duì)技術(shù)方案文本做技術(shù)關(guān)鍵詞提取時(shí)能夠降低非技術(shù)用詞對(duì)提取過(guò)程的干擾,有效提尚提取技術(shù)關(guān)鍵詞的準(zhǔn)確性,從而大大提尚了對(duì)技術(shù)領(lǐng)域的判斷;
[0025]2)使用語(yǔ)句轉(zhuǎn)換單元將依存文法解析的結(jié)果根據(jù)相應(yīng)的語(yǔ)言的句式結(jié)構(gòu)做線性文本描寫(xiě)轉(zhuǎn)換,使得每個(gè)語(yǔ)句都轉(zhuǎn)換成標(biāo)準(zhǔn)化語(yǔ)句,得到標(biāo)準(zhǔn)化語(yǔ)句文檔,所有對(duì)于技術(shù)方案的表述得以統(tǒng)一,從而便于判斷技術(shù)方案的可專利性。
【附圖說(shuō)明】
[0026]圖1為本發(fā)明所述一種專利方案的挖掘系統(tǒng)的一個(gè)【具體實(shí)施方式】的系統(tǒng)結(jié)構(gòu)框圖,
[0027]圖2為本發(fā)明所述一種專利方案的挖掘系統(tǒng)的專利數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)圖,
[0028]圖3為本發(fā)明所述一種專利方案的挖掘方法的一個(gè)【具體實(shí)施方式】的方法流程圖。
【具體實(shí)施方式】
[0029]以下結(jié)合附圖詳細(xì)介紹本發(fā)明的技術(shù)方案。
[0030]如圖1所示,本例為一個(gè)對(duì)中文技術(shù)方案進(jìn)行專利挖掘的系統(tǒng),包括:
[0031]用戶輸入單元,用于提交用戶技術(shù)方案的中文文本信息;
[0032]專利數(shù)據(jù)庫(kù),用于存儲(chǔ)所有已公開(kāi)專利文獻(xiàn)的文本化數(shù)據(jù),以及每條專利文獻(xiàn)的中文技術(shù)關(guān)鍵詞、所屬技術(shù)領(lǐng)域,該專利文獻(xiàn)相近技術(shù)領(lǐng)域及該專利文獻(xiàn)中文標(biāo)準(zhǔn)化語(yǔ)句文檔,其數(shù)據(jù)結(jié)構(gòu)如圖2所示;
[0033]語(yǔ)言判斷模塊,用于判斷文本語(yǔ)言種類;
[0034]語(yǔ)義分析單元,用于對(duì)文本信息進(jìn)行中文分詞解析、對(duì)分詞解析的結(jié)果進(jìn)行詞性標(biāo)記和依存文法解析;
[0035]語(yǔ)句轉(zhuǎn)換單元,用于把依存文法解析的結(jié)果轉(zhuǎn)換成中文標(biāo)準(zhǔn)化語(yǔ)句文檔;
[0036]關(guān)鍵詞提取模塊,用于從分詞結(jié)果中提取中文技術(shù)關(guān)鍵詞;
[0037]文本比較單元,用于標(biāo)準(zhǔn)化語(yǔ)句文檔之間的中文文本比對(duì);
[0038]報(bào)告生成單元,用于生成挖掘報(bào)告。
[0039]參見(jiàn)圖3,采用該系統(tǒng)挖掘可專利技術(shù)方案的步驟如下:
[0040]A)用戶輸入技術(shù)方案的中文文本信息;
[0041]B)語(yǔ)義分析單元根據(jù)輸入文本信息的語(yǔ)言種類,使用上海玻森數(shù)據(jù)公司提供的玻森中文語(yǔ)義分詞引擎對(duì)文本信息進(jìn)行分詞解析,得到包含η個(gè)中
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
故城县| 和硕县| 尖扎县| 攀枝花市| 丰县| 沧州市| 梅河口市| 凤阳县| 杭州市| 南澳县| 巢湖市| 乌兰察布市| 兰西县| 哈密市| 扶风县| 安顺市| 逊克县| 江津市| 乌拉特前旗| 江山市| 高密市| 临夏市| 抚远县| 北宁市| 云霄县| 岳西县| 瑞金市| 泰顺县| 灵寿县| 祁门县| 嘉禾县| 邹城市| 漾濞| 利辛县| 南安市| 丹江口市| 溆浦县| 南陵县| 昭苏县| 鱼台县| 琼中|