欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法及系統(tǒng)的制作方法

文檔序號(hào):6602064閱讀:322來(lái)源:國(guó)知局

專利名稱::一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
:本發(fā)明涉及智能信息處理和計(jì)算機(jī)
技術(shù)領(lǐng)域
,尤其涉及一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)及文獻(xiàn)內(nèi)表格數(shù)據(jù)的方法及系統(tǒng)。
背景技術(shù)
:隨著網(wǎng)絡(luò)的快速發(fā)展和迅速普及,目前在互聯(lián)網(wǎng)上發(fā)布的電子文本成為當(dāng)前知識(shí)產(chǎn)權(quán)保護(hù)的一個(gè)重點(diǎn)。由于電子文本易于復(fù)制和下載,已成為許多人研究、引用的對(duì)象,一些電子文本被大版面的復(fù)制而被認(rèn)為抄襲的案例時(shí)有發(fā)生。而目前網(wǎng)絡(luò)上的電子文本保護(hù)措施主要通過(guò)阻止和檢測(cè)法。目前,也出現(xiàn)了電子文本內(nèi)容剽竊的方法,如專利申請(qǐng)?zhí)枮椤?00810232309.8—種檢測(cè)及定位電子文本內(nèi)容剽竊的方法”與專利申請(qǐng)?zhí)枮椤?3134562.X一種利用計(jì)算機(jī)程序檢測(cè)電子文本剽竊的方法”該現(xiàn)有專利主要是通過(guò)向計(jì)算機(jī)系統(tǒng)提交被檢測(cè)文本,提取特征模塊生成項(xiàng)序列,然后從項(xiàng)序列中依次取出每個(gè)項(xiàng)映射到已知項(xiàng)表上,生成疑似剽竊隊(duì)列,獲取剽竊證據(jù)表;最后計(jì)算文本的雷同度,判斷被檢測(cè)文本中是否含有剽竊的內(nèi)容。上述檢測(cè)過(guò)程只是單層特征的檢測(cè),不能針對(duì)文獻(xiàn)內(nèi)的表格創(chuàng)建特征;其匹配也不是一篇文獻(xiàn)針對(duì)多篇文獻(xiàn)同時(shí)進(jìn)行匹配,只是一篇針對(duì)一篇,兩篇文獻(xiàn)之間的匹配(如圖1所示)浪費(fèi)了匹配的時(shí)間;而且對(duì)內(nèi)容也只是檢測(cè)抄襲的過(guò)程。
發(fā)明內(nèi)容為解決上述中存在的問(wèn)題與缺陷,本發(fā)明提供了一種不僅支持一篇文獻(xiàn)針對(duì)多篇文獻(xiàn)間的一次性匹配,而且還可檢測(cè)文獻(xiàn)內(nèi)表格數(shù)據(jù)、判斷不端文獻(xiàn)抄襲、篡改、一稿多投類型的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法及系統(tǒng)。所述技術(shù)方案如下一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法,包括將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征;對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征;將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和待檢測(cè)文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與所存有文獻(xiàn)的層級(jí)內(nèi)容特征及所存有文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配;判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端內(nèi)容的類型。一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng),包括待檢測(cè)文獻(xiàn)特征區(qū),用于對(duì)接收到的待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征;待檢測(cè)文獻(xiàn)比對(duì)資源區(qū),用于對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征;分層特征匹配區(qū),用于接收待檢測(cè)文獻(xiàn)特征區(qū)創(chuàng)建的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征,并將所述待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與待測(cè)文獻(xiàn)比對(duì)資源區(qū)所存有的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配;不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū),用于判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端學(xué)術(shù)內(nèi)容的類型。本發(fā)明提供的技術(shù)方案的有益效果是通過(guò)分層多階特征結(jié)構(gòu),不僅可以對(duì)超長(zhǎng)文獻(xiàn)進(jìn)行快速檢測(cè),而且,也滿足了文獻(xiàn)最小特征粒度短句的檢測(cè),提高了檢準(zhǔn)率和檢全率;而且該發(fā)明還支持文獻(xiàn)內(nèi)表格數(shù)據(jù)特征的創(chuàng)建及匹配全部文獻(xiàn)的一次性匹配。圖1是現(xiàn)有技術(shù)文本內(nèi)容匹配方法結(jié)構(gòu)圖;圖2是檢測(cè)學(xué)術(shù)不端文獻(xiàn)方法流程圖;圖3是學(xué)術(shù)不端文獻(xiàn)匹配方法結(jié)構(gòu)圖;圖4是文獻(xiàn)多層特征生成方法結(jié)構(gòu)圖;圖5是文獻(xiàn)內(nèi)表格數(shù)據(jù)特征生成方法結(jié)構(gòu)圖;圖6是檢測(cè)學(xué)術(shù)不端文獻(xiàn)系統(tǒng)結(jié)構(gòu)圖。具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述實(shí)施例1本實(shí)施例提供了一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法如圖2所示,該方法包括步驟101將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征。步驟102對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征;上述待檢測(cè)文獻(xiàn)與所存有的文獻(xiàn)是指任意文獻(xiàn),對(duì)其文獻(xiàn)進(jìn)行分層處理,按照篇章、段落、句子等層級(jí)分別創(chuàng)建唯一特征。步驟103將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和待檢測(cè)文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與所存有文獻(xiàn)的層級(jí)內(nèi)容特征及所存有文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配;首先是進(jìn)行篇章級(jí)別的特征匹配,如果整個(gè)篇章級(jí)別匹配成功,則不再對(duì)其段落級(jí)別進(jìn)行匹配,如果整個(gè)篇章級(jí)別匹配不成功的話,則繼續(xù)對(duì)其段落級(jí)別進(jìn)行匹配。如果整個(gè)段落級(jí)別匹配成功,則不再對(duì)其句子級(jí)別進(jìn)行匹配;如果整個(gè)段落匹配不成功的話,則繼續(xù)對(duì)其句子級(jí)別進(jìn)行匹配,總之,各層如果匹配成功,則不再進(jìn)行該特征下更小粒度層的匹配。其對(duì)待測(cè)文獻(xiàn)特征與所存有文獻(xiàn)特征庫(kù)的匹配方法如圖3所示,待測(cè)文獻(xiàn)多層特征庫(kù)中的特征所存有全部文獻(xiàn)特征庫(kù)集成倒排索引中的特征ID進(jìn)行相匹配,如果匹配成功則判斷出所述文獻(xiàn)的ID、特征匹配的數(shù)量及特征原始文本的長(zhǎng)度。步驟104判定學(xué)術(shù)不端文獻(xiàn)及類型;不端文獻(xiàn)的類型為抄襲與剽竊、或者篡改、或者一稿多投等學(xué)術(shù)不端文獻(xiàn)類型。如圖4所示,為全文特征、章節(jié)特征、段落特征及句子特征的生成方法結(jié)構(gòu)圖,其中全文特征提取方法、章節(jié)特征提取方法是利用關(guān)鍵詞詞典對(duì)全文分詞(對(duì)表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的詞),只保留關(guān)鍵詞詞典中的詞,全部詞排序并統(tǒng)計(jì)詞頻,照詞頻比例排序,得到詞序列表,依據(jù)該列表生成全文級(jí)別的一個(gè)特征,或按照詞拼寫排序得到一個(gè)詞序列表,依據(jù)該列表生成全文級(jí)別的一個(gè)特征。段落特征生成方法,利用單元詞詞典對(duì)段落分詞,(從文獻(xiàn)內(nèi)容中抽出的最基本的、字面上不能再分的詞。如“經(jīng)濟(jì)、美國(guó)、魯迅”等無(wú)定語(yǔ)的詞都是單元詞,單元詞不包括虛詞、介詞、連詞、助詞等無(wú)實(shí)質(zhì)表征的詞匯)只保留單元詞詞典中的詞,并統(tǒng)計(jì)頻率,按照詞頻比例排序,依據(jù)該列表生成段落級(jí)別的一個(gè)特征。句子特征生成方法,利用單元詞詞典對(duì)句子分詞,(從文獻(xiàn)內(nèi)容中抽出的最基本的、字面上不能再分的代表實(shí)質(zhì)意義的詞。如“經(jīng)濟(jì)、美國(guó)、魯迅”等無(wú)定語(yǔ)的詞都是單元詞。單元詞不包括虛詞、介詞、連詞、助詞等無(wú)實(shí)質(zhì)表征的詞匯)只保留單元詞詞典中的詞,利用同義詞詞典更新該列表中詞,例如“電腦”一詞全部替換為“計(jì)算機(jī)”“ontology”全部替換為“本體”,針對(duì)替換之后的列表按照詞形排序。依據(jù)排序好的列表生成句子級(jí)別的一個(gè)特征。如圖5所示,文獻(xiàn)內(nèi)表格數(shù)據(jù)生成方法結(jié)構(gòu)圖,首先是根據(jù)文獻(xiàn)表格內(nèi)容提取表格的屬性信息,特征庫(kù)根據(jù)表格內(nèi)容中的標(biāo)題信息、行數(shù)據(jù)信息、列數(shù)據(jù)信息、多行組合信息及多列組合信息來(lái)提取表格特征的特征。在提取時(shí),其全部表格內(nèi)容作為文字處理,數(shù)字如果有小數(shù)點(diǎn)則循環(huán)乘10至轉(zhuǎn)化為整數(shù)為止。根據(jù)表格列數(shù)、行數(shù)及列數(shù)的多少分別組合多行、多列表格,參見表1和表2。表1<table>tableseeoriginaldocumentpage6</column></row><table>表2<table>tableseeoriginaldocumentpage6</column></row><table>上述檢測(cè)學(xué)術(shù)不端的方法適用于任何語(yǔ)言文獻(xiàn),在檢測(cè)其它語(yǔ)言特征庫(kù)時(shí),其特征庫(kù)的生成方法過(guò)程與所用詞詞典內(nèi)容有所區(qū)別。實(shí)施例2如圖6所示,為檢測(cè)學(xué)術(shù)不端文獻(xiàn)系統(tǒng)結(jié)構(gòu)圖,包括待檢測(cè)文獻(xiàn)特征區(qū)、待測(cè)文獻(xiàn)比對(duì)資源區(qū)、分層特征匹配區(qū)及不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū),其中待測(cè)文獻(xiàn)特征區(qū),對(duì)接收到的待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征;待測(cè)文獻(xiàn)比對(duì)資源區(qū),用于對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征;要檢測(cè)的文獻(xiàn)來(lái)源可以是用戶自由指定,實(shí)時(shí)生成文獻(xiàn)多層內(nèi)容特征加入到文獻(xiàn)特征庫(kù)中;待測(cè)文獻(xiàn)比對(duì)資源區(qū)的文獻(xiàn)可以是中國(guó)學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫(kù)中的文獻(xiàn),也可以來(lái)源用戶自由指定的文獻(xiàn)。分層特征匹配區(qū),用于接收待檢測(cè)文獻(xiàn)特征區(qū)創(chuàng)建的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征,并將所述待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與待測(cè)文獻(xiàn)比對(duì)資源區(qū)所存有的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配;不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū),用于判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端學(xué)術(shù)內(nèi)容的類型。所述待檢測(cè)文獻(xiàn)層級(jí)內(nèi)容與所存有文獻(xiàn)層級(jí)內(nèi)容創(chuàng)建的特征為唯一特征,其文獻(xiàn)層級(jí)是按照文獻(xiàn)篇幅、段落、句子進(jìn)行劃分,這種分層多階特征結(jié)構(gòu),不僅可以滿足對(duì)超長(zhǎng)文獻(xiàn)的快速檢測(cè),而且也滿足了對(duì)文獻(xiàn)的最小特征粒度的短句。上述文獻(xiàn)內(nèi)表格特征的生成方法是在特征庫(kù)中通過(guò)提取表格的屬性信息,即文獻(xiàn)的標(biāo)題信息、行數(shù)據(jù)信息、列數(shù)據(jù)信息、多行組合信息及多列組合信息進(jìn)行提取表格特征。上述不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)的判斷是根據(jù)待檢測(cè)文獻(xiàn)與所存有文獻(xiàn)中的相似閾值、文獻(xiàn)時(shí)間屬性及文獻(xiàn)作者屬性,其不端內(nèi)容的類型包括抄襲與剽竊、篡改及一稿多投。當(dāng)然,本發(fā)明還可有其他多種實(shí)施例,在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下,本領(lǐng)域技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形,但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。權(quán)利要求一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法,其特征在于,待檢測(cè)文獻(xiàn)特征與所存全部文獻(xiàn)特征同時(shí)進(jìn)行匹配,所述方法具體包括將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征;對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征;將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和待檢測(cè)文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與所存有文獻(xiàn)的層級(jí)內(nèi)容特征及所存有文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配;判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端內(nèi)容的類型。2.根據(jù)權(quán)利要求1所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法,其特征在于,所述待檢測(cè)文獻(xiàn)層級(jí)內(nèi)容與所存有文獻(xiàn)層級(jí)內(nèi)容創(chuàng)建的特征為唯一特征。3.根據(jù)權(quán)利要求1所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法,其特征在于,所述不端學(xué)術(shù)文獻(xiàn)及類型的判斷是根據(jù)待檢測(cè)文獻(xiàn)與所存文獻(xiàn)中的相似閾值、文獻(xiàn)時(shí)間屬性及文獻(xiàn)作者屬性,其不端內(nèi)容的類型包括抄襲與剽竊、篡改及一稿多投。4.根據(jù)權(quán)利要求1所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法,其特征在于,所述待測(cè)文獻(xiàn)與所存有文獻(xiàn)特征間的匹配是進(jìn)行篇章級(jí)別的特征匹配、段落級(jí)別的特征匹配及句子級(jí)別的特征匹配。5.根據(jù)權(quán)利要求1所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法,其特征在于,所述文獻(xiàn)內(nèi)表格數(shù)據(jù)特征是通過(guò)提取表格的屬性信息、表格內(nèi)容的文字處理及表格的行數(shù)和列數(shù)進(jìn)行創(chuàng)建。6.根據(jù)權(quán)利要求4所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法,其特征在于,所述文獻(xiàn)全文篇幅的特征創(chuàng)建,是利用關(guān)鍵詞詞典對(duì)全文分詞,保留關(guān)鍵詞詞典中的詞,將全部詞排序并統(tǒng)計(jì)詞頻,按照詞頻比例排序,得到次序列表,依據(jù)該列表生成文獻(xiàn)全文級(jí)別的一個(gè)特征;或按照詞拼寫排序得到一個(gè)詞序列表,依據(jù)該列表生成文獻(xiàn)全文級(jí)別的一個(gè)特征;段落特征創(chuàng)建,是利用單元詞詞典對(duì)段落分詞,只保留單元詞詞典中的詞,并統(tǒng)計(jì)頻率,按照詞頻比例排序,依據(jù)該列表生成段落級(jí)別的一個(gè)特征;所述句子特征創(chuàng)建,是利用單元詞詞典對(duì)句子分詞,只保留單元詞詞典中的詞,利用同義詞詞典更新該列表中詞,針對(duì)更新之后的列表按照詞形排序,依據(jù)排序好的列表生成句子級(jí)別的一個(gè)特征。7.一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng),其特征在于,包括待檢測(cè)文獻(xiàn)特征區(qū),用于對(duì)接收到的待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征;待檢測(cè)文獻(xiàn)比對(duì)資源區(qū),用于對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征;分層特征匹配區(qū),用于接收待檢測(cè)文獻(xiàn)特征區(qū)創(chuàng)建的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征,并將所述待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與待測(cè)文獻(xiàn)比對(duì)資源區(qū)所存有的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配;不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū),用于判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端學(xué)術(shù)內(nèi)容的類型。8.根據(jù)權(quán)利要求7所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng),其特征在于,所述待檢測(cè)文獻(xiàn)層級(jí)內(nèi)容與所存有文獻(xiàn)層級(jí)創(chuàng)建的特征為唯一特征。9.根據(jù)權(quán)利要求7所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng),其特征在于,所述不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)的判斷是根據(jù)待檢測(cè)文獻(xiàn)與所存有文獻(xiàn)中的相似閾值、文獻(xiàn)時(shí)間屬性及文獻(xiàn)作者屬性;所述文獻(xiàn)內(nèi)表格數(shù)據(jù)特征是通過(guò)提取表格的屬性信息、表格內(nèi)容的文字處理及表格的行數(shù)和列數(shù)進(jìn)行創(chuàng)建;其不端內(nèi)容的類型包括抄襲與剽竊、篡改及一稿多投。10.根據(jù)權(quán)利要求7所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng),其特征在于,所述文獻(xiàn)層級(jí)內(nèi)容是按照文獻(xiàn)篇幅、段落、句子進(jìn)行劃分。全文摘要本發(fā)明公開了一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法及系統(tǒng),所述方法將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征;對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征;將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和待檢測(cè)文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與所存有文獻(xiàn)的層級(jí)內(nèi)容特征及所存有文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配;判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端內(nèi)容的類型。所述系統(tǒng)包括待檢測(cè)文獻(xiàn)特征區(qū)、待檢測(cè)文獻(xiàn)比對(duì)資源區(qū)、分層內(nèi)容特征匹配區(qū)及不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)。本發(fā)明通過(guò)分層多階特征結(jié)構(gòu),不僅可以對(duì)超長(zhǎng)文獻(xiàn)進(jìn)行快速檢測(cè),而且,也滿足了文獻(xiàn)最小特征粒度短句的檢測(cè),提高了檢準(zhǔn)率和檢全率;而且該發(fā)明還支持文獻(xiàn)內(nèi)表格數(shù)據(jù)特征的創(chuàng)建及匹配全部文獻(xiàn)的一次性匹配。文檔編號(hào)G06F17/30GK101833579SQ20101016829公開日2010年9月15日申請(qǐng)日期2010年5月11日優(yōu)先權(quán)日2010年5月11日發(fā)明者孫雄勇,張振海申請(qǐng)人:同方知網(wǎng)(北京)技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
高邮市| 宁明县| 滦南县| 库尔勒市| 贡觉县| 邯郸市| 健康| 海丰县| 商都县| 历史| 庆安县| 凭祥市| 台湾省| 文安县| 怀化市| 循化| 东方市| 唐海县| 鄂托克前旗| 亳州市| 秭归县| 铁岭县| 临猗县| 丰都县| 仁化县| 德钦县| 浦东新区| 余姚市| 夹江县| 准格尔旗| 宁夏| 交口县| 资兴市| 汤阴县| 会昌县| 光泽县| 东城区| 南阳市| 正宁县| 商河县| 赫章县|