一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法及系統(tǒng)的制作方法

文檔序號(hào)：6602064閱讀：322來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：：一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
：本發(fā)明涉及智能信息處理和計(jì)算機(jī)
技術(shù)領(lǐng)域：
，尤其涉及一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)及文獻(xiàn)內(nèi)表格數(shù)據(jù)的方法及系統(tǒng)。
背景技術(shù)：
：隨著網(wǎng)絡(luò)的快速發(fā)展和迅速普及，目前在互聯(lián)網(wǎng)上發(fā)布的電子文本成為當(dāng)前知識(shí)產(chǎn)權(quán)保護(hù)的一個(gè)重點(diǎn)。由于電子文本易于復(fù)制和下載，已成為許多人研究、引用的對(duì)象，一些電子文本被大版面的復(fù)制而被認(rèn)為抄襲的案例時(shí)有發(fā)生。而目前網(wǎng)絡(luò)上的電子文本保護(hù)措施主要通過(guò)阻止和檢測(cè)法。目前，也出現(xiàn)了電子文本內(nèi)容剽竊的方法，如專利申請(qǐng)?zhí)枮椤?00810232309.8—種檢測(cè)及定位電子文本內(nèi)容剽竊的方法”與專利申請(qǐng)?zhí)枮椤?3134562.X一種利用計(jì)算機(jī)程序檢測(cè)電子文本剽竊的方法”該現(xiàn)有專利主要是通過(guò)向計(jì)算機(jī)系統(tǒng)提交被檢測(cè)文本，提取特征模塊生成項(xiàng)序列，然后從項(xiàng)序列中依次取出每個(gè)項(xiàng)映射到已知項(xiàng)表上，生成疑似剽竊隊(duì)列，獲取剽竊證據(jù)表；最后計(jì)算文本的雷同度，判斷被檢測(cè)文本中是否含有剽竊的內(nèi)容。上述檢測(cè)過(guò)程只是單層特征的檢測(cè)，不能針對(duì)文獻(xiàn)內(nèi)的表格創(chuàng)建特征；其匹配也不是一篇文獻(xiàn)針對(duì)多篇文獻(xiàn)同時(shí)進(jìn)行匹配，只是一篇針對(duì)一篇，兩篇文獻(xiàn)之間的匹配(如圖1所示)浪費(fèi)了匹配的時(shí)間；而且對(duì)內(nèi)容也只是檢測(cè)抄襲的過(guò)程。
發(fā)明內(nèi)容為解決上述中存在的問(wèn)題與缺陷，本發(fā)明提供了一種不僅支持一篇文獻(xiàn)針對(duì)多篇文獻(xiàn)間的一次性匹配，而且還可檢測(cè)文獻(xiàn)內(nèi)表格數(shù)據(jù)、判斷不端文獻(xiàn)抄襲、篡改、一稿多投類型的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法及系統(tǒng)。所述技術(shù)方案如下一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法，包括將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征；對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征；將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和待檢測(cè)文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與所存有文獻(xiàn)的層級(jí)內(nèi)容特征及所存有文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配；判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端內(nèi)容的類型。一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng)，包括待檢測(cè)文獻(xiàn)特征區(qū)，用于對(duì)接收到的待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征；待檢測(cè)文獻(xiàn)比對(duì)資源區(qū)，用于對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征；分層特征匹配區(qū)，用于接收待檢測(cè)文獻(xiàn)特征區(qū)創(chuàng)建的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征，并將所述待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與待測(cè)文獻(xiàn)比對(duì)資源區(qū)所存有的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配；不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)，用于判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端學(xué)術(shù)內(nèi)容的類型。本發(fā)明提供的技術(shù)方案的有益效果是通過(guò)分層多階特征結(jié)構(gòu)，不僅可以對(duì)超長(zhǎng)文獻(xiàn)進(jìn)行快速檢測(cè)，而且，也滿足了文獻(xiàn)最小特征粒度短句的檢測(cè)，提高了檢準(zhǔn)率和檢全率；而且該發(fā)明還支持文獻(xiàn)內(nèi)表格數(shù)據(jù)特征的創(chuàng)建及匹配全部文獻(xiàn)的一次性匹配。圖1是現(xiàn)有技術(shù)文本內(nèi)容匹配方法結(jié)構(gòu)圖；圖2是檢測(cè)學(xué)術(shù)不端文獻(xiàn)方法流程圖；圖3是學(xué)術(shù)不端文獻(xiàn)匹配方法結(jié)構(gòu)圖；圖4是文獻(xiàn)多層特征生成方法結(jié)構(gòu)圖；圖5是文獻(xiàn)內(nèi)表格數(shù)據(jù)特征生成方法結(jié)構(gòu)圖；圖6是檢測(cè)學(xué)術(shù)不端文獻(xiàn)系統(tǒng)結(jié)構(gòu)圖。具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述實(shí)施例1本實(shí)施例提供了一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法如圖2所示，該方法包括步驟101將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征。步驟102對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征；上述待檢測(cè)文獻(xiàn)與所存有的文獻(xiàn)是指任意文獻(xiàn)，對(duì)其文獻(xiàn)進(jìn)行分層處理，按照篇章、段落、句子等層級(jí)分別創(chuàng)建唯一特征。步驟103將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和待檢測(cè)文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與所存有文獻(xiàn)的層級(jí)內(nèi)容特征及所存有文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配；首先是進(jìn)行篇章級(jí)別的特征匹配，如果整個(gè)篇章級(jí)別匹配成功，則不再對(duì)其段落級(jí)別進(jìn)行匹配，如果整個(gè)篇章級(jí)別匹配不成功的話，則繼續(xù)對(duì)其段落級(jí)別進(jìn)行匹配。如果整個(gè)段落級(jí)別匹配成功，則不再對(duì)其句子級(jí)別進(jìn)行匹配；如果整個(gè)段落匹配不成功的話，則繼續(xù)對(duì)其句子級(jí)別進(jìn)行匹配，總之，各層如果匹配成功，則不再進(jìn)行該特征下更小粒度層的匹配。其對(duì)待測(cè)文獻(xiàn)特征與所存有文獻(xiàn)特征庫(kù)的匹配方法如圖3所示，待測(cè)文獻(xiàn)多層特征庫(kù)中的特征所存有全部文獻(xiàn)特征庫(kù)集成倒排索引中的特征ID進(jìn)行相匹配，如果匹配成功則判斷出所述文獻(xiàn)的ID、特征匹配的數(shù)量及特征原始文本的長(zhǎng)度。步驟104判定學(xué)術(shù)不端文獻(xiàn)及類型；不端文獻(xiàn)的類型為抄襲與剽竊、或者篡改、或者一稿多投等學(xué)術(shù)不端文獻(xiàn)類型。如圖4所示，為全文特征、章節(jié)特征、段落特征及句子特征的生成方法結(jié)構(gòu)圖，其中全文特征提取方法、章節(jié)特征提取方法是利用關(guān)鍵詞詞典對(duì)全文分詞(對(duì)表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)意義的詞)，只保留關(guān)鍵詞詞典中的詞，全部詞排序并統(tǒng)計(jì)詞頻，照詞頻比例排序，得到詞序列表，依據(jù)該列表生成全文級(jí)別的一個(gè)特征，或按照詞拼寫排序得到一個(gè)詞序列表，依據(jù)該列表生成全文級(jí)別的一個(gè)特征。段落特征生成方法，利用單元詞詞典對(duì)段落分詞，(從文獻(xiàn)內(nèi)容中抽出的最基本的、字面上不能再分的詞。如“經(jīng)濟(jì)、美國(guó)、魯迅”等無(wú)定語(yǔ)的詞都是單元詞，單元詞不包括虛詞、介詞、連詞、助詞等無(wú)實(shí)質(zhì)表征的詞匯)只保留單元詞詞典中的詞，并統(tǒng)計(jì)頻率，按照詞頻比例排序，依據(jù)該列表生成段落級(jí)別的一個(gè)特征。句子特征生成方法，利用單元詞詞典對(duì)句子分詞，(從文獻(xiàn)內(nèi)容中抽出的最基本的、字面上不能再分的代表實(shí)質(zhì)意義的詞。如“經(jīng)濟(jì)、美國(guó)、魯迅”等無(wú)定語(yǔ)的詞都是單元詞。單元詞不包括虛詞、介詞、連詞、助詞等無(wú)實(shí)質(zhì)表征的詞匯)只保留單元詞詞典中的詞，利用同義詞詞典更新該列表中詞，例如“電腦”一詞全部替換為“計(jì)算機(jī)”“ontology”全部替換為“本體”，針對(duì)替換之后的列表按照詞形排序。依據(jù)排序好的列表生成句子級(jí)別的一個(gè)特征。如圖5所示，文獻(xiàn)內(nèi)表格數(shù)據(jù)生成方法結(jié)構(gòu)圖，首先是根據(jù)文獻(xiàn)表格內(nèi)容提取表格的屬性信息，特征庫(kù)根據(jù)表格內(nèi)容中的標(biāo)題信息、行數(shù)據(jù)信息、列數(shù)據(jù)信息、多行組合信息及多列組合信息來(lái)提取表格特征的特征。在提取時(shí)，其全部表格內(nèi)容作為文字處理，數(shù)字如果有小數(shù)點(diǎn)則循環(huán)乘10至轉(zhuǎn)化為整數(shù)為止。根據(jù)表格列數(shù)、行數(shù)及列數(shù)的多少分別組合多行、多列表格，參見表1和表2。表1<table>tableseeoriginaldocumentpage6</column></row><table>表2<table>tableseeoriginaldocumentpage6</column></row><table>上述檢測(cè)學(xué)術(shù)不端的方法適用于任何語(yǔ)言文獻(xiàn)，在檢測(cè)其它語(yǔ)言特征庫(kù)時(shí)，其特征庫(kù)的生成方法過(guò)程與所用詞詞典內(nèi)容有所區(qū)別。實(shí)施例2如圖6所示，為檢測(cè)學(xué)術(shù)不端文獻(xiàn)系統(tǒng)結(jié)構(gòu)圖，包括待檢測(cè)文獻(xiàn)特征區(qū)、待測(cè)文獻(xiàn)比對(duì)資源區(qū)、分層特征匹配區(qū)及不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)，其中待測(cè)文獻(xiàn)特征區(qū)，對(duì)接收到的待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征；待測(cè)文獻(xiàn)比對(duì)資源區(qū)，用于對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征；要檢測(cè)的文獻(xiàn)來(lái)源可以是用戶自由指定，實(shí)時(shí)生成文獻(xiàn)多層內(nèi)容特征加入到文獻(xiàn)特征庫(kù)中；待測(cè)文獻(xiàn)比對(duì)資源區(qū)的文獻(xiàn)可以是中國(guó)學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫(kù)中的文獻(xiàn)，也可以來(lái)源用戶自由指定的文獻(xiàn)。分層特征匹配區(qū)，用于接收待檢測(cè)文獻(xiàn)特征區(qū)創(chuàng)建的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征，并將所述待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與待測(cè)文獻(xiàn)比對(duì)資源區(qū)所存有的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配；不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)，用于判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端學(xué)術(shù)內(nèi)容的類型。所述待檢測(cè)文獻(xiàn)層級(jí)內(nèi)容與所存有文獻(xiàn)層級(jí)內(nèi)容創(chuàng)建的特征為唯一特征，其文獻(xiàn)層級(jí)是按照文獻(xiàn)篇幅、段落、句子進(jìn)行劃分，這種分層多階特征結(jié)構(gòu)，不僅可以滿足對(duì)超長(zhǎng)文獻(xiàn)的快速檢測(cè)，而且也滿足了對(duì)文獻(xiàn)的最小特征粒度的短句。上述文獻(xiàn)內(nèi)表格特征的生成方法是在特征庫(kù)中通過(guò)提取表格的屬性信息，即文獻(xiàn)的標(biāo)題信息、行數(shù)據(jù)信息、列數(shù)據(jù)信息、多行組合信息及多列組合信息進(jìn)行提取表格特征。上述不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)的判斷是根據(jù)待檢測(cè)文獻(xiàn)與所存有文獻(xiàn)中的相似閾值、文獻(xiàn)時(shí)間屬性及文獻(xiàn)作者屬性，其不端內(nèi)容的類型包括抄襲與剽竊、篡改及一稿多投。當(dāng)然，本發(fā)明還可有其他多種實(shí)施例，在不背離本發(fā)明精神及其實(shí)質(zhì)的情況下，本領(lǐng)域技術(shù)人員當(dāng)可根據(jù)本發(fā)明作出各種相應(yīng)的改變和變形，但這些相應(yīng)的改變和變形都應(yīng)屬于本發(fā)明所附的權(quán)利要求的保護(hù)范圍。權(quán)利要求一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法，其特征在于，待檢測(cè)文獻(xiàn)特征與所存全部文獻(xiàn)特征同時(shí)進(jìn)行匹配，所述方法具體包括將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征；對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征；將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和待檢測(cè)文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與所存有文獻(xiàn)的層級(jí)內(nèi)容特征及所存有文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配；判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端內(nèi)容的類型。2.根據(jù)權(quán)利要求1所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法，其特征在于，所述待檢測(cè)文獻(xiàn)層級(jí)內(nèi)容與所存有文獻(xiàn)層級(jí)內(nèi)容創(chuàng)建的特征為唯一特征。3.根據(jù)權(quán)利要求1所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法，其特征在于，所述不端學(xué)術(shù)文獻(xiàn)及類型的判斷是根據(jù)待檢測(cè)文獻(xiàn)與所存文獻(xiàn)中的相似閾值、文獻(xiàn)時(shí)間屬性及文獻(xiàn)作者屬性，其不端內(nèi)容的類型包括抄襲與剽竊、篡改及一稿多投。4.根據(jù)權(quán)利要求1所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法，其特征在于，所述待測(cè)文獻(xiàn)與所存有文獻(xiàn)特征間的匹配是進(jìn)行篇章級(jí)別的特征匹配、段落級(jí)別的特征匹配及句子級(jí)別的特征匹配。5.根據(jù)權(quán)利要求1所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法，其特征在于，所述文獻(xiàn)內(nèi)表格數(shù)據(jù)特征是通過(guò)提取表格的屬性信息、表格內(nèi)容的文字處理及表格的行數(shù)和列數(shù)進(jìn)行創(chuàng)建。6.根據(jù)權(quán)利要求4所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法，其特征在于，所述文獻(xiàn)全文篇幅的特征創(chuàng)建，是利用關(guān)鍵詞詞典對(duì)全文分詞，保留關(guān)鍵詞詞典中的詞，將全部詞排序并統(tǒng)計(jì)詞頻，按照詞頻比例排序，得到次序列表，依據(jù)該列表生成文獻(xiàn)全文級(jí)別的一個(gè)特征；或按照詞拼寫排序得到一個(gè)詞序列表，依據(jù)該列表生成文獻(xiàn)全文級(jí)別的一個(gè)特征；段落特征創(chuàng)建，是利用單元詞詞典對(duì)段落分詞，只保留單元詞詞典中的詞，并統(tǒng)計(jì)頻率，按照詞頻比例排序，依據(jù)該列表生成段落級(jí)別的一個(gè)特征；所述句子特征創(chuàng)建，是利用單元詞詞典對(duì)句子分詞，只保留單元詞詞典中的詞，利用同義詞詞典更新該列表中詞，針對(duì)更新之后的列表按照詞形排序，依據(jù)排序好的列表生成句子級(jí)別的一個(gè)特征。7.一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng)，其特征在于，包括待檢測(cè)文獻(xiàn)特征區(qū)，用于對(duì)接收到的待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征；待檢測(cè)文獻(xiàn)比對(duì)資源區(qū)，用于對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征；分層特征匹配區(qū)，用于接收待檢測(cè)文獻(xiàn)特征區(qū)創(chuàng)建的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征，并將所述待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與待測(cè)文獻(xiàn)比對(duì)資源區(qū)所存有的文獻(xiàn)的層級(jí)內(nèi)容特征及文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配；不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)，用于判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端學(xué)術(shù)內(nèi)容的類型。8.根據(jù)權(quán)利要求7所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng)，其特征在于，所述待檢測(cè)文獻(xiàn)層級(jí)內(nèi)容與所存有文獻(xiàn)層級(jí)創(chuàng)建的特征為唯一特征。9.根據(jù)權(quán)利要求7所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng)，其特征在于，所述不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)的判斷是根據(jù)待檢測(cè)文獻(xiàn)與所存有文獻(xiàn)中的相似閾值、文獻(xiàn)時(shí)間屬性及文獻(xiàn)作者屬性；所述文獻(xiàn)內(nèi)表格數(shù)據(jù)特征是通過(guò)提取表格的屬性信息、表格內(nèi)容的文字處理及表格的行數(shù)和列數(shù)進(jìn)行創(chuàng)建；其不端內(nèi)容的類型包括抄襲與剽竊、篡改及一稿多投。10.根據(jù)權(quán)利要求7所述的自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的系統(tǒng)，其特征在于，所述文獻(xiàn)層級(jí)內(nèi)容是按照文獻(xiàn)篇幅、段落、句子進(jìn)行劃分。全文摘要本發(fā)明公開了一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法及系統(tǒng)，所述方法將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容及文獻(xiàn)內(nèi)表格數(shù)據(jù)創(chuàng)建特征；對(duì)所存有的文獻(xiàn)層級(jí)內(nèi)容及文獻(xiàn)內(nèi)的表格數(shù)據(jù)創(chuàng)建特征；將待檢測(cè)文獻(xiàn)的層級(jí)內(nèi)容特征和待檢測(cè)文獻(xiàn)內(nèi)的表格數(shù)據(jù)特征與所存有文獻(xiàn)的層級(jí)內(nèi)容特征及所存有文獻(xiàn)內(nèi)的表格特征進(jìn)行匹配；判斷待檢測(cè)文獻(xiàn)中是否含有學(xué)術(shù)不端內(nèi)容、不端表格數(shù)據(jù)及不端內(nèi)容的類型。所述系統(tǒng)包括待檢測(cè)文獻(xiàn)特征區(qū)、待檢測(cè)文獻(xiàn)比對(duì)資源區(qū)、分層內(nèi)容特征匹配區(qū)及不端學(xué)術(shù)文獻(xiàn)及類型判定區(qū)。本發(fā)明通過(guò)分層多階特征結(jié)構(gòu)，不僅可以對(duì)超長(zhǎng)文獻(xiàn)進(jìn)行快速檢測(cè)，而且，也滿足了文獻(xiàn)最小特征粒度短句的檢測(cè)，提高了檢準(zhǔn)率和檢全率；而且該發(fā)明還支持文獻(xiàn)內(nèi)表格數(shù)據(jù)特征的創(chuàng)建及匹配全部文獻(xiàn)的一次性匹配。文檔編號(hào)G06F17/30GK101833579SQ20101016829公開日2010年9月15日申請(qǐng)日期2010年5月11日優(yōu)先權(quán)日2010年5月11日發(fā)明者孫雄勇,張振海申請(qǐng)人:同方知網(wǎng)(北京)技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張振海;孫雄勇
技術(shù)所有人：同方知網(wǎng)（北京）技術(shù)有限公司
我是此專利的發(fā)明人

上一篇：塑料注射成形中冷卻時(shí)間的快速預(yù)測(cè)方法
上一篇：學(xué)術(shù)文獻(xiàn)自動(dòng)分類的方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)相關(guān)技術(shù)

不端文獻(xiàn)檢測(cè)系統(tǒng)相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種自動(dòng)檢測(cè)學(xué)術(shù)不端文獻(xiàn)的方法及系統(tǒng)的制作方法