技術編號:6379099
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明涉及中文信息處理領域,具體地涉及中文文本分詞以及一種基于向量空間的文本相似度計算進行文本抄襲判別的裝置和方法。背景技術 設計一個文本抄襲判別系統(tǒng),其目的是要代替人為判別的方法。其主要問題在于如何文本內容進行描述,以及如何對兩個文本的相似性進行評價。向量空間模型的方法一般用在文本分類中。這里使用向量空間模型的方法,對文本內容進行描述以及相似性計算,達到判別的目的。在實際工作中,往往采用人工判別的方法來判斷是否存在文本抄襲,這種辦法的明顯缺點在于對于人的...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。