技術編號:6370889
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明涉及計算機文本處理技術;特別是涉及面向遷移學習的文本處理方法和文本特征提取方法。背景技術傳統(tǒng)的特征提取算法,沒有考慮新、舊文本不同分布的情況,沒有考慮訓練文本偏斜的問題。由于新、舊文本有不同分布,當差異較大時,若用從舊文本提取的特征表示新文本時,新文本會出現很多特征權重為0的現象。由于訓練文本中新文本很少,若單獨從中提取特征,提取到的特征不能很好地代表所有新文本。如果在這些特征的基礎上,對訓練文本和目標任務的文本進行表示,并進行文本分類,必然不會取得...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。