技術(shù)編號:12040860
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。本發(fā)明涉及文本處理技術(shù),并且更具體地,涉及用于快速地確定哪些單詞頻繁地出現(xiàn)在特定的單詞附近的技術(shù)。背景技術(shù)伴隨著信息處理技術(shù)的擴展,大量的不同的文本數(shù)據(jù)現(xiàn)在被分析以便用于在各種領(lǐng)域中的新的發(fā)現(xiàn)。例子包括分析通過網(wǎng)絡(luò)的微博數(shù)據(jù)、在制造商處的產(chǎn)品信息數(shù)據(jù)、在銷售商處的產(chǎn)品銷售數(shù)據(jù)和在醫(yī)療機構(gòu)處的臨床數(shù)據(jù)。當處理文本數(shù)據(jù)時,針對所謂的前k個問題已經(jīng)建議了各種方法,包括本發(fā)明人的那些(專利文獻1和2),該前k個問題是從頻繁出現(xiàn)的單詞中提取前k個。已經(jīng)提出附近搜索技術(shù),其使用倒排索引來確定哪些單詞頻繁地出...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。