技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明公開了一種海量數(shù)據(jù)多維排序搜索方法,包括:根據(jù)數(shù)據(jù)庫中文檔的領(lǐng)域相關(guān)度,將文檔進行聚類,得到聚類組織相似查詢樹;將不同的領(lǐng)域的聚類組織進行聚類,形成相似查詢樹;獲取用戶提交的查詢向量,將查詢向量表示為查詢超球體;根據(jù)查詢超球體與相似查詢樹中節(jié)點所代表的超球體的位置關(guān)系,獲取與查詢超球體交集最多的超球體,并對該超球體向下一層節(jié)點尋找,直到葉子節(jié)點,并查詢其左右鄰居節(jié)點,按照相關(guān)比例返回節(jié)點中k個最相關(guān)的文檔列表以及文檔向量。在大數(shù)據(jù)的環(huán)境下DIK?MEDOIDS算法具有明顯的優(yōu)勢,提高了數(shù)據(jù)的查詢速度已經(jīng)準確度。
技術(shù)研發(fā)人員:趙志濱;顧佳良;姚蘭;高福祥
受保護的技術(shù)使用者:東北大學(xué)
技術(shù)研發(fā)日:2017.05.12
技術(shù)公布日:2017.09.15