構(gòu)建所述結(jié)果范圍集合 包括: 訪問所述查詢關(guān)鍵字集合,并根據(jù)所述查詢關(guān)鍵字集合構(gòu)建關(guān)鍵字排布集合,所述關(guān) 鍵字排布集合為所述查詢關(guān)鍵字集合的冪集合減去空集; 建立最小距離數(shù)組與最小貢獻(xiàn)物體數(shù)組,所述最小距離數(shù)組與所述最小貢獻(xiàn)物體數(shù)組 的長度數(shù)值等于所述關(guān)鍵字排布集合中元素的個數(shù)數(shù)值,所述最小距離數(shù)組與所述最小貢 獻(xiàn)物體數(shù)組的內(nèi)容與所述關(guān)鍵字排布集合中的元素一一對應(yīng); 依次指定所述關(guān)鍵字排布集合中每個元素為迭代關(guān)鍵字集合,并將所述迭代關(guān)鍵字集 合與所述查詢位置信息結(jié)合構(gòu)成迭代向量; 訪問所述數(shù)據(jù)集合中的每個物體元素,并獲取所述每個物體元素到所述迭代向量的最 小距離、以及達(dá)成該最小距離的物體元素,并將所述迭代向量的最小距離存入所述最小距 離數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)的位置上,并將所述達(dá)成該最小距離的物體 元素存入最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)的位置上,其中,若關(guān) 鍵字排布集合中當(dāng)前元素未被所述數(shù)據(jù)集合中的任意物體元素的關(guān)鍵詞所覆蓋使得當(dāng)前 物體元素到所述迭代向量的最小距離不存在,則將正無窮存入所述最小距離數(shù)組內(nèi)與關(guān)鍵 字排布集合中當(dāng)前元素相對應(yīng)的位置上、以及最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng) 前元素相對應(yīng)的位置上; 根據(jù)所述數(shù)據(jù)集合建立物體對數(shù)據(jù)集合,所述物體對數(shù)據(jù)集合的元素為所述數(shù)據(jù)集合 中的每兩個不同物體元素進(jìn)行組合的形成的物體對元素; 訪問所述物體對數(shù)據(jù)集合中的每個物體對元素,并獲取所述每個物體對元素中兩個物 體元素各自到所述迭代向量的最小距離之和、以及達(dá)成該最小距離的物體對元素,并將所 述迭代向量的最小距離之和與所述最小距離數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng) 的位置上的現(xiàn)有數(shù)字進(jìn)行比對,若所述迭代向量的最小距離之和小于現(xiàn)有數(shù)字,則將現(xiàn)有 數(shù)字置為所述迭代向量的最小距離之和,并清除所述最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集 合中當(dāng)前元素相對應(yīng)位置上的內(nèi)容,將所述達(dá)成該最小距離之和的物體對元素寫入所述最 小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)位置; 依次指定所述關(guān)鍵字排布集合中每個元素為迭代關(guān)鍵字集合并執(zhí)行上述步驟,直到所 述關(guān)鍵字排布集合中的所有元素都被指定過; 輸出所述最小距離數(shù)組與所述最小貢獻(xiàn)物體數(shù)組的最終結(jié)果,所述最小距離數(shù)組全數(shù) 組之和為所述加性損失函數(shù)的最小值,所述最小貢獻(xiàn)物體數(shù)組全數(shù)組所有元素組成的集合 為所述結(jié)果范圍集合。
4. 根據(jù)權(quán)利要求3所述的一種關(guān)鍵字查詢方法,其特征在于: 獲取所述每個物體元素到所述迭代向量的最小距離、以及達(dá)成該最小距離的物體元 素,并將所述迭代向量的最小距離存入所述最小距離數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素 相對應(yīng)的位置上,并將所述達(dá)成該最小距離的物體元素存入最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字 排布集合中當(dāng)前元素相對應(yīng)的位置上,為使用并行方式處理并寫入數(shù)據(jù); 獲取所述每個物體對元素中兩個物體元素各自到所述迭代向量的最小距離之和、以及 達(dá)成該最小距離的物體對元素,并將所述迭代向量的最小距離之和與所述最小距離數(shù)組內(nèi) 與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)的位置上的現(xiàn)有數(shù)字進(jìn)行比對,若所述迭代向量的最 小距離之和小于現(xiàn)有數(shù)字,則將現(xiàn)有數(shù)字置為所述迭代向量的最小距離之和,并清除所述 最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)位置上的內(nèi)容,將所述達(dá)成該最 小距離之和的物體對元素寫入所述最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相 對應(yīng)位置,為使用串行方式處理并寫入數(shù)據(jù)。
5. 根據(jù)權(quán)利要求4所述的一種關(guān)鍵字查詢方法,其特征在于: 將所述每個物體的數(shù)據(jù)信息構(gòu)建為數(shù)據(jù)集合,為將所述每個物體的數(shù)據(jù)信息存儲在分 布式文件系統(tǒng)中,并將所述數(shù)據(jù)信息按所述分布式文件系統(tǒng)的形式構(gòu)建為數(shù)據(jù)集合; 獲取所述每個物體元素到所述迭代向量的最小距離、以及達(dá)成該最小距離的物體元 素,并將所述迭代向量的最小距離存入所述最小距離數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素 相對應(yīng)的位置上,并將所述達(dá)成該最小距離的物體元素存入最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字 排布集合中當(dāng)前元素相對應(yīng)的位置上,為通過使用服務(wù)器控制所述分布式文件系統(tǒng)的多個 物理地址的處理終端處理并寫入數(shù)據(jù),并將所述處理并寫入的數(shù)據(jù)傳送到服務(wù)器; 獲取所述每個物體對元素中兩個物體元素各自到所述迭代向量的最小距離之和、以及 達(dá)成該最小距離的物體對元素,并將所述迭代向量的最小距離之和與所述最小距離數(shù)組內(nèi) 與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)的位置上的現(xiàn)有數(shù)字進(jìn)行比對,若所述迭代向量的最 小距離之和小于現(xiàn)有數(shù)字,則將現(xiàn)有數(shù)字置為所述迭代向量的最小距離之和,并清除所述 最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)位置上的內(nèi)容,將所述達(dá)成該最 小距離之和的物體對元素寫入所述最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相 對應(yīng)位置,為服務(wù)器接受前一步驟的數(shù)據(jù),并在服務(wù)器本地進(jìn)行運(yùn)算,進(jìn)一步處理并寫入數(shù) 據(jù)。
6. -種關(guān)鍵字查詢裝置,其特征在于,包括: 一服務(wù)器,所述服務(wù)器連接至多個處理終端,所述服務(wù)器用于獲取查詢請求、驗(yàn)證所述 查詢請求的合法性、并根據(jù)所述查詢請求訪問所述多個處理終端、向所述多個處理終端分 配第一處理任務(wù)、接收所述第一處理任務(wù)的結(jié)果并進(jìn)行第二處理任務(wù)、將所述第二處理任 務(wù)的結(jié)果輸出; 多個處理終端,所述多個處理終端均連接至所述服務(wù)器,所述每個處理終端各連接至 一分布式存儲器,所述每個處理終端用于接收服務(wù)器分配的所述第一處理任務(wù)、訪問分布 式存儲器中的數(shù)據(jù)、進(jìn)行所述第一處理任務(wù)并將所述第一處理任務(wù)輸出到所述服務(wù)器; 多個分布式存儲器,所述每個分布式存儲器各連接至一所述處理終端,所述多個分布 式存儲器用于聯(lián)合存儲所述數(shù)據(jù)集合中的所有數(shù)據(jù)信息。
7. 根據(jù)權(quán)利要求6所述的一種關(guān)鍵字查詢裝置,其特征在于,所述第一任務(wù)包括: 依次指定所述關(guān)鍵字排布集合中每個元素為迭代關(guān)鍵字集合,并將所述迭代關(guān)鍵字集 合與所述查詢位置信息結(jié)合構(gòu)成迭代向量; 訪問所述數(shù)據(jù)集合中的每個物體元素,并獲取所述每個物體元素到所述迭代向量的最 小距離、以及達(dá)成該最小距離的物體元素,并將所述迭代向量的最小距離存入所述最小距 離數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)的位置上,并將所述達(dá)成該最小距離的物體 元素存入最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)的位置上,其中,若關(guān) 鍵字排布集合中當(dāng)前元素未被所述數(shù)據(jù)集合中的任意物體元素的關(guān)鍵詞所覆蓋使得當(dāng)前 物體元素到所述迭代向量的最小距離不存在,則將正無窮存入所述最小距離數(shù)組內(nèi)與關(guān)鍵 字排布集合中當(dāng)前元素相對應(yīng)的位置上、以及最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng) 前元素相對應(yīng)的位置上。
8. 根據(jù)權(quán)利要求6所述的一種關(guān)鍵字查詢裝置,其特征在于,所述第二任務(wù)包括: 根據(jù)所述數(shù)據(jù)集合建立物體對數(shù)據(jù)集合,所述物體對數(shù)據(jù)集合的元素為所述數(shù)據(jù)集合 中的每兩個不同物體元素進(jìn)行組合的形成的物體對元素; 訪問所述物體對數(shù)據(jù)集合中的每個物體對元素,并獲取所述每個物體對元素中兩個物 體元素各自到所述迭代向量的最小距離之和、以及達(dá)成該最小距離的物體對元素,并將所 述迭代向量的最小距離之和與所述最小距離數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng) 的位置上的現(xiàn)有數(shù)字進(jìn)行比對,若所述迭代向量的最小距離之和小于現(xiàn)有數(shù)字,則將現(xiàn)有 數(shù)字置為所述迭代向量的最小距離之和,并清除所述最小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集 合中當(dāng)前元素相對應(yīng)位置上的內(nèi)容,將所述達(dá)成該最小距離之和的物體對元素寫入所述最 小貢獻(xiàn)物體數(shù)組內(nèi)與關(guān)鍵字排布集合中當(dāng)前元素相對應(yīng)位置。
9. 根據(jù)權(quán)利要求6所述的一種關(guān)鍵字查詢裝置,其特征在于,所述服務(wù)器驗(yàn)證所述查 詢請求的合法性,為判斷所述查詢范圍集合中的每個物體元素是否都包含所述關(guān)鍵字集合 中的至少一關(guān)鍵字,以及判斷所述查詢關(guān)鍵字集合是否為所述查詢范圍集合中的每個物體 元素的關(guān)鍵字所組成的集合的子集,如果是,則認(rèn)為所述查詢請求合法。
【專利摘要】本發(fā)明公開了一種關(guān)鍵字查詢方法與裝置,其中,該方法包括:掃描定義范圍內(nèi)的每個物體,并獲取每個物體的數(shù)據(jù)信息;將每個物體的數(shù)據(jù)信息構(gòu)建為數(shù)據(jù)集合;獲取查詢請求,驗(yàn)證查詢請求的合法性;若查詢請求合法,則根據(jù)合法查詢請求在數(shù)據(jù)集合中進(jìn)行查詢,并返回符合查詢請求的結(jié)果。本發(fā)明將構(gòu)建結(jié)果范圍集合拆分為第一任務(wù)與第二任務(wù)并分別進(jìn)行計算,避免了使用IR樹,得以兼容大規(guī)模的數(shù)據(jù)運(yùn)算,增強(qiáng)了擴(kuò)展性;使用迭代算法構(gòu)建結(jié)果范圍集合可以保證獲得的結(jié)果范圍集合最優(yōu)解,提高了工作效率。
【IPC分類】G06F17-30
【公開號】CN104657516
【申請?zhí)枴緾N201510130790
【發(fā)明人】趙翔, 徐浩, 何培俊, 葛斌
【申請人】中國人民解放軍國防科學(xué)技術(shù)大學(xué)
【公開日】2015年5月27日
【申請日】2015年3月24日