欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種關鍵字查詢方法與裝置的制造方法

文檔序號:8339763閱讀:250來源:國知局
一種關鍵字查詢方法與裝置的制造方法
【技術領域】
[0001] 本發(fā)明涉及信息處理技術,特別地,涉及一種關鍵字查詢方法與裝置。
【背景技術】
[0002] 最近,隨著大規(guī)??臻g數(shù)據(jù)的出現(xiàn),空間數(shù)據(jù)查詢成為研宄的熱點。給定一組帶有 空間和文字描述的物體,一個空間關鍵詞查詢由一組關鍵字和位置信息構成。一個物體懂 得文字描述含有制定關鍵字我們就說這個物體覆蓋這個關鍵字。一個查詢力圖找到覆蓋所 有關鍵字的最近的物體。然而,在一些特定的應用中,只有一些物體的組合才能滿足用戶的 需求;例如,一個游客想要找到附近一組感興趣的地方,包括飯店、超市和旅館;另一個例 子是在交叉學科合作中,項目負責人往往想要找到不同領域的專家或者是具有不能技能的 人。這樣看來,一組物體協(xié)同的滿足用戶的需求可以用協(xié)同空間關鍵詞查詢確切的描述。
[0003] 現(xiàn)有技術已經公開了基于IR樹的協(xié)同空間關鍵詞算法。在現(xiàn)有技術中,當待處理 的數(shù)據(jù)集在增大時,算法被發(fā)現(xiàn)存在擴展性問題:構建IR樹需要大量的時間和內存,并且 找出的結果不能保證最優(yōu)、效率低下;同時,不依賴索引的精確算法想要的到最優(yōu)解需要大 量的運行時間。
[0004] 針對現(xiàn)有技術中協(xié)同空間關鍵詞算法擴展性差、效率低下的問題,目前尚未有有 效的解決方案。

【發(fā)明內容】

[0005] 針對現(xiàn)有技術中協(xié)同空間關鍵詞算法擴展性差、效率低下的問題,本發(fā)明的目的 在于提出一種關鍵字查詢方法與裝置,能夠兼容大規(guī)模的數(shù)據(jù)運算,擴展性好;且可以保證 獲得最優(yōu)解,工作效率高。
[0006] 基于上述目的,本發(fā)明提供的技術方案如下:
[0007] 根據(jù)本發(fā)明的一個方面,提供了一種關鍵字查詢方法,包括:
[0008] 掃描定義范圍內的每個物體,并獲取每個物體的數(shù)據(jù)信息;
[0009] 將每個物體的數(shù)據(jù)信息構建為數(shù)據(jù)集合;
[0010] 獲取查詢請求,驗證查詢請求的合法性;
[0011] 若查詢請求合法,則根據(jù)合法查詢請求在數(shù)據(jù)集合中進行查詢,并返回符合查詢 請求的結果。
[0012] 其中,每個物體的數(shù)據(jù)信息,包括每個物體的位置信息與關鍵字信息,其中,每個 物體的關鍵字信息包括至少一關鍵字;獲取查詢請求,為獲取一查詢向量與一查詢范圍集 合,其中,查詢向量包括一查詢位置信息與一查詢關鍵字集合,其中,查詢關鍵字集合包括 至少一關鍵字,查詢范圍集合為數(shù)據(jù)集合的子集;驗證查詢請求的合法性,為判斷查詢范圍 集合中的每個物體元素是否都包含關鍵字集合中的至少一關鍵字,以及判斷查詢關鍵字集 合是否為查詢范圍集合中的每個物體元素的關鍵字所組成的集合的子集,如果是,則認為 查詢請求合法;根據(jù)查詢請求在數(shù)據(jù)集合中進行查詢,為構建一結果范圍集合,其中,結果 范圍集合為數(shù)據(jù)集合的子集,結果范圍集合中的每個物體元素都包含關鍵字集合中的至少 一關鍵字,查詢關鍵字集合為結果范圍集合中的每個物體元素的關鍵字所組成的集合的子 集,并且結果范圍集合與查詢向量組成的損失函數(shù)應小于查詢請求本身的加性損失函數(shù), 其中,加性損失函數(shù)為查詢向量到查詢范圍集合或結果范圍集合中每個物體元素的距離之 和。
[0013] 并且,構建結果范圍集合包括:訪問查詢關鍵字集合,并根據(jù)查詢關鍵字集合構 建關鍵字排布集合,關鍵字排布集合為查詢關鍵字集合的冪集合減去空集;建立最小距離 數(shù)組與最小貢獻物體數(shù)組,最小距離數(shù)組與最小貢獻物體數(shù)組的長度數(shù)值等于關鍵字排布 集合中元素的個數(shù)數(shù)值,最小距離數(shù)組與最小貢獻物體數(shù)組的內容與關鍵字排布集合中的 元素一一對應;依次指定關鍵字排布集合中每個元素為迭代關鍵字集合,并將迭代關鍵字 集合與查詢位置信息結合構成迭代向量;訪問數(shù)據(jù)集合中的每個物體元素,并獲取每個物 體元素到迭代向量的最小距離、以及達成該最小距離的物體元素,并將迭代向量的最小距 離存入最小距離數(shù)組內與關鍵字排布集合中當前元素相對應的位置上,并將達成該最小距 離的物體元素存入最小貢獻物體數(shù)組內與關鍵字排布集合中當前元素相對應的位置上,其 中,若關鍵字排布集合中當前元素未被數(shù)據(jù)集合中的任意物體元素的關鍵詞所覆蓋使得當 前物體元素到迭代向量的最小距離不存在,則將正無窮存入最小距離數(shù)組內與關鍵字排布 集合中當前元素相對應的位置上、以及最小貢獻物體數(shù)組內與關鍵字排布集合中當前元素 相對應的位置上;根據(jù)數(shù)據(jù)集合建立物體對數(shù)據(jù)集合,物體對數(shù)據(jù)集合的元素為數(shù)據(jù)集合 中的每兩個不同物體元素進行組合的形成的物體對元素;訪問物體對數(shù)據(jù)集合中的每個物 體對元素,并獲取每個物體對元素中兩個物體元素各自到迭代向量的最小距離之和、以及 達成該最小距離的物體對元素,并將迭代向量的最小距離之和與最小距離數(shù)組內與關鍵字 排布集合中當前元素相對應的位置上的現(xiàn)有數(shù)字進行比對,若迭代向量的最小距離之和小 于現(xiàn)有數(shù)字,則將現(xiàn)有數(shù)字置為迭代向量的最小距離之和,并清除最小貢獻物體數(shù)組內與 關鍵字排布集合中當前元素相對應位置上的內容,將達成該最小距離之和的物體對元素寫 入最小貢獻物體數(shù)組內與關鍵字排布集合中當前元素相對應位置;依次指定關鍵字排布集 合中每個元素為迭代關鍵字集合并執(zhí)行上述步驟,直到關鍵字排布集合中的所有元素都被 指定過;輸出最小距離數(shù)組與最小貢獻物體數(shù)組的最終結果,最小距離數(shù)組全數(shù)組之和為 加性損失函數(shù)的最小值,最小貢獻物體數(shù)組全數(shù)組所有元素組成的集合為結果范圍集合。
[0014] 并且,獲取每個物體元素到迭代向量的最小距離、以及達成該最小距離的物體元 素,并將迭代向量的最小距離存入最小距離數(shù)組內與關鍵字排布集合中當前元素相對應的 位置上,并將達成該最小距離的物體元素存入最小貢獻物體數(shù)組內與關鍵字排布集合中當 前元素相對應的位置上,為使用并行方式處理并寫入數(shù)據(jù);獲取每個物體對元素中兩個物 體元素各自到迭代向量的最小距離之和、以及達成該最小距離的物體對元素,并將迭代向 量的最小距離之和與最小距離數(shù)組內與關鍵字排布集合中當前元素相對應的位置上的現(xiàn) 有數(shù)字進行比對,若迭代向量的最小距離之和小于現(xiàn)有數(shù)字,則將現(xiàn)有數(shù)字置為迭代向量 的最小距離之和,并清除最小貢獻物體數(shù)組內與關鍵字排布集合中當前元素相對應位置上 的內容,將達成該最小距離之和的物體對元素寫入最小貢獻物體數(shù)組內與關鍵字排布集合 中當前元素相對應位置,為使用串行方式處理并寫入數(shù)據(jù)。
[0015] 并且,將每個物體的數(shù)據(jù)信息構建為數(shù)據(jù)集合,為將每個物體的數(shù)據(jù)信息存儲在 分布式文件系統(tǒng)中,并將數(shù)據(jù)信息按分布式文件系統(tǒng)的形式構建為數(shù)據(jù)集合;獲取每個物 體元素到迭代向量的最小距離、以及達成該最小距離的物體元素,并將迭代向量的最小距 離存入最小距離數(shù)組內與關鍵字排布集合中當前元素相對應的位置上,并將達成該最小距 離的物體元素存入最小貢獻物體數(shù)組內與關鍵字排布集合中當前元素相對應的位置上,為 通過使用服務器控制分布式文件系統(tǒng)的多個物理地址的處理終端處理并寫入數(shù)據(jù),并將處 理并寫入的數(shù)據(jù)傳送到服務器;獲取每個物體對元素中兩個物體元素各自到迭代向量的最 小距離之和、以及達成該最小距離的物體對元素,并將迭代向量的最小距離之和與最小距 離數(shù)組內與關鍵字排布集合中當前元素相對應的位置上的現(xiàn)有數(shù)字進行比對,若迭代向量 的最小距離之和小于現(xiàn)有數(shù)字,則將現(xiàn)有數(shù)字置為迭代向量的最小距離之和,并清除最小 貢獻物體數(shù)組內與關鍵字排布集合中當前元素相對應位置上的內容,將達成該最小距離之 和的物體對元素寫入最小貢獻物體數(shù)組內與關鍵字排布集合中當前元素相對應位置,為服 務器接受前一步驟的數(shù)據(jù),并在服務器本地進行運算,進一步處理并寫入數(shù)據(jù)。
[0016] 根據(jù)本發(fā)明的另一個方面,提供了一種關鍵字查詢裝置,包括:
[0017] 一服務器,服務器連接至多個處理終端,服務器用于獲取查詢請求、驗證查詢請求 的合法性、并根據(jù)查詢請求訪問多個處理終端、向多個處理終端分配第一處理任務、接收第 一處理任務的結果并進行第二處理任務、將第二處理任務的結果輸出;
[0018] 多個處理終端,多個處理終端均連接至服務器,每個處理終端各連接至一分布式 存儲器,每個處理終端用于接收服務器分配的第一處理任務、訪問分布式存儲器中的數(shù)據(jù)、 進行第一處理任務并將第一處理任務輸出到服務器;
[0019] 多個分布式存儲器,每個分布式存儲器各連接至一處理終端,多個分布式存儲器 用于聯(lián)合存儲數(shù)據(jù)集合中的所有數(shù)據(jù)信息。
[0020] 其中,第一任務包括:依次指定關鍵字排布集合中每個元素為迭代關鍵字集合,并 將迭代關鍵字集合與查詢位置信息結合構成迭代向量;訪問數(shù)據(jù)集合中的每個物體元素, 并獲取每個物體元素到迭代向量的最小距離、以及達成該最小距離的物體元素,并將迭代 向量的最小距離存入最小距離數(shù)組內與關鍵字排布集合中當前元素相對應的位置上,并將 達
當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
宾川县| 富源县| 观塘区| 楚雄市| 乌鲁木齐县| 铁岭市| 保康县| 牙克石市| 苍梧县| 锡林郭勒盟| 府谷县| 永川市| 麻栗坡县| 辉南县| 苏州市| 沛县| 武威市| 永川市| 务川| 金川县| 包头市| 蒙自县| 肇源县| 嫩江县| 郎溪县| 嘉黎县| 台南县| 大新县| 长海县| 西吉县| 璧山县| 鄂托克旗| 吉林市| 河东区| 乌拉特前旗| 沁水县| 邯郸市| 乌兰察布市| 嵊州市| 灵丘县| 隆德县|