基于局部敏感哈希的大規(guī)模多媒體數(shù)據(jù)的高維索引方法
【專利摘要】本發(fā)明涉及一種基于局部敏感哈希的大規(guī)模多媒體數(shù)據(jù)的高維索引方法,包括以下步驟:離線索引階段,對多媒體數(shù)據(jù)提取高維特征;建立內(nèi)存索引,包括特征存儲區(qū)和哈希表存儲區(qū),將多媒體高維特征存儲到特征存儲區(qū)中,計算高維特征的局部敏感哈希向量,并將特征對應的特征編號和局部敏感哈希向量存儲在哈希表存儲區(qū)中;建立一級磁盤索引,包括特征存儲區(qū)、索引存儲區(qū)和多個哈希表存儲區(qū);建立二級磁盤索引,包括哈希桶存儲區(qū);重復上述步驟直到所有多媒體輸入全部被索引為止。在線查詢階段,對用于查詢的多媒體數(shù)據(jù)提取特征,在建立的索引基礎(chǔ)上進行查詢,返回相似的查詢結(jié)果。本發(fā)明提高了內(nèi)存和磁盤的調(diào)度性能,以及多媒體數(shù)據(jù)索引和檢索的速度。
【專利說明】基于局部敏感哈希的大規(guī)模多媒體數(shù)據(jù)的高維索引方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于多媒體索引和檢索【技術(shù)領(lǐng)域】,具體涉及一種基于局部敏感哈希的大規(guī)模多媒體數(shù)據(jù)的高維索引方法。
【背景技術(shù)】
[0002]近年來,隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展和普及,尤其是社交網(wǎng)站和圖像、視頻共享網(wǎng)站的不斷推廣和應用,網(wǎng)絡(luò)上的圖像、音頻和視頻數(shù)量呈現(xiàn)快速增長趨勢。如何快速、準確地從海量的多媒體數(shù)據(jù)中檢索到用戶所需要的信息,成為了一個亟待解決的重要問題。傳統(tǒng)基于文本的多媒體檢索方法直接利用網(wǎng)頁中的文本信息,這些文本信息未必直接描述多媒體內(nèi)容本身,因此準確性不高。基于內(nèi)容的圖像、音頻和視頻檢索可以有效地克服以上不足,逐漸受到學術(shù)界和工業(yè)界的重視。基于內(nèi)容的圖像、音頻和視頻檢索首先采用一個高維的特征向量對圖像、音頻和視頻進行描述,然后通過特征向量計算媒體之間的相似度,按照相似度的大小返回檢索結(jié)果。而隨著網(wǎng)絡(luò)中多媒體數(shù)量的急劇增加,檢索速度已成為基于內(nèi)容的圖像、音頻和視頻檢索的一大瓶頸。因此如何設(shè)計一個快速有效的索引結(jié)構(gòu),成為了大規(guī)模圖像、音頻和視頻檢索的迫切需要。
[0003]為了解決這個問題,一些方法采取了基于關(guān)鍵點特征的倒排索引,這類方法能夠保持較好的準確性。然而,一個多媒體數(shù)據(jù)中可能包含上千個關(guān)鍵點,對每一個關(guān)鍵點建立索引花費過大,因此效率較低。另一些方法利用樹形結(jié)構(gòu)來構(gòu)建多媒體數(shù)據(jù)的索引,樹形結(jié)構(gòu)的索引采用了子空間劃分的結(jié)構(gòu)設(shè)計,這類方法將多媒體數(shù)據(jù)劃分到若干子空間中,每個子空間中包含相似的多媒體數(shù)據(jù),在進行檢索時,只在某個子空間范圍內(nèi)進行檢索,從而有效提高了檢索的速度。這類方法的典型代表是于1975年Communicat1n of ACM雜志上,J.L.Bentley 等人在文獻“Multidimens1nal binary search trees used forassociative searching”中提出的KD樹,在低維特征空間中具有較好的檢索效果,但是當特征維數(shù)增大時,樹形結(jié)構(gòu)索引的效率大大降低,其效率與線性查找的時間復雜度相比幾乎沒有提高,這制約了樹形結(jié)構(gòu)的索引在多媒體檢索中的應用。
[0004]而近年來,基于Hash的索引方法得到了廣泛的關(guān)注,其中的典型代表是于1999年VLDB會議上,G1nis等人在文獻“Similarity search in high dimens1ns via hashing”中提出的局部敏感哈希(Locality Sensitive Hashing, LSH)算法。局部敏感哈希算法的原理是將特征向量相近的特征點以較大的概率索引到同一個哈希桶中,查詢時將與查詢特征向量處于相同哈希桶中的特征值都返回作為檢索的結(jié)果。局部敏感哈希是一種近似最近鄰檢索的方式,并不能保證返回與查詢特征距離最小的向量,而是以較大的概率返回與查詢特征距離較小的向量。這種方式以犧牲準確性為代價來獲取速度的提升,并且局部敏感哈希為了保證能夠返回較多與查詢相關(guān)的內(nèi)容,需要建立多個索引表,但是索引表數(shù)量的增加一方面降低了查詢的效率,另一方面也增加了內(nèi)存的開銷,導致局部敏感哈希無法支持更大規(guī)模的數(shù)據(jù)。為了解決這一問題,于2007年的VLDB會議上,Lv Qin等在文獻“Mult1-probe LSH:efficient indexing for high-dimens1nal similarity search,,中提出了多探測局部敏感哈希(Mult1-Probe LSH)算法,能夠通過少量的索引表來達到和原始局部敏感哈希算法同等的效果。多探測局部敏感哈希在索引的查詢階段,通過序列探測的方法生成多個可能的探測序列,在一個表中的多個哈希桶中進行查找。但是多探測局部敏感哈希存在的一個問題是該算法只能將索引表保存在內(nèi)存中,能夠支持的數(shù)據(jù)量較小,不能廣泛應用于目前大規(guī)模多媒體檢索任務中。另外,由于磁盤的1性能遠比內(nèi)存差,如果將索引從內(nèi)存轉(zhuǎn)移到磁盤中,又會面臨著磁盤1的性能問題。因此,如何設(shè)計支持大規(guī)模多媒體數(shù)據(jù),并具有高效1性能、高響應速度的磁盤索引結(jié)構(gòu)是多媒體搜索和管理中亟需解決的問題。
【發(fā)明內(nèi)容】
[0005]針對現(xiàn)有技術(shù)的不足,本發(fā)明提出了一種基于局部敏感哈希的大規(guī)模多媒體數(shù)據(jù)的高維索引方法,用于對多媒體高維特征進行磁盤索引,以達到對大規(guī)模多媒體數(shù)據(jù)進行快速檢索的目的。該技術(shù)充分考慮了高維特征的檢索效率、對大規(guī)模數(shù)據(jù)的支持、內(nèi)存和磁盤之間的調(diào)度性能等,能夠進一步提高多媒體的索引和檢索速度,從而有利于對大規(guī)模多媒體數(shù)據(jù)的搜索和管理。
[0006]為達到以上目的,本發(fā)明采用的技術(shù)方案如下:
[0007]本發(fā)明提出了一種基于局部敏感哈希的大規(guī)模多媒體數(shù)據(jù)的高維索引方法,用于對多媒體高維特征進行磁盤索引,包括以下步驟:
[0008](I)對需要建立索引的多媒體數(shù)據(jù)提取一種或多種高維特征;
[0009](2)基于步驟(I)中的多媒體高維特征建立內(nèi)存索引,內(nèi)存索引包括特征存儲區(qū)和哈希表存儲區(qū),并將多媒體高維特征存儲在特征存儲區(qū)中,計算多媒體高維特征的局部敏感哈希向量,將對應的特征編號和該局部敏感哈希向量存儲在哈希表存儲區(qū)中;
[0010](3)基于步驟(2)中的內(nèi)存索引建立一級磁盤索引,一級磁盤索引包括特征存儲區(qū)、索引存儲區(qū)和多個哈希表存儲區(qū);當內(nèi)存索引特征存儲區(qū)中存儲的多媒體高維特征數(shù)目達到一定值后,通過一級磁盤索引將其寫入磁盤文件中的特征存儲區(qū);當內(nèi)存索引哈希表存儲區(qū)中存儲的特征編號和局部敏感哈希向量數(shù)目達到一定值后,通過一級磁盤索引將其寫入磁盤文件中的哈希表存儲區(qū)和索引存儲區(qū);
[0011](4)基于步驟(3)中的一級磁盤索引建立二級磁盤索引,二級磁盤索引包括哈希桶存儲區(qū);主要過程如下:當一級磁盤索引哈希表存儲區(qū)哈希桶中存儲的特征編號和局部敏感哈希向量數(shù)目達到一定值后,通過二級磁盤索引將后繼需要存入該哈希桶的數(shù)據(jù)寫入哈希桶存儲區(qū);
[0012](5)重復步驟(2)、(3)和(4),直到輸入的多媒體高維特征全部被索引為止。
[0013]進一步,上述基于局部敏感哈希的多媒體高維索引方法,所述步驟(I)中,多媒體數(shù)據(jù)包括圖像、音頻或視頻等;所述提取高維特征,如對圖像提取顏色、紋理或形狀等特征,對音頻提取短時平均能量、過零率、MEL頻率倒譜系數(shù)等特征,對視頻提取關(guān)鍵點、對象或運動等特征。
[0014]進一步,上述基于局部敏感哈希的多媒體高維索引方法,所述步驟(2)中,首先將多媒體高維特征存儲到內(nèi)存索引的特征存儲區(qū)中,特征存儲區(qū)的結(jié)構(gòu)為固定大小的連續(xù)內(nèi)存區(qū)域,區(qū)域大小為:
[0015]特征存儲區(qū)大小=特征個數(shù)X特征維度X每維特征字節(jié)數(shù);
[0016]其次,計算多媒體高維特征的局部敏感哈希向量,并將對應的特征編號和局部敏感哈希向量緩存在內(nèi)存索引的哈希表存儲區(qū)中。
[0017]局部敏感哈希向量是通過一組隨機系數(shù)將高維特征映射到一條直線,使得相似特征以較高的概率在直線上相鄰,只要分割直線的參數(shù)足夠大就可以保證兩個相似高維特征局部敏感哈希向量相等,對于每個高維特征計算多個局部敏感哈希向量,以保證查詢結(jié)果的準確性。
[0018]哈希表存儲區(qū)的結(jié)構(gòu)由哈希表和動態(tài)數(shù)組組合實現(xiàn),哈希表的每個哈希槽為一個動態(tài)數(shù)組,哈希表的長度為固定值,以局部敏感哈希向量作為鍵(Key),將特征編號作為值(Value)映射到某個哈希槽對應的動態(tài)數(shù)組中。另外,使用內(nèi)存池為特征存儲區(qū)和哈希表存儲區(qū)動態(tài)分配內(nèi)存。
[0019]進一步,上述基于局部敏感哈希的多媒體高維索引方法,所述步驟(3)中,當內(nèi)存索引特征存儲區(qū)中存儲數(shù)目達到一定值后,通過一級磁盤索引將數(shù)據(jù)寫入磁盤文件中的特征存儲區(qū),特征存儲區(qū)的結(jié)構(gòu)為可增長的連續(xù)磁盤空間,區(qū)域大小為:
[0020]特征存儲區(qū)大小=特征塊個數(shù)X每塊特征個數(shù)X特征維度X每維特征字節(jié)數(shù)。
[0021]當內(nèi)存索引哈希存儲區(qū)中存儲數(shù)目達到一定值后,通過一級磁盤索引將數(shù)據(jù)寫入磁盤文件中的哈希表存儲區(qū)和索引存儲區(qū),哈希存儲區(qū)的結(jié)構(gòu)由哈希表實現(xiàn),哈希表的每個哈希槽為一個固定長度的數(shù)組。以局部敏感哈希向量作為鍵(Key),將特征編號作為值(Value)映射到某個哈希槽中。當局部敏感哈希向量不存在于該哈希槽中,將其存儲于哈希槽中;當局部敏感哈希向量存在于該哈希槽中,將其存儲于索引存儲區(qū)。
[0022]索引存儲區(qū)的結(jié)構(gòu)為類似于數(shù)組結(jié)構(gòu)的、固定長度的連續(xù)磁盤空間,區(qū)域大小為:
[0023]索引存儲區(qū)大小=預計特征總數(shù)X特征編號的字節(jié)數(shù)。
[0024]索引存儲區(qū)的腳標對應特征編號,其中,每一維存儲與其特征編號對應的局部敏感哈希向量相同的下一個特征。這樣,可將所有局部敏感哈希向量相同的特征編號全部鏈接起來。
[0025]另外,由于索引存儲區(qū)的大小為與特征總數(shù)相關(guān)的一個固定值,相對較小,可以完全放入內(nèi)存中進行讀寫,當需要時再寫入磁盤進行保存,這可以顯著地減少內(nèi)存與磁盤的交換次數(shù)。
[0026]進一步,上述基于局部敏感哈希的多媒體高維索引方法,所述步驟(4)中,當一級磁盤索引的哈希表存儲區(qū)哈希桶中存儲的特征編號和局部敏感哈希向量數(shù)目達到一定值后,建立二級磁盤索引將后繼需要存入該哈希桶的數(shù)據(jù)寫入磁盤文件,二級磁盤索引包括哈希桶存儲區(qū),哈希桶存儲區(qū)的結(jié)構(gòu)為動態(tài)的連續(xù)磁盤空間,每次一級磁盤索引哈希表存儲區(qū)中的某個哈希桶存儲滿,在哈希桶存儲區(qū)中將上次哈希桶的大小翻倍作為新的哈希桶大小,即:
[0027]新的哈希桶大小=上次哈希桶大小X 2,
[0028]從而繼續(xù)存儲該哈希桶的特征編號和局部敏感哈希向量。
[0029]本發(fā)明還提出了一種采用上述高維索引的多媒體數(shù)據(jù)檢索方法,其步驟包括:
[0030](a)采用上述方法建立基于局部敏感哈希的多媒體高維索引;
[0031](b)對用來查詢的多媒體數(shù)據(jù),提取與上述步驟(I)同樣的一種或多種高維特征,在步驟(a)建立的高維索引基礎(chǔ)上,使用多路探測技術(shù)進行查詢,返回相似的查詢結(jié)果。
[0032]進一步,上述多媒體數(shù)據(jù)檢索方法中,為了解決局部敏感哈希空間存儲率較低的問題,本發(fā)明使用了多探測局部敏感哈希結(jié)構(gòu),兩個相似數(shù)據(jù)一般會被映射到相同或相鄰的哈希槽中,因此只需要在一個哈希表中訪問多個相鄰的哈希槽就可以有效提高相似性檢索的召回率,從而達到減少哈希表數(shù)量的目的。
[0033]本發(fā)明的有益效果在于:(I)能夠?qū)Χ嗝襟w數(shù)據(jù)進行快速、實時和并發(fā)的索引和檢索;(2)內(nèi)存和磁盤調(diào)度性能較高;(3)具有動態(tài)可擴展性,能夠動態(tài)地擴展索引結(jié)構(gòu)的大小,支持更大規(guī)模的數(shù)據(jù);(4)本發(fā)明支持億級規(guī)模的高維特征數(shù)據(jù),檢索速度為百毫秒級,達到了實際應用水平。從而本發(fā)明充分發(fā)揮了多媒體高維索引在多媒體數(shù)據(jù)的搜索和管理中的重要作用。
[0034]本發(fā)明之所以具有上述發(fā)明效果,其原因在于:本發(fā)明使用了多路探測的局部敏感哈希算法,提高了索引和檢索的效率;發(fā)明了內(nèi)存索引、一級磁盤索引和二級磁盤索引等多級索引的方法,提高了內(nèi)存和磁盤的調(diào)度性能,并且提高索引和檢索的速度,從而能夠更為有效地索引和檢索大規(guī)模多媒體數(shù)據(jù)。
【專利附圖】
【附圖說明】
[0035]圖1是基于局部敏感哈希的大規(guī)模多媒體數(shù)據(jù)的高維索引方法的步驟流程圖。
[0036]圖2是一級磁盤索引的特征存儲區(qū)示意圖。
[0037]圖3是一級磁盤索引的哈希表存儲區(qū)示意圖。
[0038]圖4是一級磁盤索引的索引存儲區(qū)示意圖。
[0039]圖5是二級磁盤索引的哈希桶存儲區(qū)示意圖。
[0040]圖6是多路探測查詢的算法示意圖。
[0041]圖7是探測序列生成方法示意圖。
【具體實施方式】
[0042]下面結(jié)合附圖和具體實施例對本發(fā)明作進一步詳細的描述。
[0043]本發(fā)明的一種基于局部敏感哈希的大規(guī)模多媒體數(shù)據(jù)的高維索引方法,其流程如圖1所示,具體包含以下步驟:
[0044](I)提取多媒體數(shù)據(jù)高維特征
[0045]對需要建立索引的多媒體數(shù)據(jù)包括圖像、音頻或視頻等提取一種或多種特征,特征為高維向量,如對圖像提取顏色、紋理或形狀等特征,對音頻提取短時平均能量、過零率、MEL頻率倒譜系數(shù)等特征,對視頻提取關(guān)鍵點、對象或運動等特征。
[0046](2)建立內(nèi)存索引
[0047]在提取了圖像、視頻或音頻的特征后,我們首先在內(nèi)存中建立一個內(nèi)存索引,內(nèi)存索引中包含特征存儲區(qū)和哈希表存儲區(qū),下面分別介紹這兩個存儲區(qū)的構(gòu)造和哈希值的計算方法。
[0048]特征存儲區(qū)的結(jié)構(gòu)定義為固定大小的連續(xù)內(nèi)存區(qū)域,特征存儲區(qū)大小的計算方法如公式一所示:
[0049]公式一:MemFeaSect1nSize = NXFeaDimXDimBytes
[0050]其中MemFeaSect1nSize為特征存儲區(qū)大小,N為特征個數(shù),為了提高寫入磁盤時的效率,在N達到一定數(shù)量時統(tǒng)一映射到磁盤的存儲中,F(xiàn)eaDim為特征維度,DimBytes是每維特征的字節(jié)數(shù)。特征存儲表中保存了每一個高維特征的原始特征向量,其目的是為了在檢索時能夠利用原始特征向量在小范圍內(nèi)計算相似度并進行排序,這樣能夠獲得更加準確的查詢結(jié)果。
[0051]接著我們計算特征向量的局部敏感哈希向量。本實施例采用文獻“Datar,Mayur ,Nicole Immorlica, P1tr Indyk, and VahabS.Mirrokn1.^Locality-sensitive hashing scheme based on p-s tab Iedistribut1ns."In Proceedings of the twentieth annual symposium onComputat1nal geometry, pp.253-262.ACM, 2004..”中的方法計算高維特征的局部敏感哈希向量。該方法的基本思想是通過設(shè)計一組哈希函數(shù),使得相似的特征向量P和q滿足公式二:
[0052]公式二:P[h(p) = h (q) ] ^ P1
[0053]即哈希函數(shù)要使得相似特征的哈希值以較大的概率沖突。具體的哈希函數(shù)如公式三所示:
【權(quán)利要求】
1.一種基于局部敏感哈希的大規(guī)模多媒體數(shù)據(jù)的高維索引方法,包括以下步驟: (1)對需要建立索引的多媒體數(shù)據(jù)提取一種或多種高維特征; (2)基于步驟(I)中的多媒體高維特征建立內(nèi)存索引,內(nèi)存索引包括特征存儲區(qū)和哈希表存儲區(qū),將多媒體高維特征存儲到特征存儲區(qū)中,計算多媒體高維特征的局部敏感哈希向量,將對應的特征編號和該局部敏感哈希向量存儲在哈希表存儲區(qū)中; (3)基于步驟(2)中的內(nèi)存索引建立一級磁盤索引,一級磁盤索引包括特征存儲區(qū)、索引存儲區(qū)和多個哈希表存儲區(qū);當內(nèi)存索引中特征存儲區(qū)中存儲的多媒體高維特征數(shù)目達到一定值后,通過一級磁盤索引將其寫入磁盤文件中的特征存儲區(qū);當內(nèi)存索引哈希表存儲區(qū)中存儲的特征編號和局部敏感哈希向量數(shù)目達到一定值后,通過一級磁盤索引將其寫入磁盤文件中的哈希表存儲區(qū)和索引存儲區(qū); (4)基于步驟(3)中的一級磁盤索引建立二級磁盤索引,二級磁盤索引包括哈希桶存儲區(qū);當一級磁盤索弓I中哈希表存儲區(qū)的哈希桶中存儲的特征編號和局部敏感哈希向量數(shù)目達到一定值后,通過二級磁盤索引將后繼需要存入該哈希桶的數(shù)據(jù)寫入磁盤文件; (5)重復步驟(2)、(3)和(4),直到輸入的多媒體高維特征全部被索引為止。
2.如權(quán)利要求1所述的方法,其特征在于,所述步驟(I)中,多媒體數(shù)據(jù)包括圖像、音頻和視頻;其中,圖像提取顏色、紋理或形狀特征,音頻提取短時平均能量、過零率、MEL頻率倒譜系數(shù)特征,視頻提取關(guān)鍵點、對象或運動特征。
3.如權(quán)利要求1所述的方法,其特征在于,所述步驟(2)中,內(nèi)存索引的特征存儲區(qū)的結(jié)構(gòu)為固定大小的連續(xù)內(nèi)存區(qū)域,區(qū)域大小為: 特征存儲區(qū)大小=特征個數(shù)X特征維度X每維特征字節(jié)數(shù); 內(nèi)存索引的哈希表存儲區(qū)的結(jié)構(gòu)由哈希表和動態(tài)數(shù)組組合實現(xiàn),哈希表的每個哈希槽為一個動態(tài)數(shù)組,哈希表的長度為固定值,以局部敏感哈希向量作為鍵Key,將特征編號作為值Value映射到某個哈希槽對應的動態(tài)數(shù)組中; 另外,使用內(nèi)存池為特征存儲區(qū)和哈希表存儲區(qū)動態(tài)分配內(nèi)存。
4.如權(quán)利要求1所述的方法,其特征在于,所述步驟(3)中,一級磁盤索引的特征存儲區(qū)的結(jié)構(gòu)為可增長的連續(xù)磁盤空間,區(qū)域大小為: 特征存儲區(qū)大小=特征塊個數(shù)X每塊特征個數(shù)X特征維度X每維特征字節(jié)數(shù)。
5.如權(quán)利要求4所述的方法,其特征在于,所述步驟(3)中,一級磁盤索引的哈希存儲區(qū)的結(jié)構(gòu)由哈希表實現(xiàn),哈希表的每個哈希槽為一個固定長度的數(shù)組,以局部敏感哈希向量作為鍵Key,將特征編號作為值Value映射到某個哈希槽中;當局部敏感哈希向量不存在于該哈希槽中,將其存儲于哈希槽中;當局部敏感哈希向量存在于該哈希槽中,將其存儲于索引存儲區(qū)。
6.如權(quán)利要求5所述的方法,其特征在于,所述步驟(3)中,一級磁盤索引的索引存儲區(qū)的結(jié)構(gòu)為類似于數(shù)組結(jié)構(gòu)的、固定長度的連續(xù)磁盤空間,區(qū)域大小為: 索引存儲區(qū)大小=預計特征總數(shù)X特征編號的字節(jié)數(shù), 索引存儲區(qū)的腳標對應特征編號,其中,每一維存儲與其特征編號對應的局部敏感哈希向量相同的下一個特征,以將所有局部敏感哈希向量相同的特征編號全部鏈接起來。
7.如權(quán)利要求1所述的方法,其特征在于,所述步驟(4)中,二級磁盤索引的哈希桶存儲區(qū)的結(jié)構(gòu)為動態(tài)的連續(xù)磁盤空間,每次一級磁盤索引哈希表存儲區(qū)中的某個哈希桶存儲滿,在哈希桶存儲區(qū)中將上次哈希桶的大小翻倍作為新的哈希桶大小,即: 新的哈希桶大小=上次哈希桶大小X2, 從而繼續(xù)存儲該哈希桶的特征編號和局部敏感哈希向量。
8.一種基于局部敏感哈希的多媒體數(shù)據(jù)檢索方法,其步驟包括: (a)采用權(quán)利要求1至7中任一項所述的方法建立基于局部敏感哈希的多媒體高維索弓I ; (b)對用來查詢的多媒體數(shù)據(jù),提取與權(quán)利要求1中步驟(I)同樣的一種或多種高維特征,在步驟(a)建立的高維索引基礎(chǔ)上,使用多路探測技術(shù)進行查詢,返回相似的查詢結(jié)果O
9.如權(quán)利要求8所述的方法,其特征在于,所述步驟(b)使用多探測局部敏感哈希結(jié)構(gòu),將兩個相似數(shù)據(jù)映射到相同或相鄰的哈希槽中,以提高檢索效率和局部敏感哈??臻g存儲率。
【文檔編號】G06F17/30GK104199827SQ201410356941
【公開日】2014年12月10日 申請日期:2014年7月24日 優(yōu)先權(quán)日:2014年7月24日
【發(fā)明者】彭宇新, 彭云波, 張健 申請人:北京大學