本發(fā)明涉及數(shù)據(jù)分析,具體涉及數(shù)據(jù)查找方法、人工智能系統(tǒng)、圖像處理系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、搜索引擎、通訊系統(tǒng)、應(yīng)用。
技術(shù)背景
計(jì)算機(jī)的發(fā)展離不開數(shù)據(jù)分析,在數(shù)據(jù)分析中常常要使用到數(shù)據(jù)查找,互聯(lián)網(wǎng)相關(guān)應(yīng)用比如搜索引擎、數(shù)據(jù)檢索、數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)挖掘也要用到數(shù)據(jù)查找,人工智能系統(tǒng)也對數(shù)據(jù)挖掘存在依賴,現(xiàn)有的數(shù)據(jù)查找方法均使用搜索樹,搜索樹的最大缺點(diǎn)在于對有序數(shù)據(jù)進(jìn)行查找時(shí),必須在全部或局部按照數(shù)據(jù)順序進(jìn)行有序?qū)Ρ?,使得搜索樹具有串行流程控制的處理器高度依賴,串行流程控制的處理器價(jià)格高昂的成本很高,存在改進(jìn)空間;搜索樹雖然也存在一些并行處理的方法,但搜索樹的必須全部或局部按照順序進(jìn)行對比的如果計(jì),使得并行計(jì)算對搜索樹對的時(shí)間效率提升有限。
技術(shù)實(shí)現(xiàn)要素:
為解決技術(shù)背景中提到的問題,本發(fā)明提出了數(shù)據(jù)處理方法、人工智能系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、搜索引擎、通訊系統(tǒng)。
技術(shù)內(nèi)容1、數(shù)據(jù)查找方法,其特征在于:將需查找數(shù)據(jù)列的各個單元與被查找數(shù)據(jù)列的單元進(jìn)行對比并對對比結(jié)果進(jìn)行統(tǒng)計(jì)。
技術(shù)內(nèi)容2、數(shù)據(jù)查找方法,其特征在于:包括需查找數(shù)據(jù)列、被查找數(shù)據(jù)列、判斷矩陣、結(jié)果串;
需查找數(shù)據(jù)列的各個單元具有邏輯序號,需查找數(shù)據(jù)列中各個單元的邏輯序號的是其在需查找數(shù)據(jù)列中的順序排列位置;
被查找數(shù)據(jù)列的各個單元具有邏輯序號,被查找數(shù)據(jù)列中各個單元的邏輯序號的是其在被查找數(shù)據(jù)列中的順序排列位置;
判斷矩陣是邏輯矩陣,判斷矩陣具有兩個維度,第一維度、第二維度;
結(jié)果串是用來儲存匹配結(jié)果的數(shù)據(jù)列;
結(jié)果串的各個單元具有邏輯序號,結(jié)果串中各個單元的邏輯序號的與其在結(jié)果串的順序排列位置對應(yīng);
將需查找數(shù)據(jù)列的各個單元與被查找數(shù)據(jù)列的單元進(jìn)行對比并對對比結(jié)果進(jìn)行統(tǒng)計(jì)。
技術(shù)內(nèi)容3、如技術(shù)內(nèi)容1或2所述的數(shù)據(jù)查找方法,其特征在于:所述的對比的方法是:將對比結(jié)果填充到判斷矩陣對應(yīng)位置中,如果判斷矩陣的單元t在判斷矩陣中的第一維度坐標(biāo)為x、第二維度坐標(biāo)為y,則點(diǎn)t用于容納需查找數(shù)據(jù)列中邏輯序號為x的單元的許對比數(shù)據(jù)與被查找數(shù)據(jù)列中邏輯序號為x+y的單元所包含的需對比數(shù)據(jù)的對比結(jié)果,x+y的最大值小于或等于被查找數(shù)據(jù)列的最大邏輯序號;(需對比數(shù)據(jù)是技術(shù)人員自定義的,比如在一個結(jié)構(gòu)體數(shù)組中,只選擇某個單元的結(jié)構(gòu)體所包含的某一部分?jǐn)?shù)據(jù),比如被查找數(shù)據(jù)列的結(jié)構(gòu)體數(shù)組包含類型、數(shù)值、屬性等數(shù)據(jù),但需要查找的數(shù)據(jù)可能只是其中某一個類型)
技術(shù)內(nèi)容4、如技術(shù)內(nèi)容1或2或3所述的數(shù)據(jù)查找方法,其特征在于:統(tǒng)計(jì)的方法是:將判斷矩陣中第二維度坐標(biāo)相同的單元的值統(tǒng)計(jì)并儲存在結(jié)果串對應(yīng)位置中,方法是:如果結(jié)果串的單元r的邏輯序號(即序列位置)為y,則將判斷矩陣中第二維度坐標(biāo)為y的單元的值統(tǒng)計(jì)并存儲存在r中;所獲得的結(jié)果串的數(shù)據(jù)及查找匹配的結(jié)果。
技術(shù)內(nèi)容5、如技術(shù)內(nèi)容1或2或3或4所述的數(shù)據(jù)查找方法,其特征在于:判斷矩陣儲存的是邏輯值或整數(shù)值或浮點(diǎn)數(shù)值。
技術(shù)內(nèi)容5、如技術(shù)內(nèi)容1或2或3或4所述的數(shù)據(jù)查找方法,其特征在于:需查找數(shù)據(jù)列、被查找數(shù)據(jù)列儲存的是數(shù)值數(shù)據(jù)或矢量圖形數(shù)據(jù)或代表圖像輪廓形狀的矢量值或文本數(shù)據(jù)。技術(shù)內(nèi)容6、如技術(shù)內(nèi)容1或2或3或4或5所述的數(shù)據(jù)查找方法,其特征在于:需查找數(shù)據(jù)列、被查找數(shù)據(jù)列儲存的是包含多重信息的數(shù)據(jù)集,比如,但不限于數(shù)據(jù)存結(jié)構(gòu)體。(比如一個結(jié)構(gòu)體包括序號、姓名、學(xué)歷、家庭地址、手機(jī)號碼等)
技術(shù)內(nèi)容7、如技術(shù)內(nèi)容2-6中任意一條技術(shù)內(nèi)容所述的數(shù)據(jù)查找方法,其特征在于:邏輯序號采用數(shù)據(jù)直接標(biāo)出也可以不標(biāo)出。
技術(shù)內(nèi)容8、如技術(shù)內(nèi)容2-6中任意一條技術(shù)內(nèi)容所述的數(shù)據(jù)查找方法,其特征在于:步驟2中統(tǒng)計(jì)的方法是將各個被統(tǒng)計(jì)的值進(jìn)行數(shù)學(xué)運(yùn)算或邏輯運(yùn)算或位運(yùn)算或其他運(yùn)算。
技術(shù)內(nèi)容9、如技術(shù)內(nèi)容2-6中任意一條技術(shù)內(nèi)容所述的數(shù)據(jù)查找方法,其特征在于:步驟2中統(tǒng)計(jì)的方法是將各個被統(tǒng)計(jì)的值進(jìn)行加法運(yùn)算或減法運(yùn)算或除法運(yùn)算或乘法運(yùn)算。
技術(shù)內(nèi)容10、如技術(shù)內(nèi)容2-6中任意一條技術(shù)內(nèi)容所述的數(shù)據(jù)查找方法,其特征在于:將步驟1、2進(jìn)行合并,邊對比邊統(tǒng)計(jì)以減少中間數(shù)據(jù)對儲存空間的占用。(由于判斷矩陣與需查找數(shù)據(jù)、被查找數(shù)據(jù)直接的對應(yīng)關(guān)系是固定不變的,而矩陣與結(jié)果串直接的對應(yīng)關(guān)系也是固定不變的,所以可以依照結(jié)果串與判斷矩陣之間的對應(yīng)關(guān)系也是固定不變的,故而可以直接將對比結(jié)果統(tǒng)計(jì)到結(jié)果串里面)
人工智能系統(tǒng),其特征在于:具有技術(shù)內(nèi)容1-10中任意一條技術(shù)方案所述的技術(shù)方案。
圖像處理系統(tǒng),其特征在于:具有技術(shù)內(nèi)容1-10中任意一條技術(shù)方案所述的技術(shù)方案。
數(shù)據(jù)庫系統(tǒng),其特征在于:具有技術(shù)內(nèi)容1-10中任意一條技術(shù)方案所述的技術(shù)方案。
搜索引擎,其特征在于:具有技術(shù)內(nèi)容1-10中任意一條技術(shù)方案所述的技術(shù)方案。
通訊系統(tǒng),其特征在于:具有技術(shù)內(nèi)容1-10中任意一條技術(shù)方案所述的技術(shù)方案。
計(jì)算機(jī)應(yīng)用,其特征在于:具有技術(shù)內(nèi)容1-10中任意一條技術(shù)方案所述的技術(shù)方案。
說明:本發(fā)明在運(yùn)算時(shí)各個單元的對比是獨(dú)立的分開的數(shù)據(jù)關(guān)聯(lián)性很低,相互直接沒有順序要求,可以不按順序操作,所以本發(fā)明在能夠完美支持并行運(yùn)算(比如cuda技術(shù)、多線程技術(shù))。
本發(fā)明應(yīng)用于串行運(yùn)算時(shí)具有運(yùn)算時(shí)間不隨數(shù)據(jù)內(nèi)容變化,具有可以穩(wěn)定預(yù)測運(yùn)算時(shí)間的技術(shù)效果。
本發(fā)明可以實(shí)現(xiàn)依靠數(shù)值運(yùn)算方便,資源消耗少,收斂穩(wěn)定,運(yùn)算時(shí)間易預(yù)測。
如果需查找數(shù)據(jù)列的長度為n,結(jié)果串?dāng)?shù)列的第y個單元的數(shù)值為q,那么被查找數(shù)據(jù)列的第y個單元至y+n單元的數(shù)據(jù)與需查找數(shù)據(jù)列的匹配度為q/n;如果q/n=1則匹配度為100%。步驟1中的對比的具體手段是可以自定義的,比如采用減法、位與等,判定界限也可以自定義,比如將被對比的單元中的值相等的則判定為1,否則判定為0,又比如將判定界限如果定為在允許的范圍內(nèi)則判斷為1,否則判斷為零,又比如矢量圖形中兩個被對比的角如果差值在30度以內(nèi)則判斷為1,否則判斷為0。
步驟2中的對比的具體統(tǒng)計(jì)的具體手段是可以自定義的比如但不限于加法、減法、乘法、邏輯運(yùn)算、流程運(yùn)算。
使用本發(fā)明時(shí)應(yīng)考慮溢出問題,比如保證(x+y)的最大值小于或等于被查找數(shù)據(jù)列的最大邏輯序號。本發(fā)明提供了一種實(shí)現(xiàn)數(shù)據(jù)查找的新思路。
結(jié)果串可以是獨(dú)立的數(shù)據(jù)串也可以是儲存在判斷矩陣中的數(shù)據(jù)串,也就是說統(tǒng)計(jì)時(shí)把統(tǒng)計(jì)結(jié)果儲存在判斷矩陣中,分開寫只是為了方便理解。
附圖說明
圖1是本發(fā)明的一個實(shí)施實(shí)例的示意圖。
實(shí)施實(shí)例
實(shí)施實(shí)例1、數(shù)據(jù)查找方法,用于數(shù)據(jù)查找,其特征在于:包括需查找數(shù)據(jù)列、被查找數(shù)據(jù)列、判斷矩陣、結(jié)果串;
需查找數(shù)據(jù)列的各個單元具有邏輯序號,需查找數(shù)據(jù)列中各個單元的邏輯序號的是其在需查找數(shù)據(jù)列中的順序排列位置;
被查找數(shù)據(jù)列的各個單元具有邏輯序號,被查找數(shù)據(jù)列中各個單元的邏輯序號的是其在被查找數(shù)據(jù)列中的順序排列位置;
判斷矩陣具有第一維度、第二維度;
結(jié)果串是用來儲存匹配結(jié)果的數(shù)據(jù)列;
結(jié)果串的各個單元具有邏輯序號,結(jié)果串中各個單元的邏輯序號的是其在結(jié)果串的順序排列位置;
將需查找數(shù)據(jù)列的各個單元與被查找數(shù)據(jù)列的單元進(jìn)行對比,步驟如下:
步驟1、將對比結(jié)果填充到判斷矩陣對應(yīng)位置中,對比的方法是:如果判斷矩陣的單元t在判斷矩陣中的第一維度坐標(biāo)為x、第二維度坐標(biāo)為y,則點(diǎn)t用于容納需查找數(shù)據(jù)列中邏輯序號為x的單元的許對比數(shù)據(jù)與被查找數(shù)據(jù)列中邏輯序號為x+y的單元所包含的需對比數(shù)據(jù)的對比結(jié)果,x+y的最大值小于或等于被查找數(shù)據(jù)列的最大邏輯序號;(需對比數(shù)據(jù)是技術(shù)人員自定義的,比如在一個結(jié)構(gòu)體數(shù)組中,只選擇某個單元的結(jié)構(gòu)體所包含的某一部分?jǐn)?shù)據(jù),比如被查找數(shù)據(jù)列的結(jié)構(gòu)體數(shù)組包含類型、數(shù)值、屬性等數(shù)據(jù),但需要查找的數(shù)據(jù)可能只是類型)
步驟2、將判斷矩陣中第二維度坐標(biāo)相同的單元的值統(tǒng)計(jì)并儲存在結(jié)果串對應(yīng)位置中,方法是:如果結(jié)果串的單元r的邏輯序號為y,則將判斷矩陣中第二維度坐標(biāo)為y的單元的值統(tǒng)計(jì)并存儲存在r中;所獲得的結(jié)果串的數(shù)據(jù)及查找匹配的結(jié)果。
實(shí)施實(shí)例2、如圖1的表格所示,需要查找數(shù)據(jù)為數(shù)組a[]={a,b,c},數(shù)組a有成員數(shù)n=3,被查找數(shù)據(jù)為數(shù)組b[]={e,f,a,b,c,a},數(shù)組b成員數(shù)m=6,判斷矩陣c[][]具有兩個維度,第一維度的方向?yàn)閤軸方向,第二維度方向?yàn)閥軸方向;第一步驟、c[x][y]中填入a[x],b[x+y]的對比值,如果a[x]等于b[x+y]則c[x][y]的值為1,如果a[x]不等于b[x+y]則c[x][y]的值為0;x+y的最大值小于或等于m-n;第二步驟、將判斷矩陣的邏輯狀統(tǒng)計(jì)到結(jié)果串?dāng)?shù)組k中,統(tǒng)計(jì)的方法是將第二維度坐標(biāo)值相等的單元的值累積相乘并將結(jié)果填入到結(jié)果串?dāng)?shù)組k的第y個成員中,k[y]=g(c[0][y],c[1][y],c[2][y])=c[0][y]*c[1][y]*c[2][y];如果數(shù)組k中存在邏輯為真的單元,則代表數(shù)組b中包含有數(shù)組a的數(shù)據(jù),數(shù)組k中邏輯為真的單元的邏輯序號即匹配的索引位置;圖中的符號“!”為布爾運(yùn)算中邏輯取反的意思,如果a[x]等于b[x+y]則a[x]-b[x+y]的邏輯結(jié)果為0,對零進(jìn)行邏輯取反的結(jié)果為1,反之如果a[x]不等于b[x+y]則a[x]-b[x+y]的邏輯結(jié)果為1,對1進(jìn)行邏輯取反獲得結(jié)果為0。
實(shí)施實(shí)例3、對實(shí)施實(shí)例2進(jìn)行邏輯顛倒,進(jìn)行如下修改,第一步驟、c[x][y]中填入a[x],b[x+y]的對比值,如果a[x]等于b[x+y]則c[x][y]的值為0,如果a[x]不等于b[x+y]則c[x][y]的值為1;x+y的最大值小于或等于m-n,!!(a[x]-b[x+y]);第二步驟、將判斷矩陣的邏輯狀統(tǒng)計(jì)到結(jié)果串?dāng)?shù)組k中,統(tǒng)計(jì)的方法是將第二維度坐標(biāo)值相等的單元的值累積相乘并將結(jié)果填入到結(jié)果串?dāng)?shù)組k的第y個成員中,k[y]=g(c[0][y],c[1][y],c[2][y])=c[0][y]||c[1][y]||c[2][y];如果數(shù)組k中存在邏輯為假(即零)的單元,則代表數(shù)組b中包含有數(shù)組a的數(shù)據(jù),數(shù)組k中邏輯為假的單元的邏輯序號即匹配的索引位置。
實(shí)施實(shí)例4、為了閱讀者的理解,本實(shí)施例列舉了一個c語言實(shí)現(xiàn)數(shù)據(jù)查找的完整代碼,該代碼在微軟公司的win10操作系統(tǒng)環(huán)境下使用dev-c++5.11編譯運(yùn)行結(jié)果正確無誤。閱讀者可以將本段代碼拷貝并做出適應(yīng)性修改進(jìn)行運(yùn)用。本代碼體現(xiàn)了本發(fā)明的數(shù)據(jù)處理方法,是本發(fā)明的數(shù)據(jù)查找方法的具體表現(xiàn)。為了閱讀者的理解,本代碼沒有進(jìn)行效率優(yōu)化,但并不影響本發(fā)明作為一種新思路而具備創(chuàng)造性。
實(shí)施實(shí)例6、為了閱讀者的理解,本實(shí)施例列舉了一個c語言實(shí)現(xiàn)數(shù)據(jù)查找的完整代碼,該代碼在微軟公司的win10操作系統(tǒng)環(huán)境下使用dev-c++5.11編譯運(yùn)行結(jié)果正確無誤。閱讀者可以將本段代碼拷貝并做出適應(yīng)性修改進(jìn)行運(yùn)用。
實(shí)施實(shí)例6、為了閱讀者的理解,本實(shí)施例列舉了一個c語言實(shí)現(xiàn)數(shù)據(jù)查找的完整代碼,該代碼在微軟公司的win10操作系統(tǒng)環(huán)境下使用vs2015+cuda8.0編譯環(huán)境下編譯運(yùn)行,結(jié)果正確無誤。閱讀者可以將本段代碼拷貝直接使用或者做出適應(yīng)性修改后進(jìn)行運(yùn)用。
vs2015+cuda8.0支持中文萬國碼編碼,本代碼中部分地方采用了中文。
實(shí)施實(shí)例7、為了閱讀者的理解,本實(shí)施例列舉了一個c語言實(shí)現(xiàn)數(shù)據(jù)查找的完整代碼,該代碼在微軟公司的win10操作系統(tǒng)環(huán)境下使用dev-c++5.11編譯運(yùn)行結(jié)果正確無誤。閱讀者可以將本段代碼拷貝并做出適應(yīng)性修改進(jìn)行運(yùn)用。本實(shí)施實(shí)例將本發(fā)明的步驟1和步驟2合并了,本例運(yùn)用乘法運(yùn)算實(shí)現(xiàn)對比結(jié)果的統(tǒng)計(jì)。
實(shí)施實(shí)例8、為了閱讀者的理解,本實(shí)施例列舉了一個c語言實(shí)現(xiàn)數(shù)據(jù)查找的完整代碼,該代碼在微軟公司的win10操作系統(tǒng)環(huán)境下使用dev-c++5.11編譯運(yùn)行結(jié)果正確無誤。閱讀者可以將本段代碼拷貝并做出適應(yīng)性修改進(jìn)行運(yùn)用。本實(shí)施實(shí)例將本發(fā)明的步驟1和步驟2合并了,本例運(yùn)用加法運(yùn)算實(shí)現(xiàn)對比結(jié)果的統(tǒng)計(jì)。
實(shí)施實(shí)例9、為了閱讀者的理解,本實(shí)施例列舉了一個c語言實(shí)現(xiàn)數(shù)據(jù)查找的完整代碼,該代碼在微軟公司的win10操作系統(tǒng)環(huán)境下使用dev-c++5.11編譯運(yùn)行結(jié)果正確無誤。閱讀者可以將本段代碼拷貝并做出適應(yīng)性修改進(jìn)行運(yùn)用。本實(shí)施實(shí)例將本發(fā)明的步驟1和步驟2合并了,本例利用減法運(yùn)算實(shí)現(xiàn)對比結(jié)果的統(tǒng)計(jì)。
實(shí)施實(shí)例10、對實(shí)施實(shí)例2進(jìn)行硬件化實(shí)現(xiàn),采用邏輯門電路實(shí)現(xiàn)本發(fā)明的需查找數(shù)據(jù)列、被查找數(shù)據(jù)列、判斷矩陣、結(jié)果串;并利用專門的邏輯門硬件進(jìn)行運(yùn)算和邏輯處理。
本發(fā)明的實(shí)現(xiàn)方法多種多樣,不再贅述。