專利名稱:實(shí)時(shí)數(shù)據(jù)入庫(kù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及用于處理和檢索數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)的方法、程序和系統(tǒng),更具體地,涉及用于處理進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)和數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的數(shù)據(jù)、查詢數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)以及分析數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)的方法、程序和系統(tǒng)。
背景技術(shù):
數(shù)據(jù)倉(cāng)庫(kù)是基于計(jì)算機(jī)的數(shù)據(jù)庫(kù),設(shè)計(jì)為存儲(chǔ)記錄并對(duì)通常來(lái)自多個(gè)源的查詢進(jìn)行響應(yīng)。這些記錄與諸如個(gè)人、機(jī)構(gòu)和財(cái)產(chǎn)等的實(shí)體相對(duì)應(yīng)。每條記錄包括該實(shí)體的標(biāo)識(shí),例如個(gè)人的姓名、地址或帳戶信息。
遺憾的是,由于創(chuàng)建、維持和/或提高一定的數(shù)據(jù)質(zhì)量、完整性和性能等方面的某些局限,當(dāng)前的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的有效性不高。這些局限還增大了實(shí)施、校正和維護(hù)這些系統(tǒng)所需的風(fēng)險(xiǎn)、成本和時(shí)間。
這些問(wèn)題和局限性包括但不限于以下各項(xiàng)(a)與源自各種數(shù)據(jù)源的不同格式或沖突格式相關(guān)的難題,(b)由于在接收時(shí)丟失的信息而導(dǎo)致的不完整數(shù)據(jù),(c)由于(通常較少)誤差或拼寫(xiě)錯(cuò)誤而導(dǎo)致的反映同一實(shí)體的多條輸入記錄,(d)識(shí)別多條記錄是否反映同一實(shí)體和/或在多條記錄之間是否存在某種關(guān)聯(lián)的能力不足,(e)當(dāng)合并被確定為反映同一實(shí)體的兩條記錄或者丟棄一條記錄時(shí)發(fā)生的數(shù)據(jù)丟失,(f)當(dāng)合并后的記錄后來(lái)被確定為反映兩個(gè)獨(dú)立實(shí)體時(shí)隨后分離記錄的能力不足,(g)根據(jù)用戶定義的警告規(guī)則實(shí)時(shí)地發(fā)出警告的能力不足,(h)從利用與用于處理所接收數(shù)據(jù)的算法或轉(zhuǎn)換處理不同的算法或轉(zhuǎn)換處理進(jìn)行的查詢中獲得的不適當(dāng)?shù)慕Y(jié)果,以及(i)不能根據(jù)預(yù)定的標(biāo)準(zhǔn)(例如,在特定時(shí)間段內(nèi))來(lái)保持持續(xù)的查詢。
例如,當(dāng)接收個(gè)人的標(biāo)識(shí)并將其存儲(chǔ)在數(shù)據(jù)庫(kù)中時(shí)(a)可以以逗號(hào)分隔的格式獲得來(lái)自一個(gè)源的記錄,而以另一種數(shù)據(jù)格式接收另一個(gè)源的記錄;(b)可能會(huì)丟失來(lái)自各種記錄的數(shù)據(jù),例如電話號(hào)碼、地址或一些其它的識(shí)別信息;或者(c)由于一條記錄對(duì)應(yīng)于當(dāng)前姓名而另一條記錄對(duì)應(yīng)于婚前姓名,所以可能會(huì)無(wú)察覺(jué)地接收反映同一個(gè)人的兩條記錄。在后一情況下,系統(tǒng)可能確定應(yīng)該合并這兩條記錄或者丟棄一條記錄(該記錄可能來(lái)自于可靠性較低的源)。但是,在合并處理中,當(dāng)前系統(tǒng)通常會(huì)丟棄數(shù)據(jù),這就使系統(tǒng)不具備隨后在確定這兩條記錄反映兩個(gè)獨(dú)立實(shí)體時(shí)將兩條記錄分開(kāi)的能力。
另外,當(dāng)接收標(biāo)識(shí)并將其存儲(chǔ)在數(shù)據(jù)庫(kù)中時(shí),計(jì)算機(jī)可以在將數(shù)據(jù)加載到數(shù)據(jù)庫(kù)中之前執(zhí)行轉(zhuǎn)換和增強(qiáng)(enhancing)處理。但是,當(dāng)前系統(tǒng)的查詢工具使用很少的(如果有的話)用于接收并處理所接收數(shù)據(jù)的轉(zhuǎn)換和增強(qiáng)處理,造成這些查詢的結(jié)果不一致,因此不適當(dāng)、不充分并潛在地存在錯(cuò)誤。
類似地,當(dāng)前的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)不具有充分識(shí)別實(shí)體之間的關(guān)聯(lián)或?qū)崟r(shí)地確定這些實(shí)體是否反映同一實(shí)體的必要工具。例如,一個(gè)人可以具有與第二個(gè)人相同的地址,而第二個(gè)人可以具有與第三個(gè)人相同的電話號(hào)碼。在這種情況下,確定第一個(gè)人與第三個(gè)人存在某種關(guān)聯(lián)的可能性是很有利的,尤其是實(shí)時(shí)確定。
此外,當(dāng)前數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)在識(shí)別實(shí)體間的不適當(dāng)或沖突關(guān)系以及根據(jù)用戶定義的警告規(guī)則實(shí)時(shí)地提供警告方面的能力有限。這種有限的能力出于幾個(gè)因素,包括但不限于不能有效地識(shí)別如上所述的關(guān)聯(lián)性。
另外,當(dāng)前的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)不能首先轉(zhuǎn)換和增強(qiáng)記錄,并且隨后在預(yù)定的時(shí)間中保持持續(xù)的查詢。在各種情況(包括但不限于罪犯調(diào)查中識(shí)別人名的情況)下,持續(xù)查詢是很有利的。識(shí)別任何與該人相符的匹配的查詢可能最初找不到結(jié)果并且實(shí)際上在當(dāng)前系統(tǒng)中會(huì)拋棄已查詢到的數(shù)據(jù)。但是,以與所接收數(shù)據(jù)(其中已查詢到的數(shù)據(jù)可以用于匹配其它接收數(shù)據(jù)或查詢,并可提供更好的結(jié)果)相同的方式加載查詢是很有利的。
因此,當(dāng)前數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的任何或所有問(wèn)題和局限性(不管在此是否區(qū)分)都降低了數(shù)據(jù)倉(cāng)庫(kù)的準(zhǔn)確性、可靠性和及時(shí)性,并極大地降低了性能。實(shí)際上,這些問(wèn)題可能會(huì)導(dǎo)致不適當(dāng)?shù)慕Y(jié)果和基于這些結(jié)果的不正確判斷。
提供本發(fā)明以解決這些和其它問(wèn)題。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種處理進(jìn)入數(shù)據(jù)庫(kù)的數(shù)據(jù)和數(shù)據(jù)庫(kù)中的數(shù)據(jù)的方法、程序和系統(tǒng)。該方法優(yōu)選地包括以下步驟(a)接收多個(gè)實(shí)體的數(shù)據(jù),(b)利用一算法處理所接收的數(shù)據(jù),(c)在數(shù)據(jù)庫(kù)中存儲(chǔ)經(jīng)處理的數(shù)據(jù),(d)接收用于檢索存儲(chǔ)在數(shù)據(jù)庫(kù)中的數(shù)據(jù)的數(shù)據(jù)查詢,以及(e)利用相同的算法處理這些查詢。
所述數(shù)據(jù)包括具有表示一個(gè)或更多個(gè)實(shí)體的一個(gè)或更多個(gè)標(biāo)識(shí)的一個(gè)或更多條記錄。這些實(shí)體可以是個(gè)人、財(cái)產(chǎn)、機(jī)構(gòu)、蛋白質(zhì)或者能夠由標(biāo)識(shí)數(shù)據(jù)表示的其它事物。
所述算法包括接收已轉(zhuǎn)換成標(biāo)準(zhǔn)消息格式的數(shù)據(jù),并保留這些標(biāo)識(shí)的屬性,例如源系統(tǒng)、源系統(tǒng)的唯一標(biāo)識(shí)值、查詢系統(tǒng)和/或用戶。
算法處理包括在存儲(chǔ)到數(shù)據(jù)庫(kù)中或在數(shù)據(jù)庫(kù)中進(jìn)行查詢之前分析數(shù)據(jù),其中該分析步驟可以包括(a)將一個(gè)或更多個(gè)標(biāo)識(shí)與用戶定義的標(biāo)準(zhǔn)或數(shù)據(jù)庫(kù)、列表或其它電子格式中的一個(gè)或更多個(gè)數(shù)據(jù)集進(jìn)行比較,(b)根據(jù)用戶定義的標(biāo)準(zhǔn)對(duì)標(biāo)識(shí)進(jìn)行格式化,(c)在進(jìn)行存儲(chǔ)或查詢之前,通過(guò)在其它數(shù)據(jù)庫(kù)(這些數(shù)據(jù)庫(kù)可以具有與第一數(shù)據(jù)庫(kù)相同的算法并以級(jí)聯(lián)的方式繼續(xù)查找)或列表中的一個(gè)或多個(gè)數(shù)據(jù)集中查詢附加標(biāo)識(shí),以使用任何附加標(biāo)識(shí)來(lái)補(bǔ)充所接收的數(shù)據(jù),由此來(lái)增強(qiáng)數(shù)據(jù),(d)生成標(biāo)識(shí)的散列鍵(hash key),以及(d)根據(jù)用戶定義的標(biāo)準(zhǔn)(例如規(guī)定的時(shí)間段)存儲(chǔ)處理后的查詢。
進(jìn)一步的,該方法、程序和系統(tǒng)包括(a)利用一算法來(lái)處理數(shù)據(jù)并匹配記錄,其中該算法處理包括(i)從數(shù)據(jù)庫(kù)中檢索一組記錄,該組記錄包括與所接收數(shù)據(jù)中的標(biāo)識(shí)相似的標(biāo)識(shí),(ii)對(duì)所檢索到的記錄組進(jìn)行分析以匹配所接收的數(shù)據(jù),(iii)將所接收的數(shù)據(jù)與被確定為反映同一實(shí)體的檢索記錄進(jìn)行匹配,(iv)分析是否有任何新的標(biāo)識(shí)被添加到任何匹配的記錄中,(v)重新查找所檢索到的記錄組的其它記錄以與任何匹配記錄進(jìn)行匹配,以及(b)在數(shù)據(jù)庫(kù)中存儲(chǔ)匹配記錄。另外,該算法可以包括(a)從數(shù)據(jù)庫(kù)中檢索一組附加記錄,該組附加記錄包括與匹配記錄中的標(biāo)識(shí)相似的標(biāo)識(shí),(b)重復(fù)這些步驟檢索記錄、匹配分析、匹配相同的實(shí)體記錄、分析新的標(biāo)識(shí)、重新查找所檢索到的記錄直到找不到其它匹配為止,以及(c)將持續(xù)鍵(persistent key)分配給這些記錄??梢苑峙鼗?qū)崟r(shí)地執(zhí)行這些處理。
進(jìn)一步地,該方法、程序和系統(tǒng)包括確定特定的標(biāo)識(shí)是多個(gè)實(shí)體之間公共的還是某一實(shí)體特有的,并且如果用于匹配這些記錄的特定標(biāo)識(shí)后來(lái)被確定為是多個(gè)實(shí)體之間公共的而不是某一實(shí)體特有的,則分離先前匹配的記錄。這種確定和分離步驟可以實(shí)時(shí)地或分批地執(zhí)行。該確定和分離步驟可以包括根據(jù)被確定為在多個(gè)實(shí)體之間是公共的而不是某一實(shí)體特有的標(biāo)識(shí)而停止任何另外的匹配,以及重新處理任何所分離的記錄。
進(jìn)一步地,將所接收的數(shù)據(jù)與至少一個(gè)其它先前存儲(chǔ)的記錄進(jìn)行比較,以確定多個(gè)實(shí)體之間的關(guān)聯(lián)性,并且為存在關(guān)聯(lián)的每?jī)蓚€(gè)實(shí)體創(chuàng)建一條關(guān)聯(lián)記錄。該關(guān)聯(lián)記錄可以包括一個(gè)或多個(gè)置信度指示符,用于表示兩個(gè)實(shí)體之間關(guān)聯(lián)的可能性或者兩個(gè)實(shí)體相同的可能性。關(guān)聯(lián)記錄也可以對(duì)于接收數(shù)據(jù)中包含的各個(gè)實(shí)體具有參考作用,或者是指定的。對(duì)這些關(guān)聯(lián)記錄進(jìn)行分析以根據(jù)用戶定義的標(biāo)準(zhǔn)來(lái)確定是否存在任何先前未知的關(guān)聯(lián)記錄。這些關(guān)聯(lián)記錄反映了第一分離程度,其可分析為僅包括那些符合預(yù)定標(biāo)準(zhǔn)的記錄,例如,分離程度測(cè)試的最大次數(shù)或者最小關(guān)聯(lián)程度和/或相似性置信度指示符。可以根據(jù)用戶定義的警告規(guī)則發(fā)出識(shí)別關(guān)聯(lián)記錄組的警告??梢酝ㄟ^(guò)各種電子通信裝置(例如電子郵件消息、電話、個(gè)人數(shù)字助理或傳呼機(jī)消息)來(lái)傳送該警告。
進(jìn)一步地,該方法包括(a)在一個(gè)或更多個(gè)數(shù)據(jù)庫(kù)中復(fù)制這些關(guān)聯(lián)記錄,(b)根據(jù)工作負(fù)荷標(biāo)準(zhǔn)將所接收的數(shù)據(jù)分配給一個(gè)或更多個(gè)附加數(shù)據(jù)庫(kù)以進(jìn)行分析,以及(c)從這些附加數(shù)據(jù)庫(kù)中發(fā)出任何警告。
進(jìn)一步地,該方法和系統(tǒng)包括將所存儲(chǔ)的數(shù)據(jù)傳送到另一個(gè)數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)使用與第一數(shù)據(jù)庫(kù)相同的算法。可以實(shí)時(shí)地或分批地執(zhí)行處理和傳送步驟。
下面將參照附圖和說(shuō)明書(shū)對(duì)本發(fā)明的這些和其它方面與特征進(jìn)行說(shuō)明。
圖1是根據(jù)本發(fā)明的系統(tǒng)的方框圖;圖2是在圖1所示系統(tǒng)模塊中處理數(shù)據(jù)的流程圖;圖3是圖2所示的處理算法模塊的流程圖;以及圖4是圖3所示的用于分析所存儲(chǔ)的已分析記錄的模塊的流程圖。
具體實(shí)施例方式
盡管本發(fā)明易于以許多不同的形式實(shí)施,但在附圖中所示并將在此詳細(xì)說(shuō)明的是本發(fā)明的具體實(shí)施例,應(yīng)該理解的是,本公開(kāi)被認(rèn)為是本發(fā)明原理的范例,而并不旨在將本發(fā)明限定為所示的具體實(shí)施例。
在圖1-4中示出了用于處理進(jìn)入數(shù)據(jù)庫(kù)的數(shù)據(jù)和數(shù)據(jù)庫(kù)中的數(shù)據(jù)以及用于檢索處理后的數(shù)據(jù)的數(shù)據(jù)處理系統(tǒng)10。系統(tǒng)10包括至少一個(gè)具有處理器14和存儲(chǔ)器16的傳統(tǒng)計(jì)算機(jī)12。存儲(chǔ)器16用于存儲(chǔ)可執(zhí)行軟件以操作系統(tǒng)10,以及用于存儲(chǔ)數(shù)據(jù)庫(kù)和隨機(jī)存取存儲(chǔ)器中的數(shù)據(jù)。但是,可以將軟件存儲(chǔ)或設(shè)置在任何其它計(jì)算機(jī)可讀介質(zhì)(例如CD、DVD或軟盤(pán))上。計(jì)算機(jī)12可以從多個(gè)源181-18n接收輸入。
數(shù)據(jù)包括具有一個(gè)或更多個(gè)標(biāo)識(shí)的一個(gè)或更多條記錄,該一個(gè)或更多個(gè)標(biāo)識(shí)表示一個(gè)或更多個(gè)實(shí)體。這些實(shí)體可以是個(gè)人、機(jī)構(gòu)、財(cái)產(chǎn)、蛋白質(zhì)、化學(xué)物質(zhì)或有機(jī)化合物、生物統(tǒng)計(jì)或原子結(jié)構(gòu)或者可以由標(biāo)識(shí)數(shù)據(jù)表示的其它事物。個(gè)人型實(shí)體的標(biāo)識(shí)可以包括個(gè)人姓名、(一個(gè)或多個(gè))地址、(一個(gè)或多個(gè))電話號(hào)碼、(一個(gè)或多個(gè))信用卡號(hào)、社會(huì)保險(xiǎn)號(hào)、職業(yè)信息、飛行???frequent flyer)或其它忠誠(chéng)計(jì)劃(loyaltyprogram)或者帳戶信息。一般特有標(biāo)識(shí)是特定實(shí)體所特有的那些標(biāo)識(shí),例如個(gè)人實(shí)體的社會(huì)保險(xiǎn)號(hào)。
系統(tǒng)10從多個(gè)源181-18n接收數(shù)據(jù),并利用算法22處理所接收的數(shù)據(jù)20。該算法存儲(chǔ)在存儲(chǔ)器16中,并由處理器14進(jìn)行處理或執(zhí)行。
接收數(shù)據(jù)20,包括但不限于接收數(shù)據(jù)的屬性(例如,源系統(tǒng)標(biāo)識(shí)),可以類似地以多種數(shù)據(jù)格式進(jìn)行接收。在由算法22進(jìn)行處理之前,將接收數(shù)據(jù)20轉(zhuǎn)換成標(biāo)準(zhǔn)化消息格式24,例如通用消息格式(UniversalMessage Format)。
此后,如圖3所示,算法22接收標(biāo)準(zhǔn)化數(shù)據(jù)26并在通過(guò)以下步驟在數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)或查詢之前分析28所接收的數(shù)據(jù)26(a)將所接收的數(shù)據(jù)26與用戶定義的標(biāo)準(zhǔn)或規(guī)則進(jìn)行比較以執(zhí)行多個(gè)功能,這些功能包括但不限于(i)名稱標(biāo)準(zhǔn)化30(例如,對(duì)照根名(root name)列表),(ii)地址規(guī)范化(hygiene)32(例如,對(duì)照郵政編碼),(iii)字段測(cè)試或轉(zhuǎn)換34(例如,比較性別字段以確定M/F或者將Male轉(zhuǎn)換成M等),(iv)用戶定義的格式化36(例如,以999-99-9999格式對(duì)所有的社會(huì)保險(xiǎn)號(hào)進(jìn)行格式化),(b)通過(guò)使系統(tǒng)10訪問(wèn)一個(gè)或更多個(gè)數(shù)據(jù)庫(kù)40(數(shù)據(jù)庫(kù)40可以包括與第一數(shù)據(jù)庫(kù)相同的算法,由此使該系統(tǒng)以級(jí)聯(lián)的方式訪問(wèn)附加數(shù)據(jù)庫(kù))來(lái)增強(qiáng)數(shù)據(jù)38,以查找可以對(duì)所接收的數(shù)據(jù)26進(jìn)行補(bǔ)充42的附加信息(該信息可以作為接收數(shù)據(jù)20提交),以及(c)創(chuàng)建分析后的數(shù)據(jù)44的散列鍵??蓪⑷魏涡碌?、修改后的或增強(qiáng)后的數(shù)據(jù)存儲(chǔ)在新創(chuàng)建的字段中以保持原始數(shù)據(jù)的完整性。例如,如果以標(biāo)準(zhǔn)化格式26接收到姓名“Bobby Smith”,則可以對(duì)照根名列表30將姓名“Bobby”標(biāo)準(zhǔn)化成姓名“Robert”,并存儲(chǔ)在新創(chuàng)建的標(biāo)準(zhǔn)姓名字段中。另外,如果接收到Bobby Smith的姓名和地址26,則系統(tǒng)10可訪問(wèn)傳統(tǒng)的基于因特網(wǎng)的人員查找數(shù)據(jù)庫(kù)40,以獲取Bobby Smith的電話號(hào)碼,隨后可以根據(jù)用戶定義的標(biāo)準(zhǔn)36以標(biāo)準(zhǔn)方式對(duì)該電話號(hào)碼進(jìn)行格式化。此外,可以將地址字段對(duì)照地址列表32,以將文字“Street”添加到標(biāo)準(zhǔn)化地址的結(jié)尾處。然后根據(jù)增強(qiáng)后的數(shù)據(jù)創(chuàng)建44散列鍵并將其存儲(chǔ)在新創(chuàng)建的字段中。
系統(tǒng)10還從多個(gè)源181-18n接收查詢46,并利用相同的算法22分析和處理所接收的查詢46。例如,如果接收到對(duì)“Bobby Smith”的查詢46,則將所接收的姓名“Bobby”標(biāo)準(zhǔn)化為姓名“Robert”的相同算法22也將查詢姓名“Bobby”標(biāo)準(zhǔn)化為查詢姓名“Robert”。實(shí)際上,系統(tǒng)10加載并存儲(chǔ)與接收數(shù)據(jù)20相同的接收查詢46,保持查詢系統(tǒng)和用戶的全部屬性。因此,當(dāng)系統(tǒng)10處理接收查詢46時(shí),算法22可以搜索其它數(shù)據(jù)庫(kù)40(例如,公共記錄數(shù)據(jù)庫(kù)),以查找丟失的信息。查詢結(jié)果94可以比精確匹配更寬泛,并且可以包括多個(gè)關(guān)聯(lián)匹配。例如,如果查詢的是“Bobby Smith”,則查詢結(jié)果94可以包括那些曾使用過(guò)Bobby Smith的信用卡或者曾居住在Bobby Smith的地址的人的記錄。
算法22還在接收到任何接收數(shù)據(jù)26時(shí)執(zhí)行以下的功能(a)確定在數(shù)據(jù)庫(kù)中是否存在與對(duì)應(yīng)于該接收數(shù)據(jù)的實(shí)體相匹配的現(xiàn)有記錄,以及(b)如果存在,則將所接收的數(shù)據(jù)與該現(xiàn)有記錄相匹配。例如,算法從數(shù)據(jù)庫(kù)中檢索一組記錄48(該組記錄包括與所接收的數(shù)據(jù)中的標(biāo)識(shí)相似的標(biāo)識(shí))來(lái)找到可能的候選項(xiàng),并根據(jù)一般特有標(biāo)識(shí)52對(duì)所檢索到的記錄組進(jìn)行分析,以找出標(biāo)識(shí)了與接收數(shù)據(jù)相對(duì)應(yīng)的已存儲(chǔ)記錄的匹配50。如果識(shí)別到匹配54,則該算法分析該匹配記錄是否包含任何新的或先前未知的標(biāo)識(shí)56。如果存在新的或先前未知的標(biāo)識(shí)56,則算法22將分析該新的或先前未知的標(biāo)識(shí)58,并根據(jù)該匹配記錄中的新的或先前未知的標(biāo)識(shí)來(lái)添加或更新候選列表/關(guān)聯(lián)記錄70,并確定是否存在任何另外的匹配50。重復(fù)該處理直到找不到其它匹配為止。然后該匹配處理為所有的匹配記錄60分配相同的持續(xù)鍵。另外,如果對(duì)于任何記錄都沒(méi)有找到匹配,則為不匹配記錄分配其自己的持續(xù)鍵62。這些記錄保留了數(shù)據(jù)的全部屬性并且匹配處理不會(huì)由于合并、清除或刪除功能而丟失任何數(shù)據(jù)。
例如,如果記錄#1具有個(gè)人姓名、電話號(hào)碼和地址,而記錄#2具有相同的姓名和信用卡號(hào)。不知道他們是否是同一個(gè)人,所以必須將這兩條記錄保持分離。然后接收到記錄#3的數(shù)據(jù),包括個(gè)人姓名(與記錄#1相同)、地址(與記錄#1相同)、電話號(hào)碼(與記錄#1相同)和信用卡號(hào)。因?yàn)?1和#3的姓名、電話號(hào)碼和地址匹配,所以系統(tǒng)10可以確定#1和#3描述的是同一個(gè)人,所以該算法將#1的數(shù)據(jù)與#3的數(shù)據(jù)進(jìn)行匹配。隨后系統(tǒng)10重新運(yùn)行該算法,將匹配記錄#1與候選列表的其它記錄或包括與該匹配記錄相似的標(biāo)識(shí)的附加記錄進(jìn)行比較。因?yàn)槠ヅ溆涗?1的姓名和信用卡號(hào)碼與記錄#2的姓名和信用卡號(hào)碼匹配,所以這兩條記錄也匹配。然后再次將匹配記錄與候選列表或檢索到的附加記錄進(jìn)行比較以查找匹配54,直到不能獲得匹配為止。
有時(shí),系統(tǒng)10可能確定兩條記錄是錯(cuò)誤地匹配。例如,社會(huì)保險(xiǎn)號(hào)被認(rèn)為是個(gè)人的一般特有標(biāo)識(shí),所以往往根據(jù)相同的社會(huì)保險(xiǎn)號(hào)來(lái)匹配記錄。但是,在某些情況下,該編號(hào)可能隨后被確定為是多個(gè)實(shí)體之間公共的而不是某一實(shí)體特有的。例如,考慮一數(shù)據(jù)輸入操作,其具有作為必需字段的社會(huì)保險(xiǎn)號(hào)的記錄字段,但不知道這些個(gè)人的社會(huì)保險(xiǎn)號(hào)的數(shù)據(jù)輸入操作員僅僅為每個(gè)人輸入號(hào)碼“123-45-6789”。
在這種情況下,社會(huì)保險(xiǎn)號(hào)在這些個(gè)人型實(shí)體之間將是公共的,并且不再是這些個(gè)人的一般特有標(biāo)識(shí)。因此(a)將當(dāng)前已知的公共標(biāo)識(shí)添加到公共標(biāo)識(shí)的列表中,并且所有進(jìn)一步的處理將不嘗試檢索候選列表的記錄或者不根據(jù)該已知的公共標(biāo)識(shí)來(lái)生成關(guān)聯(lián)記錄70,由此停止所有進(jìn)一步的匹配64,并且(b)必須分離所有基于該錯(cuò)誤的社會(huì)保險(xiǎn)號(hào)匹配的記錄以反映匹配前的數(shù)據(jù),由此要求先前的數(shù)據(jù)沒(méi)有丟失。為了實(shí)現(xiàn)后一目的,系統(tǒng)10根據(jù)數(shù)據(jù)的全部屬性,將根據(jù)錯(cuò)誤假設(shè)66產(chǎn)生的任何匹配分離為該錯(cuò)誤假設(shè)之前的點(diǎn),而不丟失任何數(shù)據(jù)。因此,如果“Bobby Smith”(其已經(jīng)標(biāo)準(zhǔn)化成“Robert Smith”)的記錄#1已經(jīng)與“Robert Smith”的記錄#2匹配,并且隨后確定這是兩個(gè)不同的個(gè)人,并且需要將它們分離為原始的記錄#1和2,則該算法將認(rèn)識(shí)到記錄#1的標(biāo)準(zhǔn)化“Robert Smith”是“Bobby”。此外,可以實(shí)時(shí)地或分批地執(zhí)行確定和分離步驟。而且,可以重新提交分離后的記錄作為要在系統(tǒng)中進(jìn)行處理的新的接收數(shù)據(jù)。
存在需要對(duì)關(guān)聯(lián)(甚至是不太明顯的關(guān)聯(lián))進(jìn)行評(píng)估68的情況。例如,個(gè)人#1和#2可以分別與機(jī)構(gòu)#3存在關(guān)聯(lián)。因此可能(很有可能)在個(gè)人#1和#2之間存在關(guān)聯(lián)。該關(guān)聯(lián)可擴(kuò)展到多個(gè)分離程度。因此,系統(tǒng)10將所有的接收數(shù)據(jù)與存儲(chǔ)數(shù)據(jù)中的所有記錄進(jìn)行比較,并為各個(gè)實(shí)體之間存在某種關(guān)聯(lián)的每一對(duì)記錄創(chuàng)建關(guān)聯(lián)記錄70。該關(guān)聯(lián)記錄70可以包括關(guān)聯(lián)類型(例如,父親、共事者)、置信度指示符(該置信度指示符是表示兩個(gè)實(shí)體的關(guān)聯(lián)強(qiáng)度的分值)72和所分配的持續(xù)鍵60或62。例如,置信度指示符72可以包括關(guān)聯(lián)分值和相似性分值。關(guān)聯(lián)分值是例如在1到10之間的指示符,表示個(gè)人#1和個(gè)人#2之間存在關(guān)聯(lián)的可能性。相似性分值也是例如在1到10之間的指示符,表示個(gè)人#1與個(gè)人#2是同一個(gè)人。在以上所述的匹配處理的過(guò)程中可以識(shí)別置信度指示符72。
系統(tǒng)10還對(duì)接收數(shù)據(jù)20和查詢46進(jìn)行分析,以根據(jù)具有大于預(yù)定值的置信度指示符的關(guān)聯(lián)記錄和/或小于預(yù)定數(shù)值的分離程度的關(guān)聯(lián)記錄來(lái)確定是否存在滿足用戶定義警告規(guī)則74的標(biāo)準(zhǔn)的情況(例如,兩個(gè)實(shí)體間的不適當(dāng)關(guān)聯(lián)或者特定形式的行為)。例如,系統(tǒng)10可以包括欺騙性信用卡的列表,該列表可以用于確定任何接收數(shù)據(jù)或查詢是否包含欺騙性信用卡號(hào)列表中的信用卡號(hào)。另外,用戶定義警告規(guī)則74可以對(duì)接收數(shù)據(jù)和查詢進(jìn)行報(bào)告。例如,在輸入新經(jīng)銷商的數(shù)據(jù)時(shí),如果確定該新經(jīng)銷商與當(dāng)前雇員具有相同的地址,則可能存在一個(gè)警告規(guī)則,表示雇主可能想要調(diào)查的經(jīng)銷商和雇員之間存在關(guān)聯(lián)。一旦確定要觸發(fā)用戶定義警告規(guī)則的情況,系統(tǒng)10就發(fā)出警告74,該警告可通過(guò)各種媒介(例如,通過(guò)電子郵件的消息)傳送,或傳送到便攜通信裝置,例如字符數(shù)字傳呼機(jī)、個(gè)人數(shù)字助理或者電話。
例如,根據(jù)用戶定義的警告規(guī)則,對(duì)于具有大于7的關(guān)聯(lián)可能性置信度指示符76的所有記錄,對(duì)于最大6級(jí)的分離程度78,系統(tǒng)10將(a)從個(gè)人#1開(kāi)始,(b)查找與#1相關(guān)的具有大于7的置信度指示符76的所有其它個(gè)人80,(c)分析所有的第一級(jí)分離個(gè)人80,并確定置信度指示符84大于7的與第一級(jí)分離個(gè)人80相關(guān)的所有個(gè)人82,并且(d)重復(fù)該處理直到滿足這6級(jí)分離參數(shù)為止78。該系統(tǒng)將以電子方式向相關(guān)個(gè)人或分離系統(tǒng)發(fā)送警告74(該警告可以包括根據(jù)用戶定義標(biāo)準(zhǔn)獲得的所有記錄),以使得能夠進(jìn)行進(jìn)一步的操作。
另外,關(guān)聯(lián)記錄70可以在幾個(gè)數(shù)據(jù)庫(kù)上進(jìn)行復(fù)制。當(dāng)接收到接收數(shù)據(jù)20時(shí),系統(tǒng)將對(duì)各個(gè)其它數(shù)據(jù)庫(kù)的工作負(fù)荷特性進(jìn)行系統(tǒng)評(píng)估,并將匹配的/相關(guān)的/已分析記錄分配給最可能有效分析所存儲(chǔ)的已分析記錄68的數(shù)據(jù)庫(kù)。然后根據(jù)源自其它數(shù)據(jù)庫(kù)的任何結(jié)果發(fā)出任何警告74。
最后,可以以實(shí)時(shí)或分批處理的方式,根據(jù)可利用相同算法92的級(jí)聯(lián)數(shù)據(jù)庫(kù)公布列表86將處理后的數(shù)據(jù)傳送88給附加數(shù)據(jù)庫(kù)。通過(guò)這種方式,隨后可將所傳送的數(shù)據(jù)88用于與附加數(shù)據(jù)庫(kù)和任何后續(xù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)(可包括不同的數(shù)據(jù))進(jìn)行匹配,以識(shí)別這些數(shù)據(jù)的關(guān)聯(lián)、匹配或處理。例如,可以將根據(jù)本地?cái)?shù)據(jù)庫(kù)中的置信度指示符的匹配記錄傳送88到區(qū)域數(shù)據(jù)庫(kù),以與利用相同算法92的數(shù)據(jù)進(jìn)行比較和匹配。此后,可以將從該區(qū)域數(shù)據(jù)庫(kù)獲得的處理數(shù)據(jù)傳送88到國(guó)家局(nationaloffice)。通過(guò)在各個(gè)步驟中合并所處理的數(shù)據(jù),尤其是實(shí)時(shí)地合并,機(jī)構(gòu)或系統(tǒng)用戶將能夠確定不適當(dāng)?shù)幕驔_突的數(shù)據(jù),以提示進(jìn)一步的操作。
可使用傳統(tǒng)的軟件代碼來(lái)實(shí)現(xiàn)上述方法、程序和系統(tǒng)的多個(gè)功能方面。該代碼可以設(shè)置在任何計(jì)算機(jī)可讀介質(zhì)上,以由單個(gè)計(jì)算機(jī)或諸如互聯(lián)網(wǎng)的分布式計(jì)算機(jī)網(wǎng)絡(luò)使用。
通過(guò)以上說(shuō)明,可以知道在不背離本發(fā)明的精神和范圍的情況下可以進(jìn)行多種變化和修改。應(yīng)該理解,對(duì)于在此所述的具體設(shè)備并不旨在限定的目的,也不應(yīng)推斷為限定的目的。顯然,所附權(quán)利要求涵蓋了落入其范圍內(nèi)的所有這樣的修改。
權(quán)利要求
1.一種處理數(shù)據(jù)的方法,該方法包括以下步驟接收包括具有至少一個(gè)標(biāo)識(shí)的至少一條記錄的數(shù)據(jù),各條記錄表示多個(gè)實(shí)體中的至少一個(gè)實(shí)體;利用一算法來(lái)處理所接收的數(shù)據(jù);在數(shù)據(jù)庫(kù)中存儲(chǔ)處理后的數(shù)據(jù);接收用于檢索所述數(shù)據(jù)庫(kù)中存儲(chǔ)的數(shù)據(jù)的至少一部分的數(shù)據(jù)查詢;以及利用所述算法處理所述查詢。
2.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是個(gè)人。
3.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是個(gè)人財(cái)產(chǎn)。
4.根據(jù)權(quán)利要求3所述的方法,其中所述個(gè)人財(cái)產(chǎn)是車輛。
5.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是不動(dòng)產(chǎn)。
6.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是機(jī)構(gòu)。
7.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是化學(xué)化合物。
8.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是有機(jī)化合物。
9.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是蛋白質(zhì)。
10.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是生物結(jié)構(gòu)。
11.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是生物統(tǒng)計(jì)值。
12.根據(jù)權(quán)利要求1所述的方法,其中所述實(shí)體是原子結(jié)構(gòu)。
13.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括在利用算法處理所述接收數(shù)據(jù)之前將接收數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)化消息格式的步驟。
14.根據(jù)權(quán)利要求1所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括保留各條記錄的屬性。
15.根據(jù)權(quán)利要求14所述的方法,其中保留各條記錄的屬性的步驟包括保留以下識(shí)別信息提供各條記錄的源系統(tǒng),以及表示所述源系統(tǒng)中的各條記錄的唯一標(biāo)識(shí)。
16.根據(jù)權(quán)利要求14所述的方法,其中保留各條記錄的屬性的步驟包括保留查詢系統(tǒng)和特定用戶的識(shí)別信息。
17.根據(jù)權(quán)利要求1所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前對(duì)接收數(shù)據(jù)進(jìn)行分析。
18.根據(jù)權(quán)利要求17所述的方法,其中在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前對(duì)接收數(shù)據(jù)進(jìn)行分析的步驟包括將至少一個(gè)所述標(biāo)識(shí)與以下之一進(jìn)行比較用戶定義的標(biāo)準(zhǔn),以及次級(jí)數(shù)據(jù)庫(kù)和列表之一中的至少一個(gè)數(shù)據(jù)集。
19.根據(jù)權(quán)利要求18所述的方法,其中所比較的標(biāo)識(shí)是所述多個(gè)實(shí)體中的至少一個(gè)實(shí)體的名稱,并且所述數(shù)據(jù)集位于名稱根列表中。
20.根據(jù)權(quán)利要求18所述的方法,其中所比較的標(biāo)識(shí)是所述多個(gè)實(shí)體中的至少一個(gè)實(shí)體的地址,并且所述數(shù)據(jù)集位于地址列表中。
21.根據(jù)權(quán)利要求18所述的方法,其中將所述多個(gè)標(biāo)識(shí)中的至少一個(gè)標(biāo)識(shí)與用戶定義的標(biāo)準(zhǔn)進(jìn)行比較的步驟包括根據(jù)所述用戶定義的標(biāo)準(zhǔn)對(duì)至少一個(gè)標(biāo)識(shí)進(jìn)行格式化。
22.根據(jù)權(quán)利要求18所述的方法,其中在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前對(duì)接收數(shù)據(jù)進(jìn)行分析的步驟包括對(duì)所述接收數(shù)據(jù)進(jìn)行增強(qiáng)。
23.根據(jù)權(quán)利要求22所述的方法,其中對(duì)接收數(shù)據(jù)進(jìn)行增強(qiáng)的步驟包括對(duì)所述次級(jí)數(shù)據(jù)庫(kù)和列表之一中的至少一個(gè)數(shù)據(jù)集進(jìn)行查詢以獲得所述接收數(shù)據(jù)的附加標(biāo)識(shí),以及使用所述附加標(biāo)識(shí)補(bǔ)充所述接收數(shù)據(jù)。
24.根據(jù)權(quán)利要求23所述的方法,其中查詢至少一個(gè)數(shù)據(jù)集的步驟包括所述次級(jí)數(shù)據(jù)庫(kù)中的至少一個(gè)數(shù)據(jù)集利用所述算法來(lái)查詢附加數(shù)據(jù)庫(kù),以找出與所接收的標(biāo)識(shí)中的至少一個(gè)相關(guān)的附加標(biāo)識(shí);以及使用所述次級(jí)數(shù)據(jù)庫(kù)中的所述附加標(biāo)識(shí)來(lái)補(bǔ)充所述接收數(shù)據(jù)。
25.根據(jù)權(quán)利要求17所述的方法,其中在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前對(duì)接收數(shù)據(jù)進(jìn)行分析的步驟包括生成所述標(biāo)識(shí)的散列鍵。
26.根據(jù)權(quán)利要求1所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括根據(jù)用戶定義的標(biāo)準(zhǔn)將處理后的查詢存儲(chǔ)在所述數(shù)據(jù)庫(kù)中。
27.根據(jù)權(quán)利要求26所述的方法,其中所述用戶定義的標(biāo)準(zhǔn)包括有效日期。
28.根據(jù)權(quán)利要求1所述的方法,其中接收包括具有至少一個(gè)標(biāo)識(shí)的至少一條記錄的數(shù)據(jù)的步驟、利用算法處理接收數(shù)據(jù)的步驟、以及將處理后的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中的步驟是實(shí)時(shí)執(zhí)行的,其中各條記錄表示多個(gè)實(shí)體中的至少一個(gè)。
29.根據(jù)權(quán)利要求1所述的方法,其中接收包括具有至少一個(gè)標(biāo)識(shí)的至少一條記錄的數(shù)據(jù)的步驟、利用算法處理接收數(shù)據(jù)的步驟、以及將處理后的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中的步驟是分批執(zhí)行的,其中各條記錄表示多個(gè)實(shí)體中的至少一個(gè)。
30.根據(jù)權(quán)利要求1或17所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括從所述數(shù)據(jù)庫(kù)種檢索一組附加記錄,該組附加記錄具有與所述接收數(shù)據(jù)中的標(biāo)識(shí)相似的標(biāo)識(shí);分析所檢索到的記錄組的各個(gè)標(biāo)識(shí),以與所述接收數(shù)據(jù)的至少一部分匹配;將所述接收數(shù)據(jù)的至少一部分與所檢索到的記錄組的至少一個(gè)已分析記錄進(jìn)行匹配,該已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄;分析在接收數(shù)據(jù)的至少一部分中是否包含至少一個(gè)先前沒(méi)有存儲(chǔ)在所檢索到的記錄組的所述至少一個(gè)已分析記錄中的標(biāo)識(shí),其中該已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄以及重新分析所檢索到的記錄組的各個(gè)標(biāo)識(shí),以與以下各項(xiàng)進(jìn)行匹配所述接收數(shù)據(jù)的至少一部分,和所檢索到的記錄組的所述已分析記錄,其中所述已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄;以及在所述數(shù)據(jù)庫(kù)中存儲(chǔ)所述匹配記錄。
31.根據(jù)權(quán)利要求30所述的方法,其中將接收數(shù)據(jù)的至少一部分與至少一個(gè)已分析記錄進(jìn)行匹配的步驟包括分配持續(xù)鍵。
32.根據(jù)權(quán)利要求30所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟還包括在重新分析所檢索到的記錄組的各個(gè)標(biāo)識(shí)以進(jìn)行匹配之前從所述數(shù)據(jù)庫(kù)中檢索一組附加記錄,該組附加記錄具有與以下各項(xiàng)中的標(biāo)識(shí)相似的標(biāo)識(shí)所述接收數(shù)據(jù)的至少一部分,以及所檢索到的記錄組的所述已分析記錄,所述已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄。
33.根據(jù)權(quán)利要求32所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括重復(fù)以下步驟從所述數(shù)據(jù)庫(kù)中檢索一組記錄;分析所檢索到的記錄組的各個(gè)標(biāo)識(shí);匹配所述接收數(shù)據(jù)的至少一部分;分析在所述接收數(shù)據(jù)的至少一部分中是否存在至少一個(gè)先前沒(méi)有存儲(chǔ)的標(biāo)識(shí);從所述數(shù)據(jù)庫(kù)中檢索一組附加記錄;以及重新分析所檢索到的記錄組的各個(gè)標(biāo)識(shí)以進(jìn)行匹配,直到找不到另外的匹配。
34.根據(jù)權(quán)利要求30所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括確定特定的標(biāo)識(shí)是否為以下各項(xiàng)之一表示至少兩個(gè)不同實(shí)體的公共交叉記錄,和表示特定實(shí)體的一般特有記錄;以及如果確定特定的標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則分離先前基于該特定標(biāo)識(shí)而匹配的記錄。
35.根據(jù)權(quán)利要求34所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括如果確定特定的標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則禁止基于該特定標(biāo)識(shí)對(duì)記錄進(jìn)行任何另外的匹配。
36.根據(jù)權(quán)利要求34所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括將分離后的記錄作為接收數(shù)據(jù)進(jìn)行重新處理。
37.根據(jù)權(quán)利要求34所述的方法,其中確定特定的標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟、以及將先前匹配的記錄分離的步驟是實(shí)時(shí)執(zhí)行的。
38.根據(jù)權(quán)利要求34所述的方法,其中確定特定的標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟、以及將先前匹配的記錄分離的步驟是分批執(zhí)行的。
39.根據(jù)權(quán)利要求30所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括將接收數(shù)據(jù)與至少一個(gè)所存儲(chǔ)的記錄進(jìn)行比較以確定是否存在關(guān)聯(lián);以及為每一個(gè)被確定為反映了與接收數(shù)據(jù)的至少一部分的關(guān)聯(lián)的存儲(chǔ)記錄生成關(guān)聯(lián)記錄。
40.根據(jù)權(quán)利要求39所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括為每一個(gè)關(guān)聯(lián)記錄生成至少一個(gè)置信度指示符。
41.根據(jù)權(quán)利要求40所述的方法,其中比較接收數(shù)據(jù)的步驟、生成關(guān)聯(lián)記錄的步驟和生成至少一個(gè)置信度指示符的步驟是實(shí)時(shí)執(zhí)行的。
42.根據(jù)權(quán)利要求40所述的方法,其中比較接收數(shù)據(jù)的步驟、生成關(guān)聯(lián)記錄的步驟和生成至少一個(gè)置信度指示符的步驟是分批執(zhí)行的。
43.根據(jù)權(quán)利要求40所述的方法,其中至少一個(gè)所述的置信度指示符表示以下兩者之間關(guān)聯(lián)的可能性由與所述接收數(shù)據(jù)的所述部分有關(guān)聯(lián)的特定記錄表示的實(shí)體,以及由所述接收數(shù)據(jù)的所述部分表示的實(shí)體。
44.根據(jù)權(quán)利要求40所述的方法,其中至少一個(gè)所述的置信度指示符表示以下的可能性由與所述接收數(shù)據(jù)的所述部分有關(guān)聯(lián)的特定記錄表示的實(shí)體,和由所述接收數(shù)據(jù)的所述部分表示的實(shí)體是相同的。
45.根據(jù)權(quán)利要求40所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟包括分析所述關(guān)聯(lián)記錄以確定所述關(guān)聯(lián)記錄是否反映了至少一個(gè)先前未確定的關(guān)聯(lián)。
46.根據(jù)權(quán)利要求45所述的方法,其中分析所述關(guān)聯(lián)記錄的步驟包括對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析。
47.根據(jù)權(quán)利要求46所述的方法,其中對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括對(duì)滿足至少一個(gè)用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析。
48.根據(jù)權(quán)利要求47所述的方法,其中對(duì)滿足至少一個(gè)用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為最大級(jí)別的分離程度。
49.根據(jù)權(quán)利要求47所述的方法,其中對(duì)滿足至少一個(gè)用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為具有大于一個(gè)最小值的置信度指示符的關(guān)聯(lián)記錄。
50.根據(jù)權(quán)利要求45所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟還包括根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告。
51.根據(jù)權(quán)利要求50所述的方法,其中根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告的步驟包括通過(guò)電子通信裝置傳送所述警告。
52.根據(jù)權(quán)利要求51所述的方法,其中所述電子通信裝置包括電子郵件系統(tǒng)。
53.根據(jù)權(quán)利要求51所述的方法,其中所述電子通信裝置包括電話。
54.根據(jù)權(quán)利要求51所述的方法,其中所述電子通信裝置包括傳呼機(jī)。
55.根據(jù)權(quán)利要求51所述的方法,其中所述電子通信裝置包括個(gè)人數(shù)字助理。
56.根據(jù)權(quán)利要求50所述的方法,其中分析所述關(guān)聯(lián)記錄的步驟包括在至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)上復(fù)制所述關(guān)聯(lián)記錄;根據(jù)工作負(fù)荷標(biāo)準(zhǔn)將接收數(shù)據(jù)分配給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)以進(jìn)行分析;以及從至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)發(fā)出滿足所述用戶定義警告規(guī)則的標(biāo)準(zhǔn)的警告。
57.根據(jù)權(quán)利要求1或28所述的方法,其中利用算法處理接收數(shù)據(jù)的步驟還包括利用該算法將所存儲(chǔ)的處理后數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)。
58.根據(jù)權(quán)利要求57所述的方法,其中將所存儲(chǔ)的處理后數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)的步驟是實(shí)時(shí)執(zhí)行的。
59.根據(jù)權(quán)利要求57所述的方法,其中將所存儲(chǔ)的處理后數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)的步驟是分批執(zhí)行的。
60.一種處理數(shù)據(jù)的方法,包括以下步驟接收包括具有至少一個(gè)標(biāo)識(shí)的至少一條記錄的數(shù)據(jù),各條記錄表示多個(gè)實(shí)體中的至少一個(gè)實(shí)體;利用一算法進(jìn)行以下處理從數(shù)據(jù)庫(kù)中檢索一組附加記錄,該組附加記錄具有與接收數(shù)據(jù)中的標(biāo)識(shí)相似的標(biāo)識(shí),分析所檢索到的記錄組的各個(gè)標(biāo)識(shí)以與接收數(shù)據(jù)的至少一部分進(jìn)行匹配,將接收數(shù)據(jù)的所述至少一部分與所檢索到的記錄組的至少一條已分析記錄進(jìn)行匹配,該已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄,分析在所述接收數(shù)據(jù)的至少一部分中是否包含至少一個(gè)先前沒(méi)有存儲(chǔ)在所檢索到的記錄組的所述至少一個(gè)已分析記錄中的標(biāo)識(shí),其中該已分析記錄被確定為反映了具有表示多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄;以及重新分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以匹配以下各項(xiàng)所述接收數(shù)據(jù)的至少一部分,以及所檢索到的記錄組的所述已分析記錄,其中該已分析記錄被確定為反映了具有表示多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄;以及在所述數(shù)據(jù)庫(kù)中存儲(chǔ)匹配記錄。
61.根據(jù)權(quán)利要求60所述的方法,其中利用算法的步驟包括分配持續(xù)鍵。
62.根據(jù)權(quán)利要求60所述的方法,其中利用算法的步驟還包括在重新分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以進(jìn)行匹配之前從所述數(shù)據(jù)庫(kù)中檢索一組附加記錄,該組附加記錄具有與以下各項(xiàng)中的標(biāo)識(shí)相似的標(biāo)識(shí)所述接收數(shù)據(jù)的至少一部分,以及所檢索到的記錄組的所述已分析記錄,所述已分析記錄被確定為反映了具有表示多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄。
63.根據(jù)權(quán)利要求60或62所述的方法,其中利用算法的步驟包括重復(fù)以下步驟從數(shù)據(jù)庫(kù)中檢索一組附加記錄;分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí);匹配接收數(shù)據(jù)的至少一部分;分析接收數(shù)據(jù)的至少一部分中是否包括至少一個(gè)先前沒(méi)有存儲(chǔ)的標(biāo)識(shí);從所述數(shù)據(jù)庫(kù)中檢索一組附加記錄;以及重新分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以進(jìn)行匹配,直到找不到另外的匹配。
64.根據(jù)權(quán)利要求63所述的方法,其中接收數(shù)據(jù)的步驟、利用算法的步驟和存儲(chǔ)匹配記錄的步驟是實(shí)時(shí)執(zhí)行的。
65.根據(jù)權(quán)利要求63所述的方法,其中接收數(shù)據(jù)的步驟、利用算法的步驟和存儲(chǔ)匹配記錄的步驟是分批執(zhí)行的。
66.根據(jù)權(quán)利要求60所述的方法,其中利用算法的步驟還包括確定特定標(biāo)識(shí)是否為以下各項(xiàng)之一表示至少兩個(gè)不同實(shí)體的公共交叉記錄,以及表示特定實(shí)體的一般特有記錄;以及如果特定標(biāo)識(shí)被確定為表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則分離先前基于該特定標(biāo)識(shí)而匹配的記錄。
67.根據(jù)權(quán)利要求66所述的方法,其中利用算法的步驟包括如果特定標(biāo)識(shí)被確定為表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則禁止基于該特定標(biāo)識(shí)對(duì)記錄進(jìn)行任何另外的匹配。
68.根據(jù)權(quán)利要求66所述的方法,其中利用算法的步驟包括將所分離的記錄作為接收數(shù)據(jù)重新進(jìn)行處理。
69.根據(jù)權(quán)利要求66所述的方法,其中確定特定標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟以及分離先前匹配的記錄的步驟是實(shí)時(shí)執(zhí)行的。
70.根據(jù)權(quán)利要求66所述的方法,其中確定特定標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟以及分離先前匹配的記錄的步驟是分批執(zhí)行的。
71.根據(jù)權(quán)利要求60所述的方法,其中利用算法的步驟包括將接收數(shù)據(jù)與至少一個(gè)所存儲(chǔ)的記錄進(jìn)行比較以確定是否存在關(guān)聯(lián);以及為被確定為與接收數(shù)據(jù)的至少一部分存在關(guān)聯(lián)的各條存儲(chǔ)記錄創(chuàng)建關(guān)聯(lián)記錄。
72.根據(jù)權(quán)利要求71所述的方法,其中利用算法的步驟包括為各條關(guān)聯(lián)記錄創(chuàng)建至少一個(gè)置信度指示符。
73.根據(jù)權(quán)利要求72所述的方法,其中比較接收數(shù)據(jù)的步驟、創(chuàng)建關(guān)聯(lián)記錄的步驟和創(chuàng)建至少一個(gè)置信度指示符的步驟是實(shí)時(shí)執(zhí)行的。
74.根據(jù)權(quán)利要求72所述的方法,其中比較接收數(shù)據(jù)的步驟、創(chuàng)建關(guān)聯(lián)記錄的步驟和創(chuàng)建至少一個(gè)置信度指示符的步驟是分批執(zhí)行的。
75.根據(jù)權(quán)利要求72所述的方法,其中至少一個(gè)所述的置信度指示符表示以下兩者之間關(guān)聯(lián)的可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄表示的實(shí)體,以及由接收數(shù)據(jù)的所述部分表示的實(shí)體。
76.根據(jù)權(quán)利要求72所述的方法,其中至少一個(gè)所述的置信度指示符表示以下可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄所表示的實(shí)體,和由接收數(shù)據(jù)的所述部分表示的實(shí)體是相同的。
77.根據(jù)權(quán)利要求72所述的方法,其中利用算法的步驟包括分析所述關(guān)聯(lián)記錄以確定所述關(guān)聯(lián)記錄是否反映了先前未確定的至少一個(gè)關(guān)聯(lián)。
78.根據(jù)權(quán)利要求77所述的方法,其中分析所述關(guān)聯(lián)記錄的步驟包括對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析。
79.根據(jù)權(quán)利要求78所述的方法,其中對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括對(duì)滿足至少一個(gè)用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析。
80.根據(jù)權(quán)利要求79所述的方法,其中對(duì)滿足至少一個(gè)用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為最大級(jí)別的分離程度。
81.根據(jù)權(quán)利要求79所述的方法,其中對(duì)滿足至少一個(gè)用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為具有大于一個(gè)最小值的置信度指示符的關(guān)聯(lián)記錄。
82.根據(jù)權(quán)利要求77所述的方法,其中利用算法的步驟還包括根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告。
83.根據(jù)權(quán)利要求82所述的方法,其中根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告的步驟包括通過(guò)電子通信裝置傳送所述警告。
84.根據(jù)權(quán)利要求83所述的方法,其中所述電子通信裝置包括電子郵件系統(tǒng)。
85.根據(jù)權(quán)利要求83所述的方法,其中所述電子通信裝置包括電話。
86.根據(jù)權(quán)利要求83所述的方法,其中所述電子通信裝置包括傳呼機(jī)。
87.根據(jù)權(quán)利要求83所述的方法,其中所述電子通信裝置包括個(gè)人數(shù)字助理。
88.根據(jù)權(quán)利要求82所述的方法,其中分析所述關(guān)聯(lián)記錄的步驟包括在至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)上復(fù)制所述關(guān)聯(lián)記錄;根據(jù)工作負(fù)荷標(biāo)準(zhǔn)將接收數(shù)據(jù)分配至所述至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)以進(jìn)行分析;以及從所述至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)發(fā)出基于所述用戶定義警告規(guī)則的警告。
89.根據(jù)權(quán)利要求60所述的方法,還包括在利用算法的步驟之前將接收數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)化消息格式的步驟。
90.根據(jù)權(quán)利要求60所述的方法,其中利用算法的步驟包括保留各個(gè)標(biāo)識(shí)的屬性。
91.根據(jù)權(quán)利要求90所述的方法,其中保留各個(gè)記錄的屬性的步驟包括保留以下各項(xiàng)的識(shí)別信息提供各條記錄的源系統(tǒng),以及表示所述源系統(tǒng)中的各條記錄的唯一標(biāo)識(shí)。
92.根據(jù)權(quán)利要求90所述的方法,其中保留各個(gè)標(biāo)識(shí)的屬性的步驟包括保留查詢系統(tǒng)和特定用戶的識(shí)別信息。
93.根據(jù)權(quán)利要求60所述的方法,其中利用算法的步驟包括在數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)。
94.根據(jù)權(quán)利要求93所述的方法,其中在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)的步驟包括將所述標(biāo)識(shí)中的至少一個(gè)與以下各項(xiàng)之一進(jìn)行比較用戶定義的標(biāo)準(zhǔn),和次級(jí)數(shù)據(jù)庫(kù)和列表之一中的至少一個(gè)數(shù)據(jù)集。
95.根據(jù)權(quán)利要求94所述的方法,其中所比較的標(biāo)識(shí)是所述多個(gè)實(shí)體中的至少一個(gè)實(shí)體的名稱,并且所述數(shù)據(jù)集位于名稱根列表中。
96.根據(jù)權(quán)利要求94所述的方法,其中所比較的標(biāo)識(shí)是所述多個(gè)實(shí)體中的至少一個(gè)實(shí)體的地址,并且所述數(shù)據(jù)集位于地址列表中。
97.根據(jù)權(quán)利要求94所述的方法,其中將至少一個(gè)標(biāo)識(shí)與用戶定義的標(biāo)準(zhǔn)進(jìn)行比較的步驟包括根據(jù)用戶定義的標(biāo)準(zhǔn)對(duì)至少一個(gè)標(biāo)識(shí)進(jìn)行格式化。
98.根據(jù)權(quán)利要求93所述的方法,其中在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)的步驟包括對(duì)接收數(shù)據(jù)進(jìn)行增強(qiáng)。
99.根據(jù)權(quán)利要求98所述的方法,其中對(duì)接收數(shù)據(jù)進(jìn)行增強(qiáng)的步驟包括對(duì)所述次級(jí)數(shù)據(jù)庫(kù)和列表之一中的至少一個(gè)數(shù)據(jù)集進(jìn)行查詢以獲得所述接收數(shù)據(jù)的附加標(biāo)識(shí);以及使用所述附加標(biāo)識(shí)補(bǔ)充所述接收數(shù)據(jù)。
100.根據(jù)權(quán)利要求99所述的方法,其中查詢至少一個(gè)數(shù)據(jù)集的步驟包括所述次級(jí)數(shù)據(jù)庫(kù)中的至少一個(gè)數(shù)據(jù)集利用所述算法查詢多個(gè)附加數(shù)據(jù)庫(kù)以找到與所接收的標(biāo)識(shí)中的至少一個(gè)相關(guān)的附加標(biāo)識(shí);以及使用所述次級(jí)數(shù)據(jù)庫(kù)中的附加標(biāo)識(shí)來(lái)補(bǔ)充所述接收數(shù)據(jù)。
101.根據(jù)權(quán)利要求93所述的方法,其中利用算法的步驟包括創(chuàng)建所述標(biāo)識(shí)的散列鍵。
102.根據(jù)權(quán)利要求60所述的方法,其中利用算法的步驟包括根據(jù)用戶定義的標(biāo)準(zhǔn)在所述數(shù)據(jù)庫(kù)中存儲(chǔ)處理后的查詢。
103.根據(jù)權(quán)利要求102所述的方法,其中所述用戶定義的標(biāo)準(zhǔn)包括有效日期。
104.根據(jù)權(quán)利要求60所述的方法,其中利用算法的步驟還包括利用所述算法將所存儲(chǔ)的處理后的數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)。
105.根據(jù)權(quán)利要求104所述的方法,其中將所存儲(chǔ)的處理后的數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)的步驟是實(shí)時(shí)執(zhí)行的。
106.根據(jù)權(quán)利要求104所述的方法,其中將所存儲(chǔ)的處理后的數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)的步驟是分批執(zhí)行的。
107.一種分離先前匹配的記錄的方法,該方法包括以下步驟確定表示至少一個(gè)實(shí)體的至少一條記錄中的特定標(biāo)識(shí)是否是以下各項(xiàng)之一表示至少兩個(gè)不同實(shí)體的公共交叉記錄,和表示特定實(shí)體的一般特有記錄;以及如果特定的標(biāo)識(shí)被確定為表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則分離先前基于該特定標(biāo)識(shí)而匹配的記錄。
108.根據(jù)權(quán)利要求107所述的方法,還包括如果特定標(biāo)識(shí)被確定為表示多個(gè)實(shí)體的公共交叉記錄而不是表示一個(gè)實(shí)體的一般特有記錄,則禁止基于該特定標(biāo)識(shí)對(duì)記錄進(jìn)行任何另外的匹配。
109.根據(jù)權(quán)利要求107所述的方法,還包括重新處理所分離的記錄的步驟。
110.根據(jù)權(quán)利要求107所述的方法,其中確定特定標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟是實(shí)時(shí)執(zhí)行的。
111.根據(jù)權(quán)利要求107所述的方法,其中確定特定標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟是分批執(zhí)行的。
112.一種處理數(shù)據(jù)庫(kù)中的數(shù)據(jù)的方法,該方法包括以下步驟接收數(shù)據(jù),該數(shù)據(jù)包括具有至少一個(gè)標(biāo)識(shí)的至少一條記錄,各條記錄表示多個(gè)實(shí)體中的至少一個(gè)實(shí)體;實(shí)時(shí)地比較接收數(shù)據(jù)和數(shù)據(jù)庫(kù)中所存儲(chǔ)的至少一條記錄以確定是否存在關(guān)聯(lián);實(shí)時(shí)地為數(shù)據(jù)庫(kù)中所存儲(chǔ)的被確定為與接收數(shù)據(jù)的至少一部分存在關(guān)聯(lián)的各條記錄創(chuàng)建關(guān)聯(lián)記錄;以及在所述數(shù)據(jù)庫(kù)中存儲(chǔ)各條關(guān)聯(lián)記錄。
113.根據(jù)權(quán)利要求112所述的方法,還包括實(shí)時(shí)地為各條關(guān)聯(lián)記錄創(chuàng)建至少一個(gè)置信度指示符的步驟。
114.根據(jù)權(quán)利要求113所述的方法,其中至少一個(gè)置信度指示符表示以下兩者之間的關(guān)聯(lián)的可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄表示的實(shí)體,以及由接收數(shù)據(jù)的所述部分表示的實(shí)體。
115.根據(jù)權(quán)利要求113所述的方法,其中至少一個(gè)置信度指示符表示以下的可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄表示的實(shí)體,和由接收數(shù)據(jù)的所述部分表示的實(shí)體是相同的。
116.根據(jù)權(quán)利要求112或113所述的方法,還包括分析所述關(guān)聯(lián)記錄以確定這些關(guān)聯(lián)記錄是否反映至少一個(gè)先前未確定的關(guān)聯(lián)的步驟。
117.根據(jù)權(quán)利要求116所述的方法,其中分析所述關(guān)聯(lián)記錄的步驟包括對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析。
118.根據(jù)權(quán)利要求117所述的方法,其中對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括對(duì)滿足至少一個(gè)用戶定義標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析。
119.根據(jù)權(quán)利要求118所述的方法,其中對(duì)滿足至少一個(gè)用戶定義標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為最大級(jí)別的分離程度。
120.根據(jù)權(quán)利要求118所述的方法,其中對(duì)滿足至少一個(gè)用戶定義標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為具有大于一個(gè)最小至的置信度指示符的關(guān)聯(lián)記錄。
121.根據(jù)權(quán)利要求116所述的方法,還包括根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告的步驟。
122.根據(jù)權(quán)利要求121所述的方法,其中根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告的步驟包括通過(guò)電子通信裝置傳送所述警告。
123.根據(jù)權(quán)利要求122所述的方法,其中所述電子通信裝置包括電子郵件系統(tǒng)。
124.根據(jù)權(quán)利要求122所述的方法,其中所述電子通信裝置包括電話。
125.根據(jù)權(quán)利要求122所述的方法,其中所述電子通信裝置包括傳呼機(jī)。
126.根據(jù)權(quán)利要求122所述的方法,其中所述電子通信裝置包括個(gè)人數(shù)字助理。
127.根據(jù)權(quán)利要求121所述的方法,還包括以下步驟在至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)上復(fù)制所述關(guān)聯(lián)記錄;根據(jù)工作負(fù)荷標(biāo)準(zhǔn)將接收數(shù)據(jù)分配給所述至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)以進(jìn)行分析;以及從所述至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)中發(fā)出滿足用戶定義警告規(guī)則的標(biāo)準(zhǔn)的警告。
128.對(duì)于用于處理數(shù)據(jù)的系統(tǒng),一種包含程序指令的計(jì)算機(jī)可讀介質(zhì),計(jì)算機(jī)執(zhí)行該程序指令以執(zhí)行包括以下步驟的方法接收包括具有至少一個(gè)標(biāo)識(shí)的至少一條記錄的數(shù)據(jù),各條記錄表示多個(gè)實(shí)體中的至少一個(gè)實(shí)體;利用一個(gè)算法處理接收數(shù)據(jù);在數(shù)據(jù)庫(kù)中存儲(chǔ)處理后的數(shù)據(jù);接收用于檢索所述數(shù)據(jù)庫(kù)中存儲(chǔ)的至少一部分所述數(shù)據(jù)的數(shù)據(jù)查詢;以及利用所述算法處理所述查詢。
129.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是人。
130.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是個(gè)人財(cái)產(chǎn)。
131.根據(jù)權(quán)利要求130所述的計(jì)算機(jī)可讀介質(zhì),其中所述所述個(gè)人財(cái)產(chǎn)是車輛。
132.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是不動(dòng)產(chǎn)。
133.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是機(jī)構(gòu)。
134.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是化學(xué)化合物。
135.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是有機(jī)化合物。
136.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是蛋白質(zhì)。
137.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是生物結(jié)構(gòu)。
138.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是生物統(tǒng)計(jì)值。
139.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述實(shí)體是原子結(jié)構(gòu)。
140.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述方法進(jìn)一步包括在利用算法處理接收數(shù)據(jù)之前將接收數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)化消息格式的步驟。
141.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中所述利用算法處理接收數(shù)據(jù)的步驟包括保留各條記錄的屬性。
142.根據(jù)權(quán)利要求141所述的計(jì)算機(jī)可讀介質(zhì),其中保留各條記錄的屬性的步驟包括保留以下各項(xiàng)的識(shí)別信息提供各條記錄的源系統(tǒng),以及表示所述源系統(tǒng)中的記錄的唯一標(biāo)識(shí)。
143.根據(jù)權(quán)利要求141所述的計(jì)算機(jī)可讀介質(zhì),其中保留各條記錄的屬性的步驟包括保留查詢系統(tǒng)和特定用戶的識(shí)別信息。
144.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟包括在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)。
145.根據(jù)權(quán)利要求144所述的計(jì)算機(jī)可讀介質(zhì),其中在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)的步驟包括將所述多個(gè)標(biāo)識(shí)中的至少一個(gè)標(biāo)識(shí)與以下各項(xiàng)之一進(jìn)行比較用戶定義的標(biāo)準(zhǔn),和所述數(shù)據(jù)庫(kù)與列表之一中的至少一個(gè)數(shù)據(jù)集。
146.根據(jù)權(quán)利要求145所述的計(jì)算機(jī)可讀介質(zhì),其中所比較的標(biāo)識(shí)是所述多個(gè)實(shí)體中的至少一個(gè)實(shí)體的名稱,并且所述數(shù)據(jù)集位于名稱根列表中。
147.根據(jù)權(quán)利要求145所述的計(jì)算機(jī)可讀介質(zhì),其中所比較的標(biāo)識(shí)是所述多個(gè)實(shí)體中的至少一個(gè)實(shí)體的地址,并且所述數(shù)據(jù)集位于地址列表中。
148.根據(jù)權(quán)利要求145所述的計(jì)算機(jī)可讀介質(zhì),其中將至少一個(gè)標(biāo)識(shí)與用戶定義的標(biāo)準(zhǔn)進(jìn)行比較的步驟包括根據(jù)用戶定義的標(biāo)準(zhǔn)對(duì)至少一個(gè)標(biāo)識(shí)進(jìn)行格式化。
149.根據(jù)權(quán)利要求144所述的計(jì)算機(jī)可讀介質(zhì),其中在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)的步驟包括對(duì)接收數(shù)據(jù)進(jìn)行增強(qiáng)。
150.根據(jù)權(quán)利要求149所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)接收數(shù)據(jù)進(jìn)行增強(qiáng)的步驟包括對(duì)所述次級(jí)數(shù)據(jù)庫(kù)和列表之一中的至少一個(gè)數(shù)據(jù)集進(jìn)行查詢以獲得所述接收數(shù)據(jù)的附加標(biāo)識(shí),以及使用所述附加標(biāo)識(shí)補(bǔ)充所述接收數(shù)據(jù)。
151.根據(jù)權(quán)利要求150所述的計(jì)算機(jī)可讀介質(zhì),其中查詢至少一個(gè)數(shù)據(jù)集的步驟包括至少一個(gè)數(shù)據(jù)庫(kù)中的至少一個(gè)數(shù)據(jù)集利用所述算法查詢附加數(shù)據(jù)庫(kù),以找到與所接收的標(biāo)識(shí)中的至少一個(gè)相關(guān)的附加標(biāo)識(shí);以及使用至少一個(gè)附加數(shù)據(jù)庫(kù)中的附加標(biāo)識(shí)補(bǔ)充所述接收數(shù)據(jù)。
152.根據(jù)權(quán)利要求144所述的計(jì)算機(jī)可讀介質(zhì),其中在所述數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在所述數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)的步驟包括創(chuàng)建所述標(biāo)識(shí)的散列鍵。
153.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟包括根據(jù)用戶定義的標(biāo)準(zhǔn)在所述數(shù)據(jù)庫(kù)中存儲(chǔ)處理后的查詢。
154.根據(jù)權(quán)利要求153所述的計(jì)算機(jī)可讀介質(zhì),其中所述用戶定義的標(biāo)準(zhǔn)包括有效日期。
155.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中接收包括具有至少一個(gè)標(biāo)識(shí)的至少一個(gè)記錄的數(shù)據(jù)的步驟、利用算法處理接收數(shù)據(jù)的步驟以及將處理后的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中的步驟是實(shí)時(shí)執(zhí)行的,其中各條記錄表示多個(gè)實(shí)體中的至少一個(gè)實(shí)體。
156.根據(jù)權(quán)利要求128所述的計(jì)算機(jī)可讀介質(zhì),其中接收包括具有至少一個(gè)標(biāo)識(shí)的至少一個(gè)記錄的數(shù)據(jù)的步驟、利用算法處理接收數(shù)據(jù)的步驟以及將處理后的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中的步驟是分批執(zhí)行的,其中各條記錄表示多個(gè)實(shí)體中的至少一個(gè)實(shí)體。
157.根據(jù)權(quán)利要求128或144所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟包括從所述數(shù)據(jù)庫(kù)中檢索一組具有與接收數(shù)據(jù)中的標(biāo)識(shí)相似的標(biāo)識(shí)的附加記錄;分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以與接收數(shù)據(jù)的至少一部分進(jìn)行匹配;對(duì)接收數(shù)據(jù)的至少一部分和所檢索到的記錄組中的至少一條已分析記錄進(jìn)行匹配,所述已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄;分析在接收數(shù)據(jù)的所述至少一部分中是否包含至少一個(gè)先前沒(méi)有存儲(chǔ)在所檢索到的記錄組的所述至少一條已分析記錄中的標(biāo)識(shí),其中該已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄;以及重新分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以匹配以下各項(xiàng)接收數(shù)據(jù)的至少一部分,和所檢索到的記錄組中被確定為反映了具有表示所述多個(gè)實(shí)體中同一個(gè)實(shí)體的標(biāo)識(shí)的記錄的已分析記錄;以及將匹配的記錄存儲(chǔ)在所述數(shù)據(jù)庫(kù)中。
158.根據(jù)權(quán)利要求157所述的計(jì)算機(jī)可讀介質(zhì),其中將接收數(shù)據(jù)的至少一部分與至少一個(gè)已分析記錄進(jìn)行匹配的步驟包括分配持續(xù)鍵。
159.根據(jù)權(quán)利要求157所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟還包括在重新分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以進(jìn)行匹配之前從所述數(shù)據(jù)庫(kù)中檢索一組附加記錄,該組附加記錄具有與以下各項(xiàng)中的標(biāo)識(shí)相似的標(biāo)識(shí)接收數(shù)據(jù)的至少一部分,以及所檢索到的記錄組中被確定為反映了具有表示所述多個(gè)實(shí)體中同一個(gè)實(shí)體的標(biāo)識(shí)的記錄的已分析記錄。
160.根據(jù)權(quán)利要求159所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)包括重復(fù)以下步驟從所述數(shù)據(jù)庫(kù)中檢索一組記錄;分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí);匹配接收數(shù)據(jù)的至少一部分;分析接收數(shù)據(jù)的所述至少一部分中是否包含至少一個(gè)之前沒(méi)有存儲(chǔ)的標(biāo)識(shí);從所述數(shù)據(jù)庫(kù)中檢索一組附加記錄;以及重新分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以進(jìn)行匹配,直到找不到另外的匹配。
161.根據(jù)權(quán)利要求157所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟還包括確定特定標(biāo)識(shí)是否為以下各項(xiàng)之一表示至少兩個(gè)不同實(shí)體的公共交叉記錄,以及表示特定實(shí)體的一般特有記錄;以及如果特定標(biāo)識(shí)被確定為表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則分離先前基于該特定標(biāo)識(shí)而匹配的記錄。
162.根據(jù)權(quán)利要求161所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟包括如果特定標(biāo)識(shí)被確定為表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則禁止基于該特定標(biāo)識(shí)對(duì)記錄進(jìn)行任何另外的匹配。
163.根據(jù)權(quán)利要求161所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟包括將所分離的記錄作為接收數(shù)據(jù)重新進(jìn)行處理。
164.根據(jù)權(quán)利要求161所述的計(jì)算機(jī)可讀介質(zhì),其中確定特定標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟以及分離先前匹配的記錄的步驟是實(shí)時(shí)執(zhí)行的。
165.根據(jù)權(quán)利要求161所述的計(jì)算機(jī)可讀介質(zhì),其中確定特定標(biāo)識(shí)是表示至少兩個(gè)實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟以及分離先前匹配的記錄的步驟是分批執(zhí)行的。
166.根據(jù)權(quán)利要求157所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟包括將接收數(shù)據(jù)與至少一個(gè)所存儲(chǔ)的記錄進(jìn)行比較以確定是否存在關(guān)聯(lián);以及為被確定為與接收數(shù)據(jù)的至少一部分存在關(guān)聯(lián)的各條所存儲(chǔ)的記錄創(chuàng)建關(guān)聯(lián)記錄。
167.根據(jù)權(quán)利要求166所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟包括為每一個(gè)關(guān)聯(lián)記錄創(chuàng)建至少一個(gè)置信度指示符。
168.根據(jù)權(quán)利要求167所述的計(jì)算機(jī)可讀介質(zhì),其中比較接收數(shù)據(jù)的步驟、創(chuàng)建關(guān)聯(lián)記錄的步驟和創(chuàng)建至少一個(gè)置信度指示符的步驟是實(shí)時(shí)執(zhí)行的。
169.根據(jù)權(quán)利要求167所述的計(jì)算機(jī)可讀介質(zhì),其中比較接收數(shù)據(jù)的步驟、創(chuàng)建關(guān)聯(lián)記錄的步驟和創(chuàng)建至少一個(gè)置信度指示符的步驟是分批執(zhí)行的。
170.根據(jù)權(quán)利要求167所述的計(jì)算機(jī)可讀介質(zhì),其中至少一個(gè)所述的置信度指示符表示以下兩者之間的關(guān)聯(lián)的可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄表示的實(shí)體,以及由接收數(shù)據(jù)的所述部分表示的實(shí)體。
171.根據(jù)權(quán)利要求167所述的計(jì)算機(jī)可讀介質(zhì),其中至少一個(gè)所述的置信度指示符表示以下可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄表示的實(shí)體,和由接收數(shù)據(jù)的所述部分表示的實(shí)體是相同的。
172.根據(jù)權(quán)利要求167所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟包括分析所述關(guān)聯(lián)記錄以確定所述關(guān)聯(lián)記錄是否反映至少一個(gè)先前未確定的關(guān)聯(lián)。
173.根據(jù)權(quán)利要求172所述的計(jì)算機(jī)可讀介質(zhì),其中分析所述關(guān)聯(lián)記錄的步驟包括對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析。
174.根據(jù)權(quán)利要求173所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括對(duì)滿足用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析。
175.根據(jù)權(quán)利要求174所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)滿足用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為最大級(jí)別的分離程度。
176.根據(jù)權(quán)利要求174所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)滿足用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為具有大于一個(gè)最小值的置信度指示符的關(guān)聯(lián)記錄。
177.根據(jù)權(quán)利要求172所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟還包括根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告。
178.根據(jù)權(quán)利要求177所述的計(jì)算機(jī)可讀介質(zhì),其中根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告的步驟包括通過(guò)電子通信裝置傳送該警告。
179.根據(jù)權(quán)利要求178所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括電子郵件系統(tǒng)。
180.根據(jù)權(quán)利要求178所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括電話。
181.根據(jù)權(quán)利要求178所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括傳呼機(jī)。
182.根據(jù)權(quán)利要求178所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括個(gè)人數(shù)字助理。
183.根據(jù)權(quán)利要求177所述的計(jì)算機(jī)可讀介質(zhì),其中分析關(guān)聯(lián)記錄的步驟包括在至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)上復(fù)制所述關(guān)聯(lián)記錄;根據(jù)工作負(fù)荷標(biāo)準(zhǔn)將接收數(shù)據(jù)分配給所述至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)以進(jìn)行分析;以及從所述至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)中發(fā)出滿足用戶定義警告規(guī)則的標(biāo)準(zhǔn)的警告。
184.根據(jù)權(quán)利要求128或155所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法處理接收數(shù)據(jù)的步驟還包括利用該算法將所存儲(chǔ)的處理后的數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)。
185.根據(jù)權(quán)利要求184所述的計(jì)算機(jī)可讀介質(zhì),其中將所存儲(chǔ)的處理后的數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)的步驟是實(shí)時(shí)執(zhí)行的。
186.根據(jù)權(quán)利要求184所述的計(jì)算機(jī)可讀介質(zhì),其中將所存儲(chǔ)的處理后的數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)的步驟是分批執(zhí)行的。
187.對(duì)于用于對(duì)進(jìn)入數(shù)據(jù)庫(kù)的數(shù)據(jù)和數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行處理的系統(tǒng),一種包含程序指令的計(jì)算機(jī)可讀介質(zhì),計(jì)算機(jī)執(zhí)行該程序指令以執(zhí)行包括以下步驟的方法接收包括具有至少一個(gè)標(biāo)識(shí)的至少一個(gè)記錄的數(shù)據(jù),各條記錄表示多個(gè)實(shí)體中的至少一個(gè)實(shí)體;利用一算法執(zhí)行以下步驟從數(shù)據(jù)庫(kù)中檢索一組附加記錄,該組附加記錄具有與接收數(shù)據(jù)中的標(biāo)識(shí)相似的標(biāo)識(shí),分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以與接收數(shù)據(jù)的至少一部分進(jìn)行匹配,對(duì)接收數(shù)據(jù)的至少一部分和所檢索到的記錄組中的至少一個(gè)已分析記錄進(jìn)行匹配,該已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄;分析接收數(shù)據(jù)的所述至少一部分中是否包含至少一個(gè)先前沒(méi)有存儲(chǔ)在所檢索到的記錄組中至少一個(gè)已分析記錄中的標(biāo)識(shí),其中該已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄;以及重新分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以匹配以下各項(xiàng)接收數(shù)據(jù)的至少一部分,以及所檢索到的記錄組中的所述已分析記錄,所述已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄;以及將匹配的記錄存儲(chǔ)在所述數(shù)據(jù)庫(kù)中。
188.根據(jù)權(quán)利要求187所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法對(duì)接收數(shù)據(jù)和至少一個(gè)已分析記錄進(jìn)行匹配的步驟包括分配持續(xù)鍵。
189.根據(jù)權(quán)利要求187所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟還包括在重新分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以進(jìn)行匹配之前從數(shù)據(jù)庫(kù)中檢索一組附加記錄,該組附加記錄具有與以下各項(xiàng)中的標(biāo)識(shí)相似的標(biāo)識(shí)接收數(shù)據(jù)的至少一部分,以及所檢索到的記錄組中的所述已分析記錄,所述已分析記錄被確定為反映了具有表示所述多個(gè)實(shí)體中的同一個(gè)實(shí)體的標(biāo)識(shí)的記錄。
190.根據(jù)權(quán)利要求187或189所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括重復(fù)以下步驟從數(shù)據(jù)庫(kù)中檢索一組附加記錄;分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí);匹配接收數(shù)據(jù)的至少一部分;分析接收數(shù)據(jù)的至少一部分中是否包含至少一個(gè)先前沒(méi)有存儲(chǔ)的標(biāo)識(shí);從所述數(shù)據(jù)庫(kù)中檢索一組附加記錄;以及重新分析所檢索到的記錄組中的各個(gè)標(biāo)識(shí)以進(jìn)行匹配,直到找不到另外的匹配。
191.根據(jù)權(quán)利要求190所述的計(jì)算機(jī)可讀介質(zhì),其中接收數(shù)據(jù)的步驟、利用算法的步驟和存儲(chǔ)匹配記錄的步驟是實(shí)時(shí)執(zhí)行的。
192.根據(jù)權(quán)利要求190所述的計(jì)算機(jī)可讀介質(zhì),其中接收數(shù)據(jù)的步驟、利用算法的步驟和存儲(chǔ)匹配記錄的步驟是分批執(zhí)行的。
193.根據(jù)權(quán)利要求187所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括確定特定的標(biāo)識(shí)是否為以下各項(xiàng)之一表示至少兩個(gè)不同實(shí)體的公共交叉記錄,以及表示特定實(shí)體的一般特有記錄;以及如果特定標(biāo)識(shí)被確定為表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則分離先前基于該特定標(biāo)識(shí)而匹配的記錄。
194.根據(jù)權(quán)利要求193所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括如果特定標(biāo)識(shí)被確定為表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則禁止基于該特定標(biāo)識(shí)對(duì)記錄進(jìn)行任何另外的匹配。
195.根據(jù)權(quán)利要求193所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括將所分離的記錄作為接收數(shù)據(jù)重新進(jìn)行處理。
196.根據(jù)權(quán)利要求193所述的計(jì)算機(jī)可讀介質(zhì),其中確定特定標(biāo)識(shí)是表示至少兩個(gè)實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟以及分離先前匹配的記錄的步驟是實(shí)時(shí)執(zhí)行的。
197.根據(jù)權(quán)利要求193所述的計(jì)算機(jī)可讀介質(zhì),其中確定特定標(biāo)識(shí)是表示至少兩個(gè)實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟以及分離先前匹配的記錄的步驟是分批執(zhí)行的。
198.根據(jù)權(quán)利要求187所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括將接收數(shù)據(jù)與至少一個(gè)所存儲(chǔ)的記錄進(jìn)行比較以確定是否存在關(guān)聯(lián);以及為被確定為與接收數(shù)據(jù)的至少一部分存在關(guān)聯(lián)的每一個(gè)所存儲(chǔ)的記錄創(chuàng)建關(guān)聯(lián)記錄。
199.根據(jù)權(quán)利要求198所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括為每一個(gè)關(guān)聯(lián)記錄創(chuàng)建至少一個(gè)置信度指示符。
200.根據(jù)權(quán)利要求199所述的計(jì)算機(jī)可讀介質(zhì),其中比較接收數(shù)據(jù)的步驟、創(chuàng)建關(guān)聯(lián)記錄的步驟和創(chuàng)建至少一個(gè)置信度指示符的步驟是實(shí)時(shí)執(zhí)行的。
201.根據(jù)權(quán)利要求199所述的計(jì)算機(jī)可讀介質(zhì),其中比較接收數(shù)據(jù)的步驟、創(chuàng)建關(guān)聯(lián)記錄的步驟和創(chuàng)建至少一個(gè)置信度指示符的步驟是分批執(zhí)行的。
202.根據(jù)權(quán)利要求199所述的計(jì)算機(jī)可讀介質(zhì),其中至少一個(gè)置信度指示符表示以下兩者之間的關(guān)聯(lián)的可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄表示的實(shí)體,以及由接收數(shù)據(jù)的所述部分表示的實(shí)體。
203.根據(jù)權(quán)利要求199所述的計(jì)算機(jī)可讀介質(zhì),其中至少一個(gè)置信度指示符表示以下的可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄表示的實(shí)體,和由接收數(shù)據(jù)的所述部分表示的實(shí)體是相同的。
204.根據(jù)權(quán)利要求199所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括分析所述關(guān)聯(lián)記錄以確定所述關(guān)聯(lián)記錄是否反映先前未確定的至少一個(gè)關(guān)聯(lián)。
205.根據(jù)權(quán)利要求204所述的計(jì)算機(jī)可讀介質(zhì),其中分析所述關(guān)聯(lián)記錄的步驟包括對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析。
206.根據(jù)權(quán)利要求205所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括對(duì)滿足至少一個(gè)用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析。
207.根據(jù)權(quán)利要求206所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)滿足用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為最大級(jí)別的分離程度。
208.根據(jù)權(quán)利要求206所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)滿足用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為具有大于一個(gè)最小值的置信度指示符的關(guān)聯(lián)記錄。
209.根據(jù)權(quán)利要求204所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟還包括根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告。
210.根據(jù)權(quán)利要求209所述的計(jì)算機(jī)可讀介質(zhì),其中根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告的步驟包括通過(guò)電子通信裝置傳送警告。
211.根據(jù)權(quán)利要求210所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括電子郵件系統(tǒng)。
212.根據(jù)權(quán)利要求210所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括電話。
213.根據(jù)權(quán)利要求210所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括傳呼機(jī)。
214.根據(jù)權(quán)利要求210所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括個(gè)人數(shù)字助理。
215.根據(jù)權(quán)利要求209所述的計(jì)算機(jī)可讀介質(zhì),其中分析所述關(guān)聯(lián)記錄的步驟包括在至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)上復(fù)制所述關(guān)聯(lián)記錄;根據(jù)工作負(fù)荷標(biāo)準(zhǔn)將接收數(shù)據(jù)分配給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)以進(jìn)行分析;以及從至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)發(fā)出基于所述用戶定義警告規(guī)則的警告。
216.根據(jù)權(quán)利要求187所述的計(jì)算機(jī)可讀介質(zhì),還包括在利用算法之前將接收數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)化消息格式的步驟。
217.根據(jù)權(quán)利要求187所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括保留各個(gè)標(biāo)識(shí)的屬性。
218.根據(jù)權(quán)利要求217所述的計(jì)算機(jī)可讀介質(zhì),其中保留各條記錄的屬性的步驟包括保留以下各項(xiàng)的識(shí)別信息提供各條記錄的源系統(tǒng),以及表示所述源系統(tǒng)中的各條記錄的唯一標(biāo)識(shí)。
219.根據(jù)權(quán)利要求217所述的計(jì)算機(jī)可讀介質(zhì),其中保留各條記錄的屬性的步驟包括保留查詢系統(tǒng)和特定用戶的識(shí)別信息。
220.根據(jù)權(quán)利要求187所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括在數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)。
221.根據(jù)權(quán)利要求220所述的計(jì)算機(jī)可讀介質(zhì),其中在數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)的步驟包括將所述多個(gè)標(biāo)識(shí)中的至少一個(gè)與以下各項(xiàng)之一進(jìn)行比較用戶定義的標(biāo)準(zhǔn),以及數(shù)據(jù)庫(kù)和列表之一中的至少一個(gè)數(shù)據(jù)集。
222.根據(jù)權(quán)利要求221所述的計(jì)算機(jī)可讀介質(zhì),其中所比較的標(biāo)識(shí)是所述多個(gè)實(shí)體中的至少一個(gè)實(shí)體的名稱,并且所述數(shù)據(jù)集位于名稱根列表中。
223.根據(jù)權(quán)利要求221所述的計(jì)算機(jī)可讀介質(zhì),其中所比較的標(biāo)識(shí)是所述多個(gè)實(shí)體中的至少一個(gè)實(shí)體的地址,并且所述數(shù)據(jù)集位于地址列表中。
224.根據(jù)權(quán)利要求221所述的計(jì)算機(jī)可讀介質(zhì),其中將所述標(biāo)識(shí)中的至少一個(gè)與用戶定義的標(biāo)準(zhǔn)進(jìn)行比較的步驟包括根據(jù)該用戶定義的標(biāo)準(zhǔn)對(duì)至少一個(gè)標(biāo)識(shí)進(jìn)行格式化。
225.根據(jù)權(quán)利要求220所述的計(jì)算機(jī)可讀介質(zhì),其中在數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)和在數(shù)據(jù)庫(kù)中進(jìn)行查詢中的一個(gè)之前分析接收數(shù)據(jù)的步驟包括對(duì)接收數(shù)據(jù)進(jìn)行增強(qiáng)。
226.根據(jù)權(quán)利要求225所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)接收數(shù)據(jù)進(jìn)行增強(qiáng)的步驟包括對(duì)所述次級(jí)數(shù)據(jù)庫(kù)和列表之一中的至少一個(gè)數(shù)據(jù)集進(jìn)行查詢以獲得所述接收數(shù)據(jù)的附加標(biāo)識(shí);以及使用所述附加標(biāo)識(shí)補(bǔ)充接收數(shù)據(jù)。
227.根據(jù)權(quán)利要求226所述的計(jì)算機(jī)可讀介質(zhì),其中查詢至少一個(gè)數(shù)據(jù)集的步驟包括至少一個(gè)數(shù)據(jù)庫(kù)中的至少一個(gè)數(shù)據(jù)集利用所述算法查詢附加數(shù)據(jù)庫(kù)以找到與所接收的標(biāo)識(shí)中的至少一個(gè)相關(guān)的附加標(biāo)識(shí);以及使用至少一個(gè)附加數(shù)據(jù)庫(kù)中的所述附加標(biāo)識(shí)來(lái)補(bǔ)充接收數(shù)據(jù)。
228.根據(jù)權(quán)利要求220所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括創(chuàng)建所述標(biāo)識(shí)的散列鍵。
229.根據(jù)權(quán)利要求187所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟包括根據(jù)用戶定義的標(biāo)準(zhǔn)在所述數(shù)據(jù)庫(kù)中存儲(chǔ)處理后的查詢。
230.根據(jù)權(quán)利要求229所述的計(jì)算機(jī)可讀介質(zhì),其中所述用戶定義的標(biāo)準(zhǔn)包括有效日期。
231.根據(jù)權(quán)利要求187所述的計(jì)算機(jī)可讀介質(zhì),其中利用算法的步驟還包括利用所述算法將所存儲(chǔ)的處理后的數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)。
232.根據(jù)權(quán)利要求231所述的計(jì)算機(jī)可讀介質(zhì),其中將所存儲(chǔ)的處理后的數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)的步驟是實(shí)時(shí)執(zhí)行的。
233.根據(jù)權(quán)利要求231所述的計(jì)算機(jī)可讀介質(zhì),其中將所存儲(chǔ)的處理后的數(shù)據(jù)傳送給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)的步驟是分批執(zhí)行的。
234.對(duì)于用于分離先前匹配的記錄的系統(tǒng),一種包括程序指令的計(jì)算機(jī)可讀介質(zhì),計(jì)算機(jī)執(zhí)行該程序指令以執(zhí)行包括以下步驟的方法確定表示至少一個(gè)實(shí)體的至少一條記錄中的特定標(biāo)識(shí)是否為以下各項(xiàng)之一表示至少兩個(gè)不同實(shí)體的公共交叉記錄,以及表示特定實(shí)體的一般特有記錄;以及如果特定標(biāo)識(shí)被確定為表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則分離先前基于該特定標(biāo)識(shí)而匹配的記錄。
235.根據(jù)權(quán)利要求234所述的計(jì)算機(jī)可讀介質(zhì),還包括如果特定標(biāo)識(shí)被確定為表示至少兩個(gè)不同實(shí)體的公共交叉記錄而不是表示特定實(shí)體的一般特有記錄,則禁止基于該特定標(biāo)識(shí)對(duì)記錄進(jìn)行任何另外的匹配。
236.根據(jù)權(quán)利要求234所述的計(jì)算機(jī)可讀介質(zhì),還包括重新處理所分離的記錄的步驟。
237.根據(jù)權(quán)利要求234所述的計(jì)算機(jī)可讀介質(zhì),其中確定特定標(biāo)識(shí)是表示至少兩個(gè)不同實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟以及分離先前匹配的記錄的步驟是實(shí)時(shí)執(zhí)行的。
238.根據(jù)權(quán)利要求234所述的計(jì)算機(jī)可讀介質(zhì),其中確定特定標(biāo)識(shí)是表示至少兩個(gè)實(shí)體的公共交叉記錄還是表示特定實(shí)體的一般特有記錄的步驟以及分離先前匹配的記錄的步驟是分批執(zhí)行的。
239.對(duì)于用于處理數(shù)據(jù)庫(kù)中的數(shù)據(jù)的系統(tǒng),一種包括程序指令的計(jì)算機(jī)可讀介質(zhì),計(jì)算機(jī)執(zhí)行所述程序指令以執(zhí)行包括以下步驟的方法接收包括具有至少一個(gè)標(biāo)識(shí)的至少一條記錄的數(shù)據(jù),各條記錄表示多個(gè)實(shí)體中的至少一個(gè)實(shí)體;將接收數(shù)據(jù)與存儲(chǔ)在數(shù)據(jù)庫(kù)中的至少一條記錄進(jìn)行比較,以實(shí)時(shí)地確定是否存在關(guān)聯(lián);為存儲(chǔ)在數(shù)據(jù)庫(kù)中的被確定為與接收數(shù)據(jù)的至少一部分存在關(guān)聯(lián)的各條記錄實(shí)時(shí)地創(chuàng)建關(guān)聯(lián)記錄;以及將各條關(guān)聯(lián)記錄存儲(chǔ)在數(shù)據(jù)庫(kù)中。
240.根據(jù)權(quán)利要求239所述的計(jì)算機(jī)可讀介質(zhì),還包括為各條關(guān)聯(lián)記錄實(shí)時(shí)地創(chuàng)建至少一個(gè)置信度指示符的步驟。
241.根據(jù)權(quán)利要求240所述的計(jì)算機(jī)可讀介質(zhì),其中至少一個(gè)置信度指示符表示以下兩者之間的關(guān)聯(lián)的可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄表示的實(shí)體,以及由接收數(shù)據(jù)的所述部分表示的實(shí)體。
242.根據(jù)權(quán)利要求240所述的計(jì)算機(jī)可讀介質(zhì),其中至少一個(gè)置信度指示符表示以下的可能性由與接收數(shù)據(jù)的所述部分存在關(guān)聯(lián)的特定記錄表示的實(shí)體,和由接收數(shù)據(jù)的所述部分表示的實(shí)體是相同的。
243.根據(jù)權(quán)利要求239或240所述的計(jì)算機(jī)可讀介質(zhì),還包括分析所述關(guān)聯(lián)記錄以確定所述關(guān)聯(lián)記錄是否反映先前未確定的至少一個(gè)關(guān)聯(lián)的步驟。
244.根據(jù)權(quán)利要求243所述的計(jì)算機(jī)可讀介質(zhì),其中分析所述關(guān)聯(lián)記錄的步驟包括對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析。
245.根據(jù)權(quán)利要求244所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)反映至少一個(gè)級(jí)別的分離程度的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括對(duì)滿足至少一個(gè)用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析。
246.根據(jù)權(quán)利要求245所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)滿足至少一個(gè)用戶定義的標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為最大級(jí)別的分離程度。
247.根據(jù)權(quán)利要求245所述的計(jì)算機(jī)可讀介質(zhì),其中對(duì)滿足至少一個(gè)用戶定義標(biāo)準(zhǔn)的關(guān)聯(lián)記錄進(jìn)行分析的步驟包括將所分析的關(guān)聯(lián)記錄限定為具有大于一個(gè)最小值的置信度指示符的關(guān)聯(lián)記錄。
248.根據(jù)權(quán)利要求243所述的計(jì)算機(jī)可讀介質(zhì),還包括根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告的步驟。
249.根據(jù)權(quán)利要求248所述的計(jì)算機(jī)可讀介質(zhì),其中根據(jù)至少一個(gè)用戶定義的警告規(guī)則發(fā)出警告的步驟包括通過(guò)電子通信裝置傳送警告。
250.根據(jù)權(quán)利要求249所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括電子郵件系統(tǒng)。
251.根據(jù)權(quán)利要求249所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括電話。
252.根據(jù)權(quán)利要求249所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括傳呼機(jī)。
253.根據(jù)權(quán)利要求249所述的計(jì)算機(jī)可讀介質(zhì),其中所述電子通信裝置包括個(gè)人數(shù)字助理。
254.根據(jù)權(quán)利要求248所述的計(jì)算機(jī)可讀介質(zhì),還包括以下步驟在至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)上復(fù)制所述關(guān)聯(lián)記錄;根據(jù)工作負(fù)荷標(biāo)準(zhǔn)將接收數(shù)據(jù)分配給至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)以進(jìn)行分析;以及從所述至少一個(gè)次級(jí)數(shù)據(jù)庫(kù)發(fā)出滿足用戶定義警告規(guī)則的標(biāo)準(zhǔn)的警告。
全文摘要
公開(kāi)了一種用于對(duì)進(jìn)入數(shù)據(jù)庫(kù)的數(shù)據(jù)和數(shù)據(jù)庫(kù)中的數(shù)據(jù)并進(jìn)行處理,并檢索所處理的數(shù)據(jù)的方法和系統(tǒng)。該數(shù)據(jù)包括多個(gè)實(shí)體的多個(gè)標(biāo)識(shí)。該方法和系統(tǒng)包括(a)對(duì)進(jìn)入數(shù)據(jù)庫(kù)的數(shù)據(jù)以及數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行處理,(b)在數(shù)據(jù)庫(kù)中進(jìn)行存儲(chǔ)之前對(duì)接收數(shù)據(jù)進(jìn)行增強(qiáng),(c)根據(jù)接收數(shù)據(jù)和沒(méi)有任何數(shù)據(jù)丟失的現(xiàn)有數(shù)據(jù)中的記錄之間的關(guān)聯(lián)確定并匹配記錄,(d)根據(jù)用戶定義的警告規(guī)則和關(guān)聯(lián)啟動(dòng)警告,(e)當(dāng)用于匹配記錄的標(biāo)識(shí)隨后被確定為公共交叉實(shí)體而不是一般特有實(shí)體時(shí)自動(dòng)停止另外的匹配并分離先前匹配的記錄,(f)接收用于檢索存儲(chǔ)在數(shù)據(jù)庫(kù)中的處理后數(shù)據(jù)的數(shù)據(jù)查詢,(g)利用相同的算法處理這些查詢,以及(h)將處理后的數(shù)據(jù)傳送給使用同一算法的另一數(shù)據(jù)庫(kù)。
文檔編號(hào)G06F17/30GK1656442SQ02828375
公開(kāi)日2005年8月17日 申請(qǐng)日期2002年12月27日 優(yōu)先權(quán)日2001年12月28日
發(fā)明者杰佛里·詹姆斯·喬納斯 申請(qǐng)人:杰佛里·詹姆斯·喬納斯