欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種信息匹配方法、裝置及電子設(shè)備的制造方法

文檔序號(hào):10665809閱讀:465來(lái)源:國(guó)知局
一種信息匹配方法、裝置及電子設(shè)備的制造方法
【專(zhuān)利摘要】本發(fā)明實(shí)施例公開(kāi)了一種信息匹配方法,包括:獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)信息;將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息;確定所述字段信息之間的信息相似度;根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配。本發(fā)明實(shí)施例還公開(kāi)了一種信息匹配裝置及電子設(shè)備。采用本發(fā)明實(shí)施例,實(shí)現(xiàn)信息的統(tǒng)一性,保障信息匹配的準(zhǔn)確性,減少運(yùn)營(yíng)工作量。
【專(zhuān)利說(shuō)明】
_種信息匹配方法、裝置及電子設(shè)備
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種信息匹配方法、裝置及電子設(shè)備。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)的迅速發(fā)展,各種信息層出不窮,如果對(duì)每種信息進(jìn)行存儲(chǔ),勢(shì)必需要占用大量的存儲(chǔ)空間,其中有些信息極其相似,信息內(nèi)容完全匹配,可以將這些完全匹配的信息建立統(tǒng)一關(guān)系,來(lái)減少信息的存儲(chǔ)量。例如,現(xiàn)在很多體育賽事網(wǎng)站都公布有賽事信息(比如,國(guó)外足球聯(lián)賽),雖然有時(shí)是同一場(chǎng)比賽,由于翻譯標(biāo)準(zhǔn)不統(tǒng)一,導(dǎo)致國(guó)內(nèi)很多網(wǎng)站會(huì)顯示不同的球隊(duì)信息,用戶(hù)需要分別對(duì)這些不同的信息進(jìn)行識(shí)別處理,占用大量運(yùn)營(yíng)工作量。

【發(fā)明內(nèi)容】

[0003]本發(fā)明實(shí)施例提供一種信息匹配方法、裝置及電子設(shè)備??梢越鉀Q信息不統(tǒng)一,占用運(yùn)營(yíng)工作量的問(wèn)題。
[0004]本發(fā)明實(shí)施例提供了一種信息匹配方法,包括:
[0005]獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)信息;
[0006]將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息;
[0007]確定所述字段信息之間的信息相似度;
[0008]根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配。
[0009]其中,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息,所述數(shù)據(jù)信息包括中文信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括英文字母,所述確定所述字段信息之間的信息相似度包括:
[0010]確定所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù);
[0011]根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度。
[0012]其中,所述根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度包括:
[0013]選擇所述第一字段信息的英文字母的個(gè)數(shù)以及所述第二字段信息的英文字母的個(gè)數(shù)中數(shù)量較少的一個(gè)作為基準(zhǔn)參數(shù);
[0014]將所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù)除以所述基準(zhǔn)參數(shù)得到計(jì)算得到比例值;
[0015]將單位值I減去所述比例值,計(jì)算得到所述第一字段信息與所述第二字段信息之間的信息相似度。
[0016]其中,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息,所述數(shù)據(jù)信息包括時(shí)間信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括標(biāo)準(zhǔn)時(shí)間格式,所述確定所述字段信息之間的信息相似度包括:
[0017]判斷轉(zhuǎn)化為所述標(biāo)準(zhǔn)時(shí)間格式的第一字段信息與第二字段信息是否一致;
[0018]所述確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配包括:
[0019]若所述第一字段信息與所述第二字段信息一致,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。
[0020]其中,所述根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配包括:
[0021]判斷所述第一字段信息與所述第二字段信息之間的信息相似度是否大于預(yù)設(shè)閾值;
[0022]若所述第一字段信息與所述第二字段信息之間的信息相似度大于所述預(yù)設(shè)閾值,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。
[0023]相應(yīng)地,本發(fā)明實(shí)施例提供了一種信息匹配裝置,包括:
[0024]信息獲取模塊,用于獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)信息;
[0025]信息轉(zhuǎn)化模塊,用于將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息;
[0026]信息確定模塊,用于確定所述字段信息之間的信息相似度;
[0027]信息匹配模塊,用于根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配。
[0028]其中,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息,所述數(shù)據(jù)信息包括中文信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括英文字母,所述信息確定模塊包括:
[0029]個(gè)數(shù)確定單元,用于確定所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù);
[0030]信息計(jì)算單元,用于根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度。
[0031 ]其中,所述信息計(jì)算單元具體用于:
[0032]選擇所述第一字段信息的英文字母的個(gè)數(shù)以及所述第二字段信息的英文字母的個(gè)數(shù)中數(shù)量較少的一個(gè)作為基準(zhǔn)參數(shù);
[0033]將所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù)除以所述基準(zhǔn)參數(shù)得到計(jì)算得到比例值;
[0034]將單位值I減去所述比例值,計(jì)算得到所述第一字段信息與所述第二字段信息之間的信息相似度。
[0035]其中,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息,所述數(shù)據(jù)信息包括時(shí)間信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括標(biāo)準(zhǔn)時(shí)間格式,所述信息確定模塊具體用于:
[0036]判斷轉(zhuǎn)化為所述標(biāo)準(zhǔn)時(shí)間格式的第一字段信息與第二字段信息是否一致;
[0037]所述信息匹配模塊具體用于:
[0038]若所述第一字段信息與所述第二字段信息一致,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。
[0039]其中,所述信息匹配模塊具體用于:
[0040]判斷所述第一字段信息與所述第二字段信息之間的信息相似度是否大于預(yù)設(shè)閾值;
[0041]若所述第一字段信息與所述第二字段信息之間的信息相似度大于所述預(yù)設(shè)閾值,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。
[0042]相應(yīng)地,本發(fā)明實(shí)施例提供了一種電子設(shè)備,包括:處理器、存儲(chǔ)器、通信接口和總線;
[0043]所述處理器、所述存儲(chǔ)器和所述通信接口通過(guò)所述總線連接并完成相互間的通
?目;
[0044]所述存儲(chǔ)器存儲(chǔ)可執(zhí)行程序代碼;
[0045]所述處理器通過(guò)讀取所述存儲(chǔ)器中存儲(chǔ)的可執(zhí)行程序代碼來(lái)運(yùn)行與所述可執(zhí)行程序代碼對(duì)應(yīng)的程序,以用于:
[0046]獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)信息;
[0047]將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息;
[0048]確定所述字段信息之間的信息相似度;
[0049]根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配。
[0050]實(shí)施本發(fā)明實(shí)施例,首先獲取多種數(shù)據(jù)信息,然后將至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息;其次確定字段信息之間的信息相似度;最后根據(jù)字段信息之間的信息相似度,確定至少兩個(gè)數(shù)據(jù)信息是否匹配。通過(guò)將不同的數(shù)據(jù)信息轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息,來(lái)確定多個(gè)數(shù)據(jù)信息之間相似度,從而將完全匹配的數(shù)據(jù)信息建立統(tǒng)一關(guān)系,并保障信息的準(zhǔn)確性,減少運(yùn)營(yíng)工作量。
【附圖說(shuō)明】
[0051]為了更清楚地說(shuō)明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0052]圖1是本發(fā)明提出的一種信息匹配方法的第一實(shí)施例流程圖;
[0053]圖2是本發(fā)明提出的一種信息匹配方法的第二實(shí)施例流程圖;
[0054]圖3是本發(fā)明實(shí)施例提出的一種信息匹配裝置的結(jié)構(gòu)示意圖;
[0055]圖4是本發(fā)明實(shí)施例提供的裝置中信息確定模塊的結(jié)構(gòu)示意圖;
[0056]圖5是本發(fā)明實(shí)施例提出的一種電子設(shè)備的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0057]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0058]請(qǐng)參考圖1,圖1是本發(fā)明提出的一種信息匹配方法的第一實(shí)施例流程圖。如圖所示,本發(fā)明實(shí)施例中的方法包括:
[0059]SlOl,獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)信息。
[0060]具體實(shí)現(xiàn)中,可以從多個(gè)網(wǎng)絡(luò)服務(wù)器采集多種數(shù)據(jù)信息,其中,數(shù)據(jù)信息包括球隊(duì)信息、比分信息以及時(shí)間信息等等,數(shù)據(jù)信息可以為中文簡(jiǎn)體、中文繁體或中英文的數(shù)據(jù)類(lèi)型。
[0061]S102,將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息。
[0062]具體實(shí)現(xiàn)中,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括英文字母或者數(shù)字,可以將中文簡(jiǎn)體、中文繁體或中英文的數(shù)據(jù)信息轉(zhuǎn)化為英文字母的字段信息。例如,從兩個(gè)不同的網(wǎng)站采集到“博萊”和“比爾森”、“博雷斯拉夫”和“皮爾森”的賽事信息,“博萊”拼音轉(zhuǎn)換后為“BO,LAI”,“博雷斯拉夫”拼音轉(zhuǎn)換后為“B0,LEI,SI,LA,F(xiàn)U”,“比爾森”拼音轉(zhuǎn)換后為“BI,ER,SEN”,“皮爾森”拼音轉(zhuǎn)換后為“PI,ER,SEN”。
[0063]S103,確定所述字段信息之間的信息相似度。
[0064]具體實(shí)現(xiàn)中,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息,所述數(shù)據(jù)信息包括中文信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括英文字母,可以確定所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù);根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度。
[0065]進(jìn)一步的,可以選擇所述第一字段信息的英文字母的個(gè)數(shù)以及所述第二字段信息的英文字母的個(gè)數(shù)中數(shù)量較少的一個(gè)作為基準(zhǔn)參數(shù);將所述第一字段信息與所述第二字段信息中不同的英文字母的個(gè)數(shù)除以所述基準(zhǔn)參數(shù)得到計(jì)算得到比例值;將單位值I減去所述比例值,計(jì)算得到所述第一字段信息與所述第二字段信息之間的信息相似度。
[0066]例如:比較“比爾森(BI,ER,SEN)”和“皮爾森(PI,ER,SEN)”,兩者均包括三個(gè)拼音字段,分別比較三個(gè)拼音字段,第一個(gè)拼音字段“BI”和“PI”中有一個(gè)字符不相同,第二個(gè)拼音字段“ER”和第三個(gè)拼音字段“SEN”相同,因此,不同的拼音字符在第一個(gè)拼音字段中的所占比例為1/2,在整個(gè)拼音字段中所占比例為1/2*1/3 = 1/6,比爾森(BI,ER,SEN)”和“皮爾森(PI,ER,SEN)”的信息相似度為l-l/6 = 5/6,其中,英文字母包括拼音字符。
[0067]又如:比較“博萊(BO,LAI),,和“博雷斯拉夫(BO,LEI,SI,LA,F(xiàn)U)”,第一字段信息包括二個(gè)拼音字段,第二字段信息包括五個(gè)拼音字段,選擇2為基準(zhǔn)參數(shù),分別比較前二個(gè)拼音字段,第一個(gè)拼音字段“B0”相同,第二個(gè)拼音字段“LAI”和“LEI”中有一個(gè)拼音字符不相同,因此,不同的拼音字符在第二個(gè)拼音字段中的所占比例為1/3,在整個(gè)拼音字段中所占比例為1/3*1/2=1/6,“博萊(80,1^1)”和“博雷斯拉夫(80,1^1,51,1^{1])”信息相似度為l-l/6 = 5/6o
[0068]因此,對(duì)于采集的“博萊”對(duì)陣“比爾森”、“博雷斯拉夫”對(duì)陣“皮爾森”的兩場(chǎng)賽事信息,“博萊”和“博雷斯拉夫”的信息相似度為5/6,“比爾森”和“皮爾森”的信息相似度為5/6,則該兩場(chǎng)賽事信息的信息相似度為5/6*50 % +5/6*50 % = 5/6。
[0069]可選的,所述數(shù)據(jù)信息包括時(shí)間信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型可以包括標(biāo)準(zhǔn)時(shí)間格式,標(biāo)準(zhǔn)時(shí)間格式可以為國(guó)際標(biāo)準(zhǔn)統(tǒng)一時(shí)間,由于各個(gè)網(wǎng)站的數(shù)據(jù)信息顯示的是各自系統(tǒng)自帶的時(shí)間,導(dǎo)致有時(shí)可能是同一比賽信息,但是顯示時(shí)間不同,可以將所述第一時(shí)間信息轉(zhuǎn)化為標(biāo)準(zhǔn)時(shí)間格式的第一字段信息,以及將所述第二時(shí)間信息轉(zhuǎn)化標(biāo)準(zhǔn)時(shí)間格式的第二字段信息,判斷轉(zhuǎn)化為所述標(biāo)準(zhǔn)時(shí)間格式的第一字段信息與第二字段信息是否一致。
[0070]需要說(shuō)明的是,如果確定三個(gè)以上的字段信息,可以?xún)蓛杀容^來(lái)確定每?jī)蓚€(gè)字段信息之間的信息相似度,進(jìn)而確定該三個(gè)以上的字段信息之間的信息相似度。
[0071]S104,根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配。
[0072]具體實(shí)現(xiàn)中,可以判斷所述第一字段信息與所述第二字段信息之間的信息相似度是否大于預(yù)設(shè)閾值;若所述第一字段信息與所述第二字段信息之間的信息相似度大于所述預(yù)設(shè)閾值,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配,其中,預(yù)設(shè)閾值可以為80%或90%,但不局限于上述值?;蛘?,若第一字段信息與第二字段信息一致,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。
[0073]在本發(fā)明實(shí)施例中,首先獲取多種數(shù)據(jù)信息,然后將至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息;其次確定字段信息之間的信息相似度;最后根據(jù)字段信息之間的信息相似度,確定至少兩個(gè)數(shù)據(jù)信息是否匹配。通過(guò)將不同的數(shù)據(jù)信息轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息,來(lái)確定多個(gè)數(shù)據(jù)信息之間相似度,從而將完全匹配的數(shù)據(jù)信息建立統(tǒng)一關(guān)系,并保障信息的準(zhǔn)確性,減少運(yùn)營(yíng)工作量。
[0074]請(qǐng)參考圖2,圖2是本發(fā)明提出的一種信息匹配方法的第二實(shí)施例流程圖。如圖所示,本發(fā)明實(shí)施例中的方法包括:
[0075]S201,獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息。
[0076]具體實(shí)現(xiàn)中,可以從多個(gè)網(wǎng)絡(luò)服務(wù)器采集多種數(shù)據(jù)信息,其中,數(shù)據(jù)信息包括球隊(duì)信息、比分信息以及時(shí)間信息等等,數(shù)據(jù)信息可以為中文簡(jiǎn)體、中文繁體或中英文的數(shù)據(jù)類(lèi)型。
[0077]S202,將所述第一數(shù)據(jù)信息轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的第一字段信息,以及將所述第二字段信息轉(zhuǎn)化為所述預(yù)設(shè)數(shù)據(jù)類(lèi)型的第二字段信息。
[0078]具體實(shí)現(xiàn)中,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括拼音、全英文或者數(shù)字,可以將中文簡(jiǎn)體、中文繁體或中英文的數(shù)據(jù)信息轉(zhuǎn)化為英文字母的字段信息。例如,從兩個(gè)不同的網(wǎng)站采集到“博萊”和“比爾森”、“博雷斯拉夫”和“皮爾森”的賽事信息,“博萊”拼音轉(zhuǎn)換后為“BO,LAI”,“博雷斯拉夫”拼音轉(zhuǎn)換后為“B0,LEI,SI,LA,F(xiàn)U”,“比爾森”拼音轉(zhuǎn)換后為“BI,ER,SEN”,“皮爾森”拼音轉(zhuǎn)換后為“PI,ER,SEN”。
[0079]S203,確定所述第一字段信息與所述第二字段信息之間的信息相似度。
[0080]具體實(shí)現(xiàn)中,可以可以確定所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù);根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度。
[0081]進(jìn)一步的,可以選擇所述第一字段信息的英文字母的個(gè)數(shù)以及所述第二字段信息的英文字母的個(gè)數(shù)中數(shù)量較少的一個(gè)作為基準(zhǔn)參數(shù);將所述第一字段信息與所述第二字段信息中不同的英文字母的個(gè)數(shù)除以所述基準(zhǔn)參數(shù)得到計(jì)算得到比例值;將單位值I減去所述比例值,計(jì)算得到所述第一字段信息與所述第二字段信息之間的信息相似度。
[0082]例如:比較“比爾森(BI,ER,SEN)”和“皮爾森(PI,ER,SEN)”,兩者均包括三個(gè)拼音字段,分別比較三個(gè)拼音字段,第一個(gè)拼音字段“BI”和“PI”中有一個(gè)字符不相同,第二個(gè)拼音字段“ER”和第三個(gè)拼音字段“SEN”相同,因此,不同的拼音字符在第一個(gè)拼音字段中的所占比例為1/2,在整個(gè)拼音字段中所占比例為1/2*1/3 = 1/6,比爾森(BI,ER,SEN)”和“皮爾森(PI,ER,SEN)”的信息相似度為1_1/6 = 5/6。
[0083]又如:比較“博萊(80,1^1)”和“博雷斯拉夫(80,1^1,51,1^刊)”,第一字段信息包括二個(gè)拼音字段,第二字段信息包括五個(gè)拼音字段,選擇2為基準(zhǔn)參數(shù),分別比較前二個(gè)拼音字段,第一個(gè)拼音字段“B0”相同,第二個(gè)拼音字段“LAI”和“LEI”中有一個(gè)拼音字符不相同,因此,不同的拼音字符在第二個(gè)拼音字段中的所占比例為1/3,在整個(gè)拼音字段中所占比例為1/3*1/2=1/6,“博萊(80,1^1)”和“博雷斯拉夫(80,1^1,51,1^{1])”信息相似度為l-l/6 = 5/6o
[0084]因此,對(duì)于采集的“博萊”對(duì)陣“比爾森”、“博雷斯拉夫”對(duì)陣“皮爾森”的兩場(chǎng)賽事信息,“博萊”和“博雷斯拉夫”的信息相似度為5/6,“比爾森”和“皮爾森”的信息相似度為5/6,則該兩場(chǎng)賽事信息的信息相似度為5/6*50 % +5/6*50 % = 5/6。
[0085]S204,判斷所述第一字段信息與所述第二字段信息之間的信息相似度是否小于第一預(yù)設(shè)閾值大于第二預(yù)設(shè)閾值。其中,第一預(yù)設(shè)閾值可以為80%或90%,第二預(yù)設(shè)閾值為60%或50%,但不局限于上述值。
[0086]S205,若所述第一字段信息與所述第二字段信息之間的信息相似度小于第一預(yù)設(shè)閾值大于第二預(yù)設(shè)閾值,則判斷第一時(shí)間信息與第二時(shí)間信息是否一致。
[0087]具體實(shí)現(xiàn)中,每場(chǎng)賽事信息不僅包括球隊(duì)名字,而且包括開(kāi)賽時(shí)間以及完賽時(shí)間等等,在判斷球隊(duì)名字信息無(wú)法完全匹配時(shí),可以判斷該賽事信息中的開(kāi)賽時(shí)間或者完賽時(shí)間是否一致,由于各個(gè)網(wǎng)站的數(shù)據(jù)信息顯示的是各自系統(tǒng)自帶的時(shí)間,導(dǎo)致有時(shí)可能是同一比賽信息,但是顯示時(shí)間不同,可以將所述第一時(shí)間信息轉(zhuǎn)化為標(biāo)準(zhǔn)時(shí)間格式的第一字段信息,以及將所述第二時(shí)間信息轉(zhuǎn)化標(biāo)準(zhǔn)時(shí)間格式的第二字段信息,判斷轉(zhuǎn)化為所述標(biāo)準(zhǔn)時(shí)間格式的第一字段信息與第二字段信息是否一致,其中,標(biāo)準(zhǔn)時(shí)間格式可以為國(guó)際標(biāo)準(zhǔn)統(tǒng)一時(shí)間。
[0088]另外,若所述第一字段信息與所述第二字段信息之間的信息相似度小于第一預(yù)設(shè)閾值,則無(wú)需執(zhí)行判斷第一時(shí)間信息與第二時(shí)間信息是否一致,確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配,若所述第一字段信息與所述第二字段信息之間的信息相似度小于第二預(yù)設(shè)閾值,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息完全不匹配。
[0089]S206,若所述第一時(shí)間信息與所述第二時(shí)間信息一致,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配,若所述第一時(shí)間信息與所述第二時(shí)間信息不一致,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息不匹配。
[0090]在本發(fā)明實(shí)施例中,首先獲取多種數(shù)據(jù)信息,然后將所述第一數(shù)據(jù)信息轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的第一字段信息,以及將所述第二字段信息轉(zhuǎn)化為所述預(yù)設(shè)數(shù)據(jù)類(lèi)型的第二字段信息;其次確定所述第一字段信息與所述第二字段信息之間的信息相似度;最后根據(jù)所述第一字段信息與所述第二字段信息之間的信息相似度,確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息是否匹配。通過(guò)將不同的數(shù)據(jù)信息轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息,來(lái)確定多個(gè)數(shù)據(jù)信息之間相似度,從而將完全匹配的數(shù)據(jù)信息建立統(tǒng)一關(guān)系,并保障信息的準(zhǔn)確性,減少運(yùn)營(yíng)工作量。
[0091]請(qǐng)參考圖3,圖3是本發(fā)明實(shí)施例提出的一種信息匹配裝置的結(jié)構(gòu)示意圖。如圖所示,本發(fā)明實(shí)施例中的裝置包括:
[0092]信息獲取模塊301,用于獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)
?目息O
[0093]具體實(shí)現(xiàn)中,可以從多個(gè)網(wǎng)絡(luò)服務(wù)器采集多種數(shù)據(jù)信息,其中,數(shù)據(jù)信息包括球隊(duì)信息、比分信息以及時(shí)間信息等等,數(shù)據(jù)信息可以為中文簡(jiǎn)體、中文繁體或中英文的數(shù)據(jù)類(lèi)型。
[0094]信息轉(zhuǎn)化模塊302,用于將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段?目息O
[0095]具體實(shí)現(xiàn)中,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括拼音、全英文或者數(shù)字,可以將中文簡(jiǎn)體、中文繁體或中英文的數(shù)據(jù)信息轉(zhuǎn)化為拼音、全英文或數(shù)字的字段信息。例如,從兩個(gè)不同的網(wǎng)站采集到“博萊”和“比爾森”、“博雷斯拉夫”和“皮爾森”的賽事信息,“博萊”拼音轉(zhuǎn)換后為uBO1LAr,“博雷斯拉夫”拼音轉(zhuǎn)換后為“Β0,LEI,SI,LA,F(xiàn)U”,“比爾森”拼音轉(zhuǎn)換后為“BI,ER,SEN”,“皮爾森”拼音轉(zhuǎn)換后為“PI,ER,SEN”。
[0096]信息確定模塊303,用于確定所述字段信息之間的信息相似度。其中,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息
[0097]具體實(shí)現(xiàn)中,如圖4所示,信息確定模塊303還可以進(jìn)一步包括:
[0098]個(gè)數(shù)確定單元401,用于確定所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù);
[0099]信息計(jì)算單元402,用于根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度。
[0100]信息計(jì)算單元402具體用于,選擇所述第一字段信息的英文字母的個(gè)數(shù)以及所述第二字段信息的英文字母的個(gè)數(shù)中數(shù)量較少的一個(gè)作為基準(zhǔn)參數(shù);將所述第一字段信息與所述第二字段信息中不同的英文字母的個(gè)數(shù)除以所述基準(zhǔn)參數(shù)得到計(jì)算得到比例值;將單位值減去所述比例值,計(jì)算得到所述第一字段信息與所述第二字段信息之間的信息相似度。
[0101]例如:比較“比爾森(BI,ER,SEN)”和“皮爾森(PI,ER,SEN)”,兩者都是三個(gè)拼音字段,分別比較三個(gè)拼音字段,第一個(gè)拼音字段“BI”和“PI”中有一個(gè)字符不相同,第二個(gè)拼音字段“ER”和第三個(gè)拼音字段“SEN”相同,因此,不同的拼音字符在第一個(gè)拼音字段中的所占比例為1/2,在整個(gè)拼音字段中所占比例為1/2*1/3=1/6,比爾森(BI,ER,SEN)”和“皮爾森(PI,ER,SEN)” 的信息相似度為 1-1/6 = 5/6。
[0102]又如:比較“博萊(80,1^1)”和“博雷斯拉夫(80,1^1,51,1^刊)”,第一字段信息包括二個(gè)拼音字段,第二字段信息包括五個(gè)拼音字段,選擇2為基準(zhǔn)參數(shù),分別比較前二個(gè)拼音字段,第一個(gè)拼音字段“B0”相同,第二個(gè)拼音字段“LAI”和“LEI”中有一個(gè)拼音字符不相同,因此,不同的拼音字符在第二個(gè)拼音字段中的所占比例為1/3,在整個(gè)拼音字段中所占比例為1/3*1/2=1/6,“博萊(80,1^1)”和“博雷斯拉夫(80,1^1,51,1^{1])”信息相似度為l-l/6 = 5/6o
[0103]因此,對(duì)于采集的“博萊”對(duì)陣“比爾森”、“博雷斯拉夫”對(duì)陣“皮爾森”的兩場(chǎng)賽事信息,“博萊”和“博雷斯拉夫”的信息相似度為5/6,“比爾森”和“皮爾森”的信息相似度為5/6,則該兩場(chǎng)賽事信息的信息相似度為5/6*50 % +5/6*50 % = 5/6。
[0104]可選的,所述數(shù)據(jù)信息包括時(shí)間信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型可以包括標(biāo)準(zhǔn)時(shí)間格式,標(biāo)準(zhǔn)時(shí)間格式可以為國(guó)際標(biāo)準(zhǔn)統(tǒng)一時(shí)間,由于各個(gè)網(wǎng)站的數(shù)據(jù)信息顯示的是各自系統(tǒng)自帶的時(shí)間,導(dǎo)致有時(shí)可能是同一比賽信息,但是顯示時(shí)間不同,可以將所述第一時(shí)間信息轉(zhuǎn)化為標(biāo)準(zhǔn)時(shí)間格式的第一字段信息,以及將所述第二時(shí)間信息轉(zhuǎn)化標(biāo)準(zhǔn)時(shí)間格式的第二字段信息,判斷轉(zhuǎn)化為所述標(biāo)準(zhǔn)時(shí)間格式的第一字段信息與第二字段信息是否一致。
[0105]信息匹配模塊304,用于根據(jù)所述第一字段信息與所述第二字段信息之間的信息相似度,確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息是否匹配。
[0106]具體實(shí)現(xiàn)中,可以判斷所述第一字段信息與所述第二字段信息之間的信息相似度是否大于預(yù)設(shè)閾值;若所述第一字段信息與所述第二字段信息之間的信息相似度大于所述預(yù)設(shè)閾值,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配,其中,預(yù)設(shè)閾值可以為80%或90%,但不局限于上述值?;蛘?,若第一字段信息與第二字段信息一致,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。
[0107]在本發(fā)明實(shí)施例中,首先獲取多種數(shù)據(jù)信息,然后將至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息;其次確定字段信息之間的信息相似度;最后根據(jù)字段信息之間的信息相似度,確定至少兩個(gè)數(shù)據(jù)信息是否匹配。通過(guò)將不同的數(shù)據(jù)信息轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息,來(lái)確定多個(gè)數(shù)據(jù)信息之間相似度,從而將完全匹配的數(shù)據(jù)信息建立統(tǒng)一關(guān)系,并保障信息的準(zhǔn)確性,減少運(yùn)營(yíng)工作量。
[0108]請(qǐng)參考圖5,圖5是本發(fā)明實(shí)施例提出的一種電子設(shè)備的結(jié)構(gòu)示意圖。如圖所示,該電子設(shè)備可以包括:至少一個(gè)處理器501,例如CPU,至少一個(gè)接收器503,至少一個(gè)存儲(chǔ)器505,至少一個(gè)發(fā)送器505,至少一個(gè)通信總線502。其中,通信總線502用于實(shí)現(xiàn)這些組件之間的連接通信。其中,本發(fā)明實(shí)施例中的接收器503和發(fā)送器505可以是有線發(fā)送端口,也可以為無(wú)線設(shè)備,例如包括天線裝置,用于與其他節(jié)點(diǎn)設(shè)備進(jìn)行信令或數(shù)據(jù)的通信。存儲(chǔ)器505可以是高速RAM存儲(chǔ)器,也可以是非不穩(wěn)定的存儲(chǔ)器(non-volatile memory),例如至少一個(gè)磁盤(pán)存儲(chǔ)器。存儲(chǔ)器505可選的還可以是至少一個(gè)位于遠(yuǎn)離前述處理器501的存儲(chǔ)裝置。存儲(chǔ)器505中存儲(chǔ)一組程序代碼,且處理器501用于調(diào)用存儲(chǔ)器中存儲(chǔ)的程序代碼,用于執(zhí)行以下操作:
[0109]獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)信息;
[0110]將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息;
[0111]確定所述字段信息之間的信息相似度;
[0112]根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配。
[0113]其中,處理器501還用于執(zhí)行如下操作步驟:
[0114]確定所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù);
[0115]根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度。
[0116]其中,處理器501還用于執(zhí)行如下操作步驟:
[0117]選擇所述第一字段信息的英文字母的個(gè)數(shù)以及所述第二字段信息的英文字母的個(gè)數(shù)中數(shù)量較少的一個(gè)作為基準(zhǔn)參數(shù);
[0118]將所述第一字段信息與所述第二字段信息中不同的英文字母的個(gè)數(shù)除以所述基準(zhǔn)參數(shù)得到計(jì)算得到比例值;
[0119]將單位值I減去所述比例值,計(jì)算得到所述第一字段信息與所述第二字段信息之間的信息相似度。
[0120]其中,處理器501還用于執(zhí)行如下操作步驟:
[0121]判斷轉(zhuǎn)化為所述標(biāo)準(zhǔn)時(shí)間格式的第一字段信息與第二字段信息是否一致;
[0122]所述確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息是否匹配包括:
[0123]若所述第一字段信息與所述第二字段信息一致,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。
[0124]其中,處理器501還用于執(zhí)行如下操作步驟:
[0125]判斷所述第一字段信息與所述第二字段信息之間的信息相似度是否大于預(yù)設(shè)閾值;
[0126]若所述第一字段信息與所述第二字段信息之間的信息相似度大于所述預(yù)設(shè)閾值,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。
[0127]需要說(shuō)明的是,對(duì)于前述的各個(gè)方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某一些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書(shū)中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
[0128]在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳細(xì)描述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。
[0129]本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:閃存盤(pán)、只讀存儲(chǔ)器(英文= Read-Only Memory,簡(jiǎn)稱(chēng):ROM)、隨機(jī)存取器(英文:Random Access Memory,簡(jiǎn)稱(chēng):RAM)、磁盤(pán)或光盤(pán)等。
[0130]以上對(duì)本發(fā)明實(shí)施例所提供的內(nèi)容下載方法及相關(guān)設(shè)備、系統(tǒng)進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書(shū)內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
【主權(quán)項(xiàng)】
1.一種信息匹配方法,其特征在于,所述方法包括: 獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)信息; 將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息; 確定所述字段信息之間的信息相似度; 根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配。2.如權(quán)利要求1所述的方法,其特征在于,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息,所述數(shù)據(jù)信息包括中文信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括英文字母,所述確定所述字段信息之間的信息相似度包括: 確定所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù); 根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度。3.如權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度包括: 選擇所述第一字段信息的英文字母的個(gè)數(shù)以及所述第二字段信息的英文字母的個(gè)數(shù)中數(shù)量較少的一個(gè)作為基準(zhǔn)參數(shù); 將所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù)除以所述基準(zhǔn)參數(shù)得到計(jì)算得到比例值; 將單位值I減去所述比例值,計(jì)算得到所述第一字段信息與所述第二字段信息之間的信息相似度。4.如權(quán)利要求1所述的方法,其特征在于,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息,所述數(shù)據(jù)信息包括時(shí)間信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括標(biāo)準(zhǔn)時(shí)間格式,所述確定所述字段信息之間的信息相似度包括: 判斷轉(zhuǎn)化為所述標(biāo)準(zhǔn)時(shí)間格式的第一字段信息與第二字段信息是否一致; 所述確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配包括: 若所述第一字段信息與所述第二字段信息一致,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。5.如權(quán)利要求2或3所述的方法,其特征在于,所述根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配包括: 判斷所述第一字段信息與所述第二字段信息之間的信息相似度是否大于預(yù)設(shè)閾值; 若所述第一字段信息與所述第二字段信息之間的信息相似度大于所述預(yù)設(shè)閾值,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。6.一種信息匹配裝置,其特征在于,所述裝置包括: 信息獲取模塊,用于獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)信息; 信息轉(zhuǎn)化模塊,用于將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息; 信息確定模塊,用于確定所述字段信息之間的信息相似度; 信息匹配模塊,用于根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配。7.如權(quán)利要求6所述的裝置,其特征在于,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息,所述數(shù)據(jù)信息包括中文信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括英文字母,所述信息確定模塊包括: 個(gè)數(shù)確定單元,用于確定所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù); 信息計(jì)算單元,用于根據(jù)所述第一字段信息的英文字母的個(gè)數(shù)、所述第二字段信息的英文字母的個(gè)數(shù),以及所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù),計(jì)算所述第一字段信息與所述第二字段信息之間的信息相似度。8.如權(quán)利要求7所述的裝置,其特征在于,所述信息計(jì)算單元具體用于: 選擇所述第一字段信息的英文字母的個(gè)數(shù)以及所述第二字段信息的英文字母的個(gè)數(shù)中數(shù)量較少的一個(gè)作為基準(zhǔn)參數(shù); 將所述第一字段信息與所述第二字段信息中不相同的英文字母的個(gè)數(shù)除以所述基準(zhǔn)參數(shù)得到計(jì)算得到比例值; 將單位值I減去所述比例值,計(jì)算得到所述第一字段信息與所述第二字段信息之間的信息相似度。9.如權(quán)利要求6所述的裝置,其特征在于,所述至少兩個(gè)數(shù)據(jù)信息包括第一數(shù)據(jù)信息以及第二數(shù)據(jù)信息,所述字段信息包括與所述第一數(shù)據(jù)信息對(duì)應(yīng)的第一字段信息以及與所述第二數(shù)據(jù)信息對(duì)應(yīng)的第二字段信息,所述數(shù)據(jù)信息包括時(shí)間信息,所述預(yù)設(shè)數(shù)據(jù)類(lèi)型包括標(biāo)準(zhǔn)時(shí)間格式,所述信息確定模塊具體用于: 判斷轉(zhuǎn)化為所述標(biāo)準(zhǔn)時(shí)間格式的第一字段信息與第二字段信息是否一致; 所述信息匹配模塊具體用于: 若所述第一字段信息與所述第二字段信息一致,則確定所述第一數(shù)據(jù)信息與所述第二數(shù)據(jù)信息匹配。10.—種電子設(shè)備,其特征在于,包括:處理器、存儲(chǔ)器、通信接□和總線; 所述處理器、所述存儲(chǔ)器和所述通信接口通過(guò)所述總線連接并完成相互間的通信; 所述存儲(chǔ)器存儲(chǔ)可執(zhí)行程序代碼; 所述處理器通過(guò)讀取所述存儲(chǔ)器中存儲(chǔ)的可執(zhí)行程序代碼來(lái)運(yùn)行與所述可執(zhí)行程序代碼對(duì)應(yīng)的程序,以用于: 獲取多種數(shù)據(jù)信息,所述多種數(shù)據(jù)信息包括至少兩個(gè)數(shù)據(jù)信息; 將所述至少兩個(gè)數(shù)據(jù)信息分別轉(zhuǎn)化為預(yù)設(shè)數(shù)據(jù)類(lèi)型的字段信息; 確定所述字段信息之間的信息相似度; 根據(jù)所述字段信息之間的信息相似度,確定所述至少兩個(gè)數(shù)據(jù)信息是否匹配。
【文檔編號(hào)】G06F17/30GK106033475SQ201610334760
【公開(kāi)日】2016年10月19日
【申請(qǐng)日】2016年5月18日
【發(fā)明人】牛銘海
【申請(qǐng)人】蘇州獎(jiǎng)多多科技有限公司
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
开阳县| 五家渠市| 哈尔滨市| 宾阳县| 哈尔滨市| 新密市| 万山特区| 东安县| 海淀区| 邛崃市| 山东| 湘西| 英德市| 新化县| 进贤县| 武川县| 保定市| 田东县| 宁陕县| 繁峙县| 灵山县| 西乡县| 南陵县| 那坡县| 郯城县| 高台县| 普陀区| 富裕县| 疏附县| 临猗县| 云霄县| 巩义市| 苍山县| 法库县| 鲜城| 阳新县| 贺州市| 塔城市| 朔州市| 望江县| 永兴县|