本發(fā)明涉及數(shù)據(jù)分析領(lǐng)域,特別涉及一種基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法和系統(tǒng)。
背景技術(shù):
隨著電子商務(wù)的發(fā)展,網(wǎng)上消費(fèi)成為一種重要的消費(fèi)模式,基于網(wǎng)絡(luò)消費(fèi)的數(shù)據(jù)分析也成為數(shù)據(jù)分析的熱門(mén)領(lǐng)域。但目前的數(shù)據(jù)分析往往來(lái)自一個(gè)領(lǐng)域,如某銀行、某商務(wù)網(wǎng)站的詳細(xì)數(shù)據(jù)分析,這些數(shù)據(jù)分析往往是用戶(hù)在具體網(wǎng)站的消費(fèi)行為,不是用戶(hù)總體的消費(fèi)行為。同時(shí)對(duì)于銀行、電子商務(wù)網(wǎng)站的分析往往是各實(shí)體分析的匯總,不是建立在同一模式下對(duì)數(shù)據(jù)的分析。由于安全和數(shù)據(jù)保護(hù)等原因,難以在同一標(biāo)準(zhǔn)體系下直接收集到所有數(shù)據(jù),這樣也難以在同一標(biāo)準(zhǔn)體系下對(duì)用戶(hù)總體網(wǎng)絡(luò)消費(fèi)及消費(fèi)服務(wù)提供方(如支付寶、銀行等支付方式和淘寶、京東等電子商務(wù)提供方)的業(yè)務(wù)進(jìn)行統(tǒng)一的網(wǎng)絡(luò)消費(fèi)建模。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法和系統(tǒng)。通過(guò)基于短信的身份驗(yàn)證特性及無(wú)需互聯(lián)網(wǎng)的可達(dá)性,利用網(wǎng)絡(luò)消費(fèi)中的通知短信可全面獲取用戶(hù)的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù),從而為網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)分析挖掘提供全面、統(tǒng)一的數(shù)據(jù)。
根據(jù)本發(fā)明的一個(gè)方面,提供一種基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法,包括:
在獲取到通知短信后,識(shí)別短信是否為網(wǎng)絡(luò)消費(fèi)通知短信;
在短信是網(wǎng)絡(luò)消費(fèi)通知短信的情況下,對(duì)短信的內(nèi)容和格式進(jìn)行解析,以生成通知短信實(shí)例;
將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中。
在一個(gè)實(shí)施例中,在獲取到通知短信后,識(shí)別短信是否為網(wǎng)絡(luò)消費(fèi)通知短信的步驟包括:
在獲取到通知短信后,對(duì)短信進(jìn)行解析以獲得短信的樣式;
在短信的樣式與網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)中的一個(gè)模式的匹配度達(dá)到相應(yīng)的匹配閾值的情況下,將短信識(shí)別為網(wǎng)絡(luò)消費(fèi)通知短信。
在一個(gè)實(shí)施例中,在將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中的步驟之后,還包括:
根據(jù)短信的樣式生成正則表達(dá)式以作為短信的模式,并設(shè)置相應(yīng)的匹配閾值;
將短信的模式及相應(yīng)的匹配閾值添加到網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)中。
在一個(gè)實(shí)施例中,通知短信實(shí)例包括短信發(fā)送方號(hào)碼、短信內(nèi)容和短信格式。
在一個(gè)實(shí)施例中,根據(jù)所獲取短信的短信發(fā)送方號(hào)碼和短信內(nèi)容,在網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中查詢(xún)相匹配的通知短信實(shí)例;
通過(guò)對(duì)查詢(xún)到的通知短信實(shí)例進(jìn)行解析,以獲得相應(yīng)的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù);
根據(jù)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)生成統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集。
在一個(gè)實(shí)施例中,根據(jù)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)生成統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集的步驟包括:
對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行處理,其中處理包括對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行數(shù)據(jù)清理以剔除無(wú)效數(shù)據(jù)、對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行相應(yīng)的數(shù)據(jù)重構(gòu)和整合、對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行安全處理以保護(hù)用戶(hù)隱私和數(shù)據(jù)安全中的至少一項(xiàng);
利用經(jīng)處理的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)生成統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集。
根據(jù)本發(fā)明的另一方面,提供一種基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的系統(tǒng),包括短信獲取模塊、短信識(shí)別模塊、短信解析模塊和網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù),其中:
短信獲取模塊,用于獲取通知短信;
短信識(shí)別模塊,用于在短信獲取模塊獲取到通知短信后,識(shí)別短信是否為網(wǎng)絡(luò)消費(fèi)通知短信;
短信解析模塊,用于在通知短信是網(wǎng)絡(luò)消費(fèi)通知短信的情況下,對(duì)短信的內(nèi)容和格式進(jìn)行解析,以生成通知短信實(shí)例,將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中。
在一個(gè)實(shí)施例中,上述系統(tǒng)還包括網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù),其中:
短信識(shí)別模塊具體在獲取到短信后,對(duì)短信進(jìn)行解析以獲得短信的樣式,在短信的樣式與網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)中的一個(gè)模式的匹配度達(dá)到相應(yīng)的匹配閾值的情況下,將短信識(shí)別為網(wǎng)絡(luò)消費(fèi)通知短信。
在一個(gè)實(shí)施例中,上述系統(tǒng)還包括模式生成模塊,其中:
模式生成模塊,用于在短信解析模塊在將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中后,根據(jù)短信的樣式生成正則表達(dá)式以作為短信的模式,并設(shè)置相應(yīng)的匹配閾值,將短信的模式及相應(yīng)的匹配閾值添加到網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)中。
在一個(gè)實(shí)施例中,通知短信實(shí)例包括短信發(fā)送方號(hào)碼、短信內(nèi)容和短信格式。
在一個(gè)實(shí)施例中,上述系統(tǒng)還包括匹配實(shí)例查詢(xún)模塊、實(shí)例解析模塊和數(shù)據(jù)集生成單元,其中:
匹配實(shí)例查詢(xún)模塊,用于根據(jù)所獲取短信的短信發(fā)送方號(hào)碼和短信內(nèi)容,在網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中查詢(xún)相匹配的通知短信實(shí)例;
實(shí)例解析模塊,用于通過(guò)對(duì)查詢(xún)到的通知短信實(shí)例進(jìn)行解析,以獲得相應(yīng)的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù);
數(shù)據(jù)集生成單元,用于根據(jù)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)生成統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集。
在一個(gè)實(shí)施例中,數(shù)據(jù)集生成單元具體對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行處理,其中處理包括對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行數(shù)據(jù)清理以剔除無(wú)效數(shù)據(jù)、對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行相應(yīng)的數(shù)據(jù)重構(gòu)和整合、對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行安全處理以保護(hù)用戶(hù)隱私和數(shù)據(jù)安全中的至少一項(xiàng),利用經(jīng)處理的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)生成統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集。
通過(guò)以下參照附圖對(duì)本發(fā)明的示例性實(shí)施例的詳細(xì)描述,本發(fā)明的其它特征及其優(yōu)點(diǎn)將會(huì)變得清楚。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法一個(gè)實(shí)施例的示意圖。
圖2為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法另一實(shí)施例的示意圖。
圖3為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法又一實(shí)施例的示意圖。
圖4為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的系統(tǒng)一個(gè)實(shí)施例的示意圖。
圖5為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的系統(tǒng)另一實(shí)施例的示意圖。
圖6為本發(fā)明網(wǎng)絡(luò)框架示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。以下對(duì)至少一個(gè)示例性實(shí)施例的描述實(shí)際上僅僅是說(shuō)明性的,決不作為對(duì)本發(fā)明及其應(yīng)用或使用的任何限制?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
除非另外具體說(shuō)明,否則在這些實(shí)施例中闡述的部件和步驟的相 對(duì)布置、數(shù)字表達(dá)式和數(shù)值不限制本發(fā)明的范圍。
同時(shí),應(yīng)當(dāng)明白,為了便于描述,附圖中所示出的各個(gè)部分的尺寸并不是按照實(shí)際的比例關(guān)系繪制的。
對(duì)于相關(guān)領(lǐng)域普通技術(shù)人員已知的技術(shù)、方法和設(shè)備可能不作詳細(xì)討論,但在適當(dāng)情況下,所述技術(shù)、方法和設(shè)備應(yīng)當(dāng)被視為授權(quán)說(shuō)明書(shū)的一部分。
在這里示出和討論的所有示例中,任何具體值應(yīng)被解釋為僅僅是示例性的,而不是作為限制。因此,示例性實(shí)施例的其它示例可以具有不同的值。
應(yīng)注意到:相似的標(biāo)號(hào)和字母在下面的附圖中表示類(lèi)似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步討論。
圖1為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法一個(gè)實(shí)施例的示意圖。其中,本實(shí)施例的方法步驟包括:
步驟101,在獲取到通知短信后,識(shí)別通知短信是否為網(wǎng)絡(luò)消費(fèi)通知短信。
可選地,可從運(yùn)營(yíng)商的短信網(wǎng)關(guān)獲取通知短信。
例如,電信運(yùn)營(yíng)商的以“9”或“106”開(kāi)頭的短信為通知短信。
可選地,識(shí)別短信是否為網(wǎng)絡(luò)消費(fèi)通知短信可采用的方式為:預(yù)先設(shè)置網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù),其中在模式庫(kù)中以正則表達(dá)式的方式建立網(wǎng)絡(luò)消費(fèi)通知短信模式,每條模式對(duì)應(yīng)一個(gè)匹配閾值,當(dāng)通知短信的內(nèi)容與該庫(kù)中一條模式的匹配度達(dá)到匹配閾值時(shí),認(rèn)為該短信是網(wǎng)絡(luò)購(gòu)物和支付的通知短信;匹配閾值根據(jù)數(shù)據(jù)覆蓋率進(jìn)行動(dòng)態(tài)調(diào)整。在獲取到通知短信后,對(duì)短信進(jìn)行解析以獲得短信的樣式,在短信的樣式與網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)中的一個(gè)模式的匹配度達(dá)到相應(yīng)的匹配閾值的情況下,將短信識(shí)別為網(wǎng)絡(luò)消費(fèi)通知短信。
步驟102,在通知短信是網(wǎng)絡(luò)消費(fèi)通知短信的情況下,對(duì)通知短信的內(nèi)容和格式進(jìn)行解析,以生成通知短信實(shí)例。
可選地,通知短信實(shí)例包括短信發(fā)送方號(hào)碼、短信內(nèi)容和短信格式。
步驟103,將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中。
從而,可實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)的更新。
基于本發(fā)明上述實(shí)施例提供的基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法,在短信是網(wǎng)絡(luò)消費(fèi)通知短信的情況下,對(duì)短信的內(nèi)容和格式進(jìn)行解析,以生成通知短信實(shí)例,并將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中。從而利用網(wǎng)絡(luò)消費(fèi)中的通知短信可全面獲取用戶(hù)的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù),從而為網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)分析挖掘提供全面、統(tǒng)一的數(shù)據(jù)。
由于本發(fā)明可利用銀行、第三方支付等的短信支付通知,購(gòu)物網(wǎng)站的訂單和物流短信通知,因此可全面獲取用戶(hù)網(wǎng)絡(luò)消費(fèi)的直接數(shù)據(jù)。
圖2為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法另一實(shí)施例的示意圖。其中,本實(shí)施例的方法步驟如下:
步驟201,在獲取到通知短信后,對(duì)通知短信進(jìn)行解析以獲得通知短信的樣式。
步驟202,判斷通知短信的樣式是否與網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)中的一個(gè)模式的匹配度達(dá)到相應(yīng)的匹配閾值。
步驟203,若通知短信的樣式與網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)中的一個(gè)模式的匹配度達(dá)到相應(yīng)的匹配閾值,將短信識(shí)別為網(wǎng)絡(luò)消費(fèi)通知短信,并對(duì)通知短信的內(nèi)容和格式進(jìn)行解析,以生成通知短信實(shí)例。
步驟204,將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中,以便對(duì)網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)進(jìn)行更新。
可選地,一個(gè)短信發(fā)送方號(hào)碼可對(duì)應(yīng)多條實(shí)例。
步驟205,根據(jù)通知短信的樣式生成正則表達(dá)式以作為通知短信的模式,并設(shè)置相應(yīng)的匹配閾值。
步驟206,將通知短信的模式及相應(yīng)的匹配閾值添加到網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)中,以便對(duì)網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)進(jìn)行更新。
通過(guò)上述處理,可根據(jù)所獲取的短信對(duì)網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)和網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)進(jìn)行更新,以便于后續(xù)處理。
圖3為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的方法又一實(shí)施例 的示意圖。其中,本實(shí)施例的方法步驟包括:
步驟301,獲取通知短信。
步驟302,在獲取到通知短信后,根據(jù)所獲取通知短信的短信發(fā)送方號(hào)碼和短信內(nèi)容,在網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中查詢(xún)相匹配的通知短信實(shí)例。
步驟303,通過(guò)對(duì)查詢(xún)到的通知短信實(shí)例進(jìn)行解析,以獲得相應(yīng)的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)。
步驟304,根據(jù)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)生成統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集。
可選地,對(duì)獲得的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行處理,其中處理包括對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行數(shù)據(jù)清理以剔除無(wú)效數(shù)據(jù)、對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行相應(yīng)的數(shù)據(jù)重構(gòu)和整合、對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行安全處理(例如數(shù)據(jù)模糊處理)以保護(hù)用戶(hù)隱私和數(shù)據(jù)安全中的至少一項(xiàng),然后利用經(jīng)處理的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)生成統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集。
通過(guò)建立統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集,可便于系統(tǒng)外部的數(shù)據(jù)分析挖掘系統(tǒng)使用。
圖4為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的系統(tǒng)一個(gè)實(shí)施例的示意圖。其中,該系統(tǒng)可包括短信獲取模塊401、短信識(shí)別模塊402、短信解析模塊403和網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)404。其中:
短信獲取模塊401獲取通知短信。
短信識(shí)別模塊402在短信獲取模塊401獲取到通知短信后,識(shí)別通知短信是否為網(wǎng)絡(luò)消費(fèi)通知短信。
短信解析模塊403在通知短信是網(wǎng)絡(luò)消費(fèi)通知短信的情況下,對(duì)該短信的內(nèi)容和格式進(jìn)行解析,以生成通知短信實(shí)例,將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)404中。
可選地,通知短信實(shí)例包括短信發(fā)送方號(hào)碼、短信內(nèi)容和短信格式。
基于本發(fā)明上述實(shí)施例提供的基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的系統(tǒng),在短信是網(wǎng)絡(luò)消費(fèi)通知短信的情況下,對(duì)短信的內(nèi)容和格式進(jìn)行解析,以生成通知短信實(shí)例,并將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中。從而利用網(wǎng)絡(luò)消費(fèi)中的通知短信可全面獲取用戶(hù)的 網(wǎng)絡(luò)消費(fèi)數(shù)據(jù),從而為網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)分析挖掘提供全面、統(tǒng)一的數(shù)據(jù)。
圖5為本發(fā)明基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的系統(tǒng)另一實(shí)施例的示意圖,其中短信獲取模塊501、短信識(shí)別模塊502、短信解析模塊503和網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)504與圖4所示實(shí)施例中涉及的短信獲取模塊401、短信識(shí)別模塊402、短信解析模塊403和網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)404相同,此外,系統(tǒng)還包括網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)505。其中
短信識(shí)別模塊502具體在獲取到通知短信后,對(duì)通知短信進(jìn)行解析以獲得短信的樣式,在短信的樣式與網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)505中的一個(gè)模式的匹配度達(dá)到相應(yīng)的匹配閾值的情況下,將通知短信識(shí)別為網(wǎng)絡(luò)消費(fèi)通知短信。
可選地,該系統(tǒng)還可包括模式生成模塊506,用于在短信解析模塊503在將生成的通知短信實(shí)例添加到網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中后,根據(jù)短信的樣式生成正則表達(dá)式以作為短信的模式,并設(shè)置相應(yīng)的匹配閾值,將短信的模式及相應(yīng)的匹配閾值添加到網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)505中,以便對(duì)網(wǎng)絡(luò)消費(fèi)通知短信模式庫(kù)505進(jìn)行更新。
可選地,該系統(tǒng)還可包括匹配實(shí)例查詢(xún)模塊507、實(shí)例解析模塊508和數(shù)據(jù)集生成單元509。其中:
匹配實(shí)例查詢(xún)模塊507根據(jù)所獲取通知短信的短信發(fā)送方號(hào)碼和短信內(nèi)容,在網(wǎng)絡(luò)消費(fèi)通知短信實(shí)例庫(kù)中查詢(xún)相匹配的通知短信實(shí)例。
實(shí)例解析模塊508通過(guò)對(duì)查詢(xún)到的通知短信實(shí)例進(jìn)行解析,以獲得相應(yīng)的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)。
數(shù)據(jù)集生成單元509根據(jù)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)生成統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集。
可選地,數(shù)據(jù)集生成單元509具體對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行處理,其中處理包括對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行數(shù)據(jù)清理以剔除無(wú)效數(shù)據(jù)、對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行相應(yīng)的數(shù)據(jù)重構(gòu)和整合、對(duì)網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)進(jìn)行安全處理以保護(hù)用戶(hù)隱私和數(shù)據(jù)安全中的至少一項(xiàng),利用經(jīng)處理的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)生成統(tǒng)一的網(wǎng)絡(luò)消費(fèi)數(shù)據(jù)集。
如圖6所示,通過(guò)本發(fā)明上述任一實(shí)施例涉及的基于通知短信獲取網(wǎng)絡(luò)消費(fèi)信息的系統(tǒng)602,從電信運(yùn)營(yíng)商的短信網(wǎng)關(guān)601獲取通知短信,并在該通知短信為網(wǎng)絡(luò)消費(fèi)通知短信時(shí)進(jìn)行相應(yīng)的處理,以生成與網(wǎng)絡(luò)消費(fèi)相關(guān)的統(tǒng)一數(shù)據(jù)集。最后將該數(shù)據(jù)集提供給數(shù)據(jù)分析挖掘系統(tǒng)603以進(jìn)行相應(yīng)的數(shù)據(jù)分析和數(shù)據(jù)挖掘。
通過(guò)實(shí)施本發(fā)明,可以得到以下有益效果:
1.數(shù)據(jù)基于網(wǎng)絡(luò)消費(fèi)中實(shí)際的支付和訂單信息的短信通知,真實(shí)可靠、數(shù)據(jù)全面;
2.數(shù)據(jù)來(lái)自統(tǒng)一的網(wǎng)絡(luò)通知短信,數(shù)據(jù)采集方式統(tǒng)一;
3.采用模式匹配和自動(dòng)解析的方式,效率高。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過(guò)硬件來(lái)完成,也可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。
本發(fā)明的描述是為了示例和描述起見(jiàn)而給出的,而并不是無(wú)遺漏的或者將本發(fā)明限于所公開(kāi)的形式。很多修改和變化對(duì)于本領(lǐng)域的普通技術(shù)人員而言是顯然的。選擇和描述實(shí)施例是為了更好說(shuō)明本發(fā)明的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計(jì)適于特定用途的帶有各種修改的各種實(shí)施例。