欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

數(shù)據(jù)提取方法及裝置的制造方法

文檔序號(hào):9887632閱讀:387來(lái)源:國(guó)知局
數(shù)據(jù)提取方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信領(lǐng)域,具體而言,涉及一種數(shù)據(jù)提取方法及裝置。
【背景技術(shù)】
[0002]隨著移動(dòng)通信技術(shù)的發(fā)展,互聯(lián)網(wǎng)信息交流傳遞越來(lái)越便捷。運(yùn)營(yíng)商網(wǎng)絡(luò)的不斷優(yōu)化,速度提升,帶寬升級(jí),費(fèi)用降低,都是順應(yīng)時(shí)代的潮流。為了更好的推廣產(chǎn)品,提升用戶體驗(yàn),運(yùn)營(yíng)商迫切需要了解用戶的需求喜好等等。元數(shù)據(jù)提取可以協(xié)助了解用戶常登陸的網(wǎng)站,業(yè)務(wù)應(yīng)用,和服務(wù)器的交互內(nèi)容。運(yùn)營(yíng)商根據(jù)元數(shù)據(jù)提取的結(jié)果就能對(duì)用戶行為和用戶體驗(yàn)做跟蹤分析,統(tǒng)計(jì)熱點(diǎn)網(wǎng)站,用戶上相應(yīng)網(wǎng)站的時(shí)延、流量等信息。能更好地優(yōu)化無(wú)線網(wǎng)絡(luò),協(xié)助運(yùn)營(yíng)商提升網(wǎng)絡(luò)質(zhì)量,從而使產(chǎn)品獲得更高的價(jià)值。
[0003]簡(jiǎn)單地,用戶通過(guò)互聯(lián)網(wǎng)終端設(shè)備向服務(wù)器請(qǐng)求獲取資源,在接收和解釋請(qǐng)求消息后,服務(wù)器會(huì)返回響應(yīng)消息,問(wèn)題就是如何從海量的報(bào)文內(nèi)容中準(zhǔn)確提取出所需要的數(shù)據(jù)。現(xiàn)有的方法一般都是根據(jù)正則表達(dá)式直接匹配提取,由于在網(wǎng)絡(luò)上傳輸?shù)脑獢?shù)據(jù)信息紛繁復(fù)雜,有時(shí)候無(wú)法找到明文的特征,正則表達(dá)式無(wú)法較好地進(jìn)行配置;有時(shí)候報(bào)文數(shù)據(jù)中有多個(gè)提取目標(biāo)但是提取不全面或者是只需提取一個(gè)卻提取出很多不需要的錯(cuò)誤內(nèi)容。
[0004]針對(duì)相關(guān)技術(shù)中對(duì)目標(biāo)數(shù)據(jù)的提取不準(zhǔn)確的問(wèn)題,目前尚未提出有效的解決方案。

【發(fā)明內(nèi)容】

[0005]本發(fā)明提供了一種數(shù)據(jù)提取方法及裝置,以至少解決相關(guān)技術(shù)中對(duì)目標(biāo)數(shù)據(jù)的提取不準(zhǔn)確的問(wèn)題。
[0006]根據(jù)本發(fā)明的一個(gè)方面,提供了一種數(shù)據(jù)提取方法,包括:依據(jù)數(shù)據(jù)報(bào)文確定提取的目標(biāo)數(shù)據(jù);根據(jù)預(yù)定的正則表達(dá)式對(duì)所述報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配;在所述報(bào)文數(shù)據(jù)中存在至少兩個(gè)目標(biāo)數(shù)據(jù)的情況下,對(duì)所述至少兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取。
[0007]進(jìn)一步地,根據(jù)預(yù)定的正則表達(dá)式對(duì)所述報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配包括:在所述報(bào)文數(shù)據(jù)中具有字符串特征的情況下,根據(jù)預(yù)定的字符正則表達(dá)式對(duì)所述報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配。
[0008]進(jìn)一步地,根據(jù)預(yù)定的正則表達(dá)式對(duì)所述報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配包括:在所述報(bào)文數(shù)據(jù)中不具有字符特征的情況下,采用預(yù)定函數(shù)解析的方式解析所述報(bào)文數(shù)據(jù),解碼得到所述目標(biāo)數(shù)據(jù)。
[0009]進(jìn)一步地,對(duì)所述至少兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取包括:在對(duì)不同的所述報(bào)文數(shù)據(jù)中提取所述至少兩個(gè)目標(biāo)數(shù)據(jù)的情況下,通過(guò)預(yù)先配置的用于記錄提取成功的提取次數(shù)和/或用于記錄提取失敗的嘗試提取次數(shù)對(duì)所述目標(biāo)數(shù)據(jù)進(jìn)行提取。
[0010]進(jìn)一步地,對(duì)所述至少兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取包括:在一個(gè)報(bào)文數(shù)據(jù)有兩個(gè)提取目標(biāo)的情況下,對(duì)所述報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行多次匹配后對(duì)兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提?。缓?或,在不同報(bào)文數(shù)據(jù)有兩個(gè)提取目標(biāo)的情況下,采用預(yù)先配置的用于記錄提取成功的提取次數(shù)和/或用于記錄提取失敗的嘗試提取次數(shù)對(duì)兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取。
[0011]進(jìn)一步地,在通過(guò)預(yù)先配置的用于記錄提取成功的提取次數(shù)和/或用于記錄提取失敗的嘗試提取次數(shù)對(duì)所述目標(biāo)數(shù)據(jù)進(jìn)行提取之前,還包括:配置動(dòng)態(tài)設(shè)置接口,其中,所述動(dòng)態(tài)設(shè)置接口用于接收針對(duì)不同提取類型設(shè)置的不同提取次數(shù)和嘗試提取次數(shù)。
[0012]根據(jù)本發(fā)明的另一方面,提供了一種數(shù)據(jù)提取裝置,包括:確定模塊,用于依據(jù)數(shù)據(jù)報(bào)文確定提取的目標(biāo)數(shù)據(jù);匹配模塊,用于根據(jù)預(yù)定的正則表達(dá)式對(duì)所述報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配;提取模塊,用于在所述報(bào)文數(shù)據(jù)中存在至少兩個(gè)目標(biāo)數(shù)據(jù)的情況下,對(duì)所述至少兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取。
[0013]進(jìn)一步地,所述匹配模塊包括:匹配單元,用于在所述報(bào)文數(shù)據(jù)中具有字符串特征的情況下,根據(jù)預(yù)定的字符正則表達(dá)式對(duì)所述報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配。
[0014]進(jìn)一步地,所述匹配模塊包括:解析單元,用于在所述報(bào)文數(shù)據(jù)中不具有字符特征的情況下,采用預(yù)定函數(shù)解析的方式解析所述報(bào)文數(shù)據(jù),解碼得到所述目標(biāo)數(shù)據(jù)。
[0015]進(jìn)一步地,所述提取模塊包括:提取單元,用于在對(duì)不同的所述報(bào)文數(shù)據(jù)中提取所述至少兩個(gè)目標(biāo)數(shù)據(jù)的情況下,通過(guò)預(yù)先配置的用于記錄提取成功的提取次數(shù)和/或用于記錄提取失敗的嘗試提取次數(shù)對(duì)所述目標(biāo)數(shù)據(jù)進(jìn)行提取。
[0016]進(jìn)一步地,所述提取模塊包括:第二提取單元,用于在一個(gè)報(bào)文數(shù)據(jù)有兩個(gè)提取目標(biāo)的情況下,對(duì)所述報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行多次匹配后對(duì)兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提?。缓?或,第三提取單元,用于在不同報(bào)文數(shù)據(jù)有兩個(gè)提取目標(biāo)的情況下,采用預(yù)先配置的用于記錄提取成功的提取次數(shù)和/或用于記錄提取失敗的嘗試提取次數(shù)對(duì)兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取。
[0017]進(jìn)一步地,所述裝置還包括:配置單元,用于配置動(dòng)態(tài)設(shè)置接口,其中,所述動(dòng)態(tài)設(shè)置接口用于接收針對(duì)不同提取類型設(shè)置的不同提取次數(shù)和嘗試提取次數(shù)。
[0018]通過(guò)本發(fā)明,采用依據(jù)數(shù)據(jù)報(bào)文確定提取的目標(biāo)數(shù)據(jù);根據(jù)預(yù)定的正則表達(dá)式對(duì)所述報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配;在所述報(bào)文數(shù)據(jù)中存在至少兩個(gè)目標(biāo)數(shù)據(jù)的情況下,對(duì)所述至少兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取,解決了相關(guān)技術(shù)中對(duì)目標(biāo)數(shù)據(jù)的提取不準(zhǔn)確的問(wèn)題,進(jìn)而能夠準(zhǔn)確提取目標(biāo)數(shù)據(jù)的效果。
【附圖說(shuō)明】
[0019]此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0020]圖1是根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)提取方法的流程圖;
[0021]圖2是根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)提取裝置的框圖;
[0022]圖3是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取裝置的框圖一;
[0023]圖4是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取裝置的框圖二 ;
[0024]圖5是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取裝置的框圖三;
[0025]圖6是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取裝置的框圖四;
[0026]圖7是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取方法的流程圖一;
[0027]圖8是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取方法的流程圖二 ;
[0028]圖9是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取方法的流程圖三;
[0029]圖10是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取方法的流程圖四;
[0030]圖11是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取方法的流程圖五;
[0031]圖12是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取方法的流程圖六;
[0032]圖13是根據(jù)本發(fā)明優(yōu)選實(shí)施例的數(shù)據(jù)提取方法的流程圖七。
【具體實(shí)施方式】
[0033]下文中將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0034]在本實(shí)施例中提供了一種數(shù)據(jù)提取方法,圖1是根據(jù)本發(fā)明實(shí)施例的數(shù)據(jù)提取方法的流程圖,如圖1所示,該流程包括如下步驟:
[0035]步驟S102,依據(jù)數(shù)據(jù)報(bào)文確定提取的目標(biāo)數(shù)據(jù);
[0036]步驟S104,根據(jù)預(yù)定的正則表達(dá)式對(duì)該報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配;
[0037]步驟S106,在該報(bào)文數(shù)據(jù)中存在至少兩個(gè)目標(biāo)數(shù)據(jù)的情況下,對(duì)該至少兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取。
[0038]通過(guò)上述步驟,依據(jù)數(shù)據(jù)報(bào)文確定提取的目標(biāo)數(shù)據(jù),根據(jù)預(yù)定的正則表達(dá)式對(duì)該報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配,在該報(bào)文數(shù)據(jù)中存在至少兩個(gè)目標(biāo)數(shù)據(jù)的情況下,對(duì)該至少兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取,解決了相關(guān)技術(shù)中對(duì)目標(biāo)數(shù)據(jù)的提取不準(zhǔn)確的問(wèn)題,進(jìn)而能夠準(zhǔn)確提取目標(biāo)數(shù)據(jù)的效果。
[0039]本實(shí)施例中,根據(jù)預(yù)定的正則表達(dá)式對(duì)該報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配可以包括:在該報(bào)文數(shù)據(jù)中具有字符串特征的情況下,根據(jù)預(yù)定的字符正則表達(dá)式對(duì)該報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行匹配;和/或,在該報(bào)文數(shù)據(jù)中不具有字符特征的情況下,采用預(yù)定函數(shù)解析的方式解析該報(bào)文數(shù)據(jù),解碼得到該目標(biāo)數(shù)據(jù)。
[0040]在一個(gè)可選的實(shí)施方式中,對(duì)該至少兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取可以包括:在對(duì)不同的該報(bào)文數(shù)據(jù)中提取該至少兩個(gè)目標(biāo)數(shù)據(jù)的情況下,通過(guò)預(yù)先配置的用于記錄提取成功的提取次數(shù)和/或用于記錄提取失敗的嘗試提取次數(shù)對(duì)該目標(biāo)數(shù)據(jù)進(jìn)行提取。
[0041]進(jìn)一步地,對(duì)該至少兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取包括:在一個(gè)報(bào)文數(shù)據(jù)有兩個(gè)提取目標(biāo)的情況下,對(duì)該報(bào)文數(shù)據(jù)中的內(nèi)容進(jìn)行多次匹配后對(duì)兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取;和/或,在不同報(bào)文數(shù)據(jù)有兩個(gè)提取目標(biāo)的情況下,采用預(yù)先配置的用于記錄提取成功的提取次數(shù)和/或用于記錄提取失敗的嘗試提取次數(shù)對(duì)兩個(gè)目標(biāo)數(shù)據(jù)進(jìn)行提取。
[0042]作為一種優(yōu)選的實(shí)施方式,在通過(guò)預(yù)先配置的用于記錄提取成功的提取次數(shù)和/或用于記錄提取失敗的嘗試提取次數(shù)對(duì)該目標(biāo)數(shù)據(jù)進(jìn)行提取之前,配置動(dòng)態(tài)
當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
沈丘县| 华蓥市| 镇远县| 左权县| 叙永县| 中卫市| 贡山| 同心县| 和平区| 门头沟区| 博乐市| 长白| 婺源县| 二连浩特市| 烟台市| 唐海县| 曲阜市| 青河县| 霍山县| 岳西县| 宁波市| 南昌县| 吐鲁番市| 鄂州市| 阜宁县| 三江| 瑞昌市| 济阳县| 绥棱县| 宝坻区| 永年县| 鄂州市| 宜章县| 马边| 长子县| 济宁市| 津南区| 景泰县| 磴口县| 崇文区| 巴彦淖尔市|