欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種終端設(shè)備的特征信息的提取方法及裝置與流程

文檔序號(hào):12622495閱讀:658來(lái)源:國(guó)知局
一種終端設(shè)備的特征信息的提取方法及裝置與流程

本發(fā)明涉及通信技術(shù)領(lǐng)域,特別涉及一種終端設(shè)備的特征信息的提取方法及裝置。



背景技術(shù):

隨著移動(dòng)通信技術(shù)和各種業(yè)務(wù)應(yīng)用的快速發(fā)展,國(guó)內(nèi)外涌現(xiàn)出大批移動(dòng)設(shè)備制造商,且移動(dòng)終端和移動(dòng)操作系統(tǒng)的發(fā)展變化也極為迅速。

對(duì)于運(yùn)營(yíng)商而言,能夠掌握移動(dòng)網(wǎng)絡(luò)中的這些設(shè)備信息和系統(tǒng)信息,一方面,可以更好的了解客戶(hù)信息,優(yōu)化網(wǎng)絡(luò)服務(wù);另一方面,可以通過(guò)收集各設(shè)備和系統(tǒng)的市場(chǎng)份額來(lái)更好的推廣產(chǎn)品。但是技術(shù)中提取移動(dòng)設(shè)備信息的方法及手段不夠完善,無(wú)法準(zhǔn)確提取移動(dòng)設(shè)備信息及系統(tǒng)信息。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的在于提供一種終端設(shè)備的特征信息的提取方法及裝置,使得運(yùn)營(yíng)商能夠準(zhǔn)確的提取移動(dòng)設(shè)備的特征信息,更好的優(yōu)化網(wǎng)絡(luò)服務(wù)。

為了達(dá)到上述目的,本發(fā)明實(shí)施例提供一種終端設(shè)備的特征信息的提取方法,包括:

根據(jù)終端設(shè)備的特征信息以及每個(gè)特征信息對(duì)應(yīng)的用戶(hù)代理User-Agent字符串,構(gòu)建標(biāo)識(shí)所述特征信息與所述User-Agent字符串之間的映射關(guān)系的User-Agent特征庫(kù)文件;

采集第一終端設(shè)備發(fā)送的請(qǐng)求報(bào)文,從所述請(qǐng)求報(bào)文中獲取所述第一終端設(shè)備的第一User-Agent字符串;

根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫(kù)文件中查找與所述第一User-Agent字符串對(duì)應(yīng)的第一特征信息,得到所述第一終端設(shè)備的特征信息。

其中,所述終端設(shè)備的特征信息包括分別從多個(gè)維度獲取的特征信息;其中,

所述多個(gè)維度至少包括終端設(shè)備系統(tǒng)、終端設(shè)備廠商以及終端設(shè)備型號(hào)中的至少一種。

其中,采集第一終端設(shè)備發(fā)送的請(qǐng)求報(bào)文,從所述請(qǐng)求報(bào)文中獲取所述第一終端設(shè)備的第一User-Agent字符串,具體包括:

采集第一終端設(shè)備發(fā)送的HTTP報(bào)文,從所述HTTP報(bào)文中獲取所述第一終端設(shè)備的第一User-Agent字符串。

其中,根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫(kù)文件中查找與所述第一User-Agent字符串對(duì)應(yīng)的第一特征信息,具體包括:

根據(jù)所述第一User-Agent字符串運(yùn)用多模式匹配AC算法從所述User-Agent特征庫(kù)文件中查找與所述第一User-Agent字符串對(duì)應(yīng)的第一特征信息。

其中,所述提取方法還包括:

若所述第一User-Agent字符串對(duì)應(yīng)多個(gè)第一特征信息且所述多個(gè)第一特征信息屬于同一維度的特征信息,獲取所述第一特征信息的長(zhǎng)度;

選取所述長(zhǎng)度最長(zhǎng)的第一特征信息,作為所述第一終端設(shè)備的特征信息。

本發(fā)明實(shí)施例還提供一種終端設(shè)備的特征信息的提取裝置,包括:

構(gòu)建模塊,用于根據(jù)終端設(shè)備的特征信息以及每個(gè)特征信息對(duì)應(yīng)的用戶(hù)代理User-Agent字符串,構(gòu)建標(biāo)識(shí)所述特征信息與所述User-Agent字符串之間的映射關(guān)系的User-Agent特征庫(kù)文件;

采集模塊,用于采集第一終端設(shè)備發(fā)送的請(qǐng)求報(bào)文,從所述請(qǐng)求報(bào)文中獲取所第一述終端設(shè)備的第一User-Agent字符串;

確定模塊,用于根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫(kù)文件中查找與所述第一User-Agent字符串對(duì)應(yīng)的第一特征信息,得到所述第一終端設(shè)備的特征信息。

其中,所述終端設(shè)備的特征信息包括分別從多個(gè)維度獲取的特征信息;其中,

所述多個(gè)維度至少包括終端設(shè)備系統(tǒng)、終端設(shè)備廠商以及終端設(shè)備型號(hào)中的至少一種。

其中,所述采集模塊包括:

采集子模塊,用于采集第一終端設(shè)備發(fā)送的HTTP報(bào)文,從所述HTTP報(bào)文中獲取所述第一終端設(shè)備的第一User-Agent字符串。

其中,所述確定模塊具體包括:

確定子模塊,用于根據(jù)所述第一User-Agent字符串運(yùn)用多模式匹配AC算法從所述User-Agent特征庫(kù)文件中查找與所述第一User-Agent字符串對(duì)應(yīng)的第一特征信息。

其中,所述提取裝置還包括:

獲取模塊,用于若所述第一User-Agent字符串對(duì)應(yīng)多個(gè)第一特征信息且所述多個(gè)第一特征信息屬于同一維度的特征信息,獲取所述第一特征信息的長(zhǎng)度;

信息確定模塊,用于選取所述長(zhǎng)度最長(zhǎng)的第一特征信息,作為所述第一終端設(shè)備的特征信息。

本發(fā)明的上述技術(shù)方案至少具有如下有益效果:

本發(fā)明實(shí)施例的終端設(shè)備的特征信息的提取方法及裝置中,首先構(gòu)建標(biāo)識(shí)終端設(shè)備的特征信息與User-Agent字符串之間的映射關(guān)系的User-Agent特征庫(kù)文件,進(jìn)而根據(jù)第一終端設(shè)備的待分析的User-Agent字符串從所述User-Agent特征庫(kù)文件中查找相匹配的第一特征信息,得到第一終端設(shè)備的特征信息;該提取方法通過(guò)解析User-Agent字符串,獲得相關(guān)終端設(shè)備信息的識(shí)別結(jié)果,有效的解決了運(yùn)營(yíng)商對(duì)終端設(shè)備信息獲取的需求。

附圖說(shuō)明

圖1表示本發(fā)明實(shí)施例的終端設(shè)備的特征信息的提取方法的基本步驟流程圖;

圖2表示AC算法的goto表結(jié)構(gòu)示意圖;

圖3表示AC算法的output表結(jié)構(gòu)示意圖;

圖4表示本發(fā)明實(shí)施例的終端設(shè)備的特征信息的提取方法中構(gòu)建AC特征庫(kù)文件的步驟流程圖;

圖5表示本發(fā)明實(shí)施例的終端設(shè)備的特征信息的提取方法中提取特征信息的具體步驟流程圖;

圖6表示本發(fā)明實(shí)施例的終端設(shè)備的特征信息的提取裝置的組成結(jié)構(gòu)示意圖。

具體實(shí)施方式

為使本發(fā)明要解決的技術(shù)問(wèn)題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例進(jìn)行詳細(xì)描述。

本發(fā)明針對(duì)現(xiàn)有技術(shù)中運(yùn)營(yíng)商無(wú)法準(zhǔn)確獲取終端設(shè)備信息的問(wèn)題,提供一種終端設(shè)備的特征信息的提取方法及裝置,首先構(gòu)建標(biāo)識(shí)終端設(shè)備的特征信息與User-Agent字符串之間的映射關(guān)系的User-Agent特征庫(kù)文件,進(jìn)而根據(jù)第一終端設(shè)備的待分析的User-Agent字符串從所述User-Agent特征庫(kù)文件中查找相匹配的第一特征信息,得到第一終端設(shè)備的特征信息;該提取方法通過(guò)解析User-Agent字符串,獲得相關(guān)終端設(shè)備信息的識(shí)別結(jié)果,有效的解決了運(yùn)營(yíng)商對(duì)終端設(shè)備信息獲取的需求。

如圖1所示,本發(fā)明實(shí)施例提供一種終端設(shè)備的特征信息的提取方法,包括:

步驟11,根據(jù)終端設(shè)備的特征信息以及每個(gè)特征信息對(duì)應(yīng)的用戶(hù)代理User-Agent字符串,構(gòu)建標(biāo)識(shí)所述特征信息與所述User-Agent字符串之間的映射關(guān)系的User-Agent特征庫(kù)文件;

步驟12,采集第一終端設(shè)備發(fā)送的請(qǐng)求報(bào)文,從所述請(qǐng)求報(bào)文中獲取所述第一終端設(shè)備的第一User-Agent字符串;

步驟13,根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫(kù)文件中查找與所述第一User-Agent字符串對(duì)應(yīng)的第一特征信息,得到所述第一終端設(shè)備的特征信息。

用戶(hù)代理User Agent(以下簡(jiǎn)稱(chēng)UA),是HTTP協(xié)議中的一部分,屬于頭域的組成之一,它的信息包括了硬件平臺(tái)、系統(tǒng)軟件、應(yīng)用軟件和用戶(hù)個(gè)人偏好等。如:

User-Agent:AppStore/2.0iOS/7.1.2model/iPhone3,1build/11D257(4;dt:27)

通過(guò)UA,能夠準(zhǔn)確的提取移動(dòng)設(shè)備信息。

本發(fā)明的上述實(shí)施例中,終端設(shè)備的特征信息為能夠標(biāo)識(shí)該終端設(shè)備的信 息,例如特征信息的序列號(hào)、名稱(chēng)等。且每個(gè)特征信息都存在有與之相對(duì)應(yīng)的User-Agent字符串,該User-Agent字符串即表明其特征信息的特征字串。上述User-Agent特征庫(kù)文件中將User-Agent字符串和與其對(duì)應(yīng)的特征信息一一對(duì)應(yīng)的保存,方便后續(xù)步驟的調(diào)用識(shí)別。

進(jìn)一步的,步驟12中對(duì)采集到的第一終端設(shè)備的數(shù)據(jù)域報(bào)文,獲取該數(shù)據(jù)域報(bào)文中包含的第一UA字符串,從而根據(jù)第一UA字符串,從所述UA特征庫(kù)文件中查找得到第一特征信息,該第一特征信息即為上述第一終端設(shè)備的特征信息。

具體的,為了全面的表示終端設(shè)備的特征信息,所述終端設(shè)備的特征信息包括分別從多個(gè)維度獲取的特征信息;其中,

所述多個(gè)維度至少包括終端設(shè)備系統(tǒng)、終端設(shè)備廠商以及終端設(shè)備型號(hào)中的至少一種。其中,終端設(shè)備系統(tǒng)的特征信息一般為終端系統(tǒng)的版本號(hào),終端設(shè)備廠商的特征信息一般為終端設(shè)備廠商的名字,終端設(shè)備型號(hào)的特征信息一般為終端設(shè)備的型號(hào)。

進(jìn)一步的,本發(fā)明上述實(shí)施例中,步驟12具體包括:

步驟121,采集第一終端設(shè)備發(fā)送的HTTP報(bào)文,從所述HTTP報(bào)文中獲取所述第一終端設(shè)備的第一User-Agent字符串。

本發(fā)明實(shí)施例中,由于UA是HTTP協(xié)議中的一部分,故本發(fā)明實(shí)施例僅采集第一終端設(shè)備發(fā)送的HTTP報(bào)文,從HTTP.REQ中獲取UA字符串,該UA字符串即為第一UA字符串,該UA字符串中包括了第一終端設(shè)備的系統(tǒng)軟件、硬件平臺(tái)、系統(tǒng)軟件、應(yīng)用軟件或者用戶(hù)個(gè)人偏好等。

進(jìn)一步的,本發(fā)明上述實(shí)施例中,步驟13具體包括:

步驟131,根據(jù)所述第一User-Agent字符串運(yùn)用多模式匹配AC算法從所述User-Agent特征庫(kù)文件中查找與所述第一User-Agent字符串對(duì)應(yīng)的第一特征信息。

本發(fā)明的具體實(shí)施例中,具體為基于AC算法的輕量級(jí)多模匹配引擎,對(duì)UA字符串進(jìn)行識(shí)別,獲得相關(guān)設(shè)備信息的識(shí)別結(jié)果(即特征信息)。具體的,AC算法是一個(gè)經(jīng)典的多模式匹配算法,由三部分構(gòu)成,goto表,fail表和output表。可以保證對(duì)于給定的長(zhǎng)度為n的文本和模式集合P{p1,p2,...pm},在O(n)時(shí) 間復(fù)雜度內(nèi),找到文本中的所有目標(biāo)模式,而與模式集合的規(guī)模m無(wú)關(guān)。

假如有模式集合P{he,she,his,hers},如圖2所示為該模式的goto表、如圖3所示為該模式的output表。

AC算法對(duì)文本進(jìn)行匹配的具體步驟是。一開(kāi)始,將i指向文本text[1...j]的起始位置,然后用text[i]從goto表的狀態(tài)D[0]開(kāi)始執(zhí)行狀態(tài)跳轉(zhuǎn)。如果存在可行的跳轉(zhuǎn)方案D[0][text[i]]=p,p?。?,則將i增加1,同時(shí)轉(zhuǎn)移到狀態(tài)D[p]。如果不存在可行的轉(zhuǎn)移方案,則考察狀態(tài)D[p]的fail值,如果fail[p]不等于0,則轉(zhuǎn)移到D[fail[p]],再次查看D[fail[p]][text[i]]是否等于0,直到發(fā)現(xiàn)不為0的狀態(tài)轉(zhuǎn)移方案或者對(duì)于所有經(jīng)歷過(guò)的fail狀態(tài),對(duì)于當(dāng)前輸入text[i]都沒(méi)有非0的轉(zhuǎn)移方案為止,如果確實(shí)不存在非0的轉(zhuǎn)移方案,則將i增加1,同時(shí)轉(zhuǎn)移到D[0]繼續(xù)執(zhí)行跳轉(zhuǎn)。在每次跳轉(zhuǎn)到一個(gè)狀態(tài)D[p]時(shí)(fail跳轉(zhuǎn)不算),都需要查看一下output[p]是否指向可輸出的模式串,如果有,說(shuō)明當(dāng)前位置匹配了某些模式串,將這些模式串輸出。

承續(xù)上例,本發(fā)明的上述實(shí)施例中,所述提取方法還包括:

步驟14,若所述第一User-Agent字符串對(duì)應(yīng)多個(gè)第一特征信息且所述多個(gè)第一特征信息屬于同一維度的特征信息,獲取所述第一特征信息的長(zhǎng)度;

步驟15,選取所述長(zhǎng)度最長(zhǎng)的第一特征信息,作為所述第一終端設(shè)備的特征信息。

需要說(shuō)明的是,步驟14及步驟15是為了防止同一UA字符串對(duì)應(yīng)多個(gè)第一特征信息的情況,本發(fā)明實(shí)施例是選取其中信息長(zhǎng)度最長(zhǎng)的特征信息作為第一終端的特征信息。例如,根據(jù)第一UA字符串得到的匹配特征信息分別為iphone3和iphone3,1build;則此時(shí)選取iphone3,1build作為第一終端設(shè)備的特征信息。具體的,選取長(zhǎng)度最長(zhǎng)的第一特征信息作為第一終端設(shè)備的特征信息是基于長(zhǎng)度越長(zhǎng)精度越高的原理考慮的,僅為本發(fā)明的一較佳實(shí)施例;其他的如選擇長(zhǎng)度最短的第一特征信息作為所述第一終端設(shè)備的特征信息在某種應(yīng)用場(chǎng)景下同樣適用,即其也應(yīng)屬于本發(fā)明實(shí)施例的保護(hù)范圍,其他一些預(yù)先設(shè)定的方式也同樣適用,在此不一一枚舉。

下面結(jié)合圖4及圖5對(duì)本發(fā)明實(shí)施例提供的特征信息的提取方法做詳細(xì)描述:

如圖4所示為本發(fā)明實(shí)施例中構(gòu)建UA特征庫(kù)文件的具體過(guò)程:

假設(shè)該文件從三個(gè)維度,設(shè)備系統(tǒng)system、終端設(shè)備廠商vendor以及終端設(shè)備型號(hào)brand來(lái)覆蓋終端設(shè)備的特征信息,具體步驟如下:

步驟401,事先以表格的形式分別記錄system、vendor、brand等設(shè)備信息的特征,表格中主要包括TOKEN_ID(序列號(hào))、NAME(識(shí)別結(jié)果)、PATTERN數(shù)據(jù)(UA字符串)等信息;

步驟402,構(gòu)造system表,獲取并填充表中每條記錄的TOKEN_ID、NAME和PATTERN的數(shù)據(jù);

步驟403,構(gòu)造vendor表,獲取并填充表中每條記錄的TOKEN_ID、NAME、PATTERN的數(shù)據(jù);

步驟404,構(gòu)造brand表,獲取并填充表中每條記錄的TOKEN_ID、NAME、PATTERN的數(shù)據(jù);

步驟405,根據(jù)上述三個(gè)表生成總的UA特征庫(kù)文件,流程結(jié)束。

如圖5所示為本發(fā)明實(shí)施例中提取終端設(shè)備的特征信息的具體執(zhí)行過(guò)程:

假設(shè)該文件從三個(gè)維度,設(shè)備系統(tǒng)system、終端設(shè)備廠商vendor以及終端設(shè)備型號(hào)brand來(lái)覆蓋終端設(shè)備的特征信息,當(dāng)設(shè)備特征庫(kù)中覆蓋了UA字符串中的終端設(shè)備信息時(shí)具體步驟如下:

步驟501,加載上述UA特征庫(kù)文件;

步驟502,采集HTTP報(bào)文,從HTTP.REQ中獲取第一UA字符串;

步驟503,根據(jù)第一UA字符串運(yùn)用AC算法查找上述UA特征庫(kù)文件,獲取匹配結(jié)果;

步驟504,遍歷每個(gè)匹配結(jié)果。對(duì)每個(gè)匹配結(jié)果,計(jì)算匹配部分的長(zhǎng)度;對(duì)每種類(lèi)型的識(shí)別結(jié)果,記錄本組內(nèi)匹配的特征長(zhǎng)度最長(zhǎng)的ID和長(zhǎng)度。

步驟,505,返回終端系統(tǒng)版本號(hào)。

步驟506,返回終端品牌。

步驟507,返回終端廠家,結(jié)束流程。

為了更好的實(shí)現(xiàn)上述目的,如圖6所示,本發(fā)明實(shí)施例還提供一種終端設(shè)備的特征信息的提取裝置,包括:

構(gòu)建模塊61,用于根據(jù)終端設(shè)備的特征信息以及每個(gè)特征信息對(duì)應(yīng)的用戶(hù) 代理User-Agent字符串,構(gòu)建標(biāo)識(shí)所述特征信息與所述User-Agent字符串之間的映射關(guān)系的User-Agent特征庫(kù)文件;

采集模塊62,用于采集第一終端設(shè)備發(fā)送的請(qǐng)求報(bào)文,從所述請(qǐng)求報(bào)文中獲取所第一述終端設(shè)備的第一User-Agent字符串;

確定模塊63,用于根據(jù)所述第一User-Agent字符串從所述User-Agent特征庫(kù)文件中查找與所述第一User-Agent字符串對(duì)應(yīng)的第一特征信息,得到所述第一終端設(shè)備的特征信息。

具體的,本發(fā)明的上述實(shí)施例中,所述終端設(shè)備的特征信息包括分別從多個(gè)維度獲取的特征信息;其中,

所述多個(gè)維度至少包括終端設(shè)備系統(tǒng)、終端設(shè)備廠商以及終端設(shè)備型號(hào)中的至少一種。

具體的,本發(fā)明的上述實(shí)施例中,所述采集模塊62包括:

采集子模塊,用于采集第一終端設(shè)備發(fā)送的HTTP報(bào)文,從所述HTTP報(bào)文中獲取所述第一終端設(shè)備的第一User-Agent字符串。

具體的,本發(fā)明的上述實(shí)施例中,所述確定模塊63具體包括:

確定子模塊,用于根據(jù)所述第一User-Agent字符串運(yùn)用多模式匹配AC算法從所述User-Agent特征庫(kù)文件中查找與所述第一User-Agent字符串對(duì)應(yīng)的第一特征信息。

具體的,本發(fā)明的上述實(shí)施例中,所述提取裝置還包括:

獲取模塊,用于若所述第一User-Agent字符串對(duì)應(yīng)多個(gè)第一特征信息且所述多個(gè)第一特征信息屬于同一維度的特征信息,獲取所述第一特征信息的長(zhǎng)度;

信息確定模塊,用于選取所述長(zhǎng)度最長(zhǎng)的第一特征信息,作為所述第一終端設(shè)備的特征信息。

需要說(shuō)明的是,本發(fā)明的上述實(shí)施例提供的終端設(shè)備的特征信息的提取裝置是應(yīng)用上述終端設(shè)備的特征信息的提取方法的裝置,則上述提取方法的所有實(shí)施例均適用于該提取裝置,且均能達(dá)到相同或相似的有益效果。

以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明所述原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
雷波县| 乌鲁木齐县| 临海市| 南岸区| 盱眙县| 永新县| 铜川市| 扶余县| 四会市| 平安县| 磴口县| 福鼎市| 资源县| 胶南市| 深州市| 无锡市| 峨边| 栾川县| 齐河县| 石台县| 澜沧| 黄骅市| 玛曲县| 北宁市| 常宁市| 吉木萨尔县| 达孜县| 宁河县| 调兵山市| 都昌县| 新泰市| 峨眉山市| 宾阳县| 陆丰市| 镇雄县| 遂溪县| 南川市| 宝应县| 小金县| 库车县| 铁力市|