欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種日志數(shù)據(jù)的處理方法及裝置與流程

文檔序號:12733439閱讀:316來源:國知局
一種日志數(shù)據(jù)的處理方法及裝置與流程
本發(fā)明涉及計算機
技術(shù)領(lǐng)域
,尤其涉及一種日志數(shù)據(jù)的處理方法及裝置。
背景技術(shù)
:用戶在各種網(wǎng)站、計算機應(yīng)用、手持設(shè)備應(yīng)用及其他介質(zhì)中進行操作時產(chǎn)生的日志數(shù)據(jù)包含了用戶的行為信息,這些日志數(shù)據(jù)在理解用戶、支持業(yè)務(wù)等方面具有非常重要的價值。數(shù)據(jù)工程師從不同的角度對這些日志數(shù)據(jù)做清洗后可用于很多方面的分析。從關(guān)注用戶行為的角度整理得到的數(shù)據(jù),被稱為行為數(shù)據(jù)。對于同一個用戶,由于其使用的設(shè)備、系統(tǒng)或應(yīng)用的不同會導(dǎo)致該用戶的行為數(shù)據(jù)具有多種不同的數(shù)據(jù)結(jié)構(gòu),對于這種異構(gòu)數(shù)據(jù)表,在進行數(shù)據(jù)處理時將變得十分麻煩,對此,需要將異構(gòu)數(shù)據(jù)表盡可能地轉(zhuǎn)化為具有相同或僅存在極少量差異的同構(gòu)數(shù)據(jù)表進行數(shù)據(jù)處理。目前在業(yè)界并沒有表示用戶行為數(shù)據(jù)的統(tǒng)一標(biāo)準(zhǔn),因此當(dāng)前的現(xiàn)狀是:即便是在同一家公司,不同業(yè)務(wù)線的數(shù)據(jù)工程師開發(fā)的用戶行為數(shù)據(jù)表結(jié)構(gòu)、命名風(fēng)格等也會千差萬別,也就是說,這些包含了用戶行為信息的數(shù)據(jù)表是異構(gòu)的;更糟糕的是,這些數(shù)據(jù)往往只能滿足所在業(yè)務(wù)的人員的需求,對其他業(yè)務(wù)的人員而言,可能因缺少某些感興趣的字段而無法拿來即用,仍然需要經(jīng)過一層數(shù)據(jù)加工來獲取特定的字段。這些現(xiàn)狀折射出了如下問題:(1)對于數(shù)據(jù)工程師而言,若沒有一套統(tǒng)一的行為數(shù)據(jù)的處理方法,不同業(yè)務(wù)的數(shù)據(jù)使用方提出的需求不盡相同,需要針對不同業(yè)務(wù)開發(fā)數(shù)據(jù)結(jié)構(gòu)不同的行為數(shù)據(jù)表,開發(fā)流程不通用,行為數(shù)據(jù)表的開發(fā)效率難以提高;(2)對于行為數(shù)據(jù)的使用者而言,檢索自己想要的數(shù)據(jù)表并不容易(可能因為表命名不規(guī)范,也可能因為沒有一個目錄結(jié)構(gòu)可以進行查找,導(dǎo)致或許想要的數(shù)據(jù)表是有的,但卻不容易檢索到),使用門檻也很高(可能需要自己再加工得到其他字段才能使用,而不能拿來即用);(3)對于企業(yè)而言,由于表結(jié)構(gòu)不規(guī)范、表字段不夠豐富,會導(dǎo)致同一張表會有很多有細小差異性的副本(例如不同業(yè)務(wù)的不同的角色關(guān)注的字段不一樣,數(shù)據(jù)使用者會對來源表進行個性化加工,導(dǎo)致產(chǎn)生很多副本),大大增加了不必要的數(shù)據(jù)存儲開銷。技術(shù)實現(xiàn)要素:鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的一種日志數(shù)據(jù)的處理方法及裝置,通過統(tǒng)一行為數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)將異構(gòu)日志數(shù)據(jù)表中的行為數(shù)據(jù)轉(zhuǎn)化為同構(gòu)行為數(shù)據(jù)表,達到提高數(shù)據(jù)工程師的開發(fā)效率,降低數(shù)據(jù)消費者的使用門檻,以及為企業(yè)節(jié)約數(shù)據(jù)存儲成本的目的。為達到上述目的,本發(fā)明主要提供如下技術(shù)方案:一方面,本發(fā)明提供一種日志數(shù)據(jù)的處理方法,該方法包括:根據(jù)異構(gòu)日志數(shù)據(jù)表中包含的行為構(gòu)成要素設(shè)置同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu),所述異構(gòu)日志數(shù)據(jù)表是具有不同數(shù)據(jù)結(jié)構(gòu)的多張日志數(shù)據(jù)表;根據(jù)所述同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)生成行為數(shù)據(jù)轉(zhuǎn)換代碼框架;解析所述異構(gòu)日志數(shù)據(jù)表內(nèi)的行為數(shù)據(jù)信息;將所述行為數(shù)據(jù)信息添加到所述行為數(shù)據(jù)轉(zhuǎn)換代碼框架內(nèi)的對應(yīng)位置中,得到數(shù)據(jù)轉(zhuǎn)換的可執(zhí)行代碼;執(zhí)行所述可執(zhí)行代碼得到一張以相同數(shù)據(jù)結(jié)構(gòu)存儲行為數(shù)據(jù)信息的同構(gòu)行為數(shù)據(jù)表。另一方面,本發(fā)明提供一種日志數(shù)據(jù)的處理裝置,該裝置包括:設(shè)置單元,用于根據(jù)異構(gòu)日志數(shù)據(jù)表中包含的行為構(gòu)成要素設(shè)置同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu),所述異構(gòu)日志數(shù)據(jù)表是具有不同數(shù)據(jù)結(jié)構(gòu)的多張日志數(shù)據(jù)表;生成單元,用于根據(jù)所述設(shè)置單元設(shè)置的同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)生成行為數(shù)據(jù)轉(zhuǎn)換代碼框架;解析單元,用于解析所述異構(gòu)日志數(shù)據(jù)表內(nèi)的行為數(shù)據(jù)信息;添加單元,用于將所述解析單元得到的行為數(shù)據(jù)信息添加到所述生成單元生成的行為數(shù)據(jù)轉(zhuǎn)換代碼框架內(nèi)的對應(yīng)位置中,得到數(shù)據(jù)轉(zhuǎn)換的可執(zhí)行代碼;執(zhí)行單元,用于執(zhí)行所述添加單元生成的可執(zhí)行代碼得到一張以相同數(shù)據(jù)結(jié)構(gòu)存儲行為數(shù)據(jù)信息的同構(gòu)行為數(shù)據(jù)表。借由上述技術(shù)方案,本發(fā)明提供的一種日志數(shù)據(jù)的處理方法及裝置,通過建立統(tǒng)一的行為數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn),將日志數(shù)據(jù)表中的行為數(shù)據(jù)信息進行提取、分類、存儲為標(biāo)準(zhǔn)的同構(gòu)行為數(shù)據(jù)表。能夠?qū)⒂脩粼诟鞣N網(wǎng)站、計算機應(yīng)用、手持設(shè)備應(yīng)用及其他介質(zhì)中進行操作時所生成的包含有行為數(shù)據(jù)信息的眾多異構(gòu)日志數(shù)據(jù)處理為具有清晰分類標(biāo)準(zhǔn),以及統(tǒng)一、規(guī)范的數(shù)據(jù)結(jié)構(gòu)的行為數(shù)據(jù)。以使得數(shù)據(jù)工程師具有了一套統(tǒng)一的行為數(shù)據(jù)的處理方法,不再需要針對不同的業(yè)務(wù)開發(fā)數(shù)據(jù)結(jié)構(gòu)不同的行為數(shù)據(jù)表,提高行為數(shù)據(jù)表的開發(fā)及使用效率。同時,對于行為數(shù)據(jù)的使用者,由于行為數(shù)據(jù)信息被處理為相同的數(shù)據(jù)結(jié)構(gòu)并根據(jù)統(tǒng)一的命名規(guī)則進行命名存儲,使得使用者能夠根據(jù)統(tǒng)一的檢索規(guī)則進行數(shù)據(jù)檢索,降低了消費者的使用門檻,并且,由于同構(gòu)行為數(shù)據(jù)表所具有的良好通用性,使得使用者不需要再對數(shù)據(jù)表進行修改或加工,減少了數(shù)據(jù)表副本的出現(xiàn),也大大降低了企業(yè)存儲數(shù)據(jù)的成本。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式。附圖說明通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認(rèn)為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:圖1示出了本發(fā)明實施例提出的一種日志數(shù)據(jù)的處理方法的流程圖;圖2示出了本發(fā)明實施例提出的另一種日志數(shù)據(jù)的處理方法的流程圖;圖3示出了本發(fā)明實施例提出的一種N級行為的分類方法示意圖;圖4示出了本發(fā)明實施例提出的適用于企業(yè)A的一種行為分類方法示意圖。圖5示出了本發(fā)明實施例提出的一種日志數(shù)據(jù)的處理裝置的組成框圖;圖6示出了本發(fā)明實施例提出的另一種日志數(shù)據(jù)的處理裝置的組成框圖。具體實施方式下面將參照附圖更詳細地描述本發(fā)明的示例性實施例。雖然附圖中顯示了本發(fā)明的示例性實施例,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本發(fā)明而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本發(fā)明,并且能夠?qū)⒈景l(fā)明的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。本發(fā)明實施例提供了一種日志數(shù)據(jù)的處理方法,如圖1所示,該方法具體步驟包括:101、根據(jù)異構(gòu)日志數(shù)據(jù)表中包含的行為構(gòu)成要素設(shè)置同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu),并根據(jù)該同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)生成行為數(shù)據(jù)轉(zhuǎn)換代碼框架。異構(gòu)日志數(shù)據(jù)表是指多個數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)存在較大的不同,如字段個數(shù)、順序、名稱等內(nèi)容,因此,這些日志數(shù)據(jù)表中所包含的行為數(shù)據(jù),即使是相同的行為信息,但在不同數(shù)據(jù)表中就會有不同的數(shù)據(jù)存儲結(jié)構(gòu),導(dǎo)致獲取和使用的不便。本步驟就是要在從異構(gòu)日志數(shù)據(jù)表中獲取行為數(shù)據(jù)信息之前,設(shè)置一個統(tǒng)一的表示行為數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu),通過該數(shù)據(jù)結(jié)構(gòu)來存儲不同日志數(shù)據(jù)表中的行為數(shù)據(jù)信息。設(shè)置同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)需要定義不同行為的分類,以及描述一個行為的行為構(gòu)成要素。一般情況下,能夠完整、全面地描述一個行為所必須的要素包括:行為主體、時間、環(huán)境、行為客體、場景、事件,這6個基本行為構(gòu)成要素。通過對行為的分類可以將不同日志數(shù)據(jù)表中的行為數(shù)據(jù)信息進行有效的分組,而通過對行為構(gòu)成要素的排列組合就可以確定一個通用的描述行為數(shù)據(jù)信息的數(shù)據(jù)結(jié)構(gòu)。將該數(shù)據(jù)結(jié)構(gòu)應(yīng)用于行為數(shù)據(jù)表中就可以得到同構(gòu)行為數(shù)據(jù)表。同構(gòu)行為數(shù)據(jù)表的生成,需要基于通用行為數(shù)據(jù)信息的數(shù)據(jù)結(jié)構(gòu)所編制的行為數(shù)據(jù)轉(zhuǎn)換代碼框架。而行為數(shù)據(jù)轉(zhuǎn)換代碼框架的編制,還需要對行為數(shù)據(jù)信息中的各個行為構(gòu)成要素進行有效的編碼,以供該代碼框架能夠形成可執(zhí)行的有效代碼生成同構(gòu)行為數(shù)據(jù)表。因此,本步驟中,還需要設(shè)置行為構(gòu)成要素的編碼規(guī)則,以及行為數(shù)據(jù)表的命名規(guī)則。其中,行為數(shù)據(jù)表的命名規(guī)則用于定義所生成的同構(gòu)行為數(shù)據(jù)表的名稱,而一個優(yōu)秀的命名規(guī)則能夠讓用戶以最簡單的檢索方式獲取所需要數(shù)據(jù)表??梢姡静襟E是對同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)進行定義,同時根據(jù)所定義的數(shù)據(jù)結(jié)構(gòu)制定相應(yīng)的行為數(shù)據(jù)轉(zhuǎn)換代碼框架,為后續(xù)的行為數(shù)據(jù)的采集、轉(zhuǎn)化設(shè)置標(biāo)準(zhǔn)。102、解析異構(gòu)日志數(shù)據(jù)表內(nèi)的行為數(shù)據(jù)信息。由于異構(gòu)日志數(shù)據(jù)表是指多個具有不同數(shù)據(jù)結(jié)構(gòu)的日志數(shù)據(jù)表中的一個,并且該日志數(shù)據(jù)表包含有用戶至少一種的行為數(shù)據(jù)信息,因此,在解析異構(gòu)日志數(shù)據(jù)表內(nèi)的行為數(shù)據(jù)信息時,需要對每個異構(gòu)日志數(shù)據(jù)表逐個地進行行為數(shù)據(jù)信息的解析。其中,在解析行為數(shù)據(jù)信息時,需要根據(jù)步驟101中所設(shè)置的相關(guān)標(biāo)準(zhǔn)進行解析,包括有:根據(jù)101中設(shè)置的行為分類確定行為數(shù)據(jù)信息的具體類別,分析該行為數(shù)據(jù)信息中對應(yīng)行為構(gòu)成要素的各個字段的取值,再根據(jù)對應(yīng)的編碼規(guī)則對該行為數(shù)據(jù)信息中的各個行為構(gòu)成要素進行有效編碼,以及對該行為數(shù)據(jù)信息最終所存儲的同構(gòu)行為數(shù)據(jù)表根據(jù)命名規(guī)則確定對應(yīng)的數(shù)據(jù)表名稱。103、將行為數(shù)據(jù)信息添加到行為數(shù)據(jù)轉(zhuǎn)換代碼框架內(nèi)的對應(yīng)位置中,得到數(shù)據(jù)轉(zhuǎn)換的可執(zhí)行代碼。行為數(shù)據(jù)轉(zhuǎn)換代碼框架能夠根據(jù)添加的行為數(shù)據(jù)信息生成一組可執(zhí)行代碼。需要說明的是,該行為數(shù)據(jù)轉(zhuǎn)換代碼框架所添加的行為數(shù)據(jù)信息應(yīng)為同一行為類別下的行為信息,也就是說,在向代碼框架中所添加的行為數(shù)據(jù)信息可以是源自不同日志數(shù)據(jù)表中的行為信息數(shù)據(jù),但這些行為信息數(shù)據(jù)需要滿足屬于同一個行為類別。雖然該行為數(shù)據(jù)轉(zhuǎn)換代碼框架不能同時添加不同類別的行為數(shù)據(jù)信息,但該行為據(jù)轉(zhuǎn)換代碼框架能夠適用于各種不同種類的行為數(shù)據(jù)信息的轉(zhuǎn)換,即能夠?qū)⑼活惖男袨閿?shù)據(jù)信息生成一個同構(gòu)行為數(shù)據(jù)表,也可以通過多次執(zhí)行將不同類別的行為數(shù)據(jù)生成多張同構(gòu)行為數(shù)據(jù)表,每一張數(shù)據(jù)表中存儲的是同一類別的行為數(shù)據(jù)信息。因此,該行為數(shù)據(jù)轉(zhuǎn)換代碼框架適用于所規(guī)定的所有類別的行為數(shù)據(jù),具有一定的通用性。在實際應(yīng)用中,該行為數(shù)據(jù)轉(zhuǎn)換代碼框架的通用性就體現(xiàn)在應(yīng)用該框架進行行為數(shù)據(jù)轉(zhuǎn)換的用戶可以將該框架應(yīng)用于不同的業(yè)務(wù)場景中,而無需根據(jù)不同的業(yè)務(wù)需求制定不同的代碼框架。104、執(zhí)行可執(zhí)行代碼得到一張以相同數(shù)據(jù)結(jié)構(gòu)存儲行為數(shù)據(jù)信息的同構(gòu)行為數(shù)據(jù)表。執(zhí)行步驟103得到的可執(zhí)行代碼,將所輸入的同一類行為數(shù)據(jù)信息按照步驟101所設(shè)定的數(shù)據(jù)結(jié)構(gòu)生成一張同構(gòu)行為數(shù)據(jù)表。需要說明的是,所謂的同構(gòu)行為數(shù)據(jù)表,是指具有相同的數(shù)據(jù)結(jié)構(gòu)并且存儲行為數(shù)據(jù)的數(shù)據(jù)表,每次執(zhí)行該可執(zhí)行代碼都會得到相應(yīng)行為類別的行為數(shù)據(jù)表,通過反復(fù)執(zhí)行該可執(zhí)行代碼,能夠得到存儲有不同行為類別數(shù)據(jù)的行為數(shù)據(jù)表,而這些行為數(shù)據(jù)表都具有相同的數(shù)據(jù)結(jié)構(gòu),因此,在本發(fā)明實施例中是將這些具有相同數(shù)據(jù)結(jié)構(gòu)的多張行為數(shù)據(jù)表稱為同構(gòu)行為數(shù)據(jù)表。結(jié)合上述的實現(xiàn)方式可以看出,本發(fā)明實施例所采用的一種日志數(shù)據(jù)的處理方法,通過建立統(tǒng)一的行為數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn),將日志數(shù)據(jù)表中的行為數(shù)據(jù)信息進行提取、分類、存儲為標(biāo)準(zhǔn)的同構(gòu)行為數(shù)據(jù)表。能夠?qū)⒂脩粼诟鞣N網(wǎng)站、計算機應(yīng)用、手持設(shè)備應(yīng)用及其他介質(zhì)中進行操作時所生成的包含有行為數(shù)據(jù)信息的眾多異構(gòu)日志數(shù)據(jù)處理為具有清晰分類標(biāo)準(zhǔn),以及統(tǒng)一、規(guī)范的數(shù)據(jù)結(jié)構(gòu)的行為數(shù)據(jù)。以使得數(shù)據(jù)工程師具有了一套統(tǒng)一的行為數(shù)據(jù)的處理方法,不再需要針對不同的業(yè)務(wù)開發(fā)數(shù)據(jù)結(jié)構(gòu)不同的行為數(shù)據(jù)表,提高行為數(shù)據(jù)表的開發(fā)及使用效率。同時,對于行為數(shù)據(jù)的使用者,由于行為數(shù)據(jù)信息被處理為相同的數(shù)據(jù)結(jié)構(gòu)并根據(jù)統(tǒng)一的命名規(guī)則進行命名存儲,使得使用者能夠根據(jù)統(tǒng)一的檢索規(guī)則進行數(shù)據(jù)檢索,降低了數(shù)據(jù)消費者的使用門檻,并且,由于同構(gòu)行為數(shù)據(jù)表所具有的良好通用性,使得使用者不需要再對數(shù)據(jù)表進行修改或加工,減少了數(shù)據(jù)表副本的出現(xiàn),也大大降低了企業(yè)存儲數(shù)據(jù)的成本。為了更加詳細地說明本發(fā)明提出的一種日志數(shù)據(jù)的處理方法,本發(fā)明實施例將對上述步驟的具體實現(xiàn)逐一說明,尤其說明對同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)進行設(shè)置的具體過程,如圖2所示,該方法具體包括:201、根據(jù)異構(gòu)日志數(shù)據(jù)表中包含的行為構(gòu)成要素設(shè)置同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)。具體設(shè)置同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)主要從如下幾個方面進行:1、根據(jù)異構(gòu)日志數(shù)據(jù)表中的行為種類按照層級遞進關(guān)系設(shè)置行為分類規(guī)則。本發(fā)明實施例中所設(shè)置的行為種類是根據(jù)異構(gòu)日志數(shù)據(jù)表中所含有的行為種類確定的,在實際應(yīng)用中,行為分類規(guī)則中的行為種類一般是根據(jù)客戶(企業(yè))在所有業(yè)務(wù)中所產(chǎn)生的所有行為種類確定的。因此,在定義該分類規(guī)則時,應(yīng)盡量全面地統(tǒng)計所有的行為種類,確保在該分類規(guī)則中能夠涵蓋用戶操作產(chǎn)生的所有行為。在確定行為種類后,將這些行為種類按照層級遞進的關(guān)系確立行為關(guān)系,具體可通過N級類目的方式進行表示,根據(jù)具體的場景,N可以靈活取值,以能容易地歸類各種行為為原則,如圖3所示的一種N級行為的分類方法,同一級的行為可以對應(yīng)不同的行為場景,將第一級到第N級的行為串聯(lián)起來即可表示用戶的一個具體行為。例如,當(dāng)N取值為3時,行為被分為三級,第一級中可以設(shè)置消費、出行、娛樂等不同的行為大類,第二級是對第一級的細化,如在消費中還包括線上購物、生活便民消費等,第三級則是對第二級的進一步細化,如在線上購物中還可分為支付、收藏、瀏覽等行為。如此,對于一個在網(wǎng)上購買商品的行為,可以通過層級遞進的串聯(lián)就可以表示為“消費-線上購物-支付”這樣一個行為。通過這種N級類目所表示的行為,就能夠區(qū)分出異構(gòu)日志數(shù)據(jù)表中的行為數(shù)據(jù)信息,并將屬于同一種的行為生成一張同構(gòu)行為數(shù)據(jù)表。設(shè)置行為分類規(guī)則的目的在于明確地區(qū)分不同種類的行為,另每一種行為都有一個唯一的表示方式,同時也可以方便用戶根據(jù)該行為分類規(guī)則檢索所需的行為數(shù)據(jù)信息。2、設(shè)置描述行為數(shù)據(jù)信息的行為構(gòu)成要素。本發(fā)明實施例中所設(shè)置的行為構(gòu)成要素,采用行為主體、時間、環(huán)境、行為客體、場景、事件這6個基本要素來描述一個行為的基本數(shù)據(jù)信息,其中,前5個要素均是用來描述“事件”要素的,而“行為客體”要素是指行為實施的對象,一個具體的行為可以對應(yīng)多個客體,例如:小A在店鋪B購買了一件商品C,“店鋪B”和“商品C”是該購買行為的客體;“環(huán)境”要素進一步包括用戶行為發(fā)生的地點、媒介信息(例如設(shè)備類型、網(wǎng)絡(luò)類型等)和天氣信息;“場景”要素即用戶發(fā)生行為的網(wǎng)站名、應(yīng)用名或應(yīng)用內(nèi)的功能名,比如:小A在網(wǎng)店上購買了一件商品,那么場景即“網(wǎng)店”。需要說明的是,當(dāng)無法根據(jù)已有信息獲取某個要素的信息時,可以將對應(yīng)要素的取值置為空。一般情況下,大部分的行為均可拆解為這6個基本行為構(gòu)成要素,例如:“小A周日上午在家里用手機通過口碑外賣APP購買了一份黃燜雞米飯”,所對應(yīng)的6個要素可以拆解為:行為主體:小A;時間:周日上午;環(huán)境(地點):家;環(huán)境(媒介):手機;環(huán)境(天氣):給定描述中沒有提到天氣信息,故為空;事件:購買;行為客體:黃燜雞米飯;場景:口碑外賣APP。由此可見,該方法具有普遍通用性。3、根據(jù)行為分類規(guī)則和行為構(gòu)成要素確定同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)。針對分類規(guī)則中所存在的行為種類,根據(jù)上述的6個行為構(gòu)成要素就可以設(shè)置一個標(biāo)準(zhǔn)的同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu),如表1所示,對于其中的字段名中帶有attr的字段,可根據(jù)需要自定義字段的物理意義和對這些字段進行新的命名(對于不帶attr關(guān)鍵詞的字段,為了一致性考慮,則不建議更換名稱),原則是所設(shè)置的字段能滿足絕大多數(shù)應(yīng)用場景的需求。其中,時間、環(huán)境、行為客體要素的字段可根據(jù)應(yīng)用場景進行自定義設(shè)置。例如:時間要素字段,除了最基礎(chǔ)的時間戳外,還可以有“是否工作日”、“星期”等字段;環(huán)境要素字段中的地點字段,除了最基礎(chǔ)的經(jīng)緯度外,還可以有“省份”、“城市”、“區(qū)域”等字段;環(huán)境要素字段中的媒介字段可以包括“設(shè)備型號”、“設(shè)備操作系統(tǒng)”、“網(wǎng)絡(luò)類型”等;環(huán)境要素字段中的天氣字段可以包括“天氣狀況”、“溫度”、“空氣質(zhì)量”等;行為客體要素字段用于描述某個具體行為的客體屬性,例如:小A在網(wǎng)店購買了一件商品,那么描述商品和店鋪的字段均可以出現(xiàn)在客體要素字段中。表1:同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)示例4、設(shè)置行為構(gòu)成要素的編碼規(guī)則。通過設(shè)置編碼規(guī)則不僅可以區(qū)分同構(gòu)行為數(shù)據(jù)表中的不同行為數(shù)據(jù)信息,更重要的是在后續(xù)的行為數(shù)據(jù)轉(zhuǎn)換代碼框架中需要添加對應(yīng)的編碼信息。由于時間與環(huán)境要素自身就具有較明顯的區(qū)別,因此,本發(fā)明實施例中主要是對行為主體、行為客體、場景和事件這4個要素設(shè)置編碼規(guī)則。具體規(guī)則方案如下:(1)、行為主體編碼方案一般地,網(wǎng)站、計算機應(yīng)用、手持設(shè)備應(yīng)用及其他介質(zhì)均有自己的賬戶體系,可將對應(yīng)的賬戶id作為主體編碼。通常,同一個公司旗下可能會有多個產(chǎn)品,這些產(chǎn)品通常擁有各自的賬戶體系,如果需要對整個公司的行為數(shù)據(jù)進行統(tǒng)一管理,就有必要將不同的賬戶體系映射到同一套體系中,并以統(tǒng)一映射后的賬戶id作為主體編碼。例如:某公司的產(chǎn)品A和產(chǎn)品B擁有不同的賬戶體系,可以將產(chǎn)品B的賬戶體系映射到賬戶A的賬戶體系中,最后統(tǒng)一用產(chǎn)品A的賬戶體系表示產(chǎn)品A和產(chǎn)品B中的用戶行為,具體的映射方法也被廣泛應(yīng)用屬于現(xiàn)有技術(shù),具體實現(xiàn)不在此贅述。(2)、行為客體編碼方案根據(jù)客體對象的個數(shù)進行順序編碼,即直接對網(wǎng)站、計算機應(yīng)用、手持設(shè)備應(yīng)用及其他介質(zhì)中存在的對象進行順序編號,采用n位阿拉伯?dāng)?shù)字編碼(n的取值可根據(jù)對象的多少來定,通??扇≈?)。例如:商品可編碼為01,店鋪編碼為02,等等。(3)、場景編碼方案根據(jù)不同一級事件類目中的所有場景進行順序編碼,從s01進行順序編碼。(4)、事件編碼方案主要是基于行為分類規(guī)則以及場景對事件進行編碼,即將事件中各級行為的編碼以及場景編碼進行拼接,以達到對該事件生成一個唯一編碼。其中,加入場景編碼主要是考慮到相同行為可能會在不同場景下產(chǎn)生。這是因為,當(dāng)場景唯一時,單獨使用事件中各級行為的編碼拼接就可以對該事件進行唯一表示。但當(dāng)場景有多個時,由于同一個行為可能出現(xiàn)在不同的“場景”中,例如:某公司旗下有3款線上購物類的消費產(chǎn)品,分別是產(chǎn)品A,產(chǎn)品B和產(chǎn)品C。產(chǎn)品A、產(chǎn)品B和產(chǎn)品C即對應(yīng)3種不同的場景,用戶在這3種場景中均會產(chǎn)生支付行為,如果直接對各級行為類目的編碼進行簡單拼接(假如三級類目分別為:消費-線上購物-支付,且“消費”的編碼為101,“線上購物”的編碼為01,“支付”的編碼為07,那么直接拼接后得到編碼1010107),則用戶在3個不同場景中的支付事件編碼是一樣的,無法區(qū)分該支付行為是在哪個場景下產(chǎn)生的,使得事件編碼失去唯一性。因此,針對多場景的情況,可以在事件編碼中加入場景編碼,例如產(chǎn)品A對應(yīng)的場景編碼為s01,產(chǎn)品B對應(yīng)的場景編碼為s02,產(chǎn)品C對應(yīng)的場景編碼為s03,此時即可明確區(qū)分不同場景中的相同行為,三個不同場景中的相同事件編碼依次為:1010107s01,1010107s02,1010107s03。(5)、設(shè)置行為數(shù)據(jù)表的命名規(guī)則。根據(jù)行為數(shù)據(jù)表中包含的行為分類的層級類目以及場景名設(shè)置行為數(shù)據(jù)表的名稱。具體的命名規(guī)則是:對每級行為類目和場景名分別設(shè)置一個縮寫,針對某個具體的行為,將各級行為類目的縮寫及場景的縮寫以“_”符號拼接即可。例如,行為以3級類目進行表示,各級類目的縮寫分別為level1,level2和level3,場景的縮寫為scene,那么可將對應(yīng)的行為表命名為:pre_level1_level2_level3_scene_suffix,其中pre和suffix部分可以自定義給定。其中,當(dāng)行為是“消費-O2O-支付”時,所對應(yīng)的各級類目的縮寫可以是:csm(消費)、o2o(O2O)、pay(支付),場景為“口碑”,所對應(yīng)的縮寫為koubei,那么,記錄該行為的行為表的名稱就可以命名為:dwd_csm_o2o_pay_koubei_di,其中,dwd表示該行為數(shù)據(jù)表在對應(yīng)企業(yè)中所處的數(shù)據(jù)架構(gòu)層,di表示該行為數(shù)據(jù)表的屬性(如日增量表、全量表、維度表等等)。這樣命名的好處在于:如果數(shù)據(jù)的使用者希望檢索所有屬于場景scene的行為表,那么只檢索“scene”關(guān)鍵詞即可得到想要的所有表;如果數(shù)據(jù)的使用者希望得到所有屬于“l(fā)evel1”類目的行為表,只檢索“l(fā)evel1”關(guān)鍵詞即可得到想要的所有表,如此可以大大提升了數(shù)據(jù)使用者檢索數(shù)據(jù)表的效率。202、根據(jù)同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)生成行為數(shù)據(jù)轉(zhuǎn)換代碼框架。根據(jù)表1所示的同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu),本發(fā)明實施例對應(yīng)該數(shù)據(jù)結(jié)構(gòu)給出一個行為數(shù)據(jù)轉(zhuǎn)換代碼框架的示例偽代碼以供參考,如表2所示。表2:行為數(shù)據(jù)轉(zhuǎn)換代碼框架的示例偽代碼203、解析異構(gòu)日志數(shù)據(jù)表內(nèi)的行為數(shù)據(jù)信息。針對每個異構(gòu)日志數(shù)據(jù)表進行的解析內(nèi)容主要包括:1、根據(jù)行為分類規(guī)則確定異構(gòu)日志數(shù)據(jù)表中行為數(shù)據(jù)信息所屬的分類,得到該行為對應(yīng)的一級事件名,二級事件名和三級事件名,以及場景名。其中,所獲取的事件名的級別是根據(jù)日志數(shù)據(jù)中的行為數(shù)據(jù)信息與分類規(guī)則的對應(yīng)關(guān)系所確定的,應(yīng)根據(jù)實際情況確定行為所對應(yīng)的行為事件名。2、解析行為數(shù)據(jù)信息中對應(yīng)行為構(gòu)成要素的字段,即能直接或間接描述表1中數(shù)據(jù)結(jié)構(gòu)的字段。3、根據(jù)行為構(gòu)成要素的編碼規(guī)則對解析得到的字段進行編碼,得到具有唯一性的編碼。4、根據(jù)行為數(shù)據(jù)表的命名規(guī)則對該行為數(shù)據(jù)信息對應(yīng)生成的同構(gòu)行為數(shù)據(jù)表進行命名。204、將行為數(shù)據(jù)信息添加到行為數(shù)據(jù)轉(zhuǎn)換代碼框架內(nèi)的對應(yīng)位置中,得到數(shù)據(jù)轉(zhuǎn)換的可執(zhí)行代碼。將步驟203所解析出的行為數(shù)據(jù)信息添加到行為數(shù)據(jù)轉(zhuǎn)換代碼框架內(nèi)的對應(yīng)位置中,其中,解析得到的行為構(gòu)成要素的字段包括有能直接或間接描述表1中數(shù)據(jù)結(jié)構(gòu)的字段。對于添加這些字段的內(nèi)容需要根據(jù)如下的流程進行操作:1、判斷表2中行為數(shù)據(jù)轉(zhuǎn)換代碼框架中需要加入的字段信息是否存在于解析的行為數(shù)據(jù)信息中。其中,加入表2中的字段的內(nèi)容是以加粗的字體進行顯示。即判斷來源表中的某字段所表達的行為要素內(nèi)容與表2中所需的行為要素內(nèi)容是否相同。2、若存在,就將該字段信息添加至表2中,需要說明的是,在添加前還需要對該字段信息進行進一步核實,確認(rèn)該字段信息所表達的意思相同,即該字段所表達的行為要素內(nèi)容,相同則可不做任何處理直接添加,若不同,則需要對該字段信息進行處理,得到符合表2中字段信息所要表達意思的取值后再添加到表2中。例如,可以根據(jù)經(jīng)緯度的信息計算得到事件發(fā)生的省份、城市等信息,其具體的處理方式將在下面的舉例中加以說明。3、若不存在,就在表2的對應(yīng)位置中賦空值。完成上述的行為數(shù)據(jù)信息加載后,表2中的代碼框架就生成了一套可執(zhí)行代碼。205、執(zhí)行可執(zhí)行代碼得到一張以相同數(shù)據(jù)結(jié)構(gòu)存儲行為數(shù)據(jù)信息的同構(gòu)行為數(shù)據(jù)表。執(zhí)行步驟204所生成的可執(zhí)行代碼,就可以生成一張以相同數(shù)據(jù)結(jié)構(gòu)存儲行為數(shù)據(jù)信息的同構(gòu)行為數(shù)據(jù)表。結(jié)合上述的方法,根據(jù)本發(fā)明實施例提出的一種日志數(shù)據(jù)的處理方法,以下將以實際應(yīng)用進行舉例說明:假設(shè)企業(yè)A擁有很多種不同的業(yè)務(wù)及產(chǎn)品,涵蓋了日常生活的方方面面(消費、社交、金融等),針對該企業(yè)生成同構(gòu)行為數(shù)據(jù)的流程如下:第一,對企業(yè)A用戶的行為進行分類,根據(jù)假設(shè),對企業(yè)A的用戶行為分類采用3級比較合適。假定如圖4所示的行為分類是適用于企業(yè)A的一種行為分類方法。其中一級行為可分為8個大類:消費、出行、社交、金融活動、求助、賬戶操作、娛樂、公益行為。二級行為可針對業(yè)務(wù)情況進行細分,例如“消費”下面可再細分為線上購物、O2O消費和生活便民消費;三級行為需要根據(jù)特定的產(chǎn)品功能進行細分,例如線上購物可以再分為搜索、瀏覽、收藏、支付等行為。第二,對用戶行為進行6要素定義,所定義的6個基本行為構(gòu)成要素為:行為主體、時間、環(huán)境、行為客體、場景、事件。并根據(jù)所定義的6要素制定一種適用于企業(yè)A的同構(gòu)的行為表數(shù)據(jù)結(jié)構(gòu),如下表3所示:表3:企業(yè)A的同構(gòu)的行為表數(shù)據(jù)結(jié)構(gòu)示例與表1相比,其中的帶有attr關(guān)鍵詞的字段可以根據(jù)業(yè)務(wù)需要靈活決定字段的物理意義和對這些字段進行新的命名。對本例來說,對不同的業(yè)務(wù),可以對object_attr_1系列的字段靈活決定字段的物理意義和對這些字段進行新的命名。表3里面已經(jīng)將表1中部分帶有attr關(guān)鍵詞的字段進行了改變,例如time_is_workday和time_week分別代替了表1中的time_attr_1和time_attr_2,目的是可以從字段命名直觀體會其代表的物理意義。第三,設(shè)置適用于企業(yè)A的行為主體、行為客體、場景和事件要素的編碼方案及行為數(shù)據(jù)表命名方案。行為主體編碼:采用企業(yè)A中應(yīng)用最廣泛的賬戶體系Z作為行為主體編碼,如企業(yè)A有多套不同的賬戶體系,統(tǒng)一映射為賬戶體系Z。行為客體編碼:直接對網(wǎng)站、計算機應(yīng)用、手持設(shè)備應(yīng)用及其他介質(zhì)中存在的對象進行順序編號,采用2位阿拉伯?dāng)?shù)字編碼,如表4所示:表4:一種適用于企業(yè)A的行為客體編碼方案客體名客體編碼未知00用戶01搜索詞02商品03店鋪04廣告05頁面06消息07訂單08評價內(nèi)容09路線10…………其中,對行為客體對象的名稱采用自定義的方式設(shè)置,其數(shù)量則根據(jù)企業(yè)A的業(yè)務(wù)情況來確定,不做上限設(shè)定。場景編碼:對不同一級行為類目中的所有場景從s01進行順序編碼,例如企業(yè)A的所有產(chǎn)品中,屬于“消費”類別的有3個,分別是產(chǎn)品A,產(chǎn)品B和產(chǎn)品C;屬于“出行”類別的有2個,分別是產(chǎn)品D和產(chǎn)品E。那么在“消費”類別下,對A,B,C三個產(chǎn)品對應(yīng)的場景編碼為s01,s02和s03;同樣地,在“出行”類別下,對D和E兩個產(chǎn)品對應(yīng)的場景編碼為s01和s02。如后續(xù)有新的產(chǎn)品出現(xiàn),在所屬的一級行為類目中直接順序增加即可。事件編碼:由于企業(yè)A的場景很多,故采用如下事件編碼方案:基于所述的行為分類方法對事件進行編碼,并加入場景編碼,以區(qū)分不同場景中的相同行為。行為數(shù)據(jù)表命名方案:假如某3級類目的縮寫分別為level1,level2和level3,場景的縮寫為scene,那么可將對應(yīng)的行為表命名為:pre_level1_level2_level3_scene_suffix,其中pre和suffix部分可以自定義設(shè)置。第四,根據(jù)第二步所設(shè)定的行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu),制定通用的行為數(shù)據(jù)信息轉(zhuǎn)換代碼框架,該代碼框架的示例偽代碼如表5所示:表5:企業(yè)A行為數(shù)據(jù)信息轉(zhuǎn)換代碼框架的示例偽代碼第五,解析異構(gòu)日志數(shù)據(jù)表中的行為數(shù)據(jù)信息。假定待處理的異構(gòu)日志數(shù)據(jù)表中的數(shù)據(jù)描述的是用戶在A場景中的消費-線上購物-支付行為,且部分字段信息如表6所示:表6:異構(gòu)日志數(shù)據(jù)表示例針對表6的異構(gòu)日志數(shù)據(jù)表,需要根據(jù)圖4中的分類方法確定該異構(gòu)日志數(shù)據(jù)表中描述的用戶行為所屬的類別,得到該行為對應(yīng)的一級事件名(消費),二級事件名(線上購物)和三級事件名(支付),以及解析出場景名(A場景)。再從該異構(gòu)日志數(shù)據(jù)表(表6)中解析得到能直接或間接描述行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)(表3)的字段;對表6而言,所有的9個字段均是能直接或間接描述表3中所述的行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)的字段;按照第三步對行為主體、行為客體、場景和事件的編碼規(guī)則,對各自對應(yīng)的字段分別生成唯一的編碼,并根據(jù)命名規(guī)范對所生成的行為數(shù)據(jù)表進行命名(例如可以命名為:dwd_csm_osh_pay_di,其中dwd為表名的前綴部分,csm表示消費,osh表示線上購物,pay表示支付,di是表名的后綴部分)。第六,將第五步解析得到的全部信息相應(yīng)填充到代碼框架表5中對應(yīng)位置。其中,將解析得到的能直接或間接描述行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)的字段,根據(jù)以下3種情況將每個來源字段對應(yīng)添加到表5中的process()函數(shù):1、若來源表(異構(gòu)日志數(shù)據(jù)表)中某字段的值可以直接拿來用,那么process()函數(shù)對來源字段的值不進行任何處理,直接將該值賦值給目標(biāo)表(表3)的相應(yīng)字段;例如,來源日志表中的userid字段的取值可以直接作為目標(biāo)表中的user_id字段值,來源日志表中的time字段的取值可以直接作為目標(biāo)表中的time_stamp字段值,來源日志表中的longitude字段的取值可以直接作為目標(biāo)表中的env_loc_longitude字段值,來源日志表中的latitude字段的取值可以直接作為目標(biāo)表中的env_loc_latitude字段值,來源日志表中的os字段的取值可以直接作為目標(biāo)表中的env_medium_device_os字段值,來源日志表中的network字段的取值可以直接作為目標(biāo)表中的env_medium_network字段值,來源日志表中的pay_total_amt字段的取值可以直接作為目標(biāo)表中的object_attr_1字段值,來源日志表中的pay_real_amt字段的取值可以直接作為目標(biāo)表中的object_attr_2字段值,來源日志表中的shop_name字段的取值可以直接作為目標(biāo)表中的object_attr_3字段值。2、若來源表中不存在所需的數(shù)據(jù),那么process()函數(shù)直接返回空值,并賦值給目標(biāo)表的相應(yīng)字段;對于表6所示的例子而言,來源表中沒有可以用來描述目標(biāo)表中env_weather,env_weather_temp,env_weather_air_quality,env_medium_device_type和env_medium_channel_entry這5個字段,因此對應(yīng)的process()函數(shù)直接返回空值。3、若來源表中存在某字段,但其值需要進行一些處理方可使用,那么process()函數(shù)對來源字段值進行特定處理后,再賦值給目標(biāo)表的相應(yīng)字段。對于表6所示的例子而言,可以對來源日志表中time字段值進行相應(yīng)計算得到目標(biāo)表所需的time_is_workday和time_week字段,對來源日志表中的longitude和latitude字段值進行相應(yīng)計算得到目標(biāo)表所需的env_loc_province_id,env_loc_province_name,env_loc_city_id和env_loc_city_name4個字段。將所有解析得到的全部信息相應(yīng)填充到代碼框架表5中對應(yīng)位置后,該代碼框架就可以形成得到同構(gòu)行為數(shù)據(jù)表的可執(zhí)行代碼。第七,執(zhí)行根據(jù)表5生成的可執(zhí)行代碼,生成一張包含有多張異構(gòu)日志數(shù)據(jù)表中具有相同行為種類的同構(gòu)行為數(shù)據(jù)表,如表7所示:表7:同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)示例其中,表6中的數(shù)據(jù)信息記錄在該表的第100數(shù)據(jù)中。并且,在第一條數(shù)據(jù)中字段longitude、latitude和os的值為空值,有可能是因為在來源異構(gòu)日志數(shù)據(jù)表中并沒有記錄與這3個字段相關(guān)的信息內(nèi)容。進一步的,作為對上述方法的實現(xiàn),本發(fā)明實施例提供了一種日志數(shù)據(jù)的處理裝置,該裝置實施例與前述方法實施例對應(yīng),為便于閱讀,本裝置實施例不再對前述方法實施例中的細節(jié)內(nèi)容進行逐一贅述,但應(yīng)當(dāng)明確,本實施例中的裝置能夠?qū)?yīng)實現(xiàn)前述方法實施例中的全部內(nèi)容。該裝置如圖5所示,具體包括:設(shè)置單元31,用于根據(jù)異構(gòu)日志數(shù)據(jù)表中包含的行為構(gòu)成要素設(shè)置同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu),所述異構(gòu)日志數(shù)據(jù)表是具有不同數(shù)據(jù)結(jié)構(gòu)的多張日志數(shù)據(jù)表;生成單元32,用于根據(jù)所述設(shè)置單元31設(shè)置的同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu)生成行為數(shù)據(jù)轉(zhuǎn)換代碼框架;解析單元33,用于解析所述異構(gòu)日志數(shù)據(jù)表內(nèi)的行為數(shù)據(jù)信息;添加單元34,用于將所述解析單元33得到的行為數(shù)據(jù)信息添加到所述生成單元32生成的行為數(shù)據(jù)轉(zhuǎn)換代碼框架內(nèi)的對應(yīng)位置中,得到數(shù)據(jù)轉(zhuǎn)換的可執(zhí)行代碼;執(zhí)行單元35,用于執(zhí)行所述添加單元34生成的可執(zhí)行代碼得到一張以相同數(shù)據(jù)結(jié)構(gòu)存儲行為數(shù)據(jù)信息的同構(gòu)行為數(shù)據(jù)表。進一步的,如圖6所示,所述設(shè)置單元31包括:第一設(shè)置模塊311,用于根據(jù)所述異構(gòu)日志數(shù)據(jù)表中的行為種類按照層級遞進關(guān)系設(shè)置行為分類規(guī)則;第二設(shè)置模塊312,用于設(shè)置描述所述行為數(shù)據(jù)信息的行為構(gòu)成要素;確定模塊313,用于根據(jù)所述第一設(shè)置模塊設(shè)置311的行為分類規(guī)則和所述第二設(shè)置模塊312設(shè)置的行為構(gòu)成要素確定同構(gòu)行為數(shù)據(jù)表的數(shù)據(jù)結(jié)構(gòu);第三設(shè)置模塊314,用于設(shè)置所述行為構(gòu)成要素的編碼規(guī)則,以便區(qū)分同構(gòu)行為數(shù)據(jù)表中的不同行為數(shù)據(jù)信息;第四設(shè)置模塊315,用于設(shè)置所述行為數(shù)據(jù)表的命名規(guī)則。進一步的,所述第二設(shè)置模塊312設(shè)置的描述行為數(shù)據(jù)信息的行為構(gòu)成要素包括:行為主體、時間、環(huán)境、行為客體、場景、事件。進一步的,所述第三設(shè)置模塊314還用于:對行為客體要素的編碼是根據(jù)客體對象的個數(shù)進行順序編碼;對場景要素的編碼是根據(jù)不同一級事件類目中的所有場景進行順序編碼;對事件要素的編碼是將所述事件中各級行為的編碼以及場景編碼進行拼接,以達到對所述事件生成一個唯一編碼。進一步的,所述第四設(shè)置模塊315還用于,根據(jù)所述行為數(shù)據(jù)表中包含的行為分類的層級類目以及場景名設(shè)置所述行為數(shù)據(jù)表的名稱。進一步的,如圖6所示,所述解析單元33包括:確定模塊331,用于根據(jù)所述行為分類規(guī)則確定所述異構(gòu)日志數(shù)據(jù)表中行為數(shù)據(jù)信息所屬的分類;解析模塊332,用于解析所述行為數(shù)據(jù)信息中對應(yīng)行為構(gòu)成要素的字段;編碼模塊333,用于根據(jù)所述行為構(gòu)成要素的編碼規(guī)則對所述字段進行編碼;命名模塊334,用于根據(jù)所述行為數(shù)據(jù)表的命名規(guī)則對所述行為數(shù)據(jù)信息對應(yīng)生成的同構(gòu)行為數(shù)據(jù)表進行命名。進一步的,如圖6所示,所述添加單元34包括:判斷模塊341,用于判斷所述行為數(shù)據(jù)轉(zhuǎn)換代碼框架中需要加入的字段信息是否存在于所述行為數(shù)據(jù)信息中;添加模塊342,用于當(dāng)所述判斷模塊341判斷存在所述字段信息時,將所述字段信息添加至所述行為數(shù)據(jù)轉(zhuǎn)換代碼框架內(nèi)的對應(yīng)位置中;賦值模塊343,用于當(dāng)所述判斷模塊341判斷不存在所述字段信息時,在所述行為數(shù)據(jù)轉(zhuǎn)換代碼框架內(nèi)的對應(yīng)位置中賦空值。進一步的,所述添加模塊342還用于,根據(jù)所述行為數(shù)據(jù)轉(zhuǎn)換代碼框架所需字段信息的取值要求,對所述行為數(shù)據(jù)信息中對應(yīng)的字段信息進行處理后再添加至所述行為數(shù)據(jù)轉(zhuǎn)換代碼框架內(nèi)的對應(yīng)位置中。綜上所述,本發(fā)明實施例所采用的日志數(shù)據(jù)的處理方法及裝置,通過建立統(tǒng)一的行為數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn),將日志數(shù)據(jù)表中的行為數(shù)據(jù)信息進行提取、分類、存儲為標(biāo)準(zhǔn)的同構(gòu)行為數(shù)據(jù)表。能夠?qū)⒂脩粼诟鞣N網(wǎng)站、計算機應(yīng)用、手持設(shè)備應(yīng)用及其他介質(zhì)中進行操作時所生成的包含有行為數(shù)據(jù)信息的眾多異構(gòu)日志數(shù)據(jù)處理為具有清晰分類標(biāo)準(zhǔn),以及統(tǒng)一、規(guī)范的數(shù)據(jù)結(jié)構(gòu)的行為數(shù)據(jù)。以使得數(shù)據(jù)工程師具有了一套統(tǒng)一的行為數(shù)據(jù)的處理方法,不再需要針對不同的業(yè)務(wù)開發(fā)數(shù)據(jù)結(jié)構(gòu)不同的行為數(shù)據(jù)表,提高行為數(shù)據(jù)表的開發(fā)及使用效率。同時,對于行為數(shù)據(jù)的使用者,由于行為數(shù)據(jù)信息被處理為相同的數(shù)據(jù)結(jié)構(gòu)并根據(jù)統(tǒng)一的命名規(guī)則進行命名存儲,使得使用者能夠根據(jù)統(tǒng)一的檢索規(guī)則進行數(shù)據(jù)檢索,降低了消費者的使用門檻,并且,由于同構(gòu)行為數(shù)據(jù)表所具有的良好通用性,使得使用者不需要再對數(shù)據(jù)表進行修改或加工,減少了數(shù)據(jù)表副本的出現(xiàn),也大大降低了企業(yè)存儲數(shù)據(jù)的成本。在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關(guān)描述??梢岳斫獾氖?,上述方法及裝置中的相關(guān)特征可以相互參考。另外,上述實施例中的“第一”、“第二”等是用于區(qū)分各實施例,而并不代表各實施例的優(yōu)劣。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng),裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權(quán)利要求書由此明確地并入該具體實施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中。可以把實施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的發(fā)明名稱(如確定網(wǎng)站內(nèi)鏈接等級的裝置)中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。應(yīng)該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
萍乡市| 耒阳市| 大冶市| 永春县| 河南省| 伊金霍洛旗| 九龙坡区| 永嘉县| 大厂| 资兴市| 监利县| 云阳县| 共和县| 铁岭市| 莲花县| 安平县| 纳雍县| 延川县| 宁河县| 乌什县| 五大连池市| 商都县| 山阴县| 称多县| 黑水县| 济宁市| 辽阳县| 乌鲁木齐县| 秦安县| 固始县| 绿春县| 桦甸市| 镇远县| 淳化县| 张北县| 辽中县| 济阳县| 嘉兴市| 焉耆| 南康市| 安仁县|