欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于流計(jì)算實(shí)現(xiàn)快速提取號(hào)碼熱度的方法與流程

文檔序號(hào):12666358閱讀:552來源:國知局
一種基于流計(jì)算實(shí)現(xiàn)快速提取號(hào)碼熱度的方法與流程

本發(fā)明涉及大數(shù)據(jù)技術(shù)領(lǐng)域,是基于流式計(jì)算創(chuàng)建的一套快速提取號(hào)碼熱度的處理流程,特別是一種基于流計(jì)算實(shí)現(xiàn)快速提取號(hào)碼熱度的方法。



背景技術(shù):

隨著號(hào)碼百事通業(yè)務(wù)的逐漸壯大,用戶的行為日志和信令數(shù)據(jù)的處理也隨著變得棘手,如何快速的提取里面的號(hào)碼熱度成為一個(gè)技術(shù)難點(diǎn)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的在于提供一種基于流計(jì)算實(shí)現(xiàn)快速提取號(hào)碼熱度的方法,基于構(gòu)建一套標(biāo)準(zhǔn)的流式處理模型,通過流式計(jì)算實(shí)時(shí)提取、更新號(hào)碼的熱度,實(shí)現(xiàn)海量號(hào)碼的數(shù)據(jù)挖掘。

為實(shí)現(xiàn)上述目的,本發(fā)明的具體技術(shù)方案是:

一種基于流計(jì)算實(shí)現(xiàn)快速提取號(hào)碼熱度的方法,其特征在于:它包括如下步驟:

步驟一:基于分布式日志收集系統(tǒng)Flume,用于將海量日志或數(shù)據(jù)實(shí)時(shí)的收集,達(dá)到實(shí)時(shí)高效可靠得處理各種數(shù)據(jù)源;

步驟二:基于分布式消息隊(duì)列Kafka集群用于將數(shù)據(jù)源的數(shù)據(jù)通過消息隊(duì)列送達(dá)到實(shí)時(shí)處理平臺(tái)上,能夠?qū)崿F(xiàn)高吞吐和線性擴(kuò)展;

步驟三:基于分布式流式計(jì)算集群用于消費(fèi)消息隊(duì)列的數(shù)據(jù),在內(nèi)存里進(jìn)行迭代運(yùn)算,實(shí)現(xiàn)秒級(jí)出運(yùn)算結(jié)果;

步驟四:基于key-value庫Redis集群,用于將結(jié)果存于內(nèi)存,實(shí)現(xiàn)毫秒級(jí)數(shù)據(jù)查詢服務(wù)。

所述的基于流計(jì)算實(shí)現(xiàn)快速提取號(hào)碼熱度的方法,其特征在于:用于實(shí)施所述方法的系統(tǒng)包括數(shù)據(jù)收集系統(tǒng)、數(shù)據(jù)傳輸系統(tǒng)、大數(shù)據(jù)平臺(tái)、數(shù)據(jù)展現(xiàn)系統(tǒng)。

本發(fā)明的優(yōu)點(diǎn)在于:

通過建立一套標(biāo)準(zhǔn)流式計(jì)算模型,實(shí)時(shí)處理海量數(shù)據(jù),實(shí)現(xiàn)快速提取號(hào)碼熱度,給業(yè)務(wù)和市場人員快速直接的反應(yīng),為決策做更好的支撐;并不斷實(shí)時(shí)更新壯大號(hào)碼庫。

附圖說明

圖1為本發(fā)明系統(tǒng)示意圖。

圖2為提取號(hào)碼熱度的詳細(xì)流程圖。

具體實(shí)施方式

以下結(jié)合附圖來進(jìn)一步介紹本發(fā)明方法。

如圖1所示,它是用來實(shí)施本發(fā)明方法的系統(tǒng),該系統(tǒng)包括數(shù)據(jù)收集系統(tǒng)、數(shù)據(jù)傳輸系統(tǒng)、大數(shù)據(jù)平臺(tái)、數(shù)據(jù)展現(xiàn)系統(tǒng)。

該系統(tǒng)包括數(shù)據(jù)采集模塊1、數(shù)據(jù)清洗模塊2、熱度標(biāo)簽?zāi)K3、熱度展示模塊4和號(hào)碼熱度庫5。

如圖2所示:本發(fā)明公開了一種基于流計(jì)算實(shí)現(xiàn)快速提取號(hào)碼熱度的方法,它包括如下步驟:

步驟一:基于分布式日志收集系統(tǒng)Flume,用于將海量日志或數(shù)據(jù)實(shí)時(shí)的收集,達(dá)到實(shí)時(shí)高效可靠得處理各種數(shù)據(jù)源;

步驟二:基于分布式消息隊(duì)列Kafka集群用于將數(shù)據(jù)源的數(shù)據(jù)通過消息隊(duì)列送達(dá)到實(shí)時(shí)處理平臺(tái)上,能夠?qū)崿F(xiàn)高吞吐和線性擴(kuò)展;

步驟三:基于分布式流式計(jì)算集群用于消費(fèi)消息隊(duì)列的數(shù)據(jù),在內(nèi)存里進(jìn)行迭代運(yùn)算,實(shí)現(xiàn)秒級(jí)出運(yùn)算結(jié)果;

步驟四:基于key-value庫Redis集群,用于將結(jié)果存于內(nèi)存,實(shí)現(xiàn)毫秒級(jí)數(shù)據(jù)查詢服務(wù)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
溧阳市| 十堰市| 芦溪县| 双城市| 张掖市| 江源县| 宜春市| 德惠市| 石嘴山市| 老河口市| 鄱阳县| 错那县| 潢川县| 华亭县| 灵台县| 榆林市| 杭锦后旗| 弋阳县| 偏关县| 延长县| 铅山县| 易门县| 高安市| 阿拉善左旗| 本溪市| 合山市| 额尔古纳市| 宾阳县| 三台县| 眉山市| 深州市| 南木林县| 策勒县| 高州市| 双鸭山市| 文水县| 安泽县| 青河县| 凤冈县| 舟曲县| 阿尔山市|