欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

數(shù)據(jù)處理方法和裝置與流程

文檔序號(hào):12887246閱讀:311來(lái)源:國(guó)知局
數(shù)據(jù)處理方法和裝置與流程

本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種數(shù)據(jù)處理方法和裝置。



背景技術(shù):

隨著經(jīng)濟(jì)的發(fā)展,國(guó)家用電量也穩(wěn)步上升。根據(jù)國(guó)家能源局發(fā)布的數(shù)據(jù)中,2015年全國(guó)用電量為55500億千瓦時(shí),全國(guó)用電量極高。隨之很多人因?yàn)槔娴年P(guān)系竊電,且竊電手段多樣,科技性高,導(dǎo)致在竊電偵查非常困難。其手段有:電壓竊電、電流竊電、移相竊電、擴(kuò)差法竊電以及較為高技術(shù)的強(qiáng)磁竊電、無(wú)線遙控竊電、大功率無(wú)線干擾竊電和電能表編程器竊電等,這些手段的竊電導(dǎo)致我國(guó)供電企業(yè)每年經(jīng)濟(jì)損失達(dá)200億左右,并有每年上升的傾向。而目前,我國(guó)供電企業(yè)在供電管理方面采用自動(dòng)化的管理系統(tǒng),監(jiān)測(cè)手段落后于竊電手段,因此無(wú)法較好的遏制竊電行為。竊電行為給供電企業(yè)和社會(huì)發(fā)展造成了極大的經(jīng)濟(jì)危害,因此尋找一種較好的反竊電方法對(duì)供電企業(yè)和社會(huì)的發(fā)展有著非常重要的、深遠(yuǎn)的意義。

從供電企業(yè)開(kāi)始采用全自動(dòng)化管理開(kāi)始,用戶(hù)的用電數(shù)據(jù)就被一一的記錄下來(lái),自此,供電企業(yè)存留了海量用戶(hù)用電數(shù)據(jù)。而在這個(gè)信息技術(shù)極為發(fā)達(dá)的時(shí)代,這海量的用戶(hù)用電數(shù)據(jù)為之后制定反竊電行為有極其重要的作用。我們利用sas(statisticsanalysissystem)數(shù)據(jù)統(tǒng)計(jì)分析軟件,將用戶(hù)的用電數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫(kù)中,進(jìn)行統(tǒng)計(jì)分析,建立竊電行為模型。我們所建立的竊電行為模型庫(kù)精確度達(dá)99.3871%,具有非常高的實(shí)用性和推廣價(jià)值。建模方法單一、精準(zhǔn)度較低,也因?yàn)槠渚珳?zhǔn)度較低而無(wú)法較好的推廣到現(xiàn)實(shí)中。

針對(duì)相關(guān)技術(shù)中預(yù)計(jì)用戶(hù)的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問(wèn)題,目前尚未提出有效的解決方案。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明實(shí)施例提供了一種數(shù)據(jù)處理方法和裝置,以至少解決相關(guān)技術(shù)中預(yù)計(jì)用戶(hù)的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問(wèn)題。

根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種數(shù)據(jù)處理方法,該方法包括:獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶(hù)的屬性參數(shù)及用電用戶(hù)對(duì)應(yīng)的用電行為參數(shù);將用電數(shù)據(jù)庫(kù)中的用電用戶(hù)分為竊電用戶(hù)和不竊電用戶(hù);根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模,得到竊電用戶(hù)的竊電行為模型和不竊電用戶(hù)的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶(hù)的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶(hù)的竊電期望值之間的關(guān)系。

進(jìn)一步地,用電數(shù)據(jù)庫(kù)中包括多張數(shù)據(jù)表,每張數(shù)據(jù)表包括用電用戶(hù)的至少一種屬性參數(shù)和至少一種用電行為參數(shù),獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù)包括:分別判斷每張數(shù)據(jù)表中每個(gè)種類(lèi)的屬性參數(shù)或用電行為參數(shù)的表格值是缺失值或無(wú)效值的數(shù)量是否超過(guò)預(yù)設(shè)數(shù)量;如果判斷結(jié)果為是,則將對(duì)應(yīng)種類(lèi)的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除。

進(jìn)一步地,在將對(duì)應(yīng)種類(lèi)的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除之后,方法還包括:判斷用電數(shù)據(jù)庫(kù)中是否存在變量?jī)?nèi)容相同的屬性參數(shù)或用電行為參數(shù);如果判斷結(jié)果為是,則將變量?jī)?nèi)容相同的屬性參數(shù)或用電行為參數(shù)進(jìn)行合并。

進(jìn)一步地,根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模包括:采用多種模型對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模;根據(jù)測(cè)試樣本集對(duì)每種模型的建模結(jié)果進(jìn)行測(cè)試,以確定誤差最小的模型種類(lèi)。

根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種數(shù)據(jù)處理裝置,該裝置包括:獲取單元,用于獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶(hù)的屬性參數(shù)及用電用戶(hù)對(duì)應(yīng)的用電行為參數(shù);分類(lèi)單元,用于將用電數(shù)據(jù)庫(kù)中的用電用戶(hù)分為竊電用戶(hù)和不竊電用戶(hù);建模單元,用于根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模,得到竊電用戶(hù)的竊電行為模型和不竊電用戶(hù)的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶(hù)的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶(hù)的竊電期望值之間的關(guān)系。

進(jìn)一步地,用電數(shù)據(jù)庫(kù)中包括多張數(shù)據(jù)表,每張數(shù)據(jù)表包括用電用戶(hù)的至少一種屬性參數(shù)和至少一種用電行為參數(shù),獲取單元包括:判斷模塊,用于分別判斷每張數(shù)據(jù)表中每個(gè)種類(lèi)的屬性參數(shù)或用電行為參數(shù)的表格值是缺失值或無(wú)效值的數(shù)量是否超過(guò)預(yù)設(shè)數(shù)量;刪除模塊,用于如果判斷結(jié)果為是,則將對(duì)應(yīng)種類(lèi)的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除。

進(jìn)一步地,該裝置還包括:判斷單元,用于在將對(duì)應(yīng)種類(lèi)的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除之后,判斷用電數(shù)據(jù)庫(kù)中是否存在變量?jī)?nèi)容相同的屬性參數(shù)或用電行為參數(shù);合并單元,用于如果判斷結(jié)果為是,則將變量?jī)?nèi)容相同的屬性參數(shù)或用電行為參數(shù)進(jìn)行合并。

進(jìn)一步地,建模單元包括:建模模塊,用于采用多種模型對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模;測(cè)試模塊,用于根據(jù)測(cè)試樣本集對(duì)每種模型的建模結(jié)果進(jìn)行測(cè)試,以確定誤差最小的模型種類(lèi)。

根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種存儲(chǔ)介質(zhì),該存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在程序運(yùn)行時(shí)控制存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行本發(fā)明的數(shù)據(jù)處理方法。

根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種處理器,該處理器用于運(yùn)行程序,其中,程序運(yùn)行時(shí)執(zhí)行本發(fā)明的數(shù)據(jù)處理方法。

在本發(fā)明實(shí)施例中,通過(guò)獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶(hù)的屬性參數(shù)及用電用戶(hù)對(duì)應(yīng)的用電行為參數(shù);將用電數(shù)據(jù)庫(kù)中的用電用戶(hù)分為竊電用戶(hù)和不竊電用戶(hù);根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模,得到竊電用戶(hù)的竊電行為模型和不竊電用戶(hù)的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶(hù)的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶(hù)的竊電期望值之間的關(guān)系,解決了相關(guān)技術(shù)中預(yù)計(jì)用戶(hù)的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問(wèn)題,進(jìn)而實(shí)現(xiàn)了更準(zhǔn)確地預(yù)計(jì)用戶(hù)的竊電行為的技術(shù)效果。

附圖說(shuō)明

此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:

圖1是根據(jù)本發(fā)明實(shí)施例的一種可選的數(shù)據(jù)處理方法的流程圖;

圖2是根據(jù)本發(fā)明實(shí)施例的一種可選的數(shù)據(jù)處理裝置的示意圖。

具體實(shí)施方式

為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分的實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。

需要說(shuō)明的是,本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類(lèi)似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本發(fā)明的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過(guò)程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒(méi)有清楚地列出的或?qū)τ谶@些過(guò)程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。

本申請(qǐng)?zhí)峁┝艘环N數(shù)據(jù)處理方法的實(shí)施例。

圖1是根據(jù)本發(fā)明實(shí)施例的一種可選的數(shù)據(jù)處理方法的流程圖,如圖1所示,該方法包括如下步驟:

步驟s101,獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù):

用電數(shù)據(jù)庫(kù)中包括多個(gè)用電用戶(hù)的歷史用電數(shù)據(jù),歷史用電數(shù)據(jù)包括用電用戶(hù)的屬性參數(shù)及用電用戶(hù)對(duì)應(yīng)的用電行為參數(shù),為了分析和預(yù)測(cè)用戶(hù)的竊電行為,需要大量的歷史用電數(shù)據(jù),因此,首先需要從用電數(shù)據(jù)庫(kù)中獲取歷史用電數(shù)據(jù),可選的,在獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù)時(shí),可以對(duì)這些數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,例如刪除無(wú)效數(shù)據(jù)、合并同類(lèi)數(shù)據(jù)等數(shù)據(jù)處理操作。

用電數(shù)據(jù)庫(kù)中可以包括多張數(shù)據(jù)表,每張數(shù)據(jù)表包括用電用戶(hù)的至少一種屬性參數(shù)和至少一種用電行為參數(shù),屬性參數(shù)是用于表示用戶(hù)信息的屬性的參數(shù),例如,用戶(hù)標(biāo)識(shí)(可以是id編號(hào)等)、用電行業(yè)類(lèi)型、國(guó)家行業(yè)類(lèi)型、城鄉(xiāng)類(lèi)型等,用電行為參數(shù)是用于表示用戶(hù)用電行為的類(lèi)型的參數(shù),例如,檢查周期、用電電壓分類(lèi)、應(yīng)收電費(fèi)等。

在這種應(yīng)用場(chǎng)景中,獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù)可以包括:分別判斷每張數(shù)據(jù)表中每個(gè)種類(lèi)的屬性參數(shù)或用電行為參數(shù)的表格值是缺失值或無(wú)效值的數(shù)量是否超過(guò)預(yù)設(shè)數(shù)量;如果判斷結(jié)果為是,則將對(duì)應(yīng)種類(lèi)的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除。

進(jìn)一步地,在將對(duì)應(yīng)種類(lèi)的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除之后,該方法還可以包括:判斷用電數(shù)據(jù)庫(kù)中是否存在變量?jī)?nèi)容相同的屬性參數(shù)或用電行為參數(shù);如果判斷結(jié)果為是,則將變量?jī)?nèi)容相同的屬性參數(shù)或用電行為參數(shù)進(jìn)行合并。

步驟s102,將用電數(shù)據(jù)庫(kù)中的用電用戶(hù)分為竊電用戶(hù)和不竊電用戶(hù):

用電數(shù)據(jù)庫(kù)中的用電用戶(hù)可能存在過(guò)竊電行為,根據(jù)歷史竊電行為可以將用電數(shù)據(jù)庫(kù)中的用電用戶(hù)分為竊電用戶(hù)和不竊電用戶(hù),存在過(guò)竊電行為的竊電用戶(hù)的預(yù)測(cè)模型與未存在過(guò)竊電行為的竊電用戶(hù)的預(yù)測(cè)模型是不同的,通過(guò)將用電用戶(hù)進(jìn)行分類(lèi),可以提高預(yù)測(cè)用戶(hù)竊電行為的準(zhǔn)確性。

可選的,將用電數(shù)據(jù)庫(kù)中的用電用戶(hù)分為竊電用戶(hù)和不竊電用戶(hù)可以在獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù)之前,也可以在獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù)之后,根據(jù)具體情況而定。

步驟s103,根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模,得到竊電用戶(hù)的竊電行為模型和不竊電用戶(hù)的竊電行為模型:

在獲取歷史用電數(shù)據(jù)之后,分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模,得到用于預(yù)測(cè)用電用戶(hù)的竊電行為的竊電行為模型,竊電行為模型用于表示變量為用電用戶(hù)的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶(hù)的竊電期望值之間的關(guān)系,也即,竊電行為模型的表達(dá)式為竊電期望值=f(屬性參數(shù),用電行為參數(shù))。

進(jìn)一步地,根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建??梢圆捎枚喾N模型建模,并對(duì)通過(guò)多種模型進(jìn)行建模后的建模結(jié)果進(jìn)行測(cè)試,應(yīng)用效果最好的模型,具體而言,根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模包括:采用多種模型對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模;根據(jù)測(cè)試樣本集對(duì)每種模型的建模結(jié)果進(jìn)行測(cè)試,以確定誤差最小的模型種類(lèi)。

該實(shí)施例通過(guò)獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶(hù)的屬性參數(shù)及用電用戶(hù)對(duì)應(yīng)的用電行為參數(shù);將用電數(shù)據(jù)庫(kù)中的用電用戶(hù)分為竊電用戶(hù)和不竊電用戶(hù);根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模,得到竊電用戶(hù)的竊電行為模型和不竊電用戶(hù)的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶(hù)的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶(hù)的竊電期望值之間的關(guān)系,解決了相關(guān)技術(shù)中預(yù)計(jì)用戶(hù)的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問(wèn)題,進(jìn)而實(shí)現(xiàn)了更準(zhǔn)確地預(yù)計(jì)用戶(hù)的竊電行為的技術(shù)效果。

作為上述實(shí)施例的一種可選實(shí)施方式,數(shù)據(jù)處理方法的步驟如下:

(1)對(duì)數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù)進(jìn)行清洗:

1)通過(guò)一個(gè)或多個(gè)數(shù)據(jù)平臺(tái)向數(shù)據(jù)庫(kù)導(dǎo)入多張數(shù)據(jù)表,檢查導(dǎo)入數(shù)據(jù)庫(kù)的多張表的dmp數(shù)據(jù)的一致性,并查詢(xún)每個(gè)表的完整性約束、主鍵和外鍵;

2)每張數(shù)據(jù)表中包括一個(gè)或多個(gè)變量,確定每個(gè)變量下的值,如果多數(shù)是缺失值和無(wú)效值,則該變量對(duì)模型的參考價(jià)值較小,刪除對(duì)應(yīng)的變量,保留缺失值和無(wú)效值較少的變量;

3)檢查不同表格間的同名變量的含義是否相同,如果含義相同,則通過(guò)相似id的主鍵連接,并檢查格式內(nèi)容是否一致,剔除不一致的數(shù)據(jù);

4)在上述結(jié)果中,保留信息較完整詳細(xì)的數(shù)據(jù)。

(2)模型中變量的篩選

1)根據(jù)電力行業(yè)的特點(diǎn),從清洗過(guò)的數(shù)據(jù)中選擇并保留符合建模需要的變量;

2)利用表的主鍵和外鍵進(jìn)行合并,如果沒(méi)有對(duì)應(yīng)的主鍵和外鍵,依照建模需求挑選合適的變量合并,或者結(jié)合時(shí)間序列,參照兩個(gè)變量進(jìn)行合并,最終得到每個(gè)觀測(cè)描述某個(gè)用戶(hù)在某月內(nèi)的行為的總表;

3)檢查表中數(shù)據(jù)的一致性和完整性,并對(duì)不符合條件的變量進(jìn)行補(bǔ)缺或者剔除部分再觀測(cè);

4)通過(guò)竊電用戶(hù)表內(nèi)的竊電天數(shù)、竊電時(shí)間點(diǎn)和用戶(hù)編號(hào)加入目標(biāo)變量“用戶(hù)是否竊電”;

(3)對(duì)用電用戶(hù)進(jìn)行分類(lèi)

1)根據(jù)國(guó)家用電分類(lèi)標(biāo)準(zhǔn)和用電客戶(hù)的用電類(lèi)別分成八大類(lèi)并去除全部居民的數(shù)據(jù);

2)將八大類(lèi)數(shù)據(jù):大工業(yè)用電、中小學(xué)教育教學(xué)用電、農(nóng)業(yè)生產(chǎn)用電、農(nóng)業(yè)排灌用電、非居民照明用電、非工業(yè)用電、普通工業(yè)用電、普通工業(yè)用電和商業(yè)用電的用戶(hù)觀測(cè)分別提取出來(lái);

(4)數(shù)據(jù)分區(qū)

1)把一次分區(qū)所需要的全部觀測(cè),按用戶(hù)分成竊電用戶(hù)的觀測(cè)和不竊電用戶(hù)的觀測(cè)兩個(gè)部分;

2)在數(shù)據(jù)庫(kù)中的竊電用戶(hù)和不竊電用戶(hù)兩個(gè)部分分別抽取一部分,組成建模集,數(shù)據(jù)庫(kù)中剩下的組成評(píng)分集;

3)對(duì)建模集再按一定比例分成訓(xùn)練集、驗(yàn)證集和評(píng)分集;

(5)運(yùn)行sas(statisticsanalysissystem)數(shù)據(jù)統(tǒng)計(jì)分析軟件,建立模型

(6)通過(guò)多種模型進(jìn)行建模,將多個(gè)建模結(jié)果的模型進(jìn)行對(duì)比和評(píng)分

結(jié)果如表1至表3所示:

如表1所示,在決策樹(shù)(卡方)、回歸、神經(jīng)網(wǎng)絡(luò)、梯度boosting、數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡(luò)、dmine回歸合mbr模型中,決策樹(shù)(卡方)的測(cè)試精準(zhǔn)度是最高的,達(dá)99.3871%。將建立模型的變量進(jìn)行重要性排序(如表2所示),結(jié)果顯示為用電量排第一,第二為用電行業(yè)分類(lèi),第三為國(guó)家行業(yè)分類(lèi),因此將數(shù)據(jù)進(jìn)行行業(yè)分類(lèi)后再次進(jìn)行模型構(gòu)建(如表3所示)。從表3的結(jié)果中,八大類(lèi)用電用戶(hù)的精準(zhǔn)度均高于97.8905%,最高為非工業(yè)的99.56492%,精準(zhǔn)度超過(guò)99%的共6個(gè),占75%。

表1模型間精準(zhǔn)度表比較(單位%)

表2決策樹(shù)變量重要性排序

表3各行業(yè)間決策樹(shù)精準(zhǔn)度分析(單位%)

該實(shí)施例提供的數(shù)據(jù)處理方法能夠建立與實(shí)際情況符合程度較高的竊電行為模型,能夠根據(jù)用戶(hù)的屬性和行為推測(cè)用戶(hù)的竊電行為,具有非常高的實(shí)用性和推廣價(jià)值,準(zhǔn)確率較高。

需要說(shuō)明的是,在附圖的流程圖雖然示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。

本申請(qǐng)還提供了一種存儲(chǔ)介質(zhì)的實(shí)施例,該實(shí)施例的存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,在程序運(yùn)行時(shí)控制存儲(chǔ)介質(zhì)所在設(shè)備執(zhí)行本發(fā)明實(shí)施例的數(shù)據(jù)處理方法。

本申請(qǐng)還提供了一種處理器的實(shí)施例,該實(shí)施例的處理器用于運(yùn)行程序,其中,程序運(yùn)行時(shí)執(zhí)行本發(fā)明實(shí)施例的數(shù)據(jù)處理方法。

本申請(qǐng)還提供了一種數(shù)據(jù)處理裝置的實(shí)施例。需要說(shuō)明的是,該實(shí)施例提供數(shù)據(jù)處理裝置可以用于執(zhí)行本發(fā)明實(shí)施例提供的數(shù)據(jù)處理方法。

圖2是根據(jù)本發(fā)明實(shí)施例的一種可選的數(shù)據(jù)處理裝置的示意圖,如圖2所示,該裝置包括獲取單元10,分類(lèi)單元20和建模單元30,其中,獲取單元,用于獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶(hù)的屬性參數(shù)及用電用戶(hù)對(duì)應(yīng)的用電行為參數(shù);分類(lèi)單元,用于將用電數(shù)據(jù)庫(kù)中的用電用戶(hù)分為竊電用戶(hù)和不竊電用戶(hù);建模單元,用于根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模,得到竊電用戶(hù)的竊電行為模型和不竊電用戶(hù)的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶(hù)的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶(hù)的竊電期望值之間的關(guān)系。

該實(shí)施例通過(guò)獲取單元,用于獲取用電數(shù)據(jù)庫(kù)中的歷史用電數(shù)據(jù),其中,歷史用電數(shù)據(jù)包括用電用戶(hù)的屬性參數(shù)及用電用戶(hù)對(duì)應(yīng)的用電行為參數(shù);分類(lèi)單元,用于將用電數(shù)據(jù)庫(kù)中的用電用戶(hù)分為竊電用戶(hù)和不竊電用戶(hù);建模單元,用于根據(jù)歷史用電數(shù)據(jù)分別對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模,得到竊電用戶(hù)的竊電行為模型和不竊電用戶(hù)的竊電行為模型,其中,竊電行為模型用于表示變量為用電用戶(hù)的屬性參數(shù)和用電行為參數(shù)與因變量為用電用戶(hù)的竊電期望值之間的關(guān)系,解決了相關(guān)技術(shù)中預(yù)計(jì)用戶(hù)的竊電行為時(shí)不夠準(zhǔn)確的技術(shù)問(wèn)題,進(jìn)而實(shí)現(xiàn)了更準(zhǔn)確地預(yù)計(jì)用戶(hù)的竊電行為的技術(shù)效果。

進(jìn)一步地,用電數(shù)據(jù)庫(kù)中包括多張數(shù)據(jù)表,每張數(shù)據(jù)表包括用電用戶(hù)的至少一種屬性參數(shù)和至少一種用電行為參數(shù),獲取單元包括:判斷模塊,用于分別判斷每張數(shù)據(jù)表中每個(gè)種類(lèi)的屬性參數(shù)或用電行為參數(shù)的表格值是缺失值或無(wú)效值的數(shù)量是否超過(guò)預(yù)設(shè)數(shù)量;刪除模塊,用于如果判斷結(jié)果為是,則將對(duì)應(yīng)種類(lèi)的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除。

進(jìn)一步地,該裝置還包括:判斷單元,用于在將對(duì)應(yīng)種類(lèi)的屬性參數(shù)或用電行為參數(shù)從竊電行為模型的變量中刪除之后,判斷用電數(shù)據(jù)庫(kù)中是否存在變量?jī)?nèi)容相同的屬性參數(shù)或用電行為參數(shù);合并單元,用于如果判斷結(jié)果為是,則將變量?jī)?nèi)容相同的屬性參數(shù)或用電行為參數(shù)進(jìn)行合并。

進(jìn)一步地,建模單元包括:建模模塊,用于采用多種模型對(duì)竊電用戶(hù)的竊電行為和不竊電用戶(hù)的竊電行為進(jìn)行建模;測(cè)試模塊,用于根據(jù)測(cè)試樣本集對(duì)每種模型的建模結(jié)果進(jìn)行測(cè)試,以確定誤差最小的模型種類(lèi)。

上述的裝置可以包括處理器和存儲(chǔ)器,上述單元均可以作為程序單元存儲(chǔ)在存儲(chǔ)器中,由處理器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的上述程序單元來(lái)實(shí)現(xiàn)相應(yīng)的功能。

存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(ram)和/或非易失性?xún)?nèi)存等形式,如只讀存儲(chǔ)器(rom)或閃存(flashram),存儲(chǔ)器包括至少一個(gè)存儲(chǔ)芯片。

上述本申請(qǐng)實(shí)施例的順序不代表實(shí)施例的優(yōu)劣。

在本申請(qǐng)的上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒(méi)有詳述的部分,可以參見(jiàn)其他實(shí)施例的相關(guān)描述。在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過(guò)其它的方式實(shí)現(xiàn)。

其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過(guò)一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。

另外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以?xún)蓚€(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。

所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷(xiāo)售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:u盤(pán)、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、移動(dòng)硬盤(pán)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。

以上所述僅是本申請(qǐng)的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本申請(qǐng)?jiān)淼那疤嵯?,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本申請(qǐng)的保護(hù)范圍。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
景宁| 陆良县| 瓦房店市| 天柱县| 来宾市| 砚山县| 南宫市| 额尔古纳市| 宜川县| 沂源县| 阜平县| 安顺市| 辽阳县| 宜城市| 南丹县| 寿宁县| 全南县| 驻马店市| 商水县| 邵阳县| 林州市| 莲花县| 葵青区| 白河县| 黔西县| 庄河市| 和平区| 纳雍县| 吉木萨尔县| 商洛市| 平利县| 北辰区| 甘南县| 巫山县| 府谷县| 呼图壁县| 友谊县| 化州市| 六枝特区| 剑阁县| 郴州市|