.5階段:
[0057] 根據(jù)最終目標(biāo)函數(shù)對S中每個元素求導(dǎo),具體公式為叛* = Σ;1ιΟ巧[V悼丫-聽]+成
[0058] 步驟2.6)對矩陣S中每個元素進(jìn)行更新的S2.6階段:
[0059] 每個《分別減去步長乘W梯度,具體的更新公式為sW -巧冷是人工設(shè)定 的步長;
[0060] 步驟2.7)判斷算法是否收斂的S2.7階段:
[0061 ]若算法收斂,則進(jìn)行步驟2.8),否則返回步驟2.2);
[0062] 步驟2.8)輸出結(jié)果的S2.8階段:
[0063] 輸出用戶用電需求結(jié)果,本流程至此結(jié)束。
[0064] 在步驟3)中,所述的兩個基本指標(biāo)的計算公式如下:
[0065] (1)不同用戶的用電需求矩陣的相似度的衡量指標(biāo)如下:
[0066] Sim(Vi,Vj) = tr(Vi,V/)/( | |Vi| | | |Vj| | )
[0067] 其中tr( ·,·)表示矩陣的對角線上元素的和,II · II表示矩陣的L2范式。
[0068] (2)-個用戶分組C中,所有用戶的整體用電需求矩陣的計算公式如下:
[0069]
[0070] 其中I C I表示分組C中包含用戶的個數(shù)。
[0071 ]在步驟3)中,所述的用戶細(xì)分方法如下:
[007引步驟3.1)將用戶隨機(jī)劃分為k個簇C1,C2,…,ck的S3.1階段:
[0073] 其中k表示人為設(shè)定的用戶簇的個數(shù);
[0074] 步驟3.2)計算每個簇的整體表示的S3.2階段:
[0075] 采用上述在步驟3)中的步驟(2)中的公式來計算每個簇的整體表示;
[0076] 步驟3.3)計算第i個用戶與所有簇之間相似度的S3.3階段:
[OOW]采用上述在步驟3)中的步驟(1)中的公式,將每個簇的整體表示看作是一個特殊 的"用戶',計算用戶與簇之間的相似度;
[0078] 步驟3.4)調(diào)整第i個用戶的簇標(biāo)簽的S3.4階段:
[0079] 根據(jù)步驟3.3)中的結(jié)果,將第i個用戶的簇標(biāo)簽調(diào)整為與之最相似的簇;
[0080] 步驟3.5)判斷所有用戶是否調(diào)整完畢的S3.5階段:
[0081] 判斷是否所有用戶的簇標(biāo)簽均調(diào)整完畢,若是,進(jìn)行步驟3.6),若否,返回步驟 3.2) ;
[0082] 步驟3.6)判斷用戶簇標(biāo)簽是否收斂的S3.6階段:
[0083] 判斷上一輪用戶簇標(biāo)簽調(diào)整中是否有用戶的簇標(biāo)簽發(fā)生改變,若是,返回步驟 3.2) ,若否,進(jìn)行步驟3.7);
[0084] 步驟3.7)輸出結(jié)果的S3.7階段:
[0085] 輸出所有用戶簇標(biāo)簽結(jié)果,本流程至此結(jié)束。
[0086] 本發(fā)明提供的基于聯(lián)合矩陣分解模型的電力用戶細(xì)分方法的效果:
[0087] 本發(fā)明對用戶的需求分析與表示,包含用戶的用電行為、時間、日期和地理位置等 信息信息,相比于傳統(tǒng)方法,用戶在需求空間中的表示具有更加豐富的涵義。
[0088] 本發(fā)明采用聚類算法,在隱含需求空間中綜合考慮用戶本身的特性和用戶間關(guān)系 對用戶進(jìn)行聚類,每個簇中的用戶的關(guān)聯(lián)關(guān)系更加緊密。不同簇之間,用戶在用電需求和地 理位置等方面均存在較大差異。
【附圖說明】
[0089] 圖1為本發(fā)明提供的基于聯(lián)合矩陣分解模型的電力用戶細(xì)分方法的整體系統(tǒng)結(jié)構(gòu) 示意圖。
[0090] 圖2是本發(fā)明提供的基于聯(lián)合矩陣分解模型的電力用戶細(xì)分方法流程圖。
[0091] 圖3是本發(fā)明提供的基于聯(lián)合矩陣分解模型的電力用戶細(xì)分方法中聯(lián)合矩陣分解 模型求解方法流程圖。
[0092] 圖4是本發(fā)明提供的基于聯(lián)合矩陣分解模型的電力用戶細(xì)分方法中用戶細(xì)分方法 流程圖。
【具體實施方式】
[0093] 下面結(jié)合附圖和具體實施例對本發(fā)明提供的基于聯(lián)合矩陣分解模型的電力用戶 細(xì)分方法進(jìn)行詳細(xì)說明。
[0094] 如圖1所示,本發(fā)明主要采用數(shù)據(jù)挖掘理論和方法對電力數(shù)據(jù)中的用戶進(jìn)行分析, 為了保證系統(tǒng)的正常運行,在具體實施中,要求所使用的計算機(jī)平臺配備不低于8G的內(nèi)存, CPU核屯、數(shù)不低于4個且主頻不低于2.6G化、Windows 7及W上版本的64位操作系統(tǒng),并安裝 化acle數(shù)據(jù)庫、Java 1.7及W上版本、Matlab 201化及W上版本等必備軟件環(huán)境。
[0095] 如圖2所示,本發(fā)明提供的基于聯(lián)合矩陣分解模型的電力用戶細(xì)分方法包括按順 序執(zhí)行的下列步驟:
[0096] 步驟1)輸入用戶的用電記錄數(shù)據(jù),根據(jù)用電記錄數(shù)據(jù)構(gòu)建用戶的用電記錄矩陣; 輸入用戶的地理位置信息,將用戶的地理位置信息用層級表示,構(gòu)建用戶的地理位置信息 相似度矩陣,并調(diào)節(jié)不同層級的地理位置信息中不同組成部分的權(quán)重;
[0097] 用戶的用電記錄矩陣包含影響用戶用電行為的兩個重要因素:1)矩陣的行表示每 天不同的用戶數(shù)據(jù)采樣時間點,2)矩陣的列表示用戶記錄數(shù)據(jù)中包含的每一天。
[0098] 步驟2)根據(jù)步驟1)獲得的用戶的用電記錄矩陣構(gòu)建聯(lián)合矩陣分解模型的目標(biāo)函 數(shù),分析影響用戶用電行為的時間因素與日期因素,并選擇合理的目標(biāo)函數(shù)求解算法進(jìn)行 求解,W得到用戶用電需求;
[0099] 所述的目標(biāo)函數(shù)包括五個方面:1)最大可能地降低每個用戶的用電記錄矩陣在分 解為時間因素矩陣和日期因素矩陣過程中的損失,2)保持不同用戶的用電記錄矩陣分解得 到的日期因素矩陣的一致性;3)最大可能地降低在地理位置上相鄰的用戶的時間因素矩陣 的差異;4)最大可能地保持時間因素矩陣和日期因素矩陣的平滑,5)保持目標(biāo)函數(shù)的凸性, 使模型具有全局最優(yōu)解;求解算法應(yīng)當(dāng)滿足=個基本條件:1)算法能夠在可接受的時間內(nèi) 收斂,2)算法對存儲空間的需求要控制在合理范圍內(nèi),3)算法能夠并行執(zhí)行,W提高計算效 率。
[0100] 步驟3)根據(jù)上述用戶用電需求對用戶進(jìn)行細(xì)分:
[0101] 根據(jù)用戶用電需求對用戶進(jìn)行細(xì)分應(yīng)當(dāng)滿足兩個基本條件:1)同一組中的用戶應(yīng) 當(dāng)具有相似的用電需求矩陣,2)不同組中的用戶的用電需求矩陣應(yīng)當(dāng)盡可能不同;因此,為 了提高用戶細(xì)分結(jié)果的質(zhì)量,在用戶細(xì)分過程中,需要計算兩個基本指標(biāo):1)不同用戶的用 電需求矩陣的相似度的衡量指標(biāo),2)-個用戶分組中,所有用戶的整體用電需求矩陣的計 算;同時,算法應(yīng)能夠自行優(yōu)化,對劃分到錯誤的分組中的用戶進(jìn)行調(diào)整。
[0102] 在步驟1)中,所述的輸入用戶的用電記錄數(shù)據(jù),根據(jù)用戶的用電記錄數(shù)據(jù)構(gòu)建用 電記錄矩陣的方法為:
[0103] 所輸入的用戶用電記錄數(shù)據(jù)中的所有用戶被表示為集合:
[0104] U={ui,U2,...,un}
[010引其中N表示數(shù)據(jù)中包含的用戶個數(shù),ui表示第i個用戶。
[0106] 第i個用戶的用電記錄數(shù)據(jù)被構(gòu)建為用電記錄矩陣:
[0107]
[0108] 其中D表示數(shù)據(jù)中用電記錄包含的天數(shù),T表示每個用戶每天的用電記錄包含的均 勻采樣點的個數(shù),盼"表示T行D列的非負(fù)實數(shù)矩陣。同時,用巧'和町分別表示矩陣化的第t 行和第d列,即用戶m在每天第t個時間點上的所有用電記錄和在第d天的用電記錄,并用?if 表示矩陣化的第t行第d列上的元素;
[0109] 最終,輸出所有用戶的用電記錄矩陣:
[0110]
。
[0111] 在步驟1)中,所述的輸入用戶的地理位置信息,將用戶的地理位置信息用層級表 示,構(gòu)建用戶的地理位置信息相似度矩陣,并調(diào)節(jié)不同層級的地理位置信息中不同組成部 分的權(quán)重的方法為:
[0112] 第i個用戶的地理位置信息被表示為結(jié)構(gòu)體:
[0113]
[0114] 其中茜為居住地點中某個組成部分的字符串表示,gf按行政單位,即省、城市、區(qū) 縣、鄉(xiāng)鎮(zhèn)、街道、小區(qū)等,從大到小的順序排列;
[0115] 第i個用戶和第j個用戶的地理位置信息相似度計算公式為:
[0116]
[0117] 其中eU表示兩個用戶地理位置信息的相似度值,δ(.,.)為邏輯函數(shù),當(dāng)兩個字 符串相同時取值1,否則為〇,λι^Ε(〇, 1)為平衡參數(shù),用于