欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于節(jié)點(diǎn)置信半徑的p2p網(wǎng)絡(luò)分布式聚類方法

文檔序號(hào):7656837閱讀:267來源:國(guó)知局
專利名稱:一種基于節(jié)點(diǎn)置信半徑的p2p網(wǎng)絡(luò)分布式聚類方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)通信、數(shù)據(jù)挖掘及分布式聚類領(lǐng)域,尤其涉及一種P2P網(wǎng)絡(luò)(對(duì)等網(wǎng)絡(luò))分布式聚類方法。
背景技術(shù)
聚類(Clustering)分析是指對(duì)一個(gè)已給的數(shù)據(jù)對(duì)象集合,依照一定的規(guī)則將數(shù)據(jù)對(duì)象分成多類的過程,聚類使得同一聚類中的數(shù)據(jù)對(duì)象彼此盡可能相似,不同聚類中的數(shù)據(jù)對(duì)象彼此盡可能相異。迄今為止,人們已經(jīng)提出了許多聚類方法,例如K-Means, DBSCAN, Cure, Birch等。在諸多的聚類方法中,K-Means是應(yīng)用最廣泛的方法之一,這是由于相比其他方法,K-Means方法具有方法簡(jiǎn)單易實(shí)現(xiàn)且聚類效果穩(wěn)定的特點(diǎn)。
傳統(tǒng)的K-Means聚類方法分析處理是基于單個(gè)中心服務(wù)器上的數(shù)據(jù)。近年來,文件共享、視頻點(diǎn)播等分布式的P2P網(wǎng)絡(luò)日漸成為互聯(lián)網(wǎng)的主要應(yīng)用,由于P2P網(wǎng)絡(luò)是一種不依賴于集中服務(wù)器的對(duì)等網(wǎng)絡(luò),網(wǎng)絡(luò)中的任意節(jié)點(diǎn)均可以作為服務(wù)器提供資源,也可以作為客戶機(jī)下載資源,所以,在P2P網(wǎng)絡(luò)中,數(shù)據(jù)資源散落地分布在網(wǎng)絡(luò)各個(gè)節(jié)點(diǎn)上。由于站點(diǎn)在數(shù)據(jù)存儲(chǔ)量、信息安全及隱私保護(hù)等方面的限制,把不同站點(diǎn)的海量或者隱私數(shù)據(jù)全部集中到某一個(gè)中心服務(wù)器進(jìn)行全局聚類是不可能的,因此研究適用于分布式環(huán)境下的 K-Means聚類方法尤其重要。
在P2P環(huán)境下的分布式聚類方法中,Eisenhardt等人提出一種Probe/Echo (探測(cè)/回應(yīng))機(jī)制的分布式聚類方法,該方法通過在網(wǎng)絡(luò)中對(duì)節(jié)點(diǎn)聚類進(jìn)行同步,取得較為精確的聚類效果,但這種方法的缺陷是網(wǎng)絡(luò)帶寬使用率高、帶寬消耗非常大。Jin等人提出了 DFEKM方法,該方法通過計(jì)算聚類的置信半徑方式來完成聚類,但該方法并沒有提出一個(gè)合適的置信半徑計(jì)算方法,對(duì)所有節(jié)點(diǎn)采用固定閾值參數(shù)來確定置信半徑大小,由于聚類只能在分布式節(jié)點(diǎn)上局部地進(jìn)行,該方法所設(shè)定的固定半徑并沒有考慮數(shù)據(jù)在節(jié)點(diǎn)上的分布式及局部性的特點(diǎn),仍然需要較多的迭代數(shù)來完成聚類。

發(fā)明內(nèi)容
為了節(jié)約分布式網(wǎng)路聚類所需帶寬并盡可能保持聚類的精度,考慮到同一類的數(shù)據(jù)中存在稠密和稀疏的數(shù)據(jù)分布,如果在聚類過程中能保持稠密數(shù)據(jù)的類別屬性不發(fā)生改變,則近似認(rèn)為聚類基本完成,而不考慮稀疏數(shù)據(jù)對(duì)聚類的影響。應(yīng)用此原理,考慮數(shù)據(jù)在 P2P網(wǎng)絡(luò)節(jié)點(diǎn)中的分布式狀況,本發(fā)明提出一種基于節(jié)點(diǎn)置信半徑的P2P網(wǎng)絡(luò)分布式聚類方法,基于Fisher判別來確定聚類置信半徑的分布式K-Means聚類算法,在保持聚類精度的同時(shí),大幅減少分布式網(wǎng)絡(luò)聚類過程中所需的迭代數(shù),節(jié)約網(wǎng)絡(luò)帶寬。
本發(fā)明的技術(shù)方案是采用如下步驟
步驟1 在網(wǎng)絡(luò)中隨機(jī)選擇初始節(jié)點(diǎn)作為聚類發(fā)起節(jié)點(diǎn),并且隨機(jī)選擇k個(gè)數(shù)據(jù)作為初始聚類中心;
步驟2 聚類發(fā)起節(jié)點(diǎn)將初始聚類中心作為Probe消息發(fā)送給其所有直接相鄰的鄰居節(jié)點(diǎn),以便聚類發(fā)起節(jié)點(diǎn)自主地更新局部聚類中心并更新自身的聚類置信半徑;每一個(gè)鄰居節(jié)點(diǎn)也都繼續(xù)Probe消息轉(zhuǎn)發(fā)過程,并等待從其鄰居節(jié)點(diǎn)接收Echo消息,以完成局部聚類;
步驟3 聚類發(fā)起節(jié)點(diǎn)等待其鄰居節(jié)點(diǎn)回送Echo消息,若接收到其所有鄰居節(jié)點(diǎn)的 Echo消息,網(wǎng)絡(luò)中所有節(jié)點(diǎn)的局部聚類已完成,轉(zhuǎn)到步驟4,否則繼續(xù)等待鄰居節(jié)點(diǎn)回送 Echo消息;其中,Echo消息中包含節(jié)點(diǎn)根據(jù)自身數(shù)據(jù)及結(jié)合它的直接相鄰的鄰居節(jié)點(diǎn)聚類數(shù)據(jù)所完成的局部聚類后所形成的局部聚類中心、所得局部聚類中每個(gè)類所包含的數(shù)據(jù)對(duì)象數(shù),以及本節(jié)點(diǎn)是否需要繼續(xù)迭代的邏輯變量;
步驟4 聚類發(fā)起節(jié)點(diǎn)將接收到的Echo消息中所包含的局部聚類信息與自身節(jié)點(diǎn)的局部聚類信息進(jìn)行合并形成整個(gè)網(wǎng)絡(luò)的聚類中心,并應(yīng)用Fisher線性判別準(zhǔn)則計(jì)算該節(jié)點(diǎn)的置信半徑;
步驟5 聚類發(fā)起節(jié)點(diǎn)計(jì)算保留的上次聚類中心和本次聚類完成后所形成聚類中心的距離,若該距離小于置信半徑并且接收到的邏輯變量都為false,則聚類過程結(jié)束;否則轉(zhuǎn)到步驟2,開始下一輪聚類過程。
步驟2所述局部聚類過程具體是
1)節(jié)點(diǎn)Pn從其鄰居節(jié)點(diǎn)接受消息;
2)節(jié)點(diǎn)Pn進(jìn)行消息判斷,若為Echo消息,則進(jìn)行步驟7);否則為Probe消息,轉(zhuǎn)步驟 3)繼續(xù)判斷;
3)節(jié)點(diǎn)Pn進(jìn)行是否首次收到Probe消息判斷,如果否,則轉(zhuǎn)步驟8);如果是,則繼續(xù)步驟4);
4)節(jié)點(diǎn)Pn進(jìn)行首次接收Probe消息處理,將消息處理數(shù)置1;將首次發(fā)送Probe消息的節(jié)點(diǎn)設(shè)為父節(jié)點(diǎn)P ;
5)節(jié)點(diǎn)Pn將收到的Probe消息轉(zhuǎn)發(fā)給除了父節(jié)點(diǎn)ρ以外的所有鄰居節(jié)點(diǎn);
6)節(jié)點(diǎn)Pn將自身包含的局部數(shù)據(jù)按照其到Probe消息中所含聚類中心的距離進(jìn)行聚類,將每一個(gè)局部數(shù)據(jù)分類到聚類中心距離最小的某一個(gè)聚類中,計(jì)算節(jié)點(diǎn)Pn的局部聚類中心和置信半徑;
7)鄰居節(jié)點(diǎn)返回了Echo消息給節(jié)點(diǎn)pn,節(jié)點(diǎn)Pn將接收消息處理數(shù)累加1 ;
8)鄰居節(jié)點(diǎn)發(fā)送了Probe消息給節(jié)點(diǎn)pn,節(jié)點(diǎn)Pn將接收消息處理數(shù)累加1,只對(duì)返回 Echo消息的鄰居節(jié)點(diǎn)進(jìn)行局部聚類結(jié)果的合并;
9)節(jié)點(diǎn)Pn進(jìn)行消息處理數(shù)判斷,如果消息處理數(shù)不等于鄰居數(shù)則轉(zhuǎn)到步驟1)繼續(xù)等待從鄰居節(jié)點(diǎn)接收消息;否則執(zhí)行步驟10);
10)判斷本節(jié)點(diǎn)Pn前后兩次聚類中心的距離是否超過置信半徑或者接收到Echo消息中所包含的邏輯變量不全為false,若判斷正確,該節(jié)點(diǎn)或者其鄰居節(jié)點(diǎn)進(jìn)一步聚類,進(jìn)行步驟11);如果判斷不成立,則執(zhí)行步驟12);
11)節(jié)點(diǎn)Pn將邏輯變量置true,以指示初始聚類節(jié)點(diǎn)繼續(xù)下一個(gè)聚類迭代過程;
12)節(jié)點(diǎn)Pn將邏輯變量置false,節(jié)點(diǎn)Pn及以該節(jié)點(diǎn)為父節(jié)點(diǎn)P的其他節(jié)點(diǎn)已完成聚類;
13)節(jié)點(diǎn)Pn將接收到的Echo消息中所包含的聚類信息與本節(jié)點(diǎn)的聚類信息進(jìn)行局部聚類中心的合并與更新,并形成節(jié)點(diǎn)Pn的Echo消息;14)節(jié)點(diǎn)pn發(fā)送Echo消息給父節(jié)點(diǎn)P。
本發(fā)明節(jié)約分布式網(wǎng)路聚類所需帶寬并盡可能保持聚類的精度,考慮到同一類的數(shù)據(jù)中存在稠密和稀疏的數(shù)據(jù)分布,采用一種基于Fisher判別來確定聚類置信半徑的分布式K-Means聚類算法,F(xiàn)isher線性判別是模式識(shí)別中的分類方法,該方法通過尋找最佳分類線,將兩類數(shù)據(jù)投影到分類線上,使得不同類數(shù)據(jù)之間的距離最大,并且使得類內(nèi)的數(shù)據(jù)密集分布。網(wǎng)絡(luò)中節(jié)點(diǎn)通過分別應(yīng)用Fisher線性判別率,確定同一類數(shù)據(jù)在節(jié)點(diǎn)上的稠密和稀疏分布,從而確定聚類的置信半徑并指導(dǎo)下一步的聚類,因此,本發(fā)明的有益效果是通過對(duì)每個(gè)P2P節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行自主學(xué)習(xí),根據(jù)網(wǎng)絡(luò)上各個(gè)節(jié)點(diǎn)的數(shù)據(jù)分布動(dòng)態(tài)地計(jì)算出置信半徑,確定節(jié)點(diǎn)上的聚類置信半徑,指導(dǎo)下一次聚類及聚類的迭代過程,在保證聚類效果的同時(shí),減少分布式網(wǎng)絡(luò)上聚類的迭代次數(shù)以節(jié)省帶寬,最終提高網(wǎng)絡(luò)的應(yīng)用水平。


圖1是本發(fā)明方法的主流程圖; 圖2是節(jié)點(diǎn)消息處理流程圖;
圖3是節(jié)點(diǎn)消息傳遞圖;
圖4是本發(fā)明方法對(duì)一組數(shù)據(jù)對(duì)象進(jìn)行聚類的數(shù)據(jù)分布圖; 圖5是聚類結(jié)束后聚類效果的比較圖; 圖6是聚類結(jié)束后所需迭代數(shù)比較圖。
具體實(shí)施例方式參照?qǐng)D1,本發(fā)明應(yīng)用Probe/Echo的消息傳遞機(jī)制,進(jìn)行基于節(jié)點(diǎn)置信半徑的分布式聚類,主要過程如下
步驟101,初始化過程,在網(wǎng)絡(luò)中隨機(jī)選擇初始節(jié)點(diǎn)作為聚類發(fā)起節(jié)點(diǎn),并且隨機(jī)選擇 k個(gè)數(shù)據(jù)作為初始聚類中心,接著執(zhí)行步驟102 ;
步驟102,聚類發(fā)起節(jié)點(diǎn)將初始聚類中心作為Probe消息發(fā)送給其所有直接相鄰的鄰居節(jié)點(diǎn)(以下的鄰居節(jié)點(diǎn)均指直接相鄰的鄰居節(jié)點(diǎn)),以便聚類發(fā)起節(jié)點(diǎn)自主地更新局部聚類中心并更新自身的聚類置信半徑;每一個(gè)鄰居節(jié)點(diǎn)也都繼續(xù)Probe消息轉(zhuǎn)發(fā)過程,并等待從其鄰居節(jié)點(diǎn)接收Echo消息,以完成局部聚類。接著執(zhí)行步驟103 ;
步驟103,聚類發(fā)起節(jié)點(diǎn)等待其鄰居節(jié)點(diǎn)回送Echo消息,若接收到其所有鄰居節(jié)點(diǎn)的 Echo消息,說明網(wǎng)絡(luò)所有節(jié)點(diǎn)的局部聚類已完成,轉(zhuǎn)到步驟104,否則在步驟103繼續(xù)等待鄰居節(jié)點(diǎn)回送Echo消息。
步驟104,聚類發(fā)起節(jié)點(diǎn)將接收到Echo消息中所包含的局部聚類信息與自身節(jié)點(diǎn)的局部聚類信息進(jìn)行合并形成整個(gè)網(wǎng)絡(luò)的聚類中心,并計(jì)算置信半徑,完成一次K-Means 聚類過程。Echo消息中包含節(jié)點(diǎn)根據(jù)自身數(shù)據(jù)及結(jié)合它的鄰居節(jié)點(diǎn)聚類數(shù)據(jù)所完成的局部聚類后所形成的局部聚類中心、所得局部聚類中每個(gè)類所包含的數(shù)據(jù)對(duì)象數(shù)。接著執(zhí)行步驟 105 ;
步驟105,進(jìn)行聚類結(jié)束條件判斷,聚類發(fā)起節(jié)點(diǎn)計(jì)算保留的上次聚類中心和本次聚類完成后所形成聚類中心的距離,如果是第一次聚類就是初始聚類中心和本次完成聚類后形成的聚類中心之間的距離,如果不是第一次,顯然是上次和本次的聚類中心之間的距離,如果距離小于置信半徑并且接收到的Further變量都為false,說明所有節(jié)點(diǎn)的聚類結(jié)果較為穩(wěn)定,聚類過程結(jié)束;否則轉(zhuǎn)到步驟102,開始下一輪聚類過程。
其中, Probe消息中包含各個(gè)類的聚類中心;Echo消息中包含節(jié)點(diǎn)根據(jù)自身數(shù)據(jù)及結(jié)合它的直接相鄰的鄰居節(jié)點(diǎn)聚類數(shù)據(jù)所完成的局部聚類后所形成的局部聚類中心、 所得局部聚類中每個(gè)類所包含的數(shù)據(jù)對(duì)象數(shù),以及本節(jié)點(diǎn)是否需要繼續(xù)迭代的邏輯變量 Further (邏輯變量,表示節(jié)點(diǎn)是否需要再次迭代,其取值只有true和false),如果節(jié)點(diǎn)的前后兩次聚類中心距離大于本節(jié)點(diǎn)的置信半徑,F(xiàn)urther為true,表示需要繼續(xù)進(jìn)行下一次迭代;相反,則設(shè)置Further為false。
其中,節(jié)點(diǎn)置信半徑的計(jì)算應(yīng)用Fi sher線性判別準(zhǔn)則,F(xiàn)i sher線性判別是模式識(shí)別中的分類方法,該方法通過尋找最佳分類線,將兩類數(shù)據(jù)投影到分類線上,使得不同類數(shù)據(jù)之間的距離最大,并且使得類內(nèi)的數(shù)據(jù)密集分布。網(wǎng)絡(luò)中節(jié)點(diǎn)通過分別應(yīng)用Fisher線性判別率,確定同一類數(shù)據(jù)在節(jié)點(diǎn)上的稠密和稀疏分布,從而確定聚類的置信半徑并指導(dǎo)下一步的聚類。Fisher線性判別準(zhǔn)則應(yīng)用如下假設(shè)某一類數(shù)據(jù)對(duì)象共有 J/個(gè)數(shù)據(jù)對(duì)象,考慮將其分為兩類問題,假設(shè)Λ 個(gè)數(shù)據(jù)對(duì)象的中心為對(duì)M個(gè)數(shù)據(jù)對(duì)象,分別計(jì)算其到中心的距離, 并按照升序排列,得到一個(gè)按照距離排序的集合⑷義...,Μ),及其對(duì)應(yīng)的數(shù)據(jù)對(duì)象集合為{ify =l,2_ikf}。其中,Ii是到按照到聚類中心距離排序的第i個(gè)數(shù)據(jù)對(duì)象,其到中心的距離為式。Fisher線性判別率表示為
JfiskeX" = ^Fj( 1)
其中,和分別表示所有數(shù)據(jù)對(duì)象以&為分隔點(diǎn)的兩個(gè)聚類均值距離以及距離方差和。
^p = Mjf(2) = (3)
其中,片是Jf1到孓的數(shù)據(jù)對(duì)象上而到/的距離均值;相似地,嶺是<+1到知上的距離均值。of則是式到^的數(shù)據(jù)對(duì)象上為到式的距離方差,of是到上的距離方差。。 )則是為以恥=U和^ =為兩類的Fisher線性判別率。
所有數(shù)據(jù)對(duì)象集上的Fisher線性判別率越大,說明通過該方法得到的兩類數(shù)據(jù)越明顯,從而找到以聚類中心的數(shù)據(jù)稠密與稀疏的分界點(diǎn)。當(dāng)fisher判別率最大時(shí),假設(shè)為ImJM ,此時(shí)的&為聚類的最佳分隔數(shù)據(jù)點(diǎn),所得置信半徑為
CR = dR(4)
參照?qǐng)D2,基于節(jié)點(diǎn)Fisher置信半徑的P2P網(wǎng)絡(luò)分布式聚類過程中,某個(gè)節(jié)點(diǎn)(假設(shè)為 Pn)的Probe/Echo消息及局部聚類處理過程具體如下
步驟201,節(jié)點(diǎn)其鄰居節(jié)點(diǎn)接受消息;接著執(zhí)行步驟202 ;步驟202,節(jié)點(diǎn)pn進(jìn)行消息判斷,如果為Echo消息,則進(jìn)行步驟207 ;否則為Probe消息,轉(zhuǎn)步驟203繼續(xù)判斷;
步驟203,節(jié)點(diǎn)pn進(jìn)行是否首次收到Probe消息判斷,如果不是首次接收到Probe消息, 則進(jìn)行步驟208 ;如果是首次接收Probe消息,則繼續(xù)步驟204 ;
步驟204,節(jié)點(diǎn)Pn進(jìn)行首次接收Probe消息處理,將消息處理數(shù)(接收變量)置1 ;將首次發(fā)送Probe消息的節(jié)點(diǎn)設(shè)為父節(jié)點(diǎn),假設(shè)為ρ節(jié)點(diǎn)。接著執(zhí)行步驟205 ;
步驟205,節(jié)點(diǎn)收到的Probe消息轉(zhuǎn)發(fā)給除了父節(jié)點(diǎn)ρ以外的所有鄰居節(jié)點(diǎn);接著執(zhí)行步驟206 ;
步驟206,節(jié)點(diǎn)Pn將自身包含的局部數(shù)據(jù)按照其到Probe消息中所含聚類中心的距離進(jìn)行聚類,將每一個(gè)局部數(shù)據(jù)分類到聚類中心距離最小的某一個(gè)聚類中,然后應(yīng)用公式(5) 計(jì)算節(jié)點(diǎn)Pn的局部聚類中心,以及應(yīng)用公式(1) _ (4)計(jì)算節(jié)點(diǎn)pn的置信半徑;接著執(zhí)行步驟207 ;
步驟207,鄰居節(jié)點(diǎn)返回了 Echo消息給節(jié)點(diǎn)pn,節(jié)點(diǎn)Pn將接收消息處理數(shù)累加1。繼續(xù)執(zhí)行步驟208 ;
步驟208,鄰居節(jié)點(diǎn)發(fā)送了 Probe消息給節(jié)點(diǎn)pn,節(jié)點(diǎn)Pn將接收消息處理數(shù)累加1,說明該鄰居節(jié)點(diǎn)不是將節(jié)點(diǎn)Pn作為父節(jié)點(diǎn),因此不需要將該鄰居的局部聚類結(jié)果返回給節(jié)點(diǎn) Pn來完成聚類消息的合并;即網(wǎng)絡(luò)中的節(jié)點(diǎn)只對(duì)返回Echo消息的鄰居節(jié)點(diǎn)進(jìn)行局部聚類結(jié)果的合并,從而保證聚類結(jié)果的唯一性。接著執(zhí)行步驟209 ;
步驟209,節(jié)點(diǎn)Pn進(jìn)行消息處理數(shù)判斷,如果消息處理數(shù)不等于鄰居數(shù)則轉(zhuǎn)到步驟201 繼續(xù)等待從鄰居節(jié)點(diǎn)接收消息;否則執(zhí)行步驟210。
步驟210,判斷本節(jié)點(diǎn)Pn前后兩次聚類中心的距離是否超過置信半徑或者接收到 Echo消息中所包含的Further變量不全為false,若判斷正確,說明該節(jié)點(diǎn)或者其鄰居節(jié)點(diǎn)需要進(jìn)一步聚類,進(jìn)行步驟211 ;如果判斷不成立,則執(zhí)行步驟212 ;
步驟211,節(jié)點(diǎn)pn將Further置true,以指示初始聚類節(jié)點(diǎn)繼續(xù)下一個(gè)聚類迭代過程。 接著執(zhí)行步驟212;
步驟212,節(jié)點(diǎn)?11將Further置false,說明節(jié)點(diǎn)Pn及以該節(jié)點(diǎn)為父節(jié)點(diǎn)的其他節(jié)點(diǎn)已完成聚類,不需要初始聚類節(jié)點(diǎn)繼續(xù)下一個(gè)聚類迭代過程。接著執(zhí)行步驟213 ;
步驟213,節(jié)點(diǎn)pn將接收到的Echo消息中所包含的聚類信息與本節(jié)點(diǎn)的聚類信息應(yīng)用以下公式(5)- (7)進(jìn)行局部聚類中心的合并與更新,并形成節(jié)點(diǎn)pn WEcho消息。接著執(zhí)行步驟214 ;
局部聚類中心的合并與更新的公式如下
權(quán)利要求
1.一種基于節(jié)點(diǎn)置信半徑的P2P網(wǎng)絡(luò)分布式聚類方法,其特征是采用如下步驟步驟1 在網(wǎng)絡(luò)中隨機(jī)選擇初始節(jié)點(diǎn)作為聚類發(fā)起節(jié)點(diǎn),并且隨機(jī)選擇k個(gè)數(shù)據(jù)作為初始聚類中心;步驟2 聚類發(fā)起節(jié)點(diǎn)將初始聚類中心作為Probe消息發(fā)送給其所有直接相鄰的鄰居節(jié)點(diǎn),以便聚類發(fā)起節(jié)點(diǎn)自主地更新局部聚類中心并更新自身的聚類置信半徑;每一個(gè)鄰居節(jié)點(diǎn)也都繼續(xù)消息轉(zhuǎn)發(fā)過程,并等待從其鄰居節(jié)點(diǎn)接收Echo消息,以完成局部聚類;步驟3:聚類發(fā)起節(jié)點(diǎn)等待其鄰居節(jié)點(diǎn)回送Echo消息,若接收到其所有鄰居節(jié)點(diǎn)的 Echo消息,網(wǎng)絡(luò)中所有節(jié)點(diǎn)的局部聚類已完成,轉(zhuǎn)到步驟4,否則繼續(xù)等待鄰居節(jié)點(diǎn)回送 Echo消息;其中,Echo消息中包含節(jié)點(diǎn)根據(jù)自身數(shù)據(jù)及結(jié)合它的直接相鄰的鄰居節(jié)點(diǎn)聚類數(shù)據(jù)所完成的局部聚類后所形成的局部聚類中心、所得局部聚類中每個(gè)類所包含的數(shù)據(jù)對(duì)象數(shù),以及本節(jié)點(diǎn)是否需要繼續(xù)迭代的邏輯變量;步驟4 聚類發(fā)起節(jié)點(diǎn)將接收到的Echo消息中所包含的局部聚類信息與自身節(jié)點(diǎn)的局部聚類信息進(jìn)行合并形成整個(gè)網(wǎng)絡(luò)的聚類中心,并應(yīng)用Fisher線性判別準(zhǔn)則計(jì)算該節(jié)點(diǎn)的置信半徑;步驟5 聚類發(fā)起節(jié)點(diǎn)計(jì)算保留的上次聚類中心和本次聚類完成后所形成聚類中心的距離,若該距離小于置信半徑并且接收到的邏輯變量都為false,則聚類過程結(jié)束;否則轉(zhuǎn)到步驟2,開始下一輪聚類過程。
2.根據(jù)權(quán)利要求1所述的一種基于節(jié)點(diǎn)置信半徑的P2P網(wǎng)絡(luò)分布式聚類方法,其特征是步驟2所述局部聚類過程具體是1)節(jié)點(diǎn)Pn從其鄰居節(jié)點(diǎn)接受消息;2)節(jié)點(diǎn)Pn進(jìn)行消息判斷,若為Echo消息,則進(jìn)行步驟7);否則為Probe消息,轉(zhuǎn)步驟 3)繼續(xù)判斷;3)節(jié)點(diǎn)Pn進(jìn)行是否首次收到消息判斷,如果否,則轉(zhuǎn)步驟8);如果是,則繼續(xù)步驟4);4)節(jié)點(diǎn)Pn進(jìn)行首次接收ftObe消息處理,將消息處理數(shù)置1;將首次發(fā)送Probe消息的節(jié)點(diǎn)設(shè)為父節(jié)點(diǎn)P ;5)節(jié)點(diǎn)Pn將收到的ftObe消息轉(zhuǎn)發(fā)給除了父節(jié)點(diǎn)ρ以外的所有鄰居節(jié)點(diǎn);6)節(jié)點(diǎn)Pn將自身包含的局部數(shù)據(jù)按照其到Probe消息中所含聚類中心的距離進(jìn)行聚類,將每一個(gè)局部數(shù)據(jù)分類到聚類中心距離最小的某一個(gè)聚類中,計(jì)算節(jié)點(diǎn)Pn的局部聚類中心和置信半徑;7)鄰居節(jié)點(diǎn)返回了Echo消息給節(jié)點(diǎn)Pn,節(jié)點(diǎn)Pn將接收消息處理數(shù)累加1 ;8)鄰居節(jié)點(diǎn)發(fā)送了Probe消息給節(jié)點(diǎn)Pn,節(jié)點(diǎn)Pn將接收消息處理數(shù)累加1,只對(duì)返回 Echo消息的鄰居節(jié)點(diǎn)進(jìn)行局部聚類結(jié)果的合并;9)節(jié)點(diǎn)Pn進(jìn)行消息處理數(shù)判斷,如果消息處理數(shù)不等于鄰居數(shù)則轉(zhuǎn)到步驟1)繼續(xù)等待從鄰居節(jié)點(diǎn)接收消息;否則執(zhí)行步驟10);10)判斷本節(jié)點(diǎn)Pn前后兩次聚類中心的距離是否超過置信半徑或者接收到Echo消息中所包含的邏輯變量不全為false,若判斷正確,該節(jié)點(diǎn)或者其鄰居節(jié)點(diǎn)進(jìn)一步聚類,進(jìn)行步驟11);如果判斷不成立,則執(zhí)行步驟12);11)節(jié)點(diǎn)Pn將邏輯變量置true,以指示初始聚類節(jié)點(diǎn)繼續(xù)下一個(gè)聚類迭代過程;12)節(jié)點(diǎn)Pn將邏輯變量置false,節(jié)點(diǎn)Pn及以該節(jié)點(diǎn)為父節(jié)點(diǎn)P的其他節(jié)點(diǎn)已完成聚類;13)節(jié)點(diǎn)Pn將接收到的Echo消息中所包含的聚類信息與本節(jié)點(diǎn)的聚類信息進(jìn)行局部聚類中心的合并與更新,并形成節(jié)點(diǎn)Pn的Echo消息;14)節(jié)點(diǎn)Pn發(fā)送Echo消息給父節(jié)點(diǎn)P。
全文摘要
本發(fā)明公開一種基于節(jié)點(diǎn)置信半徑的P2P網(wǎng)絡(luò)分布式聚類方法;采用一種基于Fisher判別來確定聚類置信半徑的分布式K-Means聚類算法,通過對(duì)每個(gè)P2P節(jié)點(diǎn)的數(shù)據(jù)進(jìn)行自主學(xué)習(xí),網(wǎng)絡(luò)中節(jié)點(diǎn)通過分別應(yīng)用Fisher線性判別率,確定同一類數(shù)據(jù)在節(jié)點(diǎn)上的稠密和稀疏分布,從而確定聚類的置信半徑并指導(dǎo)下一步的聚類,根據(jù)網(wǎng)絡(luò)上各個(gè)節(jié)點(diǎn)的數(shù)據(jù)分布動(dòng)態(tài)地計(jì)算出置信半徑,確定節(jié)點(diǎn)上的聚類置信半徑,指導(dǎo)下一次聚類及聚類的迭代過程,在保證聚類效果的同時(shí),減少分布式網(wǎng)絡(luò)上聚類的迭代次數(shù)以節(jié)省帶寬,提高網(wǎng)絡(luò)的應(yīng)用水平。
文檔編號(hào)H04L12/58GK102185919SQ20111011349
公開日2011年9月14日 申請(qǐng)日期2011年5月4日 優(yōu)先權(quán)日2011年5月4日
發(fā)明者沈項(xiàng)軍, 蔣中秋, 林琳, 朱倩, 張科澤 申請(qǐng)人:江蘇大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
沙雅县| 彰化市| 土默特右旗| 霍林郭勒市| 镇远县| 高青县| 韶山市| 常宁市| 全椒县| 上蔡县| 宁武县| 绵竹市| 运城市| 扬州市| 长寿区| 镶黄旗| 理塘县| 长治市| 麦盖提县| 溧水县| 乌拉特前旗| 锡林浩特市| 黄石市| 锡林郭勒盟| 水富县| 临澧县| 休宁县| 胶南市| 贵南县| 松原市| 会东县| 盐津县| 吴川市| 洮南市| 若羌县| 屏南县| 仪陇县| 蓝田县| 读书| 陵川县| 酉阳|