欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

圖群集的制作方法

文檔序號:6357399閱讀:224來源:國知局
專利名稱:圖群集的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及圖,尤其涉及圖的群集。
背景技術(shù)
圖(G)通常是包括一組頂點(diǎn)(V)和用于表示頂點(diǎn)之間關(guān)系的一組邊(E)的結(jié)構(gòu)。 例如,參與圖可用于基于共同條件、性質(zhì)、參數(shù)、特征、活動(dòng)、連接等使實(shí)體彼此相關(guān)。這種圖可用于分析在多種場景中的對應(yīng)數(shù)據(jù)集。這種場景的一個(gè)實(shí)例是在對于與來自服務(wù)提供者的資源相關(guān)的廣告空間的在線廣告拍賣的背景中。在廣告拍賣的背景中,拍賣參與圖是包括頂點(diǎn)和邊的結(jié)構(gòu),頂點(diǎn)表示在拍賣中競爭的廣告客戶,當(dāng)由兩個(gè)頂點(diǎn)表示的廣告客戶通過一同參與拍賣而相關(guān)時(shí)邊連接這兩個(gè)頂點(diǎn)。拍賣參與圖包含具有多個(gè)應(yīng)用程序的大量信息,應(yīng)用程序包括廣告客戶欄柵(flighting)、對廣告客戶的關(guān)鍵字建議、微市場分析等等。
通常,這種類型圖的分析包括在圖中找出有意義的子集或集群。對于示例性拍賣參與圖,這可對應(yīng)于對圖進(jìn)行群集以識別廣告客戶圖中彼此具有相對較少交互的子市場。 具體而言,群集可包括識別集群以優(yōu)化某些目標(biāo)函數(shù)。然而,隨著圖變得更大(更多頂點(diǎn)) 且更密集(頂點(diǎn)之間的更多邊),由于群集所涉及的計(jì)算量,對圖進(jìn)行群集變得相當(dāng)困難。 因此,用于對圖進(jìn)行直接群集的傳統(tǒng)算法可能不能成功地對在某些場景中出現(xiàn)的較大較密集的圖執(zhí)行群集。

發(fā)明內(nèi)容
提供本概述是為了以簡化的形式介紹將在以下詳細(xì)描述中進(jìn)一步描述的一些概念。本概述并不旨在標(biāo)識出所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨在用于限定所要求保護(hù)的主題的范圍。
各種實(shí)施例提供了用于圖群集的技術(shù)。在一個(gè)或多個(gè)實(shí)施例中,獲得表示實(shí)體間關(guān)系的參與圖。基于參與圖來構(gòu)造輔助圖。構(gòu)造輔助圖使得輔助圖沒有參與圖密集,從而計(jì)算上較不復(fù)雜以便于分析。通過對為輔助圖定義的目標(biāo)函數(shù)求解來確定輔助圖中的集群。 為輔助圖確定的集群然后可用于確定參與圖中的集群,參與圖中的集群對為參與圖定義的相關(guān)目標(biāo)函數(shù)求解。


圖1示出其中可用圖群集的一個(gè)或多個(gè)實(shí)施例的示例操作環(huán)境。
圖2是描述根據(jù)一個(gè)或多個(gè)實(shí)施例的示例過程的流程圖。
圖3是描述根據(jù)一個(gè)或多個(gè)實(shí)施例的另一示例過程的流程圖。
圖4是描繪根據(jù)一個(gè)或多個(gè)實(shí)施例的示例參與圖和對應(yīng)二分圖的示圖。
圖5是描繪根據(jù)一個(gè)或多個(gè)實(shí)施例的示例輔助圖的構(gòu)造的示圖。
圖6是可用于實(shí)現(xiàn)各種實(shí)施例的系統(tǒng)的框圖。
具體實(shí)施例方式腿 各種實(shí)施例提供了用于圖群集的技術(shù)。在一個(gè)或多個(gè)實(shí)施例中,獲得表示實(shí)體間關(guān)系的參與圖。基于參與圖來構(gòu)造輔助圖。構(gòu)造輔助圖使得輔助圖沒有參與圖密集,從而計(jì)算上較不復(fù)雜以便于分析。通過對為輔助圖定義的目標(biāo)函數(shù)求解來確定輔助圖中的集群。 為輔助圖確定的集群然后可用于確定參與圖中的集群,參與圖中的集群對為參與圖定義的相關(guān)目標(biāo)函數(shù)求解。
在以下討論中,題為“操作環(huán)境”的章節(jié)僅描述其中可采用各實(shí)施例的一個(gè)環(huán)境。 接著,題為“圖群集過程”的章節(jié)描述了根據(jù)一個(gè)或多個(gè)實(shí)施例的用于圖群集的示例技術(shù)。 接著,題為“圖群集實(shí)施細(xì)節(jié)”的章節(jié)描述了根據(jù)一個(gè)或多個(gè)實(shí)施例的用于圖群集的示例算法和實(shí)施。最后,提供了題為“示例系統(tǒng)”的章節(jié)并且該章節(jié)描述可用于實(shí)現(xiàn)一個(gè)或多個(gè)實(shí)施例的示例系統(tǒng)。
操作環(huán)境 圖1在100處概括地示出根據(jù)一個(gè)或多個(gè)實(shí)施例的操作環(huán)境。環(huán)境100包括具有一個(gè)或多個(gè)處理器104、一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)106和存儲在計(jì)算機(jī)可讀介質(zhì)上并可由一個(gè)或多個(gè)處理器104執(zhí)行的一個(gè)或多個(gè)應(yīng)用程序108的服務(wù)提供者102。計(jì)算機(jī)可讀介質(zhì)106可包括,作為示例而非限制,通常與計(jì)算設(shè)備相關(guān)聯(lián)的所有形式的易失性和非易失性存儲器和/或存儲介質(zhì)。這種介質(zhì)可包括ROM、RAM、閃存、硬盤、光盤、可移動(dòng)介質(zhì)等。 計(jì)算機(jī)可讀介質(zhì)106也被描繪成存儲也可由處理器104執(zhí)行的操作系統(tǒng)110、服務(wù)管理器模塊112、資源114(如內(nèi)容、服務(wù)和數(shù)據(jù))、以及群集工具116。盡管分開示出,但是群集工具 116也可被實(shí)現(xiàn)為服務(wù)管理器模塊112的組件。
服務(wù)提供者102可被實(shí)施為任何合適的計(jì)算設(shè)備或諸如以下設(shè)備的組合,例如但不限于服務(wù)器、服務(wù)器場、設(shè)備的對等網(wǎng)絡(luò)、臺式計(jì)算機(jī)等。計(jì)算設(shè)備的一個(gè)具體示例在以下關(guān)于圖6示出并描述。服務(wù)提供者102可通信上通過網(wǎng)絡(luò)118耦合到各種其他實(shí)體(如設(shè)備、服務(wù)器、存儲位置、客戶機(jī)等)。具體來說,服務(wù)提供者102被示為通過網(wǎng)絡(luò)118連接到提供廣告122的廣告客戶120以及客戶機(jī)124。廣告客戶120和客戶機(jī)IM可通過網(wǎng)絡(luò) 118與服務(wù)提供者102交互來獲得對各種資源114的訪問。雖然網(wǎng)絡(luò)118被示為因特網(wǎng),但是該網(wǎng)絡(luò)可以采用各種各樣的配置。例如,網(wǎng)絡(luò)118可以包括廣域網(wǎng)(WAN)、局域網(wǎng)(LAN)、 無線網(wǎng)絡(luò)、公共電話網(wǎng)和內(nèi)聯(lián)網(wǎng)等等。此外,雖然示出了單個(gè)網(wǎng)絡(luò)118,但是網(wǎng)絡(luò)118可被配置為包括多個(gè)網(wǎng)絡(luò)。
服務(wù)管理器模塊112表示可由服務(wù)提供者102操作來管理各種資源114的功能, 可使各種資源114可通過網(wǎng)絡(luò)118被獲得。服務(wù)管理器模塊112可管理對資源114的訪問、 資源114的性能、用戶接口或數(shù)據(jù)的配置來提供資源114等等。例如,客戶機(jī)IM可形成資源請求1 來傳送到服務(wù)提供者102以獲得相應(yīng)的資源114。響應(yīng)于接收到這樣的請求,服務(wù)提供者102可經(jīng)通過網(wǎng)絡(luò)118傳送的供由一個(gè)或多個(gè)客戶機(jī)IM輸出的網(wǎng)頁1 和/或其他用戶界面來提供各種資源114。
資源114可包括內(nèi)容和/或服務(wù)的任何合適的組合,通常由一個(gè)或多個(gè)服務(wù)提供者使這些內(nèi)容和/或服務(wù)通過網(wǎng)絡(luò)可被獲得。內(nèi)容可包括文本、視頻、廣告、音頻、多媒體流、動(dòng)畫、圖像等的各種組合。服務(wù)的某些示例包括但不限于搜索服務(wù)、發(fā)送和接收電子郵件的電子郵件服務(wù)、在客戶機(jī)之間提供即時(shí)消息的即時(shí)消息通信服務(wù)、以及便于共享共同興趣和活動(dòng)的用戶組之間的連接和交互的社交網(wǎng)絡(luò)服務(wù)。服務(wù)還可包括配置成使得廣告客戶120投放廣告122以連同資源114 一起呈現(xiàn)給客戶機(jī)104的廣告服務(wù)。
例如,至少一些網(wǎng)頁1 可被配置成包括由廣告客戶120提供的廣告122。通過廣告服務(wù)使用選擇和投遞廣告的任何合適的技術(shù)可選擇廣告122來包含在網(wǎng)頁中。在一個(gè)示例中,可對網(wǎng)頁128中保留的用于來自廣告客戶120的廣告122的空間進(jìn)行拍賣。
群集工具116被配置成實(shí)現(xiàn)此處描述的圖群集技術(shù)的各方面。群集工具116可被配置成使用可通過服務(wù)提供者102收集、存儲和/或訪問的各種圖數(shù)據(jù)130。雖然圖1的示例圖數(shù)據(jù)130被示為存儲在服務(wù)提供者102的計(jì)算機(jī)可讀介質(zhì)106上,但是可以構(gòu)想圖數(shù)據(jù)130可以通過任何合適的設(shè)備被編譯并被存儲在任何合適的本地或網(wǎng)絡(luò)存儲位置上和/ 或從任何合適的本地或網(wǎng)絡(luò)存儲位置獲得。圖數(shù)據(jù)130可表示可用于構(gòu)造圖的各種數(shù)據(jù)集,接著圖可以是群集工具116執(zhí)行的分析對象。具體而言,拍賣群集工具116表示至少以下功能使用圖數(shù)據(jù)獲得合適的圖,將各種群集算法應(yīng)用于圖和/或以其它方式分析圖,以及基于對圖的分析來確認(rèn)集群。注意,群集可包括對某些目標(biāo)函數(shù)的優(yōu)化。因此,也可實(shí)施群集工具116以使目標(biāo)函數(shù)被定義。這里描述的群集算法然后可用于測試目標(biāo)函數(shù)。對可通過群集工具116實(shí)施的目標(biāo)函數(shù)和圖群集技術(shù)的進(jìn)一步討論可參考以下附圖得到。
已經(jīng)考慮了示例操作環(huán)境,現(xiàn)在考慮對根據(jù)一個(gè)或多個(gè)實(shí)施例的示例圖群集技術(shù)的討論。
圖群集過程 下面的討論描述了可利用上述和下述的環(huán)境、系統(tǒng)和/或設(shè)備來實(shí)現(xiàn)的圖群集技術(shù)。這些過程中每一過程的各方面可用硬件、固件、軟件、或其組合來實(shí)現(xiàn)。這些過程被示為指定由一個(gè)或多個(gè)設(shè)備執(zhí)行的操作的一組框,并且其不必限于所示由各框執(zhí)行操作的順序。在以下討論的各部分中,可對圖1的示例環(huán)境100做出參考。
圖2是描述根據(jù)一個(gè)或多個(gè)實(shí)施例的示例過程200的流程圖。在至少某些實(shí)施例中,過程200可由諸如圖1的服務(wù)提供者102的適當(dāng)配置的計(jì)算設(shè)備或具有圖群集工具116 的其它計(jì)算設(shè)備來執(zhí)行。
步驟202獲得表示實(shí)體之間的關(guān)系的參與圖。這能發(fā)生的一種方式是通過群集工具116使用圖數(shù)據(jù)130來構(gòu)造圖的操作。另外或作為替換,群集工具可被配置成從任何合適的源接收先前構(gòu)造的圖作為輸入。然后,群集工具116使用各種算法對獲得的圖執(zhí)行圖群集技術(shù)。
注意,這里所用的圖(G)是指包括一組頂點(diǎn)(V)和用于表示頂點(diǎn)之間關(guān)系的一組邊(E)的結(jié)構(gòu)。例如,參與圖可用于基于共同條件、性質(zhì)、參數(shù)、特征、活動(dòng)、連接等使實(shí)體彼此相關(guān)。在用于與來自服務(wù)提供者102的資源114相關(guān)的廣告空間的在線廣告拍賣的背景中,拍賣參與圖是包含頂點(diǎn)(A)和邊(E)的結(jié)構(gòu),頂點(diǎn)表示在拍賣中競爭的廣告客戶,當(dāng)兩個(gè)頂點(diǎn)表示的廣告客戶通過一同參與拍賣而相關(guān)時(shí)邊連接這兩個(gè)頂點(diǎn)。
步驟204基于參與圖構(gòu)造輔助圖。注意,參與圖(如拍賣參與圖)有時(shí)過于密集而不允許高效的分析。因此,為了進(jìn)行更高效的分析,可實(shí)施群集工具116以構(gòu)造對應(yīng)于參與圖的輔助圖,輔助圖易于操作且包括較少的計(jì)算以便分析。一般而言,輔助圖被構(gòu)造成包含較少的邊,因此它沒有對應(yīng)的參與圖密集。可構(gòu)造的輔助圖的一個(gè)實(shí)例是二分圖,將參考以下附圖作更詳細(xì)的描述。然而,簡而言之,二分圖引入表示參與圖中關(guān)系的頂點(diǎn)并將實(shí)體連接到關(guān)系頂點(diǎn),而不是彼此連接。這樣,可減少用于表示數(shù)據(jù)集的邊的數(shù)目。
在至少一些實(shí)施例中,將另外的改變應(yīng)用于二分圖,以進(jìn)一步優(yōu)化圖群集技術(shù)。以下在題為“圖群集實(shí)施實(shí)例”的章節(jié)中描述了示例改變。
步驟206通過對為輔助圖定義的目標(biāo)函數(shù)求解來確定集群。例如,給定在步驟204 中構(gòu)造的輔助圖,可在輔助圖中通過對目標(biāo)函數(shù)求解來確定集群??蓪?shí)施群集工具116來使用被構(gòu)造以優(yōu)化群集的各種合適的目標(biāo)函數(shù)。通常,可使用的合適的目標(biāo)函數(shù)(1)測量被移除以形成集群的邊的數(shù)目,( 懲罰較大的集群。集群大小懲罰防止算法返回整個(gè)數(shù)據(jù)集作為群集的結(jié)果。這種類型的合適的目標(biāo)函數(shù)產(chǎn)生的集群具有相對較多的集群內(nèi)的邊 (緊密關(guān)系),具有相對較少的向外通向其它集群的邊(與其它集群關(guān)系不密切),并具有合理的大小。具有這些特性的集群是理想的,因?yàn)檫@種集群表示經(jīng)常交互和/或共享許多共同特性的實(shí)體的組合。在廣告拍賣的背景中,集群可對應(yīng)于隔離的子市場,它們被認(rèn)為是各種市場分析的良好候選。關(guān)于合適目標(biāo)函數(shù)的進(jìn)一步細(xì)節(jié)可參考以下附圖找到。
步驟208使用為輔助圖確定的集群來確定對為參與圖定義的相關(guān)目標(biāo)函數(shù)求解的集群。群集工具116可被配置成基于通過對輔助圖進(jìn)行群集而獲得集群來重構(gòu)參與圖中的集群。這可包括從輔助圖中識別集群中包含的實(shí)體,并形成實(shí)體之間的邊,以重構(gòu)對應(yīng)于參與圖一部分的集群。
具體而言,可從為參與圖定義的相關(guān)目標(biāo)函數(shù)中導(dǎo)出用于對輔助圖進(jìn)行群集的目標(biāo)函數(shù)。因此,如以下將要詳細(xì)描述的,通過仔細(xì)設(shè)計(jì)用于群集的目標(biāo)函數(shù),從輔助圖中導(dǎo)出的集群可直接用于獲得對應(yīng)于參與圖的集群。在一些實(shí)施例中,如以上或以下討論的,改變輔助圖以優(yōu)化群集。這些改變確定用于參與圖和輔助圖的目標(biāo)函數(shù)之間的關(guān)系。
例如,當(dāng)二分圖用作圖群集技術(shù)的基礎(chǔ)時(shí),群集的結(jié)果是一組表示連接到關(guān)系頂點(diǎn)的實(shí)體的頂點(diǎn)。通過根據(jù)實(shí)體到關(guān)系頂點(diǎn)的共享連接將實(shí)體彼此互連,可獲得參與圖的對應(yīng)集群。這包括二分圖和對應(yīng)參與圖之間的簡單轉(zhuǎn)換。
圖3是描述根據(jù)一個(gè)或多個(gè)實(shí)施例的另一示例過程300的流程圖。在至少某些實(shí)施例中,過程300可由諸如具有群集工具116的圖1的服務(wù)提供者102之類的適當(dāng)配置的計(jì)算設(shè)備來執(zhí)行。具體而言,圖3描述了可用于構(gòu)造輔助圖的示例過程。過程300的各部分是關(guān)于在廣告客戶120之間對廣告空間的示例拍賣來描述的,廣告空間可用于連同資源 114 一起向客戶機(jī)IM呈現(xiàn)廣告122。在過程300的討論中,可參考圖4所示的示例參與圖和對應(yīng)的二分圖。
步驟302獲得無向二分圖,它使用表示實(shí)體的頂點(diǎn)和表示關(guān)系的頂點(diǎn)之間的無向邊將實(shí)體連接到實(shí)體的關(guān)系。這能發(fā)生的一種方式是通過群集工具116從對應(yīng)的參與圖或數(shù)據(jù)集生成二分圖的操作。另外或作為替換,群集工具116能夠產(chǎn)生或用其它方式直接從圖數(shù)據(jù)130獲得數(shù)據(jù)集的二分圖。
現(xiàn)在考慮圖4,它在400處概括地示出示例參與圖402和對應(yīng)的二分圖404。參與圖包括通過邊408彼此連接的多個(gè)頂點(diǎn)406。在拍賣參與圖的實(shí)例中,頂點(diǎn)406表示拍賣參與者(如廣告客戶102),當(dāng)拍賣參與者一同參與了拍賣時(shí)邊408連接對應(yīng)的頂點(diǎn)。
可構(gòu)造類似的圖來表示各種關(guān)系。注意,實(shí)體間存在的關(guān)系可包括共同條件、性質(zhì)、參數(shù)、特征、活動(dòng)、連接等。作為實(shí)例而非限制,類似于參與圖402的圖可用于將網(wǎng)頁與該網(wǎng)頁共享的鏈接相關(guān),將廣告客戶與關(guān)鍵詞或搜索項(xiàng)相關(guān),將拍賣參與者與位置相關(guān),將網(wǎng)頁與廣告收入相關(guān),或者用其它方式通過示出數(shù)據(jù)集的實(shí)體間存在的關(guān)系來表示數(shù)據(jù)集。
一般而言,二分圖404引入表示參與圖中關(guān)系的頂點(diǎn)410,并使用邊412將實(shí)體連接到關(guān)系頂點(diǎn)410。繼續(xù)拍賣參與圖的實(shí)例,頂點(diǎn)410可表示拍賣。因此,當(dāng)拍賣參與者參與拍賣時(shí),二分圖404中表示拍賣參與者的參與者頂點(diǎn)408通過邊412連接到表示拍賣的頂點(diǎn)410。如圖4所示,參與圖402和對應(yīng)二分圖404之間的來回轉(zhuǎn)換是直截了當(dāng)?shù)?。注意,二分圖404中的密度(邊的數(shù)目)小于參與圖402的密度。再一次,這可實(shí)現(xiàn)用于對二分圖404進(jìn)行群集的簡化計(jì)算。
上述的二分圖是這里所述的圖群集技術(shù)的開始點(diǎn)。具體而言,作進(jìn)一步改變以產(chǎn)生可使用上述或下述類型的目標(biāo)函數(shù)進(jìn)行有效群集的最佳的圖。在以下圖3的過程300的繼續(xù)討論中概括地描述這些改變的一些實(shí)例。關(guān)于示例改變的細(xì)節(jié)可在題為“圖群集實(shí)施實(shí)例”的章節(jié)中找到。
現(xiàn)回到圖3的討論,步驟304通過用有向邊替換無向圖中的無向邊創(chuàng)建有向圖。換句話說,二分圖頂點(diǎn)之間的邊各自用在頂點(diǎn)之間相對方向行進(jìn)的兩條邊替換。這類似于用兩條單向路替換一條雙向路。為了群集的目的,這使群集工具116能夠區(qū)別地處理從實(shí)體 (如廣告客戶)到關(guān)系(如拍賣)的連接和從關(guān)系(如拍賣)到實(shí)體(如廣告客戶)的連接。
步驟306為有向邊分配方向權(quán)重。具體而言,群集工具116可根據(jù)邊的方向?yàn)椴襟E306中形成的邊分配權(quán)重。當(dāng)應(yīng)用圖群集算法時(shí),權(quán)重具有懲罰某些邊和/或頂點(diǎn)從群集移除的效果。例如,權(quán)重可對應(yīng)于通過切割對應(yīng)邊來移除頂點(diǎn)以產(chǎn)生集群的成本。因此, 應(yīng)用于有向邊的方向權(quán)重可用于使在一個(gè)方向上的切割比在其它方向上的切割成本更高。 在至少一些實(shí)施例中,將相對較高的權(quán)重分配給從實(shí)體到關(guān)系的邊,并將相對較低的權(quán)重分配給從關(guān)系到實(shí)體的邊。其效果是不容易將實(shí)體從鄰近關(guān)系切割。例如,將權(quán)重?zé)o窮大分配給從廣告客戶到拍賣的邊,并將權(quán)重1分配給從拍賣到廣告客戶的邊。當(dāng)然,可以使用邊的權(quán)重的各種合適的值,并可以調(diào)節(jié)以微調(diào)圖群集。雖然這里的一些實(shí)例使用無窮大的邊權(quán)重,但實(shí)際上為簡明起見可使用有限值。
步驟308通過用邊將表示實(shí)體的頂點(diǎn)連接到任意匯點(diǎn)(sink vertex)來從有向圖構(gòu)造輔助二分圖。這樣,為包括在集群中的每個(gè)實(shí)體(如廣告客戶)創(chuàng)建成本。這是因?yàn)楫?dāng)群集進(jìn)行時(shí)連接到任意匯點(diǎn)的邊將斷開。也可使用可調(diào)權(quán)重對到匯點(diǎn)的邊進(jìn)行加權(quán)。分配給到匯點(diǎn)的邊的邊權(quán)重在以下討論中表示為α。
在步驟308之后,已經(jīng)構(gòu)造了可用作圖群集技術(shù)的輸入的輔助圖。對于密集的圖的一般群集問題被有效地簡化為在相對稀疏的輔助圖中找出集群的問題。具體而言,通過根據(jù)所述方式構(gòu)造輔助二分圖,群集問題被簡化為創(chuàng)建最小化將被切割(即移除)以形成集群的邊的數(shù)目的集群。在至少一些實(shí)施例中,這可通過群集工具116將最小割算法應(yīng)用于用上述方式產(chǎn)生的輔助二分圖來進(jìn)行。
具體而言,步驟310選擇實(shí)體中的一個(gè)作為目標(biāo),然后步驟312對該目標(biāo)使用最小割以獲得割的目標(biāo)側(cè)的頂點(diǎn)。在拍賣參與圖的實(shí)例中,獲得的結(jié)果是具有通過邊連接到其所參與的拍賣的一組廣告客戶的集群。這是二分圖的一個(gè)子集?,F(xiàn)在,通過將產(chǎn)生的集群從二分圖形式直接轉(zhuǎn)換成參與圖形式,可得到拍賣參與圖的對應(yīng)集群。以下章節(jié)將解決關(guān)于最小割算法的細(xì)節(jié)。
已經(jīng)描述了涉及圖群集的示例性過程,現(xiàn)在考慮可用此處描述的一個(gè)或多個(gè)實(shí)施例來實(shí)施的具體實(shí)施實(shí)例。
圖群集實(shí)施實(shí)例 現(xiàn)在考慮對可使用上述設(shè)備和系統(tǒng)來利用的群集算法和實(shí)施的討論。具體而言, 考慮在拍賣參與圖中找到集群的問題。更精確地,令A(yù)為一組廣告客戶。定義圖G= (A, E),其中一組邊是 E= {(a, b) :a 和 b 參與拍賣} 雖然以下技術(shù)是參考用拍賣參與圖來使廣告客戶和拍賣相關(guān)的實(shí)例描述的,但是顯而易見的是該技術(shù)可容易地應(yīng)用于包含一組頂點(diǎn)(V)和表示頂點(diǎn)之間關(guān)系的一組邊(E) 的其它圖(G)。換句話說,這里所述的圖群集技術(shù)一般可用于具有G= (V,E)形式的圖。
非正式地,群集G的問題是找到頂點(diǎn)的子集C Cd,使得橫跨集群的邊的權(quán)重低
(這種集群稱為具有低傳導(dǎo)),而集群中的邊的權(quán)重高(這種集群稱為具有高密度)。
不幸的是,圖G_(A,E)可能變得過于密集而不能進(jìn)行高效地群集。為了這點(diǎn),考慮廣告客戶 ,...,知參與的拍賣。這種拍賣將條邊引入圖中。對于一天的廣告詳細(xì)目錄和對應(yīng)拍賣的僅的采樣,示例廣告?zhèn)鬟f系統(tǒng)的通信量可包含100億個(gè)邊。另外,現(xiàn)有群集算法對于圖G= (V,E)具有O(IVI2IEI)時(shí)間步量級的運(yùn)行時(shí)間。因此,減少邊可顯著地改善圖群集的性能。
為此,以上定義的參與圖可用對應(yīng)的二分圖= (A U Q,Eb)替換,其中Q是一組拍賣,因此如果a參與拍賣q,則(a,q) e &。圖(U皮構(gòu)造包含拍賣和廣告客戶之間的一條邊,因此在假設(shè)一小組廣告客戶參與一個(gè)特定拍賣的情況下,圖(^b是稀疏的。因此,圖(^b的分析比參與圖的分析更快且計(jì)算負(fù)擔(dān)更少。
如以下將要詳細(xì)描述的,可以示出在二分圖中找出低傳導(dǎo)的小集群與在原始圖 G中找出小的低傳導(dǎo)集群相關(guān)。嚴(yán)格地說,為二分圖(^b導(dǎo)出的集群中的廣告客戶可直接用于構(gòu)造參與圖G的對應(yīng)的集群為此,定義二分圖的目標(biāo)函數(shù),當(dāng)它被求解時(shí),也對原始圖 G的相關(guān)目標(biāo)函數(shù)求解。
為了示例,關(guān)于群集算法來描述圖群集技術(shù),群集算法找出使具有 f(H) = &(凡幻+ 5〔/0形式的目標(biāo)函數(shù)最小化的集群!1,其中801)是懲罰大集群H的函數(shù),并且&(艮初=Σ證貼謂WG(li,1;),其中i(u,υ)是u禾Π υ之間的邊的總權(quán)重。這里, H是集合H的補(bǔ)集。
對于每個(gè)集群i/ C G,集群//’ £ &可通過設(shè)置i/' CHU 來關(guān)聯(lián)關(guān),其中
Γ (H)是與H相鄰的拍賣。具體而言,可得到映射Φ,它取G中的集群,并將該集群與具有相同廣告客戶集的&中的集群相關(guān)聯(lián),即Φ (H) ΠΑ = H。
現(xiàn)在,假設(shè)g(H)相對于映射Φ具有以下兼容性性質(zhì) g(H) = δ(Φ (H)). 說明這的另一方式是g只是H中的廣告客戶的函數(shù),或者函數(shù)g表示為g = g' (H η A).。這樣的函數(shù)的示例在以下討論中提供。
考慮以下關(guān)于使用圖對圖G的目標(biāo)函數(shù)求解的命題。對于命題A,如果頂點(diǎn)a和
b參與具有η個(gè)其它頂點(diǎn)的拍賣,令G具有邊權(quán)重w(a,b) 二;^令&具有邊權(quán)重’
權(quán)利要求
1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括 獲得表示實(shí)體之間的關(guān)系的參與圖(202);至少通過以下步驟基于所述參與圖構(gòu)造輔助圖(204) 形成對應(yīng)于所述參與圖的二分圖; 用有向邊替換所述二分圖中的無向邊; 向所述有向邊分配方向權(quán)重;以及將表示所述實(shí)體的頂點(diǎn)連接到任意匯點(diǎn); 通過對為所述輔助圖定義的目標(biāo)函數(shù)求解來確定集群O06);以及使用為所述輔助圖確定的所述集群來確定對為所述參與圖定義的相關(guān)目標(biāo)函數(shù)求解的集群(208)。
2.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,通過對目標(biāo)函數(shù)求解來確定集群包括將最小割算法應(yīng)用于所構(gòu)造的輔助圖。
3.如權(quán)利要求2所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,應(yīng)用最小割算法的步驟包括選擇所述輔助圖的實(shí)體中的一個(gè)作為目標(biāo),并對所述目標(biāo)使用最小割算法以獲得具有位于所述割中包括目標(biāo)的一側(cè)的一組頂點(diǎn)的集群。
4.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,所述實(shí)體包括在線拍賣的參與者,當(dāng)參與者在同一拍賣中競爭時(shí)所述關(guān)系使參與者相關(guān)。
5.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,還包括通過轉(zhuǎn)換為參與圖定義的相關(guān)目標(biāo)函數(shù),導(dǎo)出為輔助圖定義的目標(biāo)函數(shù)。
6.如權(quán)利要求2所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,所述輔助圖被配置成沒有所述參與圖密集。
7.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于所述參與圖被配置成用對應(yīng)于所述實(shí)體之間關(guān)系的邊來連接表示所述實(shí)體的頂點(diǎn);以及構(gòu)造輔助圖包括將所述參與圖轉(zhuǎn)換成對應(yīng)于所述參與圖的二分圖,所述二分圖被配置成具有表示所述實(shí)體的所述頂點(diǎn)和被引入以表示所述實(shí)體之間的關(guān)系的額外頂點(diǎn)之間的邊。
8.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,為所述輔助圖定義的所述目標(biāo)函數(shù)具有/00 二 % (仗幻+5(H)的形式。
9.如權(quán)利要求8所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,為所述參與圖定義的所述目標(biāo)函數(shù)具有/(H η/I) = eG (H Π Α,Η ^Ο + giH Π /1)的形式,!(;屮Ii η A表示與集群H具有相同的一組實(shí)體A的集合的所述參與圖的集群,其被確定以對為所述輔助圖定義的所述目標(biāo)函數(shù)求解。
10.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,構(gòu)造所述輔助圖包括引入所述有向邊,并有向地加權(quán)所述有向邊,使得從實(shí)體到關(guān)系的邊與從關(guān)系到實(shí)體的邊相比具有相對較高的權(quán)重。
11.如權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其特征在于,所述目標(biāo)函數(shù)被配置成測量被移除以形成集群的邊的數(shù)目并懲罰大集群。
12.—個(gè)或多個(gè)存儲指令的計(jì)算機(jī)可讀存儲介質(zhì)(106),當(dāng)由一個(gè)或多個(gè)服務(wù)器設(shè)備執(zhí)行時(shí),使得所述一個(gè)或多個(gè)服務(wù)器設(shè)備實(shí)現(xiàn)群集工具(116),所述群集工具被配置成獲得無向二分圖,它使用表示實(shí)體的頂點(diǎn)和表示關(guān)系的頂點(diǎn)之間的無向邊將實(shí)體連接到該實(shí)體的關(guān)系(302);通過用有向邊替換所述無向圖中的所述無向邊來創(chuàng)建有向圖(304); 為所述有向邊分配方向權(quán)重(306);通過將表示實(shí)體的所述頂點(diǎn)連接到任意匯點(diǎn)來從所述有向圖構(gòu)造輔助二分圖(308); 選擇所述實(shí)體中的一個(gè)作為目標(biāo)(310);對所述目標(biāo)使用最小割算法,以獲得具有位于所述割包括目標(biāo)的一側(cè)的一組頂點(diǎn)的集群。
13.如權(quán)利要求12所述的一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述群集工具還被配置成使/(H) =+ 5(捫形式的目標(biāo)函數(shù)最小化,其中g(shù)(H)是懲罰大集群H的函數(shù),測量被移除以形成群集H的邊的總權(quán)重。
14.如權(quán)利要求12所述的一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,分配方向權(quán)重包括將相對較高的權(quán)重分配給從實(shí)體到關(guān)系的邊,并將相對較低的權(quán)重分配給從關(guān)系到實(shí)體的邊。
15.如權(quán)利要求12所述的一個(gè)或多個(gè)計(jì)算機(jī)可讀存儲介質(zhì),其特征在于,所述群集工具還被配置成使用在所述割的目標(biāo)側(cè)獲得的一組頂點(diǎn)來確定所述輔助圖的集群,其中所獲得的集群對為輔助二分圖定義的目標(biāo)函數(shù)和為參與圖定義的相關(guān)目標(biāo)函數(shù)兩者求解,所述參與圖被配置成用對應(yīng)于所述實(shí)體之間關(guān)系的邊來連接表示所述實(shí)體的頂點(diǎn)。
全文摘要
各種實(shí)施例提供了用于圖群集的技術(shù)。在一個(gè)或多個(gè)實(shí)施例中,獲得表示實(shí)體間關(guān)系的參與圖?;趨⑴c圖來構(gòu)造輔助圖。構(gòu)造輔助圖使得輔助圖沒有參與圖密集,從而在計(jì)算上較不復(fù)雜以便于分析。通過對為輔助圖定義的目標(biāo)函數(shù)求解來確定輔助圖中的集群。為輔助圖確定的集群然后可用于確定參與圖中的集群,參與圖中的集群對為參與圖定義的相關(guān)目標(biāo)函數(shù)求解。
文檔編號G06Q30/00GK102201097SQ20111008152
公開日2011年9月28日 申請日期2011年3月25日 優(yōu)先權(quán)日2010年3月26日
發(fā)明者D·X·查爾斯, D·M·奇克林, P·Y·西馬德, R·M·安德森 申請人:微軟公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
常州市| 张掖市| 鄂尔多斯市| 南漳县| 香河县| 弥渡县| 胶州市| 盐源县| 乐安县| 池州市| 黄骅市| 吴江市| 乌拉特后旗| 准格尔旗| 犍为县| 汝南县| 高密市| 逊克县| 西城区| 来凤县| 中阳县| 德惠市| 平阳县| 化州市| 长葛市| 改则县| 农安县| 池州市| 和龙市| 五大连池市| 赤壁市| 清丰县| 娄烦县| 中阳县| 长宁区| 大竹县| 甘南县| 喀喇| 漳浦县| 将乐县| 新田县|