欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

數(shù)據(jù)聚類方法和數(shù)據(jù)聚類系統(tǒng)與流程

文檔序號:12363837閱讀:214來源:國知局
數(shù)據(jù)聚類方法和數(shù)據(jù)聚類系統(tǒng)與流程

本發(fā)明涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,具體而言,涉及一種數(shù)據(jù)聚類方法和一種數(shù)據(jù)聚類系統(tǒng)。



背景技術(shù):

目前,相關(guān)技術(shù)中的數(shù)據(jù)聚類都是對一定規(guī)模的當(dāng)前數(shù)據(jù)進(jìn)行聚類,得到當(dāng)前數(shù)據(jù)的多個類別,然后將這多個類別的聚類結(jié)果呈現(xiàn)給用戶。但是,呈現(xiàn)給用戶的聚類結(jié)果通常不是用戶感興趣的,具體有以下兩種情況:

(1)異常數(shù)據(jù),在當(dāng)前數(shù)據(jù)中可能存在這樣一類數(shù)據(jù):單純從分析和聚類的角度,這些數(shù)據(jù)與正常的數(shù)據(jù)無異,其聚類特征良好,因此,各種數(shù)據(jù)聚類的算法都無法將其判定為異常數(shù)據(jù),但用戶并不關(guān)心這類數(shù)據(jù),不希望呈現(xiàn)此類數(shù)據(jù)的聚類結(jié)果。

(2)特殊的聚類要求,聚類分析的結(jié)果最終是為客戶服務(wù)的,因此,當(dāng)前數(shù)據(jù)的聚類結(jié)果純粹從數(shù)據(jù)和數(shù)據(jù)分析的角度是毫無疑問合適的,其聚類特征也是非常明顯的,但在具體應(yīng)用中,由于業(yè)務(wù)的需要,對當(dāng)前數(shù)據(jù)有特殊的聚類需求,而在聚類分析的當(dāng)前數(shù)據(jù)中無法發(fā)現(xiàn)與特殊的聚類需求對應(yīng)的聚類結(jié)果,只有通過用戶反饋,才能得到用戶真正感興趣的聚類結(jié)果。

因此,如何對當(dāng)前數(shù)據(jù)進(jìn)行聚類得到的是用戶感興趣的聚類結(jié)果,從而提高數(shù)據(jù)聚類的準(zhǔn)確率和效率,成為亟待解決的問題。



技術(shù)實現(xiàn)要素:

本發(fā)明正是基于上述問題,提出了一種新的技術(shù)方案,通過用戶的反饋對反饋詞集合進(jìn)行更新,則根據(jù)更新后的反饋詞集合對數(shù)據(jù)進(jìn)行聚類,得到的聚類結(jié)果是用戶所感興趣的,從而提高了數(shù)據(jù)聚類的準(zhǔn)確率和效 率。

有鑒于此,本發(fā)明的一方面提出了一種數(shù)據(jù)聚類方法,包括:接收創(chuàng)建命令,創(chuàng)建反饋詞集合;根據(jù)所述反饋詞集合對當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成多個當(dāng)前類別,并將所述多個當(dāng)前類別呈現(xiàn)給用戶;接收所述用戶對所述多個當(dāng)前類別的第一反饋,以對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,根據(jù)用戶對聚類結(jié)果中的多個當(dāng)前類別的第一反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的反饋聚類得到的,進(jìn)而將用戶可能關(guān)心的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,根據(jù)所述反饋詞集合對所述當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成所述多個當(dāng)前類別,具體包括:對所述當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成多個聚類類別;獲取所述多個聚類類別中的每個聚類類別的第一中心詞以及所述第一中心詞的第一詞權(quán)重;根據(jù)所述反饋詞集合更新所述第一中心詞的所述第一詞權(quán)重,以在所述多個聚類類別中確定所述多個當(dāng)前類別。

在該技術(shù)方案中,由于反饋詞集合是根據(jù)用戶的需求來創(chuàng)建或更新的,因此,根據(jù)反饋詞集合對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,即是根據(jù)用戶的需求對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別,即是根據(jù)用戶的需求確定的多個當(dāng)前類別,從而使呈現(xiàn)給用戶的多個當(dāng)前類別是用戶感興趣或關(guān)心的類別,進(jìn)而提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,還包括:判斷所述第一中心詞是否與所述反饋詞集合中的反饋詞匹配;在判斷結(jié)果為是且與所述第一中心詞匹配的所述反饋詞的第二詞權(quán)重為負(fù)數(shù)時,將所述第一中心詞的所述第一詞權(quán)重取反,以得到所述第一中心詞的第三詞權(quán)重;在判斷結(jié)果為否時,設(shè)置所述第一中心詞的所述第一詞權(quán)重為第一預(yù)設(shè)值,以得到所述第一中心詞的第三詞權(quán)重,其中,所述第三詞權(quán)重與所述第一預(yù)設(shè)值相同;根據(jù)所述 第一中心詞的所述第三詞權(quán)重計算所述每個聚類類別的總詞權(quán)重,并根據(jù)所述每個聚類類別的所述總詞權(quán)重在所述多個聚類類別中確定所述多個當(dāng)前類別。

在該技術(shù)方案中,根據(jù)多個聚類類別中的每個聚類類別的第一中心詞是否在反饋詞集合中,對第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別,由于反饋詞集合是根據(jù)用戶的需求來創(chuàng)建或更新的,因此,是根據(jù)用戶的需求對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別時,是根據(jù)用戶的需求確定的多個當(dāng)前類別,進(jìn)而使呈現(xiàn)給用戶的多個當(dāng)前類別是用戶感興趣或關(guān)心的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,接收所述用戶對所述多個當(dāng)前類別的所述第一反饋,以對所述反饋詞集合進(jìn)行更新,具體包括:獲取所述多個當(dāng)前類別中的每個當(dāng)前類別的第二中心詞;根據(jù)所述第二中心詞和所述第一反饋,對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,根據(jù)多個當(dāng)前類別中的每個當(dāng)前類別的第二中心詞和用戶對多個當(dāng)前類別的第一反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的反饋聚類得到的,進(jìn)而將用戶可能感興趣的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和聚類效率。

在上述技術(shù)方案中,優(yōu)選地,還包括:接收所述用戶輸入的關(guān)鍵詞以及所述用戶對所述關(guān)鍵詞的第二反饋;根據(jù)所述關(guān)鍵詞和所述第二反饋,對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,還可以根據(jù)用戶輸入的關(guān)鍵詞以及用戶對該關(guān)鍵詞的第二反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的第二反饋聚類得到的,進(jìn)而將用戶可能感興趣的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,這樣,根據(jù)用戶輸入的關(guān)鍵詞和第二反饋聚類的結(jié)果更加具有針對性,從而使聚類的結(jié)果更加準(zhǔn)確。

在上述技術(shù)方案中,優(yōu)選地,對所述反饋詞集合進(jìn)行更新,具體包 括:判斷所述反饋詞集合中是否存在與所述第二中心詞或所述關(guān)鍵詞匹配的目標(biāo)反饋詞;在判斷結(jié)果為是時,對所述目標(biāo)反饋詞的所述第二詞權(quán)重進(jìn)行更新;否則,將所述第二中心詞或所述關(guān)鍵詞添加到所述反饋詞集合中,并設(shè)置所述第二中心詞或所述關(guān)鍵詞的權(quán)重初值。

在該技術(shù)方案中,在根據(jù)用戶對多個當(dāng)前類別的第一反饋或根據(jù)用戶輸入的關(guān)鍵詞與其第二反饋對反饋詞集合進(jìn)行更新時,根據(jù)反饋詞集合中是否存在與每個當(dāng)前類別的第二中心詞或關(guān)鍵詞匹配的目標(biāo)反饋詞,對反饋詞集合進(jìn)行更新,從而使更新后的反饋詞集合更符合用戶的需求,進(jìn)而使根據(jù)更新后的反饋詞再次進(jìn)行聚類時得到的是用戶感興趣的類別。

本發(fā)明的另一方面提出了一種數(shù)據(jù)聚類系統(tǒng),包括:創(chuàng)建單元,接收創(chuàng)建命令,創(chuàng)建反饋詞集合;聚類單元,根據(jù)所述反饋詞集合對當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成多個當(dāng)前類別,并將所述多個當(dāng)前類別呈現(xiàn)給用戶;第一接收單元,接收所述用戶對所述多個當(dāng)前類別的第一反饋,以對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,根據(jù)用戶對聚類結(jié)果中的多個當(dāng)前類別的第一反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的反饋聚類得到的,進(jìn)而將用戶可能關(guān)心的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,所述聚類單元具體包括:分類單元,用于對所述當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成多個聚類類別;第一獲取單元,用于獲取所述多個聚類類別中的每個聚類類別的第一中心詞以及所述第一中心詞的第一詞權(quán)重;確定單元,用于根據(jù)所述反饋詞集合更新所述第一中心詞的所述第一詞權(quán)重,以在所述多個聚類類別中確定所述多個當(dāng)前類別。

在該技術(shù)方案中,由于反饋詞集合是根據(jù)用戶的需求來創(chuàng)建或更新的,因此,根據(jù)反饋詞集合對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,即是根據(jù)用戶的需求對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別,即是根據(jù)用戶的需 求確定的多個當(dāng)前類別,從而使呈現(xiàn)給用戶的多個當(dāng)前類別是用戶感興趣或關(guān)心的類別,進(jìn)而提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,所述聚類單元還包括:第一判斷單元,用于判斷所述第一中心詞是否與所述反饋詞集合中的反饋詞匹配;處理單元,用于在判斷結(jié)果為是且與所述第一中心詞匹配的所述反饋詞的第二詞權(quán)重為負(fù)數(shù)時,將所述第一中心詞的所述第一詞權(quán)重取反,以得到所述第一中心詞的第三詞權(quán)重;設(shè)置單元,用于在判斷結(jié)果為否時,設(shè)置所述第一中心詞的所述第一詞權(quán)重為第一預(yù)設(shè)值,以得到所述第一中心詞的第三詞權(quán)重,其中,所述第三詞權(quán)重與所述第一預(yù)設(shè)值相同;以及所述確定單元具體用于:根據(jù)所述第一中心詞的所述第三詞權(quán)重計算所述每個聚類類別的總詞權(quán)重,并根據(jù)所述每個聚類類別的所述總詞權(quán)重在所述多個聚類類別中確定所述多個當(dāng)前類別。

在該技術(shù)方案中,根據(jù)多個聚類類別中的每個聚類類別的第一中心詞是否在反饋詞集合中,對第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別,由于反饋詞集合是根據(jù)用戶的需求來創(chuàng)建或更新的,因此,是根據(jù)用戶的需求對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別時,是根據(jù)用戶的需求確定的多個當(dāng)前類別,進(jìn)而使呈現(xiàn)給用戶的多個當(dāng)前類別是用戶感興趣或關(guān)心的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,所述第一接收單元具體包括:第二獲取單元,用于獲取所述多個當(dāng)前類別中的每個當(dāng)前類別的第二中心詞;第一更新單元,用于根據(jù)所述第二中心詞和所述第一反饋,對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,根據(jù)多個當(dāng)前類別中的每個當(dāng)前類別的第二中心詞和用戶對多個當(dāng)前類別的第一反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的反饋聚類得到的,進(jìn)而將用戶可能感興趣的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和聚類效率。

在上述技術(shù)方案中,優(yōu)選地,還包括:第二接收單元,用于接收所述 用戶輸入的關(guān)鍵詞以及所述用戶對所述關(guān)鍵詞的第二反饋;第二更新單元,用于根據(jù)所述關(guān)鍵詞和所述第二反饋,對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,還可以根據(jù)用戶輸入的關(guān)鍵詞以及用戶對該關(guān)鍵詞的第二反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的第二反饋聚類得到的,進(jìn)而將用戶可能感興趣的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,這樣,根據(jù)用戶輸入的關(guān)鍵詞和第二反饋聚類的結(jié)果更加具有針對性,從而使聚類的結(jié)果更加準(zhǔn)確。

在上述技術(shù)方案中,優(yōu)選地,還包括:第二判斷單元,用于判斷所述反饋詞集合中是否存在與所述第二中心詞或所述關(guān)鍵詞匹配的目標(biāo)反饋詞;第三更新單元,用于在判斷結(jié)果為是時,對所述目標(biāo)反饋詞的所述第二詞權(quán)重進(jìn)行更新;添加單元,用于在判斷結(jié)果為否時,將所述第二中心詞或所述關(guān)鍵詞添加到所述反饋詞集合中,并設(shè)置所述第二中心詞或所述關(guān)鍵詞的權(quán)重初值。

在該技術(shù)方案中,在根據(jù)用戶對多個當(dāng)前類別的第一反饋或根據(jù)用戶輸入的關(guān)鍵詞與其第二反饋對反饋詞集合進(jìn)行更新時,根據(jù)反饋詞集合中是否存在與每個當(dāng)前類別的第二中心詞或關(guān)鍵詞匹配的目標(biāo)反饋詞,對反饋詞集合進(jìn)行更新,從而使更新后的反饋詞集合更符合用戶的需求,進(jìn)而使根據(jù)更新后的反饋詞再次進(jìn)行聚類時得到的是用戶感興趣的類別。

通過本發(fā)明的技術(shù)方案,通過用戶的反饋對反饋詞集合進(jìn)行更新,從而使根據(jù)更新后的反饋詞集合對數(shù)據(jù)進(jìn)行聚類得到的類別是用戶所感興趣的,進(jìn)而提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

附圖說明

圖1示出了根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)聚類方法的流程示意圖;

圖2示出了根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)聚類系統(tǒng)的結(jié)構(gòu)示意圖;

圖3示出了根據(jù)本發(fā)明的另一個實施例的數(shù)據(jù)聚類方法的流程示意圖。

具體實施方式

為了可以更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點,下面結(jié)合附圖和具體實施方式對本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述。需要說明的是,在不沖突的情況下,本申請的實施例及實施例中的特征可以相互組合。

在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述的其他方式來實施,因此,本發(fā)明的保護(hù)范圍并不受下面公開的具體實施例的限制。

圖1示出了根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)聚類方法的流程示意圖。

如圖1所示,根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)聚類方法,包括:

步驟102,接收創(chuàng)建命令,創(chuàng)建反饋詞集合;

步驟104,根據(jù)所述反饋詞集合對當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成多個當(dāng)前類別,并將所述多個當(dāng)前類別呈現(xiàn)給用戶;

步驟106,接收所述用戶對所述多個當(dāng)前類別的第一反饋,以對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,根據(jù)用戶對聚類結(jié)果中的多個當(dāng)前類別的第一反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的反饋聚類得到的,進(jìn)而將用戶可能關(guān)心的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,根據(jù)所述反饋詞集合對所述當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成所述多個當(dāng)前類別,具體包括:對所述當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成多個聚類類別;獲取所述多個聚類類別中的每個聚類類別的第一中心詞以及所述第一中心詞的第一詞權(quán)重;根據(jù)所述反饋詞集合更新所述第一中心詞的所述第一詞權(quán)重,以在所述多個聚類類別中確定所述多個當(dāng)前類別。

在該技術(shù)方案中,由于反饋詞集合是根據(jù)用戶的需求來創(chuàng)建或更新的,因此,根據(jù)反饋詞集合對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,即是根據(jù)用戶的需求對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別,即是根據(jù)用戶的需 求確定的多個當(dāng)前類別,從而使呈現(xiàn)給用戶的多個當(dāng)前類別是用戶感興趣或關(guān)心的類別,進(jìn)而提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,還包括:判斷所述第一中心詞是否與所述反饋詞集合中的反饋詞匹配;在判斷結(jié)果為是且與所述第一中心詞匹配的所述反饋詞的第二詞權(quán)重為負(fù)數(shù)時,將所述第一中心詞的所述第一詞權(quán)重取反,以得到所述第一中心詞的第三詞權(quán)重;在判斷結(jié)果為否時,設(shè)置所述第一中心詞的所述第一詞權(quán)重為第一預(yù)設(shè)值,以得到所述第一中心詞的第三詞權(quán)重,其中,所述第三詞權(quán)重與所述第一預(yù)設(shè)值相同;根據(jù)所述第一中心詞的所述第三詞權(quán)重計算所述每個聚類類別的總詞權(quán)重,并根據(jù)所述每個聚類類別的所述總詞權(quán)重在所述多個聚類類別中確定所述多個當(dāng)前類別。

在該技術(shù)方案中,根據(jù)多個聚類類別中的每個聚類類別的第一中心詞是否在反饋詞集合中,對第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別,由于反饋詞集合是根據(jù)用戶的需求來創(chuàng)建或更新的,因此,是根據(jù)用戶的需求對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別時,是根據(jù)用戶的需求確定的多個當(dāng)前類別,進(jìn)而使呈現(xiàn)給用戶的多個當(dāng)前類別是用戶感興趣或關(guān)心的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率,具體地,當(dāng)?shù)谝恢行脑~與反饋詞集合中的反饋詞匹配時,如果與第一中心詞匹配的反饋詞的第二詞權(quán)重為負(fù)數(shù),則說明用戶對第一中心詞所在的聚類類別不感興趣,將將第一中心詞的第一詞權(quán)重取反,以得到第一中心詞的第三詞權(quán)重,如果與第一中心詞匹配的反饋詞的第二詞權(quán)重為正數(shù),則說明用戶對第一中心詞所在的聚類類別感興趣,將第一中心詞的第一詞權(quán)重保持不變,另一方面,當(dāng)?shù)谝恢行脑~與反饋詞集合中的反饋詞不匹配時,設(shè)置第一中心詞的所述第一詞權(quán)重為第一預(yù)設(shè)值,例如設(shè)置為零,從而得到第一中心詞的第三詞權(quán)重,在得到第一中心詞的第三詞權(quán)重之后,將每個聚類類別的所有中心詞的第三詞權(quán)重相加,得到每個聚類類別的總詞權(quán)重,當(dāng)任一聚類類別的總詞權(quán)重為正數(shù)時,則說明任一聚類類別是用戶感興趣的,可以將任一聚類類別確定為多個當(dāng)前類別中的一個,當(dāng)任一聚類 類別的總詞權(quán)重為負(fù)數(shù)時,則說明任一聚類類別是用戶不感興趣的,可以將任一聚類類別從多個聚類類別中刪除,從而在多個聚類類別中篩選出多個當(dāng)前類別。

在上述技術(shù)方案中,優(yōu)選地,接收所述用戶對所述多個當(dāng)前類別的所述第一反饋,以對所述反饋詞集合進(jìn)行更新,具體包括:獲取所述多個當(dāng)前類別中的每個當(dāng)前類別的第二中心詞;根據(jù)所述第二中心詞和所述第一反饋,對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,根據(jù)多個當(dāng)前類別中的每個當(dāng)前類別的第二中心詞和用戶對多個當(dāng)前類別的第一反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的反饋聚類得到的,進(jìn)而將用戶可能感興趣的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和聚類效率。

在上述技術(shù)方案中,優(yōu)選地,還包括:接收所述用戶輸入的關(guān)鍵詞以及所述用戶對所述關(guān)鍵詞的第二反饋;根據(jù)所述關(guān)鍵詞和所述第二反饋,對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,還可以根據(jù)用戶輸入的關(guān)鍵詞以及用戶對該關(guān)鍵詞的第二反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的第二反饋聚類得到的,進(jìn)而將用戶可能感興趣的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,這樣,根據(jù)用戶輸入的關(guān)鍵詞和第二反饋聚類的結(jié)果更加具有針對性,從而使聚類的結(jié)果更加準(zhǔn)確。

在上述技術(shù)方案中,優(yōu)選地,對所述反饋詞集合進(jìn)行更新,具體包括:判斷所述反饋詞集合中是否存在與所述第二中心詞或所述關(guān)鍵詞匹配的目標(biāo)反饋詞;在判斷結(jié)果為是時,對所述目標(biāo)反饋詞的所述第二詞權(quán)重進(jìn)行更新;否則,將所述第二中心詞或所述關(guān)鍵詞添加到所述反饋詞集合中,并設(shè)置所述第二中心詞或所述關(guān)鍵詞的權(quán)重初值。

在該技術(shù)方案中,在根據(jù)用戶對多個當(dāng)前類別的第一反饋或根據(jù)用戶輸入的關(guān)鍵詞與其第二反饋對反饋詞集合進(jìn)行更新時,根據(jù)反饋詞集合中是否存在與每個當(dāng)前類別的第二中心詞或關(guān)鍵詞匹配的目標(biāo)反饋詞,對反 饋詞集合進(jìn)行更新,從而使更新后的反饋詞集合更符合用戶的需求,進(jìn)而使根據(jù)更新后的反饋詞再次進(jìn)行聚類時得到的是用戶感興趣的類別,具體地,當(dāng)?shù)诙行脑~在反饋詞集合中時,如果用戶對第二中心詞所在的當(dāng)前類別的反饋為正反饋,則將反饋詞集合中的與第二中心詞匹配的反饋詞的第二詞權(quán)重減第二預(yù)設(shè)值,例如,將反饋詞集合中的與第二中心詞匹配的反饋詞的第二詞權(quán)重減1,如果用戶對第二中心詞所在的當(dāng)前類別的反饋為負(fù)反饋,則將反饋詞集合中的與第二中心詞匹配的反饋詞的第二詞權(quán)重加第二預(yù)設(shè)值,例如,將反饋詞集合中的與第二中心詞匹配的反饋詞的第二詞權(quán)重加1,另一方面,當(dāng)?shù)诙行脑~不在反饋詞集合中時,如果用戶對第二中心詞所在的當(dāng)前類別的反饋為正反饋,則將第二中心詞添加到反饋詞集合中,并設(shè)置與第二中心詞匹配的反饋詞的第二詞權(quán)重為第三預(yù)設(shè)值,例如,設(shè)置與第二中心詞匹配的反饋詞的第二詞權(quán)重為1,如果用戶對第二中心詞所在的當(dāng)前類別的反饋為負(fù)反饋,則將第二中心詞添加到反饋詞集合中,并設(shè)置與第二中心詞匹配的反饋詞的第二詞權(quán)重為第四預(yù)設(shè)值,優(yōu)選地,第三預(yù)設(shè)值與第四預(yù)設(shè)值互為相反數(shù),例如,設(shè)置與第二中心詞匹配的反饋詞的第二詞權(quán)重為-1。

圖2示出了根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)聚類系統(tǒng)200的結(jié)構(gòu)示意圖。

如圖2所示,根據(jù)本發(fā)明的一個實施例的數(shù)據(jù)聚類系統(tǒng)200,包括:創(chuàng)建單元202,接收創(chuàng)建命令,創(chuàng)建反饋詞集合;聚類單元204,根據(jù)所述反饋詞集合對當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成多個當(dāng)前類別,并將所述多個當(dāng)前類別呈現(xiàn)給用戶;第一接收單元206,接收所述用戶對所述多個當(dāng)前類別的第一反饋,以對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,根據(jù)用戶對聚類結(jié)果中的多個當(dāng)前類別的第一反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的反饋聚類得到的,進(jìn)而將用戶可能關(guān)心的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,所述聚類單元204具體包括:分類單元 2042,用于對所述當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將所述當(dāng)前數(shù)據(jù)聚類成多個聚類類別;第一獲取單元2044,用于獲取所述多個聚類類別中的每個聚類類別的第一中心詞以及所述第一中心詞的第一詞權(quán)重;確定單元2046,用于根據(jù)所述反饋詞集合更新所述第一中心詞的所述第一詞權(quán)重,以在所述多個聚類類別中確定所述多個當(dāng)前類別。

在該技術(shù)方案中,由于反饋詞集合是根據(jù)用戶的需求來創(chuàng)建或更新的,因此,根據(jù)反饋詞集合對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,即是根據(jù)用戶的需求對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別,即是根據(jù)用戶的需求確定的多個當(dāng)前類別,從而使呈現(xiàn)給用戶的多個當(dāng)前類別是用戶感興趣或關(guān)心的類別,進(jìn)而提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在上述技術(shù)方案中,優(yōu)選地,所述聚類單元204還包括:第一判斷單元2048,用于判斷所述第一中心詞是否與所述反饋詞集合中的反饋詞匹配;處理單元20410,用于在判斷結(jié)果為是且與所述第一中心詞匹配的所述反饋詞的第二詞權(quán)重為負(fù)數(shù)時,將所述第一中心詞的所述第一詞權(quán)重取反,以得到所述第一中心詞的第三詞權(quán)重;設(shè)置單元20412,用于在判斷結(jié)果為否時,設(shè)置所述第一中心詞的所述第一詞權(quán)重為第一預(yù)設(shè)值,以得到所述第一中心詞的第三詞權(quán)重,其中,所述第三詞權(quán)重與所述第一預(yù)設(shè)值相同;以及所述確定單元2046具體用于:根據(jù)所述第一中心詞的所述第三詞權(quán)重計算所述每個聚類類別的總詞權(quán)重,并根據(jù)所述每個聚類類別的所述總詞權(quán)重在所述多個聚類類別中確定所述多個當(dāng)前類別。

在該技術(shù)方案中,根據(jù)多個聚類類別中的每個聚類類別的第一中心詞是否在反饋詞集合中,對第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別,由于反饋詞集合是根據(jù)用戶的需求來創(chuàng)建或更新的,因此,是根據(jù)用戶的需求對多個聚類類別的第一中心詞的第一詞權(quán)重進(jìn)行更新,從而在多個聚類類別中確定多個當(dāng)前類別時,是根據(jù)用戶的需求確定的多個當(dāng)前類別,進(jìn)而使呈現(xiàn)給用戶的多個當(dāng)前類別是用戶感興趣或關(guān)心的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率,具體地,當(dāng)?shù)谝恢行脑~與反饋詞集合中的反饋詞匹配時,如果與第一中心詞匹 配的反饋詞的第二詞權(quán)重為負(fù)數(shù),則說明用戶對第一中心詞所在的聚類類別不感興趣,將將第一中心詞的第一詞權(quán)重取反,以得到第一中心詞的第三詞權(quán)重,如果與第一中心詞匹配的反饋詞的第二詞權(quán)重為正數(shù),則說明用戶對第一中心詞所在的聚類類別感興趣,將第一中心詞的第一詞權(quán)重保持不變,另一方面,當(dāng)?shù)谝恢行脑~與反饋詞集合中的反饋詞不匹配時,設(shè)置第一中心詞的所述第一詞權(quán)重為第一預(yù)設(shè)值,例如設(shè)置為零,從而得到第一中心詞的第三詞權(quán)重,在得到第一中心詞的第三詞權(quán)重之后,將每個聚類類別的所有中心詞的第三詞權(quán)重相加,得到每個聚類類別的總詞權(quán)重,當(dāng)任一聚類類別的總詞權(quán)重為正數(shù)時,則說明任一聚類類別是用戶感興趣的,可以將任一聚類類別確定為多個當(dāng)前類別中的一個,當(dāng)任一聚類類別的總詞權(quán)重為負(fù)數(shù)時,則說明任一聚類類別是用戶不感興趣的,可以將任一聚類類別從多個聚類類別中刪除,從而在多個聚類類別中篩選出多個當(dāng)前類別。

在上述技術(shù)方案中,優(yōu)選地,所述第一接收單元206具體包括:第二獲取單元2062,用于獲取所述多個當(dāng)前類別中的每個當(dāng)前類別的第二中心詞;第一更新單元2064,用于根據(jù)所述第二中心詞和所述第一反饋,對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,根據(jù)多個當(dāng)前類別中的每個當(dāng)前類別的第二中心詞和用戶對多個當(dāng)前類別的第一反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的反饋聚類得到的,進(jìn)而將用戶可能感興趣的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,進(jìn)一步地提高了數(shù)據(jù)聚類的準(zhǔn)確率和聚類效率。

在上述技術(shù)方案中,優(yōu)選地,還包括:第二接收單元208,用于接收所述用戶輸入的關(guān)鍵詞以及所述用戶對所述關(guān)鍵詞的第二反饋;第二更新單元210,用于根據(jù)所述關(guān)鍵詞和所述第二反饋,對所述反饋詞集合進(jìn)行更新。

在該技術(shù)方案中,還可以根據(jù)用戶輸入的關(guān)鍵詞以及用戶對該關(guān)鍵詞的第二反饋,對反饋詞集合進(jìn)行更新,由此,根據(jù)更新后的反饋詞集合再次進(jìn)行聚類,從而使此次的聚類結(jié)果是根據(jù)用戶的第二反饋聚類得到的, 進(jìn)而將用戶可能感興趣的類別呈現(xiàn)給用戶,同時淘汰用戶不感興趣的類別,這樣,根據(jù)用戶輸入的關(guān)鍵詞和第二反饋聚類的結(jié)果更加具有針對性,從而使聚類的結(jié)果更加準(zhǔn)確。

在上述技術(shù)方案中,優(yōu)選地,還包括:第二判斷單元212,用于判斷所述反饋詞集合中是否存在與所述第二中心詞或所述關(guān)鍵詞匹配的目標(biāo)反饋詞;第三更新單元214,用于在判斷結(jié)果為是時,對所述目標(biāo)反饋詞的所述第二詞權(quán)重進(jìn)行更新;添加單元216,用于在判斷結(jié)果為否時,將所述第二中心詞或所述關(guān)鍵詞添加到所述反饋詞集合中,并設(shè)置所述第二中心詞或所述關(guān)鍵詞的權(quán)重初值。

在該技術(shù)方案中,在根據(jù)用戶對多個當(dāng)前類別的第一反饋或根據(jù)用戶輸入的關(guān)鍵詞與其第二反饋對反饋詞集合進(jìn)行更新時,根據(jù)反饋詞集合中是否存在與每個當(dāng)前類別的第二中心詞或關(guān)鍵詞匹配的目標(biāo)反饋詞,對反饋詞集合進(jìn)行更新,從而使更新后的反饋詞集合更符合用戶的需求,進(jìn)而使根據(jù)更新后的反饋詞再次進(jìn)行聚類時得到的是用戶感興趣的類別,具體地,當(dāng)?shù)诙行脑~在反饋詞集合中時,如果用戶對第二中心詞所在的當(dāng)前類別的反饋為正反饋,則將反饋詞集合中的與第二中心詞匹配的反饋詞的第二詞權(quán)重減第二預(yù)設(shè)值,如果用戶對第二中心詞所在的當(dāng)前類別的反饋為負(fù)反饋,則將反饋詞集合中的與第二中心詞匹配的反饋詞的第二詞權(quán)重加第二預(yù)設(shè)值,另一方面,當(dāng)?shù)诙行脑~不在反饋詞集合中時,如果用戶對第二中心詞所在的當(dāng)前類別的反饋為正反饋,則將第二中心詞添加到反饋詞集合中,并設(shè)置與第二中心詞匹配的反饋詞的第二詞權(quán)重為第三預(yù)設(shè)值,如果用戶對第二中心詞所在的當(dāng)前類別的反饋為負(fù)反饋,則將第二中心詞添加到反饋詞集合中,并設(shè)置與第二中心詞匹配的反饋詞的第二詞權(quán)重為第四預(yù)設(shè)值,優(yōu)選地,第三預(yù)設(shè)值與第四預(yù)設(shè)值互為相反數(shù)。

圖3示出了根據(jù)本發(fā)明的另一個實施例的數(shù)據(jù)聚類方法的流程示意圖。

如圖3所示,根據(jù)本發(fā)明的另一個實施例的數(shù)據(jù)聚類方法,包括:

步驟302,創(chuàng)建反饋詞集合。

步驟304,根據(jù)反饋詞集合對當(dāng)前數(shù)據(jù)進(jìn)行聚類,以將當(dāng)前數(shù)據(jù)聚類成多個當(dāng)前類別。

步驟306,為用戶呈現(xiàn)聚類結(jié)果,即將多個當(dāng)前類別呈現(xiàn)給用戶。

步驟308,接收用戶對多個當(dāng)前類別的負(fù)正向反饋(第一反饋)。

步驟310,接收用戶輸入的關(guān)鍵詞以及用戶對關(guān)鍵詞的第二反饋。

步驟312,根據(jù)第一反饋或第二反饋,更新反饋詞集合,以根據(jù)更新后的反饋詞集合對數(shù)據(jù)再次進(jìn)行聚類,以得到用戶感興趣的數(shù)據(jù)。

以上結(jié)合附圖詳細(xì)說明了本發(fā)明的技術(shù)方案,通過用戶的反饋對反饋詞集合進(jìn)行更新,從而使根據(jù)更新后的反饋詞集合對數(shù)據(jù)進(jìn)行聚類得到的類別是用戶所感興趣的,進(jìn)而提高了數(shù)據(jù)聚類的準(zhǔn)確率和效率。

在本發(fā)明中,術(shù)語“第一”、“第二”、“第三”、“第四”僅用于描述的目的,而不能理解為指示或暗示相對重要性;術(shù)語“多個”表示兩個或兩個以上。對于本領(lǐng)域的普通技術(shù)人員而言,可以根據(jù)具體情況理解上述術(shù)語在本發(fā)明中的具體含義。

以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
双鸭山市| 定远县| 枣强县| 洛隆县| 西吉县| 海宁市| 辛集市| 开封市| 喀什市| 定南县| 武威市| 克什克腾旗| 潞西市| 政和县| 会同县| 华安县| 蛟河市| 瑞金市| 嘉黎县| 洪泽县| 上蔡县| 博白县| 钟山县| 湾仔区| 益阳市| 育儿| 周宁县| 措美县| 宁波市| 陵水| 灯塔市| 余江县| 秦皇岛市| 阆中市| 普兰县| 长沙市| 托里县| 分宜县| 湄潭县| 三江| 双鸭山市|