1.一種基于卷積神經(jīng)網(wǎng)絡(luò)的多視圖文本聚類方法,其特征在于,包括:
2.如權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的多視圖文本聚類方法,其特征在于,所述對原始多視圖文本數(shù)據(jù)進(jìn)行預(yù)處理包括:
3.如權(quán)利要求2所述的基于卷積神經(jīng)網(wǎng)絡(luò)的多視圖文本聚類方法,其特征在于,所述對預(yù)處理后的原始多視圖文本數(shù)據(jù)先計算tf-idf值再與word2vec詞向量結(jié)合,生成文本詞嵌入加權(quán)向量,包括:
4.如權(quán)利要求3所述的基于卷積神經(jīng)網(wǎng)絡(luò)的多視圖文本聚類方法,其特征在于,所述對預(yù)處理后的原始多視圖文本數(shù)據(jù)生成lda文本主題向量,包括:
5.如權(quán)利要求4所述的基于卷積神經(jīng)網(wǎng)絡(luò)的多視圖文本聚類方法,其特征在于,所述對文本詞嵌入加權(quán)向量和lda文本主題向量形成的向量組分別進(jìn)行譜聚類,獲得聚類結(jié)果,包括:
6.如權(quán)利要求5所述的基于卷積神經(jīng)網(wǎng)絡(luò)的多視圖文本聚類方法,其特征在于,所述將聚類結(jié)果中相同的分類數(shù)據(jù)作為有標(biāo)記數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,聚類結(jié)果中不同的分類數(shù)據(jù)作為未標(biāo)記樣本,利用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)對未標(biāo)記樣本進(jìn)行特征提取并將得到的特征向量進(jìn)行譜聚類,獲得最終聚類結(jié)果,包括:
7.如權(quán)利要求1所述的基于卷積神經(jīng)網(wǎng)絡(luò)的多視圖文本聚類方法,其特征在于,所述原始多視圖文本數(shù)據(jù)的獲取步驟包括:
8.如權(quán)利要求7所述的基于卷積神經(jīng)網(wǎng)絡(luò)的多視圖文本聚類方法,其特征在于,所述序列項簇條件包括多種結(jié)合: