基于帶約束非負(fù)矩陣分解的科技資源元數(shù)據(jù)檢索方法與流程

文檔序號(hào)：12124751閱讀：來源：國知局

技術(shù)特征：

1.一種基于帶約束非負(fù)矩陣分解的科技資源元數(shù)據(jù)檢索方法，其特征在于，包括以下步驟，

S101：形成原始文檔矩陣，對(duì)文本數(shù)據(jù)進(jìn)行編號(hào)，并進(jìn)行分詞，為每個(gè)詞分配唯一序號(hào)，以便能獲取詞對(duì)應(yīng)的列，抽取文檔Tf-Idf特征，按照每一篇文檔進(jìn)行歸一化，形成原始文檔矩陣；

S102：按照維度生成兩個(gè)矩陣；

S103：文檔主題分類；

S104：獲得文檔在主題下的表示，采用梯度下降方法，迭代矩陣，直至矩陣收斂，即可獲得文檔在主題下的表示。

2.按照權(quán)利要求1所述的基于帶約束非負(fù)矩陣分解的科技資源元數(shù)據(jù)檢索方法，其特征在于：所述步驟S102中設(shè)定主題個(gè)數(shù)k，按照維度要求生成兩個(gè)矩陣，用隨機(jī)數(shù)初始化矩陣中的數(shù)值。

3.按照權(quán)利要求1所述的基于帶約束非負(fù)矩陣分解的科技資源元數(shù)據(jù)檢索方法，其特征在于：所述步驟S103中文檔主題分為共有主題和私有主題兩大類。

4.按照權(quán)利要求3所述的基于帶約束非負(fù)矩陣分解的科技資源元數(shù)據(jù)檢索方法，其特征在于：所述步驟S103中共有主題的約束條件為約束文檔的主題表示矩陣，前n列采用平滑約束；私有主題的約束條件為約束文檔的主題表示矩陣，后m列采用稀疏約束。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

精彩留言，會(huì)給你點(diǎn)贊！

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频