1.一種基于數(shù)據(jù)分析的文獻(xiàn)管理系統(tǒng),其特征在于,系統(tǒng)包括文獻(xiàn)信息獲取模塊、文獻(xiàn)標(biāo)題自動(dòng)分寫(xiě)模塊、文獻(xiàn)標(biāo)題詞性標(biāo)注模塊、文獻(xiàn)命名實(shí)體識(shí)別模塊和文獻(xiàn)分類模塊;
2.根據(jù)權(quán)利要求1所述的一種基于數(shù)據(jù)分析的文獻(xiàn)管理系統(tǒng),其特征在于,將x輸入到字符查詢表,通過(guò)查詢將每個(gè)xi轉(zhuǎn)化為固定長(zhǎng)度的低維實(shí)數(shù)向量具體包括以下過(guò)程:
3.根據(jù)權(quán)利要求1所述的一種基于數(shù)據(jù)分析的文獻(xiàn)管理系統(tǒng),其特征在于,將lx(x)輸入到雙向lstm網(wǎng)絡(luò)中,輸出分寫(xiě)標(biāo)注序列具體包括以下過(guò)程:
4.根據(jù)權(quán)利要求1所述的一種基于數(shù)據(jù)分析的文獻(xiàn)管理系統(tǒng),其特征在于,將輸入向量輸入到雙向lstm網(wǎng)絡(luò)中,輸出最優(yōu)的詞性標(biāo)注序列包括以下過(guò)程:
5.根據(jù)權(quán)利要求1所述的一種基于數(shù)據(jù)分析的文獻(xiàn)管理系統(tǒng),其特征在于,對(duì)文獻(xiàn)標(biāo)題進(jìn)行命名實(shí)體標(biāo)注具體包括以下過(guò)程:
6.根據(jù)權(quán)利要求5所述的一種基于數(shù)據(jù)分析的文獻(xiàn)管理系統(tǒng),其特征在于,將γi輸入到全連接網(wǎng)絡(luò),并通過(guò)一個(gè)softmax函數(shù)輸出該形態(tài)素的命名實(shí)體標(biāo)簽具體包括以下過(guò)程:
7.根據(jù)權(quán)利要求1所述的一種基于數(shù)據(jù)分析的文獻(xiàn)管理系統(tǒng),其特征在于,基于含有分寫(xiě)標(biāo)注序列和詞性標(biāo)注序列且經(jīng)過(guò)命名實(shí)體標(biāo)注的文獻(xiàn)標(biāo)題進(jìn)行文獻(xiàn)歸類具體包括以下過(guò)程:
8.根據(jù)權(quán)利要求1所述的一種基于數(shù)據(jù)分析的文獻(xiàn)管理系統(tǒng),其特征在于,將解析和提取出的關(guān)鍵信息與分類體系進(jìn)行匹配,確定文獻(xiàn)標(biāo)題所屬的類別具體包括以下步驟: