本發(fā)明涉及計算機(jī),尤其涉及一種模型訓(xùn)練、用戶長短期特性差異預(yù)測方法、裝置以及存儲介質(zhì)。
背景技術(shù):
1、隨著數(shù)字經(jīng)濟(jì)的發(fā)展和人工智能技術(shù)的應(yīng)用,大數(shù)據(jù)分析在各行各業(yè)中發(fā)揮著越來越重要的作用。信貸等業(yè)務(wù)存在較高的風(fēng)險性和不確定性,采用機(jī)器學(xué)習(xí)等技術(shù)建立信貸模型等模型,可以從海量數(shù)據(jù)中挖掘有價值的數(shù)據(jù)并分析、學(xué)習(xí)用戶的行為模式,進(jìn)而達(dá)到合理規(guī)避業(yè)務(wù)風(fēng)險、減少公司損失、擴(kuò)大收益的目的。在信貸業(yè)務(wù)等業(yè)務(wù)場景中存在用戶短期違約(逾期)風(fēng)險較好且用戶長期違約風(fēng)險較差等問題。目前,通?;诙唐谶`約風(fēng)險標(biāo)簽和長期違約風(fēng)險標(biāo)簽分別構(gòu)建模型,將兩個模型結(jié)合使用用以識別短期違約風(fēng)險好而長期違約風(fēng)險差的用戶;但是,兩個模型之間并沒有直接對比關(guān)系,基于兩個模型輸出的預(yù)測分不能直接、準(zhǔn)確確定短期違約風(fēng)險和長期違約風(fēng)險的差異。
技術(shù)實現(xiàn)思路
1、有鑒于此,本發(fā)明要解決的一個技術(shù)問題是提供一種模型訓(xùn)練、用戶長短期特性差異預(yù)測方法、裝置以及存儲介質(zhì)。
2、根據(jù)本公開的第一方面,提供一種模型訓(xùn)練方法,包括:確定與用戶長期特性相對應(yīng)的長期屬性、與用戶短期特性相對應(yīng)的短期屬性;基于所述長期屬性與所述短期屬性之間的屬性一致性關(guān)系,確定用戶的長短期特性融合屬性以及長短期特性融合標(biāo)簽;根據(jù)所述長期屬性、所述短期屬性和所述長短期特性融合屬性對用戶特征進(jìn)行篩選處理,獲得目標(biāo)特征;基于與所述目標(biāo)特性相對應(yīng)的用戶特征數(shù)據(jù)以及用戶的長短期特性融合標(biāo)簽生成訓(xùn)練樣本集;使用所述訓(xùn)練樣本集對長短期特性差異預(yù)測模型進(jìn)行訓(xùn)練;對訓(xùn)練后的所述長短期特性差異預(yù)測模型進(jìn)行評估處理,用以基于評估處理結(jié)果對所述長短期特性差異預(yù)測模型進(jìn)行調(diào)整處理。
3、可選地,所述對訓(xùn)練后的所述長短期特性差異預(yù)測模型進(jìn)行評估處理包括:使用訓(xùn)練后的所述長短期特性差異預(yù)測模型對評估樣本集進(jìn)行處理,獲得與所述評估樣本集中的樣本相對應(yīng)的差異預(yù)測值;基于所述差異預(yù)測值對訓(xùn)練后的所述長短期特性差異預(yù)測模型進(jìn)行可視化評估處理。
4、可選地,所述基于所述差異預(yù)測值對訓(xùn)練后的所述長短期特性差異預(yù)測模型進(jìn)行可視化評估處理包括:基于所述差異預(yù)測值對所述評估樣本集中的樣本進(jìn)行排序處理;對進(jìn)行排序處理后的所述評估樣本集中的樣本進(jìn)行分組處理,生成多個樣本分組;確定與各個樣本分組相對應(yīng)的真實長短期特性差異信息;根據(jù)所述真實長短期特性差異信息生成與多個樣本分組相對應(yīng)的評估圖表,用以對訓(xùn)練后的所述長短期特性差異預(yù)測模型進(jìn)行可視化評估處理。
5、可選地,所述確定與各個樣本分組相對應(yīng)的真實長短期特性差異信息包括:在所述樣本分組中,確定所述用戶長期特性為目標(biāo)屬性的第一樣本數(shù)量、所述用戶短期特性為所述目標(biāo)屬性的第二樣本數(shù)量;基于所述第一樣本數(shù)量和所述第二樣本數(shù)量確定所述真實長短期特性差異信息。
6、可選地,所述評估樣本集中的樣本為與所述訓(xùn)練樣本集中的樣本相對應(yīng)的跨時間樣本。
7、可選地,所述根據(jù)所述長期屬性、所述短期屬性和所述長短期特性融合屬性對用戶特征進(jìn)行篩選處理,獲得目標(biāo)特征包括:根據(jù)所述長期屬性對進(jìn)行初篩后的用戶特征進(jìn)行篩選處理,獲得第一用戶特征集合;根據(jù)所述短期屬性對進(jìn)行初篩后的用戶特征進(jìn)行篩選處理,獲得第二用戶特征集合;基于所述第一用戶特征集合和所述第二用戶特征集合進(jìn)行交集或并集計算,獲取用戶特征融合集合;根據(jù)所述長短期特性融合屬性對所述用戶特征融合集合內(nèi)的用戶特征進(jìn)行篩選處理,獲得所述目標(biāo)特征。
8、可選地,所述確定與用戶長期特性相對應(yīng)的長期屬性、與用戶短期特性相對應(yīng)的短期屬性包括:設(shè)置觀察點(diǎn)、第一表現(xiàn)期和第二表現(xiàn)期;其中,所述觀察點(diǎn)之后的未來第一時間段為所述第一表現(xiàn)期,所述觀察點(diǎn)之后的未來第二時間段為所述第二表現(xiàn)期,所述第二時間段大于所述第一時間段;基于在第一表現(xiàn)期內(nèi)的、與用戶短期特性相對應(yīng)的業(yè)務(wù)數(shù)據(jù)以及業(yè)務(wù)數(shù)據(jù)閾值,確定所述短期屬性;基于在第二表現(xiàn)期內(nèi)的、與用戶長期特性相對應(yīng)的業(yè)務(wù)數(shù)據(jù)以及所述業(yè)務(wù)數(shù)據(jù)閾值,確定所述長期屬性。
9、可選地,確定用戶的長短期特性融合屬性包括:在所述長期屬性與所述短期屬性一致的情況下,確定所述長短期特性融合屬性為第一屬性;并且,在所述長期屬性與所述短期屬性不一致的情況下,確定所述長短期特性融合屬性為第二屬性。
10、可選地,所述用戶長期特性包括:用戶長期違約風(fēng)險;所述用戶短期特性包括:用戶短期違約風(fēng)險;所述長短期特性差異預(yù)測模型包括:邏輯回歸模型、決策樹模型。
11、根據(jù)本公開的第二方面,提供一種用戶長短期特性差異預(yù)測方法,包括:獲取訓(xùn)練好的長短期特性差異預(yù)測模型;其中,所述長短期特性差異預(yù)測模型是通過如上所述的模型訓(xùn)練方法訓(xùn)練得到;使用所述長短期特性差異預(yù)測模型對與目標(biāo)特性相對應(yīng)的用戶特征數(shù)據(jù)進(jìn)行處理,用以獲得用戶的長期特性與短期特性差異的信息。
12、根據(jù)本公開的第三方面,提供一種模型訓(xùn)練裝置,包括:屬性確定模塊,用于確定與用戶長期特性相對應(yīng)的長期屬性、與用戶短期特性相對應(yīng)的短期屬性;屬性融合模塊,用于基于所述長期屬性與所述短期屬性之間的屬性一致性關(guān)系,確定用戶的長短期特性融合屬性以及長短期特性融合標(biāo)簽;特征篩選模塊,用于根據(jù)所述長期屬性、所述短期屬性和所述長短期特性融合屬性對用戶特征進(jìn)行篩選處理,獲得目標(biāo)特征;樣本生成模塊,用于基于與所述目標(biāo)特性相對應(yīng)的用戶特征數(shù)據(jù)以及與用戶的長短期特性融合標(biāo)簽生成訓(xùn)練樣本集;訓(xùn)練處理模塊,用于使用所述訓(xùn)練樣本集對長短期特性差異預(yù)測模型進(jìn)行訓(xùn)練;評估處理模塊,用于對訓(xùn)練后的所述長短期特性差異預(yù)測模型進(jìn)行評估處理,用以基于評估處理結(jié)果對所述長短期特性差異預(yù)測模型進(jìn)行調(diào)整處理。
13、根據(jù)本公開的第四方面,提供一種用戶長短期特性差異預(yù)測裝置,包括:模型獲取模塊,用于獲取訓(xùn)練好的長短期特性差異預(yù)測模型;其中,所述長短期特性差異預(yù)測模型是通過如上所述的訓(xùn)練方法訓(xùn)練得到;預(yù)測處理模塊,用于使用所述長短期特性差異預(yù)測模型對與目標(biāo)特性相對應(yīng)的用戶特征數(shù)據(jù)進(jìn)行處理,用以獲得用戶的長期特性與短期特性差異的信息。
14、根據(jù)本公開的第五方面,提供一種模型訓(xùn)練裝置,包括:存儲器;以及耦接至所述存儲器的處理器,所述處理器被配置為基于存儲在所述存儲器中的指令,執(zhí)行如上所述的訓(xùn)練方法。
15、根據(jù)本公開的第六方面,提供一種用戶長短期特性差異預(yù)測裝置,包括:存儲器;以及耦接至所述存儲器的處理器,所述處理器被配置為基于存儲在所述存儲器中的指令,執(zhí)行如上所述的預(yù)測方法。
16、根據(jù)本公開的第七方面,提供一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)指令,所述指令被處理器執(zhí)行如上所述的方法。
17、本公開的模型訓(xùn)練、用戶長短期特性差異預(yù)測方法、裝置以及存儲介質(zhì),根據(jù)長期特性與短期特性確定長短期特性融合標(biāo)簽,基于長期屬性、短期屬性和長短期特性融合屬性獲得目標(biāo)特征,使用基于與目標(biāo)特性相對應(yīng)的用戶特征數(shù)據(jù)以及長短期特性融合標(biāo)簽生成的訓(xùn)練樣本集對長短期特性差異預(yù)測模型進(jìn)行訓(xùn)練,并對訓(xùn)練后的模型進(jìn)行可視化評估等評估處理;可以提高模型訓(xùn)練效率和預(yù)測的準(zhǔn)確性,能夠直接、準(zhǔn)確地確定用戶是否存在長短期特性差異,可以準(zhǔn)確、全面的識別具有短期和長期特性差異的用戶群體,能夠?qū)τ脩暨M(jìn)行精細(xì)化管控。