本公開(kāi)的實(shí)施例涉及計(jì)算機(jī),具體涉及模型存儲(chǔ)方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù):
1、目前,隨著社會(huì)的不斷發(fā)展,各種智能化應(yīng)用也廣泛的出現(xiàn)在人們的日常生成中。對(duì)于預(yù)定業(yè)務(wù)場(chǎng)景下的模型生成,通常采用的方式為:首先,獲取訓(xùn)練數(shù)據(jù)集。然后,設(shè)計(jì)針對(duì)預(yù)定業(yè)務(wù)場(chǎng)景下的模型結(jié)構(gòu),得到初始業(yè)務(wù)場(chǎng)景模型。最后,根據(jù)訓(xùn)練數(shù)據(jù)集,對(duì)上述初始業(yè)務(wù)場(chǎng)景模型進(jìn)行模型訓(xùn)練,以生成符合約定業(yè)務(wù)場(chǎng)景下的業(yè)務(wù)場(chǎng)景模型。
2、然而,當(dāng)采用上述方式來(lái)生成預(yù)定業(yè)務(wù)場(chǎng)景下的模型,經(jīng)常會(huì)存在如下技術(shù)問(wèn)題:
3、針對(duì)海量需求的預(yù)定業(yè)務(wù)場(chǎng)景,需要進(jìn)行針對(duì)性的模型結(jié)構(gòu)設(shè)計(jì),會(huì)浪費(fèi)大量的模型設(shè)計(jì)資源,導(dǎo)致業(yè)務(wù)場(chǎng)景模型的落地時(shí)間比較長(zhǎng),不便于業(yè)務(wù)場(chǎng)景下的模型使用。
4、該背景技術(shù)部分中所公開(kāi)的以上信息僅用于增強(qiáng)對(duì)本發(fā)明構(gòu)思的背景的理解,并因此,其可包含并不形成本國(guó)的本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實(shí)現(xiàn)思路
1、本公開(kāi)的內(nèi)容部分用于以簡(jiǎn)要的形式介紹構(gòu)思,這些構(gòu)思將在后面的具體實(shí)施方式部分被詳細(xì)描述。本公開(kāi)的內(nèi)容部分并不旨在標(biāo)識(shí)要求保護(hù)的技術(shù)方案的關(guān)鍵特征或必要特征,也不旨在用于限制所要求的保護(hù)的技術(shù)方案的范圍。
2、本公開(kāi)的一些實(shí)施例提出了模型存儲(chǔ)方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì),來(lái)解決以上背景技術(shù)部分提到的技術(shù)問(wèn)題中的一項(xiàng)或多項(xiàng)。
3、第一方面,本公開(kāi)的一些實(shí)施例提供了一種模型存儲(chǔ)方法,包括:獲取預(yù)先訓(xùn)練的基于全量模態(tài)輸入的全量模態(tài)輸出模型;響應(yīng)于接收到針對(duì)目標(biāo)業(yè)務(wù)場(chǎng)景下的模型獲取信息,確定上述目標(biāo)業(yè)務(wù)場(chǎng)景對(duì)應(yīng)的輸入模態(tài)集和業(yè)務(wù)輸出信息;對(duì)于上述輸入模態(tài)集中的每至少一個(gè)輸入模態(tài),執(zhí)行以下第一生成步驟:根據(jù)上述至少一個(gè)輸入模態(tài),對(duì)上述全量模態(tài)輸出模型進(jìn)行模型裁剪,以生成裁剪后的多模態(tài)輸出模型,其中,上述裁剪后的多模態(tài)輸出模型對(duì)應(yīng)的輸入數(shù)據(jù)的模態(tài)為上述至少一個(gè)輸入模態(tài),其中,上述裁剪后的多模態(tài)輸出模型對(duì)應(yīng)的模型參數(shù)與上述全量模態(tài)輸出模型中的對(duì)應(yīng)模型結(jié)構(gòu)相同的子模態(tài)輸出模型的模型參數(shù)相同;獲取上述至少一個(gè)輸入模態(tài)對(duì)應(yīng)的多模態(tài)數(shù)據(jù)集;對(duì)上述多模態(tài)數(shù)據(jù)集進(jìn)行多模態(tài)數(shù)據(jù)預(yù)處理,以生成預(yù)處理數(shù)據(jù)集;將上述預(yù)處理數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,根據(jù)業(yè)務(wù)輸出信息,對(duì)上述裁剪后的多模態(tài)輸出模型進(jìn)行模型訓(xùn)練,以生成訓(xùn)練后的多模態(tài)輸出模型;將所得到的至少一個(gè)訓(xùn)練后的多模態(tài)輸出模型進(jìn)行模型存儲(chǔ),以及將上述至少一個(gè)訓(xùn)練后的多模態(tài)輸出模型部署于上述目標(biāo)業(yè)務(wù)場(chǎng)景對(duì)應(yīng)的節(jié)點(diǎn)集群。
4、第二方面,本公開(kāi)的一些實(shí)施例提供了一種模型存儲(chǔ)裝置,包括:獲取單元,被配置成獲取預(yù)先訓(xùn)練的基于全量模態(tài)輸入的全量模態(tài)輸出模型;確定單元,被配置成響應(yīng)于接收到針對(duì)目標(biāo)業(yè)務(wù)場(chǎng)景下的模型獲取信息,確定上述目標(biāo)業(yè)務(wù)場(chǎng)景對(duì)應(yīng)的輸入模態(tài)集和業(yè)務(wù)輸出信息;執(zhí)行單元,被配置成對(duì)于上述輸入模態(tài)集中的每至少一個(gè)輸入模態(tài),執(zhí)行以下第一生成步驟:根據(jù)上述至少一個(gè)輸入模態(tài),對(duì)上述全量模態(tài)輸出模型進(jìn)行模型裁剪,以生成裁剪后的多模態(tài)輸出模型,其中,上述裁剪后的多模態(tài)輸出模型對(duì)應(yīng)的輸入數(shù)據(jù)的模態(tài)為上述至少一個(gè)輸入模態(tài),其中,上述裁剪后的多模態(tài)輸出模型對(duì)應(yīng)的模型參數(shù)與上述全量模態(tài)輸出模型中的對(duì)應(yīng)模型結(jié)構(gòu)相同的子模態(tài)輸出模型的模型參數(shù)相同;獲取上述至少一個(gè)輸入模態(tài)對(duì)應(yīng)的多模態(tài)數(shù)據(jù)集;對(duì)上述多模態(tài)數(shù)據(jù)集進(jìn)行多模態(tài)數(shù)據(jù)預(yù)處理,以生成預(yù)處理數(shù)據(jù)集;將上述預(yù)處理數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,根據(jù)業(yè)務(wù)輸出信息,對(duì)上述裁剪后的多模態(tài)輸出模型進(jìn)行模型訓(xùn)練,以生成訓(xùn)練后的多模態(tài)輸出模型;存儲(chǔ)單元,被配置成將所得到的至少一個(gè)訓(xùn)練后的多模態(tài)輸出模型進(jìn)行模型存儲(chǔ),以及將上述至少一個(gè)訓(xùn)練后的多模態(tài)輸出模型部署于上述目標(biāo)業(yè)務(wù)場(chǎng)景對(duì)應(yīng)的節(jié)點(diǎn)集群。
5、第三方面,本公開(kāi)的一些實(shí)施例提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,其上存儲(chǔ)有一個(gè)或多個(gè)程序,當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)如第一方面中任一實(shí)現(xiàn)方式描述的方法。
6、第四方面,本公開(kāi)的一些實(shí)施例提供了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中,程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面中任一實(shí)現(xiàn)方式描述的方法。
7、本公開(kāi)的上述各個(gè)實(shí)施例具有如下有益效果:通過(guò)本公開(kāi)的一些實(shí)施例的模型存儲(chǔ)方法可以準(zhǔn)確、高效地實(shí)現(xiàn)針對(duì)目標(biāo)業(yè)務(wù)場(chǎng)景的模型落地和存儲(chǔ),以便于后續(xù)目標(biāo)業(yè)務(wù)場(chǎng)景下的模型使用。具體來(lái)說(shuō),造成相關(guān)的目標(biāo)業(yè)務(wù)場(chǎng)景的模型落地不夠準(zhǔn)確、高效的原因在于:針對(duì)海量需求的預(yù)定業(yè)務(wù)場(chǎng)景,需要進(jìn)行針對(duì)性的模型結(jié)構(gòu)設(shè)計(jì),會(huì)浪費(fèi)大量的模型設(shè)計(jì)資源,導(dǎo)致業(yè)務(wù)場(chǎng)景模型的落地時(shí)間比較長(zhǎng),不便于業(yè)務(wù)場(chǎng)景下的模型使用?;诖耍竟_(kāi)的一些實(shí)施例的模型存儲(chǔ)方法,首先,獲取預(yù)先訓(xùn)練的基于全量模態(tài)輸入的全量模態(tài)輸出模型,以作為各個(gè)全量模態(tài)下的總模型,通過(guò)考慮不同模態(tài)輸出的各種業(yè)務(wù)場(chǎng)景,可以通過(guò)全量模型輸出模型,來(lái)實(shí)現(xiàn)模型結(jié)構(gòu)的對(duì)應(yīng)獲取,在保障模型結(jié)構(gòu)匹配的情況下,提高目標(biāo)業(yè)務(wù)場(chǎng)景下的模型落地效率。接著,響應(yīng)于接收到針對(duì)目標(biāo)業(yè)務(wù)場(chǎng)景下的模型獲取信息,確定上述目標(biāo)業(yè)務(wù)場(chǎng)景對(duì)應(yīng)的輸入模態(tài)集和業(yè)務(wù)輸出信息。在這里,通過(guò)目標(biāo)業(yè)務(wù)場(chǎng)景對(duì)應(yīng)的輸入模態(tài)集和業(yè)務(wù)輸出信息,可以便于后續(xù)模型的裁剪,以適應(yīng)目標(biāo)業(yè)務(wù)場(chǎng)景下的模型應(yīng)用。再接著,對(duì)于上述輸入模態(tài)集中的每至少一個(gè)輸入模態(tài),執(zhí)行以下第一生成步驟:第一步,根據(jù)上述至少一個(gè)輸入模態(tài),對(duì)上述全量模態(tài)輸出模型進(jìn)行模型裁剪,以快捷、準(zhǔn)確地生成裁剪后的多模態(tài)輸出模型。其中,上述裁剪后的多模態(tài)輸出模型對(duì)應(yīng)的輸入數(shù)據(jù)的模態(tài)為上述至少一個(gè)輸入模態(tài),其中,上述裁剪后的多模態(tài)輸出模型對(duì)應(yīng)的模型參數(shù)與上述全量模態(tài)輸出模型中的對(duì)應(yīng)模型結(jié)構(gòu)相同的子模態(tài)輸出模型的模型參數(shù)相同。在這里,通過(guò)至少一個(gè)輸入模態(tài)可以實(shí)現(xiàn)全量模態(tài)輸出模型的模型有效裁剪,以符合目標(biāo)業(yè)務(wù)場(chǎng)景的場(chǎng)景需求。第二步,獲取上述至少一個(gè)輸入模態(tài)對(duì)應(yīng)的多模態(tài)數(shù)據(jù)集,以用于裁剪后的多模態(tài)輸出模型的模型訓(xùn)練。第三步,對(duì)上述多模態(tài)數(shù)據(jù)集進(jìn)行多模態(tài)數(shù)據(jù)預(yù)處理,以生成預(yù)處理數(shù)據(jù)集,以生成高質(zhì)量的訓(xùn)練數(shù)據(jù)集。第四步,將上述預(yù)處理數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,根據(jù)業(yè)務(wù)輸出信息,對(duì)上述裁剪后的多模態(tài)輸出模型進(jìn)行模型訓(xùn)練,以生成訓(xùn)練后的多模態(tài)輸出模型,以獲取得到訓(xùn)練好的,針對(duì)輸入為至少一個(gè)輸入模態(tài)且場(chǎng)景為目標(biāo)業(yè)務(wù)場(chǎng)景的輸出模型。最后,將所得到的至少一個(gè)訓(xùn)練后的多模態(tài)輸出模型進(jìn)行模型存儲(chǔ),以供目標(biāo)業(yè)務(wù)場(chǎng)景對(duì)應(yīng)使用場(chǎng)景情況下進(jìn)行模型調(diào)度使用,以及將上述至少一個(gè)訓(xùn)練后的多模態(tài)輸出模型部署于上述目標(biāo)業(yè)務(wù)場(chǎng)景對(duì)應(yīng)的節(jié)點(diǎn)集群。綜上,基于目標(biāo)業(yè)務(wù)場(chǎng)景的輸入模態(tài)集和業(yè)務(wù)輸出信息,通過(guò)對(duì)對(duì)應(yīng)全量模態(tài)輸出模型進(jìn)行對(duì)應(yīng)輸入模態(tài)下的模型裁剪,可以快捷地得到在目標(biāo)業(yè)務(wù)場(chǎng)景下使用的、針對(duì)每個(gè)至少一個(gè)輸入模態(tài)的多模態(tài)輸出模型。
1.一種模型存儲(chǔ)方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述方法還包括:
3.根據(jù)權(quán)利要求1所述的方法,其中,所述全量模態(tài)輸出模型包括:多個(gè)并行連接的模態(tài)特征提取模型、多模態(tài)特征融合模型,基于全量模態(tài)集的業(yè)務(wù)輸出信息生成層集;以及
4.根據(jù)權(quán)利要求1所述的方法,其中,所述將所述預(yù)處理數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù)集,根據(jù)業(yè)務(wù)輸出信息,對(duì)所述裁剪后的多模態(tài)輸出模型進(jìn)行模型訓(xùn)練,以生成訓(xùn)練后的多模態(tài)輸出模型,包括:
5.根據(jù)權(quán)利要求4所述的方法,其中,所述生成表征至少一個(gè)業(yè)務(wù)輸出信息之間信息主體差異的第一損失信息,包括:
6.根據(jù)權(quán)利要求1所述的方法,其中,所述至少一個(gè)輸入模態(tài)包括:圖像輸入模態(tài)、文本輸入模態(tài)、音頻輸入模態(tài);以及
7.根據(jù)權(quán)利要求6所述的方法,其中,所述根據(jù)所述第四損失信息和所述第五損失信息,確定所述裁剪后的多模態(tài)輸出模型是否訓(xùn)練完成,包括:
8.一種模型存儲(chǔ)裝置,包括:
9.一種電子設(shè)備,包括:
10.一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7中任一所述的方法。