本公開涉及人工智能,尤其涉及大模型、生成模型、多模態(tài)大模型、圖像處理等領(lǐng)域,更具體地,本公開提供了一種圖像處理方法、裝置、電子設(shè)備、存儲介質(zhì)以及計算機程序產(chǎn)品。
背景技術(shù):
1、用戶在生活、工作、旅游等場景中經(jīng)常會拍攝照片,手機等電子設(shè)備中的照片通常是按照拍攝時間的順序進行全量顯示,無法突出重點,影響用戶的瀏覽體驗。
技術(shù)實現(xiàn)思路
1、本公開提供了一種圖像處理方法、裝置、電子設(shè)備、存儲介質(zhì)以及計算機程序產(chǎn)品。
2、根據(jù)本公開的一方面,提供了一種圖像處理方法,包括:根據(jù)目標圖像集中符合預(yù)定條件的圖像的數(shù)量,從多個預(yù)定結(jié)構(gòu)模板中確定目標結(jié)構(gòu)模板;根據(jù)用于目標結(jié)構(gòu)模板的分組模式,對目標圖像集中的多個圖像進行分組處理,得到至少一個目標子集;針對至少一個目標子集中的每個目標子集,根據(jù)目標子集中的圖像和圖像的描述文本,生成子集文案;以及根據(jù)目標結(jié)構(gòu)模板、目標圖像集中的圖像和子集文案,生成圖文數(shù)據(jù)。
3、根據(jù)本公開的另一方面,提供了一種圖像處理裝置,包括:目標結(jié)構(gòu)模板確定模塊、分組模塊、子集文案生成模塊以及圖文生成模塊。目標結(jié)構(gòu)模板確定模塊用于根據(jù)目標圖像集中符合預(yù)定條件的圖像的數(shù)量,從多個預(yù)定結(jié)構(gòu)模板中確定目標結(jié)構(gòu)模板。分組模塊用于根據(jù)用于目標結(jié)構(gòu)模板的分組模式,對目標圖像集中的多個圖像進行分組處理,得到至少一個目標子集。子集文案生成模塊用于針對至少一個目標子集中的每個目標子集,根據(jù)目標子集中的圖像和圖像的描述文本,生成子集文案。圖文生成模塊用于根據(jù)目標結(jié)構(gòu)模板、目標圖像集中的圖像和子集文案,生成圖文數(shù)據(jù)。
4、根據(jù)本公開的另一個方面,提供了一種電子設(shè)備,包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器;其中,存儲器存儲有可被至少一個處理器執(zhí)行的指令,指令被至少一個處理器執(zhí)行,以使至少一個處理器能夠執(zhí)行本公開提供的方法。
5、根據(jù)本公開的另一個方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),其中,計算機指令用于使計算機執(zhí)行本公開提供的方法。
6、根據(jù)本公開的另一個方面,提供了一種計算機程序產(chǎn)品,包括計算機程序,計算機程序在被處理器執(zhí)行時實現(xiàn)本公開提供的方法。
7、應(yīng)當理解,本部分所描述的內(nèi)容并非旨在標識本公開的實施例的關(guān)鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種圖像處理方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)所述目標子集中的圖像和圖像的描述文本,生成子集文案包括:
3.根據(jù)權(quán)利要求2所述的方法,還包括:
4.根據(jù)權(quán)利要求3所述的方法,其中,所述根據(jù)所述目標結(jié)構(gòu)模板、所述目標圖像集中的圖像和所述子集文案,生成圖文數(shù)據(jù)包括:
5.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)用于所述目標結(jié)構(gòu)模板的分組模式,對所述目標圖像集中的多個圖像進行分組處理,得到至少一個目標子集包括:
6.根據(jù)權(quán)利要求5所述的方法,其中,所述響應(yīng)于檢測到所述目標結(jié)構(gòu)模板為多級分類模板,基于不同的分類維度將所述目標圖像集中的圖像劃分至多個初始子集包括:
7.根據(jù)權(quán)利要求5所述的方法,其中,所述根據(jù)所述初始子集,確定所述至少一個目標子集包括:
8.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)目標圖像集中符合預(yù)定條件的圖像的數(shù)量,從多個預(yù)定結(jié)構(gòu)模板中確定目標結(jié)構(gòu)模板包括:
9.根據(jù)權(quán)利要求1所述的方法,還包括:
10.根據(jù)權(quán)利要求9所述的方法,其中,所述根據(jù)初始圖像集中的圖像的質(zhì)量評估值、任意兩個圖像之間的相似度、圖像的類別中的至少一個,對所述初始圖像集中的圖像進行篩選處理包括以下中的至少一個:
11.根據(jù)權(quán)利要求10所述的方法,其中,所述根據(jù)所述兩個圖像之間的相似度和所述兩個圖像各自的質(zhì)量評估值,對所述兩個圖像進行篩選處理包括:
12.根據(jù)權(quán)利要求1所述的方法,其中,所述描述文本是根據(jù)圖像的拍攝時間、拍攝位置、類別中的至少一個確定的。
13.一種圖像處理裝置,包括:
14.根據(jù)權(quán)利要求13所述的裝置,其中,所述子集文案生成模塊包括:
15.根據(jù)權(quán)利要求14所述的裝置,還包括:
16.根據(jù)權(quán)利要求15所述的裝置,其中,所述圖文生成模塊包括:
17.根據(jù)權(quán)利要求13所述的裝置,其中,所述分組模塊包括:
18.根據(jù)權(quán)利要求17所述的裝置,其中,所述第一分組子模塊包括:
19.根據(jù)權(quán)利要求17所述的裝置,其中,所述目標子集確定子模塊包括:
20.根據(jù)權(quán)利要求13所述的裝置,其中,所述目標結(jié)構(gòu)模板確定模塊包括:
21.根據(jù)權(quán)利要求13所述的裝置,還包括:
22.根據(jù)權(quán)利要求21所述的裝置,其中,所述篩選模塊包括以下中的至少一個:
23.根據(jù)權(quán)利要求22所述的裝置,其中,所述篩選子模塊包括:
24.根據(jù)權(quán)利要求13所述的裝置,其中,所述描述文本是根據(jù)圖像的拍攝時間、拍攝位置、類別中的至少一個確定的。
25.一種電子設(shè)備,包括:
26.一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),其中,所述計算機指令用于使所述計算機執(zhí)行根據(jù)權(quán)利要求1至12中任一項所述的方法。
27.一種計算機程序產(chǎn)品,包括計算機程序,所述計算機程序在被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1至12中任一項所述的方法。