本申請屬于人工智能,具體涉及一種圖像分類方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、目前,為了便于管理和查找相冊應(yīng)用程序中存儲的多個圖像,通常電子設(shè)備可以對多個圖像進(jìn)行分類存儲,以便于用戶查找自身需求的圖像。
2、相關(guān)技術(shù)中,用戶可以對相冊應(yīng)用程序中的場景分類文件夾控件進(jìn)行輸入,以使得電子設(shè)備可以在相冊應(yīng)用程序中創(chuàng)建場景分類文件夾,然后用戶可以依次將多個圖像分別拖動至對應(yīng)的場景分類文件夾中,以使得電子設(shè)備可以對相冊應(yīng)用程序中的多個圖像進(jìn)行場景分類。
3、然而,由于上述方法需要用戶手動創(chuàng)建文件夾以及手動將多個圖像添加至對應(yīng)的場景分類文件夾中,而且,在相冊應(yīng)用程序中的圖像較多時,用戶很難不出錯,所以導(dǎo)致電子設(shè)備進(jìn)行圖像分類的過程較為繁瑣且耗時,以及準(zhǔn)確性較差。
技術(shù)實現(xiàn)思路
1、本申請實施例的目的是提供一種圖像分類方法、裝置、電子設(shè)備、存儲介質(zhì)及程序產(chǎn)品,能夠在提高圖像分類效率的同時,提升圖像分類的準(zhǔn)確性。
2、第一方面,本申請實施例提供了一種圖像分類方法,該圖像分類方法包括:獲取第一圖像;通過第一模型的n層卷積層,對第一圖像進(jìn)行特征提取處理,得到第一圖像的圖像特征向量,圖像特征向量包括n層特征信息,每層特征信息包括通過每層卷積層中不同大小的至少兩個卷積核提取得到的特征信息;基于圖像特征向量,確定第一圖像所屬的場景類別;其中,n為大于1的整數(shù)。
3、第二方面,本申請實施例提供了一種圖像分類裝置,該圖像分類裝置包括:獲取模塊、特征提取模塊和確定模塊。獲取模塊,用于獲取第一圖像。特征提取模塊,用于通過第一模型的n層卷積層,對獲取模塊獲取的第一圖像進(jìn)行特征提取處理,得到第一圖像的圖像特征向量,圖像特征向量包括n層特征信息,每層特征信息包括通過每層卷積層中不同大小的至少兩個卷積核提取得到的特征信息確定模塊,用于基于圖像特征向量,確定第一圖像所屬的場景類別;其中,n為大于1的整數(shù)。
4、第三方面,本申請實施例提供了一種電子設(shè)備,該電子設(shè)備包括處理器和存儲器,所述存儲器存儲可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執(zhí)行時實現(xiàn)如第一方面所述的方法的步驟。
5、第四方面,本申請實施例提供了一種可讀存儲介質(zhì),所述可讀存儲介質(zhì)上存儲程序或指令,所述程序或指令被處理器執(zhí)行時實現(xiàn)如第一方面所述的方法的步驟。
6、第五方面,本申請實施例提供了一種芯片,所述芯片包括處理器和通信接口,所述通信接口和所述處理器耦合,所述處理器用于運行程序或指令,實現(xiàn)如第一方面所述的方法。
7、第六方面,本申請實施例提供一種計算機(jī)程序產(chǎn)品,該程序產(chǎn)品被存儲在存儲介質(zhì)中,該程序產(chǎn)品被至少一個處理器執(zhí)行以實現(xiàn)如第一方面所述的方法。
8、在本申請實施例中,電子設(shè)備可以通過第一模型的n層卷積層的每層卷積層中的不同大小的多個兩個卷積核提取第一圖像中的特征信息,然后基于該圖像特征向量,確定所述第一圖像所屬的場景類別。本方案中,由于在每一層卷積層中均通過不同大小的卷積核可以同時提取不同尺度的圖像特征,所以第一模型可以捕捉到更多細(xì)節(jié)信息和全局信息,使得場景識別更加精準(zhǔn)。此外,卷積操作的疊加可以使得第一模型能夠在不同層次上逐步提取更高級別的語義信息,進(jìn)一步提升了識別的準(zhǔn)確性。而且,通過第一模型對圖像進(jìn)行自動場景分類,無需用戶手動操作,如此,在提升了電子設(shè)備進(jìn)行場景分類的效率的同時也提升了電子設(shè)備進(jìn)行場景分類的準(zhǔn)確性。
1.一種圖像分類方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過第一模型的n層卷積層,對所述第一圖像進(jìn)行特征提取處理,得到所述第一圖像的圖像特征向量,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述通過所述第一模型的第1層卷積層中的至少兩個卷積核,對所述第一圖像進(jìn)行特征提取處理,得到所述第1層卷積層對應(yīng)的特征向量,包括:
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求1-3中任一項所述的方法,其特征在于,所述基于所述圖像特征向量,確定所述第一圖像所屬的場景類別,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述基于所述關(guān)鍵特征信息,確定所述第一圖像的場景類別,包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述基于所述關(guān)鍵特征信息,通過第三模型,對所述第一圖像進(jìn)行特征提取處理,得到第二特征信息之前,所述方法還包括:
8.一種圖像分類裝置,其特征在于,所述圖像分類裝置包括:獲取模塊、特征提取模塊和確定模塊;
9.一種電子設(shè)備,其特征在于,包括處理器,存儲器及存儲在所述存儲器上并可在所述處理器上運行的程序或指令,所述程序或指令被所述處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至8中任一項所述的圖像分類方法的步驟。
10.一種可讀存儲介質(zhì),其特征在于,所述可讀存儲介質(zhì)上存儲程序或指令,所述程序或指令被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1至8中任一項所述的圖像分類方法的步驟。
11.一種計算機(jī)程序產(chǎn)品,其特征在于,所述計算機(jī)程序產(chǎn)品被存儲在存儲介質(zhì)中,所述計算機(jī)程序產(chǎn)品被至少一個處理器執(zhí)行以如權(quán)利要求1至8中任一項所述的圖像分類方法。