本發(fā)明涉及圖像分類領域,具體涉及一種面向長尾類別分布的圖像分類方法。
背景技術:
1、現(xiàn)實世界視覺識別數(shù)據(jù)集通常呈現(xiàn)長尾類別分布,即小部分類別含有大量樣本,而其他大部分類別僅含有少量樣本。由于類別分布不平衡,訓練的模型很容易偏向含有較多樣本的頭部類,而在尾部類上表現(xiàn)不佳。
2、長尾學習是解決類別分布不平衡問題的主流研究方向之一。大多數(shù)當前的長尾研究僅考慮訓練數(shù)據(jù)服從長尾類別分布,并假設測試數(shù)據(jù)服從均勻類別分布。然而,該假設忽視了真實場景中測試數(shù)據(jù)往往存在未知的分布偏移,導致已有方法在解決實際長尾問題時失效。
技術實現(xiàn)思路
1、本發(fā)明目的:在于提供一種面向長尾類別分布的圖像分類方法,該方法適用于訓練集服從長尾類別分布,測試集服從未知類別分布的圖像分類場景,以解決真實場景中的長尾問題。
2、為實現(xiàn)以上功能,本發(fā)明設計一種面向長尾類別分布的圖像分類方法,執(zhí)行如下步驟s1-步驟s6,完成對圖像的分類預測:
3、步驟s1:采集原始圖像作為訓練樣本,并標注相應類別標簽,構建長尾訓練數(shù)據(jù)集;
4、步驟s2:使用數(shù)據(jù)混合技術,對步驟s1所構建的長尾訓練數(shù)據(jù)集中的原始圖像與類別標簽進行線性插值,構造新的圖像和類別標簽;
5、步驟s3:構建多專家模型,多專家模型具有不同預測偏向的專家模型,各專家模型分別基于不同邏輯調整系數(shù)的損失函數(shù),包括面向正向長尾分布、均勻分布、逆向長尾分布三種不同分布的專家模型,并通過保留獨立的專家模型網絡參數(shù),保證專家模型間的差異性;采用步驟s2所獲得的圖像和類別標簽對多專家模型進行訓練;
6、步驟s4:以無標簽的圖像作為測試樣本構建測試集,分別將測試集中的圖像輸入多專家模型,以測試多專家模型在未知測試分布中的泛化性能,獲得多專家模型的最優(yōu)集成權重;
7、步驟s5:使用最優(yōu)集成后的多專家模型對測試集中的圖像再次進行預測,得到最終分類結果;
8、步驟s6:如果用戶對最終分類結果滿意,則結束,否則收集更多的訓練樣本及標簽,執(zhí)行步驟s2。
9、有益效果:相對于現(xiàn)有技術,本發(fā)明的優(yōu)點包括:
10、一般的長尾設置僅考慮訓練集長尾分布、測試集平衡分布的情況。在現(xiàn)實世界應用中,測試集的分布可能是多種多樣的,這可能會使針對測試集平衡這一種分布設計的長尾方法表現(xiàn)不佳。為了考慮測試數(shù)據(jù)分布的不確定性,本發(fā)明首先利用訓練數(shù)據(jù)學習多個具有不同預測偏向的專家模型。然后通過專家模型生成測試數(shù)據(jù)偽標簽,并設計自適應閾值篩選高置信偽標簽優(yōu)化一致性正則,自動學習各專家模型的最優(yōu)線性組合,提升多專家集成模型在未知測試分布上的泛化效果,為解決真實場景中的長尾問題提供新的方案。
1.一種面向長尾類別分布的圖像分類方法,其特征在于,執(zhí)行如下步驟s1-步驟s6,完成對圖像的分類預測:
2.根據(jù)權利要求1所述的一種面向長尾類別分布的圖像分類方法,其特征在于,步驟s1中所構建的長尾訓練數(shù)據(jù)集為其中,xi表示第i個訓練樣本,yi表示訓練樣本xi的類別標簽,ns表示長尾訓練數(shù)據(jù)集中各個類別的訓練樣本總和。
3.根據(jù)權利要求1所述的一種面向長尾類別分布的圖像分類方法,其特征在于,步驟s2方法如下:
4.根據(jù)權利要求1所述的一種面向長尾類別分布的圖像分類方法,其特征在于,步驟s3中所構建的多專家模型具體如下:
5.根據(jù)權利要求1所述的一種面向長尾類別分布的圖像分類方法,其特征在于,步驟s4具體步驟如下: