1.一種面向圖像檢索的對象級深度特征聚合方法,其特征在于以下步驟:
步驟1,對數(shù)據(jù)庫中的每一張圖像采用Selective Search算法提取候選區(qū)域,生成圖像候選區(qū)域;
步驟2,選擇卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)模型,并在公共數(shù)據(jù)庫上對卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練;
步驟3,采用訓(xùn)練完成的卷積神經(jīng)網(wǎng)絡(luò)提取所有圖像候選區(qū)域的特征
3.1)將圖像候選區(qū)域縮放填充到固定大小后,作為卷積神經(jīng)網(wǎng)絡(luò)的輸入;
3.2)將卷積神經(jīng)網(wǎng)絡(luò)的全連接層FC7的輸出作為該圖像候選區(qū)域的描述特征;
步驟4,對步驟3得到的候選區(qū)域的描述特征采用主成分分析算法進(jìn)行降維,將其維度降為N維,得到低維候選區(qū)域特征;
步驟5,對步驟4得到的低維候選區(qū)域特征采用K均值聚類算法進(jìn)行無監(jiān)督聚類,聚成K個聚類中心;
步驟6,對步驟4得到的屬于同一張圖像的低維候選區(qū)域特征和步驟5得到的K個聚類中心,采用VLAD算法進(jìn)行聚合,每張圖像得到一個維度為N*K維的VLAD特征;
步驟7,對步驟6得到的VLAD特征采用主成分分析算法進(jìn)行降維,將其維度降為D維,生成簡潔的圖像特征。