1.基于思維鏈條的圖像級自動提示生成方法,其特征在于,利用思維鏈條思想將一階段的目標(biāo)檢測任務(wù)分解為多步,針對特定數(shù)據(jù)集自動生成圖像級的提示,從而提高目標(biāo)檢測準(zhǔn)確率,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于思維鏈條的圖像級自動提示生成方法,其特征在于,所述的概念提取模塊由前景物體提取器extf和預(yù)訓(xùn)練好的文本-圖像匹配對組成。
3.根據(jù)權(quán)利要求1所述的基于思維鏈條的圖像級自動提示生成方法,其特征在于,所述的常識知識圖譜gc以常識知識庫概念網(wǎng)絡(luò)為基礎(chǔ),待檢測類別標(biāo)簽為實體,關(guān)聯(lián)關(guān)系為邊,關(guān)聯(lián)程度為權(quán)重,數(shù)學(xué)模型為帶權(quán)有向圖。
4.根據(jù)權(quán)利要求1所述的基于思維鏈條的圖像級自動提示生成方法,其特征在于,所述的大語言模型為生成式預(yù)訓(xùn)練轉(zhuǎn)換器模型,利用兩步問答進(jìn)行場景聯(lián)想和概念補充推理。
5.根據(jù)權(quán)利要求2所述的前景物體提取器extf,其特征在于,使用視覺變換器作為基礎(chǔ)網(wǎng)絡(luò),使用尺寸為14*14的無重疊窗口提取特征圖,并利用感興趣區(qū)域頭篩選預(yù)選框,從而獲得前景物體所在區(qū)域。