本說明書涉及圖像處理,尤其涉及一種假證檢測(cè)方法、可讀存儲(chǔ)介質(zhì)、設(shè)備及程序產(chǎn)品。
背景技術(shù):
1、在電子客戶身份驗(yàn)證(electronic?know?your?customer,ekyc)場(chǎng)景中,往往需要對(duì)客戶提供的證件進(jìn)行真實(shí)性驗(yàn)證,此時(shí)可以借助基于機(jī)器學(xué)習(xí)技術(shù)的假證識(shí)別模型,該假證識(shí)別模型通常將大量普通假證的數(shù)據(jù)作為樣本進(jìn)行訓(xùn)練,因此該模型對(duì)于普通假證有著較好的泛化能力,可對(duì)其實(shí)現(xiàn)高效檢測(cè)。然而,隨著證件造假技術(shù)的提升,通過例如屏幕翻拍、彩色打印、高精度仿制等手段得到的逼真假證相比上述普通假證具備更高的仿真度,導(dǎo)致上述假證識(shí)別模型難以區(qū)分真?zhèn)危瑱z測(cè)準(zhǔn)確率下降。
2、在相關(guān)技術(shù)中,為提升上述假證識(shí)別模型對(duì)于逼真假證的檢測(cè)能力,通常將逼真假證對(duì)應(yīng)的訓(xùn)練樣本與普通假證對(duì)應(yīng)的歷史訓(xùn)練樣本相互混合以訓(xùn)練上述假證識(shí)別模型。然而,訓(xùn)練后的假證識(shí)別模型即便提升了對(duì)逼真假證的檢測(cè)能力,但由于不同訓(xùn)練樣本之間的混合,導(dǎo)致訓(xùn)練樣本的整體分布發(fā)生大幅改變,例如針對(duì)逼真證件的訓(xùn)練樣本數(shù)量遠(yuǎn)多于針對(duì)普通證件的歷史訓(xùn)練樣本,導(dǎo)致模型過度關(guān)注逼真假證的訓(xùn)練樣本的特征,對(duì)普通假證的檢測(cè)能力下降,鑒于普通假證的檢測(cè)能力是ekyc場(chǎng)景下的關(guān)鍵指標(biāo)之一,這種能力的下降并不符合預(yù)期。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本說明書提供一種假證檢測(cè)方法及裝置,以解決相關(guān)技術(shù)中存在的不足。
2、具體地,本說明書是通過如下技術(shù)方案實(shí)現(xiàn)的:
3、根據(jù)本說明書實(shí)施例的第一方面,提供了一種假證檢測(cè)方法,包括:
4、獲取原始假證識(shí)別模型,所述原始假證識(shí)別模型用于檢測(cè)第一類假證;
5、獲取待訓(xùn)練樣本集合,所述待訓(xùn)練樣本集合中包含有對(duì)應(yīng)于所述第一類假證的第一類樣本和對(duì)應(yīng)于第二類假證的第二類樣本,所述第二類假證的逼真程度高于所述第一類假證,所述第二類樣本的數(shù)量小于所述第一類樣本;
6、根據(jù)所述待訓(xùn)練樣本集合對(duì)所述原始假證識(shí)別模型進(jìn)行迭代訓(xùn)練,以生成目標(biāo)假證識(shí)別模型。根據(jù)本說明書實(shí)施例的第二方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序/指令,該程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述方法的步驟。
7、根據(jù)本說明書實(shí)施例的第三方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面所述的方法的步驟。
8、根據(jù)本說明書實(shí)施例的第四方面,提供了一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如第一方面所述的方法的步驟。
9、在本說明書所提供的技術(shù)方案中,針對(duì)用于檢測(cè)第一類假證的原始假證識(shí)別模型,可以通過待訓(xùn)練樣本集合對(duì)其進(jìn)行迭代訓(xùn)練,從而生成目標(biāo)假證識(shí)別模型。其中,上述待訓(xùn)練樣本集合包含有對(duì)應(yīng)于第一類假證的第一類樣本和對(duì)應(yīng)于第二類假證的第二類樣本,且第二類假證在逼真程度高于第一類假證的同時(shí),其對(duì)應(yīng)的第二類樣本數(shù)量也小于第一類樣本,這使得上述待訓(xùn)練樣本集合可以確保不同類型的假證樣本占比,且基于逼真程度的關(guān)系可以將第一類假證視為普通假證、第二類假證視為逼真假證。對(duì)于原始假證識(shí)別模型而言,在一方面,即使增加了第二類假證的樣本比例,但仍然保持第一類假證的主導(dǎo)地位,因此可以確保目標(biāo)假證識(shí)別模型不會(huì)過度關(guān)注逼真假證而忽略普通假證的特征;在另一方面,通過增加第二類假證的樣本,模型可以學(xué)習(xí)到更多的第二類假證的特征,從而提高對(duì)這類樣本的檢測(cè)能力,但是由于第一類假證的樣本量仍然占主導(dǎo)地位,因此目標(biāo)假證識(shí)別模型也不會(huì)過度擬合第二類假證的特征。綜合以上兩方面的作用,那么上述目標(biāo)假證識(shí)別模型可以在保持針對(duì)普通假證的檢測(cè)準(zhǔn)確率的基礎(chǔ)上,還能有效增強(qiáng)針對(duì)逼真假證的檢測(cè)準(zhǔn)確率。
10、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本說明書。
1.一種假證檢測(cè)方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,所述獲取待訓(xùn)練樣本集合,包括:
3.根據(jù)權(quán)利要求2所述的方法,所述根據(jù)預(yù)設(shè)的樣本篩選條件從所述備選樣本集合中選取對(duì)應(yīng)數(shù)量的第二類備選樣本作為所述待訓(xùn)練樣本集合中的第二類樣本,包括:
4.根據(jù)權(quán)利要求1所述的方法,
5.根據(jù)權(quán)利要求1所述的方法,所述第一類樣本與所述第二類樣本之間的最小差值大于預(yù)定義的目標(biāo)閾值。
6.根據(jù)權(quán)利要求5所述的方法,響應(yīng)于所述原始假證識(shí)別模型的迭代次數(shù)的增加,所述目標(biāo)閾值呈下降趨勢(shì)。
7.根據(jù)權(quán)利要求1所述的方法,還包括:
8.根據(jù)權(quán)利要求1所述的方法,所述第一類樣本與所述第二類樣本分別包含針對(duì)相應(yīng)樣本證件所提取的多模態(tài)特征,所述多模態(tài)特征由相應(yīng)樣本證件的多個(gè)基礎(chǔ)特征融合所獲得,所述基礎(chǔ)特征包含以下任一:紅綠藍(lán)空域顏色信息、快速傅里葉變換頻域信息、高通濾波器信息、邊緣檢測(cè)算子信息和約束卷積信息。
9.根據(jù)權(quán)利要求1所述的方法,所述根據(jù)所述待訓(xùn)練樣本集合對(duì)所述原始假證識(shí)別模型進(jìn)行迭代訓(xùn)練,包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序/指令,該程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1~9任一所述方法的步驟。
11.一種電子設(shè)備,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述程序時(shí)實(shí)現(xiàn)如權(quán)利要求1~9任一所述方法的步驟。
12.一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序/指令,該計(jì)算機(jī)程序/指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1~9任一所述方法的步驟。