本技術(shù)涉及圖像處理,尤其涉及一種文本識別方法、裝置、電子設(shè)備、介質(zhì)及產(chǎn)品。
背景技術(shù):
1、隨著科技不斷發(fā)展和自動化程度逐漸提高,大量的圖像中文本處理工作由人工完成逐漸轉(zhuǎn)變?yōu)橛蓹C器自動完成。
2、在現(xiàn)有技術(shù)中,機器拍攝一張待識別圖像,并將該待識別圖像整張輸入一個預(yù)先訓練好的文本識別模型中,將文本識別模型的輸出結(jié)果作為該待識別圖像中的全部文本內(nèi)容,進而根據(jù)該待識別圖像中的全部文本內(nèi)容執(zhí)行相應(yīng)的文本處理工作。
3、但是,整張待識別圖像中文本之間存在嚴格的關(guān)聯(lián)關(guān)系,如果現(xiàn)有技術(shù)的文本識別模型不能夠準確地識別出整張待識別圖像中文本之間的關(guān)聯(lián)關(guān)系,就會導致后續(xù)的文本處理工作無法正常開展,而為了保證現(xiàn)有技術(shù)的文本識別模型能夠準確地區(qū)分出整張待識別圖像中文本之間的關(guān)聯(lián)關(guān)系,前期需要對文本識別模型進行大量訓練,這樣會導致成本較高,并且最終的識別準確率也難以保證。也就是說,現(xiàn)有技術(shù)中存在圖像中文本識別成本較高、識別準確率難以保證等問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)提供一種文本識別方法、裝置、電子設(shè)備、介質(zhì)及產(chǎn)品,用以解決圖像中文本識別成本較高、識別準確率難以保證等問題。
2、第一方面,本技術(shù)提供一種文本識別方法,包括:
3、獲取待識別圖像和預(yù)設(shè)識別模板數(shù)據(jù),所述預(yù)設(shè)識別模板數(shù)據(jù)包括模板圖像尺寸和預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息;
4、根據(jù)所述模板圖像尺寸對所述待識別圖像進行預(yù)處理,獲得標準圖像;
5、根據(jù)所述預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息對所述標準圖像進行裁剪處理,獲得至少一個裁剪圖像;
6、對至少一個所述裁剪圖像進行文本識別處理,并根據(jù)至少一個所述裁剪圖像的文本識別處理結(jié)果生成所述待識別圖像的文本識別信息。
7、可選地,所述根據(jù)所述模板圖像尺寸對所述待識別圖像進行預(yù)處理,獲得標準圖像,包括:
8、采用預(yù)設(shè)圖像參數(shù)識別算法確定所述待識別圖像的當前參數(shù),所述當前參數(shù)包括當前傾角、當前尺寸和當前中心點;
9、根據(jù)所述當前傾角和所述當前中心點對所述待識別圖像進行角度校正處理,獲得角度校正圖像;
10、根據(jù)所述當前尺寸和所述模板圖像尺寸對所述角度校正圖像進行尺寸校正處理,獲得尺寸校正圖像;
11、根據(jù)所述尺寸校正圖像確定所述標準圖像。
12、可選地,所述根據(jù)所述當前傾角和所述當前中心點對所述待識別圖像進行角度校正處理,獲得角度校正圖像,包括:
13、響應(yīng)于所述當前傾角為正值,以所述當前中心點為旋轉(zhuǎn)中心,將所述待識別圖像逆時針旋轉(zhuǎn)所述當前傾角,獲得所述角度校正圖像;
14、響應(yīng)于所述當前傾角為負值,以所述當前中心點為旋轉(zhuǎn)中心,將所述待識別圖像順時針旋轉(zhuǎn)所述當前傾角的絕對值,獲得所述角度校正圖像;
15、響應(yīng)于所述當前傾角為0°,將所述待識別圖像確定為所述角度校正圖像。
16、可選地,所述根據(jù)所述尺寸校正圖像確定所述標準圖像,包括:
17、根據(jù)所述預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息對所述尺寸校正圖像進行預(yù)裁剪處理,獲得一個裁剪圖像;
18、對所述一個裁剪圖像進行文本預(yù)識別處理;
19、響應(yīng)于文本預(yù)識別處理失敗,將所述尺寸校正圖像旋轉(zhuǎn)180°,并將旋轉(zhuǎn)后的尺寸校正圖像確定為所述標準圖像;
20、響應(yīng)于文本預(yù)識別處理成功,將所述尺寸校正圖像直接確定為所述標準圖像。
21、可選地,所述根據(jù)所述當前尺寸和所述模板圖像尺寸對所述角度校正圖像進行尺寸校正處理,獲得尺寸校正圖像,包括:
22、確定所述當前尺寸與所述模板圖像尺寸的水平縮放比例和豎直縮放比例;
23、根據(jù)所述水平縮放比例對所述角度校正圖像水平方向上的像素點進行抽除處理或補充處理,獲得水平校正圖像,并根據(jù)所述豎直縮放比例對所述水平校正圖像豎直方向上的像素點進行抽除處理或補充處理,獲得所述標準圖像;或
24、根據(jù)所述豎直縮放比例對所述角度校正圖像豎直方向上的像素點進行抽除處理或補充處理,獲得豎直校正圖像,并根據(jù)所述水平縮放比例對所述豎直校正圖像水平方向上的像素點進行抽除處理或補充處理,獲得所述標準圖像。
25、可選地,所述預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息包括至少一個待識別關(guān)聯(lián)區(qū)域的左上角坐標和右下角坐標;
26、所述根據(jù)所述預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息對所述標準圖像進行裁剪處理,獲得至少一個裁剪圖像,包括:
27、根據(jù)所述至少一個待識別關(guān)聯(lián)區(qū)域的左上角坐標和右下角坐標確定出所述標準圖像中的至少一個矩形區(qū)域;
28、裁剪出所述標準圖像中的至少一個矩形區(qū)域內(nèi)的圖像,獲得至少一個所述裁剪圖像。
29、可選地,所述對至少一個所述裁剪圖像進行文本識別處理,包括:
30、將至少一個所述裁剪圖像輸入預(yù)先訓練好的文本識別模型中,對至少一個所述裁剪圖像進行文本識別處理,獲得所述文本識別模型的輸出結(jié)果;
31、將所述文本識別模型的輸出結(jié)果作為至少一個所述裁剪圖像的文本識別處理結(jié)果。
32、可選地,所述預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息包括至少一個待識別關(guān)聯(lián)區(qū)域標識;
33、所述根據(jù)至少一個所述裁剪圖像的文本識別處理結(jié)果生成所述待識別圖像的文本識別信息,包括:
34、將至少一個所述裁剪圖像的文本識別處理結(jié)果中與所述待識別關(guān)聯(lián)區(qū)域標識相同的文本確定為目標文本標識;
35、將至少一個所述裁剪圖像的文本識別處理結(jié)果中除所述目標文本標識外的文本確定為目標文本內(nèi)容;
36、以所述目標文本標識為鍵,以所述目標文本內(nèi)容為值,生成所述待識別圖像的文本識別信息。
37、第二方面,本技術(shù)提供一種文本識別裝置,所述文本識別裝置包括:
38、獲取模塊,用于獲取待識別圖像和預(yù)設(shè)識別模板數(shù)據(jù),所述預(yù)設(shè)識別模板數(shù)據(jù)包括模板圖像尺寸和預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息;
39、預(yù)處理模塊,用于根據(jù)所述模板圖像尺寸對所述待識別圖像進行預(yù)處理,獲得標準圖像;
40、裁剪模塊,用于根據(jù)所述預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息對所述標準圖像進行裁剪處理,獲得至少一個裁剪圖像;
41、生成模塊,用于對至少一個所述裁剪圖像進行文本識別處理,并根據(jù)至少一個所述裁剪圖像的文本識別處理結(jié)果生成所述待識別圖像的文本識別信息。
42、第三方面,本技術(shù)提供一種電子設(shè)備,所述電子設(shè)備包括:處理器,以及與所述處理器通信連接的存儲器;
43、所述存儲器存儲計算機執(zhí)行指令;
44、所述處理器執(zhí)行所述存儲器存儲的計算機執(zhí)行指令,以實現(xiàn)第一方面中任一項所述的文本識別方法。
45、第四方面,本技術(shù)提供一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)中存儲有計算機執(zhí)行指令,所述計算機執(zhí)行指令被處理器執(zhí)行時用于實現(xiàn)第一方面中任一項所述的文本識別方法。
46、第五方面,本技術(shù)提供一種計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)第一方面中任一項所述的文本識別方法。
47、本技術(shù)提供的文本識別方法、裝置、電子設(shè)備、介質(zhì)及產(chǎn)品,文本識別方法包括:獲取待識別圖像和預(yù)設(shè)識別模板數(shù)據(jù),預(yù)設(shè)識別模板數(shù)據(jù)包括模板圖像尺寸和預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息;根據(jù)模板圖像尺寸對待識別圖像進行預(yù)處理,獲得標準圖像;根據(jù)預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息對標準圖像進行裁剪處理,獲得至少一個裁剪圖像;對至少一個裁剪圖像進行文本識別處理,并根據(jù)至少一個裁剪圖像的文本識別處理結(jié)果生成待識別圖像的文本識別信息。通過上述方案,根據(jù)預(yù)設(shè)識別模板數(shù)據(jù)中的模板圖像尺寸將待識別圖像變換為標準圖像,進而根據(jù)預(yù)設(shè)識別模板數(shù)據(jù)中的預(yù)設(shè)待識別關(guān)聯(lián)區(qū)域信息將標準圖像裁剪為至少一個裁剪圖像,從而對至少一個裁剪圖像分別進行文本識別處理,并根據(jù)至少一個裁剪圖像的文本識別處理結(jié)果生成待識別圖像的文本識別信息,由于不是直接對整張待識別圖像進行文本識別,因此,不再需要訓練能夠準確識別整張待識別圖像中文本之間的關(guān)聯(lián)關(guān)系的文本識別模型,從而既能夠降低識別成本,又能夠保證識別準確率。