本申請涉及計(jì)算機(jī),尤其涉及一種基于wasm的ocr單據(jù)錄入方法、設(shè)備及介質(zhì)。
背景技術(shù):
1、著全球數(shù)字化轉(zhuǎn)型浪潮的洶涌澎湃,企業(yè)和組織正以前所未有的速度向數(shù)字化、智能化邁進(jìn),這一轉(zhuǎn)型不僅深刻改變了業(yè)務(wù)模式,也極大地提升了運(yùn)營效率與管理水平。在這一背景下,將傳統(tǒng)紙質(zhì)文檔和單據(jù)轉(zhuǎn)化為數(shù)字格式,成為了實(shí)現(xiàn)全面數(shù)字化管理不可或缺的一環(huán)。紙質(zhì)文檔的數(shù)字化,不僅有助于減少物理存儲空間的需求,降低存儲成本,更重要的是,它使得信息的檢索、共享、分析及處理變得前所未有的高效與便捷。然而,面對堆積如山的紙質(zhì)單據(jù)和文檔,手動(dòng)輸入其中的數(shù)據(jù)無疑是一項(xiàng)既繁重又耗時(shí)的任務(wù)。這種方式不僅效率低下,容易出錯(cuò),還大大增加了人力成本。更為關(guān)鍵的是,它限制了企業(yè)快速響應(yīng)市場變化、優(yōu)化決策流程的能力。因此,尋找一種高效、準(zhǔn)確的自動(dòng)化解決方案,以替代傳統(tǒng)的手動(dòng)輸入方式,成為了眾多企業(yè)和組織迫切的需求。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述問題,本申請?zhí)岢隽艘环N基于wasm的ocr單據(jù)錄入方法,包括:確定客戶端的web界面,通過所述web界面獲取用戶上傳的單據(jù)文件,其中,所述單據(jù)文件包括單據(jù)圖像;通過所述客戶端對所述單據(jù)文件進(jìn)行ocr處理,并根據(jù)ocr處理后的所述單據(jù)文件提取文本信息;對所述文本信息進(jìn)行解析,以得到數(shù)據(jù)對象,確定預(yù)先設(shè)置的字段,根據(jù)所述數(shù)據(jù)對象對所述字段進(jìn)行填充。
2、在一個(gè)示例中,通過所述客戶端對所述單據(jù)文件進(jìn)行ocr處理,具體包括:根據(jù)ocr處理邏輯進(jìn)行編譯,以得到webassembly模塊;通過客戶端執(zhí)行所述webassembly模塊,以通過所述webassembly模塊對所述單據(jù)文件中的圖像進(jìn)行ocr處理。
3、在一個(gè)示例中,所述方法還包括:通過所述客戶端的web界面確定模板選擇功能,以使用戶通過所述模板選擇功能確定預(yù)設(shè)的模板,所述模板包括單據(jù)的字段結(jié)構(gòu)和字段對應(yīng)關(guān)系;通過所述模板對所述文本信息進(jìn)行解析,以得到數(shù)據(jù)對象,并將所述數(shù)據(jù)對象填充到所述模板的字段中。
4、在一個(gè)示例中,所述方法還包括:通過所述客戶端對所述文本信息的格式進(jìn)行檢測,以確定所述文本信息中的異常值;確定所述異常值對應(yīng)的矯正數(shù)據(jù),將所述矯正數(shù)據(jù)填充至所述字段中。
5、在一個(gè)示例中,根據(jù)所述數(shù)據(jù)對象對所述字段進(jìn)行填充之后,所述方法還包括:將填充后的數(shù)據(jù)對象發(fā)送至服務(wù)器,通過所述服務(wù)器對所述數(shù)據(jù)對象進(jìn)行數(shù)據(jù)處理,以使所述客戶端與所述服務(wù)器之間進(jìn)行數(shù)據(jù)同步,其中,所述數(shù)據(jù)處理包括數(shù)據(jù)分析、報(bào)表生成。
6、在一個(gè)示例中,所述方法還包括:通過服務(wù)器確定預(yù)先設(shè)置的用戶界面,通過所述用戶界面獲取webassembly模塊的字段結(jié)構(gòu),并將所述字段結(jié)構(gòu)進(jìn)行展示,其中,所述字段結(jié)構(gòu)包括但不限于注釋、主鍵、索引。
7、在一個(gè)示例中,所述方法還包括:通過服務(wù)器獲取所述字段對應(yīng)關(guān)系,并對所述字段對應(yīng)關(guān)系進(jìn)行展示,其中,所述字段對應(yīng)關(guān)系包括但不限于倉房編號、產(chǎn)線編號、員工編號。
8、在一個(gè)示例中,所述文本信息包括單據(jù)號碼、日期、金額。
9、另一方面,本申請還提出了一種基于wasm的ocr單據(jù)錄入設(shè)備,包括:至少一個(gè)處理器;以及,與所述至少一個(gè)處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述一種基于wasm的ocr單據(jù)錄入設(shè)備能夠執(zhí)行:確定客戶端的web界面,通過所述web界面獲取用戶上傳的單據(jù)文件,其中,所述單據(jù)文件包括單據(jù)圖像;通過所述客戶端對所述單據(jù)文件進(jìn)行ocr處理,并根據(jù)ocr處理后的所述單據(jù)文件提取文本信息;對所述文本信息進(jìn)行解析,以得到數(shù)據(jù)對象,確定預(yù)先設(shè)置的字段,根據(jù)所述數(shù)據(jù)對象對所述字段進(jìn)行填充。
10、另一方面,本申請還提出了一種非易失性計(jì)算機(jī)存儲介質(zhì),存儲有計(jì)算機(jī)可執(zhí)行指令,所述計(jì)算機(jī)可執(zhí)行指令設(shè)置為:確定客戶端的web界面,通過所述web界面獲取用戶上傳的單據(jù)文件,其中,所述單據(jù)文件包括單據(jù)圖像;通過所述客戶端對所述單據(jù)文件進(jìn)行ocr處理,并根據(jù)ocr處理后的所述單據(jù)文件提取文本信息;對所述文本信息進(jìn)行解析,以得到數(shù)據(jù)對象,確定預(yù)先設(shè)置的字段,根據(jù)所述數(shù)據(jù)對象對所述字段進(jìn)行填充。
11、本申請通過在客戶端使用wasm執(zhí)行ocr過程,可以減輕服務(wù)器端的負(fù)載和網(wǎng)絡(luò)傳輸壓力,提高了系統(tǒng)的響應(yīng)速度和并發(fā)處理能力,同時(shí)降低了服務(wù)器的成本和維護(hù)復(fù)雜性。本申請將ocr處理移到客戶端可以增強(qiáng)用戶的隱私保護(hù),降低了數(shù)據(jù)泄露和安全風(fēng)險(xiǎn),提高用戶的信任度和滿意度。本申請通過在客戶端執(zhí)行ocr,實(shí)現(xiàn)了即時(shí)的識別和反饋,使用戶能夠立即看到識別結(jié)果并進(jìn)行必要的修正,提高了數(shù)據(jù)錄入的效率和準(zhǔn)確性,同時(shí)降低用戶的等待時(shí)間和不必要的交互成本。本申請基于wasm的ocr解決方案可以輕松集成到現(xiàn)有的web應(yīng)用中,并且具有良好的可擴(kuò)展性和定制性,開發(fā)人員可以根據(jù)實(shí)際需求對ocr模塊進(jìn)行定制和擴(kuò)展,以滿足不同場景下的需求和要求。
1.一種基于wasm的ocr單據(jù)錄入方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過所述客戶端對所述單據(jù)文件進(jìn)行ocr處理,具體包括:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述數(shù)據(jù)對象對所述字段進(jìn)行填充之后,所述方法還包括:
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括:
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述文本信息包括單據(jù)號碼、日期、金額。
9.一種基于wasm的ocr單據(jù)錄入設(shè)備,其特征在于,包括:
10.一種非易失性計(jì)算機(jī)存儲介質(zhì),存儲有計(jì)算機(jī)可執(zhí)行指令,其特征在于,所述計(jì)算機(jī)可執(zhí)行指令設(shè)置為: