一種電子檔案掃描識(shí)別建檔的方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種電子檔案掃描識(shí)別建檔的方法,包括:步驟1、掃描檔案文件到指定目錄,并壓縮所述指定目錄;步驟2、壓縮完成后通過網(wǎng)絡(luò)協(xié)議將壓縮包傳輸?shù)綀D檔服務(wù)器;步驟3、圖檔服務(wù)器自動(dòng)解壓縮接收到的壓縮文件,并對(duì)解壓后的圖檔進(jìn)行OCR識(shí)別,通過提取圖檔中的文字信息將圖檔按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中。本發(fā)明還提供一種電子檔案掃描識(shí)別建檔的系統(tǒng)。通過本發(fā)明提供的一種電子檔案掃描識(shí)別建檔的方法及系統(tǒng),實(shí)現(xiàn)一鍵操作,將紙質(zhì)文檔轉(zhuǎn)換為電子檔案,大幅提升較傳統(tǒng)的文檔掃描上傳歸檔等步驟的效率,通過集成OCR圖像文字識(shí)別技術(shù),實(shí)現(xiàn)電子檔案與業(yè)務(wù)實(shí)體的關(guān)聯(lián),而不需人員操作,大大降低人力成本,減少建設(shè)時(shí)間。
【專利說明】—種電子檔案掃描識(shí)別建檔的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及自動(dòng)辦公化領(lǐng)域,特別是涉及一種電子檔案快速掃描識(shí)別建檔的方法及系統(tǒng)。
【背景技術(shù)】
[0002]目前,應(yīng)用系統(tǒng)軟件經(jīng)過多年的發(fā)展,業(yè)界出現(xiàn)不少電子檔案系統(tǒng),致力于解決紙質(zhì)檔案多,繁瑣,查閱難,借閱難,安全性難管控的問題。但傳統(tǒng)的電子檔案系統(tǒng),都需要一個(gè)將紙質(zhì)文檔轉(zhuǎn)換成電子文檔的過程,往往需要投入巨大的人力成本,并且費(fèi)時(shí)費(fèi)力,容易出錯(cuò)。電子檔案后期在使用中的成本往往甚至超過了軟件建設(shè)的成本。
[0003]所以,需要提出一種新的方式,在傳統(tǒng)的檔案系統(tǒng)之上,實(shí)現(xiàn)快速的電子檔案掃描識(shí)別建檔的方法,從而實(shí)現(xiàn)以最小的代價(jià),快速實(shí)現(xiàn)紙質(zhì)檔案轉(zhuǎn)換成電子檔案的功能。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種電子檔案掃描識(shí)別建檔的方法及系統(tǒng),實(shí)現(xiàn)一鍵操作,將紙質(zhì)文檔轉(zhuǎn)換為電子檔案,大幅提升較傳統(tǒng)的文檔掃描上傳歸檔等步驟的效率,通過集成OCR (Optical Character Recognition,光學(xué)字符識(shí)別)圖像文字識(shí)別技術(shù),實(shí)現(xiàn)電子檔案與業(yè)務(wù)實(shí)體的關(guān)聯(lián),而不需人員操作,大大降低人力成本,減少建設(shè)時(shí)間。
[0005]為解決以上技術(shù)問題,本發(fā)明提供一種電子檔案掃描識(shí)別建檔的方法,包括:
[0006]步驟1、掃描檔案文件到指定目錄,并壓縮所述指定目錄;
[0007]步驟2、壓縮完成后通過網(wǎng)絡(luò)協(xié)議將壓縮包傳輸?shù)綀D檔服務(wù)器;
[0008]步驟3、圖檔服務(wù)器自動(dòng)解壓縮接收到的壓縮文件,并對(duì)解壓后的圖檔進(jìn)行OCR識(shí)另IJ,通過提取圖檔中的文字信息將圖檔按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中。
[0009]進(jìn)一步地,所述步驟I具體包括:
[0010]步驟1.1、啟動(dòng)具有ActiveX插件的瀏覽器;
[0011]步驟1.2、所述ActiveX插件控制掃描儀掃描檔案文件,并將掃描完成的電子檔案存儲(chǔ)到指定目錄;
[0012]步驟1.3、所述ActiveX插件在全部檔案文件掃描完成后自動(dòng)壓縮所述指定目錄。
[0013]進(jìn)一步地,所述步驟3具體包括:
[0014]步驟3.1、圖檔服務(wù)器自動(dòng)解壓縮接收到的壓縮文件;
[0015]步驟3.2、對(duì)圖檔進(jìn)行OCR文字識(shí)別,提取圖檔中的文字信息;
[0016]步驟3.3、根據(jù)提取到的文字信息將所述圖檔按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中。
[0017]進(jìn)一步地,所述規(guī)則是:通過OCR文字識(shí)別到的電子檔案標(biāo)題,與當(dāng)前檔案目錄的標(biāo)題進(jìn)行比對(duì),字符相同則認(rèn)定當(dāng)前電子檔案歸屬到該檔案目錄。
[0018]為解決以上技術(shù)問題,本發(fā)明還提供一種電子檔案掃描識(shí)別建檔的系統(tǒng),包括:客戶機(jī)、掃描儀、交換機(jī)、圖檔服務(wù)器,其中:[0019]所述客戶機(jī),包括具有ActiveX插件的瀏覽器,所述ActiveX插件能控制掃描儀掃描檔案文件,將掃描完成的電子檔案存儲(chǔ)到指定目錄,并在全部檔案掃描完成后對(duì)所述指定目錄進(jìn)行壓縮;
[0020]所述掃描儀,用于根據(jù)客戶機(jī)的ActiveX插件指令掃描檔案文件;
[0021]所述交換機(jī),用于將壓縮包通過網(wǎng)絡(luò)協(xié)議傳輸?shù)綀D檔服務(wù)器;
[0022]所述圖檔服務(wù)器集成OCR文字識(shí)別,自動(dòng)解壓縮接收到的壓縮文件,并對(duì)解壓后的圖檔進(jìn)行OCR識(shí)別,通過提取圖檔中的文字信息將圖檔文件按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中。
[0023]進(jìn)一步地,所述規(guī)則是:通過OCR文字識(shí)別到的電子檔案標(biāo)題,與當(dāng)前檔案目錄標(biāo)題進(jìn)行比對(duì),字符相同則認(rèn)定當(dāng)前電子檔案歸屬到該檔案目錄。
[0024]與傳統(tǒng)技術(shù)相比,本發(fā)明提供一種電子檔案掃描識(shí)別建檔的方法及系統(tǒng),能通過普通的IE瀏覽器,實(shí)現(xiàn)一鍵操作,直接操控掃描儀,將紙質(zhì)文檔批量掃描轉(zhuǎn)換為電子檔案,掃描后能自動(dòng)上傳到服務(wù)器,而無需用戶手動(dòng)選擇文件進(jìn)行上傳。上傳的過程中會(huì)采取壓縮的技術(shù),自動(dòng)將電子檔案壓縮成zip包,實(shí)現(xiàn)上傳,從而最大化的提高網(wǎng)絡(luò)性能。上傳到服務(wù)器的文件系統(tǒng)自動(dòng)解壓縮,然后通過服務(wù)器集成OCR (Optical CharacterRecognition,光學(xué)字符識(shí)別)圖片文字識(shí)別技術(shù),將圖片上的文字識(shí)別出來,從而自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄下,通過系統(tǒng)的掃描實(shí)現(xiàn)電子檔案與業(yè)務(wù)實(shí)體的關(guān)聯(lián),實(shí)現(xiàn)建檔。整個(gè)過程是完整的、連續(xù)的,全過程自動(dòng)化完成,不需人員操作,大大降低人力成本,減少建設(shè)時(shí)間。
【專利附圖】
【附圖說明】
[0025]此處所說明的附圖用來提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0026]圖1是本發(fā)明提供一種電子檔案掃描識(shí)別建檔的方法的流程圖。
[0027]圖2是本發(fā)明提供一種電子檔案掃描識(shí)別建檔的系統(tǒng)的物理示意圖。
【具體實(shí)施方式】
[0028]為了使本發(fā)明所要解決的技術(shù)問題、技術(shù)方案及有益效果更加清楚、明白,以下結(jié)合附圖和實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0029]如圖1所示,本發(fā)明提供一種電子檔案掃描識(shí)別建檔的方法,包括:
[0030]步驟1、掃描檔案文件并自動(dòng)存儲(chǔ)到指定目錄,并壓縮所述指定目錄;
[0031]步驟1.1、啟動(dòng)掃描:本發(fā)明是基本瀏覽器進(jìn)行掃描,用戶打開瀏覽器,進(jìn)去相關(guān)系統(tǒng)網(wǎng)頁,單擊掃描按鈕,啟動(dòng)掃描。
[0032]步驟1.2、掃描檔案文件到指定目錄:
[0033]系統(tǒng)采用ActiveX插件控制掃描儀,指令掃描儀掃描檔案文件,并能將掃描完成的電子檔案存儲(chǔ)到指定目錄。
[0034]步驟1.3、掃描完成后自動(dòng)壓縮所述指定目錄:系統(tǒng)ActiveX插件在全部檔案掃描完成后觸發(fā)事件對(duì)所述指定目錄進(jìn)行壓縮。[0035]步驟2、壓縮完成后通過網(wǎng)絡(luò)協(xié)議將壓縮包傳輸?shù)綀D檔服務(wù)器;
[0036]步驟3、圖檔服務(wù)器對(duì)接收到的壓縮文件自動(dòng)解壓縮,并對(duì)解壓后的圖檔進(jìn)行OCR識(shí)別,通過提取圖檔中的文字信息將圖檔按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中,實(shí)現(xiàn)快速歸檔。
[0037]步驟3.1、圖檔服務(wù)器自動(dòng)解壓縮接收到的壓縮文件;
[0038]步驟3.2、對(duì)解壓后的圖檔進(jìn)行OCR識(shí)別,提取圖檔中的文字信息:圖檔服務(wù)器集成OCR文字識(shí)別對(duì)圖檔進(jìn)行文字識(shí)別,提取圖檔中的文字信息。
[0039]步驟3.3、根據(jù)提取到的文字信息將圖檔按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中。
[0040]其中,所述規(guī)則如下:通過OCR文字識(shí)別到的電子檔案標(biāo)題,與當(dāng)前檔案目錄的標(biāo)題進(jìn)行比對(duì),字符相同則認(rèn)定當(dāng)前電子檔案歸屬到該檔案目錄。這里,所述“字符相同”并不要求字符完全相同,當(dāng)字符匹配度在一定比例(這個(gè)比例是可以配置的,例如80%)或以上相同則可以認(rèn)為字符相同。例如,檔案目錄的標(biāo)題是“企業(yè)營業(yè)執(zhí)照”,但OCR識(shí)別掃描出來的標(biāo)題字符為“深圳企業(yè)營業(yè)執(zhí)照”,雖然兩者不是完全一致,但總體一致,也會(huì)認(rèn)為兩者是字符相同。
[0041]如圖2所示,本發(fā)明提供一種電子檔案掃描識(shí)別建檔的系統(tǒng),包括:客戶機(jī)10、掃描儀20、交換機(jī)30、圖檔服務(wù)器40,其中:
[0042]所述客戶機(jī)10,包括具有ActiveX插件的瀏覽器,所述ActiveX插件能控制掃描儀,指令掃描儀掃描檔案文件,將掃描完成的電子檔案存儲(chǔ)到指定目錄,并在全部檔案掃描完成后對(duì)所述指定目錄進(jìn)行壓縮。
[0043]所述掃描儀20,用于根據(jù)客戶機(jī)10的ActiveX插件指令掃描檔案文件。
[0044]所述交換機(jī)30,用于將壓縮完成后的壓縮包通過網(wǎng)絡(luò)協(xié)議傳輸?shù)綀D檔服務(wù)器40 ;
[0045]所述圖檔服務(wù)器40集成OCR文字識(shí)別,用于對(duì)接收到的壓縮文件自動(dòng)解壓縮,并對(duì)解壓后的圖檔進(jìn)行OCR識(shí)別,通過提取圖檔中的文字信息將圖檔按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中。
[0046]下面將結(jié)合具體的實(shí)施案例來詳細(xì)說明本發(fā)明的實(shí)現(xiàn)方式,借此對(duì)本發(fā)明如何應(yīng)用技術(shù)手段來解決實(shí)際業(yè)務(wù)問題。
[0047]本發(fā)明的實(shí)施案例中,以某稅務(wù)局管理某公司歷史納稅檔案為例,需將納稅人的營業(yè)執(zhí)照、合同、法人身份證、納稅清單等原件紙檔案轉(zhuǎn)換成電子檔案并入庫歸檔。
[0048]根據(jù)本發(fā)明提供一種電子檔案快速掃描識(shí)別建檔的方法,包括:
[0049]第一步,圖檔管理員將紙質(zhì)檔案資料放到掃描儀上,可任意順序排放。
[0050]第二步:打開IE瀏覽器,登錄系統(tǒng),查詢到該納稅客戶,點(diǎn)擊掃描按鈕。
[0051]第三步:后續(xù)步驟全由系統(tǒng)自動(dòng)完成。
[0052]a) ActiveX插件會(huì)直接訪問掃描儀,發(fā)送指令,控制掃描儀進(jìn)行批量掃描操作。
[0053]b)將掃描的文件自動(dòng)存儲(chǔ)到客戶機(jī)指定目錄,掃描完成后,將電子檔案文件壓縮成zip包。
[0054]c)通過網(wǎng)絡(luò)協(xié)議傳輸?shù)綀D檔服務(wù)器。
[0055]d)圖檔服務(wù)器接收到文件后進(jìn)行解壓縮。
[0056]e)對(duì)每份圖檔,進(jìn)行OCR圖像文字識(shí)別,身份證類的會(huì)歸類到身份證類下,合同類的會(huì)歸類到合同類下,營業(yè)執(zhí)照類會(huì)歸類到營業(yè)執(zhí)照類下。[0057]f)處理完成后,提示用戶操作成功。
[0058]本發(fā)明提供一種電子檔案掃描識(shí)別建檔的方法及系統(tǒng),能通過普通的IE瀏覽器,實(shí)現(xiàn)一鍵操作,直接操控掃描儀,將紙質(zhì)文檔批量掃描轉(zhuǎn)換為電子檔案,掃描后能自動(dòng)上傳到服務(wù)器,而無需用戶手動(dòng)選擇文件進(jìn)行上傳。上傳的過程中會(huì)采取壓縮的技術(shù),自動(dòng)將電子檔案壓縮成zip包,實(shí)現(xiàn)上傳,從而最大化的提高網(wǎng)絡(luò)性能。上傳到服務(wù)器的文件系統(tǒng)自動(dòng)解壓縮,然后通過服務(wù)器集成OCR圖片文字識(shí)別技術(shù),將圖片上的文字識(shí)別出來,從而自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄下,通過系統(tǒng)的掃描實(shí)現(xiàn)電子檔案與業(yè)務(wù)實(shí)體的關(guān)聯(lián),實(shí)現(xiàn)建檔。整個(gè)過程是完整的、連續(xù)的,全過程自動(dòng)化完成,不需人員操作,大大降低人力成本,減少建設(shè)時(shí)間。
[0059]上述說明示出并描述了本發(fā)明的一個(gè)優(yōu)選實(shí)施例,但如前所述,應(yīng)當(dāng)理解本發(fā)明并非局限于本文所披露的形式,不應(yīng)看作是對(duì)其他實(shí)施例的排除,而可用于各種其他組合、修改和環(huán)境,并能夠在本文所述發(fā)明構(gòu)想范圍內(nèi),通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識(shí)進(jìn)行改動(dòng)。而本領(lǐng)域人員所進(jìn)行的改動(dòng)和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種電子檔案掃描識(shí)別建檔的方法,其特征在于,包括: 步驟1、掃描檔案文件到指定目錄,并壓縮所述指定目錄; 步驟2、壓縮完成后通過網(wǎng)絡(luò)協(xié)議將壓縮包傳輸?shù)綀D檔服務(wù)器; 步驟3、圖檔服務(wù)器自動(dòng)解壓縮接收到的壓縮文件,并對(duì)解壓后的圖檔進(jìn)行OCR識(shí)別,通過提取圖檔中的文字信息將圖檔按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中。
2.如權(quán)利要求1所述的方法,其特征在于,所述步驟I具體包括: 步驟1.1、啟動(dòng)具有ActiveX插件的瀏覽器; 步驟1.2、所述ActiveX插件控制掃描儀掃描檔案文件,并將掃描完成的電子檔案存儲(chǔ)到指定目錄; 步驟1.3、所述ActiveX插件在全部檔案文件掃描完成后自動(dòng)壓縮所述指定目錄。
3.如權(quán)利要求1所述的方法,其特征在于,所述步驟3具體包括: 步驟3.1、圖檔服務(wù)器自動(dòng)解壓縮接收到的壓縮文件; 步驟3.2、對(duì)圖檔進(jìn)行OCR文字識(shí)別,提取圖檔中的文字信息; 步驟3.3、根據(jù)提取到的文字信息將所述圖檔按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中。
4.如權(quán)利要求3所述的方法,其特征在于,所述規(guī)則是:通過OCR文字識(shí)別到的電子檔案標(biāo)題,與當(dāng)前檔案目錄的標(biāo)題進(jìn)行比對(duì),字符相同則認(rèn)定當(dāng)前電子檔案歸屬到該檔案目錄。
5.—種電子檔案掃描識(shí)別建檔的系統(tǒng),其特征在于,包括:客戶機(jī)、掃描儀、交換機(jī)、圖檔服務(wù)器,其中: 所述客戶機(jī),包括具有ActiveX插件的瀏覽器,所述ActiveX插件能控制掃描儀掃描檔案文件,將掃描完成的電子檔案存儲(chǔ)到指定目錄,并在全部檔案掃描完成后對(duì)所述指定目錄進(jìn)行壓縮; 所述掃描儀,用于根據(jù)客戶機(jī)的ActiveX插件指令掃描檔案文件; 所述交換機(jī),用于將壓縮包通過網(wǎng)絡(luò)協(xié)議傳輸?shù)綀D檔服務(wù)器; 所述圖檔服務(wù)器集成OCR文字識(shí)別,自動(dòng)解壓縮接收到的壓縮文件,并對(duì)解壓后的圖檔進(jìn)行OCR識(shí)別,通過提取圖檔中的文字信息將圖檔文件按規(guī)則自動(dòng)關(guān)聯(lián)到對(duì)應(yīng)的檔案目錄中。
6.如權(quán)利要求5所述的系統(tǒng),其特征在于,所述規(guī)則是:通過OCR文字識(shí)別到的電子檔案標(biāo)題,與當(dāng)前檔案目錄的標(biāo)題進(jìn)行比對(duì),字符相同則認(rèn)定當(dāng)前電子檔案歸屬到該檔案目錄。
【文檔編號(hào)】G06K9/20GK103870826SQ201410125970
【公開日】2014年6月18日 申請(qǐng)日期:2014年3月31日 優(yōu)先權(quán)日:2014年3月31日
【發(fā)明者】魯淳 申請(qǐng)人:深圳市遠(yuǎn)行科技有限公司