本發(fā)明涉及圖像處理領(lǐng)域,尤其涉及一種文檔圖像的方向檢測(cè)裝置及方法。
背景技術(shù):
:隨著信息技術(shù)的不斷發(fā)展,對(duì)于文檔圖像的歸檔與識(shí)別的應(yīng)用日益普遍。而對(duì)于文檔圖像的方向檢測(cè)是實(shí)現(xiàn)文檔圖像歸檔與識(shí)別的前提之一。目前,有很多方法被用于文檔圖像的方向檢測(cè)。例如,現(xiàn)有的第一種檢測(cè)方法基于特征的連通域的形狀和位置的分布來(lái)進(jìn)行方向檢測(cè),現(xiàn)有的第二種檢測(cè)方法通過(guò)僅關(guān)注拉丁字符并檢測(cè)特殊的如“i”或“T”的特征來(lái)決定方向;現(xiàn)有的第三種檢測(cè)方法通過(guò)使用光學(xué)字符識(shí)別(OCR,OpticalCharacterRecognition)的識(shí)別結(jié)果進(jìn)行投票來(lái)檢測(cè)方向。應(yīng)該注意,上面對(duì)技術(shù)背景的介紹只是為了方便對(duì)本發(fā)明的技術(shù)方案進(jìn)行清楚、完整的說(shuō)明,并方便本領(lǐng)域技術(shù)人員的理解而闡述的。不能僅僅因?yàn)檫@些方案在本發(fā)明的
背景技術(shù):
部分進(jìn)行了闡述而認(rèn)為上述技術(shù)方案為本領(lǐng)域技術(shù)人員所公知。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的發(fā)明人發(fā)現(xiàn),當(dāng)使用現(xiàn)有的第一種檢測(cè)方法時(shí),由于亞洲語(yǔ)言的手稿包括很多不同形狀的特征集,該方法的魯棒性較差,并且,當(dāng)例如紙張或分辨率等因素導(dǎo)致噪聲水平較高時(shí),基于特征的連通域變得不可靠,從而影響了檢測(cè)精度;現(xiàn)有的第二種檢測(cè)方法存在類似的問(wèn)題;而當(dāng)使用現(xiàn)有的第三種檢測(cè)方法時(shí),如果噪聲文本行的去除功能強(qiáng)大,很多候選的正確文本行被去除,導(dǎo)致可用于投票的文本行很少,檢測(cè)結(jié)果不可靠,另外,由于投票值為整數(shù),因此即使某個(gè)方向的置信度不高,但仍然將值為1的投票投給具有最高置信度的該方向,因此圖像噪聲以及OCR識(shí)別錯(cuò)誤對(duì)檢測(cè)結(jié)果的影響很大。本發(fā)明實(shí)施例提供一種文檔圖像的方向檢測(cè)裝置及方法,根據(jù)文本行與各個(gè)候選 方向上參考樣本的相似度的差值比,設(shè)定對(duì)候選方向進(jìn)行投票的投票值,能夠有效降低噪聲文本行、低質(zhì)量文本行以及不支持的文本行等對(duì)方向檢測(cè)的影響,實(shí)現(xiàn)文檔圖像方向的精確檢測(cè)。根據(jù)本發(fā)明實(shí)施例的第一方面,提供一種文檔圖像的方向檢測(cè)裝置,包括:投票單元,所述投票單元用于對(duì)文檔圖像中的文本行逐行進(jìn)行投票,所述投票單元包括:第一計(jì)算單元,所述第一計(jì)算單元用于計(jì)算當(dāng)前文本行與多個(gè)候選方向上的參考樣本的相似度;選擇單元,所述選擇單元用于在多個(gè)候選方向中選擇兩個(gè)候選方向,其中,當(dāng)前文本行與選擇的所述兩個(gè)候選方向上的參考樣本具有最大相似度以及第二大相似度;第二計(jì)算單元,所述第二計(jì)算單元用于計(jì)算當(dāng)前文本行與選擇的所述兩個(gè)候選方向上的參考樣本的相似度的差值比;加法單元,所述加法單元用于當(dāng)所述差值比大于或等于第一閾值時(shí),將所述兩個(gè)候選方向中與所述最大相似度對(duì)應(yīng)的候選方向的投票值加1,當(dāng)所述差值比小于第一閾值時(shí),將所述兩個(gè)候選方向中與所述最大相似度對(duì)應(yīng)的候選方向的投票值加上所述差值比和與第一閾值相關(guān)的參數(shù)的乘積;所述裝置還包括:確定單元,所述確定單元用于當(dāng)多個(gè)候選方向的投票累計(jì)值中最大投票累計(jì)值與第二大投票累計(jì)值之差大于或等于第二閾值時(shí),將所述文檔圖像的方向確定為多個(gè)候選方向中具有最大投票累計(jì)值的候選方向。根據(jù)本發(fā)明實(shí)施例的第二方面,提供一種文檔圖像的方向檢測(cè)方法,包括:對(duì)文檔圖像中的文本行逐行進(jìn)行投票,其中,對(duì)于每一個(gè)文本行的投票包括:計(jì)算當(dāng)前文本行與多個(gè)候選方向上的參考樣本的相似度;在多個(gè)候選方向中選擇兩個(gè)候選方向,其中,當(dāng)前文本行與選擇的所述兩個(gè)候選方向上的參考樣本具有最大相似度以及第二大相似度;計(jì)算當(dāng)前文本行與選擇的所述兩個(gè)候選方向上的參考樣本的相似度的差值比;當(dāng)所述差值比大于或等于第一閾值時(shí),將所述兩個(gè)候選方向中與所述最大相似度對(duì)應(yīng)的候選方向的投票值加1,當(dāng)所述差值比小于第一閾值時(shí),將所述兩個(gè)候選方向中與所述最大相似度對(duì)應(yīng)的候選方向的投票值加上所述差值比和與第一閾值相關(guān)的參數(shù)的乘積;所述方法還包括:當(dāng)多個(gè)候選方向的投票累計(jì)值中最大投票累計(jì)值與第二大投票累計(jì)值之差大于或等于第二閾值時(shí),將所述文檔圖像的方向確定為多個(gè)候選方向中具有最大投票累計(jì)值的候選方向。本發(fā)明的有益效果在于:根據(jù)文本行與各個(gè)候選方向上參考樣本的相似度的差值比,設(shè)定對(duì)候選方向進(jìn)行投票的投票值,能夠有效降低噪聲文本行、低質(zhì)量文本行以 及不支持的文本行等對(duì)方向檢測(cè)的影響,實(shí)現(xiàn)文檔圖像方向的精確檢測(cè)。參照后文的說(shuō)明和附圖,詳細(xì)公開(kāi)了本發(fā)明的特定實(shí)施方式,指明了本發(fā)明的原理可以被采用的方式。應(yīng)該理解,本發(fā)明的實(shí)施方式在范圍上并不因而受到限制。在所附權(quán)利要求的精神和條款的范圍內(nèi),本發(fā)明的實(shí)施方式包括許多改變、修改和等同。針對(duì)一種實(shí)施方式描述和/或示出的特征可以以相同或類似的方式在一個(gè)或更多個(gè)其它實(shí)施方式中使用,與其它實(shí)施方式中的特征相組合,或替代其它實(shí)施方式中的特征。應(yīng)該強(qiáng)調(diào),術(shù)語(yǔ)“包括/包含”在本文使用時(shí)指特征、整件、步驟或組件的存在,但并不排除一個(gè)或更多個(gè)其它特征、整件、步驟或組件的存在或附加。附圖說(shuō)明所包括的附圖用來(lái)提供對(duì)本發(fā)明實(shí)施例的進(jìn)一步的理解,其構(gòu)成了說(shuō)明書(shū)的一部分,用于例示本發(fā)明的實(shí)施方式,并與文字描述一起來(lái)闡釋本發(fā)明的原理。顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。在附圖中:圖1是本發(fā)明實(shí)施例1的文檔圖像的方向檢測(cè)裝置的結(jié)構(gòu)示意圖;圖2是本發(fā)明實(shí)施例1的印刷文本行的示意圖;圖3是本發(fā)明實(shí)施例1的噪聲文本行的示意圖;圖4是本發(fā)明實(shí)施例1的手寫(xiě)文本行的示意圖;圖5是本發(fā)明實(shí)施例2的電子設(shè)備的結(jié)構(gòu)示意圖;圖6是本發(fā)明實(shí)施例2的電子設(shè)備的系統(tǒng)構(gòu)成的一示意框圖;圖7是本發(fā)明實(shí)施例3的文檔圖像的方向檢測(cè)方法流程圖;圖8是圖7的步驟701中對(duì)于每一個(gè)文本行的投票方法流程圖;圖9是本發(fā)明實(shí)施例4的文檔圖像的方向檢測(cè)方法流程圖。具體實(shí)施方式參照附圖,通過(guò)下面的說(shuō)明書(shū),本發(fā)明的前述以及其它特征將變得明顯。在說(shuō)明書(shū)和附圖中,具體公開(kāi)了本發(fā)明的特定實(shí)施方式,其表明了其中可以采用本發(fā)明的原則的部分實(shí)施方式,應(yīng)了解的是,本發(fā)明不限于所描述的實(shí)施方式,相反,本發(fā)明包 括落入所附權(quán)利要求的范圍內(nèi)的全部修改、變型以及等同物。實(shí)施例1圖1是本發(fā)明實(shí)施例1的文檔圖像的方向檢測(cè)裝置的結(jié)構(gòu)示意圖。圖1所示,該裝置100包括:投票單元101,用于對(duì)文檔圖像中的文本行逐行進(jìn)行投票,投票單元101包括:第一計(jì)算單元102,用于計(jì)算當(dāng)前文本行與多個(gè)候選方向上的參考樣本的相似度;選擇單元103,用于在多個(gè)候選方向中選擇兩個(gè)候選方向,其中,當(dāng)前文本行與選擇的兩個(gè)候選方向上的參考樣本具有最大相似度以及第二大相似度;第二計(jì)算單元104,用于計(jì)算當(dāng)前文本行與選擇的兩個(gè)候選方向上的參考樣本的相似度的差值比;加法單元105,用于當(dāng)該差值比大于或等于第一閾值時(shí),將該兩個(gè)候選方向中與最大相似度對(duì)應(yīng)的候選方向的投票值加1,當(dāng)該差值比小于第一閾值時(shí),將該兩個(gè)候選方向中與最大相似度對(duì)應(yīng)的候選方向的投票值加上該差值比和與第一閾值相關(guān)的參數(shù)的乘積;該裝置100還包括:確定單元106,用于當(dāng)多個(gè)候選方向的投票累計(jì)值中最大投票累計(jì)值與第二大投票累計(jì)值之差大于或等于第二閾值時(shí),將該文檔圖像的方向確定為多個(gè)候選方向中具有最大投票累計(jì)值的候選方向。由上述實(shí)施例可知,根據(jù)文本行與各個(gè)候選方向上參考樣本的相似度的差值比,設(shè)定對(duì)候選方向進(jìn)行投票的投票值,能夠有效降低噪聲文本行、低質(zhì)量文本行以及不支持的文本行等對(duì)方向檢測(cè)的影響,實(shí)現(xiàn)文檔圖像方向的精確檢測(cè)。在本實(shí)施例中,文檔圖像可利用現(xiàn)有的掃描方法對(duì)文檔進(jìn)行掃描而獲得,另外,文檔可以是垂直放置的,也可以是水平放置的。在本實(shí)施例中,文檔圖像的方向與該文檔圖像中文本行的方向相對(duì)應(yīng),其方向包括0度、180度、90度或270度,例如,當(dāng)具有水平文本行的文檔正常放置時(shí),文本行的方向是水平的,即文本行的方向是0度或180度,那么文檔圖像的方向也是0度或180度,當(dāng)該文檔旋轉(zhuǎn)90度或270度放置時(shí),文本行的方向是垂直的,即文本行的方向是90度或270度,那么文檔圖像的方向也是90度或270度。在本實(shí)施例中,投票單元101對(duì)文檔圖像中的文本行逐行進(jìn)行投票,其中,可以 按照文檔圖像中文本行的排列順序逐行進(jìn)行投票,也可以選取部分文本行逐行進(jìn)行投票。在本實(shí)施例中,多個(gè)候選方向可以根據(jù)實(shí)際需要而設(shè)定,多個(gè)候選方向包括至少兩個(gè)候選方向。例如,對(duì)于正常排版的文檔圖像,多個(gè)候選方向可包括0度方向、90度方向、180度方向以及270度方向這四個(gè)候選方向。在本實(shí)施例中,以這四個(gè)候選方向?yàn)槔M(jìn)行示例性的說(shuō)明。在本實(shí)施例中,第一計(jì)算單元102計(jì)算當(dāng)前文本行與多個(gè)候選方向上的參考樣本的相似度。在本實(shí)施例中,該參考樣本為預(yù)先獲得的參考樣本,例如,該參考樣本是標(biāo)準(zhǔn)樣本或者預(yù)先收集的訓(xùn)練樣本。在本實(shí)施例中,多個(gè)候選方向上的參考樣本是指將參考樣本旋轉(zhuǎn)與候選方向相應(yīng)的角度后的參考樣本,例如,多個(gè)候選方向?yàn)?度方向、90度方向、180度方向以及270度方向,那么,0度方向上的參考樣本為原始參考樣本,90度方向上的參考樣本為將原始參考樣本旋轉(zhuǎn)90度后的參考樣本,180度方向上的參考樣本為將原始參考樣本旋轉(zhuǎn)180度后的參考樣本,270度方向上的參考樣本為將原始參考樣本旋轉(zhuǎn)270度后的參考樣本。在本實(shí)施例中,可使用現(xiàn)有方法計(jì)算當(dāng)前文本行與多個(gè)候選方向上的參考樣本的相似度。例如,該相似度可以使用當(dāng)前文本行與參考樣本的平均識(shí)別距離或置信度來(lái)度量,也可以使用各個(gè)方向上確信的字的個(gè)數(shù)來(lái)度量,本發(fā)明實(shí)施例不對(duì)該相似度的度量方法進(jìn)行限制。在本實(shí)施例中,可使用多種方法計(jì)算當(dāng)前文本行與參考樣本的平均識(shí)別距離或置信度。例如,可以基于光學(xué)字符識(shí)別(OCR)的結(jié)果計(jì)算當(dāng)前文本行與參考樣本的平均識(shí)別距離或置信度;可以基于筆畫(huà)的上升和下降、基于筆畫(huà)的朝向或基于筆畫(huà)的垂直分量運(yùn)行(VCR,VerticalComponentRun)計(jì)算當(dāng)前文本行與參考樣本的平均識(shí)別距離或置信度;還可以基于文本行的紋理特征計(jì)算當(dāng)前文本行與參考樣本的平均識(shí)別距離或置信度。其中,當(dāng)前文本行與參考樣本的平均識(shí)別距離越小,則相似度越大,而當(dāng)前文本行與參考樣本的置信度越大,則相似度越大。在本實(shí)施例中,在計(jì)算出當(dāng)前文本行與多個(gè)候選方向上的參考樣本的相似度之后,選擇單元103選擇兩個(gè)候選方向,使得當(dāng)前文本行與選擇的兩個(gè)候選方向上的參 考樣本具有最大相似度以及第二大相似度。在本實(shí)施例中,第二計(jì)算單元104用于計(jì)算當(dāng)前文本行與選擇的兩個(gè)候選方向上的參考樣本的相似度的差值比,其中,該差值比的分子為當(dāng)前文本行與選擇的兩個(gè)候選方向上的參考樣本的相似度之差,該差值為正數(shù);該差值比的分母可以是最大相似度,也可以是第二大相似度,還可以是最大相似度和第二大相似度的平均值。在本實(shí)施例中,該差值比可以是當(dāng)前文本行與選擇的兩個(gè)候選方向上的參考樣本的相似度之差和最大相似度的比值。這樣,能夠進(jìn)一步降低噪聲文本行或低質(zhì)量文本行對(duì)檢測(cè)結(jié)果的影響。在本實(shí)施例中,加法單元105用于當(dāng)該差值比大于或等于第一閾值時(shí),將選擇的兩個(gè)候選方向中與所述最大相似度對(duì)應(yīng)的候選方向的投票值加1,當(dāng)該差值比小于第一閾值時(shí),將選擇的兩個(gè)候選方向中與最大相似度對(duì)應(yīng)的候選方向的投票值加上該差值比和與第一閾值相關(guān)的參數(shù)的乘積。這樣,通過(guò)判斷相似度的差值比是否大于等于第一閾值來(lái)進(jìn)行差別化的投票,并且當(dāng)該差值比小于第一閾值時(shí)的投票值是一個(gè)較小的值,從而能夠保證正確的文本行不被去除并獲得合理的投票,并且,能夠有效降低噪聲文本行、低質(zhì)量文本行以及不支持的文本行等對(duì)方向檢測(cè)的影響。在本實(shí)施例中,還可以具有第一判斷單元(未圖示),用于判斷該差值比是否大于或等于第一閾值,該第一判斷單元可設(shè)置在投票單元101中,也可以設(shè)置在檢測(cè)裝置100中,本發(fā)明實(shí)施例不對(duì)第一判斷單元的位置進(jìn)行限制。在本實(shí)施例中,該第一閾值可根據(jù)實(shí)際需要而設(shè)定。例如,該第一閾值用T1表示,T為0.5以下的數(shù)值,例如T=0.1。在本實(shí)施例中,該與第一閾值相關(guān)的參數(shù)的范圍可根據(jù)實(shí)際需要而設(shè)定,例如,該參數(shù)用C表示,0<C<1/T,T為第一閾值。在本實(shí)施例中,當(dāng)前文本行與選擇的兩個(gè)候選方向上的參考樣本的相似度的差值比用R表示,由于當(dāng)該差值比R<T時(shí)才計(jì)算該差值比R和與第一閾值相關(guān)的參數(shù)C的乘積,而C<1/T,因此,R×C是小于1的數(shù)值。例如,C=1/(2T),此時(shí)R×C是小于0.5的數(shù)值。在本實(shí)施例中,投票單元101對(duì)文檔圖像的各個(gè)文本行逐行進(jìn)行投票,其中對(duì)當(dāng)前文本行進(jìn)行投票時(shí),當(dāng)該差值比R≥T時(shí),加法單元105將兩個(gè)候選方向中與最大 相似度對(duì)應(yīng)的候選方向的投票值V加1,當(dāng)該差值比R<T時(shí),將兩個(gè)候選方向中與最大相似度對(duì)應(yīng)的候選方向的投票值V加R×C。在本實(shí)施例中,確定單元106用于當(dāng)多個(gè)候選方向的投票累計(jì)值中最大投票累計(jì)值與第二大投票累計(jì)值之差大于或等于第二閾值時(shí),將該文檔圖像的方向確定為多個(gè)候選方向中具有最大投票累計(jì)值的候選方向。在本實(shí)施例中,該第二閾值可根據(jù)實(shí)際需要而設(shè)定。例如,該第二閾值為大于等于2的整數(shù),例如該第二閾值取值為2。在本實(shí)施例中,還可以具有第二判斷單元(未圖示),用于判斷多個(gè)候選方向的投票累計(jì)值中最大投票累計(jì)值與第二大投票累計(jì)值之差是否大于或等于第二閾值,該第二判斷單元可設(shè)置在確定單元106中,也可以設(shè)置在檢測(cè)裝置100中,本發(fā)明實(shí)施例不對(duì)第二判斷單元的位置進(jìn)行限制。下面以將文本行與參考樣本的平均識(shí)別距離作為對(duì)相似度的度量為例,對(duì)本實(shí)施例的投票方法進(jìn)行示例性的說(shuō)明。在本實(shí)施例中,將第一閾值T設(shè)為0.1,將第二閾值設(shè)為2,將C設(shè)為1/(2T),即C=5。圖2是本發(fā)明實(shí)施例1的印刷文本行的示意圖。該印刷文本行與0度方向以及180度方向上的參考樣本具有最大相似度以及第二大相似度,表1給出了圖2所示的印刷文本行與0度方向和180方向上的參考樣本的平均識(shí)別距離。表1序號(hào)0度方向的識(shí)別距離180度方向的識(shí)別距離08351040154551421120103837797844816103655735126857908786576084861079910741255105181128111036791平均識(shí)別距離792906由表1可以看出,該印刷文本行與0度方向上的參考樣本具有最小的平均識(shí)別距離,該印刷文本行與180度方向上的參考樣本具有第二小的平均識(shí)別距離,即該印刷文本行與0度方向上的參考樣本具有最大相似度,該印刷文本行與0度方向上的參考樣本具有第二大的相似度。這樣,該印刷文本行與0度方向和180度方向上參考樣本的相似度的差值比R=(906-792)/792≈0.144。那么此時(shí)R>T,將0度方向的投票值V加1。圖3是本發(fā)明實(shí)施例1的噪聲文本行的示意圖。如圖3所示,該文本行并不是一個(gè)實(shí)際的文本行,而是多個(gè)圖形排列形成的文本行。該噪聲文本行與0度方向以及180度方向上的參考樣本具有最大相似度以及第二大相似度,表2給出了圖3所示的噪聲文本行與0度方向和180方向上的參考樣本的平均識(shí)別距離。表2序號(hào)0度方向的識(shí)別距離180度方向的識(shí)別距離015851679115101506216361568316711600平均識(shí)別距離16001588由表2可以看出,該噪聲文本行與180度方向上的參考樣本具有最小的平均識(shí)別距離,該噪聲文本行與0度方向上的參考樣本具有第二小的平均識(shí)別距離,即該噪聲文本行與180度方向上的參考樣本具有最大相似度,該噪聲文本行與0度方向上的參考樣本具有第二大的相似度。這樣,該噪聲文本行與180度方向和0度方向上參考樣本的相似度的差值比R=(1600-1588)/1588≈0.008。那么此時(shí)R<T,R×C=0.008×5=0.04,將180度方向的投票值加上0.04??梢钥闯觯瑘D3所示的噪聲文本行產(chǎn)生的投票值很小,能夠有效降低噪聲文本行對(duì)方向檢測(cè)的影響。圖4是本發(fā)明實(shí)施例1的手寫(xiě)文本行的示意圖。該手寫(xiě)文本行與0度方向以及180度方向上的參考樣本具有最大相似度以及第二大相似度,表3給出了圖4所示的手寫(xiě)文本行與0度方向和180方向上的參考樣本的平均識(shí)別距離。表3序號(hào)0度方向的識(shí)別距離0度方向的識(shí)別距離0106063111137137421224106131267130545091412511595686166759979151490811911067913641431101227139811125514611282310681314008691414781519151450919161141153817138094718103314411912211130205261600平均識(shí)別距離12541283由表3可以看出,該手寫(xiě)文本行與0度方向上的參考樣本具有最小的平均識(shí)別距離,該手寫(xiě)文本行與180度方向上的參考樣本具有第二小的平均識(shí)別距離,即該印刷文本行與0度方向上的參考樣本具有最大相似度,該印刷文本行與0度方向上的參考樣本具有第二大的相似度。這樣,該手寫(xiě)文本行與0度方向和180度方向上參考樣本的相似度的差值比R=(1283-1254)/1254≈0.023。那么此時(shí)R<T,R×C=0.023×5≈0.12,將0度方向的投票值加上0.12。在本實(shí)施例中,假設(shè)文檔圖像的文本行第1行至第3行分別為圖2至圖4所示的文本行,第4-6行重復(fù)圖2至圖4所示的文本行,候選方向?yàn)?度方向、90度方向、180度方向以及270度方向,各個(gè)候選方向的投票初始值均為0。那么,對(duì)第1行進(jìn)行投票時(shí),將0度方向的投票值加1,對(duì)第2行進(jìn)行投票時(shí),將180度方向的投票值加0.04,對(duì)第3行進(jìn)行投票時(shí),將0度方向的投票值加0.12,此時(shí),0度方向的投票累計(jì)值為1.12,180度方向的投票累計(jì)值為0.04,接著對(duì)第4 行進(jìn)行投票,將0度方向的投票值加1,此時(shí)0度方向的投票累計(jì)值為2.12,其與180度方向的投票累計(jì)值之差為2.08,超過(guò)了第二閾值2,此時(shí)停止投票,將文檔圖像的方向確定為0度方向。由上述實(shí)施例可知,根據(jù)文本行與各個(gè)候選方向上參考樣本的相似度的差值比,設(shè)定對(duì)候選方向進(jìn)行投票的投票值,能夠有效降低噪聲文本行、低質(zhì)量文本行以及不支持的文本行等對(duì)方向檢測(cè)的影響,實(shí)現(xiàn)文檔圖像方向的精確檢測(cè)。實(shí)施例2本發(fā)明實(shí)施例還提供了一種電子設(shè)備,圖5是本發(fā)明實(shí)施例2的電子設(shè)備的結(jié)構(gòu)示意圖。如圖5所示,電子設(shè)備500包括文檔圖像的方向檢測(cè)裝置501,其中,文檔圖像的方向檢測(cè)裝置501的結(jié)構(gòu)和功能與實(shí)施例1中的記載相同,此處不再贅述。在本實(shí)施例中,該電子設(shè)備例如是掃描儀。圖6是本發(fā)明實(shí)施例2的電子設(shè)備的系統(tǒng)構(gòu)成的一示意框圖。如圖6所示,電子設(shè)備600可以包括中央處理器601和存儲(chǔ)器602;存儲(chǔ)器602耦合到中央處理器601。該圖是示例性的;還可以使用其它類型的結(jié)構(gòu),來(lái)補(bǔ)充或代替該結(jié)構(gòu),以實(shí)現(xiàn)電信功能或其它功能。如圖6所示,該電子設(shè)備600還可以包括:輸入單元603、顯示器604、電源605。在一個(gè)實(shí)施方式中,實(shí)施例1所述的文檔圖像的方向檢測(cè)裝置的功能可以被集成到中央處理器601中。其中,中央處理器601可以被配置為:對(duì)文檔圖像中的文本行逐行進(jìn)行投票,其中,對(duì)于每一個(gè)文本行的投票包括:計(jì)算當(dāng)前文本行與多個(gè)候選方向上的參考樣本的相似度;在多個(gè)候選方向中選擇兩個(gè)候選方向,其中,當(dāng)前文本行與選擇的所述兩個(gè)候選方向上的參考樣本具有最大相似度以及第二大相似度;計(jì)算當(dāng)前文本行與選擇的所述兩個(gè)候選方向上的參考樣本的相似度的差值比;當(dāng)所述差值比大于或等于第一閾值時(shí),將所述兩個(gè)候選方向中與所述最大相似度對(duì)應(yīng)的候選方向的投票值加1,當(dāng)所述差值比小于第一閾值時(shí),將所述兩個(gè)候選方向中與所述最大相似度對(duì)應(yīng)的候選方向的投票值加上所述差值比和與第一閾值相關(guān)的參數(shù)的乘積;中央處理器601還可以被配置為:當(dāng)多個(gè)候選方向的投票累計(jì)值中最大投票累計(jì)值與第二大投票累計(jì)值之差大于或等于第二閾值時(shí),將所述文檔圖像的方向確定為多個(gè)候選方向中具有最大投票累計(jì)值的候選方向。其中,所述當(dāng)前文本行與選擇的所述兩個(gè)候選方向上的參考樣本的相似度的差值 比是當(dāng)前文本行與選擇的所述兩個(gè)候選方向上的參考樣本的相似度之差和所述最大相似度的比值。其中,所述與第一閾值相關(guān)的參數(shù)C滿足:0<C<1/T,T為所述第一閾值。其中,C=1/(2T),T為所述第一閾值。其中,根據(jù)以下的任一種方法計(jì)算當(dāng)前文本行與多個(gè)候選方向上的參考樣本的相似度:基于光學(xué)字符識(shí)別;基于筆畫(huà)的上升和下降、基于筆畫(huà)的朝向或基于筆畫(huà)的垂直分量運(yùn)行;基于文本行的紋理特征。在另一個(gè)實(shí)施方式中,實(shí)施例1所述的文檔圖像的方向檢測(cè)裝置可以與中央處理器601分開(kāi)配置,例如可以將文檔圖像的方向檢測(cè)裝置配置為與中央處理器601連接的芯片,通過(guò)中央處理器601的控制來(lái)實(shí)現(xiàn)文檔圖像的方向檢測(cè)裝置的功能。在本實(shí)施例中電子設(shè)備600也并不是必須要包括圖6中所示的所有部件。如圖6所示,中央處理器601有時(shí)也稱為控制器或操作控件,可以包括微處理器或其它處理器裝置和/或邏輯裝置,中央處理器601接收輸入并控制電子設(shè)備600的各個(gè)部件的操作。存儲(chǔ)器602,例如可以是緩存器、閃存、硬驅(qū)、可移動(dòng)介質(zhì)、易失性存儲(chǔ)器、非易失性存儲(chǔ)器或其它合適裝置中的一種或更多種。并且中央處理器601可執(zhí)行該存儲(chǔ)器602存儲(chǔ)的該程序,以實(shí)現(xiàn)信息存儲(chǔ)或處理等。其它部件的功能與現(xiàn)有類似,此處不再贅述。電子設(shè)備600的各部件可以通過(guò)專用硬件、固件、軟件或其結(jié)合來(lái)實(shí)現(xiàn),而不偏離本發(fā)明的范圍。由上述實(shí)施例可知,根據(jù)文本行與各個(gè)候選方向上參考樣本的相似度的差值比,設(shè)定對(duì)候選方向進(jìn)行投票的投票值,能夠有效降低噪聲文本行、低質(zhì)量文本行以及不支持的文本行等對(duì)方向檢測(cè)的影響,實(shí)現(xiàn)文檔圖像方向的精確檢測(cè)。實(shí)施例3本發(fā)明實(shí)施例還提供一種文檔圖像的方向檢測(cè)方法,其對(duì)應(yīng)于實(shí)施例1的文檔圖像的方向檢測(cè)裝置。圖7是本發(fā)明實(shí)施例3的文檔圖像的方向檢測(cè)方法流程圖。如圖7所示,該方法包括:步驟701:對(duì)文檔圖像中的文本行逐行進(jìn)行投票;步驟702:當(dāng)多個(gè)候選方向的投票累計(jì)值中最大投票累計(jì)值與第二大投票累計(jì)值之差大于或等于第二閾值時(shí),將文檔圖像的方向確定為多個(gè)候選方向中具有最大投票 累計(jì)值的候選方向。圖8是圖7的步驟701中對(duì)于每一個(gè)文本行的投票方法流程圖。如圖8所示,該方法包括:步驟801:計(jì)算當(dāng)前文本行與多個(gè)候選方向上的參考樣本的相似度;步驟802:在多個(gè)候選方向中選擇兩個(gè)候選方向,其中,當(dāng)前文本行與選擇的兩個(gè)候選方向上的參考樣本具有最大相似度以及第二大相似度;步驟803:計(jì)算當(dāng)前文本行與選擇的兩個(gè)候選方向上的參考樣本的相似度的差值比;步驟804:當(dāng)該差值比大于或等于第一閾值時(shí),將兩個(gè)候選方向中與最大相似度對(duì)應(yīng)的候選方向的投票值加1,當(dāng)該差值比小于第一閾值時(shí),將兩個(gè)候選方向中與最大相似度對(duì)應(yīng)的候選方向的投票值加上該差值比和與第一閾值相關(guān)的參數(shù)的乘積。在本實(shí)施例中,對(duì)每個(gè)文本行進(jìn)行投票的方法與實(shí)施例1中的記載相同,此處不再贅述。由上述實(shí)施例可知,根據(jù)文本行與各個(gè)候選方向上參考樣本的相似度的差值比,設(shè)定對(duì)候選方向進(jìn)行投票的投票值,能夠有效降低噪聲文本行、低質(zhì)量文本行以及不支持的文本行等對(duì)方向檢測(cè)的影響,實(shí)現(xiàn)文檔圖像方向的精確檢測(cè)。實(shí)施例4本發(fā)明實(shí)施例還提供一種文檔圖像的方向檢測(cè)方法,其對(duì)應(yīng)于實(shí)施例1的文檔圖像的方向檢測(cè)裝置。圖9是本發(fā)明實(shí)施例4的文檔圖像的方向檢測(cè)方法流程圖。如圖9所示,該方法包括:步驟901:將文本行的序號(hào)i的初始值設(shè)為1,i為正整數(shù);步驟902:計(jì)算第i文本行與多個(gè)候選方向上的參考樣本的相似度;步驟903:在多個(gè)候選方向中選擇兩個(gè)候選方向,其中,第i文本行與選擇的兩個(gè)候選方向上的參考樣本具有最大相似度以及第二大相似度;步驟904:計(jì)算第i文本行與選擇的兩個(gè)候選方向上的參考樣本的相似度的差值比R;步驟905:判斷該差值比R是否大于或等于第一閾值;當(dāng)判斷結(jié)果為“是”時(shí),進(jìn)入步驟906,當(dāng)判斷結(jié)果為“否”時(shí),進(jìn)入步驟907;步驟906:將兩個(gè)候選方向中與最大相似度對(duì)應(yīng)的候選方向的投票值加1;步驟907:將兩個(gè)候選方向中與最大相似度對(duì)應(yīng)的候選方向的投票值加上該差值比R和與第一閾值相關(guān)的參數(shù)C的乘積;步驟908:判斷多個(gè)候選方向的投票累計(jì)值中最大投票累計(jì)值與第二大投票累計(jì)值之差是否大于或等于第二閾值;當(dāng)判斷結(jié)果為“否”時(shí),進(jìn)入步驟909,當(dāng)判斷結(jié)果為“是”時(shí),進(jìn)入步驟910;步驟909:將文本行的序號(hào)i加1;步驟910:將該文檔圖像的方向確定為多個(gè)候選方向中具有最大投票累計(jì)值的候選方向。在本實(shí)施例中,對(duì)每個(gè)文本行進(jìn)行投票的方法與實(shí)施例1中的記載相同,此處不再贅述。由上述實(shí)施例可知,根據(jù)文本行與各個(gè)候選方向上參考樣本的相似度的差值比,設(shè)定對(duì)候選方向進(jìn)行投票的投票值,能夠有效降低噪聲文本行、低質(zhì)量文本行以及不支持的文本行等對(duì)方向檢測(cè)的影響,實(shí)現(xiàn)文檔圖像方向的精確檢測(cè)。本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)可讀程序,其中當(dāng)在文檔圖像的方向檢測(cè)裝置或電子設(shè)備中執(zhí)行所述程序時(shí),所述程序使得計(jì)算機(jī)在所述文檔圖像的方向檢測(cè)裝置或電子設(shè)備中執(zhí)行實(shí)施例3或?qū)嵤├?所述的文檔圖像的方向檢測(cè)方法。本發(fā)明實(shí)施例還提供一種存儲(chǔ)有計(jì)算機(jī)可讀程序的存儲(chǔ)介質(zhì),其中所述計(jì)算機(jī)可讀程序使得計(jì)算機(jī)在文檔圖像的方向檢測(cè)裝置或電子設(shè)備中執(zhí)行實(shí)施例3或?qū)嵤├?所述的文檔圖像的方向檢測(cè)方法。本發(fā)明以上的裝置和方法可以由硬件實(shí)現(xiàn),也可以由硬件結(jié)合軟件實(shí)現(xiàn)。本發(fā)明涉及這樣的計(jì)算機(jī)可讀程序,當(dāng)該程序被邏輯部件所執(zhí)行時(shí),能夠使該邏輯部件實(shí)現(xiàn)上文所述的裝置或構(gòu)成部件,或使該邏輯部件實(shí)現(xiàn)上文所述的各種方法或步驟。本發(fā)明還涉及用于存儲(chǔ)以上程序的存儲(chǔ)介質(zhì),如硬盤(pán)、磁盤(pán)、光盤(pán)、DVD、flash存儲(chǔ)器等。以上結(jié)合具體的實(shí)施方式對(duì)本發(fā)明進(jìn)行了描述,但本領(lǐng)域技術(shù)人員應(yīng)該清楚,這些描述都是示例性的,并不是對(duì)本發(fā)明保護(hù)范圍的限制。本領(lǐng)域技術(shù)人員可以根據(jù)本發(fā)明的精神和原理對(duì)本發(fā)明做出各種變型和修改,這些變型和修改也在本發(fā)明的范圍內(nèi)。當(dāng)前第1頁(yè)1 2 3