欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種電子圖檔拆分方法

文檔序號:6470224閱讀:277來源:國知局
專利名稱:一種電子圖檔拆分方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種電子圖檔拆分方法,尤其涉及基于圖簽定位的電子圖檔拆分方法。
背景技術(shù)
隨著計算機輔助設(shè)計(CAD)技術(shù)的普及,電子圖檔在很多方面取代紙質(zhì)圖紙,成為了重要的設(shè)計信息的傳遞媒介。電子圖檔相對于紙質(zhì)的圖紙,更環(huán)保、信息傳輸速度更快、而且方便再利用。因此,越來越多的設(shè)計企業(yè)開始重視電子圖檔的歸檔和收集工作,并開始建立電子圖檔管理系統(tǒng)。
為了便于檔案管理系統(tǒng)進行分類和檢索,大多數(shù)電子檔案管理系統(tǒng)要求一個電子圖檔里面只含一張圖紙的資料。但是,設(shè)計人員在實際工作過程中,為了參考方便,往往把一個工程的所有圖紙都畫在一個電子圖檔里面。這給歸檔工作帶來很大麻煩,檔案管理人員不得不打開每個電子圖檔,檢查其中是否有多個獨立的圖。如果有,必須手工地一張一張拆分出來進行保存。有的電子圖檔里面含有多達20多張圖紙的內(nèi)容,這種拆分工作無疑會耗費相當多的時間,而且拆分過程中比較容易出現(xiàn)錯誤,使得存檔資料不準確。
于是人們使用計算機自動處理的過程,來分析和拆分具有多張圖紙內(nèi)容的電子圖檔。該過程需要分析和識別電子圖檔的兩個普遍特征-圖框和圖簽,如圖l所示。所有正式打印的圖紙,都有一個矩形框作為邊線,這種邊線稱為"圖框"。在圖框的一個角落,有一個描述表格,記錄圖紙的工程、編號、設(shè)計者等設(shè)計信息,稱為"圖簽"。
以上過程可以在計算機中完成,中央處理單元在操作上連接到一個存儲設(shè)備, 一個控制器, 一個輸入設(shè)備和一個輸出設(shè)備。使用存儲設(shè)備來存儲處理過程中用到的直線和文字,以及適用于各種電子圖檔的相應(yīng)匹配規(guī)則。中央處理單元對電子圖檔進行預(yù)處理,即讀取文字和直線的信息,進行篩選、排序等,從存儲器獲得可用的匹配規(guī)則,逐一嘗試,然后對匹配結(jié)果進行篩選和處理,并且利用這個結(jié)果對圖檔進行拆分,得到最終的提取結(jié)果。
對電子圖檔進行自動拆分的工作已經(jīng)有一些研究成果和應(yīng)用。這些研究通過分析圖框的特征來實現(xiàn)拆分。圖框的特征包括長度和寬度的數(shù)值、長寬比例等。為了打印的需要,圖框的長度和寬度往往調(diào)整為打印紙張的大小或整數(shù)
^f咅。如A3紙為420mm x 297mm,許多A3圖框的長寬是420 x 297,或42000 x 29700。A0 A6規(guī)格的打印紙張,其長寬比都為1.4142: 1。另外,圖框之間往往是分離的。這些特征,被用作為拆分的依據(jù)。
但是,以圖框的上述特征作為依據(jù)并不可靠。首先,并不是所有的矩形框都是圖框有一些游離于圖框之外的矩形框,里面包含表格或其它內(nèi)容。其次并不是所有的圖框的長度和寬度都是打印紙張的整數(shù)倍。很多設(shè)計人員為了節(jié)省打印紙張,將多張小圖幅的圖拼在一張大圖幅的圖里面一起打印。比如4張等于或小于A3的圖紙拼裝為一張A2的圖紙。因為打印是以大圖幅的尺寸為準,所以小圖幅的圖框的數(shù)值不一定是打印紙張尺寸的整數(shù)倍,可能是一個隨意的數(shù)值。另外,因為各種需要,有時候在同一張圖里面也可能會出現(xiàn)繪圖比例相差較大的圖紙,比如一個是l: IO繪圖,圖框大小為4200 x 2970;另外一個為1: 100,圖框大小為42000 x 29700。因此,根據(jù)邊長的大小或比例來判斷圖框是不可靠的,有可能會辨認出一些無效的圖框,也有可能會丟失一些有效的圖框。進一步的,圖框"相互之間分離"的特征同樣不可靠。有的設(shè)計人員喜歡把幾個圖框緊密的排放在一起。這時就無法找到一個分離的、完整的圖框。由此可見,依靠圖框的特征來進行拆分,存在許多風險。
另外,判斷出圖框需要耗費相當多的直線求交的運算量,導(dǎo)致拆圖效率不高。因為在電子圖檔中最多的元素是直線, 一個普通的圖都往往有2000 -20000條直線,如果是含有多個圖框,直線數(shù)量達到100000以上都是很正常的。這么多的直線通過求交運行來獲得幾個合適的矩形,運算量非常大。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足之處,公開一種電子圖檔的拆分方法,基于圖簽定位來分析電子圖檔,能大大提高拆分的有效性,并且有很高的執(zhí)行效率。
本發(fā)明公開的一種電子圖檔拆分方法,用于拆分包含至少一張圖紙的所述
電子圖檔,成為至少一個分別包含其中一張圖紙的電子文件;包括如下步驟
第一步,建立包括圖簽的特征關(guān)鍵字及其在所述圖紙中的位置的圖簽特征模板;
第二步,讀取所述電子圖檔中的文字和直線的內(nèi)容和位置,建立圖檔數(shù)據(jù)
庫;
第三步,根據(jù)所述圖簽特征模板在所述圖檔數(shù)據(jù)庫中進行搜索,找出全部圖簽;再針對每一個所述圖簽,分別進行如下操作
第四步,在所述圖檔數(shù)據(jù)庫中,在所述圖簽的上、下、左、右四個方向進行搜索,找出全部包含所述圖簽的所有矩形;
第五步,在所述全部包含所述圖簽的所有矩形中,選擇不包含其他圖簽的所有矩形為候選圖框,以所述候選圖框中最大的矩形為邊界,拆分所述電子圖檔。
本發(fā)明還包括如下從屬技術(shù)特征所述圖簽特征模板中還包括圖簽的圖案;還建立包括多個不同的所述圖簽特征才莫板的圖簽特征模板庫。在所述第二步中,建立所述圖檔數(shù)據(jù)庫之前,還對所述文字和直線根據(jù)其位置排序。
假設(shè)與所述每一 個圖簽匹配的所述圖框的四條邊,從右到左分別為直線A 、直線B、直線C、和直線D;所述第四步細化成如下步驟根據(jù)所述圖簽特征模板,制定搜索范圍;
(1)在所述搜索范圍內(nèi),按照從右至左的方向,每次取一根垂直的直線作為直線A;
(2) 在所述搜索范圍內(nèi),按照由近至遠的順序,每次取一條和直線A相交,且交點在所述圖簽范圍上方的水平關(guān)聯(lián)直線B;
(3) 在所述搜索范圍內(nèi),按照由近至遠的順序,每次取一條和直線A相交,且交點在所述圖簽范圍下方的水平關(guān)聯(lián)直線C;
(4) 在所述搜索范圍內(nèi),按照由近至遠的順序,每次取一條同時相交于兩條所述水平關(guān)聯(lián)直線B和水平關(guān)聯(lián)直線C,且交點在基線左側(cè)的直線D,由此得到一個矩形;
(5) 重復(fù)上述步驟,獲得全部包含所述圖簽的所有矩形。
然后,在所述全部包含所述圖簽的所有矩形中,每次取出一個所述矩形判斷其中是否包含其它圖簽,否,則得到一個候選圖框;是,則繼續(xù)判斷其他矩形,這樣分別判斷所述所有矩形從而得到所有的候選圖框;以所述候選圖框中最大的矩形為邊界,拆分所述電子圖檔。
本發(fā)明由于以圖簽作為參照,不受圖框大小、比例的限制,多個圖框之間是否相連,也不會影響拆圖的結(jié)果,能大大提高拆分的有效性,并且有很高的執(zhí)行效率。


圖1是電子圖檔的圖框和圖簽的示意圖。
圖2是本發(fā)明的基于圖簽定位的電子圖檔拆分流程圖。
圖3是本發(fā)明搜索圖框用到的直線的示意圖。
圖4是根據(jù)圖簽范圍尋找圖框的流程圖。
具體實施例方式
下面結(jié)合附圖和具體實施方式
對本發(fā)明做進一步詳細說明。本發(fā)明首先利用一定的規(guī)則,獲取圖檔中的圖簽的大致位置和內(nèi)容。然后
7根據(jù)圖簽,找到包含圖簽特征文字的圖框,再根據(jù)圖框位置,把圖紙內(nèi)容逐一 分離出來。
本發(fā)明提出一種基于圖簽定位的拆分方法,能大大提高拆分的有效性,并 且有很高的執(zhí)行效率。圖簽和圖框在圖紙中是——對應(yīng)的,而圖簽的位置是更 穩(wěn)定可靠的判斷依據(jù)。 一般的設(shè)計單位都有自己特定的圖簽格式,并用模板固 定下來。雖然在實際應(yīng)用中圖簽會產(chǎn)生一些變化,如形狀拉伸或者格子移位, 但是圖簽中總存在若干特征關(guān)鍵字或圖案,這些特征是相對固定的。找到這些 特征后,再以圖簽范圍為基準,就能找到包含圖簽的圖框。考慮到一些企業(yè)的 電子圖檔存在多種格式的圖簽(如房地產(chǎn)開發(fā)商),本發(fā)明提供開放式的圖簽特 征庫,用戶可以不斷添加各種圖簽的特征。
由于以圖簽作為參照,本發(fā)明不受圖框大小、比例的限制,多個圖框之間 是否相連,也不會影響拆圖的結(jié)果。
基于圖簽定位的電子圖檔拆分過程如圖2所示,總結(jié)如下
(6) 收集和匯總各類圖簽的特征(圖案或關(guān)鍵字,以及圖簽在圖紙中 的大致范圍)。
(7) 讀取電子圖檔中的文字和直線的內(nèi)容和位置,并根據(jù)該文字和直 線的位置進行排序。
(8) 根據(jù)圖簽特征模板在該文字和直線中進行搜索和定位,獲得若干 個圖簽信息。
(9) 取出一個圖簽。
(10) 根據(jù)模板,獲得圖簽在圖中的大致范圍。
(11) 以該特征為基準,在上、下、左、右四個方向進行搜索,搜索包 含該圖簽的所有矩形。
(12) 取出一個搜索到的矩形。
(13) 判斷該矩形是否包含其它圖簽,否,則得到包圍該圖簽文字、但 不包含其它圖簽文字的矩形,即為一個候選圖框。是,則根據(jù)是否還有其他矩 形,重復(fù)第(7)和第(8)步,得到所有的候選圖框。(14) 在所有的候選圖框中,選取一個最大的,作為尋找的包含該圖簽
的圖框。
(15) 判斷是否還有其它圖簽,是,則重復(fù)第(4)步到第(9)步,直 至找出全部圖框。
(16) 根據(jù)找到的圖框,對電子圖檔進行拆分。 下面說明以圖簽范圍為基準,搜索圖框的過程。為了得到準確的結(jié)果,需
要以圖簽位置為基準,在上、下、左、右四個方向進行搜索。每個方向的搜索 算法類似,下面以自右向左的搜索為例說明,參見圖3和圖4:
(1) 根據(jù)模板和尋找到的圖簽特征,計算出每個圖簽在整圖中的大致 范圍,作為搜索范圍。
(2) 在搜索范圍內(nèi),按照從右至左的方向,每次取一根垂直的直線作為 基線(直線A )。
(3) 根據(jù)直線的上下端點,和圖簽對應(yīng)的范圍,決定兩端關(guān)聯(lián)直線的 搜索范圍。
(4) 按照由近至遠的順序,循環(huán)取兩條關(guān)聯(lián)的直線,保證這兩條直線 和基線相交(直線B、 C)。
(5) 循環(huán)取出所有和上述兩根關(guān)聯(lián)直線都相交,且交點在基線左邊的 直線(直線D),從而形成一個矩形。
(6) 判斷該矩形是否包含該圖簽的文字或特征圖案,但不包括其它圖 簽的文字或特征圖案。
(7 ) 如果判斷通過,則把該矩形作為一個候選的矩形。
如圖4所示,是根據(jù)圖簽范圍尋找圖框的流程圖,包括如下步驟 (1)根據(jù)模板和尋找到的圖簽特征,計算出每個圖簽在整圖中的大致范圍,作 為搜索范圍。
(2 )在搜索范圍內(nèi),按照從右至左的方向,每次取一根垂直的直線作為基線(直 線A)。(3) 根據(jù)基線的上下端點,和圖簽對應(yīng)的范圍,決定兩端關(guān)聯(lián)直線的搜索范圍。
(4) 按照由近至遠的順序,每次取一條和基線相交,且交點在圖簽范圍上方的 水平關(guān)聯(lián)直線B。
(5) 按照由近至遠的順序,每次取一條和基線相交,且交點在圖簽范圍下方的 水平關(guān)聯(lián)直線。
(6) 按照由近至遠的順序,每次取一條和兩條關(guān)聯(lián)直線均相交,且交點在基線 左側(cè)的直線(直線D),由此形成一個矩形
(7) 作為一個候選圖框保存。
(8) 判斷是否還有其它符合條件的直線D,是,則返回步驟(6);否,則進入 下一步。
(9) 判斷是否還有其它符合條件的直線C,是,則返回步驟(5);否,則進入 下一步。
(10) 判斷是否還有其它符合條件的直線B,是,則返回步驟(4);否,則 進入下一步。
(11) 判斷是否還有其它符合條件的直線A,是,則返回步驟(3);否,則 本次搜索過程結(jié)束。
權(quán)利要求
1.一種電子圖檔拆分方法,用于拆分包含至少一張圖紙的所述電子圖檔,成為至少一個分別包含其中一張圖紙的電子文件;其特征在于,包括如下步驟第一步,建立包括圖簽的特征關(guān)鍵字及其在所述圖紙中的位置的圖簽特征模板;第二步,讀取所述電子圖檔中的文字和直線的內(nèi)容和位置,建立圖檔數(shù)據(jù)庫;第三步,根據(jù)所述圖簽特征模板在所述圖檔數(shù)據(jù)庫中進行搜索,找出全部圖簽;再針對每一個所述圖簽,分別進行如下操作第四步,在所述圖檔數(shù)據(jù)庫中,在所述圖簽的上、下、左、右四個方向進行搜索,找出全部包含所述圖簽的所有矩形;第五步,在所述全部包含所述圖簽的所有矩形中,選擇不包含其他圖簽的所有矩形為候選圖框,以所述候選圖框中最大的矩形為邊界,拆分所述電子圖檔。
2. 如權(quán)利要求l所述的電子圖檔拆分方法,:其特征在于,所述圖簽特征模板中還包括圖簽的圖案。
3. 如權(quán)利要求2所述的電子圖檔拆分方法,其特征在于,在所述第一步之前,建立包括多個不同的所述圖簽特征模板的圖簽特征模板庫,所述第一步替換為在所述圖簽特征模板庫中選擇適當?shù)膱D簽特征才莫板。
4. 如權(quán)利要求l所述的電子圖檔拆分方法,其特征在于,在所述第二步中,建立所述圖檔數(shù)據(jù)庫之前,還對所述文字和直線根據(jù)其位置排序。
5. 如權(quán)利要求4所述的電子圖檔拆分方法,其特征在于,^i設(shè)與所述每一個圖簽匹配的所述圖框的四條邊,從右到左分別為直線A、直線B、直線C、和直線D;所述第四步細化成如下步驟根據(jù)所述圖簽特征模板,制定搜索范圍;(1) 在所述搜索范圍內(nèi),按照從右至左的方向,每次取一根垂直的直線作為直線A;(2) 在所述搜索范圍內(nèi),按照由近至遠的順序,每次取一條和直線A相交,且交點在所述圖簽范圍上方的水平關(guān)聯(lián)直線B;(3) 在所述搜索范圍內(nèi),按照由近至遠的順序,每次取一條和直線A相交,且交點在所述圖簽范圍下方的水平關(guān)聯(lián)直線C;(4) 在所述搜索范圍內(nèi),按照由近至遠的順序,每次取一條同時相交于兩條所述水平關(guān)聯(lián)直線B和水平關(guān)聯(lián)直線C,且交點在直線A左側(cè)的直線D,由此得到一個矩形;(5) 重復(fù)上述步驟,獲得全部包含所述圖簽的所有矩形。
6.如權(quán)利要求5所述的電子圖檔拆分方法,其特征在于,所述第五步細化成如下步驟首先,在所述全部包含所述圖簽的所有矩形中,每次取出一個所述矩形判斷其中是否包含其它圖簽,否,則得到一個候選圖框;是,則繼續(xù)判斷其他矩形,這樣分別判斷所述所有矩形從而得到所有的候選圖框;以所述候選圖框中最大的矩形為邊界,拆分所述電子圖檔。
全文摘要
本發(fā)明公開了一種電子圖檔拆分方法,用于拆分包含至少一張圖紙的電子圖檔成為只包含一張圖紙的電子文件;包括建立包括圖簽的特征關(guān)鍵字及其在所述圖紙中的位置的圖簽特征模板;讀取所述電子圖檔中的文字和直線的內(nèi)容和位置,建立圖檔數(shù)據(jù)庫;根據(jù)所述圖簽特征模板在所述圖檔數(shù)據(jù)庫中進行搜索,找出全部圖簽;在所述圖檔數(shù)據(jù)庫中,在所述圖簽的上、下、左、右四個方向進行搜索,找出全部包含所述圖簽的所有矩形;在所述全部包含所述圖簽的所有矩形中,選擇不包含其他圖簽的所有矩形為候選圖框,以所述候選圖框中最大的矩形為邊界,拆分所述電子圖檔。本發(fā)明以圖簽作為參照,不受圖框大小、比例和間距的限制,有效性和執(zhí)行效率高。
文檔編號G06K9/64GK101673347SQ200810216140
公開日2010年3月17日 申請日期2008年9月12日 優(yōu)先權(quán)日2008年9月12日
發(fā)明者黃天祥 申請人:緯衡浩建科技(深圳)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
利辛县| 三台县| 英德市| 张家川| 长沙县| 揭东县| 宜阳县| 扎鲁特旗| 扬中市| 望奎县| 大英县| 遂昌县| 上思县| 磐石市| 灵台县| 沾化县| 玉田县| 娱乐| 行唐县| 探索| 犍为县| 镇康县| 当阳市| 惠安县| 五河县| 当涂县| 南华县| 岫岩| 鹤山市| 大理市| 洛川县| 凯里市| 赤峰市| 大埔县| 益阳市| 宁德市| 通化县| 百色市| 宜良县| 石楼县| 施甸县|