本發(fā)明涉及智能審圖,具體涉及一種水利工程智能審圖方法及系統(tǒng)。
背景技術(shù):
::1、隨著制圖軟件的廣泛應(yīng)用,在水利行業(yè)中存在有大量的工程圖紙,如何快速對(duì)現(xiàn)有圖紙進(jìn)行信息提取和檢索查詢,己成為迫切需要解決的問題。目前主要是通過人工比對(duì)的方式對(duì)數(shù)據(jù)庫(kù)中的圖紙進(jìn)行查找,流程繁瑣同時(shí)效率較低。近年來,ai智能審圖在建筑行業(yè)中得到了快速發(fā)展。例如,深圳市住房和建設(shè)局與萬(wàn)翼科技共同研發(fā)的ai審圖系統(tǒng)。ai審圖系統(tǒng)在處理同一批圖紙時(shí),發(fā)現(xiàn)的問題數(shù)量和速度是人工的數(shù)倍,而成本僅為人力的1/10。更重要的是,ai審圖系統(tǒng)具有持續(xù)學(xué)習(xí)的算法能力,隨著積累的數(shù)據(jù)越來越多,其審查的質(zhì)量和效率也將不斷提升。2、水利工程是國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展的重要基礎(chǔ)設(shè)施,其地位和重要性不言而喻。水利工程在防洪、抗旱、供水、發(fā)電、航運(yùn)、灌溉等方面發(fā)揮著舉足輕重的作用。水閘作為水利工程的重要組成部分,其設(shè)計(jì)質(zhì)量直接關(guān)系到工程的安全運(yùn)行和效益。水閘設(shè)計(jì)圖紙審查是水利工程領(lǐng)域的重要環(huán)節(jié),傳統(tǒng)的人工審查方式存在效率低、易出錯(cuò)等問題,同時(shí)在特異性較強(qiáng)的水利行業(yè)ai審圖系統(tǒng)還尚未得到應(yīng)用。隨著人工智能技術(shù)的快速發(fā)展,將人工智能應(yīng)用于水閘設(shè)計(jì)圖紙審查成為可能。3、因此本發(fā)明提出一種水利工程智能審圖方法及系統(tǒng),來提高我國(guó)水閘工程中的建設(shè)效率,降低建設(shè)成本,規(guī)范施工圖紙,減少錯(cuò)誤,保障江河湖泊的安瀾。技術(shù)實(shí)現(xiàn)思路1、針對(duì)上述存在的缺陷和問題,本發(fā)明提供一種水利工程智能審圖方法及系統(tǒng),采用計(jì)算機(jī)視覺、深度學(xué)習(xí)、大語(yǔ)言模型等技術(shù),實(shí)現(xiàn)對(duì)水閘設(shè)計(jì)圖紙的自動(dòng)化審查,提高水閘設(shè)計(jì)圖紙的審查效率和準(zhǔn)確性,提高設(shè)計(jì)質(zhì)量,確保水利工程的安全運(yùn)行。2、本發(fā)明解決其技術(shù)問題所采用的方案是:一種水利工程智能審圖方法,包括以下步驟:3、s1、圖紙文件轉(zhuǎn)換,通過cad二次開發(fā)實(shí)現(xiàn)pdf/dxf格式生成,再利用python將pdf文件轉(zhuǎn)化為jpg文件,并對(duì)圖像預(yù)處理;4、s2、目標(biāo)結(jié)構(gòu)檢測(cè):通過以yolov5為基礎(chǔ)算法目標(biāo)檢測(cè),對(duì)于水閘圖紙的閘室底板、鋪蓋、消力池、海漫、防沖槽和圖框信息進(jìn)行識(shí)別,準(zhǔn)確識(shí)別出圖紙上水閘各部件及其位置并產(chǎn)生文本框,輸出文本框置信度及其四角坐標(biāo)和中心坐標(biāo);5、s3、圖紙ocr識(shí)別:對(duì)jpg圖像進(jìn)行預(yù)處理,然后對(duì)保存的jpg文件做切片處理工作,使用paddleocr工具對(duì)切分后的子區(qū)域進(jìn)行ocr識(shí)別,在識(shí)別過程中,paddleocr會(huì)分析圖像中的文本內(nèi)容,并返回每個(gè)可識(shí)別文本的位置及對(duì)應(yīng)的內(nèi)容,這一步驟將圖像中的文本信息轉(zhuǎn)化為可編輯、可搜索的文本數(shù)據(jù);6、s4、數(shù)據(jù)匹配與驗(yàn)證:根據(jù)ocr識(shí)別的文本框中心x坐標(biāo)與目標(biāo)檢測(cè)的中心x坐標(biāo)進(jìn)行匹配驗(yàn)證,通過計(jì)算兩者之間的誤差值,并與預(yù)設(shè)的誤差容忍范圍進(jìn)行比較,判斷原理是文本框的位置標(biāo)注是否符合居中規(guī)范,如果誤差在容忍范圍內(nèi),則認(rèn)為匹配成功,數(shù)據(jù)標(biāo)注準(zhǔn)確,如果誤差超出容忍范圍,則報(bào)告錯(cuò)誤;7、s5、解析cad文件,首先檢測(cè)框坐標(biāo)映射,找到j(luò)pg格式圖像與dxf文件坐標(biāo)系的映射關(guān)系,然后cad數(shù)據(jù)文件格式分析以及dxf文件數(shù)據(jù)提取。8、s6、相關(guān)庫(kù)的構(gòu)建:構(gòu)建專家經(jīng)驗(yàn)庫(kù)和知識(shí)庫(kù),存儲(chǔ)圖紙信息,并利用ai技術(shù)對(duì)設(shè)計(jì)規(guī)范進(jìn)行解譯,實(shí)現(xiàn)規(guī)范的自動(dòng)匹配;9、s7、智能審查:通過以自然語(yǔ)言模型為核心的智能審圖體系對(duì)圖紙進(jìn)行審查。10、進(jìn)一步的,所述s1中圖紙文件轉(zhuǎn)換由以下步驟完成:11、(1)cad二次開發(fā)自動(dòng)出圖12、1)開發(fā)環(huán)境準(zhǔn)備13、選擇合適的集成開發(fā)環(huán)境(ide),安裝autocad的.net開發(fā)包;14、2)設(shè)置項(xiàng)目15、在visual?studio中創(chuàng)建一個(gè)新的類庫(kù)項(xiàng)目或windows窗體應(yīng)用程序項(xiàng)目,引用autocad的.net庫(kù),以便在代碼中訪問autocad的api;16、3)選擇裁剪范圍17、提供一個(gè)用戶界面,用戶通過鼠標(biāo)選擇裁剪區(qū)域,通過重寫autocad的命令或創(chuàng)建一個(gè)新的命令來實(shí)現(xiàn),捕獲用戶選擇的裁剪區(qū)域的邊界;18、4)提取范圍內(nèi)的實(shí)體19、遍歷圖紙中的所有實(shí)體,檢查它們是否與裁剪區(qū)域相交或完全位于裁剪區(qū)域內(nèi),使用autocad的dbdictionary、blocktable、layertable來訪問圖紙中的不同元素,對(duì)于每個(gè)實(shí)體,使用boundingbox或geometricextents屬性來確定其位置,并與裁剪區(qū)域進(jìn)行比較,將符合條件的實(shí)體收集起來,準(zhǔn)備用于后續(xù)操作;20、5)生成pdf和dxf文件21、調(diào)用plottofile方法導(dǎo)出為pdf文件,并通過調(diào)用autocad的saveas方法并指定dxf作為文件類型來實(shí)現(xiàn);22、(2)pdf轉(zhuǎn)jpg過程,通過python編程實(shí)現(xiàn),安裝必要的python庫(kù),pdf2image、pillow、numpy,pdf2image用于pdf到圖像的轉(zhuǎn)換,pillow用于圖像處理,利用os庫(kù)的walk函數(shù)深入遍歷指定文件夾及其所有子文件夾中的每個(gè)目錄,通過os.path子庫(kù),可以操作和處理文件路徑,使用pillow庫(kù)的image類來調(diào)整圖像的大小和分辨率,確保輸出圖像的像素;23、進(jìn)一步的,所述s2中采用以yolov5為基礎(chǔ)算法的目標(biāo)檢測(cè)模型,在最開始yolo算法將輸入的圖像分割為sxs個(gè)網(wǎng)格單元格,每個(gè)單元格預(yù)測(cè)b個(gè)邊界(bounding?box)和每個(gè)邊界框的置信度(confidence),并使用卷積神經(jīng)網(wǎng)絡(luò)(cnn)作為特征提取網(wǎng)絡(luò)從輸入圖像中提取特征,以便后續(xù)用于目標(biāo)檢測(cè),對(duì)于每個(gè)網(wǎng)格單元格,每個(gè)邊界框預(yù)測(cè)包含的目標(biāo)的類別概率和邊界框的坐標(biāo)信息。24、進(jìn)一步的,所述s5中,jpg格式圖像與dxf文件坐標(biāo)系的映射關(guān)系通過以下方法尋找,jpg格式圖像的坐標(biāo)系原點(diǎn)為圖像的左上角x軸向右,y軸向下;cad坐標(biāo)系(dwg/dxf)的原點(diǎn)在圖紙的邊緣,x軸向右,y軸向上,對(duì)于圖像坐標(biāo)系中的任一點(diǎn)(ximage,yimage),轉(zhuǎn)換到cad坐標(biāo)系中的點(diǎn)(xcad,ycad)可以通過以下公式進(jìn)行:25、xcad=ximage×scale+xoffset?????????(1)26、ycad=(heightimage-yimage)×scale+yoffset????(2)27、其中:scale—比例尺,xoffset和yoffset—cad坐標(biāo)相對(duì)圖像坐標(biāo)的偏移量,heightimage—圖像高度。28、進(jìn)一步的,所述s4中數(shù)據(jù)的匹配方式如下:首先分別提取目標(biāo)檢測(cè)和ocr識(shí)別的文本框坐標(biāo),計(jì)算其中心點(diǎn)的x坐標(biāo),找到兩個(gè)坐標(biāo)框上下水平中點(diǎn),若在一定誤差下兩個(gè)中點(diǎn)的橫坐標(biāo)相等,即兩個(gè)坐標(biāo)框中心點(diǎn)所在x軸重合時(shí),則判定該文本框與目標(biāo)檢測(cè)框匹配,同時(shí)限定中點(diǎn)縱坐標(biāo),只在目標(biāo)檢測(cè)框下方一定距離進(jìn)行尋找文本框,防止匹配錯(cuò)誤;如果誤差在容忍范圍內(nèi),則顯示匹配成功,并輸出部件名稱及其對(duì)應(yīng)標(biāo)注數(shù)據(jù);如果誤差超出容忍范圍,則報(bào)告錯(cuò)誤,并可能指出可能的違規(guī)原因。29、進(jìn)一步的,所述s1中預(yù)處理圖像的方式為:首先將轉(zhuǎn)換過來的jpg文件轉(zhuǎn)換為灰度(黑白)圖像,然后使用imageenhance.contrast增強(qiáng)圖像的對(duì)比度,接著應(yīng)用imagefilter.sharpen來銳化圖像,再后應(yīng)用imagefilter.smooth_more嘗試減少圖像的顆粒感,接下來使用空域微分法處理,采用sobel算子對(duì)jpg圖紙進(jìn)行邊緣檢測(cè),突出圖像中的文本框邊界,最后處理后的圖像以黑白jpg格式進(jìn)行保存并進(jìn)入下一步處理。30、進(jìn)一步的,所述s6中,專家經(jīng)驗(yàn)庫(kù)的構(gòu)建包括word?embedding(詞嵌入向量)、經(jīng)驗(yàn)庫(kù)提取以及經(jīng)驗(yàn)庫(kù)的擴(kuò)充;知識(shí)庫(kù)由以下兩個(gè)方案構(gòu)建:方案一:向量數(shù)據(jù)庫(kù),將規(guī)范轉(zhuǎn)換成詞向量,存儲(chǔ)在向量數(shù)據(jù)庫(kù)中;方案二:圖數(shù)據(jù)庫(kù),將規(guī)范以知識(shí)圖譜三元組的形式表達(dá),使強(qiáng)條規(guī)則轉(zhuǎn)換成機(jī)器可以理解的形式。31、進(jìn)一步的,所述s7中,智能審查框架包括基于問答式的審查方法、設(shè)定提示詞prompt,以及設(shè)定ai代理agent。32、一種基于水利工程智能審圖方法的系統(tǒng),包括圖紙數(shù)據(jù)提取與處理模塊、圖紙數(shù)據(jù)與規(guī)范解析存儲(chǔ)模塊和基于nlp的智能審查框架,其中,33、所述圖紙數(shù)據(jù)提取與處理模塊又包括:圖紙文件轉(zhuǎn)換模塊,將cad轉(zhuǎn)為dxf和pdf文件,再將pdf轉(zhuǎn)為jpg格式文件;圖像預(yù)處理及切分模塊,對(duì)轉(zhuǎn)換后的jpg圖紙圖像進(jìn)行預(yù)處理,以提高圖像質(zhì)量,利用圖像處理技術(shù)將預(yù)處理后的圖像切分為多個(gè)子區(qū)域,為后續(xù)的目標(biāo)檢測(cè)和ocr識(shí)別做準(zhǔn)備;目標(biāo)結(jié)構(gòu)檢測(cè)模型,使用以yolov5為基礎(chǔ)算法的目標(biāo)檢測(cè)模型,主要對(duì)于水閘圖紙的閘室底板、鋪蓋、消力池、海漫、防沖槽和圖框信息進(jìn)行識(shí)別,確定其在圖紙中的位置并確定其長(zhǎng)度;cad文件解析模塊,運(yùn)用python的ezdxf庫(kù),以此為核心策略進(jìn)行深度解析;圖紙ocr識(shí)別模塊,應(yīng)用ocr技術(shù),包括yolov5算法和paddleocr分析,對(duì)圖像進(jìn)行掃描識(shí)別,提取出標(biāo)注信息的相對(duì)位置;位置匹配與驗(yàn)證模塊,將ocr識(shí)別結(jié)果與目標(biāo)檢測(cè)結(jié)果進(jìn)行匹配,驗(yàn)證文本框的位置標(biāo)注是否準(zhǔn)確。34、規(guī)范解析存儲(chǔ)模塊包括數(shù)據(jù)字典和規(guī)范解譯,構(gòu)建數(shù)據(jù)字典來存儲(chǔ)和分類圖紙中的信息,以便于信息的識(shí)別、管理和使用,使用ai技術(shù)對(duì)現(xiàn)行的設(shè)計(jì)規(guī)范進(jìn)行解析,將規(guī)范條款轉(zhuǎn)換成可由計(jì)算機(jī)理解和執(zhí)行的格式;35、基于nlp的智能審查框架基于自然語(yǔ)言處理技術(shù),構(gòu)建智能審查體系,實(shí)現(xiàn)對(duì)圖紙的自動(dòng)化審查,包括專家經(jīng)驗(yàn)庫(kù):建立包含各種含量指標(biāo)和關(guān)聯(lián)關(guān)系的數(shù)據(jù)庫(kù),模擬專家的審圖經(jīng)驗(yàn)進(jìn)行合理性判斷;知識(shí)庫(kù):將規(guī)范轉(zhuǎn)換成詞向量或知識(shí)圖譜三元組的形式,存儲(chǔ)在數(shù)據(jù)庫(kù)中,用于支持智能審查。36、進(jìn)一步的,所述cad文件解析模塊包括:檢測(cè)框坐標(biāo)映射,找到j(luò)pg格式圖像與dxf文件坐標(biāo)系的映射關(guān)系;cad數(shù)據(jù)文件格式分析,選擇autocad的結(jié)果數(shù)據(jù)文件—dxf文件作為識(shí)別數(shù)據(jù)來源;dxf文件數(shù)據(jù)提取,選擇使用python的ezdxf開源工具實(shí)現(xiàn)dxf文件的提取。37、本發(fā)明的有益效果:通過將cad圖紙轉(zhuǎn)換為dxf格式,并使用python的ezdxf庫(kù)進(jìn)行深度解析,系統(tǒng)能夠精細(xì)提取圖紙的幾何信息和尺寸標(biāo)注,利用基于yolov5算法的目標(biāo)檢測(cè)和paddleocr的ocr識(shí)別技術(shù),提高了圖紙中結(jié)構(gòu)部件識(shí)別和文本信息提取的準(zhǔn)確性智能審圖系統(tǒng),并且通過數(shù)據(jù)匹配與驗(yàn)證步驟,系統(tǒng)能夠智能地驗(yàn)證圖紙中文本框的位置標(biāo)注是否準(zhǔn)確,進(jìn)一步提高審圖的可靠性系統(tǒng);38、通過數(shù)據(jù)字典和規(guī)范解譯,系統(tǒng)優(yōu)化了圖紙信息的存儲(chǔ)和管理,使得信息的檢索和使用更加高效,系統(tǒng)通過構(gòu)建知識(shí)庫(kù)和專家經(jīng)驗(yàn)庫(kù),實(shí)現(xiàn)了設(shè)計(jì)規(guī)范的自動(dòng)匹配和合理性判斷,提高了審圖的智能化水平,智能審圖系統(tǒng)具備持續(xù)學(xué)習(xí)的能力,隨著數(shù)據(jù)的積累和經(jīng)驗(yàn)的增加,系統(tǒng)的審查質(zhì)量和效率將不斷提升;39、通過自動(dòng)化的圖紙文件轉(zhuǎn)換和圖像預(yù)處理,大幅減少了人工操作的步驟,加快了審圖流程,并且減少了對(duì)專業(yè)審圖人員在圖紙信息檢索和初步審查方面的依賴,從而降低了人力成本,而且通過對(duì)圖紙的自動(dòng)化審查,確保了圖紙信息的一致性和準(zhǔn)確性,通過精確的圖紙審查,確保了水閘設(shè)計(jì)圖紙符合安全標(biāo)準(zhǔn)和規(guī)范要求,降低了工程風(fēng)險(xiǎn),提高了設(shè)計(jì)質(zhì)量。當(dāng)前第1頁(yè)12當(dāng)前第1頁(yè)12