本發(fā)明屬于建筑施工,具體涉及一種建筑工程質(zhì)量數(shù)據(jù)實時比對方法。
背景技術(shù):
1、建筑工程在設(shè)計、施工、驗收、運維等過程中涉及方方面面的數(shù)據(jù),這些數(shù)據(jù)來自建筑工程現(xiàn)場包括材料供應(yīng)、施工過程、竣工驗收、資料歸檔多階段和“人員-機械設(shè)備-材料-方法-環(huán)境”(簡稱“人-機-料-法-環(huán)”)多維度。這些數(shù)據(jù)的集合不僅僅體現(xiàn)當前建筑工程自身的狀態(tài),也反映當前針對該建筑工程進行操作的人員、設(shè)備、材料、方法以及環(huán)境的信息。這些數(shù)據(jù)往往需要和建筑工程相關(guān)的標準、建筑設(shè)計要求或者一些相關(guān)案例進行比對,明確與相關(guān)衡量要求之間的差異。
2、現(xiàn)有比對主要還是以人工方式為主,專家或技術(shù)人員獲得一個數(shù)據(jù)后,根據(jù)其對標準的理解找到對應(yīng)條款、要求或者參考相關(guān)案例,從而進行比較。隨著人工智能和大數(shù)據(jù)的發(fā)展,也有一些方法采用計算機的方法進行比對,但往往需要專家事先設(shè)置比對的規(guī)則,如輸入一個數(shù)值,然后從指定的數(shù)據(jù)庫中找到特定字段,然后將數(shù)值和該字段獲取的內(nèi)容進行比較,或者只是進行基于文本的匹配,查找效率低而且準確率也不高。同時,這樣的系統(tǒng)往往在實際應(yīng)用階段靈活性差,一旦有數(shù)據(jù)要素或者標準、規(guī)范條款發(fā)生更新,需要調(diào)整內(nèi)容眾多,容易出現(xiàn)錯誤,也無法自動將相關(guān)案例進行對比。
技術(shù)實現(xiàn)思路
1、為此,本發(fā)明針對存在的技術(shù)問題,提供一種建筑工程質(zhì)量數(shù)據(jù)實時比對方法,本方法將標準、規(guī)范、建筑設(shè)計要求和一些典型案例形成以本體為表現(xiàn)形式的領(lǐng)域本體,建立基于本體的多層次網(wǎng)絡(luò)結(jié)構(gòu)。采用激活擴散的方法,通過輸入激勵數(shù)據(jù)激活實體網(wǎng)絡(luò)中的一個節(jié)點后,激活狀態(tài)會沿網(wǎng)絡(luò)進行擴散,形成一個激活區(qū)域。這個區(qū)域為從大數(shù)據(jù)集合中識別出與激勵輸入數(shù)據(jù)關(guān)聯(lián)密切的實體節(jié)點集合。這就在輸入激勵數(shù)據(jù)的同時從龐大的建筑工程質(zhì)量數(shù)據(jù)集中形成與輸入激勵數(shù)據(jù)關(guān)聯(lián)的子集,然后再從該子集中進行基于類型和相似性的匹配找到目標實體,從而實現(xiàn)輸入激勵數(shù)據(jù)和目標實體的對比,實時輸出對比的結(jié)果。具體方案如下:
2、一種建筑工程質(zhì)量數(shù)據(jù)實時比對方法,收集建筑工程的標準或規(guī)范數(shù)據(jù),將所述數(shù)據(jù)進行結(jié)構(gòu)化和知識化處理構(gòu)建本體層;所述本體層根據(jù)概念的層次結(jié)構(gòu)和邏輯關(guān)系,定義概念的含義和屬性,其中每一個概念形成本體層網(wǎng)絡(luò)中的一個命名的節(jié)點,圖形化表達一般用橢圓表示,其屬性包括對象屬性和數(shù)據(jù)屬性,屬性在圖形中一般表達為有向箭頭,節(jié)點和其屬性組成本體層中的一個命名實體,每個命名實體在整個數(shù)據(jù)集合中有與其它命名實體區(qū)別的唯一編號。
3、在所述本體層基礎(chǔ)上,對命名實體的概念和屬性進行擴展構(gòu)建得到應(yīng)用層;所述應(yīng)用層補充標準或規(guī)范數(shù)據(jù)中參數(shù)獲取步驟和計算過程,對標準或規(guī)范數(shù)據(jù)中的結(jié)論或數(shù)值型的說明建立約束;所述應(yīng)用層還可以將一些典型案例進行結(jié)構(gòu)化處理成為實例節(jié)點,為后續(xù)同類應(yīng)用提供參考。
4、在所述應(yīng)用層基礎(chǔ)上,以節(jié)點和屬性網(wǎng)絡(luò)為基本框架,計算各個節(jié)點代表概念的相關(guān)性來表明各個實體間的連接強度,以連接強度為邊構(gòu)建得到連接層。
5、在所述連接層基礎(chǔ)上,輸入建筑工程質(zhì)量相關(guān)概念或數(shù)據(jù)作為激勵數(shù)據(jù),激活連接層網(wǎng)絡(luò)中的對應(yīng)節(jié)點并擴散至受影響的節(jié)點,這些節(jié)點和邊就成為擴散層;在一次激活擴散事件完成后,本次激活形成的實例節(jié)點可以合并到應(yīng)用層中成為后續(xù)參考的實例節(jié)點。
6、基于上述構(gòu)建的多層數(shù)據(jù)組織結(jié)構(gòu),進行建筑工程質(zhì)量數(shù)據(jù)實時比對。在擴散層激活范圍內(nèi),針對其輸入激勵數(shù)據(jù)中的核心詞匯形成的節(jié)點查找匹配的目標節(jié)點;基于核心詞匯的類型進行過濾,形成過濾節(jié)點集合;計算核心詞匯對應(yīng)的概念與過濾節(jié)點集合中每個概念的相似度;如果所述核心詞匯為文本,則選取語義相似度最高的結(jié)果作為比對結(jié)果輸出;如果所述核心詞匯為數(shù)值或時間類型,輸出最接近的結(jié)果及大小關(guān)系。
7、所述多層數(shù)據(jù)組織結(jié)構(gòu),在使用中既可以單層使用,也可以多層疊加為復(fù)合層使用。
8、具體的,所述知識化處理包括知識建模、命名實體識別、關(guān)系的識別和提取。
9、具體的,所述屬性包括對象屬性和數(shù)據(jù)屬性,所述對象屬性定義為兩個節(jié)點之間的關(guān)聯(lián);所述數(shù)據(jù)屬性定義概念的描述性或數(shù)值型特征;屬性的定義域和值域?qū)ι婕暗母拍?、?shù)值和文本形成約束關(guān)系;所述節(jié)點有數(shù)據(jù)屬性標明該節(jié)點代表概念的具體內(nèi)容和含義,有對象屬性指向與之有關(guān)的其他節(jié)點。
10、具體的,所述連接層連接強度可以用節(jié)點概念間的相關(guān)性sim_use來表示,其有兩部分組成:一般語境下的兩個概念間的語義相似關(guān)系sim_base和在建筑工程領(lǐng)域的概念間相關(guān)性sim_field。
11、一般語境下的兩個概念間的語義相似關(guān)系為sim_base,根據(jù)語義相似度公式計算,概念a和b間的語義相似度公式如下:
12、???(1)
13、其中,f(a)為搜索引擎庫中包含概念a的網(wǎng)頁數(shù)量,f(b)為搜索引擎庫中包含概念b的網(wǎng)頁數(shù)量,f(a,b)為搜索引擎庫中同時包含a和b的網(wǎng)頁數(shù),n為搜索引擎庫引用的網(wǎng)絡(luò)上的總網(wǎng)頁數(shù)。
14、在建筑工程領(lǐng)域的概念間相關(guān)性為sim_field,收集整理建筑工程設(shè)計、施工、驗收及運維各個環(huán)節(jié)的技術(shù)文檔、檢測報告、運維說明,形成面向建筑工程應(yīng)用的數(shù)據(jù)集合和語義向量。在該集合中通過概念的語義向量計算各個節(jié)點概念間的相關(guān)性sim_field,sim_field采用余弦相似度的方法計算,具體公式如下:
15、???(2)
16、其中,a和b表示兩個概念文本的語義向量,和分別表示向量的模長。
17、兩個節(jié)點代表的概念間的相關(guān)性sim_use,采用將sim_base和sim_field按照權(quán)重進行組合,形成組合后的相關(guān)性:
18、???(3)
19、其中,a、b為超參數(shù),需滿足0≤a+b≤1,a≥0,b≥0。
20、具體的,在擴散層構(gòu)建過程中,所述連接層中的任意一個節(jié)點的被激活程度為激活值act_total,當節(jié)點激活值低于設(shè)定值act_min時,該節(jié)點沒有被激活,所有激活值大于等于act_min的激活節(jié)點以引用或者生成實例的方式組成擴散層。
21、一個節(jié)點i的激活值act_total_i由兩部分組成:①基礎(chǔ)激活值,代表激勵概念初始輸入后通過多級擴散形成對節(jié)點i的影響;②節(jié)點i周圍已經(jīng)被激活的節(jié)點對節(jié)點i造成的影響;act_total_i計算公式如下:
22、節(jié)點基礎(chǔ)激活值act_base_i的計算公式為:
23、???(4)
24、其中,act_start為前級激勵強度,為超參數(shù),表示傳遞過程中的損耗。
25、在此基礎(chǔ)上,實體節(jié)點i周圍若干個節(jié)點用集合j表示,其中有m個激活的節(jié)點,k為j中任一激活的節(jié)點,act_total_i計算公式為:
26、???(5)
27、其中,初始值被設(shè)定為1/m,m為j集合中包含激活節(jié)點的數(shù)量,為節(jié)點k代表的概念和節(jié)點i代表的概念的相關(guān)性。
28、輸入激勵數(shù)據(jù)時,以激勵數(shù)據(jù)所在的節(jié)點為中心,計算該激勵由近及遠擴散影響的范圍,沿屬性的方向形成數(shù)據(jù)擴散區(qū),當擴散至節(jié)點激活值低于設(shè)定值act_min后停止擴散,此時擴散區(qū)中包含激勵所影響的所有節(jié)點,在擴散區(qū)節(jié)點范圍內(nèi)查找能與激勵數(shù)據(jù)匹配的目標節(jié)點進行對比。
29、具體的,進行建筑工程質(zhì)量數(shù)據(jù)實時比對中,錄入建筑工程質(zhì)量數(shù)據(jù)或文本以及其相關(guān)的上下文語境,組成語境數(shù)據(jù)集合;將語境數(shù)據(jù)中的相關(guān)文本進行分詞形成輸入詞匯集合,所述詞匯集合包括一個核心詞匯和若干關(guān)聯(lián)詞匯,所述核心詞匯可人工指定,或利用人工智能的方式從輸入詞匯集合中提取主題詞做為核心詞匯;詞匯集合中的詞匯分為概念和實例,所述概念主要反映一類實物和行為描述的抽象表達,可從連接層直接引用包含該概念的節(jié)點到擴散層,所述實例是針對本次應(yīng)用的具體數(shù)據(jù),依據(jù)連接層中的一個節(jié)點,在擴散層中進行實例化,形成一個實例節(jié)點。
30、進一步,所述超參數(shù)需要在開始激活過程之前進行設(shè)置;如果用于對比的目標節(jié)點不在擴散層的區(qū)域內(nèi),則調(diào)整超參數(shù)。
31、進一步,如果比對時,核心詞形成的節(jié)點概念和目標節(jié)點代表的概念一致,但是其中之一節(jié)點沒有對應(yīng)屬性值,則調(diào)整本體層知識結(jié)構(gòu),補充節(jié)點的屬性。
32、進一步,在構(gòu)建多層數(shù)據(jù)組織的過程中,在輸入建筑工程質(zhì)量數(shù)據(jù)的同時,以人工的方式形成對比結(jié)果,建立數(shù)據(jù)訓(xùn)練集合,用于訓(xùn)練連接層網(wǎng)絡(luò)中的。
33、有益效果:
34、本發(fā)明提出一種建筑工程質(zhì)量數(shù)據(jù)實時比對方法,本方法將標準、規(guī)范、建筑設(shè)計要求和一些典型案例形成以本體為表現(xiàn)形式的領(lǐng)域本體,然后擴展領(lǐng)域本體到實際的應(yīng)用場景形成知識應(yīng)用框架。建立基于本體的多層次數(shù)據(jù)網(wǎng)絡(luò),形成面向應(yīng)用場景的命名實體節(jié)點網(wǎng)絡(luò)。在此基礎(chǔ)上,采用激活擴散的方法,當通過輸入激勵數(shù)據(jù)激活實體網(wǎng)絡(luò)中的一個節(jié)點后,將激活狀態(tài)會沿網(wǎng)絡(luò)進行擴散,形成一個激活區(qū)域。這個區(qū)域為從大數(shù)據(jù)集合中識別出與激勵輸入數(shù)據(jù)關(guān)聯(lián)密切的命名實體節(jié)點集合,這樣就一定程度上避免了在大量建筑工程數(shù)據(jù)集合中直接進行文本查詢找到概念類似但又不相關(guān)數(shù)據(jù)對比項的問題。這就在輸入激勵數(shù)據(jù)的同時從龐大的建筑工程質(zhì)量數(shù)據(jù)集中形成與輸入激勵數(shù)據(jù)關(guān)聯(lián)的子集,然后再從該子集中進行基于類型和相似度的匹配找到目標實體,從而實現(xiàn)輸入激勵數(shù)據(jù)和目標實體的實時對比,輸出對比的結(jié)果。