一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及物聯(lián)網(wǎng)終端設(shè)備技術(shù)領(lǐng)域,具體地說(shuō)是一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化 方法。
【背景技術(shù)】
[0002] 物聯(lián)網(wǎng)是在互聯(lián)網(wǎng)概念的基礎(chǔ)上,將其用戶端延伸和擴(kuò)展到任何物品與物品之 間,進(jìn)行信息交換和通信的一種網(wǎng)絡(luò)概念。具體說(shuō)來(lái),通過(guò)射頻識(shí)別(RFID)、紅外感應(yīng)器、全 球定位系統(tǒng)、激光掃描器等信息傳感設(shè)備,按約定的協(xié)議,把任何物品與互聯(lián)網(wǎng)相連接,進(jìn) 行信息交換和通信,以實(shí)現(xiàn)智能化識(shí)別、定位、跟蹤、監(jiān)控和管理的一種網(wǎng)絡(luò)概念。
[0003] 信息語(yǔ)義化是物聯(lián)網(wǎng)的基礎(chǔ),是針對(duì)當(dāng)今物聯(lián)網(wǎng)中信息無(wú)序,數(shù)據(jù)缺乏語(yǔ)義和信 息獲取效率低等問(wèn)題提出來(lái)的。在語(yǔ)義Web中,信息被賦予了明確的含義,使計(jì)算機(jī)能夠理 解和辨識(shí)Web信息,并對(duì)其自動(dòng)解釋?zhuān)粨Q和處理,從而為人們提供優(yōu)質(zhì)的服務(wù)。語(yǔ)義Web 使用XML定義的標(biāo)簽格式,采用RDF靈活地描述數(shù)據(jù)以及用OWL語(yǔ)言來(lái)描述網(wǎng)絡(luò)文檔中的 術(shù)語(yǔ)的明確含義和它們之間的關(guān)系。
[0004] 本體是語(yǔ)義的核心,其主要目標(biāo)是通過(guò)獲取相關(guān)領(lǐng)域知識(shí)得到共同認(rèn)可的代表領(lǐng) 域的詞匯以及這些詞匯的層次化結(jié)構(gòu),以實(shí)現(xiàn)對(duì)領(lǐng)域知識(shí)的共同理解。
[0005] 但是目前傳感器本體,無(wú)論是作為一種通用語(yǔ)言還是作為一種數(shù)據(jù)模型都缺少時(shí) 間和空間的語(yǔ)義,如從溫度傳感器中獲得"25"這個(gè)數(shù)據(jù),用傳感器本體中的"溫度"這一概 念標(biāo)注它,則表明"25"是溫度,但該本體卻不能表明采集的時(shí)間,地點(diǎn)以及采集者等相關(guān)信 肩、。
[0006] 另一方面,本體開(kāi)發(fā)者都是根據(jù)特定應(yīng)用來(lái)構(gòu)建相應(yīng)的傳感器本體,并沒(méi)有明確 的含義和統(tǒng)一的框架,導(dǎo)致各個(gè)本體中的類(lèi)定義不同,使彼此之間共享性和重用性較差。面 對(duì)傳感器本體的開(kāi)發(fā),沒(méi)有比較完整成熟的構(gòu)建方法。目前常見(jiàn)的本體構(gòu)建方法有骨架 法,METH0NT0L0GY法,IDEF5,評(píng)價(jià)法和七步法等,但是這些方法并不適合傳感器本體的構(gòu) 建。首先,這些方法是從領(lǐng)域本體構(gòu)建方法中提煉出來(lái)的,本身并不完善,如構(gòu)建過(guò)程不規(guī) 范,無(wú)計(jì)劃性,無(wú)需求分析過(guò)程,未考慮本體的可擴(kuò)展性,不能充分保證本體的共享和重用 性,沒(méi)有統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)。
【發(fā)明內(nèi)容】
[0007] 針對(duì)現(xiàn)有技術(shù)的不足,為實(shí)現(xiàn)本體的規(guī)模化和規(guī)范化開(kāi)發(fā),提高傳感器本體開(kāi)發(fā) 質(zhì)量,本發(fā)明在傳感器本體構(gòu)建準(zhǔn)則和傳感器本體特性的基礎(chǔ)上,綜合METH0NT0L0GY法 的生命周期開(kāi)發(fā)特點(diǎn),七步法的系統(tǒng)分析法,Tove法的評(píng)價(jià)優(yōu)化技術(shù)以及其它本體構(gòu)建方 法的優(yōu)點(diǎn),依據(jù)軟件工程中的原型法,提出了一種支持需求分析,利于傳感器本體不斷進(jìn) 化,有效減少領(lǐng)域?qū)<覅⑴c度的傳感器本體Senont-PDF構(gòu)建法(PDFBuilding of Sensor ontology)。該方法分為傳感器本體計(jì)劃(SoP,Sensor ontology Plan),傳感器本體構(gòu)建 (Sensor ontology Do)和傳感器本體反饋(Sensor ontology Feedback)三個(gè)階段,米用 面向?qū)ο蟮姆绞街贫?xiàng)目計(jì)劃,利用已有測(cè)試數(shù)據(jù)集或仿真數(shù)據(jù)分析執(zhí)行結(jié)果,并根據(jù)具 體應(yīng)用實(shí)現(xiàn)傳感器本體的領(lǐng)域更新和擴(kuò)展,整個(gè)傳感器本體開(kāi)發(fā)及進(jìn)化過(guò)程是循序漸進(jìn), 螺旋上升的。
[0008] 本發(fā)明為實(shí)現(xiàn)上述目的所采用的技術(shù)方案是:一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方 法,分析物聯(lián)網(wǎng)終端設(shè)備的應(yīng)用特征,制定建立本體庫(kù)的規(guī)則;利用本體建立工具,分析建 立初始本體庫(kù);對(duì)網(wǎng)絡(luò)與傳感器信息進(jìn)行預(yù)處理;采集傳感器上傳的信息,對(duì)初始本體庫(kù) 進(jìn)行更新,并且采集網(wǎng)絡(luò)搜集的信息對(duì)初始本體庫(kù)進(jìn)行擴(kuò)展。
[0009] 所述預(yù)處理包括本體解析和文本處理。
[0010] 所述本體解析包括對(duì)初始本體庫(kù)中的概念信息進(jìn)行解析,得到概念集;對(duì)初始本 體庫(kù)中的實(shí)例信息進(jìn)行解析,得到實(shí)例集;對(duì)初始本體庫(kù)中的關(guān)系信息進(jìn)行解析,得到關(guān)系 集。
[0011] 所述文本處理包括對(duì)網(wǎng)頁(yè)文本處理和對(duì)采集數(shù)據(jù)文本處理。
[0012] 所述網(wǎng)頁(yè)文本處理包括:對(duì)網(wǎng)頁(yè)去噪聲后,提取網(wǎng)頁(yè)特征。
[0013] 所述采集數(shù)據(jù)文本處理包括:對(duì)數(shù)據(jù)格式進(jìn)行轉(zhuǎn)換。
[0014] 所述對(duì)初始本體庫(kù)進(jìn)行更新包括以下過(guò)程:
[0015] 當(dāng)采集到傳感器發(fā)送的實(shí)時(shí)動(dòng)態(tài)測(cè)量值時(shí),進(jìn)行動(dòng)態(tài)數(shù)據(jù)匹配,更新初始本體庫(kù) 中的實(shí)例集;
[0016] 當(dāng)采集到傳感器發(fā)送的固有屬性信息值時(shí),進(jìn)行靜態(tài)數(shù)據(jù)匹配,更新初始本體庫(kù) 中的概念集和關(guān)系集。
[0017] 所述對(duì)初始本體庫(kù)進(jìn)行擴(kuò)展包括以下過(guò)程:
[0018] 對(duì)網(wǎng)絡(luò)搜集到的信息進(jìn)行篩選,得到與本體庫(kù)相似度較高的網(wǎng)絡(luò)信息;
[0019] 通過(guò)對(duì)編輯距離和上下文相似度的計(jì)算得到相關(guān)度較高的詞匯信息。
[0020] 所述對(duì)網(wǎng)絡(luò)搜集到的信息進(jìn)行篩選包括以下過(guò)程:
[0021] 設(shè)有η個(gè)領(lǐng)域文檔的集合為SetD= {Dl,D2,…Dn},cj為傳感器本體中的任一概 念,文檔Di與概念cj的相關(guān)度為:
【主權(quán)項(xiàng)】
1. 一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于: 分析物聯(lián)網(wǎng)終端設(shè)備的應(yīng)用特征,制定建立本體庫(kù)的規(guī)則; 利用本體建立工具,分析建立初始本體庫(kù); 對(duì)網(wǎng)絡(luò)與傳感器信息進(jìn)行預(yù)處理; 采集傳感器上傳的信息,對(duì)初始本體庫(kù)進(jìn)行更新,并且采集網(wǎng)絡(luò)搜集的信息對(duì)初始本 體庫(kù)進(jìn)行擴(kuò)展。
2. 根據(jù)權(quán)利要求1所述的一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于: 所述預(yù)處理包括本體解析和文本處理。
3. 根據(jù)權(quán)利要求2所述的一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于: 所述本體解析包括對(duì)初始本體庫(kù)中的概念信息進(jìn)行解析,得到概念集;對(duì)初始本體庫(kù) 中的實(shí)例信息進(jìn)行解析,得到實(shí)例集;對(duì)初始本體庫(kù)中的關(guān)系信息進(jìn)行解析,得到關(guān)系集。
4. 根據(jù)權(quán)利要求2所述的一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于: 所述文本處理包括對(duì)網(wǎng)頁(yè)文本處理和對(duì)采集數(shù)據(jù)文本處理。
5. 根據(jù)權(quán)利要求4所述的一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于:所述網(wǎng)頁(yè) 文本處理包括:對(duì)網(wǎng)頁(yè)去噪聲后,提取網(wǎng)頁(yè)特征。
6. 根據(jù)權(quán)利要求4所述的一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于:所述采集 數(shù)據(jù)文本處理包括:對(duì)數(shù)據(jù)格式進(jìn)行轉(zhuǎn)換。
7. 根據(jù)權(quán)利要求1所述的一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于: 所述對(duì)初始本體庫(kù)進(jìn)行更新包括以下過(guò)程: 當(dāng)采集到傳感器發(fā)送的實(shí)時(shí)動(dòng)態(tài)測(cè)量值時(shí),進(jìn)行動(dòng)態(tài)數(shù)據(jù)匹配,更新初始本體庫(kù)中的 實(shí)例集; 當(dāng)采集到傳感器發(fā)送的固有屬性信息值時(shí),進(jìn)行靜態(tài)數(shù)據(jù)匹配,更新初始本體庫(kù)中的 概念集和關(guān)系集。
8. 根據(jù)權(quán)利要求1所述的一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于: 所述對(duì)初始本體庫(kù)進(jìn)行擴(kuò)展包括以下過(guò)程: 對(duì)網(wǎng)絡(luò)搜集到的信息進(jìn)行篩選,得到與本體庫(kù)相似度較高的網(wǎng)絡(luò)信息; 通過(guò)對(duì)編輯距離和上下文相似度的計(jì)算得到相關(guān)度較高的詞匯信息。
9. 根據(jù)權(quán)利要求8所述的一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于:所述對(duì)網(wǎng) 絡(luò)搜集到的信息進(jìn)行篩選包括以下過(guò)程: 設(shè)有n個(gè)領(lǐng)域文檔的集合為SetD={Dl,D2,…Dn},cj為傳感器本體中的任一概念,文 檔Di與概念cj的相關(guān)度為:
其中:
freqy為術(shù)語(yǔ)cj在Di中出現(xiàn)的次數(shù),即頻率。則 文檔Dj與傳感器本體的相關(guān)度為:
m表示傳感器本體中的概念個(gè)數(shù); 如果文檔Dj與傳感器本體的相關(guān)度DRs_nt大于領(lǐng)域文檔相關(guān)系數(shù)0,則領(lǐng)域文檔相 關(guān)度較高,反之領(lǐng)域文檔相關(guān)度較低;其中領(lǐng)域文檔相關(guān)系數(shù)e為用戶輸入文檔變量。
10.根據(jù)權(quán)利要求8所述的一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,其特征在于: 所述對(duì)編輯距離和上下文相似度的計(jì)算包括: 給定兩個(gè)詞匯h和t2,根據(jù)Sigmoid函數(shù)以及編輯距離和上下文相似度得到兩個(gè)詞匯 的概念匹配度為:
其中,a,@作為協(xié)調(diào)因子,采用Sigmoid函數(shù),
如果兩個(gè)詞匯的概念匹配度Sim_rept(tl,t2)大于領(lǐng)域詞匯相關(guān)系數(shù)6,則領(lǐng)域詞匯 相關(guān)度較高,反之領(lǐng)域詞匯相關(guān)度較低;其中領(lǐng)域詞匯相關(guān)系數(shù)S為用戶輸入詞匯變量。
【專(zhuān)利摘要】本發(fā)明涉及物聯(lián)網(wǎng)終端設(shè)備技術(shù)領(lǐng)域,具體地說(shuō)是一種物聯(lián)網(wǎng)終端設(shè)備的語(yǔ)義化方法,分析物聯(lián)網(wǎng)終端設(shè)備的應(yīng)用特征,制定建立本體庫(kù)的規(guī)則;利用本體建立工具,分析建立初始本體庫(kù);對(duì)網(wǎng)絡(luò)與傳感器信息進(jìn)行預(yù)處理;采集傳感器上傳的信息,對(duì)初始本體庫(kù)進(jìn)行更新,并且采集網(wǎng)絡(luò)搜集的信息對(duì)初始本體庫(kù)進(jìn)行擴(kuò)展。本發(fā)明采用面向?qū)ο蟮姆绞街贫?xiàng)目計(jì)劃,利用已有測(cè)試數(shù)據(jù)集或仿真數(shù)據(jù)分析執(zhí)行結(jié)果,并根據(jù)具體應(yīng)用實(shí)現(xiàn)傳感器本體的領(lǐng)域更新和擴(kuò)展,整個(gè)傳感器本體開(kāi)發(fā)及進(jìn)化過(guò)程是循序漸進(jìn),螺旋上升的。
【IPC分類(lèi)】G06F17-30
【公開(kāi)號(hào)】CN104699719
【申請(qǐng)?zhí)枴緾N201310669226
【發(fā)明人】佟星, 劉陽(yáng), 施昭, 曾鵬, 于海斌
【申請(qǐng)人】中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所
【公開(kāi)日】2015年6月10日
【申請(qǐng)日】2013年12月10日
【公告號(hào)】WO2015085622A1