欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于本體庫內(nèi)容的sparql查詢語句生成系統(tǒng)的制作方法_2

文檔序號(hào):8258842閱讀:來源:國知局
基于SPARQL的語法形式,轉(zhuǎn)換成相對應(yīng)的查詢語句,最終進(jìn)入RDF數(shù)據(jù)庫查詢,與數(shù)據(jù) 平臺(tái)進(jìn)行交互的接口;數(shù)據(jù)清洗主要使用JenaAPI讀取原始三元組數(shù)據(jù),從中提取需要檢 索URI字符串并單獨(dú)存儲(chǔ),字符串檢索組件則使用了 Trie樹等數(shù)據(jù)結(jié)構(gòu)。
[0032] 搭建上述系統(tǒng),并提供用戶編輯查詢圖與生成SPARQL查詢語句數(shù)據(jù)庫交互的具 體步驟如下:
[0033] (1)準(zhǔn)備好需要檢索的基于RDF資源描述框架格式的三元組數(shù)據(jù)。
[0034] (2)使用JenaAPI讀取原始三元組提取需要檢索的URI :根據(jù)本體的Schema可以 分別提取四種類型的URI,包括label、type、property、sameAs ;其中的label與property 在查詢時(shí)起主要用途,type信息主要是為了提供附加信息供用戶最終選擇URI使用,而 sameAs主要用于自動(dòng)生成字符串轉(zhuǎn)換庫;對于最終的界面使用而言,label信息主要用于 響應(yīng)查詢圖節(jié)點(diǎn)的標(biāo)簽檢索請求,而property信息主要用于響應(yīng)查詢圖邊的標(biāo)簽檢索請 求。
[0035] (3)將步驟⑴中的原始數(shù)據(jù)存儲(chǔ)到提供SPARQL查詢端點(diǎn)的圖數(shù)據(jù)庫中,將步驟 (2)中清洗出來的URI字符串分類別按照n-gram(-般n取3)滑動(dòng)窗口截取之后利用Trie 樹數(shù)據(jù)結(jié)構(gòu)進(jìn)行倒排索引,為前端界面標(biāo)簽查詢進(jìn)行字符串檢索提供接口。
[0036] (4)創(chuàng)建字符串轉(zhuǎn)換規(guī)則,提供字符串轉(zhuǎn)換庫自定義接口:基于現(xiàn)實(shí)世界中大量 別名以及縮寫形式的存在這一考慮,因此需要提供將這些人類語言中能夠自動(dòng)解碼的非正 式字符串表達(dá)轉(zhuǎn)換成正式形式的字符串,步驟(2)中的sameAs信息一定程度上支持了這種 轉(zhuǎn)換,將這一部分信息利用直接哈希存儲(chǔ)的技術(shù)存儲(chǔ),另外還提供用戶自定義轉(zhuǎn)換接口保 證這種轉(zhuǎn)換規(guī)則的時(shí)效性與正確性。
[0037] (5)采用d3. js可視化控件,創(chuàng)建用戶可編輯的圖形化界面,提供節(jié)點(diǎn)編輯、連接 節(jié)點(diǎn)的邊編輯以及對節(jié)點(diǎn)、邊加入自然語言標(biāo)簽的編輯功能;其中節(jié)點(diǎn)或邊的標(biāo)簽可以有 兩種模式,與SPARQL的兩種變量綁定一致:a.查詢模式,使用字符"?",代表要查詢該節(jié)點(diǎn) 的信息;b.綁定URI模式,用戶需要編輯自然語言的標(biāo)簽用以描述該節(jié)點(diǎn);后臺(tái)的URI查詢 接口主要用于響應(yīng)后一種標(biāo)簽?zāi)J健?br>[0038] (6)服務(wù)器端響應(yīng)步驟(5)中的b模式的字符串檢索,對于原始字符串s,利用轉(zhuǎn) 換規(guī)則獲取能夠經(jīng)過轉(zhuǎn)換得到的字符串集合S tMnsfOTm,將s與StMnsfOTm組合成新的查詢字符 串集合SQuOTy,對新的查詢字符串中的每一個(gè)字符串^ e ,進(jìn)行n-gram滑動(dòng)窗口切分(n 保持與步驟(3)中的一致),得到一個(gè)二元組<?,.《又">;對于每一個(gè)二元組,我們可以利 用其中的segn子字符串集,在步驟(3)中創(chuàng)建的Trie樹中檢索得到對應(yīng)的URI列表,合并 這些URI列表并統(tǒng)計(jì)每個(gè)URI的出現(xiàn)次數(shù),最終返回出現(xiàn)次數(shù)為Top-k的URI集合Smi = { < URI,cnt > },集合中每一個(gè)元素都是一個(gè)二元組,分別表示URI字符串和該字符串出 現(xiàn)的次數(shù);進(jìn)一步合并最終每一個(gè)二元組所返回的Top-k的URI集合,統(tǒng)計(jì)出現(xiàn)次數(shù)并返回 最終的出現(xiàn)次數(shù)Top-k的URI集合給前端界面展示。
[0039] (7)前端界面接受服務(wù)器返回的數(shù)據(jù)進(jìn)行展示,用戶對每一個(gè)b類型的標(biāo)簽 選擇一個(gè)最為合適的URI之后,點(diǎn)擊查詢,后臺(tái)響應(yīng)前臺(tái)傳輸?shù)膱D的節(jié)點(diǎn)-邊描述集合 {<s, P,〇 >I (s,〇)G node, p G edge},其中:node為用戶編輯的圖中的節(jié)點(diǎn)集合標(biāo)簽, edge為用戶編輯的圖中的邊集合;結(jié)合部分filter信息,生成最終的SPARQL查詢語句,自 動(dòng)生成SPARQL查詢語句的功能模塊構(gòu)建需要對SPARQL語法有一定的理解,但一般來說, SPARQL的查詢語句可以由以下組件組成:
[0040]
【主權(quán)項(xiàng)】
1. 一種基于本體庫內(nèi)容的SPAR化查詢語句生成系統(tǒng),包括在線模塊和離線模塊;其特 征在于: 所述的在線模塊用于為用戶提供查詢編輯界面和結(jié)果展示界面,實(shí)時(shí)生成SPAR化查 詢語句,并展示最終的查詢結(jié)果; 所述的離線模塊用于更新服務(wù)內(nèi)容,對本體庫中的部分URI字符串進(jìn)行索引。
2. 根據(jù)權(quán)利要求1所述的SPAR化查詢語句生成系統(tǒng),其特征在于:所述的離線模塊對 本體庫中的部分URI字符串進(jìn)行索引的具體實(shí)現(xiàn)過程如下: 1. 1準(zhǔn)備好符合規(guī)范的RDF =元組數(shù)據(jù); 1. 2讀取所述的RDF =元組數(shù)據(jù),從中提取需要索引的URI字符串,對URI字符串進(jìn)行 數(shù)據(jù)清洗; 1. 3將步驟1. 1中的畑F S元組數(shù)據(jù)存儲(chǔ)到提供SPARQL查詢端點(diǎn)的圖數(shù)據(jù)庫中,將步 驟1. 2中清洗保留下來的URI字符串分類別進(jìn)行切片截取W得到URI字符串切片后的倒排 索引,并進(jìn)一步為倒排索引的URI字符串提供檢索接口; 1. 4根據(jù)步驟1. 2中清洗保留下來的URI字符串創(chuàng)建字符串轉(zhuǎn)換規(guī)則庫,進(jìn)一步提供字 符串轉(zhuǎn)換規(guī)則庫的自定義轉(zhuǎn)換接口。
3. 根據(jù)權(quán)利要求2所述的SPAR化查詢語句生成系統(tǒng),其特征在于:所述的步驟1. 2中 提取關(guān)于1油el、type、property、sameAs該四類URI字符串,并對該四類URI字符串進(jìn)行 數(shù)據(jù)清洗。
4. 根據(jù)權(quán)利要求2所述的SPAR化查詢語句生成系統(tǒng),其特征在于:所述的步驟1. 3中 切片截取的具體實(shí)現(xiàn)方式為:將清洗保留下來的URI字符串分類別按照n-gram滑動(dòng)窗口截 取之后利用Trie樹數(shù)據(jù)結(jié)構(gòu)創(chuàng)建倒排索引。
5. 根據(jù)權(quán)利要求2所述的SPAR化查詢語句生成系統(tǒng),其特征在于:所述的步驟1. 4中 創(chuàng)建字符串轉(zhuǎn)換規(guī)則庫的具體實(shí)現(xiàn)方式為:利用步驟1. 2清洗過程中得到的sameAs信息直 接進(jìn)行哈希存儲(chǔ),另外利用所述的自定義轉(zhuǎn)換接口為開發(fā)者輸入特定的轉(zhuǎn)換規(guī)則。
6. 根據(jù)權(quán)利要求2所述的SPAR化查詢語句生成系統(tǒng),其特征在于:所述的在線模塊為 用戶提供查詢編輯界面,實(shí)時(shí)生成SPAR化查詢語句并展示最終查詢結(jié)果的具體實(shí)現(xiàn)過程 如下: 2. 1采用d3. js可視化控件創(chuàng)建用戶編輯的圖形化界面,該圖形化界面提供節(jié)點(diǎn)編輯、 連接節(jié)點(diǎn)的邊編輯W及對節(jié)點(diǎn)和邊加入自然語言標(biāo)簽的編輯;其中節(jié)點(diǎn)或邊的自然語言標(biāo) 簽有W下兩種模式,該兩種模式與SPARQL的兩種綁定對應(yīng)一致; a. 查詢模式,代表要查詢節(jié)點(diǎn)的信息,對應(yīng)SPARQL的未知變量; b. 綁定URI模式,用W描述節(jié)點(diǎn)或邊,對應(yīng)SPARQL查詢中的已知URI ; 2. 2后臺(tái)的檢索接口用于響應(yīng)b模式的字符串檢索;應(yīng)用所述的字符串轉(zhuǎn)換規(guī)則庫的 轉(zhuǎn)換規(guī)則,將用戶編輯的自然語言標(biāo)簽轉(zhuǎn)換成URI字符串,進(jìn)一步對自然語言標(biāo)簽及其轉(zhuǎn) 換后URI字符串的切片,利用所述的倒排索引進(jìn)行檢索,得到對應(yīng)的URI列表并進(jìn)行合并, 統(tǒng)計(jì)URI字符串的出現(xiàn)次數(shù),然后將在合并后列表中出現(xiàn)次數(shù)為top-K的URI字符串返回 給前臺(tái)圖形化界面W進(jìn)行展示,K為大于1的自然數(shù); 2. 3在前臺(tái)圖形化界面上用戶對于每一個(gè)b模式的自然語言標(biāo)簽從top-K中選擇一個(gè) 最為合適的URI字符串之后點(diǎn)擊查詢,后臺(tái)響應(yīng)前臺(tái)傳輸?shù)挠脩艟庉媹D中的節(jié)點(diǎn)-邊描述 集合,通過結(jié)合部分filter信息,生成最終的SPAR化查詢語句,進(jìn)一步與圖數(shù)據(jù)庫交互,查 詢到結(jié)果返回。
【專利摘要】本發(fā)明公開了一種基于本體庫內(nèi)容的SPARQL查詢語句生成系統(tǒng),其基于d3.js的可視化技術(shù)以及對本體庫的URI進(jìn)行索引檢索的思想,通過用戶在前臺(tái)使用系統(tǒng)提供的圖形繪制部件構(gòu)建出查詢圖,并對每一個(gè)部件賦予自然語言的標(biāo)簽,由后臺(tái)實(shí)時(shí)響應(yīng)每一個(gè)新構(gòu)建的部件,并在已經(jīng)索引的URI中檢索出Top-K個(gè)匹配部件標(biāo)簽的URI,交由用戶選擇最符合自己查詢意圖的URI,同時(shí)提供用戶定制的查詢限制,最終自動(dòng)生成SPARQL查詢語句對RDF數(shù)據(jù)庫進(jìn)行查詢,極大地方便了對本體庫的Schema不熟悉,或者不了解SPARQL語法的用戶對數(shù)據(jù)庫進(jìn)行查詢。
【IPC分類】G06F17-30
【公開號(hào)】CN104572970
【申請?zhí)枴緾N201410852126
【發(fā)明人】王東輝, 熊逵, 李亞南, 藺越檀, 孫歡, 黃鵬程, 洪高峰, 徐燦, 梁建增, 莊越挺
【申請人】浙江大學(xué)
【公開日】2015年4月29日
【申請日】2014年12月31日
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
唐河县| 阳泉市| 曲松县| 道孚县| 兴国县| 临桂县| 五台县| 内黄县| 栾城县| 来凤县| 巩留县| 泽州县| 南丰县| 淮南市| 河北省| 宁夏| 湘乡市| 宝坻区| 钟山县| 鄱阳县| 广汉市| 龙海市| 谢通门县| 青铜峡市| 和平县| 湾仔区| 昂仁县| 亳州市| 格尔木市| 五常市| 金乡县| 大渡口区| 阳原县| 西林县| 望都县| 治多县| 会宁县| 行唐县| 宁远县| 繁昌县| 隆德县|