本技術(shù)涉及知識圖譜查詢,尤其涉及一種自然語句轉(zhuǎn)換方法、裝置、設(shè)備及可讀存儲介質(zhì)。
背景技術(shù):
1、rdf(resource?description?framework),即資源描述框架,是一種資源描述語言,其本質(zhì)是一個數(shù)據(jù)模型,它提供了一個統(tǒng)一的標(biāo)準(zhǔn),用于描述實體/資源及其屬性和關(guān)系,rdf在形式上的表示為spo三元組,spo三元組即主語(subject)、謂語(predicate)及賓語(object)。
2、知識圖譜技術(shù)在智能問答系統(tǒng)的應(yīng)用中越來越廣泛,而知識圖譜大多基于rdf數(shù)據(jù)庫進(jìn)行構(gòu)建,其數(shù)據(jù)的查詢語言是sparql(英文全稱為sparql?protocol?and?rdf?querylanguage,是為rdf開發(fā)的一種查詢語言和數(shù)據(jù)獲取協(xié)議)。從用戶輸入的自然語言到對知識圖譜rdf數(shù)據(jù)庫的查詢,其核心在于根據(jù)用戶輸入的自然語言,提取用戶的意圖并轉(zhuǎn)換成sparql語句。
3、目前業(yè)界通常是使用ai(artificial?intelligence,人工智能)模型對自然語言進(jìn)行語義的提取,然而ai模型的生成需要有訓(xùn)練數(shù)據(jù)集,還需要對訓(xùn)練數(shù)據(jù)集進(jìn)行標(biāo)注處理,因而存在著實施難度大和實現(xiàn)效率低的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)提供一種自然語句轉(zhuǎn)換方法、裝置、設(shè)備及可讀存儲介質(zhì),旨在解決目前業(yè)界通常是使用ai模型對自然語言進(jìn)行語義的提取,ai模型的生成需要有訓(xùn)練數(shù)據(jù)集,還需要對訓(xùn)練數(shù)據(jù)集進(jìn)行標(biāo)注處理,存在著實施難度大和實現(xiàn)效率低的技術(shù)問題。
2、第一方面,本技術(shù)實施例提供一種自然語句轉(zhuǎn)換方法,所述自然語句轉(zhuǎn)換方法包括:
3、獲取待轉(zhuǎn)換自然語句;
4、對待轉(zhuǎn)換自然語句進(jìn)行分詞及預(yù)處理,得到第一中間文本,所述第一中間文本包括多個詞語及每個詞語的詞性;
5、從待轉(zhuǎn)換自然語句中提取預(yù)設(shè)標(biāo)記內(nèi)的內(nèi)容作為參數(shù);
6、對參數(shù)及第一中間文本中除參數(shù)外的各個詞語按照預(yù)設(shè)三元組語法規(guī)則進(jìn)行組合,得到一個或多個第一三元組,所述預(yù)設(shè)三元組語法規(guī)則包括不同詞性的多個詞語及參數(shù)組合為主謂賓三元組的規(guī)則;
7、針對每個第一三元組,通過將第一三元組和知識圖譜本體模型的實體關(guān)系進(jìn)行匹配和查找,將第一三元組轉(zhuǎn)換為一個或多個第二三元組;
8、使用所有的第二三元組生成sparql語句,以供使用sparql語句對知識圖譜進(jìn)行查詢。
9、可選的,所述獲取待轉(zhuǎn)換自然語句包括:
10、獲取原始自然語句;
11、將原始自然語句中包括的預(yù)設(shè)常見提問詞去除,得到待轉(zhuǎn)換自然語句。
12、可選的,所述對待轉(zhuǎn)換自然語句進(jìn)行分詞及預(yù)處理,得到第一中間文本包括:
13、對待轉(zhuǎn)換自然語句進(jìn)行分詞,得到第二中間文本,所述第二中間文本包括分詞后的所有詞語及每個詞語的詞性;
14、對第二中間文本中的各個詞語按照在待轉(zhuǎn)換自然語句中的順序進(jìn)行遍歷,去除當(dāng)前詞語的詞性是動詞且后一詞語的詞性是助詞的詞語,去除詞性是區(qū)別詞的詞語,將相鄰詞語的詞性為名詞的多個詞語合并為一個詞語,得到第一中間文本。
15、可選的,在所述針對每個第一三元組,通過將第一三元組和知識圖譜本體模型的實體關(guān)系進(jìn)行匹配和查找,將第一三元組轉(zhuǎn)換為一個或多個第二三元組之前,還包括:
16、針對每個第一三元組,遍歷第一三元組中的每個詞語,若當(dāng)前詞語在預(yù)設(shè)關(guān)鍵詞映射列表中存在對應(yīng)的替換詞,則將當(dāng)前詞語替換為對應(yīng)的替換詞,所述預(yù)設(shè)關(guān)鍵詞映射列表中的替換詞存在于知識圖譜的本體模型中。
17、可選的,所述通過將第一三元組和知識圖譜本體模型的實體關(guān)系進(jìn)行匹配和查找,將第一三元組轉(zhuǎn)換為一個或多個第二三元組包括:
18、若知識圖譜本體模型的實體關(guān)系中存在與第一三元組匹配的實體關(guān)系,則將第一三元組作為第二三元組;
19、若知識圖譜本體模型的實體關(guān)系中不存在與第一三元組匹配的實體關(guān)系,則在知識圖譜本體模型的實體關(guān)系中查找第一三元組的從主語至賓語的實體關(guān)系,將查找到的第一三元組的從主語至賓語的實體關(guān)系轉(zhuǎn)換為多個第二三元組。
20、可選的,在使用所有的第二三元組生成sparql語句的過程中,若第二三元組中包括參數(shù),則為包括參數(shù)的第二三元組中的主語添加sparql類型限定語句。
21、第二方面,本技術(shù)實施例提供了一種自然語句轉(zhuǎn)換裝置,所述自然語句轉(zhuǎn)換裝置包括:
22、獲取模塊,用于獲取待轉(zhuǎn)換自然語句;
23、分詞模塊,用于對待轉(zhuǎn)換自然語句進(jìn)行分詞及預(yù)處理,得到第一中間文本,所述第一中間文本包括多個詞語及每個詞語的詞性;
24、提取模塊,用于從待轉(zhuǎn)換自然語句中提取預(yù)設(shè)標(biāo)記內(nèi)的內(nèi)容作為參數(shù);
25、組合模塊,用于對參數(shù)及第一中間文本中除參數(shù)外的各個詞語按照預(yù)設(shè)三元組語法規(guī)則進(jìn)行組合,得到一個或多個第一三元組,所述預(yù)設(shè)三元組語法規(guī)則包括不同詞性的多個詞語及參數(shù)組合為主謂賓三元組的規(guī)則;
26、轉(zhuǎn)換模塊,用于針對每個第一三元組,通過將第一三元組和知識圖譜本體模型的實體關(guān)系進(jìn)行匹配和查找,將第一三元組轉(zhuǎn)換為一個或多個第二三元組;
27、生成模塊,用于使用所有的第二三元組生成sparql語句,以供使用sparql語句對知識圖譜進(jìn)行查詢。
28、可選的,所述轉(zhuǎn)換模塊,用于:
29、若知識圖譜本體模型的實體關(guān)系中存在與第一三元組匹配的實體關(guān)系,則將第一三元組作為第二三元組;
30、若知識圖譜本體模型的實體關(guān)系中不存在與第一三元組匹配的實體關(guān)系,則在知識圖譜本體模型的實體關(guān)系中查找第一三元組的從主語至賓語的實體關(guān)系,將查找到的第一三元組的從主語至賓語的實體關(guān)系轉(zhuǎn)換為多個第二三元組。
31、第三方面,本技術(shù)實施例提供了一種自然語句轉(zhuǎn)換設(shè)備,所述自然語句轉(zhuǎn)換設(shè)備包括處理器、存儲器、以及存儲在所述存儲器上并可被所述處理器執(zhí)行的自然語句轉(zhuǎn)換程序,其中所述自然語句轉(zhuǎn)換程序被所述處理器執(zhí)行時,實現(xiàn)如上述所述的自然語句轉(zhuǎn)換方法的步驟。
32、第四方面,本技術(shù)實施例提供了一種可讀存儲介質(zhì),所述可讀存儲介質(zhì)上存儲有自然語句轉(zhuǎn)換程序,其中所述自然語句轉(zhuǎn)換程序被處理器執(zhí)行時,實現(xiàn)如上述所述的自然語句轉(zhuǎn)換方法的步驟。
33、本技術(shù)實施例提供的技術(shù)方案帶來的有益效果包括:
34、本技術(shù)實施例中,獲取待轉(zhuǎn)換自然語句;對待轉(zhuǎn)換自然語句進(jìn)行分詞及預(yù)處理,得到第一中間文本,所述第一中間文本包括多個詞語及每個詞語的詞性;從待轉(zhuǎn)換自然語句中提取預(yù)設(shè)標(biāo)記內(nèi)的內(nèi)容作為參數(shù);對參數(shù)及第一中間文本中除參數(shù)外的各個詞語按照預(yù)設(shè)三元組語法規(guī)則進(jìn)行組合,得到一個或多個第一三元組,所述預(yù)設(shè)三元組語法規(guī)則包括不同詞性的多個詞語及參數(shù)組合為主謂賓三元組的規(guī)則;針對每個第一三元組,通過將第一三元組和知識圖譜本體模型的實體關(guān)系進(jìn)行匹配和查找,將第一三元組轉(zhuǎn)換為一個或多個第二三元組;使用所有的第二三元組生成sparql語句,以供使用sparql語句對知識圖譜進(jìn)行查詢。本技術(shù)實施例通過,對待轉(zhuǎn)換自然語句進(jìn)行分詞、預(yù)處理及參數(shù)提取,按照預(yù)設(shè)的三元組語法規(guī)則進(jìn)行主謂賓三元組的組合,然后再基于知識圖譜本體模型的實體關(guān)系對組合的三元組進(jìn)行轉(zhuǎn)換,使用轉(zhuǎn)換后的三元組生成sparql語句,相對于現(xiàn)有技術(shù)使用ai模型進(jìn)行語義提取的方案,具有實施便捷和效率高的優(yōu)勢。