專利名稱:一種基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法
一種基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)自然語(yǔ)言理解領(lǐng)域,特別涉及一種基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法。
背景技術(shù):
在知識(shí)集成中,大量的知識(shí)被蘊(yùn)含在自然語(yǔ)言語(yǔ)句中,只有實(shí)現(xiàn)了自然語(yǔ)言語(yǔ)句的自動(dòng)分析,才能有效獲取語(yǔ)句中所蘊(yùn)含的知識(shí)。因此,自然語(yǔ)言處理技術(shù)就成為了知識(shí)集成的關(guān)鍵基礎(chǔ)技術(shù)。
自然語(yǔ)言處理技術(shù)主要有基于規(guī)則的方法和基于統(tǒng)計(jì)的方法兩種思路,但這兩種方法都沒有充分地利用語(yǔ)義信息,很難取得高質(zhì)量的處理結(jié)果。因此,研究者越來(lái)越重視語(yǔ)義的作用,出現(xiàn)了基于Wordnet、hownet、framenet等詞匯語(yǔ)義知識(shí)庫(kù)來(lái)分析自然語(yǔ)言的方法,但這些知識(shí)庫(kù)中所包含語(yǔ)義信息的描述粒度太粗,沒有表示到詞素的層次,也不夠準(zhǔn)確。這些缺點(diǎn)致使很難利用它們形成一套系統(tǒng)的語(yǔ)句處理方法和模型。
在基于語(yǔ)義的語(yǔ)句分析方面,學(xué)者們作了一定程度的研究姚天順研究過基于語(yǔ)義驅(qū)動(dòng)的自然語(yǔ)言理解,但詞匯語(yǔ)義的描述比較粗糙,對(duì)語(yǔ)義信息的利用也不夠充分, 分析方法也不夠系統(tǒng);HPSG方法是基于詞匯信息驅(qū)動(dòng)的,但詞匯的信息主要是用來(lái)描述語(yǔ)法規(guī)則的 ,對(duì)語(yǔ)義的描述過少也不夠準(zhǔn)確,與漢語(yǔ)的特點(diǎn)不相適應(yīng)。文獻(xiàn)(Tom 0H, Janyce ff,Exploiting Semantic Role Resources for Preposition Disambiguation[J]. Computational Linguistics, 2008, 35 (2) : 151-184.)研究了將語(yǔ)料樹庫(kù)與 framenet 相結(jié)合的介詞短語(yǔ)消歧,文獻(xiàn)(Patwardhan S, Banerjee S, Pedersen T. Using measures of semantic relatedness for word sense disambiguation[C]. Proceedings of the 4th International Conference on Intelligent Text Processing and Computational Linguistics (CICLING-03) ,Mexico City, 2003 241 - 257.)研究了使用語(yǔ)義關(guān)系進(jìn)行詞匯語(yǔ)義消歧。雖然這些研究取得一定的成果,但還沒有形成一套系統(tǒng)地利用語(yǔ)義信息進(jìn)行自然語(yǔ)言處理的模型和方法。
要形成一個(gè)完整的自然語(yǔ)言處理的語(yǔ)義模型,必須較為準(zhǔn)確地表示詞匯的語(yǔ)義, 應(yīng)具體到詞素的級(jí)別才可能滿足語(yǔ)義模型的要求,而現(xiàn)有的詞匯語(yǔ)義表示方式大多沒有對(duì)此進(jìn)行深入的研究。格語(yǔ)法使用“格”來(lái)描述深層語(yǔ)義關(guān)系,但格語(yǔ)法僅僅被用來(lái)進(jìn)行語(yǔ)法分析,很少用格來(lái)描述詞匯的語(yǔ)義。模態(tài)是描述動(dòng)作執(zhí)行狀態(tài)關(guān)鍵因素之一,自然語(yǔ)言中很多詞匯的準(zhǔn)確語(yǔ)義在本質(zhì)上蘊(yùn)含了某個(gè)動(dòng)作概念的模態(tài),而現(xiàn)有的各種詞匯語(yǔ)義表示方式?jīng)]有考慮模態(tài),因此很難準(zhǔn)確地描述概念的語(yǔ)義。本體能夠嚴(yán)格地表示概念語(yǔ)義,本體一般使用描述邏輯來(lái)表示所有概念;但描述邏輯中將概念之間的語(yǔ)義關(guān)系進(jìn)行平等的對(duì)待,沒有對(duì)動(dòng)作性概念的語(yǔ)義關(guān)系的本質(zhì)特征進(jìn)行特殊的語(yǔ)義解釋和處理。發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的不足,本發(fā)明的目的在于提供一種利用語(yǔ)義信息來(lái)進(jìn)行自然語(yǔ)言處理并獲取其中所蘊(yùn)含的知識(shí)的基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法。
本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的為了能夠自動(dòng)分析自然語(yǔ)言并獲取中所蘊(yùn)含的知識(shí),提出了一個(gè)自然語(yǔ)言處理的語(yǔ)義模型,該模型使用一個(gè)假設(shè)公理來(lái)判定最佳語(yǔ)法分析方案。為了滿足該模型的語(yǔ)義表示需求,對(duì)描述邏輯進(jìn)行了特殊化處理,使之能夠更適合地表示自然語(yǔ)言詞匯語(yǔ)義?;谠撃P?,提出了一種基于詞匯語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言分析方法;該方法利用語(yǔ)義匹配信息,結(jié)合少量自然語(yǔ)言中常見的語(yǔ)法規(guī)則,根據(jù)語(yǔ)義匹配值,能夠在多種符合語(yǔ)法的分析方案中,選擇一種比較符合語(yǔ)義邏輯的分析方案作為最終的分析結(jié)果,通過該方法可以進(jìn)行自然語(yǔ)言語(yǔ)句分析并獲取其中所蘊(yùn)含的知識(shí)。本發(fā)明基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法,包括如下過程
(I)定義自然語(yǔ)言處理的語(yǔ)義模型包括定義詞匯間的語(yǔ)義匹配關(guān)系;定義詞匯的語(yǔ)義修飾目標(biāo);以及定義語(yǔ)句的語(yǔ)義匹配值;
(2)定義詞匯語(yǔ)義的表示方法;
(3)定義詞匯間的語(yǔ)義匹配關(guān)系包括名詞-名詞間的語(yǔ)義匹配關(guān)系;名詞-動(dòng)詞間的語(yǔ)義匹配關(guān)系;名詞-形容詞的語(yǔ)義匹配關(guān)系;并列語(yǔ)義匹配關(guān)系;副詞的語(yǔ)義匹配關(guān)系;量詞的語(yǔ)義匹配關(guān)系;代詞的語(yǔ)義匹配關(guān)系;以及語(yǔ)法匹配關(guān);
(4)定義語(yǔ)句處理方法涉及語(yǔ)義結(jié)構(gòu)的三個(gè)層次及其文法;包括獲取最佳語(yǔ)法分析方案的思路,獲取最佳的語(yǔ)法分析方案,以及簡(jiǎn)單子句的最佳語(yǔ)義匹配值等幾部分;
(5)將分析結(jié)果轉(zhuǎn)化為知識(shí)點(diǎn)。
本發(fā)明的有益效果是本發(fā)明提出了一個(gè)自然語(yǔ)言處理的語(yǔ)義模型。在該模型中, 提出了語(yǔ)義匹配的概念,使用一個(gè)假設(shè)公理來(lái)判定最佳語(yǔ)法分析方案。由于使用該模型必須具有較為準(zhǔn)確的詞匯語(yǔ)義表示方式,本發(fā)明對(duì)基于描述邏輯的語(yǔ)義表示方式作了特殊化處理,其特點(diǎn)為
(I)將“格”和“模態(tài)”作為基本的語(yǔ)義關(guān)系;
(2)對(duì)描述邏輯進(jìn)行了變型、限制并賦予特殊的語(yǔ)義解釋,使之便于表示自然語(yǔ)言的詞匯語(yǔ)義;
基于該模型,本發(fā)明提出了一種基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言處理的方法,該方法具有以下的特點(diǎn)
(I)提出了基于語(yǔ)義匹配的自底向上的簡(jiǎn)單子句歸結(jié)法;
(2)語(yǔ)句分析的目的和結(jié)果是獲得語(yǔ)句中隱含的知識(shí)。
圖I是本發(fā)明基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法中基于語(yǔ)義關(guān)系的詞匯定義;
圖2是本發(fā)明基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法中文法規(guī)則示意圖。
具體實(shí)施方式
本發(fā)明基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法的具體實(shí)現(xiàn)過程如下
步驟I :
(Ia)定義詞匯間的語(yǔ)義匹配關(guān)系14
定義I :在詞匯語(yǔ)義知識(shí)庫(kù)中,任意兩個(gè)實(shí)詞^和^之間具有的內(nèi)在語(yǔ)義聯(lián)系,稱為語(yǔ)義匹配關(guān)系。用函數(shù)match(Wx,Wy)來(lái)表示其密切程度,函數(shù)的值就是語(yǔ)義匹配值。語(yǔ)義匹配關(guān)系與具體語(yǔ)句無(wú)關(guān)。假如Wx與Wy之間沒有語(yǔ)義匹配關(guān)系,則設(shè)置match (ffx, ffY) =MAX, MAX是一個(gè)大常數(shù)。
(Ib)定義2 :語(yǔ)句中的任意實(shí)詞Wi(除去謂語(yǔ)中心詞)均語(yǔ)義修飾于另外一個(gè)實(shí)詞Wei,稱Wei是Wi語(yǔ)義修飾目標(biāo)。
(Ic)定義3 :在特定的語(yǔ)法分析方案Ai的情況下,假設(shè)V為謂語(yǔ)中心詞,S為V的施動(dòng)者,O為V的承受者,Wi是語(yǔ)句中的一個(gè)實(shí)詞且!(Wi e {S,V, O}), Wei是Wi的語(yǔ)義修飾目標(biāo),用函數(shù)match (Wi, Wei)表示其語(yǔ)義匹配值,那么,整個(gè)語(yǔ)句的語(yǔ)義匹配值¥&111 可以用公式(I)來(lái)表示
vauleAi = kSvo :! (match(S, V) + match(0,V)) - Kw Σ ^matcliiWi, W(;i)i=i(I)
S和0的語(yǔ)義修飾目標(biāo)是V,η是實(shí)詞的個(gè)數(shù)(不包括S,V,O),Ksto和Kwi為權(quán)值系數(shù)。需要注意的是,值越小表示語(yǔ)義匹配程度越大。
(Id)假設(shè)公理I (最佳語(yǔ)法分析公理)假設(shè)一個(gè)語(yǔ)句具有m種語(yǔ)法分析方案,最符合語(yǔ)義邏輯的語(yǔ)法分析方案Ai滿足條件=A^argmin (ValueAi),即語(yǔ)義匹配值最小的語(yǔ)法分析方案是最佳語(yǔ)法分析方案。
步驟2
(2a)定義4(基本概念)在構(gòu)建語(yǔ)義庫(kù)前所設(shè)定的、無(wú)需進(jìn)行語(yǔ)義定義的、并在語(yǔ)句分析和推理時(shí)由系統(tǒng)進(jìn)行特別語(yǔ)義解釋處理的有限符號(hào)集合,基本概念數(shù)量極少,用 Cwb= {WB1, WfWBk}表不,默認(rèn)每個(gè)基本概念Wm繼承于根概念。
(2b)定義5(格)表示動(dòng)作類概念與其他事物之間相關(guān)情況的深層語(yǔ)義關(guān)系的特殊基本概念集合,用Cve=IC1, CfCj表不。例如“原因”是一個(gè)表不動(dòng)作原因的一個(gè)格。
(2c)定義6(模態(tài))表示動(dòng)作類概念的執(zhí)行狀態(tài)的特殊基本概念集合,用Cvm= {M1; MfM1J表不。例如“完成”是一個(gè)表不動(dòng)作已經(jīng)執(zhí)行完畢的一個(gè)模態(tài)。
(2d)定義7(基本的語(yǔ)義關(guān)系)在構(gòu)建語(yǔ)義庫(kù)前所設(shè)定的、不可改變的、并在語(yǔ)句分析時(shí)需要進(jìn)行特別語(yǔ)義解釋處理的語(yǔ)義關(guān)系,包括如下語(yǔ)義關(guān)系
Rc (V, C,W)格語(yǔ)義關(guān)系用以表示動(dòng)作類概念V與概念W具有格為C的深層語(yǔ)義關(guān)系,其中c e Cvc;
Rm(V, M)模態(tài)語(yǔ)義關(guān)系用以表示動(dòng)作類概念V的執(zhí)行狀態(tài)為M,其中C e Cvm ;
Rap(WjP)屬性語(yǔ)義關(guān)系用以表示概念P是名詞類概念W的一個(gè)屬性的語(yǔ)義關(guān)系;
Ras (W,S)狀態(tài)語(yǔ)義關(guān)系用以表示概念S是名詞類概念W的一個(gè)狀態(tài)的語(yǔ)義關(guān)系;
Rd(W)繼承語(yǔ)義關(guān)系概念的語(yǔ)義定義式中只能使用一次,例如W1繼承于W2 ;
Rp(W1, W2)描述部分語(yǔ)義關(guān)系的有限集合說明概念W2的語(yǔ)義是W1的語(yǔ)義的一部分;
Rw(W1, W2)描述整體關(guān)系的有限集合說明概念W1語(yǔ)義包含W2 ;
Rvs (V, W)表示動(dòng)作V的施動(dòng)者是W的語(yǔ)義關(guān)系,Rvo (V, W)表示動(dòng)作V的承受者是 W的語(yǔ)義關(guān)系。
(2e)定義8 (擴(kuò)展語(yǔ)義關(guān)系)在構(gòu)建語(yǔ)義庫(kù)過程中所新定義的語(yǔ)義關(guān)系集合,數(shù)量不限。在語(yǔ)句分析時(shí),所有的擴(kuò)展語(yǔ)義關(guān)系具有統(tǒng)一的處理方法,不進(jìn)行特殊的處理。用 Re (W1, W2)表示,說明被定義的概念W是巧和^之間的一種語(yǔ)義關(guān)系。在非定義式中,用 Rk (W,W1, W2)表示W(wǎng)1和W2之間存在名為W的擴(kuò)展語(yǔ)義關(guān)系。
(2f)基于基本描述邏輯,對(duì)其概念定義按規(guī)則1-7進(jìn)行限制和變換,成為本文的概念語(yǔ)義定義方法。
規(guī)則I (概念定義規(guī)則)
I)假如Wbi,Wb2是基本概念,R1, R2是語(yǔ)義關(guān)系,則新符號(hào)
W= I Wbi I R1 (Wbi) I ] Wbi I R1 (W81) IR1 (Wbi) UR2 (Wb2) | R1 (Wbi) η
R2 (Wb2)是概念;
2)假如Wbi,Wb2是概念,R1,R2是語(yǔ)義關(guān)系,則新符號(hào)
W=^wbi I n R1 (Wr1) U Wbi U R1 (Wbi) | R1 (Wbi) UR2 (Wb2)丨 Ri (Wbi) Π
R2 (Wb2)是概念;
在規(guī)則I中沒有概念并、概念交、量詞的使用規(guī)則,它們的處理方式見規(guī)則2-2。規(guī)則2-3是為了把概念的定義方式轉(zhuǎn)化為一組語(yǔ)義關(guān)系,并且要求名詞滿足單繼承的原則。
規(guī)則2 (概念并的處理規(guī)則)假如W1, W2是概念,WpW2的最近共同祖先概念為WP, 當(dāng)新概念W具有W=Wi U W2的語(yǔ)義時(shí),由于單繼承規(guī)則,可將W定義為W=Rd (Wp) n (Rp(ffP, W1) URp(Wp,W2))。例如,雙親=Rd(人)n (Rp(人,父親)U Rp(人,母親))。
規(guī)則3 (概念交的處理規(guī)則)假如W1,W2是概念,當(dāng)新概念W具有W=W1 n W2的語(yǔ)義時(shí),由于單繼承規(guī)則,可將W定義為W=Rd (W1) n Rff(W17W2)或W=Rd (W2) H Rw(W2jW1)0
規(guī)則2和規(guī)則3只不過是將概念并、概念交轉(zhuǎn)換了一種表示方式而已,只需規(guī)定該兩種表示方式的特定語(yǔ)義解釋即可,這樣做是為了解決多繼承問題和保證單繼承原則的一種變通手段,作用類似于java中的接口,以加快概念的檢索和匹配的速度。
在自然語(yǔ)言中,名詞均會(huì)在語(yǔ)義上直接或間接繼承于基本概念,為了更清晰準(zhǔn)確的表示名詞的語(yǔ)義,要求名詞語(yǔ)義表示時(shí)采用單繼承的原則,對(duì)于具有多繼承語(yǔ)義的概念, 采用規(guī)則2和規(guī)則3來(lái)處理。及物動(dòng)詞在語(yǔ)義上表示名詞對(duì)另一個(gè)名詞所做施加的一個(gè)動(dòng)作;不及物動(dòng)詞則表示名詞自身的一種變化;形容詞在語(yǔ)義上均表示名詞或名詞間的狀態(tài)或?qū)傩裕桓痹~在語(yǔ)義上均表示動(dòng)作的執(zhí)行情況(模態(tài))和相關(guān)情況(格)。因此,可用滿足規(guī)則4的方式來(lái)表示自然語(yǔ)言中各類詞匯的語(yǔ)義。
規(guī)則4(概念分類定義規(guī)則)自然語(yǔ)言中概念按性質(zhì)被分類表示為名詞、動(dòng)詞、形容詞、副詞。假設(shè)用Def(W)表示概念W的定義式,Num(R,W)為定義式中語(yǔ)義關(guān)系R的出現(xiàn)次數(shù),每類詞匯定義應(yīng)滿足如下規(guī)則
名詞的單繼承滿足條件(Rd(Wp) cDef(W)) n (Num(Rn, W)=l)的概念W。
動(dòng)詞:滿足條件(Rvs(W1) U (Rvo (W2)) [ Def (W) Γ (Num (Rvs,W1) =1)
n (Num (Rvo, W2) =1)。
形容詞:滿足條件(Rap(W,W1)URas(W,W1)) Def Cf)) Π
(Num (Rap, W) =1) η (Num (Ras,W)=l)。
副詞滿足條件(札(W1,D^Def(W)) n (Num(R , W)二I)。
規(guī)則5 (量詞的處理規(guī)則)量詞(V全稱量詞和存在量詞3)沒有得到特殊的對(duì)待,被作為”次數(shù)”格語(yǔ)義關(guān)系的一個(gè)值表示動(dòng)作的次數(shù),作為“數(shù)量”屬性語(yǔ)義關(guān)系的值來(lái)表示名詞的個(gè)數(shù)。因?yàn)檫@不影響自然語(yǔ)言的語(yǔ)法結(jié)構(gòu)分析,在推理時(shí)根據(jù)動(dòng)作的“次數(shù)”格和名詞“數(shù)量”屬性的值進(jìn)行具體分析。
規(guī)則6 (實(shí)例設(shè)置規(guī)則)在定義概念W時(shí),假如定義式中的概念Wi出現(xiàn)m次,而這 m次出現(xiàn)指代的η個(gè)語(yǔ)義{S1; SJ,則可用{W,ff#l-ff#n-l},來(lái)區(qū)別W的η個(gè)語(yǔ)義,ff#i在推理時(shí)可解釋為實(shí)例。
規(guī)則7 (多義詞處置規(guī)則)自然語(yǔ)言中有很多多義詞,假如多義詞W具有η個(gè)語(yǔ)義{S1; SfSJ,則針對(duì)每一個(gè)具體語(yǔ)義定義一個(gè)概念,共定義η個(gè)概念{W@1,W@2…獅η}來(lái)區(qū)別表示這η個(gè)不同語(yǔ)義。
(2g)假設(shè)公理2 :繼承語(yǔ)義關(guān)系具有單向傳遞性,下層概念繼承上層概念所具有語(yǔ)義關(guān)系。
定理I。根據(jù)繼承關(guān)系RD,所有名詞構(gòu)成一棵樹。
根據(jù)規(guī)則1-7和定義4-8,可以定義自然語(yǔ)言中詞匯的語(yǔ)義。假設(shè)用一條有向線段來(lái)表示語(yǔ)義關(guān)系的話,根據(jù)定理I和詞匯的定義和規(guī)則可知,詞匯W的語(yǔ)義可以由名詞樹中的一組有向線段來(lái)表不。
步驟3
(3a)定義名詞-名詞間的語(yǔ)義匹配關(guān)系
定義9 (關(guān)聯(lián)詞匯集)名詞定義式中所包含的所有詞匯的集合,用Ckw表示。例如附I中的名詞W的關(guān)聯(lián)詞匯集
Cew= {ff, Wp, Wrl, Wr2, Wr3, Wr4, Wr5, Wv, WvJ
在下文的分析中用~為表示繼承語(yǔ)義關(guān)系,Wx - ffY表示W(wǎng)x繼承于Wy,并且規(guī)定 W ~ W。
(I)基本語(yǔ)義匹配關(guān)系
定義10 (直接語(yǔ)義匹配關(guān)系)如果詞匯WX、WY滿足下述條件,用符號(hào)Wxn Wy表示
條件假設(shè)Wy的關(guān)聯(lián)詞匯集是C ,則
3 Wz Π (Wz E Cwy) Π (W產(chǎn) Wz)。
當(dāng)WxrWy時(shí),match (Wx, ffY) =KT*d (Wx, Wz)。
Kt為匹配關(guān)系系數(shù),根據(jù)所匹配的關(guān)系R的類型,設(shè)置為不同的常數(shù),一般有 I ^ Kt ^ 3ο
例如附I中{W^W^WwWd^W^Ww}中的每個(gè)詞匯都與W具有直接語(yǔ)義匹配關(guān)系。
定義11(繼承語(yǔ)義匹配關(guān)系)洳果詞匯^為滿足下述條件’用符號(hào)!^ Wy表示
條件3Wzn (wxr Wz) n (wYocwz)
當(dāng)WxrWy時(shí),match (Wx, ffY) =match (Wx, Wz) +d (ffY, Wz)。
例如附I 中 Iffdrt, Wdvc, Wdr2, Wd2,Wdr3, Wdr4, Wdr5I 與 Wdl,Wd2 具有繼承語(yǔ)義匹配關(guān)系。
定義語(yǔ)義距離函數(shù)d(Wx,Wy):表示具有繼承關(guān)系的兩個(gè)詞匯Wx,Wy之間的繼承次數(shù)。
(2)包含語(yǔ)義匹配關(guān)系
定義12 (顯式語(yǔ)義包含關(guān)系)如果詞匯Wx、Wy滿足下述條件,用符號(hào)Wx Θ Wy表/Jn ο
條件存在概念Wz,滿足條件
3Wz (Rw(WY, Wz) CDef (Wy)) Π (Wx^Wz)
當(dāng)Wx Θ Wy 時(shí),有 match (Wx,Wy) =Kp* (d (Wx,Wz)。Kp 為包含匹配關(guān)系系數(shù)。
定義13 (隱含語(yǔ)義包含關(guān)系):如果詞匯\、Wy滿足下述條件,用符號(hào)Wx〇Wy表/Jn ο
條件存在概念Wz,滿足條件
3 Wz (Rp(Wz, Wx) C Def (Wx)) fl (WzocWy )
當(dāng)Wx 〇 Wy 時(shí),match (Wx, ffY) =Kp* (d(Wz, ffY))。
定義14 (包含語(yǔ)義匹配關(guān)系):如果詞匯Wx、Wy滿足下述條件,用符號(hào)Wx ◎ Wy表示
條件=(WxOWy)U (WxOWy) U (3WZ ((WxOWz) H (WzOWy)))
當(dāng)Wx ◎ Wy 時(shí),match (ffx, ffY)=
min {match (ffx, Wz) +match (Wz, ffY), match (ffx, ffY)}
定理3 :當(dāng)詞匯WX、WY滿足WX€)WY時(shí),WY具有WX的語(yǔ)義關(guān)系。
(3b)名詞-動(dòng)詞間的語(yǔ)義匹配關(guān)系
名詞-動(dòng)詞的語(yǔ)義匹配關(guān)系可以分為兩類
I) SVO語(yǔ)義匹配關(guān)系名詞可能作施動(dòng)者或動(dòng)作的承受者
2)格語(yǔ)義匹配關(guān)系名詞與動(dòng)詞具有格語(yǔ)義匹配關(guān)系
假設(shè)動(dòng)詞為V,V的定義中的施動(dòng)名詞為Stl,受動(dòng)名詞為(V由于在定義時(shí)已經(jīng)將 S0設(shè)置為可能實(shí)施V的最高層名詞,O0設(shè)置為承受該動(dòng)作的最高層名詞,所以只有同Stl或 O0具有某種關(guān)系的名詞S和名詞O才有可能執(zhí)行動(dòng)作V,即構(gòu)成SVO的語(yǔ)義匹配。SVO語(yǔ)義匹配有6種情況,其值可用Valuesw表示,計(jì)算公式如下
Valuesvo=match (S, S。)+match (O, O0)
定義15 (常規(guī)SVO語(yǔ)義匹配關(guān)系):滿足條件(S OC S0) η (O- O0)。
定義16 (重載SVO語(yǔ)義匹配關(guān)系)滿足條件
((SO n (aRvo(Rvo(V, W) CDef (S)) fl (OD) U ((O^O0) Π
(3Rvs(Rvs(V, W) cDef (O)) Γ (S^W))
對(duì)于名詞S和O以及動(dòng)詞V,當(dāng)V的定義中不滿足SVO匹配時(shí),而S、0的定義說明它們滿足SVO匹配。
例戒指=Rd (飾品)n Rvs (佩戴,人)n Rvq(佩戴,飾品)n Rc(佩戴,位置,手), 由于“戒指”中包含了 Rvs(佩戴,人),所以{人,佩戴,戒指}構(gòu)成重載SVO語(yǔ)義匹配關(guān)系。
定義17 (包含SVO語(yǔ)義匹配關(guān)系):滿足條件((S(DStl) H (O-O0)) U ((S-S0) H (O ◎ O0))。
例班級(jí)=Rd(集合)n Rff(集合,學(xué)生),由于“學(xué)生”可以“吃” “飯”,“學(xué)生”是 “班級(jí)”的一部分,所以{班級(jí),吃,飯}構(gòu)成整體SVO語(yǔ)義匹配關(guān)系。
定義18(相似SVO語(yǔ)義匹配關(guān)系):滿足條件((S^Sci) H (O-O0)) U ((S-S0) H (O …O0))。18
定義19 (比喻SVO語(yǔ)義匹配關(guān)系):在下述條件下,猜測(cè)語(yǔ)句中可能存在比喻
條件I :在整個(gè)語(yǔ)句中沒有任何名詞可以滿足前四種SVO匹配。
條件2 :語(yǔ)句中存在名詞S或0,滿足!(S OC S0) n (Ooc Otl),猜測(cè)將S比喻為S。。
或條件3 :語(yǔ)句中存在名詞S或0,滿足(So^Stl) η ! (O ~ O。),猜測(cè)將O比喻為O。。
對(duì)于比喻SVO 語(yǔ)義匹配關(guān)系,Valuesvo=Kp* (match (S, ffP) +match (O, Wp))
Kf為權(quán)值系數(shù),Wp是S和Stl的最近共同祖先。因?yàn)閷儆诓聹y(cè)性質(zhì),Kf的值應(yīng)比較大,以防止不良影響。
定義20(格語(yǔ)義匹配關(guān)系)對(duì)于名詞W和動(dòng)詞V,滿足3Rc(V,L Wc) C Def (V) n (W^Wc) O
match (W,V) =Kc*d(ff, Wc),Kc 為權(quán)值系數(shù)。
(3c)名詞_形容詞的語(yǔ)義匹配關(guān)系
對(duì)于形容詞Wva和名詞WN,滿足
3W((Ras(W, W1) U (Rap (W,W1)) cDef (Wva) n (W產(chǎn)W)),
match (ffVA, ffN) =KA*d (ffN, ff),Ka 為權(quán)值系數(shù)(一般 KA=1)。
(3d)并列語(yǔ)義匹配關(guān)系
并列語(yǔ)義匹配關(guān)系僅用于語(yǔ)句中并列結(jié)構(gòu)的判斷,以確定連詞的轄域。
定義21 (語(yǔ)義相似)由于名詞定義采用了單繼承的方法,兩個(gè)名詞Wx、Wy雖然在定義式中沒有繼承關(guān)系,但在語(yǔ)義上Wx卻可能是Wy的一種,相當(dāng)于描述邏輯中的概念蘊(yùn)含, 用符號(hào)Wx - Wy表示??蓪?duì)描述邏輯中的Tableau算法加以改進(jìn),以判斷概念語(yǔ)義相似關(guān)系O
定義22 (名詞并列語(yǔ)義匹配關(guān)系)對(duì)于兩個(gè)名詞Wx,Wy可用match (ffx, WY) =Kt* (d (ffx, WE) +d (ffY, WE))計(jì)算出一個(gè)數(shù)值,作為啟發(fā)信息,We是WX、WY的距離最近的共同祖先節(jié)點(diǎn)。當(dāng)滿足Wx - Wy時(shí),也可能是并列關(guān)系。
定義23 (動(dòng)詞并列語(yǔ)義匹配關(guān)系)對(duì)于兩個(gè)動(dòng)詞Vx,Vy可用match (ffx, WY) =KT*(d(Sxo,SY0)+d(0X0, Oyo))計(jì)算出一個(gè)數(shù)值,作為啟發(fā)信息,{Sxo, SY0, Oxo, OycJ 是 Wx,Wy 定義中的施動(dòng)者和受動(dòng)者。
(3e)其它類詞匯間的語(yǔ)義匹配關(guān)系
副詞的語(yǔ)義匹配關(guān)系關(guān)于副詞修飾形容詞和副詞,也有很復(fù)雜的情況,本文暫不作討論,假設(shè)副詞可以語(yǔ)義匹配于動(dòng)詞、形容詞和副詞,規(guī)定match^,W2) =O0量詞的語(yǔ)義匹配關(guān)系詞匯庫(kù)應(yīng)保存量詞與名詞的關(guān)聯(lián)關(guān)系。假如量詞W可以修飾名詞Wn,則規(guī)定 match (ff, WN) =0 ;否則match (ff, ffN) =MAX。代詞的語(yǔ)義匹配關(guān)系根據(jù)代詞的指代關(guān)系,將代詞替換成相應(yīng)的名詞進(jìn)行處理,比如把“我”按“人”處理。
(3f)語(yǔ)法匹配關(guān)系
特別注意前面的各種語(yǔ)義匹配關(guān)系是內(nèi)在的,與具體語(yǔ)句無(wú)關(guān)。在具體的語(yǔ)句中,可能某些類型的詞匯互相修飾,但詞匯本身之間并沒有內(nèi)在的語(yǔ)義關(guān)系,只是在本語(yǔ)句內(nèi)可能有語(yǔ)義修飾關(guān)系的一種語(yǔ)法現(xiàn)象(即語(yǔ)法上的修飾關(guān)系),主要包括以下兩種情況
(I)不常見的詞類間修飾關(guān)系動(dòng)詞-動(dòng)詞之間;副詞-名詞之間;形容詞-動(dòng)詞之間等。例如“喜歡游泳” “老實(shí)說”等;這些都屬于語(yǔ)法匹配關(guān)系,詞匯本身之間沒有內(nèi)在的語(yǔ)義匹配關(guān)系,只是在語(yǔ)句中具有語(yǔ)法上的修飾關(guān)系而已。在語(yǔ)句分析過程中其語(yǔ)義匹配值可用match (Wx, WY) =MAX/Kg計(jì)算,Kg是類型權(quán)值(一般情況下Ke=l,或滿足Ke〈l. 5)。
(2)詞類活用,例如形容詞經(jīng)常會(huì)被活用為副詞,這種情況本文不考慮。
步驟4:
(4a)定義語(yǔ)義結(jié)構(gòu)的三個(gè)層次及其文法
要根據(jù)本文的語(yǔ)義模型進(jìn)行語(yǔ)句分析,必須具有適合語(yǔ)義模型的語(yǔ)句抽象表示方法。任何語(yǔ)句都是由結(jié)構(gòu)比較簡(jiǎn)單的語(yǔ)句經(jīng)過迭代而形成的,短語(yǔ)被看成語(yǔ)句內(nèi)的一個(gè)組成部分。為了滿足語(yǔ)義模型的語(yǔ)義分析需要,根據(jù)語(yǔ)義結(jié)構(gòu)的復(fù)雜程度和特點(diǎn)可以將語(yǔ)句的語(yǔ)義結(jié)構(gòu)劃分為三個(gè)層次簡(jiǎn)單句、特殊簡(jiǎn)單句、復(fù)雜句。
定義24 (簡(jiǎn)單句)僅有一個(gè)動(dòng)詞或形容詞作謂語(yǔ)的語(yǔ)句Cs,可用文法G1來(lái)抽象描述。
用格語(yǔ)法的思想設(shè)計(jì)文法G1,設(shè)計(jì)思路假設(shè)V是謂語(yǔ),S是V的施動(dòng)者;0是V的承受者,AB是前置定語(yǔ);Aa是后置定語(yǔ);PD是狀語(yǔ)或補(bǔ)語(yǔ),相當(dāng)于格語(yǔ)法中的一組格;P。是一個(gè)的格內(nèi)容;n是名詞;NP為名詞短語(yǔ)。
文法G1中的規(guī)則數(shù)目較多(詳細(xì)的規(guī)則數(shù)目較多,略),其關(guān)鍵規(guī)則的設(shè)計(jì)思路如下
DCs- PdAbSAaPdVPdAbOAaPd (SV0的出現(xiàn)順序有10種,附2是其中的一種)
2)S — n| SAaAbS(多個(gè)詞匯作施動(dòng)者,如圖2中的S)
3) Pd-Pc I PdPc
S、0、Ab、Aa、P。中的介詞、連詞、助詞、數(shù)詞、量詞等詞匯的使用規(guī)則可以很容易的寫出來(lái)。
文法的Gl的具體表示方式如下
權(quán)利要求
1.基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法,包括如下過程(1)定義自然語(yǔ)言處理的語(yǔ)義模型包括定義詞匯間的語(yǔ)義匹配關(guān)系;定義詞匯的語(yǔ)義修飾目標(biāo);以及定義語(yǔ)句的語(yǔ)義匹配值;(2)定義詞匯語(yǔ)義的表示方法;(3)詞匯間的語(yǔ)義匹配關(guān)系包括名詞-名詞間的語(yǔ)義匹配關(guān)系;名詞-動(dòng)詞間的語(yǔ)義匹配關(guān)系;名詞-形容詞的語(yǔ)義匹配關(guān)系;并列語(yǔ)義匹配關(guān)系;副詞的語(yǔ)義匹配關(guān)系;量詞的語(yǔ)義匹配關(guān)系;代詞的語(yǔ)義匹配關(guān)系;以及語(yǔ)法匹配關(guān);(4)定義語(yǔ)句處理方法涉及語(yǔ)義結(jié)構(gòu)的三個(gè)層次及其文法;包括獲取最佳語(yǔ)法分析方案的思路,獲取最佳的語(yǔ)法分析方案,以及簡(jiǎn)單子句的最佳語(yǔ)義匹配值等幾部分;(5)將分析結(jié)果轉(zhuǎn)化為知識(shí)點(diǎn)。
2.根據(jù)權(quán)利要求I所述的基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法,其中步驟(I) 按如下過程執(zhí)行(Ia)定義詞匯間的語(yǔ)義匹配關(guān)系定義I :在詞匯語(yǔ)義知識(shí)庫(kù)中,任意兩個(gè)實(shí)詞 和^之間具有的內(nèi)在語(yǔ)義聯(lián)系,稱為語(yǔ)義匹配關(guān)系,其中副詞按實(shí)詞對(duì)待;用函數(shù)match (Wx,Wy)來(lái)表示其密切程度,函數(shù)的值就是語(yǔ)義匹配值;語(yǔ)義匹配關(guān)系與具體語(yǔ)句無(wú)關(guān);假如Wx與Wy之間沒有語(yǔ)義匹配關(guān)系,則設(shè)置 match (Wx, ffY) =MAX, MAX 是一個(gè)大常數(shù);(Ib)定義2:語(yǔ)句中的除去謂語(yǔ)中心詞之外的任意實(shí)詞Wi均語(yǔ)義修飾于另外一個(gè)實(shí)詞Wei,稱Wei是Wi語(yǔ)義修飾目標(biāo);(Ic)定義3 :在任意的語(yǔ)法分析方案Ai的情況下,假設(shè)V為謂語(yǔ)中心詞,S為V的施動(dòng)者,O為V的承受者,Wi是語(yǔ)句中的一個(gè)實(shí)詞且!(Wi e {S,V, O}), Wei是Wi的語(yǔ)義修飾目標(biāo),用函數(shù)match (Wi7Wci)表示其語(yǔ)義匹配值,那么,整個(gè)語(yǔ)句的語(yǔ)義匹配值ValueAi,可以用公式⑴來(lái)表示DVanIeΛι = Ksvo (match(S, V) + rnatch(0, V)) + KV ^itch(WpW7cj)i=i(I)S和0的語(yǔ)義修飾目標(biāo)是V,η是不包括S,V和O的實(shí)詞的個(gè)數(shù),Ksvtj和Kwi為權(quán)值系數(shù), 語(yǔ)義匹配值越小表示語(yǔ)義匹配程度越大;(Id)假設(shè)公理I——最佳語(yǔ)法分析公理假設(shè)一個(gè)語(yǔ)句具有m種語(yǔ)法分析方案,最符合語(yǔ)義邏輯的語(yǔ)法分析方案Ai滿足條件-Ai = argmin (ValueAi),即語(yǔ)義匹配值最小的語(yǔ)法分析方案是最佳語(yǔ)法分析方案。
3.根據(jù)權(quán)利要求I所述的基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法,其中步驟(2) 按如下過程執(zhí)行(2a)定義4——基本概念在構(gòu)建語(yǔ)義庫(kù)前所設(shè)定的、無(wú)需進(jìn)行語(yǔ)義定義的、并在語(yǔ)句分析和推理時(shí)由系統(tǒng)進(jìn)行特別語(yǔ)義解釋處理的有限符號(hào)集合,基本概念數(shù)量極少,用 Cwb= {WB1, WfWBk}表不,默認(rèn)每個(gè)基本概念Wm繼承于根概念;(2b)定義5——格表示動(dòng)作類概念與其他事物之間相關(guān)情況的深層語(yǔ)義關(guān)系的特殊基本概念集合,用Cvc= (C1, CfCj表不;(2c)定義6——模態(tài)表示動(dòng)作類概念的執(zhí)行狀態(tài)的特殊基本概念集合,用CvmHM1, MfMj表不;(2d)定義7——基本的語(yǔ)義關(guān)系在構(gòu)建語(yǔ)義庫(kù)前所設(shè)定的、不可改變的、并在語(yǔ)句分析時(shí)需要進(jìn)行特別語(yǔ)義解釋處理的語(yǔ)義關(guān)系,包括如下語(yǔ)義關(guān)系Rc (V, C,W)格語(yǔ)義關(guān)系用以表示動(dòng)作類概念V與概念W具有格為C的深層語(yǔ)義關(guān)系, 其中C e Cvc ;R1 (V, M)模態(tài)語(yǔ)義關(guān)系用以表示動(dòng)作類概念V的執(zhí)行狀態(tài)為M,其中C e Cvm ;Rap(W,P)屬性語(yǔ)義關(guān)系用以表示概念P是名詞類概念W的一個(gè)屬性的語(yǔ)義關(guān)系;Ras(W,S)狀態(tài)語(yǔ)義關(guān)系用以表示概念S是名詞類概念W的一個(gè)狀態(tài)的語(yǔ)義關(guān)系; Rd(W)繼承語(yǔ)義關(guān)系概念的語(yǔ)義定義式中只能使用一次;Rpd1, W2)描述部分語(yǔ)義關(guān)系的有限集合說明概念W2的語(yǔ)義是W1的語(yǔ)義的一部分; Rff (W1, W2)描述整體關(guān)系的有限集合說明概念W1語(yǔ)義包含W2 ;Rvs (V,W)表示動(dòng)作V的施動(dòng)者是W的語(yǔ)義關(guān)系,Rvo (V, W)表示動(dòng)作V的承受者是W的語(yǔ)義關(guān)系;(2e)定義8——擴(kuò)展語(yǔ)義關(guān)系在構(gòu)建語(yǔ)義庫(kù)過程中所新定義的語(yǔ)義關(guān)系集合,數(shù)量不限;在語(yǔ)句分析時(shí),所有的擴(kuò)展語(yǔ)義關(guān)系具有統(tǒng)一的處理方法,不進(jìn)行特殊的處理;用 Re(W1, W2)表示,說明被定義的概念W是W1和W2之間的一種語(yǔ)義關(guān)系;在非定義式中,用 Rk (W,W1, W2)表示W(wǎng)1和W2之間存在名為W的擴(kuò)展語(yǔ)義關(guān)系;(2f)基于基本描述邏輯,對(duì)其概念定義按規(guī)則I到規(guī)則7進(jìn)行限制和變換,成為概念語(yǔ)義定義方法;規(guī)則I—概念定義規(guī)則1)假如WB1,Wb2是基本概念,R1,R2是語(yǔ)義關(guān)系,則新符號(hào)W= I ffB11,R1 (Wbi) I q Wbi U R1 (Wbi) I Rj (Wm) U R2 (Wb2) I R1 (Wbi)門 R2 (Wb2)是概念;2)假如WB1,Wb2是概念,R1,R2是語(yǔ)義關(guān)系,則新符號(hào)W=,Wbi I,R1 (Wb1) I -,WbiURi (Wbi) | R1 (Wbi) UR2 (Wb2)丨 Ri (Wbi)門 R2 (Wb2)是概念;在規(guī)則I中沒有概念并、概念交、量詞的使用規(guī)則,它們的處理方式見規(guī)則2、規(guī)則3,它們是為了把概念的定義方式轉(zhuǎn)化為一組語(yǔ)義關(guān)系,并且要求名詞滿足單繼承的原則;規(guī)則2—概念并的處理規(guī)則假如W1, W2是概念,W1, W2的最近共同祖先概念為WP, 當(dāng)新概念W具有W=Wi U W2的語(yǔ)義時(shí),由于單繼承規(guī)則,可將W定義為W=Rd (Wp) H (Rp(ffP, W1) U Rp(WpjW2));規(guī)則3——概念交的處理規(guī)則假如W1, W2是概念,當(dāng)新概念w具有W=Wi H W2的語(yǔ)義時(shí),由于單繼承規(guī)則,可將W定義為W=Rd (W1) n Rff(W17W2)或W=Rd (W2) H Rff(W27W1);規(guī)則4——概念分類定義規(guī)則自然語(yǔ)言中概念按性質(zhì)被分類表示為名詞、動(dòng)詞、形容詞和副詞;假設(shè)用Def(W)表示概念W的定義式,Num(R,W)為定義式中語(yǔ)義關(guān)系R的出現(xiàn)次數(shù),每類詞匯定義應(yīng)滿足如下規(guī)則名詞的單繼承:滿足條件(Rd(Wp) [Def(W)) Γ (Num(RD, W)=l)的概念W ;動(dòng)詞:滿足條件(Rvs(W1) U (Rv0(W2))cDef(W) Π (Num(Rvs,W1)二I)Π (Num (Rvo,W2) =1);形容詞滿足條件(Rap (W,W1) U Ras (W,W1)) [Def (W)) Π(Num(Rap, W)=l) n (Num(Ras, W)=l);副詞滿足條件(Rm (W1, Dc=Def(W)) Γ (Num(Rh, W)=l);規(guī)則5—量詞的處理規(guī)則量詞沒有得到特殊的對(duì)待,被作為”次數(shù)”格語(yǔ)義關(guān)系的一個(gè)值表示動(dòng)作的次數(shù),作為“數(shù)量”屬性語(yǔ)義關(guān)系的值來(lái)表示名詞的個(gè)數(shù);規(guī)則6—實(shí)例設(shè)置規(guī)則在定義概念W時(shí),假如定義式中的概念Wi出現(xiàn)m次,而這m 次出現(xiàn)指代的η個(gè)語(yǔ)義(S1,S^SJ,則可用{Ι,·1····η-1},來(lái)區(qū)別W的η個(gè)語(yǔ)義,W#i在推理時(shí)可解釋為實(shí)例;規(guī)則7——多義詞處置規(guī)則自然語(yǔ)言中有很多多義詞,假如多義詞W具有η個(gè)語(yǔ)義 {S1; S^SJ,則針對(duì)每一個(gè)具體語(yǔ)義定義一個(gè)概念,共定義η個(gè)概念{W@1,W@2···獅η}來(lái)區(qū)別表示這η個(gè)不同語(yǔ)義;(2g)假設(shè)公理2 :繼承語(yǔ)義關(guān)系具有單向傳遞性,下層概念繼承上層概念所具有語(yǔ)義關(guān)系;定理I :根據(jù)繼承關(guān)系RD,所有名詞構(gòu)成一棵樹;根據(jù)規(guī)則I到規(guī)則7和定義4到定義8,可以定義自然語(yǔ)言中詞匯的語(yǔ)義;假設(shè)用一條有向線段來(lái)表示語(yǔ)義關(guān)系的話,根據(jù)定理I和詞匯的定義和規(guī)則可知,詞匯W的語(yǔ)義可以由名詞樹中的一組有向線段來(lái)表不。
4.根據(jù)權(quán)利要求I所述的基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法,其中步驟(3) 按如下過程執(zhí)行(3a)定義名詞-名詞間的語(yǔ)義匹配關(guān)系定義9——關(guān)聯(lián)詞匯集名詞定義式中所包含的所有詞匯的集合,用Ckw表示;用~為表示繼承語(yǔ)義關(guān)系,Wx - Wy表示W(wǎng)x繼承于WY,并且規(guī)定W ~ W ;(1)基本語(yǔ)義匹配關(guān)系定義10——直接語(yǔ)義匹配關(guān)系如果詞匯^、Wy滿足下述條件,用符號(hào)Wx] Wy表示 條件假設(shè)Wy的關(guān)聯(lián)詞匯集是Cw,則31H (WzGCwy) Π (W產(chǎn)Wz);當(dāng) WxI Wy時(shí),match (Wx, WY) =KT*d (Wx, Wz);Kt為匹配關(guān)系系數(shù),根據(jù)所匹配的關(guān)系R的類型,設(shè)置為不同的常數(shù),I ^ Kt ^ 3 ; 定義11——繼承語(yǔ)義匹配關(guān)系如果詞匯^、Wy滿足下述條件,用符號(hào)Wx ; Wy表示條件3Wz n (wxi wz) n (wYo=wz)當(dāng) Wx i W'時(shí),match (Wx, ffY) =match (Wx, Wz) +d (ffY, Wz);定義語(yǔ)義距離函數(shù)d(Wx,WY):表示具有繼承關(guān)系的兩個(gè)詞匯Wx,Wy之間的繼承次數(shù);(2)包含語(yǔ)義匹配關(guān)系定義12——顯式語(yǔ)義包含關(guān)系如果詞匯Wx、Wy滿足下述條件,用符號(hào)Wx Θ Wy表示; 條件存在概念Wz,滿足條件3% (Rw(Wv, Wz) eDef (Wy)) Π (Wx-=Wz)當(dāng)Wx Θ Wy時(shí),有match (Wx, ffY) =Kp* (d (Wx, Wz)。Kp為包含匹配關(guān)系系數(shù);定義13——隱含語(yǔ)義包含關(guān)系如果詞匯Wx、Wy滿足下述條件,用符號(hào)Wx〇Wy表示; 條件存在概念Wz,滿足條件3 Wz (Rp(Wz, W ) c Def (Wx)) n (WzO=Wy )當(dāng) Wx 〇 WY 時(shí),match (ffx, ffY) =KP* (d (ffz, ffY));定義14——包含語(yǔ)義匹配關(guān)系如果詞匯WX、WY滿足下述條件,用符號(hào)Wx ◎ WY表示 條件
5.根據(jù)權(quán)利要求I所述的基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法,其中步驟(4) 按如下過程執(zhí)行(4a)定義語(yǔ)義結(jié)構(gòu)的三個(gè)層次及其文法要根據(jù)本文的語(yǔ)義模型進(jìn)行語(yǔ)句分析,必須具有適合語(yǔ)義模型的語(yǔ)句抽象表示方法; 任何語(yǔ)句都是由結(jié)構(gòu)比較簡(jiǎn)單的語(yǔ)句經(jīng)過迭代而形成的,短語(yǔ)被看成語(yǔ)句內(nèi)的一個(gè)組成部分;為了滿足語(yǔ)義模型的語(yǔ)義分析需要,根據(jù)語(yǔ)義結(jié)構(gòu)的復(fù)雜程度和特點(diǎn)可以將語(yǔ)句的語(yǔ)義結(jié)構(gòu)劃分為三個(gè)層次簡(jiǎn)單句、特殊簡(jiǎn)單句、復(fù)雜句;定義24——簡(jiǎn)單句僅有一個(gè)動(dòng)詞或形容詞作謂語(yǔ)的語(yǔ)句Cs,可用文法G1來(lái)抽象描述;用格語(yǔ)法的思想設(shè)計(jì)文法G1,設(shè)計(jì)思路假設(shè)V是謂語(yǔ),S是V的施動(dòng)者;0是V的承受者,Ab是前置定語(yǔ);Aa是后置定語(yǔ);PD是狀語(yǔ)或補(bǔ)語(yǔ),相當(dāng)于格語(yǔ)法中的一組格;PC是一個(gè)的格內(nèi)容;n是名詞;NP為名詞短語(yǔ);文法G1中的規(guī)則數(shù)目較多,其關(guān)鍵規(guī)則的設(shè)計(jì)思路如下DCs-PdAbSAaPdVPdAbOAaPd2)S — η I SAaAbS3)Pd —PcIPdPcS、0、Ab、Aa、P。中的介詞、連詞、助詞、數(shù)詞、量詞的使用規(guī)則可以很容易的寫出來(lái);簡(jiǎn)單句中的SVO總共具有6種不同順序SVO、SOV、VSO、OSV、VOS、OVS ;SV、VS ;簡(jiǎn)單句
6.根據(jù)權(quán)利要求I所述的基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法,其中步驟(5)按如下過程執(zhí)行根據(jù)具有最佳語(yǔ)義匹配值的語(yǔ)法分析結(jié)果,將簡(jiǎn)單句轉(zhuǎn)化為一個(gè)知識(shí)點(diǎn),將復(fù)雜句的每個(gè)簡(jiǎn)單子句轉(zhuǎn)化為知識(shí)點(diǎn),整個(gè)復(fù)雜化句轉(zhuǎn)化為一組知識(shí)點(diǎn);將語(yǔ)句轉(zhuǎn)化為以結(jié)構(gòu)化數(shù)據(jù)形式存放的知識(shí)點(diǎn)后,就可方便地對(duì)這些知識(shí)數(shù)據(jù)進(jìn)行各種智能信息處理。
全文摘要
本發(fā)明公開了一種基于語(yǔ)義匹配驅(qū)動(dòng)的自然語(yǔ)言知識(shí)獲取方法,包括如下過程(1)定義自然語(yǔ)言處理的語(yǔ)義模型;(2)定義詞匯語(yǔ)義的表示方法;(3)定義詞匯間的語(yǔ)義匹配關(guān)系;(4)定義語(yǔ)句處理方法;(5)將分析結(jié)果轉(zhuǎn)化為知識(shí)點(diǎn)。該方法利用語(yǔ)義匹配信息,結(jié)合少量自然語(yǔ)言中常見的語(yǔ)法規(guī)則,根據(jù)語(yǔ)義匹配值,能夠在多種符合語(yǔ)法的分析方案中,選擇一種比較符合語(yǔ)義邏輯的分析方案作為最終的分析結(jié)果。通過該方法可以進(jìn)行自然語(yǔ)言語(yǔ)句分析并獲取其中所蘊(yùn)含的知識(shí)。實(shí)驗(yàn)證明,該方法具有較好的可行性。
文檔編號(hào)G06F17/28GK102945230SQ20121039662
公開日2013年2月27日 申請(qǐng)日期2012年10月17日 優(yōu)先權(quán)日2012年10月17日
發(fā)明者劉運(yùn)通, 郭磊, 王愛民 申請(qǐng)人:劉運(yùn)通, 郭磊, 王愛民