欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于云本體的茶樹蟲害智能診斷原型系統(tǒng)的制作方法

文檔序號:6375607閱讀:317來源:國知局
專利名稱:一種基于云本體的茶樹蟲害智能診斷原型系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本技術(shù)方案是計(jì)算機(jī)信息技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用,具體是一種基于云本體的茶樹蟲害智能診斷原型系統(tǒng)。
背景技術(shù)
茶起源于中國,中國有著源遠(yuǎn)流長的飲茶歷史,也是世界上重要的茶葉產(chǎn)地。我國茶葉產(chǎn)業(yè)的飛速發(fā)展,對茶學(xué)領(lǐng)域知識的服務(wù)提出了更高的要求。茶學(xué)領(lǐng)域內(nèi)容極其豐富龐大,包括茶的種類、茶的產(chǎn)地、茶葉的栽培、茶的生物化學(xué)、茶文化、茶食品以及茶樹病蟲
_坐坐舌寸寸ο
縱觀整個(gè)茶學(xué)領(lǐng)域,茶樹病蟲害是我國茶葉生產(chǎn)的重點(diǎn)。由于氣候溫暖、空氣濕潤、環(huán)境多樣等原因,茶樹昆蟲區(qū)系復(fù)雜,種類繁多,發(fā)病嚴(yán)重,為茶葉生產(chǎn)帶來嚴(yán)重威脅。因此,能否及時(shí)診斷與防治病蟲害成為大家共同關(guān)心的問題。為了減少病蟲害帶來的損失,除了推廣和普及診斷防治知識之外,研究開發(fā)各種診斷專家系統(tǒng),協(xié)助茶葉生產(chǎn)者及早診斷與防治茶樹病蟲害,便成了眾多研究機(jī)構(gòu)的研究方向。在實(shí)際應(yīng)用中還發(fā)現(xiàn)茶樹蟲害領(lǐng)域中存在大量不確定性知識,無法使用本體語言進(jìn)行精確表達(dá)。用自然語言描述的茶樹發(fā)病癥狀和害蟲體征,其內(nèi)容有很多屬于模糊概念,意思相近的詞語之間的區(qū)別沒有嚴(yán)格的定義和劃分。諸如黃色、淺黃色、深黃色、黃白色、鵝黃色等,這些詞語都是些模糊的相對的概念,不適宜出現(xiàn)在本體和系統(tǒng)中作為判定依據(jù)。而氣候、環(huán)境、旱澇等隨機(jī)性因素亦會(huì)對蟲害診斷結(jié)果造成不同的影響。不確定性的概念實(shí)際是自然語言的不確定性,這種不確定性顯而易見,而概念間的關(guān)系中同樣存在相當(dāng)?shù)牟淮_定性。無論是分類關(guān)系還是非分類關(guān)系,都存在許多確定的關(guān)系,例如“鞘翅目-天??啤?、“吸汁-芽葉”等等,這些關(guān)系是是既定事實(shí),不存在不確定性。但是,概念間關(guān)系中也存在很多諸如“天陰-下雨”這樣的不確定性的關(guān)系。在涉及到茶樹蟲害領(lǐng)域知識的本體構(gòu)建中,這類不確定性關(guān)系的出現(xiàn)不可避免。對于不確定性知識的處理,現(xiàn)有技術(shù)紅可以采用云模型概念,該云模型概念可以普遍適用于數(shù)據(jù)挖掘、決策分析、智能控制和圖像處理等眾多領(lǐng)域。云模型是用語言值描述的某個(gè)定性概念與其數(shù)值表示之間的不確定性轉(zhuǎn)換模型。設(shè)X是一個(gè)普通集合。X={x},稱為論域。關(guān)于論域X中的模糊集合2,是指對于任意元素X
都存在一個(gè)有穩(wěn)定傾向的隨機(jī)數(shù),叫做X對j的隸屬度。如果論域中的元素是簡單有
序的,則X可以看作是基礎(chǔ)變量,隸屬度在X上的分布叫做隸屬云;如果論域中的元素不是簡單有序的,而根據(jù)某個(gè)法則f,可將X映射到另一個(gè)有序的論域)^上,中的一個(gè)且只有一個(gè)X ^和X對應(yīng),則X丨為基礎(chǔ)變量,隸屬度在X丨上的分布叫做隸屬云。云的三個(gè)數(shù)字特征分別是期望ExJg En,超熵He。期望Ex是論域的中心值,它永遠(yuǎn)都隸屬于這個(gè)定性概念,且最能夠代表這個(gè)定性概念。反映在云形上就是云的“最高點(diǎn)”,即隸屬度為I的點(diǎn)。熵En表示一個(gè)定性概念可被度量的范圍,熵越大概念越宏觀,即可被度量的范圍越廣。熵En反映了模糊概念的亦此亦彼性的裕度,即這個(gè)定性概念的不確定性,又稱模糊性,反映在云形上就表示云的“跨度”,即熵越大,云的“跨度”越大。超熵He是指熵的熵,它表示樣本出現(xiàn)的隨機(jī)性,即熵的不確定性,在云圖上即云滴(請說明一下“云滴”的概念)的離散程度,超熵將模糊性和隨機(jī)性相關(guān)聯(lián),它反映在云形上表示云的“厚度”,超熵越大,云越“厚”。這三個(gè)數(shù)字特征把模糊性和隨機(jī)性結(jié)合在一起,非常形象的把云的形狀展示出來,完成了定性和定量間的相互映射,很好地解決了不確定性知識的表達(dá)問題。定性概念和定量數(shù)據(jù)之間的轉(zhuǎn)換通過云發(fā)生器來實(shí)現(xiàn)。云發(fā)生器(CloudGenerator,簡稱CG)即云生產(chǎn)算法,可以通過模塊化的軟件實(shí)現(xiàn),也可以通過固化的硬件實(shí)現(xiàn)。按實(shí)現(xiàn)的功能不同,云發(fā)生器可劃分為正向云發(fā)生器和逆向云發(fā)生器。正向云發(fā)生器是一個(gè)前向的、直接的過程,輸入三個(gè)云的數(shù)字特征(Ex,En, He)以及需要生成的云滴數(shù),輸出每個(gè)云滴的坐標(biāo),以及每個(gè)云滴代表的確定度。正向云發(fā)生器的 生成算法如下輸入各定性概念的三個(gè)數(shù)字特征(Ex,En, He),生成云滴的個(gè)數(shù)η。輸出η個(gè)云滴X及其確定度μ (可用drop (Xi, μ ) , i = 1,2···,η來表示)。算法步驟以En為期望值、He2為方差,生成一個(gè)正態(tài)隨機(jī)數(shù)En' ^NORKEn1He2);以Ex為期望值、丑《;2為方差,生成一個(gè)正態(tài)隨機(jī)數(shù)JCi = NORMi /‘>,);計(jì)算Yi = exp [-(χ「Εχ) 2/2 (En ' )2];生成η個(gè)具有確定度μ i云滴Xi或表示為drop (Xi, μ ;逆向云發(fā)生器是正向云發(fā)生器的逆過程,它輸入符合某一種分布的云滴,輸出該云模型對應(yīng)的的三個(gè)數(shù)字特征(Ex,En, He),逆向云發(fā)生器的生成算法如下輸入樣本點(diǎn)Xi,其中i = 1,2,…,η ;輸出反映定性概念的數(shù)字特征(Ex,En, He);算法步驟
_ I η 'j η_根據(jù)Xi計(jì)算該組數(shù)據(jù)的樣本均值Ζ = ,—階樣本絕對中心矩;,
n i=l n i=l
樣本方差~γΣ^/ -' )
η — I ..[Ex = X .En = x—^\xf -Ex\;He = ^S2 -En1 。根據(jù)不同的給定條件,云發(fā)生器還可以分成X條件云發(fā)生器和Y條件云發(fā)生器,在論域中給定數(shù)值X的條件下的云發(fā)生器稱為X條件云發(fā)生器;給定隸屬度值μ的條件下的云發(fā)生器稱為Y條件云發(fā)生器。另外云模型中的3個(gè)數(shù)字特征(Ex,En,He)可以是多維的,表示一個(gè)概念的多維屬性。那么對一維的正向云發(fā)生器進(jìn)行改造,輸入兩組或多組數(shù)字特征,就可構(gòu)成二維或多維的正向云發(fā)生器,逆向二維及多維云發(fā)生器可對照一維逆向云發(fā)生器同理可得。

發(fā)明內(nèi)容
針對茶學(xué)領(lǐng)域蟲害診斷過程中存在的問題,本發(fā)明研究構(gòu)建了茶樹蟲害領(lǐng)域本體,并研制開發(fā)了基于本體的茶樹蟲害智能診斷原型系統(tǒng)。該系統(tǒng)對于茶樹蟲害領(lǐng)域知識的有效表達(dá)、組織管理以及復(fù)用共享,提高茶樹蟲害診斷防治的準(zhǔn)確率和診斷防治速度,具有很強(qiáng)的理論研究價(jià)值和實(shí)際意義。一種基于云本體的茶樹蟲害智能診斷原型系統(tǒng),該系統(tǒng)包括概念提取模塊、茶樹蟲害領(lǐng)域本體概念的云化模塊、概念間分類關(guān)系的云化模塊、概念間非分類關(guān)系的云化模塊、智能查詢模塊和診斷模塊、結(jié)果輸出模塊;本方法的步驟包括I)用戶將已經(jīng)過處理的茶樹蟲害領(lǐng)域本體知識導(dǎo)入本診斷原型系統(tǒng);2)導(dǎo)入的茶樹蟲害領(lǐng)域本體知識進(jìn)入概念提取模塊,由概念提取模塊提取茶樹蟲害領(lǐng)域本體概念; 3)再由茶樹蟲害領(lǐng)域本體概念的云化模塊針對不同的茶樹蟲害領(lǐng)域本體概念,選擇劃分方法,對每個(gè)概念進(jìn)行劃分,確定其概念語言值,并將劃分后的概念輸入相應(yīng)云發(fā)生器進(jìn)行云化;4)已云化的茶樹蟲害領(lǐng)域本體概念,分別進(jìn)入概念間分類關(guān)系云化模塊和概念間非分類關(guān)系云化模塊中;5)由概念間分類關(guān)系云化模塊和概念間非分類關(guān)系云化模塊對已云化的茶樹蟲害領(lǐng)域本體概念進(jìn)行分類關(guān)系提取;再分別對提取的每對分類關(guān)系處理得到概念間云化的分類關(guān)系,對提取到的非分類關(guān)系處理得到概念間云化的非分類關(guān)系;6)概念間云化的分類關(guān)系和概念間云化的非分類關(guān)系通過一致性檢測后生成茶樹蟲害領(lǐng)域云本體;7)智能查詢模塊和診斷模塊在接收用戶的查詢提問后,對用戶提交的關(guān)鍵詞進(jìn)行語義分析,然后通過在線交互界面反饋關(guān)鍵詞語義信息給用戶,由用戶進(jìn)一步選擇判斷并輸入本診斷原型系統(tǒng);8)重復(fù)步驟7),直至返回用戶滿意的關(guān)鍵詞語義信息;再構(gòu)造相應(yīng)的檢索式,將查詢語句交給云本體,得出云本體中所有具有語義關(guān)聯(lián)的類以及實(shí)例;由智能查詢模塊和診斷模塊診斷出結(jié)果,再通過結(jié)果輸出模塊返回診斷結(jié)果給用戶;9)由用戶點(diǎn)擊診斷查詢結(jié)果,顯示出蟲害的特征、發(fā)病癥狀和防治方法信息。所述茶樹蟲害領(lǐng)域本體概念的云化模塊中的茶樹蟲害領(lǐng)域本體概念云化方法是,首先從茶樹蟲害領(lǐng)域知識中提取概念,再對概念中的不同語言值進(jìn)行劃分,最后用云模型表示,使概念不用通過語言的二次表達(dá),就能夠直觀的表達(dá)不確定性的概念;a)從茶樹蟲害領(lǐng)域知識中提取概念的方法首先通過中文分詞的方法,先對茶樹蟲害領(lǐng)域語料進(jìn)行切分;中文分詞后的語料被劃分成一個(gè)個(gè)單個(gè)詞語,利用互信息技術(shù),從切分后的語料中得到候選概念集合;最后通過領(lǐng)域相關(guān)性判斷剔除非合成詞,最終提取出茶樹蟲害領(lǐng)域本體的概念;b)對概念中的不同語言值進(jìn)行劃分的方法在茶樹蟲害領(lǐng)域有各種類型的不確定性概念中對于直接能用數(shù)值表達(dá)的概念的劃分中,先確定長度和寬度的范圍;第二步再在這個(gè)范圍內(nèi)等量化分間距,即可得到劃分好的不確定性概念;對于不能直接用數(shù)值表達(dá)的概念的劃分中,據(jù)不同的概念采取相應(yīng)的轉(zhuǎn)化方法劃分概念;c)用云模型表示使概念不用通過語言的二次表達(dá),即概念云化方法概念云化的過程可以細(xì)化成三個(gè)步驟步驟一遍歷每個(gè)概念的屬性;如果實(shí)單屬性,則直接進(jìn)入步驟三,如果是多屬性,則進(jìn)入步驟二 ;步驟二 采用云維度優(yōu)選方法選取多屬性概念其中一個(gè),進(jìn)入步驟三;
步驟三將劃分后的概念輸入相應(yīng)云發(fā)生器進(jìn)行云化。所述概念間分類關(guān)系的云化模塊中的茶樹蟲害領(lǐng)域本體概念間分類關(guān)系云化方法包括第一步,對分類關(guān)系進(jìn)行提?。坏诙?,對每個(gè)分類關(guān)系進(jìn)行云化;第一步中,茶樹蟲害領(lǐng)域本體概念間分類關(guān)系的提取方法是,采用層次聚類方法對茶樹蟲害領(lǐng)域本體概念間分類關(guān)系進(jìn)行提取,首先對已提取的茶樹蟲害領(lǐng)域概念進(jìn)行聚類,再計(jì)算概念集合中的每兩個(gè)概念之間的相似度;如果該相似度大于預(yù)設(shè)閾值,那么這兩個(gè)概念就歸并為一簇;當(dāng)概念集合中的所有概念通過兩兩計(jì)算歸并為數(shù)個(gè)簇之后,再開始進(jìn)行層次聚類,獲取概念層次關(guān)系;層次聚類采用平均鏈接方法來計(jì)算簇間的相似度,如果簇間相似度大于預(yù)定閾值,則進(jìn)行簇的歸并,直到所有的簇都?xì)w并為同一簇;第二步中,在分類關(guān)系提取完成后,按照概念的劃分方法即直接或間接數(shù)據(jù)化方法對分類關(guān)系的每個(gè)關(guān)系對進(jìn)行劃分,采用主觀統(tǒng)計(jì)的方法得到每組分類關(guān)系的數(shù)據(jù)后,選擇不同的云發(fā)生器對分類關(guān)系進(jìn)行云化,步驟如下步驟一對每對分類關(guān)系按照父類在左,子類在右的順序結(jié)成分類關(guān)系對;步驟二 根據(jù)劃分方法,確定劃分類型,依次對每對概念進(jìn)行劃分;步驟三采用主觀統(tǒng)計(jì)法,采集每個(gè)概念對的不確定性統(tǒng)計(jì)數(shù)據(jù);步驟四分析每組數(shù)據(jù),并采用正態(tài)分布曲線擬合,得到每組數(shù)據(jù)的期望;步驟五計(jì)算熵和超熵,得到每對分類關(guān)系的云模型中的三個(gè)數(shù)字特征(期望Ex,熵En,超熵He);步驟六根據(jù)數(shù)字特征確定每對關(guān)系所用的云模型的類型,將每組數(shù)字特征輸入相應(yīng)的云發(fā)生器,得到每對分類關(guān)系的云圖。概念間非分類關(guān)系的云化模塊中的茶樹蟲害領(lǐng)域本體概念間非分類關(guān)系云化方法包括第一步,對分類關(guān)系進(jìn)行提?。坏诙?,對每個(gè)分類關(guān)系進(jìn)行云化;第一步中,采用基于關(guān)聯(lián)規(guī)則的挖掘方法來提取非分類關(guān)系,算法如下第一步設(shè)置支持度閾值Sup和置信度閾值Conf ;第二步計(jì)算概念集中任意兩個(gè)概念Cp Ck的支持度X和置信度y ;第三步比較支持度X與Sup的大小,置信度y與Conf的大小;第四步若x>Sup和y>Conf同時(shí)成立,則概念Cj和Ck存在關(guān)系,若不成立,跳到第
丄止
/、少;第五步提取關(guān)系對Cj和Ck ;第六步選擇兩個(gè)概念cj+1、ck+1,重復(fù)第二步,循環(huán)至遍歷所有概念;這里j和k表不任意兩個(gè)概念的編號;第二步中,先對得到的非分類關(guān)系進(jìn)行分組,然后再對每組關(guān)系進(jìn)行劃分,最后對每個(gè)關(guān)系進(jìn)行主觀統(tǒng)計(jì),得到的統(tǒng)計(jì)數(shù)據(jù)輸入云發(fā)生器,得到云化的非分類關(guān)系,具體步驟如下步驟一對得到的關(guān)系對進(jìn)行甄別,并按照關(guān)系種類進(jìn)行分組;步驟二 分別確定每組關(guān)系對的組成結(jié)構(gòu),例如,因果關(guān)系規(guī)定因在左果在右;步驟三根據(jù)劃分方法,確定劃分類型,依次對每對關(guān)系進(jìn)行劃分;步驟四采用主觀統(tǒng)計(jì)法,采集每個(gè)關(guān)系對的不確定性統(tǒng)計(jì)數(shù)據(jù);
步驟五分析每組數(shù)據(jù),并采用正態(tài)分布曲線擬合,得到每組數(shù)據(jù)的期望;步驟六計(jì)算熵和超熵,得到每對分類關(guān)系的云模型中的三個(gè)數(shù)字特征(期望Ex,熵En,超熵He);步驟七根據(jù)數(shù)字特征確定每對關(guān)系所用的云模型的類型,將每組數(shù)字特征輸入相應(yīng)的云發(fā)生器,得到每對非分類關(guān)系的云圖。所述智能查詢模塊和診斷模塊中,查詢茶樹蟲害知識是通過關(guān)鍵詞查詢從而檢索到該關(guān)鍵詞在云本體中的等級關(guān)系以及具體的茶樹蟲害相關(guān)信息;在對蟲害進(jìn)行診斷的過程中,是通過建立語義推理引擎,來判斷用戶輸入的檢索詞之間的語義關(guān)系,實(shí)現(xiàn)基于知識/概念層面的查詢診斷;具體是首先根據(jù)茶樹蟲害領(lǐng)域云本體關(guān)系模型,對用戶提交的搜索詞匯的語義進(jìn)行分析,然后借助于推理規(guī)則進(jìn)行語義擴(kuò)展,得出云本體中所有具有隱含語義關(guān)聯(lián)的類以及實(shí)例間的語義關(guān)系,最后據(jù)此擴(kuò)展檢索相應(yīng)的數(shù)據(jù)返回給用戶界面。本發(fā)明針對茶樹蟲害領(lǐng)域本體不確定性知識的表達(dá)問題,考慮將云模型概念與本體結(jié)合構(gòu)建云本體,研究茶樹蟲害領(lǐng)域概念及概念間關(guān)系的云化方法,嘗試將領(lǐng)域內(nèi)不確定性知識確定化,并應(yīng)用于智能診斷專家系統(tǒng)中,為農(nóng)村信息化提供更好的科學(xué)決策服務(wù)。


圖I基于云本體的茶樹蟲害智能診斷原型系統(tǒng)示意圖。
具體實(shí)施例方式下面結(jié)合附圖與具體實(shí)施方式
對本技術(shù)方案進(jìn)一步說明如下I、茶樹蟲害領(lǐng)域本體概念云化方法研究概念是構(gòu)造本體的基本元素,由于茶樹蟲害領(lǐng)域中存在大量不確定性概念,所以在構(gòu)建茶樹蟲害領(lǐng)域本體時(shí)必須考慮概念的不確定性處理。首先從茶樹蟲害領(lǐng)域知識中提取概念,再對概念中的不同語言值進(jìn)行劃分,最后用云模型表示,使概念不用通過語言的二次表達(dá),就能夠直觀的表達(dá)不確定性的概念。a)概念提取方法為了提高概念提取的效率,首先通過中文分詞的方法,先對茶樹蟲害領(lǐng)域語料進(jìn)行切分,中文分詞后的語料被劃分成一個(gè)個(gè)單個(gè)詞語,但是茶樹蟲害領(lǐng)域知識中存在很多合成詞語,它們雖由單個(gè)詞語組成,但表達(dá)特定的意思,因此需要互信息技術(shù),從切分后的語料中得到候選概念集合,最后通過領(lǐng)域相關(guān)性判斷剔除非合成詞,最終提取出茶樹蟲害領(lǐng)域本體的概念。在概念提取方法中,大致可分為基于詞典的方法、基于統(tǒng)計(jì)的方法和基于規(guī)則的方法?;诮y(tǒng)計(jì)的方法運(yùn)用上下文依賴分析,領(lǐng)域相關(guān)性判斷和互信息等技術(shù)。其中上下文依賴分析通過先分別計(jì)算左右上下文依賴參數(shù),然后與設(shè)置的閾值相比較,判斷出概念是否為一個(gè)完整的詞。領(lǐng)域相關(guān)性判斷是通過一定的公式來判斷一個(gè)概念是否屬于某領(lǐng)域,這種判斷方法的主要思想是通過建立詞語頻度以計(jì)算出領(lǐng)域度值,然后與閾值比較得出相關(guān)性判斷。互信息技術(shù)是通過計(jì)算兩個(gè)字串之間的關(guān)聯(lián)程度,來判斷這些字串之間是否存在關(guān)系,該技術(shù)主要針對經(jīng)過分詞后的被分成單個(gè)詞語的合成詞語的提取?;バ畔⒓夹g(shù)同樣需要設(shè)定閾值,只有當(dāng)計(jì)算出互信息度大于該閾值,才能將幾個(gè)字串作為合成詞語提取。b)概念劃分方法在茶樹蟲害領(lǐng)域有各種類型的不確定性概念,有的直接能用數(shù)值表示,有的概念 卻要通過轉(zhuǎn)化才能表達(dá)。對于直接能用數(shù)值表達(dá)的概念,例如某害蟲“體型中等”,體型可用長度和寬度來衡量,在這個(gè)概念的劃分中,第一步先確定長度和寬度的范圍;第二步再在這個(gè)范圍內(nèi)等量化分間距,即可得到劃分好的不確定性概念。對于能直接用數(shù)值表達(dá)的模糊概念,可用以上步驟進(jìn)行劃分。對于不能直接用數(shù)值表達(dá)的概念,例如某害蟲體色“棕色”,與之相近的有黑色,褐色等顏色,即“棕色”與一定范圍內(nèi)的顏色相近。為了解決顏色不確定性表達(dá)的問題,可借助顏色代碼表進(jìn)行自然語言到數(shù)值的轉(zhuǎn)換第一步,對照顏色代碼表,確定“棕色”的代碼范圍;第二步將每個(gè)代碼作為一個(gè)數(shù)值,組成不確定性概念“棕色”的數(shù)值范圍。對于不能直接用數(shù)值表達(dá)的概念,需要根據(jù)不同的概念采取不同的轉(zhuǎn)化方法劃分概念。c )概念云化方法概念的云化是將不確定性概念用云圖表達(dá),在對概念進(jìn)行劃分后,我們需根據(jù)不同的概念劃分結(jié)果,對多屬性的概念進(jìn)行云維度優(yōu)選,最后輸入云發(fā)生器得到云化的概念。根據(jù)我們對概念屬性的理解,屬性分為數(shù)值屬性和分類屬性,如害蟲的體型屬于數(shù)值屬性,屬性值為離散的數(shù)值,而害蟲的危害范圍就是分類屬性,它可以分為無序的一些名詞的集合,如葉,葉梢,樹皮,茶籽等。針對數(shù)值屬性,需要對其進(jìn)行量化,轉(zhuǎn)化為布爾類型,即可挖掘出各個(gè)屬性之間的關(guān)系及屬性與概念之間的關(guān)系。針對分類屬性,運(yùn)用布爾類型的關(guān)聯(lián)規(guī)則挖掘,可以處理出各個(gè)屬性之間的關(guān)系及屬性與概念之間的關(guān)系。采用apriori算法將各個(gè)屬性統(tǒng)一起來共同研究,研究它們之間的關(guān)系及它們同這個(gè)概念之間的關(guān)系,在預(yù)定義的最小支持度和最小置信度下,挖掘出頻繁項(xiàng)集,即是頻繁屬性集,研究由它產(chǎn)生的強(qiáng)關(guān)聯(lián)規(guī)則,說明各個(gè)屬性和概念的關(guān)系,從而篩選出云維度信息。概念云化的過程可以細(xì)化成三個(gè)步驟步驟一遍歷每個(gè)概念的屬性,如單屬性,直接進(jìn)入步驟三,如多屬性,進(jìn)入步驟-* ;步驟二 采用云維度優(yōu)選方法選取多屬性概念其中一個(gè),進(jìn)入下一步;步驟三將劃分后的概念輸入相應(yīng)云發(fā)生器進(jìn)行云化。構(gòu)建云本體時(shí),我們使用云圖代替具體確定數(shù)值來表達(dá)不確定性概念,這與本體的定義中“明確的”要求更加契合,更有助于體現(xiàn)客觀性。這些云化的概念將為構(gòu)建云化的分類體系和云化的非分類體系打下基礎(chǔ),并與它們一起構(gòu)成了云化的茶樹蟲害領(lǐng)域本體知識體系,為構(gòu)建能表達(dá)不確定性知識的茶樹蟲害領(lǐng)域本體服務(wù)提供支撐。2、茶樹蟲害領(lǐng)域本體概念間分類關(guān)系云化方法在分類關(guān)系中,父類與子類之間只是單純的分類關(guān)系,如某地“旱澇-中雨”與降雨程度的分類關(guān)系,雖然10mm-25mm都有可能是預(yù)報(bào)中雨出現(xiàn)的最低降水量,但是不同降雨量隸屬于中雨的程度是不同的,對氣候、茶樹、蟲害的影響也不盡相同,那么如何表述這種可能性?怎么將每個(gè)子類隸屬父類的程度表達(dá)出來?表述出這種不確定性就是分類關(guān)系云化中要解決的關(guān)鍵問題。茶樹蟲害領(lǐng)域本體概念間分類關(guān)系的云化方法由兩大步組成,第一步是對分類關(guān)系進(jìn)行提取,第二步再對每個(gè)分類關(guān)系進(jìn)行云化。概念間分類關(guān)系的提取方法有多種,針對概念集合中包含許多沒有固定的語法模式規(guī)則可以遵循的非合成詞概念,我們采用層次聚類方法對概念間的分類關(guān)系進(jìn)行提取。 利用層次聚類的方法進(jìn)行茶樹蟲害領(lǐng)域概念間分類關(guān)系提取,首先要對已提取的茶樹蟲害領(lǐng)域概念進(jìn)行聚類,計(jì)算概念集合中的每兩個(gè)概念之間的相似度,如果該相似度大于預(yù)設(shè)閾值,那么這兩個(gè)概念就歸并為一簇。當(dāng)概念集合中的所有概念通過兩兩計(jì)算歸并為數(shù)個(gè)簇之后,開始進(jìn)行層次聚類,獲取概念層次關(guān)系。層次聚類采用平均鏈接方法來計(jì)算簇間的相似度,如果簇間相似度大于預(yù)定閾值,則進(jìn)行簇的歸并,直到所有的簇都?xì)w并為同一簇。在分類關(guān)系提取完成后,本發(fā)明按照概念的劃分方法,即直接或間接數(shù)據(jù)化方法對分類關(guān)系的每個(gè)關(guān)系對進(jìn)行劃分,同樣采用主觀統(tǒng)計(jì)的方法得到每組分類關(guān)系的數(shù)據(jù)后,選擇不同的云發(fā)生器對分類關(guān)系進(jìn)行云化,分類關(guān)系云化具體步驟如下步驟一對每對分類關(guān)系按照父類在左,子類在右的順序結(jié)成分類關(guān)系對;步驟二 根據(jù)劃分方法,確定劃分類型,依次對每對概念進(jìn)行劃分;步驟三采用主觀統(tǒng)計(jì)法,采集每個(gè)概念對的不確定性統(tǒng)計(jì)數(shù)據(jù);步驟四分析每組數(shù)據(jù),并采用正態(tài)分布曲線擬合,得到每組數(shù)據(jù)的期望;步驟五計(jì)算熵和超熵,得到每對分類關(guān)系的三個(gè)數(shù)字特征;步驟六根據(jù)數(shù)字特征確定每對關(guān)系所用的云模型的類型;步驟七將每組數(shù)字特征輸入相應(yīng)的云發(fā)生器,得到每對分類關(guān)系的云圖。3、茶樹蟲害領(lǐng)域本體概念間非分類關(guān)系云化方法在非分類關(guān)系中,概念間的關(guān)系更加復(fù)雜,例如某因果關(guān)系“潮濕一一長勢快”,環(huán)境潮濕作物長勢就快,這個(gè)關(guān)系中潮濕要達(dá)到什么樣的程度才會(huì)導(dǎo)致作物長勢快?是不是潮濕都會(huì)導(dǎo)致長勢快,會(huì)不會(huì)造成長勢減緩和停止生長等情況發(fā)生?這種不確定性同樣存在于其他的非分類關(guān)系中。每種類型的非分類關(guān)系區(qū)別對待、進(jìn)行云化,則是非分類關(guān)系云化中所要解決的問題。茶樹蟲害領(lǐng)域本體概念間非分類關(guān)系的云化方法同樣由提取和云化兩大步組成,但由于非分類關(guān)系的多樣化,提取和云化的具體方法有所不同。在本體概念的關(guān)系中,除了子類父類的分類關(guān)系,還存在大量的非分類關(guān)系,如因果關(guān)系,part-of關(guān)系,相關(guān)關(guān)系等。非分類的關(guān)系不僅種類繁多,而且形式多樣。這給我們提取非分類關(guān)系帶來了一定的難度。本發(fā)明主要基于關(guān)聯(lián)規(guī)則的挖掘方法來提取非分類關(guān)系。在關(guān)聯(lián)規(guī)則中,有兩個(gè)衡量關(guān)聯(lián)規(guī)則強(qiáng)度的指標(biāo)支持度和置信度。規(guī)則X — Y的支持度是指T中包含XUY的事務(wù)的百分比;規(guī)則X — Y的置信度是指既包含了 X又包含了 Y的事務(wù)的數(shù)量占所有包含了X的事務(wù)的百分比。支持度是很重要的評價(jià)指標(biāo),如果它的值太小,那么說明該規(guī)則很可能是偶然發(fā)生的。而置信度決定了規(guī)則的可預(yù)測度。如果一條規(guī)則的置信度太低,那么從X就很難可靠地推斷出Y。所以置信度太低的規(guī)則在實(shí)際應(yīng)用中也不會(huì)有多大用處。利用關(guān)聯(lián)規(guī)則來提取概念間非分類關(guān)系的算法如下第一步設(shè)置支持度閾值Sup和置信度閾值Conf ;第二步計(jì)算概念集中任意兩個(gè)概念Cp Ck的支持度X和置信度y ;第三步比較支持度X與Sup的大小,置信度y與Conf的大?。坏谒牟饺魓>Sup和y>Conf同時(shí)成立,則概念Cj和Ck存在關(guān)系,若不成立,跳到第
丄止 /、少;第五步提取關(guān)系對C」和Ck ;第六步j(luò)++,k++,重復(fù)第二步,循環(huán)至遍歷所有概念。非分類關(guān)系與分類關(guān)系不同,因其復(fù)雜的種類,需要在云化前加一個(gè)甄別的步驟,即對得到的非分類關(guān)系進(jìn)行分組,然后再對每組關(guān)系進(jìn)行劃分,劃分方法與分類關(guān)系劃分方法一致,最后對每個(gè)關(guān)系進(jìn)行主觀統(tǒng)計(jì),得到的統(tǒng)計(jì)數(shù)據(jù)輸入云發(fā)生器,得到云化的非分類關(guān)系,具體步驟如下步驟一對得到的關(guān)系對進(jìn)行甄別,并按照關(guān)系種類進(jìn)行分組;步驟二 分別確定每組關(guān)系對的組成結(jié)構(gòu),例如,因果關(guān)系規(guī)定因在左果在右;步驟三根據(jù)劃分方法,確定劃分類型,依次對每對關(guān)系進(jìn)行劃分;步驟四采用主觀統(tǒng)計(jì)法,采集每個(gè)關(guān)系對的不確定性統(tǒng)計(jì)數(shù)據(jù);步驟五分析每組數(shù)據(jù),并采用正態(tài)分布曲線擬合,得到每組數(shù)據(jù)的期望;步驟六計(jì)算熵和超熵,得到每對分類關(guān)系的三個(gè)數(shù)字特征;步驟七根據(jù)數(shù)字特征確定每對關(guān)系所用的云模型的類型;步驟八將每組數(shù)字特征輸入相應(yīng)的云發(fā)生器,得到每對非分類關(guān)系的云圖。針對茶樹蟲害領(lǐng)域本體不確定性知識的表達(dá)問題,我們研究了茶樹蟲害領(lǐng)域概念及概念間關(guān)系的云化方法,構(gòu)建出云本體并應(yīng)用于智能診斷專家系統(tǒng)中,結(jié)合知識庫的推理機(jī)制,對茶樹蟲害知識進(jìn)行查詢、診斷和防治服務(wù)。根據(jù)茶樹蟲害診斷領(lǐng)域知識的特點(diǎn),本發(fā)明采用描述邏輯推理和語義推理相結(jié)合的方法對茶樹蟲害進(jìn)行智能診斷推理。Prot6g6本身不具有推理的功能,但它能構(gòu)造描述邏輯約束條件,并提供第三方推理軟件接口,將使用OWL語言描述的云本體直接轉(zhuǎn)化為描述邏輯的形式,然后進(jìn)行推理服務(wù)。在蟲害的診斷過程中,運(yùn)用語義推理方法,首先根據(jù)用戶選擇的提問詞進(jìn)行語義關(guān)系判斷,推理出各個(gè)提問詞之間隱含的語義關(guān)系,然后構(gòu)造相應(yīng)的檢索式,實(shí)現(xiàn)診斷推理過程。(I)描述邏輯描述邏輯是一種知識表示的形式化語言,是一階謂詞邏輯的可判定子集,具有很強(qiáng)的表達(dá)能力和可判定性,能夠保證推理算法都能停止,并返回正確的結(jié)果。描述邏輯建立在概念和角色之上,使用構(gòu)造算子從簡單概念和角色中構(gòu)造出復(fù)雜概念和角色。描述邏輯具有形式化的、基于邏輯的語義規(guī)范,并且概念語言推理可以從明顯地表達(dá)推出隱含的內(nèi)容。
云本體的推理機(jī)制是基于描述邏輯的推理,通過對約束公理及類層次結(jié)構(gòu)的應(yīng)用,實(shí)現(xiàn)類、屬性、實(shí)例及其之間關(guān)系等推理,目的是保持類的一致性,檢驗(yàn)類的構(gòu)成和隱含關(guān)系,確認(rèn)實(shí)例是否包含于云本體中,以及云本體的完整性維護(hù)等等。查詢茶樹蟲害知識可以通過關(guān)鍵詞查詢從而檢索到該關(guān)鍵詞在云本體中的等級關(guān)系以及具體的蟲害相關(guān)信息。Prot6g6中以樹形結(jié)構(gòu)表示云本體的等級體系,將云本體中的類表示為根節(jié)點(diǎn),實(shí)例表示為葉子節(jié)點(diǎn),點(diǎn)擊樹的節(jié)點(diǎn),即可顯示該節(jié)點(diǎn)相關(guān)的各種信息。具體步驟如下步驟一通過has Synonym屬性,為概念提供不同的表達(dá)形式,使用推理引擎,實(shí)現(xiàn)對同義詞的智能查詢。步驟二 利用list Hierarchy Root Classes O方法得到云本體的根節(jié)點(diǎn),然后利用list Sub ClassesO方法對根結(jié)點(diǎn)判斷是否有子類,通過遞歸的方法得到所有子 類。步驟三對每個(gè)類通過list Sub Classes O方法判斷并獲取類的實(shí)例,利用getLocal NameO方法得到實(shí)例的名稱。步驟四根據(jù)Data Properties的描述,可以得到診斷系統(tǒng)中具體害蟲的詳細(xì)信
肩、O(2)語義推理在對蟲害進(jìn)行診斷的過程中,傳統(tǒng)的信息檢索模型是將各個(gè)檢索詞看作孤立的,忽略檢索詞之間的語義關(guān)系,可能造成基于關(guān)鍵詞的檢索模型在一定程度上查詢不到結(jié)果,或者返回大量無關(guān)的檢索結(jié)果。我們通過建立語義推理引擎,來判斷用戶輸入的檢索詞之間的語義關(guān)系,實(shí)現(xiàn)基于知識/概念層面的查詢診斷,提高茶樹蟲害查詢診斷的查全率及查準(zhǔn)率。云本體具有良好的概念層次結(jié)構(gòu)和對邏輯推理的支持,能夠通過概念之間的關(guān)系來表達(dá)概念語義的能力,實(shí)現(xiàn)語義上的信息表示。在茶樹蟲害智能診斷過程中,本發(fā)明首先根據(jù)茶樹蟲害領(lǐng)域云本體關(guān)系模型,對用戶提交的搜索詞匯的語義進(jìn)行分析,然后借助于某種推理規(guī)則進(jìn)行語義擴(kuò)展,比如近似/同義詞的推理分析,以及詞匯語義在分類結(jié)構(gòu)上的擴(kuò)展,得出云本體中所有具有隱含語義關(guān)聯(lián)的類以及實(shí)例間的語義關(guān)系,最后據(jù)此擴(kuò)展檢索相應(yīng)的數(shù)據(jù)返回給用戶界面。具體步驟如下步驟一根據(jù)用戶輸入的關(guān)鍵詞進(jìn)行語義分析,并借助于推理規(guī)則進(jìn)行語義擴(kuò)展。比如輸入茶區(qū)“皖南”,則擴(kuò)展為安徽南部;輸入蟲害體色“黃色”,則擴(kuò)展為淺黃、深黃、棕黃
坐坐寸寸ο步驟二 將上述全部擴(kuò)展結(jié)果通過在線交互界面返回給用戶,由用戶進(jìn)一步選擇判斷并輸入系統(tǒng)。步驟三重復(fù)步驟一、二,通過語義關(guān)系、概念匹配、推理機(jī)制以及在線交互界面來引導(dǎo)用戶的查詢直至返回用戶滿意的關(guān)鍵詞語義信息。步驟四由步驟三的結(jié)果,構(gòu)造相應(yīng)的檢索式。將查詢語句交給云本體模型,如果云本體中存在該語義關(guān)系組合,則返回診斷結(jié)果;若不存在,則返回NULL。為驗(yàn)證不確定性本體知識確定化的可行性和有效性,本發(fā)明采用Matlab7. O平臺(tái)及Jsp/Servlet技術(shù),開發(fā)了基于云本體的茶樹蟲害智能診斷原型系統(tǒng),所使用的開發(fā)環(huán)境為Windows XP。該系統(tǒng)既可以對用戶選擇的條件進(jìn)行蟲害診斷,也可以在導(dǎo)航中進(jìn)行害蟲查詢。基于云本體的茶樹蟲害智能診斷系統(tǒng)主要由茶樹蟲害領(lǐng)域本體概念的云化模塊、概念間分類關(guān)系的云化模塊、概念間非分類關(guān)系的云化模塊、智能查詢模塊及診斷模塊等組成,其基本框架結(jié)構(gòu)如圖I所示,該系統(tǒng)步驟流程如下步驟一用戶將已經(jīng)過處理的茶樹蟲害領(lǐng)域本體知識導(dǎo)入模型系統(tǒng);步驟二 導(dǎo)入的茶樹蟲害領(lǐng)域本體知識進(jìn)入概念提取模塊,通過上下文依賴、互信息技術(shù)、領(lǐng)域相關(guān)性判斷來提取茶樹蟲害領(lǐng)域本體概念;步驟三針對不同概念,選擇劃分方法,對每個(gè)概念進(jìn)行劃分,確定其概念語言值,并將劃分后的概念輸入相應(yīng)云發(fā)生器進(jìn)行云化。步驟四已云化的茶樹蟲害領(lǐng)域概念,分別進(jìn)入分類關(guān)系云化模塊和非分類關(guān)系 云化模塊中。步驟五對輸入分類關(guān)系云化模塊的概念,采用層次聚類的的方法對其進(jìn)行提??;步驟六對提取的每對分類關(guān)系按照父類在左、子類在右的順序結(jié)成分類關(guān)系對;根據(jù)劃分方法,確定劃分類型,依次對每對概念進(jìn)行劃分;采用主觀統(tǒng)計(jì)法,采集每個(gè)概念對的不確定性統(tǒng)計(jì)數(shù)據(jù)分析每組數(shù)據(jù),并采用正態(tài)分布曲線擬合,得到每組數(shù)據(jù)的期望,計(jì)算熵和超熵,得到每對分類關(guān)系的三個(gè)數(shù)字特征;根據(jù)數(shù)字特征確定每對關(guān)系所用的云模型的類型,將每組數(shù)字特征輸入相應(yīng)的云發(fā)生器,得到云化分類關(guān)系。步驟七對輸入非分類關(guān)系云化模塊的概念,采用關(guān)聯(lián)規(guī)則挖掘的方法對其進(jìn)行提取;步驟八對提取到的非分類關(guān)系對進(jìn)行甄別,并按照關(guān)系種類進(jìn)行分組,分別確定每組關(guān)系對的組成結(jié)構(gòu);根據(jù)劃分方法,確定劃分類型,依次對每對關(guān)系進(jìn)行劃分;采用主觀統(tǒng)計(jì)法,采集每個(gè)關(guān)系對的不確定性統(tǒng)計(jì)數(shù)據(jù),分析每組數(shù)據(jù),并采用正態(tài)分布曲線擬合,得到每組數(shù)據(jù)的期望,計(jì)算熵和超熵,得到每對分類關(guān)系的三個(gè)數(shù)字特征;根據(jù)數(shù)字特征確定每對關(guān)系所用的云模型的類型將每組數(shù)字特征輸入相應(yīng)的云發(fā)生器,得到云化的非分類關(guān)系。步驟九生成茶樹蟲害領(lǐng)域云本體并通過一致性檢測。步驟十系統(tǒng)接收用戶的查詢提問后,對用戶提交的關(guān)鍵詞進(jìn)行語義分析,并借助于推理規(guī)則進(jìn)行語義擴(kuò)展,通過在線交互界面反饋給用戶,由用戶進(jìn)一步選擇判斷并輸入系統(tǒng)。步驟十一重復(fù)步驟十,直至返回用戶滿意的關(guān)鍵詞語義信息。構(gòu)造相應(yīng)的檢索式,將查詢語句交給云本體模型,得出云本體中所有具有語義關(guān)聯(lián)的類以及實(shí)例。獲得診斷結(jié)果后,通過結(jié)果輸出模塊返回給用戶。步驟十二 點(diǎn)擊診斷查詢結(jié)果,可以顯示出蟲害的特征、發(fā)病癥狀和防治方法等信
肩、O通過對本系統(tǒng)的測試分析,取得了良好的效果,驗(yàn)證了該方法的可行性和有效性。基于云本體的茶樹蟲害智能診斷系統(tǒng)利用云化的概念及概念間分類關(guān)系、非分類關(guān)系可以有效解決本體中的不確定性知識表達(dá)問題,并對茶樹蟲害防治進(jìn)行更加精確、更加客觀的診斷推理,提高了茶樹蟲害診斷防治的準(zhǔn)確率和診斷防治速度,以滿足茶農(nóng)實(shí)際需求。
基于云本體的茶樹蟲害智能診斷系統(tǒng)對于茶樹蟲害領(lǐng)域知識的有效表達(dá)、組織管理以及復(fù)用共享,提升茶樹蟲害智能診斷系統(tǒng)的問題求解和協(xié)同能力,提高茶樹蟲害診斷防治的智能化水平,提高農(nóng)村信息化服務(wù)效率,進(jìn)一步開展農(nóng)業(yè)知識工程的基礎(chǔ)理論與關(guān)鍵技術(shù)研究,具有一定的現(xiàn)實(shí)意義和實(shí)際研究價(jià)值。在此基礎(chǔ)上,下一步將繼續(xù)完善、更新 與茶樹病蟲害有關(guān)的實(shí)用技術(shù)信息系統(tǒng),使之真正有效地成為科學(xué)種茶的有力助手,讓科學(xué)種茶技術(shù)在我國廣大地區(qū)迅速推廣,進(jìn)一步提高我國的茶葉產(chǎn)量和茶飲質(zhì)量。
權(quán)利要求
1.一種基于云本體的茶樹蟲害智能診斷原型系統(tǒng),其特征是該系統(tǒng)包括概念提取模塊、茶樹蟲害領(lǐng)域本體概念的云化模塊、概念間分類關(guān)系的云化模塊、概念間非分類關(guān)系的云化模塊、智能查詢模塊和診斷模塊、結(jié)果輸出模塊;本方法的步驟包括 1)用戶將已經(jīng)過處理的茶樹蟲害領(lǐng)域本體知識導(dǎo)入本診斷原型系統(tǒng); 2)導(dǎo)入的茶樹蟲害領(lǐng)域本體知識進(jìn)入概念提取模塊,由概念提取模塊提取茶樹蟲害領(lǐng)域本體概念; 3)再由茶樹蟲害領(lǐng)域本體概念的云化模塊針對不同的茶樹蟲害領(lǐng)域本體概念,選擇劃分方法,對每個(gè)概念進(jìn)行劃分,確定其概念語言值,并將劃分后的概念輸入相應(yīng)云發(fā)生器進(jìn)行云化; 4)已云化的茶樹蟲害領(lǐng)域本體概念,分別進(jìn)入概念間分類關(guān)系云化模塊和概念間非分類關(guān)系云化模塊中; 5)由概念間分類關(guān)系云化模塊和概念間非分類關(guān)系云化模塊對已云化的茶樹蟲害領(lǐng)域本體概念進(jìn)行分類關(guān)系提??;再分別對提取的每對分類關(guān)系處理得到概念間云化的分類關(guān)系,對提取到的非分類關(guān)系處理得到概念間云化的非分類關(guān)系; 6)概念間云化的分類關(guān)系和概念間云化的非分類關(guān)系通過一致性檢測后生成茶樹蟲害領(lǐng)域云本體; 7)智能查詢模塊和診斷模塊在接收用戶的查詢提問后,對用戶提交的關(guān)鍵詞進(jìn)行語義分析,然后通過在線交互界面反饋關(guān)鍵詞語義信息給用戶,由用戶進(jìn)一步選擇判斷并輸入本診斷原型系統(tǒng); 8)重復(fù)步驟7),直至返回用戶滿意的關(guān)鍵詞語義信息;再構(gòu)造相應(yīng)的檢索式,將查詢語句交給云本體,得出云本體中所有具有語義關(guān)聯(lián)的類以及實(shí)例;由智能查詢模塊和診斷模塊診斷出結(jié)果,再通過結(jié)果輸出模塊返回診斷結(jié)果給用戶; 9)由用戶點(diǎn)擊診斷查詢結(jié)果,顯示出蟲害的特征、發(fā)病癥狀和防治方法信息。
2.根據(jù)權(quán)利要求I所述的基于云本體的茶樹蟲害智能診斷原型系統(tǒng),其特征是所述茶樹蟲害領(lǐng)域本體概念的云化模塊中的茶樹蟲害領(lǐng)域本體概念云化方法是,首先從茶樹蟲害領(lǐng)域知識中提取概念,再對概念中的不同語言值進(jìn)行劃分,最后用云模型表示,使概念不用通過語言的二次表達(dá),就能夠直觀的表達(dá)不確定性的概念; a)從茶樹蟲害領(lǐng)域知識中提取概念的方法 首先通過中文分詞的方法,先對茶樹蟲害領(lǐng)域語料進(jìn)行切分;中文分詞后的語料被劃分成一個(gè)個(gè)單個(gè)詞語,利用互信息技術(shù),從切分后的語料中得到候選概念集合;最后通過領(lǐng)域相關(guān)性判斷剔除非合成詞,最終提取出茶樹蟲害領(lǐng)域本體的概念; b)對概念中的不同語言值進(jìn)行劃分的方法 在茶樹蟲害領(lǐng)域有各種類型的不確定性概念中 對于直接能用數(shù)值表達(dá)的概念的劃分中,先確定長度和寬度的范圍;第二步再在這個(gè)范圍內(nèi)等量化分間距,即可得到劃分好的不確定性概念; 對于不能直接用數(shù)值表達(dá)的概念的劃分中,據(jù)不同的概念采取相應(yīng)的轉(zhuǎn)化方法劃分概念; c)用云模型表示使概念不用通過語言的二次表達(dá),即概念云化方法 概念云化的過程可以細(xì)化成三個(gè)步驟步驟一遍歷每個(gè)概念的屬性;如果實(shí)單屬性,則直接進(jìn)入步驟三,如果是多屬性,則進(jìn)入步驟二; 步驟二 采用云維度優(yōu)選方法選取多屬性概念其中一個(gè),進(jìn)入步驟三; 步驟三將劃分后的概念輸入相應(yīng)云發(fā)生器進(jìn)行云化。
3.根據(jù)權(quán)利要求I所述的基于云本體的茶樹蟲害智能診斷原型系統(tǒng),其特征是所述概念間分類關(guān)系的云化模塊中的茶樹蟲害領(lǐng)域本體概念間分類關(guān)系云化方法包括第一步,對分類關(guān)系進(jìn)行提?。坏诙?,對每個(gè)分類關(guān)系進(jìn)行云化; 第一步中,茶樹蟲害領(lǐng)域本體概念間分類關(guān)系的提取方法是, 采用層次聚類方法對茶樹蟲害領(lǐng)域本體概念間分類關(guān)系進(jìn)行提取,首先對已提取的茶樹蟲害領(lǐng)域概念進(jìn)行聚類,再計(jì)算概念集合中的每兩個(gè)概念之間的相似度;如果該相似度大于預(yù)設(shè)閾值,那么這兩個(gè)概念就歸并為一簇; 當(dāng)概念集合中的所有概念通過兩兩計(jì)算歸并為數(shù)個(gè)簇之后,再開始進(jìn)行層次聚類,獲取概念層次關(guān)系;層次聚類采用平均鏈接方法來計(jì)算簇間的相似度,如果簇間相似度大于預(yù)定閾值,則進(jìn)行簇的歸并,直到所有的簇都?xì)w并為同一簇; 第二步中,在分類關(guān)系提取完成后,按照概念的劃分方法即直接或間接數(shù)據(jù)化方法對分類關(guān)系的每個(gè)關(guān)系對進(jìn)行劃分,采用主觀統(tǒng)計(jì)的方法得到每組分類關(guān)系的數(shù)據(jù)后,選擇不同的云發(fā)生器對分類關(guān)系進(jìn)行云化,步驟如下 步驟一對每對分類關(guān)系按照父類在左,子類在右的順序結(jié)成分類關(guān)系對; 步驟二 根據(jù)劃分方法,確定劃分類型,依次對每對概念進(jìn)行劃分; 步驟三采用主觀統(tǒng)計(jì)法,采集每個(gè)概念對的不確定性統(tǒng)計(jì)數(shù)據(jù); 步驟四分析每組數(shù)據(jù),并采用正態(tài)分布曲線擬合,得到每組數(shù)據(jù)的期望; 步驟五計(jì)算熵和超熵,得到每對分類關(guān)系的云模型中的三個(gè)數(shù)字特征(期望Ex,熵En,超熵 He); 步驟六根據(jù)數(shù)字特征確定每對關(guān)系所用的云模型的類型,將每組數(shù)字特征輸入相應(yīng)的云發(fā)生器,得到每對分類關(guān)系的云圖。
4.根據(jù)權(quán)利要求I所述的基于云本體的茶樹蟲害智能診斷原型系統(tǒng),其特征是概念間非分類關(guān)系的云化模塊中的茶樹蟲害領(lǐng)域本體概念間非分類關(guān)系云化方法包括第一步,對分類關(guān)系進(jìn)行提??;第二步,對每個(gè)分類關(guān)系進(jìn)行云化; 第一步中,采用基于關(guān)聯(lián)規(guī)則的挖掘方法來提取非分類關(guān)系,算法如下 第一步設(shè)置支持度閾值Sup和置信度閾值Conf ; 第二步計(jì)算概念集中任意兩個(gè)概念A(yù)、Ck的支持度X和置信度y ; 第三步比較支持度X與Sup的大小,置信度y與Conf的大?。? 第四步若x>Sup和y>Conf同時(shí)成立,則概念Cj和Ck存在關(guān)系,若不成立,跳到第六I K少; 第五步提取關(guān)系對Cj和Ck ; 第六步選擇兩個(gè)概念(V1Aw,重復(fù)第二步,循環(huán)至遍歷所有概念;這里j和k表示任意兩個(gè)概念的編號; 第二步中,先對得到的非分類關(guān)系進(jìn)行分組,然后再對每組關(guān)系進(jìn)行劃分,最后對每個(gè)關(guān)系進(jìn)行主觀統(tǒng)計(jì),得到的統(tǒng)計(jì)數(shù)據(jù)輸入云發(fā)生器,得到云化的非分類關(guān)系,具體步驟如下 步驟一對得到的關(guān)系對進(jìn)行甄別,并按照關(guān)系種類進(jìn)行分組; 步驟二 分別確定每組關(guān)系對的組成結(jié)構(gòu),例如,因果關(guān)系規(guī)定因在左果在右; 步驟三根據(jù)劃分方法,確定劃分類型,依次對每對關(guān)系進(jìn)行劃分; 步驟四采用主觀統(tǒng)計(jì)法,采集每個(gè)關(guān)系對的不確定性統(tǒng)計(jì)數(shù)據(jù); 步驟五分析每組數(shù)據(jù),并采用正態(tài)分布曲線擬合,得到每組數(shù)據(jù)的期望; 步驟六計(jì)算熵和超熵,得到每對分類關(guān)系的云模型中的三個(gè)數(shù)字特征(期望Ex,熵En,超熵 He); 步驟七根據(jù)數(shù)字特征確定每對關(guān)系所用的云模型的類型,將每組數(shù)字特征輸入相應(yīng)的云發(fā)生器,得到每對非分類關(guān)系的云圖。
5.根據(jù)權(quán)利要求I所述的基于云本體的茶樹蟲害智能診斷原型系統(tǒng),其特征是所述智能查詢模塊和診斷模塊中, 查詢茶樹蟲害知識是通過關(guān)鍵詞查詢從而檢索到該關(guān)鍵詞在云本體中的等級關(guān)系以及具體的茶樹蟲害相關(guān)信息; 在對蟲害進(jìn)行診斷的過程中,是通過建立語義推理引擎,來判斷用戶輸入的檢索詞之間的語義關(guān)系,實(shí)現(xiàn)基于知識/概念層面的查詢診斷;具體是首先根據(jù)茶樹蟲害領(lǐng)域云本體關(guān)系模型,對用戶提交的搜索詞匯的語義進(jìn)行分析,然后借助于推理規(guī)則進(jìn)行語義擴(kuò)展,得出云本體中所有具有隱含語義關(guān)聯(lián)的類以及實(shí)例間的語義關(guān)系,最后據(jù)此擴(kuò)展檢索相應(yīng)的數(shù)據(jù)返回給用戶界面。
全文摘要
一種基于云本體的茶樹蟲害智能診斷原型系統(tǒng),該系統(tǒng)包括概念提取模塊、茶樹蟲害領(lǐng)域本體概念的云化模塊、概念間分類關(guān)系的云化模塊、概念間非分類關(guān)系的云化模塊、智能查詢模塊和診斷模塊、結(jié)果輸出模塊;本方法針對茶樹蟲害領(lǐng)域本體不確定性知識的表達(dá)問題,考慮將云模型概念與本體結(jié)合構(gòu)建云本體,研究茶樹蟲害領(lǐng)域概念及概念間關(guān)系的云化方法,將領(lǐng)域內(nèi)不確定性知識確定化,并應(yīng)用于智能診斷專家系統(tǒng)中。
文檔編號G06F19/00GK102831316SQ201210304048
公開日2012年12月19日 申請日期2012年8月24日 優(yōu)先權(quán)日2012年8月24日
發(fā)明者李紹穩(wěn), 葉瓊, 劉超, 吉喆, 孫靚, 張友華, 劉愷, 許高建, 張?bào)愕?申請人:安徽農(nóng)業(yè)大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
仁布县| 旬邑县| 新河县| 山西省| 光泽县| 马龙县| 大英县| 婺源县| 金湖县| 乌鲁木齐市| 锦州市| 天水市| 平乐县| 奉新县| 朝阳区| 榆社县| 紫阳县| 库车县| 山丹县| 鲁山县| 崇仁县| 措美县| 陆丰市| 五华县| 河间市| 无极县| 合阳县| 凌海市| 普兰店市| 梓潼县| 遵化市| 徐汇区| 栾川县| 金沙县| 镇安县| 安仁县| 余江县| 舟曲县| 获嘉县| 来宾市| 永泰县|