專利名稱:系統(tǒng)模型化的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種系統(tǒng)模型的求取,該模型包括多個子模型。
從[1]中公開了這種模型的求取。
在這種具有子模型的模型中,也即在一種具有本征變量y的所謂的統(tǒng)計概率模型中,通過P(x|Θ)≡ΣjP(x|y,Θ)P(y|Θ),---(1)]]>來描述由連續(xù)的狀態(tài)參量xi(xi∈R)進行描述的狀態(tài)x的概率分布P,式中,θ表示模型的參數(shù),i表示狀態(tài)參量的下標(biāo),j表示子模型的數(shù)目,P(a|b)表示變量a在變量b條件下的條件概率,和 表示在j個子模型上的總和。
在這種模型中,在采用公式為P(x|y,my,σ)∝exp{12(x-myσ)2}---(2)]]>的高斯分布條件下來描述子模型j的概率分布P(x|y,θ),式中,my表示平均值,σ表示方差,exp(...)表示指數(shù)函數(shù),和P(a|b)表示變量a在b條件下的條件概率。
在訓(xùn)練階段中如此訓(xùn)練[1]中公開的模型,使得在一個實的系統(tǒng)上求出在規(guī)定時刻k的狀態(tài)參量,并分別將規(guī)定時刻k之一的狀態(tài)參量匯總為一個訓(xùn)練數(shù)據(jù)。許多這樣的訓(xùn)練數(shù)據(jù)形成一個訓(xùn)練數(shù)據(jù)組。
用所述的訓(xùn)練數(shù)據(jù)組訓(xùn)練模型。在[1]和[2]中同樣可以找到不同訓(xùn)練方法的概況。
在訓(xùn)練階段中通常使以下的成本函數(shù)L、也即對數(shù)的似然性最小化L(Θ)=Σilog(P(xk|Θ))---(3)]]>式中,xk表示一個訓(xùn)練數(shù)據(jù),θ表示在訓(xùn)練中要匹配的參數(shù),log(...)表示對數(shù)函數(shù),和P(xk|θ)表示訓(xùn)練數(shù)據(jù)xk在參數(shù)θ條件下的條件概率。
通常在采用期望最大化方法(EM算法)的條件下進行對數(shù)似然性的最小化,正象從[2]中公開的那樣。
從[3]中公開了一個用于在彼此相連接的計算機之間傳輸數(shù)據(jù)的裝置。
這個裝置的部件是一種通信網(wǎng)的部分,也即所謂的萬維網(wǎng)(WWW)的部分。
所述的通信網(wǎng)如此彼此連接各個計算機,使得所述的計算機可以按規(guī)定的傳輸協(xié)議″傳輸控制協(xié)議(TCP)/互聯(lián)網(wǎng)協(xié)議(IP)″交換數(shù)據(jù)。為了實現(xiàn)數(shù)據(jù)的統(tǒng)一處理,許多數(shù)據(jù)以統(tǒng)一的格式、即所謂的超文本置標(biāo)語言(HTLM)格式存在。
此外從[3]中公開了,在采用WWW瀏覽器的條件下在WWW中尋找數(shù)據(jù),并在顯示屏上顯示出這些數(shù)據(jù)。從[3]中公開了這種WWW瀏覽器和實現(xiàn)WWW瀏覽器的計算機程序。
在可以由計算機在通信網(wǎng)中請求的業(yè)務(wù)的范圍中可以傳輸這些數(shù)據(jù)。這樣的業(yè)務(wù)譬如是提供信息。
此時,一個單個計算機(用戶)可以經(jīng)所述的通信網(wǎng)在另一個單個計算機上(服務(wù)器)請求所述的業(yè)務(wù)。
在業(yè)務(wù)的范圍內(nèi),數(shù)據(jù)經(jīng)通信網(wǎng)在用戶和服務(wù)器之間傳輸。
從[3]中進一步公開了,在通信網(wǎng)中提供數(shù)據(jù)的和在其中可以請求數(shù)據(jù)的計算機是一種這樣的服務(wù)器。
一種在用戶和服務(wù)器之間的通信稱為會議,在這種通信時用戶從服務(wù)器請求一種業(yè)務(wù),而服務(wù)器滿足這種請求。與此相應(yīng)地在WWW中在用戶和服務(wù)器之間的通信稱為因特網(wǎng)會議。
在用戶的因特網(wǎng)會議中,在所選擇的服務(wù)器上在所謂的″日志文件″中存儲說明所述因特網(wǎng)會議的信息。
這個信息譬如包括用戶的標(biāo)志和因特網(wǎng)會議的持續(xù)時間。
通過所述信息所說明的這種因特網(wǎng)會議可以解釋為系統(tǒng)″因特網(wǎng)會議″的狀態(tài)。在此情況下信息會包含系統(tǒng)的狀態(tài)參量。
本發(fā)明基于的問題是提供用其可以求出系統(tǒng)的,譬如系統(tǒng)″因特網(wǎng)會議″的具有子模型的模型的一種方法和一個裝置,該模型以比在上述方法中更改進的準(zhǔn)確度描述所述的系統(tǒng)。
通過按各自的獨立權(quán)利要求的方法和裝置來解決所述的問題。
在用于求出系統(tǒng)模型的至少一個子模型的方法中,其中,通過狀態(tài)參量描述系統(tǒng)的狀態(tài),并且至少一個狀態(tài)參量是離散的狀態(tài)參量,確定多組狀態(tài)參量值。從所述的組中求出狀態(tài)參量的概率分布。在采用所述的組和狀態(tài)參量的概率分布的條件下,和在采用統(tǒng)計的學(xué)習(xí)方法的條件下求出系統(tǒng)的子模型,其中,在狀態(tài)參量的概率分布的前提下描述系統(tǒng)的子模型。
用于求出系統(tǒng)模型的至少一個子模型的裝置,其中,通過狀態(tài)參量描述系統(tǒng)的狀態(tài),并且至少一個狀態(tài)參量是離散的狀態(tài)參量,具有一個如此設(shè)置的處理機,使得-可以確定多組狀態(tài)參量值,-從所述的組中可以求出狀態(tài)參量的概率分布,-在采用所述的組和狀態(tài)參量的概率分布的條件下,和在采用統(tǒng)計的學(xué)習(xí)方法的條件下可以求出系統(tǒng)的子模型,其中,在狀態(tài)參量的概率分布的前提下描述系統(tǒng)的子模型。
所述的裝置尤其適合于實施本發(fā)明的方法,或該方法的以下所闡述的改進方案之一。
由從屬權(quán)利要求中產(chǎn)生本發(fā)明的優(yōu)選的改進方案。
以下所說明的改進方案既涉及所述的方法,也涉及所述的裝置。
既在軟件中,也在硬件中,譬如在采用專門的電路的條件下可以實現(xiàn)本發(fā)明和以下所說明的改進方案。
此外,通過一種計算機可讀的存儲媒體可以實現(xiàn)本發(fā)明或以下所說明的改進方案,在該存儲媒體上存儲了實施本發(fā)明或改進方案的計算機程序。
通過具有一種存儲媒體的計算機程序產(chǎn)品也可以實現(xiàn)本發(fā)明和/或每個以下所說明的改進方案,在該存儲媒體上存儲了實施本發(fā)明和/或改進方案的計算機程序。
在一個改進方案中模型包括多個子模型。
所有的狀態(tài)參量也可以是離散的狀態(tài)參量。
在一個擴展方案中概率分布是一個多項式分布或一個二項式分布。
在一個改進方案中求出一個特征組的狀態(tài)參量值,其中,在至少一個特征組中的狀態(tài)參量的概率分布具有一個極限值。所述的極限值可能是一個最大值。
此外,對于所述的特征組可以確定語義的關(guān)系。
在一個擴展方案中求出多個特征組。
通過離散化一個連續(xù)的狀態(tài)參量可以求出至少一個離散的狀態(tài)參量。
為了改進模型,對于子模型確定一個統(tǒng)計不可靠性的尺度是有利的。
在統(tǒng)計的學(xué)習(xí)方法中可以考慮統(tǒng)計不可靠性的尺度,譬如一種條件熵。
在這種情況下在統(tǒng)計的學(xué)習(xí)方法中只能學(xué)習(xí)這種具有統(tǒng)計不可靠性的小的尺度的子模型。
在一個擴展方案中所述的模型是一種貝葉斯網(wǎng)。
在統(tǒng)計的學(xué)習(xí)方法中確定對數(shù)似然性。
在統(tǒng)計的學(xué)習(xí)方法中也可以實施期望最大化法。
在一個改進方案中通過測量狀態(tài)參量和/或規(guī)定狀態(tài)參量來確定系統(tǒng)的狀態(tài)。
可以將所述的擴展方案用于系統(tǒng)狀態(tài)的預(yù)測。
在所述的預(yù)測時僅部分地確定一組狀態(tài)參量的狀態(tài)參量,并在采用所述模型和部分確定的狀態(tài)參量的條件下求出該組的其它的狀態(tài)參量。
在一個改進方案中所述的系統(tǒng)被規(guī)定為因特網(wǎng)訪問。
在此情況下可將所述的改進方案用于分析許多因特網(wǎng)訪問。
在附圖中示出了,并在以下詳述本發(fā)明的實施例。
所展示的
圖1為按第一實施例的通信系統(tǒng)的草圖;圖2為具有關(guān)于不同用戶訪問網(wǎng)頁的信息的網(wǎng)絡(luò)日志文件;圖3為在模型化第一實施例的系統(tǒng)″因特網(wǎng)會議″時的方法步驟;圖4為一個描述對網(wǎng)頁集(Sammlung)的訪問的統(tǒng)計模型;圖5為一個描述對網(wǎng)頁集的訪問和示出用戶系統(tǒng)結(jié)構(gòu)的統(tǒng)計模型;
圖6為一個描述對網(wǎng)頁集的訪問和示出用戶系統(tǒng)結(jié)構(gòu)的統(tǒng)計模型。
實施例分析因特網(wǎng)會議附圖1示意地展示通信網(wǎng)100,所謂的萬維網(wǎng)(WWW)的結(jié)構(gòu),正象在[1]中所說明的那樣。
在通信網(wǎng)100中通過可傳輸數(shù)據(jù)的連接111,121,131將各個計算機110,120,130連接。
計算機110和計算機120分別是所謂的用戶計算機,即在采用這種用戶計算機的條件下用戶可以在WWW中利用在WWW中提供的信息。
計算機130是在WWW中提供信息的所謂的服務(wù)器計算機。
每個用戶計算機110,120分別具有一個存儲了軟件程序-正象在[1]中所說明的所謂的WWW瀏覽器-的存儲器112,122。
在采用這種WWW瀏覽器的條件下用戶計算機可以在WWW中尋找某些信息,向自己傳輸所找到的信息,和在顯示屏上顯示出所傳輸?shù)男畔ⅰ?br>
在用戶和服務(wù)器之間的,用戶從服務(wù)器請求業(yè)務(wù)和服務(wù)器滿足這種請求的通信稱為會議或訪問。
在用戶的每個會議中,在所使用的服務(wù)器中在存儲器132的所謂的″日志文件″中存儲了描述相應(yīng)會議的信息。
附圖2示意地示出了服務(wù)器的這種日志文件200,在該日志文件200中存儲了四個不同用戶的四個會議210,220,230,240的信息。
關(guān)于用戶會議的信息分別包括以下的子信息-關(guān)于相應(yīng)用戶250的說明,-關(guān)于相應(yīng)會議251的時刻的說明,-關(guān)于相應(yīng)會議252的起始網(wǎng)頁的說明,-關(guān)于相應(yīng)會議的持續(xù)時間的說明,-關(guān)于起始網(wǎng)頁的參考的說明,-關(guān)于在相應(yīng)會議期間所訪問網(wǎng)頁的數(shù)目的說明。
應(yīng)該指出,一個信息的子信息的上述列舉不應(yīng)理解為終結(jié)性的。一個信息也可以包括其它的子信息。
為了模型化系統(tǒng)″因特網(wǎng)會議″,在采用這些子信息的條件下規(guī)定系統(tǒng)″因特網(wǎng)會議″的盡可能全面描述因特網(wǎng)會議的變量(請參閱附圖3,方法步驟301)。
隨后在采用所述的模型的條件下進行因特網(wǎng)會議的進一步的分析和模型化。
附圖3展示在模型化系統(tǒng)″因特網(wǎng)會議″中進行的方法步驟300-求出系統(tǒng)的譬如用戶等級或會議數(shù)目等離散狀態(tài)參量的第一方法步驟301,-求出狀態(tài)參量值組的第二方法步驟310,-求出狀態(tài)參量概率分布的第三方法步驟320,-求出系統(tǒng)模型的第四方法步驟330,其中,在求取時采用一個擴充了條件熵的目標(biāo)函數(shù),-求出特征組狀態(tài)參量的,并給特征組分別分配一個語義名稱的第五方法步驟340。
以下闡述系統(tǒng)″因特網(wǎng)會議″的模型化,其中,參考附圖3中的各自的方法步驟300。
在此展示,如何將模型用來描述因特網(wǎng)中用戶的行為、提取用戶的典型的系統(tǒng)結(jié)構(gòu)、和確定用戶的典型的重復(fù)行為樣式。
對于系統(tǒng)″因特網(wǎng)會議″的變量是連續(xù)變量的,譬如是會議持續(xù)時間的情況,則離散化此變量,即將變量的一個連續(xù)的值范圍劃分為區(qū),并給這些區(qū)分別分配一個標(biāo)識數(shù),譬如直至1分鐘標(biāo)識數(shù)1/1分鐘至10分鐘標(biāo)識數(shù)2/10分鐘至1小時標(biāo)識數(shù)3/多于1小時標(biāo)識數(shù)4(請參閱附圖3,方法步驟301)。
系統(tǒng)″因特網(wǎng)會議″的規(guī)定的和必要時離散化的變量是-用戶等級(本地雇員/公司領(lǐng)導(dǎo)/.../其它的用戶),-在所觀察的時間區(qū)間中會議的數(shù)目(一次訪問/二至五次訪問/6至15次訪問/多于15次訪問),-會議的起始時間(9時之前/9時和11時之間/...),-起始網(wǎng)頁,-會議的持續(xù)時間,-對起始網(wǎng)頁的參考,-被訪問網(wǎng)頁的數(shù)目,-主頁(已訪問的/未訪問的)-新聞(已訪問的/未訪問的)。
要著重指出,變量的這種列舉不應(yīng)理解為終結(jié)性的。完全可以規(guī)定描述系統(tǒng)″因特網(wǎng)會議″的其它變量。
將所述的變量匯總成一個所謂的會議矢量,其中,所述會議矢量的分量是離散的變量。
將具有貝葉斯網(wǎng)類型的本征變量y的統(tǒng)計概率模型P用于模型化系統(tǒng)″因特網(wǎng)會議″,正象在[1]中所說明的那樣。
可以如下來描述所采用的統(tǒng)計的概率模型PP(x|Θ)≡ΣjP(x|y,Θ)P(y|Θ),---(4)]]>式中,θ表示模型的參數(shù),x表示包括狀態(tài)參量xi的系統(tǒng)狀態(tài),i表示N個數(shù)目的具有i=1...N的狀態(tài)參量的下標(biāo),P(a|b)表示變量a在變量b的條件下的條件概率,和 表示統(tǒng)計的概率模型P的j個子模型的總和。
可以自由規(guī)定統(tǒng)計的概率模型P的子模型的數(shù)目j。在這種情況下選擇j=20個子模型。
由于狀態(tài)x,在本情況下會議矢量x只具有離散的變量,所以選擇一種自然的參數(shù)化,即統(tǒng)計的概率模型的參數(shù)θ相當(dāng)于概率表P(xi|y,θ)的元素。
這明確地意味著,在此情況下在采用多項式分布的條件下描述概率分布P(x|y,θ)。
在訓(xùn)練階段中訓(xùn)練統(tǒng)計的概率模型P(4)。為此從給定的訓(xùn)練日志文件中提取會議矢量,并匯總成一個訓(xùn)練數(shù)據(jù)組(請參閱附圖3,方法步驟310)。
用所述的訓(xùn)練數(shù)據(jù)組訓(xùn)練統(tǒng)計的概率模型(4)(請參閱附圖3,方法步驟320和方法步驟330)。
在所述的訓(xùn)練階段中,使一個修正的成本函數(shù)Lmod(θ)、也即一個具有經(jīng)拉格朗日參數(shù)λ耦合的附加項K(θ)的對數(shù)似然性L(θ)最小化(請參閱附圖3,方法步驟320和方法步驟330)Lmod(Θ)=Σilog(P(xk|Θ))+λK(Θ)---(5)]]>式中,xk表示一個訓(xùn)練數(shù)據(jù),θ表示在訓(xùn)練中應(yīng)匹配的參數(shù),log(...)表示對數(shù)函數(shù),和P(xk|θ)表示在所述參數(shù)的條件下所述訓(xùn)練數(shù)據(jù)xk的條件概率。
將用優(yōu)先級P(y|θ)加權(quán)的平均的(負的)熵E(θ)采用為附加項K(θ)(請參閱附圖3,方法步驟320)。
適用下式E(Θ)=ΣyP(y|Θ)ΣxP(x|y,Θ)logP(x|y,Θ)---(6)]]>在采用基于期望最大化方法(EM算法)的優(yōu)化方法的條件下進行修正的成本函數(shù)的最小化,正象在[2]中所說明的那樣。
為此通過改變參數(shù)θ來逐步優(yōu)化以下的規(guī)程 式中,θ舊表示在優(yōu)化步驟之前的參數(shù),θ新表示在優(yōu)化步驟之后的參數(shù),和argθmax{...}表示(請補充)。
但是要指出,在所述的訓(xùn)練時也可以采用未修正的成本函數(shù),對數(shù)似然性L(θ)。
所訓(xùn)練的統(tǒng)計的概率模型現(xiàn)在在以下用于求出因特網(wǎng)用戶的典型行為樣式,也稱為系統(tǒng)結(jié)構(gòu)(請參閱附圖3,方法步驟340)。
為此,對于模型的每個子模型求出條件概率P(xi|y,θ),并就變量xi的最大確定性的概率分布來進行分析研究。
將在[4]中說明的庫爾伯克-萊普勒-間距(Kullback-Leibler-Distanz) Q(xi)log(Q(xi)/P(xi|y,θ))采用為最大確定性的概率分布的一個判據(jù),式中,Q(...)表示經(jīng)驗的概率。
此時,將屬于變量xi的概率分布向下或向上取整到0%或100%。向下或向上取整的分布被凍結(jié),即在本方法的以后的過程中不再改變這些分布。象所述的那樣再次進行模型的訓(xùn)練。
以此保證了,在每個子模型之內(nèi)一個變量xi的至少幾個概率分布具有一種確定的結(jié)構(gòu),并因此可將每個子模型解釋為一個系統(tǒng)結(jié)構(gòu)。
附圖6中示出了,如何按照上面的進行方式識別和命名一個系統(tǒng)結(jié)構(gòu)″有針對性的組織結(jié)構(gòu)″。
附圖6示意地展示了具有系統(tǒng)625子模型的本征變量610″用戶系統(tǒng)結(jié)構(gòu)″。
此外,附圖6中示出了系統(tǒng)″因特網(wǎng)會議″的變量620,譬如用戶等級和訪問數(shù)目。
附圖6展示一個所選出的子模型626,并對于所選出的子模型626展示了變量620的在采用訓(xùn)練模型的條件下求出的所屬概率分布628。
在用按Kullback-Leibler的在[4]中所說明的方法處理概率分布之后,變量″組織結(jié)構(gòu)″630具有最大確定性的概率分布631。
因此所選出的子模型626是以變量″組織結(jié)構(gòu)″的這種最大確定性的概率分布631為特征的。與此相應(yīng)地,所選出的子模型獲得一個語義名稱″有針對性的組織結(jié)構(gòu)″。
按照這種進行方式求出另外的系統(tǒng)結(jié)構(gòu),譬如″標(biāo)準(zhǔn)PC″和″有針對性的訪問″。
附圖4中示意地示出了具有本征變量410的統(tǒng)計概率模型400。
附圖4展示所述的被分配了語義名稱″用戶系統(tǒng)結(jié)構(gòu)″的本征變量410。
附圖4也展示了系統(tǒng)″因特網(wǎng)會議″的變量420,譬如″用戶等級″、″訪問數(shù)目″、″起始網(wǎng)頁″和″通向報告的信息(Infos zu Referaten)″。
附圖5中示出了分析因特網(wǎng)會議的結(jié)果500,在這些因特網(wǎng)會議中許多不同的用戶訪問了所選出服務(wù)器的因特網(wǎng)頁。
為此按照上述方案處理所選出的服務(wù)器的日志文件。
附圖5展示所述的本征變量510″用戶系統(tǒng)結(jié)構(gòu)″和所屬的語義上表示的系統(tǒng)結(jié)構(gòu)511,譬如有針對性的訪問、標(biāo)準(zhǔn)PC、和未知的人員。
對于系統(tǒng)結(jié)構(gòu)511分別給出了一個概率512。
系統(tǒng)結(jié)構(gòu)511的概率512說明了,系統(tǒng)結(jié)構(gòu)511以何種頻度出現(xiàn)在存儲在日志文件中的因特網(wǎng)會議中。
附圖5也展示了系統(tǒng)″因特網(wǎng)會議″的變量520,譬如用戶等級、訪問數(shù)目。
對于所示出的變量520分別給出了所屬的離散化的值范圍521。
此外,對于每個變量520給出了一個概率分布522,各自的變量520以該概率分布522出現(xiàn)在存儲在日志文件中的因特網(wǎng)會議中。
但是必須強調(diào),所說明的進行方式不局限于模型化系統(tǒng)″因特網(wǎng)會議″。
通過所說明的進行方式可以對于每個任意的系統(tǒng),譬如化學(xué)反應(yīng)器、交通系統(tǒng)、或汽車中的故障診斷系統(tǒng)求出一個模型。
在此情況下產(chǎn)生另外的狀態(tài)參量,譬如化學(xué)的物質(zhì)組成、物質(zhì)濃度、交通密度、或交通流量。
在故障診斷系統(tǒng)中狀態(tài)參量可以是描述汽車行駛狀態(tài)或汽車電子裝置的變量,譬如速度、發(fā)動機扭矩、或發(fā)動機轉(zhuǎn)速。在這種情況下由本征的變量描述汽車的故障狀態(tài)或汽車的故障系統(tǒng)結(jié)構(gòu),譬如″噴油系統(tǒng)中的故障″。
應(yīng)按上面的實施方案實行在模型化這種系統(tǒng)時的進行方式。
以下說明對所述實施例的替換方案。
在對所述實施例的第一替換方案中,在訓(xùn)練統(tǒng)計的概率模型(4)時將建立在基于梯度的通常方法上的方法用于參數(shù)θ的優(yōu)化。
為此用′經(jīng)驗的優(yōu)先級′Q(y|θ)加權(quán)平均的(負的)熵E(θ)E′(Θ)=ΣyQ(y|Θ)ΣxP(x|y,Θ)logP(x|y,Θ)---(8)]]>式中,對于Q(y|θ)適用Q(y|Θ)=1KΣiP(y|xi,Θ).---(9)]]>基于梯度的方法中的目標(biāo)函數(shù)在此情況下為Lmod(Θ)=Σilog(P(xi|Θ))+λE′(Θ)---(10)]]>在對所述實施例的第二替換方案中,在訓(xùn)練時進行一種變換M(Θ)=ΣyΣxP(x,y|Θ)logP(x|y,Θ)P(x|Θ)---(11)]]>式中,M(θ)表示所變換的項。
在此情況下優(yōu)化以下的規(guī)程Θneu=argmaxΘ{ΣiΣyP(y|xi,Θalt)logP(xi,y|Θ)+λM(Θ)}.---(12)]]>在對所述實施例的第三替換方案中,采用一個熵E(θ)作為最大確定的概率分布的一個判據(jù),其中,E(θ)=-ΣxiP(xi|y,θ)logP(xi|y,θ).]]>
在本文件的范圍內(nèi)引用了以下的文獻[1]Bartholomew及其他人著本征變量模型和因子分析,CharlesGrifin,1987;[2]Tanner及其他人著統(tǒng)計干涉的工具,Springer出版社1996;[3]萬維網(wǎng)基礎(chǔ)(WWW),于1999年3月16日可在http//www.w3.org/下獲得[4]Cover及其他人著信息理論要素,Wiley 1991。
權(quán)利要求
1.用于求取系統(tǒng)模型的至少一個子模型的方法,其中,通過狀態(tài)參量描述所述系統(tǒng)的一個狀態(tài),-其中,確定多個組的所述狀態(tài)參量值,-其中,從所述的組中求出所述狀態(tài)參量的一個概率分布,-其中,在采用所述組和所述狀態(tài)參量的概率分布的條件下,和在采用一個統(tǒng)計的學(xué)習(xí)方法的條件下求出系統(tǒng)的所述子模型,其中,由所述的子模型在狀態(tài)參量的所述概率分布的前提下描述所述的系統(tǒng),其特征在于,-所述狀態(tài)參量中的至少一個是一個離散的狀態(tài)參量。
2.按權(quán)利要求1的方法,其中,所述的模型包括多個子模型。
3.按權(quán)利要求2的方法,其中,所有的狀態(tài)參量是離散的狀態(tài)參量。
4.按權(quán)利要求1至3之一的方法,其中,所述的概率分布是一個多項式分布或二項式分布。
5.按權(quán)利要求1至4的方法,其中,求出至少一個特征組的狀態(tài)參量值,其中,狀態(tài)參量的所述概率分布在所述的至少一個特征組中具有一個極限值。
6.按權(quán)利要求5的方法,其中,所述的極限值是一個最大值。
7.按權(quán)利要求5或6的方法,其中,對于所述的特征組確定一個語義名稱。
8.按權(quán)利要求5至7之一的方法,其中,求出多個特征組。
9.按權(quán)利要求1至8之一的方法,其中,通過離散化一個連續(xù)的狀態(tài)參量求出至少一個所述的離散的狀態(tài)參量.
10.按權(quán)利要求1至9之一的方法,其中,對于一個子模型確定統(tǒng)計不可靠性的一個尺度。
11.按權(quán)利要求10的方法,其中,在所述統(tǒng)計的學(xué)習(xí)方法中考慮統(tǒng)計不可靠性的所述的尺度。
12.按權(quán)利要求11的方法,其中,如此考慮統(tǒng)計不可靠性的所述的尺度,使得只學(xué)習(xí)一個具有統(tǒng)計不可靠性的小尺度的這種子模型。
13.按權(quán)利要求10至12之一的方法,其中,統(tǒng)計不可靠性的所述的尺度是一個條件熵。
14.按權(quán)利要求1至13之一的方法,其中,所述的模型是一個貝葉斯網(wǎng)。
15.按權(quán)利要求1至14之一的方法,其中,在所述統(tǒng)計的學(xué)習(xí)方法中確定一個對數(shù)的似然性。
16.按權(quán)利要求1至15之一的方法,其中,在所述統(tǒng)計的學(xué)習(xí)方法中執(zhí)行一種期望最大化方法。
17.按權(quán)利要求1至16之一的方法,其中,通過測量狀態(tài)參量和/或規(guī)定狀態(tài)參量來確定所述系統(tǒng)的一個狀態(tài)。
18.按權(quán)利要求1至17之一的方法,用于系統(tǒng)狀態(tài)的預(yù)測。
19.按權(quán)利要求18的方法,其中,在所述的預(yù)測時僅部分地確定一組狀態(tài)參量的狀態(tài)參量,并在采用所述的模型和部分確定的狀態(tài)參量的條件下求出該組的其它的狀態(tài)參量。
20.按權(quán)利要求1至19之一的方法,其中,所述的系統(tǒng)被規(guī)定為一種因特網(wǎng)訪問。
21.按權(quán)利要求20的方法,用于分析許多因特網(wǎng)訪問。
22.用于求取系統(tǒng)模型的至少一個子模型的裝置,其中,通過狀態(tài)參量描述所述系統(tǒng)的狀態(tài),具有一個如此設(shè)置的處理機,使得-可以確定多組的所述狀態(tài)參量值,-從所述的組中可以求出所述狀態(tài)參量的一個概率分布,-在采用所述組和所述狀態(tài)參量的概率分布的條件下,和在采用一個統(tǒng)計的學(xué)習(xí)方法的條件下可以求出系統(tǒng)的所述子模型,其中,由所述的子模型在狀態(tài)參量的所述概率分布的前提下描述所述的系統(tǒng),其特征在于,-所述狀態(tài)參量中的至少一個是一個離散的狀態(tài)參量。
全文摘要
在用于求取系統(tǒng)模型的至少一個子模型的方法和裝置中,其中,通過狀態(tài)參量描述所述系統(tǒng)的一個狀態(tài),和其中,所述狀態(tài)參量中的至少一個是一個離散的狀態(tài)參量,確定多個組的所述狀態(tài)參量值。從所述的組中求出所述狀態(tài)參量的一個概率分布。在采用所述組和狀態(tài)參量的所述概率分布的條件下和在采用一個統(tǒng)計的學(xué)習(xí)方法的條件下求出系統(tǒng)的所述子模型。由所述的子模型在狀態(tài)參量的所述概率分布前提下描述所述的系統(tǒng)。
文檔編號H04L29/08GK1452753SQ0081946
公開日2003年10月29日 申請日期2000年12月21日 優(yōu)先權(quán)日2000年2月28日
發(fā)明者M·哈夫特, R·霍夫曼, V·特雷斯普 申請人:西門子公司