欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于全記憶事件序列挖掘模型的用藥分析方法與流程

文檔序號:12720677閱讀:362來源:國知局
一種基于全記憶事件序列挖掘模型的用藥分析方法與流程

本發(fā)明屬于數(shù)據(jù)挖掘、醫(yī)療信息和大數(shù)據(jù)技術(shù)領(lǐng)域,具體涉及一種基于全記憶事件序列挖掘模型的用藥分析方法。



背景技術(shù):

有效的用藥方案對于患者獲取最佳治療是非常重要的。利用已經(jīng)積累的大規(guī)模的患者臨床用藥歷史數(shù)據(jù)進行分析建模,有助于醫(yī)生對患者下一步用藥提供決策支持。數(shù)據(jù)挖掘方法已經(jīng)被用于用藥分析,傳統(tǒng)的用藥數(shù)據(jù)挖掘方法采用頻繁模式挖掘發(fā)現(xiàn)頻繁出現(xiàn)的用藥組合,推斷藥物之間的關(guān)聯(lián)。然而,一方面,不考慮用藥順序的頻繁模式挖掘忽略了疾病演變的特征對用藥的影響;另一方面,雖然已有考慮“序”和時間特征的頻繁序列模式挖掘方法被使用,然而,大量冗余的結(jié)果模式和關(guān)聯(lián)規(guī)則限制了方法的實際應(yīng)用。更重要的是,患者的用藥并不是簡單的考慮先后關(guān)系,還需要考慮在治療過程中前序不同時間點的用藥對目標時間點的用藥的影響的差異。

本發(fā)明針對患者用藥歷史數(shù)據(jù),提出一種基于全記憶事件序列挖掘模型的用藥分析方法。首先,采用事件序列形式建模表示用藥歷史數(shù)據(jù),即形成用藥事件序列;然后,針對患者疾病隨時間的變化,以及用藥受不同階段用藥情況的影響,將需要預(yù)測事件的時間節(jié)點前的所有事件看作為預(yù)測事件的記憶,對預(yù)測事件記憶加權(quán)構(gòu)成事件記憶特征表示,并構(gòu)建訓(xùn)練數(shù)據(jù)集;再構(gòu)建訓(xùn)練模型,設(shè)置損失函數(shù),求解參數(shù);最后,對于待預(yù)測用藥事件序列實現(xiàn)事件預(yù)測。該方法不僅考慮了時間順序,以及不同階段患者用藥的影響差異,而且對比以往的一階或高階事件序列分析方法,能夠利用盡可能多的數(shù)據(jù)來用于決策,從而減少決策的失誤。



技術(shù)實現(xiàn)要素:

本發(fā)明的主要目的是提供一種基于用藥記錄數(shù)據(jù)的用藥分析方法,能夠使用患者周期內(nèi)所有歷史用藥事件記憶來幫助預(yù)測下一個用藥事件的發(fā)生。

本發(fā)明提供了一種基于全記憶事件序列挖掘模型的用藥分析方法,事件序列的記憶是以預(yù)測事件的時間節(jié)點為前提定義的,在預(yù)測事件的時間節(jié)點前的所有事件被看作為預(yù)測事件的記憶。本發(fā)明的主要思想是:將原始用藥數(shù)據(jù)轉(zhuǎn)換成類別型的用藥事件發(fā)生序列,把所有類別型用藥事件序列的每個用藥事件節(jié)點轉(zhuǎn)換為歐式空間的多維向量表示,此基礎(chǔ)上,根據(jù)要預(yù)測的用藥事件的前一個節(jié)點(稱為當前事件)來對所有歷史記錄的事件(預(yù)測事件的記憶,設(shè)置一個特定的記憶長度閾值,選擇高于該閾值的序列用于構(gòu)造訓(xùn)練數(shù)據(jù)集)加權(quán)求和,形成預(yù)測事件的記憶的特征表示,作為預(yù)測下一個事件向量的分類器的標準輸入,把要預(yù)測的事件的多維向量表示作為輸出,訓(xùn)練一個預(yù)測模型,再把歐式空間的多維向量映射回原來的類別型空間,使用所有用藥事件序列訓(xùn)練;最后,對于新的用藥事件序列,輸入訓(xùn)練好的模型,用于預(yù)測未來事件。該方法不僅考慮了時間順序,以及不同階段患者用藥的影響差異,而且對比以往的一階或高階事件序列分析方法,能夠利用盡可能多的數(shù)據(jù)來用于決策,從而減少決策的失誤

本發(fā)明提供的基于全記憶事件序列挖掘模型的用藥分析方法,其流程如圖1所示,具體步驟如下:

(1)首先,對患者歷史用藥數(shù)據(jù)進行預(yù)處理,即采集用藥事件序列的原始數(shù)據(jù),將原始用藥數(shù)據(jù)轉(zhuǎn)換成用藥事件發(fā)生序列;然后,對用藥事件序列數(shù)據(jù)進行處理,將序列中的每個事件都用一個或多個類別型的變量進行表示;

(2)對于已經(jīng)處理好的類別型變量表示的事件序列,設(shè)置一個特定的記憶長度閾值,選擇高于該閾值的序列用于構(gòu)造訓(xùn)練數(shù)據(jù)集;

(3)采用基于全記憶事件序列方法構(gòu)建訓(xùn)練預(yù)測模型;

(4)對于新的用藥事件序列,輸入預(yù)測模型實現(xiàn)對未來時間節(jié)點的用藥事件進行預(yù)測。

本發(fā)明步驟(1)中,患者歷史用藥數(shù)據(jù)的事件序列的轉(zhuǎn)化表示,將患者歷史用藥記錄表示為事件,每個事件用一個或多個類別型變量表示。

本發(fā)明步驟(2)中,將患者用藥的歷史事件作為記憶序列,形成記憶特征表示。

本發(fā)明步驟(4)中,把新的用藥事件序列作為訓(xùn)練好的預(yù)測模型的輸入,使用模型輸出預(yù)測結(jié)果

本發(fā)明步驟(2)中,構(gòu)造訓(xùn)練數(shù)據(jù)集方法的具體步驟為:

(1)設(shè)置一個特定的記憶長度閾值M,要高于這個閾值的序列才用于構(gòu)造訓(xùn)練數(shù)據(jù)集合;

(2)對于每個事件序列,從第M+1個事件節(jié)點開始設(shè)置預(yù)測節(jié)點,采集訓(xùn)練集;預(yù)測節(jié)點的每個類別變量作為模型的輸出,當前節(jié)點之前的所有節(jié)點作為模型的輸入;預(yù)測節(jié)點不斷向右移動,每移動一個時間節(jié)點就形成一個或多個新的訓(xùn)練數(shù)據(jù)。如圖2所示。

本發(fā)明步驟(3)中,構(gòu)建訓(xùn)練模型方法的具體步驟為:

(1)設(shè)置一個最大記憶數(shù)量T,使用的記憶數(shù)量不能超過這個數(shù)量,通常設(shè)置大于數(shù)據(jù)中大部分序列的長度;

(2)初始化變換矩陣A,把預(yù)測事件的前一個事件投影到多維連續(xù)空間中的向量,并求和形成一個向量q;

(3)初次化變換矩陣B、C,把預(yù)測事件之前的所有事件(前一個事件除外)分別投影到多維連續(xù)空間中的多個向量,這些稱為記憶向量,表示預(yù)測事件的所有記憶;

(4)使用向量q和經(jīng)過B投影矩陣變換后的向量做內(nèi)積,形成權(quán)重向量,再使用這些權(quán)重向量和經(jīng)過C投影矩陣變換后的記憶向量加權(quán)求和,形成最終的一個記憶向量表示m;

(5)向量m和向量q相加,作為預(yù)測分類器的輸入,并使用一個變換矩陣W,投影到原始的離散事件空間,再使用softmax函數(shù),得到下一個預(yù)測事件的每一項的概率;

(6)使用交叉熵損失函數(shù)作為目標函數(shù),使用梯度下降的方法求參數(shù),即求得參數(shù)A、B、C和W。

這里,變換矩陣A、B、C可以是隨機投影矩陣(或其它離散變量的嵌入式方法embedding matrix)。

本發(fā)明方法可根據(jù)患者用藥記錄數(shù)據(jù)來對患者用藥情況進行數(shù)據(jù)分析,并對患者后期用藥情況和疾病或并發(fā)癥進行推斷。

本發(fā)明方法對事件序列進行預(yù)測,對比以往的一階或高階事件序列分析方法,能夠利用盡可能多的數(shù)據(jù)來用于決策,從而減少決策的失誤。

附圖說明

圖1為本發(fā)明的挖掘方法流程示意圖。

圖2為本發(fā)明方法中構(gòu)造訓(xùn)練集的方法示例圖。

圖3為發(fā)明方法的具體實施方式示例圖。

具體實施方式:

下面給出該方法的具體實施方式,如圖3所示。

(1)用藥事件序列生成:統(tǒng)計所有用藥事件序列中的出現(xiàn)的用藥事件內(nèi)容,用離散變量的集合表示用藥事件序列中的每個用藥事件,例如,(1,3,5)-(6,7)-(8)是一個長度為3的用藥事件序列,每個用藥事件序列的節(jié)點用離散變量的集合表示。例如,上面的用藥事件序列中假設(shè)一共有8種藥物,每種藥物對應(yīng)的離散變量表示為1~8,那么上述序列表示患者第一次用了1,3,5這三個編號的藥物,第二次用了6,7這兩個編號的藥物,第三次使用了8這個編號的藥物。

(2)訓(xùn)練數(shù)據(jù)集構(gòu)造:使用上述生成的用藥事件離散序列來構(gòu)建訓(xùn)練數(shù)據(jù)集(X,Y),其中,X是分類器的輸入,Y是分類器的輸出。根據(jù)預(yù)先指定的最短記憶長度M,把一個N個事件的用藥事件序列分為|N-M|個訓(xùn)練數(shù)據(jù)集合,每個訓(xùn)練數(shù)據(jù)集合的形式分別是(X=x1,x2,x3,…,xT,y), 其中y是原始序列中xT的下一個事件,也就是xT+1。例如,對于上例中的用藥事件序列,如果指定最短歷史記憶長度為2(即M=2),那么,該序列可以作為其中一個訓(xùn)練數(shù)據(jù)集,X=[x1,x2]=[(1,3,5),(6,7)],y=(8),其中x1=(1,3,5),x2=(6,7)。

例如:在圖2中,假設(shè)其中一個事件序列數(shù)據(jù)樣本為(1,2)-(5)-(9,1)-(7)-(13),如果設(shè)置最短記憶長度為2,則可以形成以下4個訓(xùn)練樣本:第1和第2個訓(xùn)練樣本是以第3個時間節(jié)點的事件為預(yù)測事件,標簽分別為9和1,輸入為(1,2)-5。第2個訓(xùn)練樣本以第4個時間節(jié)點的事件為預(yù)測事件,標簽為7,輸入為(1,2)-(5)-(9,1)。第4個樣本以第5個時間節(jié)點的事件為預(yù)測事件,標簽為13,輸入為(1,2)-(5)-(9,1)-(7)。

(3)使用一個隨機投影矩陣C(或其它離散變量的嵌入式方法embedding matrix),把輸入變量x中的前T-1個離散變量集合序列[x1,x2,…,xT-2,xT-1]轉(zhuǎn)變成一個歐氏空間的多維連續(xù)向量序列[xc1,xc2,…,xcT-2,xcT-1],其中,每個xci是一個多維連續(xù)向量。實現(xiàn)的方法是把每個離散變量用C矩陣的對應(yīng)的列表示,然后,一個時間節(jié)點上的事件的所有離散變量對應(yīng)的多維連續(xù)變量相加,形成表示一個事件的多維向量,例如,在上面的例子中,x1=(1,3,5),xc1=(C~1+C~3+C~5)是矩陣C的對應(yīng)第1,3,5這三列相加,使用數(shù)學(xué)表達式的方法就是把一個事件里的每個離散變量使用one-h(huán)ot方法表示,即xi1=0000010…00,那么xci=C*xi1+C*xi2+C*xi3。

(4)使用另一個隨機投影矩陣B(或其它離散變量嵌入式方法),把[x1,x2,…,xT-2,xT-1]用歐氏空間的多維連續(xù)向量表示為[xb1,xb2,…,xbT-2,xbT-1]。其中每個事件xbi是一個多維連續(xù)向量。實現(xiàn)的方法和上面的步驟相同,只是投影矩陣不同。其中B、C矩陣和下面提到的A矩陣都可以看做是特征矩陣,也可以看做是模型的參數(shù),作用在于把離散事件序列的輸入轉(zhuǎn)換為多維度歐式空間的特征。

(5)使用第三個隨機投影矩陣A把當前事件集合[xT]用一個歐式空間的高維連續(xù)向量表示[xq]。在上面的例子中,x2=xT=(6,7),那么xq=A~6+B~7,也就是把矩陣A的第6列和第7列相加,來表示xq這個歐式空間的多維向量。

(6)把xq分別和[xb1,xb2,…,xbT-2,xbT-1]做向量內(nèi)積,得到一個權(quán)重向量P=(p1,p2,…,pT-1)。

(7)把權(quán)重向量p1,p2,…,pT-1分別乘以xb1,xb2,…,xbT-2,xbT-1,再求和,得到輸出記憶向量O=p1*xb1+…+pT-1*xbT-1。

(8)把xq和O相加,得到分類器的輸入向量。

(9)分類器的輸出設(shè)置為:y=softmax(W(xq+O)),其中,y是輸出的離散變量。W是D*|V|的矩陣,其中D是提前設(shè)置的多維向量的維度,|V|是所有出現(xiàn)的用藥事件內(nèi)容的個數(shù)。

(10)設(shè)置交叉熵損失函數(shù),作為訓(xùn)練這個預(yù)測模型的目標函數(shù)。其中yik=1,表示一個訓(xùn)練樣本的輸出為離散索引k(表示藥物標號),yik-就是預(yù)測的概率取值,取值為0~1之間,由上一步的softmax函數(shù)得到。

(11)訓(xùn)練模型,即求解參數(shù)A、B、C和W,這里使用梯度下降方法求解。

(12)預(yù)測:對于一個序列[x1,x2,…,xT],要預(yù)測xT+1,按照前面(1)~(9)步驟,得到要輸出的事件的類別型變量表示,再根據(jù)事件的內(nèi)容編碼解釋數(shù)據(jù)的內(nèi)容。例如,如果模型的輸出結(jié)果是5,那么對應(yīng)的預(yù)測結(jié)果就是5所對應(yīng)的藥物。

(13)例如:在圖3中,當一個訓(xùn)練樣本為(1,2)-(5)-(9,1)-(7)-(13),其中標簽為(13),輸入為(1,2)-(5)-(9,1)-(7),根據(jù)步驟(3)~(10),事件變量(7)和(1,2)-(5)-(9,1)分別形成最后的多維歐式空間中的向量q和m,然后相加作為分類器的輸入,使用W矩陣和softmax函數(shù)形成最后的輸出,并和真實標簽共同計算交叉熵損失函數(shù)。

當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
财经| 突泉县| 平陆县| 阿克陶县| 温宿县| 如东县| 大同县| 河源市| 时尚| 泰来县| 莱芜市| 长寿区| 松滋市| 罗甸县| 绥滨县| 平定县| 中宁县| 凤翔县| 鹤庆县| 蓝田县| 三穗县| 铁岭市| 沿河| 青田县| 沙田区| 齐河县| 江达县| 满洲里市| 蒲城县| 黎平县| 陇西县| 福安市| 娄底市| 平远县| 勃利县| 武威市| 永善县| 义乌市| 安阳县| 武穴市| 洛川县|