欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于多維時(shí)態(tài)數(shù)據(jù)挖掘的系統(tǒng)、方法和計(jì)算機(jī)程序的制作方法

文檔序號(hào):6350327閱讀:296來(lái)源:國(guó)知局
專(zhuān)利名稱(chēng):用于多維時(shí)態(tài)數(shù)據(jù)挖掘的系統(tǒng)、方法和計(jì)算機(jī)程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明總體上涉及數(shù)據(jù)挖掘。本發(fā)明更具體地涉及實(shí)現(xiàn)多維、時(shí)間獨(dú)立查詢和分折的數(shù)據(jù)挖掘環(huán)境。
背景技術(shù)
存在多個(gè)其中多個(gè)設(shè)備生成多個(gè)數(shù)據(jù)流的領(lǐng)域,并且期望監(jiān)控、分析和/或預(yù)測(cè)時(shí)間相關(guān)的行為。使用現(xiàn)有的數(shù)據(jù)挖掘環(huán)境,這種跨多個(gè)數(shù)據(jù)流的時(shí)間相關(guān)性尤其對(duì)于分折目的而言可能難于解決。需要一種改進(jìn)的數(shù)據(jù)挖掘環(huán)境,其支持跨例如多個(gè)流、多個(gè)實(shí)體、多個(gè)可能的實(shí)體屬性、隨時(shí)間變化的數(shù)據(jù)流的多個(gè)可能行為以及數(shù)據(jù)流中反映的多個(gè)事件進(jìn)行的時(shí)間相關(guān)數(shù)據(jù)的數(shù)據(jù)分析(包括出于數(shù)據(jù)挖掘的目的),從而產(chǎn)生多維環(huán)境(即,實(shí)體、流、實(shí)體屬性、 流行為和流事件)。還需要如下數(shù)據(jù)挖掘環(huán)境,其足夠靈活以允許相對(duì)開(kāi)放式查詢,由此實(shí)現(xiàn)例如對(duì)包括具有新維度的趨勢(shì)或者基于相對(duì)小的數(shù)據(jù)集的趨勢(shì)在內(nèi)的趨勢(shì)檢測(cè)。例如,各地的重癥監(jiān)護(hù)室使用一系列醫(yī)療監(jiān)控設(shè)備,諸如用于生命保障和危急監(jiān)控的醫(yī)療設(shè)備。這些設(shè)備已經(jīng)投入使用了 50年以上,并且使得垂危的內(nèi)科患者和外科患者能夠由在恢復(fù)和/或維持重要器官功能方面訓(xùn)練有素的醫(yī)生和護(hù)士在復(fù)雜、專(zhuān)業(yè)環(huán)境中進(jìn)行觀察和監(jiān)控。一系列不同的設(shè)備顯示生理數(shù)據(jù),并且許多設(shè)備具有經(jīng)由串行、USB或其他端ロ輸出此數(shù)據(jù)的能力。除了采集此數(shù)據(jù)供醫(yī)務(wù)人員實(shí)時(shí)使用外,還期望支持針對(duì)其他相關(guān)臨床研究的數(shù)據(jù)的二次分析,例如以支持發(fā)現(xiàn)可以是某些狀況發(fā)動(dòng)的指示的預(yù)先未知的趨勢(shì)和模式。諸如此類(lèi)的針對(duì)健康數(shù)據(jù)的二次使用的潛力是顯著的。在2007年美國(guó)醫(yī)療信息協(xié)會(huì)雜志中發(fā)布的、題為"Toward a National Framework for the Secondary Use of Health Data,, 的美國(guó)醫(yī)療信息協(xié)會(huì)白皮書(shū)中,支持當(dāng)今數(shù)據(jù)密集型醫(yī)療環(huán)境中數(shù)據(jù)二次使用的基礎(chǔ)設(shè)施的迫切性被視為美國(guó)健康系統(tǒng)的關(guān)鍵。醫(yī)療監(jiān)控設(shè)備產(chǎn)生大量數(shù)據(jù),這使得不可能人工分析這些數(shù)據(jù)。増加了大數(shù)據(jù)集的復(fù)雜度是生理監(jiān)控?cái)?shù)據(jù)(該數(shù)據(jù)是多維的)的本性,其中值得注意的不僅是單個(gè)維度中的改變,而且有時(shí)是在若干維度中的同時(shí)改變。由于監(jiān)控設(shè)備產(chǎn)生的時(shí)間序列是時(shí)態(tài) (temporal)的,因此需要如下臨床研究框架,該框架使得維度和時(shí)態(tài)行為能夠在數(shù)據(jù)挖掘期間被保留,以便不在挖掘過(guò)程期間丟失時(shí)間和上下文的信息。在臨床研究領(lǐng)域,為支持在患者的狀況中特定事件的時(shí)機(jī)可能非常重要的情況下,發(fā)現(xiàn)可能是重癥監(jiān)護(hù)患者狀況發(fā)作指示的新趨勢(shì)和模式,需要包括如下方法的集成時(shí)態(tài)抽取數(shù)據(jù)挖掘系統(tǒng),該方法支持關(guān)于與被研究的狀況發(fā)動(dòng)而對(duì)歷史數(shù)據(jù)進(jìn)行重新校準(zhǔn)。

發(fā)明內(nèi)容
本發(fā)明提供了一種用于多維時(shí)態(tài)數(shù)據(jù)挖掘的系統(tǒng)、方法和計(jì)算機(jī)程序。本發(fā)明還提供了一種用于多維時(shí)態(tài)抽取和數(shù)據(jù)挖掘的方法,該方法包括采集并選擇性清洗多維數(shù)據(jù),該多維數(shù)據(jù)包括多個(gè)數(shù)據(jù)流;時(shí)態(tài)抽取多維數(shù)據(jù);以及基于至少一個(gè)感興趣的時(shí)間點(diǎn)來(lái)相對(duì)校準(zhǔn)經(jīng)時(shí)態(tài)抽取的多維數(shù)據(jù)。該系統(tǒng)包括計(jì)算機(jī)實(shí)現(xiàn)的數(shù)據(jù)挖掘系統(tǒng),其特征在于至少ー個(gè)數(shù)據(jù)存儲(chǔ);以及與該至少ー個(gè)數(shù)據(jù)存儲(chǔ)通信的處理器,該處理器配置用干使用用戶設(shè)置的選擇標(biāo)準(zhǔn)來(lái)從數(shù)據(jù)存儲(chǔ)采集并構(gòu)造至少ー個(gè)時(shí)間相關(guān)的數(shù)據(jù)集;根據(jù)預(yù)定抽取規(guī)則來(lái)向至少ー個(gè)時(shí)間相關(guān)的數(shù)據(jù)集應(yīng)用時(shí)態(tài)抽取以產(chǎn)生至少ー個(gè)經(jīng)時(shí)間抽取的數(shù)據(jù)集;以及相對(duì)于至少ー個(gè)感興趣的時(shí)間點(diǎn)來(lái)重新校準(zhǔn)至少ー個(gè)經(jīng)時(shí)間抽取的數(shù)據(jù)集以產(chǎn)生至少ー個(gè)經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)條。本發(fā)明的計(jì)算機(jī)程序包括其上存儲(chǔ)有用于數(shù)據(jù)挖掘的計(jì)算機(jī)程序的計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)程序包括當(dāng)與處理器一起使用時(shí)用于生成并存儲(chǔ)多個(gè)可訪問(wèn)信息文件的指令集,該指令集包括特征在于以下的方法使用用戶設(shè)置的選擇標(biāo)準(zhǔn)來(lái)構(gòu)造至少ー個(gè)時(shí)間相關(guān)的數(shù)據(jù)集;根據(jù)預(yù)定抽取規(guī)則來(lái)向至少ー個(gè)時(shí)間相關(guān)的數(shù)據(jù)集應(yīng)用時(shí)態(tài)抽取以產(chǎn)生至少ー個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集;相對(duì)于感興趣的時(shí)間點(diǎn)來(lái)相對(duì)地校準(zhǔn)至少ー個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集以創(chuàng)建至少ー個(gè)經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)集;以及存儲(chǔ)每個(gè)至少ー個(gè)數(shù)據(jù)集用于隨后檢
^ O在此方面,在詳細(xì)說(shuō)明本發(fā)明的至少ー個(gè)實(shí)施方式之前,應(yīng)當(dāng)理解本發(fā)明在其應(yīng)用上不受限于以下描述或其中提供的示例中闡述的或附圖中舉例說(shuō)明的構(gòu)造細(xì)節(jié)和組成布置。本發(fā)明能具有其他實(shí)施方式井能以各種方式實(shí)施和實(shí)現(xiàn)本發(fā)明。同時(shí),將理解在此使用的措詞和術(shù)語(yǔ)是出于描述的目的而不應(yīng)當(dāng)被認(rèn)為是限制。


圖1圖示了現(xiàn)有技術(shù)的CRISP-DM模型。
圖2圖示了用于實(shí)現(xiàn)本發(fā)明的系統(tǒng)。
圖3圖示了可通過(guò)云計(jì)算架構(gòu)訪問(wèn)的本發(fā)明。
圖4圖示了已知CRISP-DM與科學(xué)方法之間的并行。
圖5圖示了滿足零(null)假設(shè)測(cè)試需求的擴(kuò)展CRISP-DM模型。
圖6圖示了用于實(shí)現(xiàn)STDMntl框架的數(shù)據(jù)存儲(chǔ)模式。
圖7圖示了尤其用于實(shí)現(xiàn)針對(duì)臨床研究的STDMntl框架的圖6的數(shù)據(jù)存儲(chǔ)模式。
圖8圖示了用于使得臨床醫(yī)生能夠?qū)嵭斜景l(fā)明的方法的方案管理設(shè)備。
圖9圖示了作為示例的例如ECG不穩(wěn)定流的相對(duì)校準(zhǔn)。
具體實(shí)施例方式MM本發(fā)明涉及對(duì)已知多維數(shù)據(jù)挖掘環(huán)境的改進(jìn)。本發(fā)明包括對(duì)ー系列時(shí)態(tài)和相對(duì) (relative)規(guī)則的數(shù)據(jù)挖掘環(huán)境的添加。本發(fā)明提供的特定優(yōu)勢(shì)在于時(shí)態(tài)規(guī)則支持如下多維環(huán)境,該多維環(huán)境借助于數(shù)據(jù)預(yù)備階段,使得數(shù)據(jù)流能夠用與特定興趣點(diǎn)相關(guān)的時(shí)間戳進(jìn)行編碼。該環(huán)境提供了其中可能針對(duì)多個(gè)患者進(jìn)行跨多個(gè)參數(shù)的多種研究的整體框架。本發(fā)明的方法包括若干步驟。第一,多維數(shù)據(jù)被收集并被選擇性地清洗(clean)。 第二,多維數(shù)據(jù)被時(shí)態(tài)抽取(temporally abstracted),從而在多維中創(chuàng)建動(dòng)態(tài)數(shù)據(jù)挖掘環(huán)境(如下文進(jìn)ー步描述)。第三,經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)被相對(duì)校準(zhǔn)(relatively aligned)。時(shí)態(tài)抽取過(guò)程將原始設(shè)備或預(yù)處理流數(shù)據(jù)作為輸入,并且利用域知識(shí)(上下文) 將原始數(shù)據(jù)轉(zhuǎn)譯成如下行為或事件信息,該行為或事件信息處于比輸入數(shù)據(jù)的輸入流更慢的時(shí)間頻率,由此產(chǎn)生更高的層級(jí)、上下文敏感、定性、基于區(qū)間的表示。復(fù)雜時(shí)態(tài)抽取可以通過(guò)評(píng)估跨多個(gè)流的行為來(lái)創(chuàng)建??蛇x擇地,第四步驟為在所創(chuàng)建的多維數(shù)據(jù)挖掘環(huán)境中進(jìn)行探索性和/或解釋性數(shù)據(jù)挖掘。探索性數(shù)據(jù)挖掘是指通過(guò)支持對(duì)數(shù)據(jù)挖掘環(huán)境的查詢進(jìn)行數(shù)據(jù)挖掘而不強(qiáng)加規(guī)則或函數(shù)。解釋性數(shù)據(jù)挖掘嘗試通過(guò)對(duì)更多數(shù)據(jù)集執(zhí)行進(jìn)ー步的數(shù)據(jù)挖掘來(lái)進(jìn)ー步驗(yàn)證規(guī)則。備選的第四步驟,或者除了上文所述第四步驟的第五步驟為鏈接至ー個(gè)或多個(gè)遠(yuǎn)程設(shè)備以使得ー個(gè)或多個(gè)遠(yuǎn)程設(shè)備能夠使用所產(chǎn)生的經(jīng)時(shí)態(tài)抽取的并且經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)。遠(yuǎn)程設(shè)備可以是鏈接到提供所述數(shù)據(jù)流的本發(fā)明或與之相關(guān)聯(lián)的任意設(shè)備。遠(yuǎn)程設(shè)備可以位于同彼此、系統(tǒng)和實(shí)體物理上接近的位置。遠(yuǎn)程設(shè)備可以備選地位干與系統(tǒng)、彼此或?qū)嶓w附近的外部位置,例如位于國(guó)家或世界的遙遠(yuǎn)地區(qū),通過(guò)因特網(wǎng)或其他網(wǎng)絡(luò)與系統(tǒng)連接。遠(yuǎn)程設(shè)備可以無(wú)線地鏈接到系統(tǒng)或?qū)嶓w。設(shè)備可以全部連接到ー個(gè)實(shí)體,或者一系列設(shè)備子集可以連接到全集或樣本集內(nèi)現(xiàn)有的一系列實(shí)體。設(shè)備可以是例如醫(yī)療生理監(jiān)控設(shè)備、智能儀表、汽車(chē)遙感監(jiān)控設(shè)備、氣象傳感器、網(wǎng)絡(luò)流量監(jiān)控器、股票價(jià)格數(shù)據(jù)流或發(fā)電廠監(jiān)控系統(tǒng)。全集內(nèi)的匹配實(shí)體可以分別是醫(yī)療保險(xiǎn)內(nèi)的患者、電網(wǎng)中的住宅、汽車(chē)或氣象站。本發(fā)明的計(jì)算機(jī)程序最好理解為包括(1)時(shí)態(tài)效用(utility)或代理(agent),以及(2)相對(duì)效用或代理,均對(duì)應(yīng)于上文的方法步驟。時(shí)態(tài)效用和相對(duì)效用是鏈接的。本發(fā)明的計(jì)算機(jī)程序至少支持對(duì)所產(chǎn)生經(jīng)的時(shí)態(tài)抽取的和經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)的查詢。可選擇地, 計(jì)算機(jī)程序支持探索性和/或解釋性數(shù)據(jù)挖掘,這在ー個(gè)實(shí)現(xiàn)中采用已經(jīng)描述過(guò)的功能代理的形式。可選擇地,提供了規(guī)則生成代理。該規(guī)則生成代理為用戶提供了一種機(jī)制以用于通過(guò)提出規(guī)則并將規(guī)則存儲(chǔ)到數(shù)據(jù)表中來(lái)生成規(guī)則,或者存儲(chǔ)在探索性數(shù)據(jù)挖掘階段由系統(tǒng)提出的規(guī)則。響應(yīng)于關(guān)于所述規(guī)則的經(jīng)時(shí)態(tài)抽取并經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)可以發(fā)起警報(bào)、警告或消息。該過(guò)程可以是用戶驅(qū)動(dòng)的。通常,用戶愿意了解他們正在研究的內(nèi)容以及期望的規(guī)則。查詢可以是用戶驅(qū)動(dòng)的原因在于用戶可以根據(jù)需要操縱、分析或監(jiān)控?cái)?shù)據(jù)。查詢可以由用戶使用用戶接ロ提供。用戶接ロ可以提供用于輸入研究選擇標(biāo)準(zhǔn)的裝置。用戶接ロ的該部分是數(shù)據(jù)驅(qū)動(dòng)的,并且使得用戶能夠選擇標(biāo)準(zhǔn)來(lái)與符合研究的實(shí)體的其他選擇標(biāo)準(zhǔn)一起來(lái)限定感興趣的相對(duì)時(shí)間點(diǎn)。用戶接ロ還可以提供用于輸入感興趣的相對(duì)時(shí)間點(diǎn)的裝置,其使得用戶能夠基于事件、實(shí)體屬性、流行為、或者流事件(后兩者由其自己的流的時(shí)態(tài)抽取來(lái)表示)來(lái)選擇興趣點(diǎn)。用戶可以首先確定該感興趣的時(shí)間點(diǎn)是來(lái)自事件、實(shí)體屬性還是時(shí)態(tài)抽取。該感興趣的時(shí)間點(diǎn)可以被限定為日期時(shí)間,該日期時(shí)間為可操作用作相對(duì)校準(zhǔn)感興趣的數(shù)據(jù)流的參考點(diǎn)的時(shí)間點(diǎn)。基于用戶的選擇,用戶繼而提供有由來(lái)自數(shù)據(jù)庫(kù)的如下內(nèi)容所直接填充的列表可能事件的列表;具有日期時(shí)間的實(shí)體屬性的列表;或者時(shí)態(tài)抽取的列表。在時(shí)態(tài)抽取的情況下,用戶可以選擇是時(shí)態(tài)抽取的首次發(fā)生還是最近發(fā)生是感興趣的,并且還可以確定是起始時(shí)間還是結(jié)束時(shí)間是感興趣的。如果事件被選作相對(duì)興趣點(diǎn),則確定針對(duì)選定實(shí)體發(fā)生的事件是相對(duì)時(shí)間點(diǎn)。如果為日期時(shí)間的實(shí)體屬性被選作相對(duì)興趣點(diǎn)(例如,與實(shí)體相關(guān)的在特定時(shí)間之后存在哪些常見(jiàn)行為),則該日期時(shí)間為針對(duì)選定實(shí)體的相關(guān)時(shí)間點(diǎn),諸如完成制造的日期或者出生日期。如果選擇了時(shí)態(tài)抽取,則選擇了與針對(duì)給定實(shí)體的時(shí)態(tài)抽取的選定標(biāo)準(zhǔn)相關(guān)聯(lián)的日期時(shí)間。該結(jié)果是滿足選定標(biāo)準(zhǔn)的實(shí)體列表,并且針對(duì)每個(gè)實(shí)體還列出了表示針對(duì)相對(duì)校準(zhǔn)過(guò)程的、的日期時(shí)間點(diǎn)。該結(jié)果列表可以持久地存儲(chǔ)在數(shù)據(jù)庫(kù)內(nèi),但這不是強(qiáng)制的,這是由于該列表可以基于針對(duì)特定研究的研究表中的內(nèi)容經(jīng)由包含在其他表中的信息而重新生成。除了限定相對(duì)感興趣的時(shí)間點(diǎn),用戶還能夠通過(guò)數(shù)據(jù)驅(qū)動(dòng)列表填充的類(lèi)似數(shù)據(jù)庫(kù)來(lái)提供其他選擇和/或排他標(biāo)準(zhǔn)以確定什么實(shí)體應(yīng)當(dāng)作為研究的一部分。這些標(biāo)準(zhǔn)可以來(lái)自實(shí)體屬性、事件屬性、時(shí)態(tài)抽取或相對(duì)時(shí)態(tài)抽取中的任意項(xiàng)或所有項(xiàng)。查詢可以在以任何期望的組合方式與時(shí)間和相對(duì)數(shù)據(jù)流一起的靜態(tài)和/或原始數(shù)據(jù)流上進(jìn)行。經(jīng)時(shí)態(tài)抽取的并經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)還可以被動(dòng)態(tài)分析以確定具體信息。例如,可以容易地確定特定時(shí)間點(diǎn)處的平均性能,其很難于手動(dòng)進(jìn)行,尤其是在需要并發(fā)流評(píng)估的情況下。本發(fā)明的系統(tǒng)可以被實(shí)現(xiàn)為已知數(shù)據(jù)庫(kù)引擎或類(lèi)似技術(shù)。本發(fā)明可以包括計(jì)算機(jī)系統(tǒng),該計(jì)算機(jī)系統(tǒng)包括至少包含時(shí)態(tài)效用和相對(duì)效用的一個(gè)或多個(gè)計(jì)算機(jī),所述計(jì)算機(jī)系統(tǒng)鏈接到一個(gè)或多個(gè)數(shù)據(jù)庫(kù)引擎或者類(lèi)似技木,數(shù)據(jù)庫(kù)引擎包括靜態(tài)數(shù)據(jù)、來(lái)自ー個(gè)或多個(gè)遠(yuǎn)程設(shè)備或傳感器的數(shù)據(jù),或者直接或間接鏈接到ー個(gè)或多個(gè)遠(yuǎn)程設(shè)備或傳感器的計(jì)算機(jī)系統(tǒng),以便用傳感器數(shù)據(jù)來(lái)填充數(shù)據(jù)庫(kù)引擎提供的ー個(gè)或多個(gè)數(shù)據(jù)庫(kù)??蛇x擇地,系統(tǒng)可以被實(shí)現(xiàn)為云計(jì)算實(shí)現(xiàn),其中通過(guò)一系列的web服務(wù)來(lái)將此環(huán)境的使用提供作為外部服務(wù)。圖3圖示了可通過(guò)云計(jì)算架構(gòu)訪問(wèn)的本發(fā)明。系統(tǒng)還可以實(shí)現(xiàn)為經(jīng)由web服務(wù)集仍可訪問(wèn)的專(zhuān)有方案,其中來(lái)自ー個(gè)源(以及有可能來(lái)自每個(gè)源的多個(gè)傳感器等)的數(shù)據(jù)被提供到連接到因特網(wǎng)以及至少鏈接到時(shí)態(tài)效用和相對(duì)效用的web服務(wù)器,其中web服務(wù)器遞送經(jīng)時(shí)態(tài)抽取且經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù),或者上文論述的探索性和/或解釋性數(shù)據(jù)挖掘的輸出。本發(fā)明提供的規(guī)則還可以通過(guò)使用web服務(wù)進(jìn)行添加、改變或刪除。應(yīng)當(dāng)注意,web服務(wù)模型的益處之ー在于鏈接到web服務(wù)器的多個(gè)組織可以提供改進(jìn)可由每個(gè)參與組織訪問(wèn)的數(shù)據(jù)的大量數(shù)據(jù)集。本發(fā)明尤其可應(yīng)用于各種領(lǐng)域,具體而言,在任何存在多個(gè)傳感器或者與發(fā)生的事件或行為相關(guān)的多個(gè)數(shù)據(jù)流以及與感興趣的“實(shí)體”的特定“終端狀態(tài)”或“終端狀況”有關(guān)的不同時(shí)間的場(chǎng)合。例如,“實(shí)體”例如可以是被監(jiān)控的患者或裝置。事件或行為可以引起或?qū)е陆K端狀態(tài)或終端狀況,例如,一系列連續(xù)事件可以限定導(dǎo)向特定狀態(tài)或狀況的時(shí)間軸。本環(huán)境包括用于數(shù)據(jù)挖掘的方法,該方法支持通過(guò)規(guī)定探索性和確定性數(shù)據(jù)挖掘函數(shù)進(jìn)行零假設(shè)測(cè)試。本發(fā)明還包括用于支持時(shí)態(tài)、相對(duì)規(guī)則連同多維規(guī)則庫(kù)的本體設(shè)計(jì)。 環(huán)境支持靜態(tài)數(shù)據(jù)(例如,臨床數(shù)據(jù))連同如下傳感器數(shù)據(jù),該傳感器數(shù)據(jù)可以是數(shù)值數(shù)據(jù) (例如,溫度或血壓)流或者波形數(shù)據(jù)(例如,ECG和EEG)流,并且支持跨數(shù)據(jù)流之間的關(guān)聯(lián)的數(shù)據(jù)挖掘連同靜態(tài)數(shù)據(jù)。時(shí)態(tài)和相對(duì)時(shí)態(tài)數(shù)據(jù)的存儲(chǔ)還支持針對(duì)其他相關(guān)臨床研究的數(shù)據(jù)的二次分析。根據(jù)應(yīng)用的領(lǐng)域,理解本發(fā)明可以應(yīng)用到任意其中可以存在用于監(jiān)控與類(lèi)似或相同行為有關(guān)的事件或參數(shù)的多個(gè)傳感器的范圍是重要的。該技術(shù)至少與患者看護(hù)、監(jiān)控結(jié)構(gòu)故障、氣象事件、智能儀表等有關(guān)。只要在不同時(shí)間發(fā)生的多個(gè)事件上,從多個(gè)信息源進(jìn)行推斷是ー種挑戰(zhàn),本發(fā)明就是有利的。同樣有利的還有,本發(fā)明的多維數(shù)據(jù)挖掘環(huán)境支持多個(gè)研究。這些可以是以實(shí)體為中心的、以實(shí)體屬性為中心的、以流為中心或以事件為中心的,或者還可以從本體中的任何其他方面中抽取。例如,在患者看護(hù)方面,三個(gè)嬰兒可能全發(fā)現(xiàn)感染,并且例如技術(shù)使得能夠調(diào)查這三個(gè)案例之間的共同因素,例如對(duì)于心率、呼吸速率等。附加地,由于存在與這些事件相關(guān)聯(lián)的實(shí)際時(shí)間,因此本發(fā)明使得能夠追蹤各種傳感器生成的多個(gè)流上的多個(gè)行為,以及構(gòu)建支持與診斷事件相關(guān)的重新校準(zhǔn)的數(shù)據(jù)結(jié)構(gòu),以便在環(huán)境內(nèi)進(jìn)行更好的分析, 例如在感染的傳播期間基于在特定時(shí)間點(diǎn)處的平均因素(factor)更好地實(shí)時(shí)追蹤每個(gè)嬰兒的過(guò)程等。本發(fā)明使得用戶能夠具有何時(shí)介入以防止?fàn)顩r或緩和狀況的高級(jí)知識(shí)。存在感興趣的事件狀態(tài),例如引擎故障或診斷事件。本發(fā)明提供了ー個(gè)環(huán)境,其中用戶可以看到走向事件狀態(tài)的先前事件,并且探索該軌跡以根據(jù)事件狀態(tài)來(lái)確定實(shí)體處于什么情況下(即, 實(shí)體是否以及何時(shí)朝事件狀態(tài)方向發(fā)展)。軌跡可以基于歷史平均進(jìn)行限定,而且支持用戶或系統(tǒng)進(jìn)行實(shí)時(shí)反應(yīng)。此外,本發(fā)明使得能夠使用相對(duì)較小的數(shù)據(jù)集創(chuàng)建軌跡,并且基于附加的數(shù)據(jù)集優(yōu)化軌跡。本發(fā)明還對(duì)新的狀況做出反應(yīng)。在特定說(shuō)明性示例中,數(shù)據(jù)可以與事件相關(guān)地時(shí)態(tài)抽取。例如,在發(fā)生狀況或事件吋,存在提供特定實(shí)體(例如,患者或汽車(chē))的圖片的多個(gè)傳感器。這些多個(gè)傳感器例如可以位于不同器官或組件上,由此提供多維數(shù)據(jù)流。數(shù)據(jù)可以在延長(zhǎng)的時(shí)段上采集。來(lái)自發(fā)生狀況或事件的類(lèi)似實(shí)體的數(shù)據(jù)還可以隨時(shí)間進(jìn)行采集。狀況或事件可以被設(shè)置為興趣點(diǎn), 并且可以對(duì)多維數(shù)據(jù)進(jìn)行挖掘以確定導(dǎo)向所述狀況或事件的趨勢(shì)。題為“Multi-Dimensional Tempora丄 Abstraction and Data mining of medical Time Series Data :Trends and Challenges,,的論文(Catley, C, Stratti, H 禾ロ McGregor, C, 2008 年8 月,Multi-Dimensional Temporal Abstraction and Data Mining of Medical Time Series Data =Trends and Challenges,第30屆國(guó)際IEEE醫(yī)學(xué)與生物工程會(huì)議)的 4322-5圖示了對(duì)時(shí)間序列數(shù)據(jù)、一般時(shí)態(tài)抽取(對(duì)照于在此所述的特定時(shí)態(tài)抽取技術(shù)和系統(tǒng))以及零假設(shè)測(cè)試的原理方面的一些當(dāng)前研究。本發(fā)明的ー個(gè)方面是利用生理數(shù)據(jù)填充針對(duì)醫(yī)療保險(xiǎn)應(yīng)用的數(shù)據(jù)挖掘環(huán)境。這可以例如使用以下生理數(shù)據(jù)模型完成,該生理數(shù)據(jù)模型在“A Web Service Based Framework ior the Transmission of Physiological Data for Local and Remote Neonatal Intensive Care" (McGregor, C.,Heath, J.,以及 Wei,Μ.,2005 年,IEEE 電子技術(shù)、電子商務(wù)以及電子服務(wù)國(guó)際會(huì)議論文集,香港,IEEE)第496-501頁(yè)中進(jìn)行了描述。數(shù)據(jù)挖掘框架本發(fā)明提供了用于對(duì)時(shí)態(tài)數(shù)據(jù)進(jìn)行多維數(shù)據(jù)挖掘的框架。本發(fā)明可以支持本地使用以及通過(guò)基于服務(wù)的模型進(jìn)行使用。該框架這里被稱(chēng)為基于服務(wù)的多維時(shí)態(tài)數(shù)據(jù)挖掘 (STDMntl)15應(yīng)用于支持對(duì)來(lái)自新生兒重癥監(jiān)護(hù)室(NICU)的患者的歷史數(shù)據(jù)進(jìn)行分析以及趨 ^ Wtii^iiiA Multidimensional Temporal Abstractive Data Mining Framework", (Bjering, H.和McGregor,C.,2010年,第4屆澳大利亞健康信息與知識(shí)管理研討會(huì)論文集,布里斯班)HIKM第四-38頁(yè)中進(jìn)行了描述,其通過(guò)引用并入于此。STDMn??刹僮饔糜诎l(fā)現(xiàn)指示狀況發(fā)動(dòng)的趨勢(shì)和模式;包括用于跨多個(gè)實(shí)體的多個(gè)參數(shù)應(yīng)用時(shí)態(tài)抽取以使得能夠挖掘多維時(shí)態(tài)數(shù)據(jù)的方法;支持零假設(shè)測(cè)試;可以生成能夠供分析實(shí)體當(dāng)前狀況的實(shí)時(shí)事件流處理器使用的假設(shè);以及生成可以被轉(zhuǎn)譯成規(guī)則以供用于監(jiān)控和警告的實(shí)時(shí)事件流處理器使用的假設(shè)。STDMn0提供了用于支持?jǐn)U展CRISP-DM數(shù)據(jù)挖掘模型的功能的機(jī)制以助于零假設(shè)測(cè)試。CRISP-DM是如圖1所示的6階段分級(jí)處理模型。在最高級(jí)別,該六個(gè)階段為業(yè)務(wù)理解;數(shù)據(jù)理解;數(shù)據(jù)預(yù)備;建模;評(píng)估和部署。這些階段的每ー個(gè)均與如圖7所示散布在該分級(jí)模型較低等級(jí)上的子任務(wù)集相關(guān)聯(lián)。在圖3的云計(jì)算模型中示出了用于擴(kuò)展CRISP-DM 的方法以支持并入本發(fā)明的基于科學(xué)方法的零假設(shè)測(cè)試。STDMntl包括橋接數(shù)據(jù)管理與數(shù)據(jù)挖掘研究之間距離的架構(gòu),從而支持由監(jiān)控設(shè)備采集的某些大量數(shù)據(jù)的二次使用。采集的新數(shù)據(jù)被饋送到具有現(xiàn)有數(shù)據(jù)的框架中以幫助進(jìn)一步細(xì)化STDMntl框架中產(chǎn)生的假設(shè)。STDMntl模型由如下多個(gè)代理支持,所述多個(gè)代理促進(jìn)用戶與包含在活動(dòng)規(guī)則本體和數(shù)據(jù)管理層中的數(shù)據(jù)之間的交互。多個(gè)代理包括處理代理、時(shí)態(tài)代理、相對(duì)代理、功能代理和規(guī)則生成代理,如下文及圖3中所示。多個(gè)數(shù)據(jù)存儲(chǔ)還可以由STDMntl框架提供,從而包括時(shí)態(tài)數(shù)據(jù)存儲(chǔ)和相對(duì)時(shí)態(tài)數(shù)據(jù)存儲(chǔ)。圖3中圖示了 STDMntl框架的多代理數(shù)據(jù)挖掘系統(tǒng)。該框架圖將所使用的代理映射到擴(kuò)展的CRISP-DM模型適當(dāng)部分,并且提出単獨(dú)的STDMntl任務(wù)。參考圖3中標(biāo)記為STDMntl代理的水平欄,STDMn0框架中的第一代理是處理代理。該處理代理充當(dāng)功能代理的預(yù)處理器,執(zhí)行獲取并準(zhǔn)備數(shù)據(jù)以及將其存儲(chǔ)到數(shù)據(jù)存儲(chǔ)內(nèi)的任務(wù),以便為時(shí)態(tài)代理的進(jìn)ー步處理做好準(zhǔn)備。如STDMntl擴(kuò)展至CRISP-DM欄下所示,處理代理用于支持并部分支持CRISP-DM模型中的數(shù)據(jù)理解和數(shù)據(jù)預(yù)備階段。在STDMntl數(shù)據(jù)管理欄下,處理代理通常將針對(duì)靜態(tài)數(shù)據(jù)從外部數(shù)據(jù)庫(kù)獲取數(shù)據(jù)以及針對(duì)流數(shù)據(jù)經(jīng)由傳感器設(shè)備獲取數(shù)據(jù)。處理代理使用靜態(tài)和流web服務(wù),使得數(shù)據(jù)能夠被直接推送或拉送至處理代理。 數(shù)據(jù)還可以經(jīng)由直接連接向處理代理直接發(fā)送。接下來(lái)參考圖3的STDMntl代理任務(wù)欄,存在ー個(gè)由處理代理執(zhí)行的名為本地采集和清洗的主要任務(wù)。當(dāng)數(shù)據(jù)到達(dá)并且執(zhí)行通用數(shù)據(jù)清洗(諸如針對(duì)誤差值的檢查)時(shí),該任務(wù)涉及從外部數(shù)據(jù)庫(kù)收集靜態(tài)和流數(shù)據(jù)用于在STDMntl框架內(nèi)使用。這些誤差值是例如由與實(shí)體相關(guān)的不相關(guān)因素引起的那些誤差值,從而采用用于處理丟失值等的策略。
數(shù)據(jù)由處理代理從外部數(shù)據(jù)庫(kù)提取,轉(zhuǎn)變成需要的格式并且存儲(chǔ)到STDMntl框架中的數(shù)據(jù)存儲(chǔ),如在STDMntl數(shù)據(jù)管理欄中所示。從實(shí)體獲得的靜態(tài)數(shù)據(jù)或者描述實(shí)體的靜態(tài)數(shù)據(jù)被錄入靜態(tài)數(shù)據(jù)表,并且傳感器數(shù)據(jù)被存儲(chǔ)在傳感器數(shù)據(jù)表中。該任務(wù)支持在STDMntl 內(nèi)提出的擴(kuò)展CRISP-DM模型的所有數(shù)據(jù)理解以及部分?jǐn)?shù)據(jù)預(yù)備組件。本地采集和清洗任務(wù)是作為STDMntl內(nèi)代理之一的處理代理的任務(wù)。接下來(lái)參考圖 3中所示的STDMntl Web服務(wù)接ロ欄,處理代理可以從源直接取得數(shù)據(jù)或者由流數(shù)據(jù)采集Web 服務(wù)和靜態(tài)數(shù)據(jù)采集Web服務(wù)提供數(shù)據(jù)。在傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)設(shè)置(其中原始數(shù)據(jù)被拷貝至數(shù)據(jù)倉(cāng)庫(kù)并且經(jīng)由跟隨有批聚合的周期負(fù)載進(jìn)行聚合)中,處理代理例如可以實(shí)現(xiàn)為容納數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù)管理系統(tǒng) (DBMS)中的代理。周期提取可以脫離接收傳感器數(shù)據(jù)的可操作數(shù)據(jù)并且該提取經(jīng)由實(shí)施處理代理的腳本被加載至STDMntl環(huán)境。在流計(jì)算范例(其中當(dāng)數(shù)據(jù)實(shí)時(shí)到達(dá)時(shí)作為流操縱數(shù)據(jù))中,處理代理可以是當(dāng)數(shù)據(jù)實(shí)時(shí)到達(dá)時(shí)從傳感器直接接收流、并且通過(guò)數(shù)據(jù)庫(kù)輸出算符輸出數(shù)據(jù)以支持排插入的流計(jì)算程序。在服務(wù)計(jì)算范例中,經(jīng)由流數(shù)據(jù)采集Web服務(wù)或靜態(tài)數(shù)據(jù)采集服務(wù)的實(shí)施可以實(shí)施數(shù)據(jù)庫(kù)腳本和流計(jì)算程序。再次參考STDMntl代理欄,框架中下ー個(gè)代理是時(shí)態(tài)代理。時(shí)態(tài)代理生成對(duì)處理代理預(yù)備和存儲(chǔ)的數(shù)據(jù)的時(shí)態(tài)抽取。待執(zhí)行的時(shí)態(tài)抽取由STDMntl規(guī)則本體的時(shí)態(tài)規(guī)則限定。 時(shí)態(tài)抽取代表在數(shù)據(jù)挖掘之前的預(yù)處理方法,該方法允許保留數(shù)據(jù)的時(shí)態(tài)方面和上下文。例如,在臨床研究設(shè)置中,針對(duì)給定患者集,每個(gè)相關(guān)生理流可以時(shí)態(tài)抽取成適當(dāng)?shù)某槿?abstraction),諸如趨勢(shì)(増加、減少)和級(jí)別轉(zhuǎn)變(高、低)。每個(gè)原始數(shù)據(jù)片可以屬于若干抽取。例如,特定測(cè)量可以是“増加”抽取的一部分,并且同時(shí)處干“正常”的限制內(nèi)。復(fù)雜抽取還可以跨多個(gè)所抽取的參數(shù)完成。盡管單獨(dú)數(shù)據(jù)值本身可能不提供有價(jià)值的信息,但是當(dāng)隨時(shí)間和上下文考慮吋, 這些值可以產(chǎn)生意義。在探索性數(shù)據(jù)挖掘之前,STDMntl框架將使用時(shí)態(tài)抽取作為數(shù)據(jù)的預(yù)處理。根據(jù)STDMntl代理任務(wù)欄下列出的任務(wù),針對(duì)每個(gè)實(shí)體,每個(gè)傳感器流時(shí)態(tài)抽取成適當(dāng)?shù)某槿。T如趨勢(shì)和等級(jí)轉(zhuǎn)變。復(fù)雜抽取還可以跨多個(gè)所抽取的參數(shù)完成。包括特定抽取實(shí)例的實(shí)際開(kāi)始時(shí)間和結(jié)束時(shí)間的每個(gè)抽取可以被存儲(chǔ)為時(shí)態(tài)數(shù)據(jù)作為STDMntl數(shù)據(jù)管理組件的一部分。如圖3中由數(shù)據(jù)預(yù)備步驟的重疊所描繪的那樣,時(shí)態(tài)代理用于部分支持CRISP-DM 模型中數(shù)據(jù)預(yù)備階段。接下來(lái)參考STDMntl Web服務(wù)接ロ欄,可以發(fā)現(xiàn)時(shí)態(tài)代理使用如下時(shí)態(tài)抽取web服務(wù),該服務(wù)使得數(shù)據(jù)能夠被直接推送或拉送至?xí)r態(tài)代理。數(shù)據(jù)還可以經(jīng)由直接連接直接向時(shí)態(tài)代理發(fā)送。時(shí)態(tài)代理具有作為時(shí)態(tài)抽取任務(wù)執(zhí)行的五個(gè)主要功能(1)從時(shí)態(tài)規(guī)則表獲取相關(guān)時(shí)態(tài)規(guī)則;(2)向數(shù)據(jù)應(yīng)用時(shí)態(tài)規(guī)則,從而創(chuàng)建針對(duì)單獨(dú)實(shí)體的単獨(dú)數(shù)據(jù)流的簡(jiǎn)單抽??; (3)將所創(chuàng)建的低頻時(shí)態(tài)抽取流存儲(chǔ)到時(shí)態(tài)數(shù)據(jù)存儲(chǔ)中;(4)根據(jù)任意相關(guān)的時(shí)態(tài)規(guī)則,從步驟3中創(chuàng)建的簡(jiǎn)單抽取來(lái)創(chuàng)建復(fù)雜抽??;以及( 將所創(chuàng)建的任意復(fù)雜時(shí)態(tài)抽取流存儲(chǔ)到時(shí)態(tài)數(shù)據(jù)存儲(chǔ)中。
時(shí)態(tài)抽取的示例可以包括如下(i)新生兒重癥監(jiān)護(hù)1)在平均動(dòng)脈血壓降到新生兒患者的當(dāng)前胎齡以下時(shí)的開(kāi)始時(shí)間和結(jié)束時(shí)間;2)在新生兒患者的血氧量水平降到85%以下時(shí)的開(kāi)始時(shí)間和結(jié)束時(shí)間;3)在新生兒患者的血氧量水平以大于規(guī)定閾值的速率下降時(shí)的開(kāi)始時(shí)間和結(jié)束時(shí)間;以及4)在1)和2)同時(shí)發(fā)生超過(guò)20秒時(shí)的開(kāi)始時(shí)間和結(jié)束時(shí)間的復(fù)雜抽取。(ii)電網(wǎng)1)當(dāng)電カ超過(guò)特定閾值時(shí)的開(kāi)始時(shí)間和結(jié)束時(shí)間。(iii)氣象1)當(dāng)氣象站的溫度超過(guò)35°C時(shí)的開(kāi)始時(shí)間和結(jié)束時(shí)間。再次參考圖3,相關(guān)代理表示框架的下ー階段。當(dāng)用戶希望調(diào)查在某些事件之前或之后出現(xiàn)在實(shí)體的傳感器數(shù)據(jù)中的某些模式或其他信號(hào)的可能性時(shí),經(jīng)常會(huì)需要校準(zhǔn)例如與診斷時(shí)間相關(guān)的數(shù)據(jù),包括靜態(tài)數(shù)據(jù)和傳感器數(shù)據(jù)的抽取。這將允許用戶研究關(guān)于其他實(shí)體的特定結(jié)果和糾正方法。這些相關(guān)校準(zhǔn)處理組成相對(duì)代理的STDMntl代理任務(wù)。相對(duì)地將數(shù)據(jù)校準(zhǔn)至的興趣點(diǎn)在臨床上下文中可以是(但并不一定是)診斷時(shí)間。興趣點(diǎn)可以基于任意事件或行為。當(dāng)研究特定事件吋,將抽取與保持實(shí)體事件的時(shí)間和日期的事件表進(jìn)行匹配。該信息通過(guò)轉(zhuǎn)變算法進(jìn)行饋送以支持針對(duì)與診斷時(shí)間點(diǎn)相關(guān)的抽取的時(shí)間上的測(cè)量。T0是事件點(diǎn),并且T」、τ 2、IV··Tn表明在事件時(shí)間之前的抽取與事件之間時(shí)間上的距離。該步驟使得與事件點(diǎn)的實(shí)體相關(guān)的數(shù)據(jù)能夠“排隊(duì)”,以使得能夠檢測(cè)在某些事件發(fā)動(dòng)之前或之后處于特定時(shí)間點(diǎn)處的實(shí)體中常見(jiàn)的趨勢(shì)和模式。在導(dǎo)致事件的時(shí)間中特定參數(shù)的顯著變化可以被剝離,以使得能夠找到用于確定特定參數(shù)的改變或行為何時(shí)與事件的發(fā)動(dòng)相關(guān)地發(fā)生的任何顯著指示符。相對(duì)代理使用時(shí)態(tài)代理創(chuàng)建并存儲(chǔ)在時(shí)態(tài)抽取表中的抽取,連同單獨(dú)實(shí)體的靜態(tài)信息一起來(lái)產(chǎn)生數(shù)據(jù)子集或數(shù)據(jù)集市以支持特定研究??梢源嬖谌我鈹?shù)目的在時(shí)態(tài)抽取上執(zhí)行的相對(duì)校準(zhǔn),如圖3中相對(duì)代理ェ和相對(duì)代理n標(biāo)記所示。特定校準(zhǔn)由待從事的研究類(lèi)型來(lái)確定,該類(lèi)型在數(shù)據(jù)庫(kù)中的研究表中指定。相對(duì)代理設(shè)計(jì)用于基于待從事的研究來(lái)支持實(shí)體數(shù)據(jù)和時(shí)態(tài)抽取的相對(duì)校準(zhǔn)。相對(duì)代理用于相對(duì)于在時(shí)態(tài)抽取的數(shù)據(jù)集內(nèi)共享的某些感興趣的時(shí)間點(diǎn)(例如針對(duì)事件何時(shí)對(duì)實(shí)體顯現(xiàn)的相對(duì)時(shí)間點(diǎn))來(lái)重新校準(zhǔn)時(shí)態(tài)抽取。多個(gè)研究可以在相同時(shí)態(tài)抽取上進(jìn)行,并且相同時(shí)態(tài)抽取可以用于許多不同的研究并且可以要求以若干不同的方式進(jìn)行重新校準(zhǔn)。存儲(chǔ)在在相對(duì)時(shí)態(tài)數(shù)據(jù)表中的每個(gè)經(jīng)校準(zhǔn)的時(shí)態(tài)抽取將屬于特定研究。經(jīng)重新校準(zhǔn)的時(shí)態(tài)抽取將形成在后期處理階段中執(zhí)行的可選探索性和確認(rèn)性數(shù)據(jù)挖掘的基礎(chǔ)。當(dāng)作為相對(duì)校準(zhǔn)的結(jié)果沒(méi)有時(shí)間調(diào)整發(fā)生吋,可以創(chuàng)建研究。在這種情況下,相對(duì)校準(zhǔn)基于單獨(dú)實(shí)體的靜態(tài)信息執(zhí)行感興趣實(shí)體的子集選擇。相對(duì)代理用于部分支持CRISP-DM模型內(nèi)的數(shù)據(jù)預(yù)備階段,并且針對(duì)給定研究代表數(shù)據(jù)預(yù)備的最終步驟。
參考圖3的頂部水平欄,相對(duì)代理使用如下相對(duì)校準(zhǔn)web服務(wù),該服務(wù)使得數(shù)據(jù)能夠被直接推送或拉送至相對(duì)代理。數(shù)據(jù)還可以經(jīng)由直接連接直接向相對(duì)代理發(fā)送。相對(duì)代理具有三個(gè)主要功能(1)基于用戶給定的選擇規(guī)范從時(shí)態(tài)數(shù)據(jù)存儲(chǔ)獲取相關(guān)數(shù)據(jù)和時(shí)態(tài)抽?。? 向絕對(duì)時(shí)間的時(shí)態(tài)抽取應(yīng)用針對(duì)待從事的研究規(guī)定的轉(zhuǎn)變,以創(chuàng)建經(jīng)校準(zhǔn)的時(shí)態(tài)抽取集,該抽取集被稱(chēng)作相對(duì)抽取,因?yàn)闀r(shí)間(開(kāi)始時(shí)間和結(jié)束時(shí)間)與校準(zhǔn)點(diǎn)相關(guān);以及C3)將經(jīng)相對(duì)校準(zhǔn)的抽取存儲(chǔ)到相對(duì)時(shí)態(tài)數(shù)據(jù)存儲(chǔ)中以允許功能代理的進(jìn)ー步處理。相對(duì)校準(zhǔn)任務(wù)的示例可以包括如下(i)新生兒重癥監(jiān)護(hù)1)選擇被診斷為醫(yī)院感染的所有新生兒患者,并基于疑似醫(yī)院感染的數(shù)據(jù)相對(duì)地校準(zhǔn)數(shù)據(jù),并且計(jì)入疑似醫(yī)院感染診斷之前四天的數(shù)據(jù)以及之后的所有數(shù)據(jù)。2)選擇23周妊娠出生的所有患者,并且針對(duì)這些患者創(chuàng)建相當(dāng)于27- 妊娠的 27-29周的患者的研究數(shù)據(jù)集。(ii)電網(wǎng)2)校準(zhǔn)其中溫度大于40C超過(guò)4小吋,隨后日子的溫度小于27C的周末的儀表數(shù)據(jù),并且選擇儀表數(shù)據(jù)的其后72小時(shí)(即,用于檢測(cè)在非常熱的日子之后可能不需要空調(diào)的實(shí)例中過(guò)度的空調(diào)使用的模式)。再次參考圖3,STDMn0框架的下ー個(gè)代理是功能代理。功能代理嘗試檢測(cè)并驗(yàn)證相對(duì)校準(zhǔn)的時(shí)態(tài)數(shù)據(jù)中的新趨勢(shì)和模式,并且包括探索性和確認(rèn)性數(shù)據(jù)挖掘。初始分析使用探索性數(shù)據(jù)挖掘完成,以使得興趣規(guī)則集的發(fā)現(xiàn)能夠進(jìn)一歩調(diào)查。探索性數(shù)據(jù)挖掘用于跨多個(gè)實(shí)體的多個(gè)數(shù)據(jù)流分析由時(shí)態(tài)代理和相對(duì)代理所創(chuàng)建的重新校準(zhǔn)的時(shí)態(tài)抽取,以在對(duì)可以通過(guò)規(guī)則集生成來(lái)表示、并且還被稱(chēng)作假設(shè)的新趨勢(shì)和模式的捜索中探索數(shù)據(jù)。“進(jìn)行觀察”和“創(chuàng)立假設(shè)以解釋觀察”的科學(xué)方法階段由探索性數(shù)據(jù)挖掘支持。如果發(fā)現(xiàn)數(shù)據(jù)中的關(guān)聯(lián),則該關(guān)聯(lián)可以使用確認(rèn)性數(shù)據(jù)挖掘進(jìn)行驗(yàn)證。所述驗(yàn)證可以經(jīng)由對(duì)進(jìn)ー步數(shù)據(jù)集的測(cè)試或者經(jīng)由零假設(shè)測(cè)試或者這兩者來(lái)進(jìn)行。分析的目的在于查找時(shí)態(tài)數(shù)據(jù)中的等級(jí)轉(zhuǎn)變和趨勢(shì),以及交叉相關(guān)跨多個(gè)實(shí)體的多個(gè)數(shù)據(jù)流的數(shù)據(jù)挖掘結(jié)果,從而檢測(cè)可能隨特定事件在實(shí)體中存在的先前未知的模式, 并由此創(chuàng)建有可能成為能夠在實(shí)體監(jiān)控中應(yīng)用的新規(guī)則的新的假設(shè)。在先前步驟中執(zhí)行的時(shí)態(tài)抽取保留了數(shù)據(jù)的時(shí)態(tài)方面,使得當(dāng)跨多個(gè)流以及針對(duì)多個(gè)實(shí)體任務(wù)執(zhí)行探索性數(shù)據(jù)挖掘時(shí)包括此時(shí)態(tài)方面。存在用戶在該步驟中使用備選數(shù)據(jù)挖掘技術(shù)的能力;框架不限制對(duì)最佳匹配挖掘任務(wù)的數(shù)據(jù)挖掘技術(shù)的選擇。選定的數(shù)據(jù)挖掘技術(shù)必須意識(shí)到時(shí)序數(shù)據(jù)。探索性數(shù)據(jù)挖掘的結(jié)果由用戶檢測(cè),并且選擇重要的規(guī)則集。功能代理用于支持CRISP-DM模型內(nèi)的建模階段。STDMntl框架擴(kuò)展CRISP-DM以支持科學(xué)方法。圖4中圖示了已知CRISP-DM與科學(xué)方法之間的并行。STDMn0框架探索性數(shù)據(jù)挖掘任務(wù)是數(shù)據(jù)挖掘規(guī)則集生成的一部分,并且選擇擴(kuò)展 CRISP-DM模型的重要規(guī)則集階段。該任務(wù)將在多代理框架中由功能代理完成。參考STDMntl代理任務(wù)欄,在功能代理步驟下,基于給定假設(shè)針對(duì)給定研究選定的實(shí)體子集及其相關(guān)聯(lián)的經(jīng)相對(duì)校準(zhǔn)的時(shí)態(tài)流可以被用作探索性數(shù)據(jù)挖掘的訓(xùn)練集。隨后在解釋性模式中,相同的假設(shè)(無(wú)需切換到零假設(shè)模式)可以在最初針對(duì)給定研究選定的實(shí)體的其他子集或者滿足實(shí)體的研究選擇標(biāo)準(zhǔn)的整個(gè)子集的更多數(shù)據(jù)上運(yùn)行。在STDMntl內(nèi)并入零假設(shè)測(cè)試使得能夠通過(guò)確認(rèn)性數(shù)據(jù)挖掘處理來(lái)驗(yàn)證假設(shè),并且表示用于在如下域內(nèi)使用的可選步驟,在該域中,需要對(duì)結(jié)果規(guī)則的進(jìn)ー步驗(yàn)證(諸如但不限于醫(yī)療保險(xiǎn))。這種具有零假設(shè)任務(wù)的確認(rèn)性數(shù)據(jù)挖掘在制定的零假設(shè)和運(yùn)行統(tǒng)計(jì)過(guò)程內(nèi)執(zhí)行以測(cè)試到CRISP-DM的假設(shè)擴(kuò)展。該假設(shè)從ー個(gè)假設(shè)轉(zhuǎn)譯到零假設(shè),并且驗(yàn)證嘗試反駁該零假設(shè)。如果反駁不成功,則假設(shè)保留。零假設(shè)測(cè)試集成的示例如下零星臨床證據(jù)指出以下兩個(gè)事件的關(guān)聯(lián)與導(dǎo)致不穩(wěn)定心率的新生兒不穩(wěn)定性直接相關(guān)聯(lián)“假設(shè)早產(chǎn)5周出生的新生嬰兒(35周胎齡),平均血壓降到小于35mm Hg(即, 他們胎齡的數(shù)值)是臨床相關(guān)的。在所有妊娠期,外圍氧飽和度降到小于85%達(dá)超過(guò)20秒也是臨床相關(guān)的。”時(shí)態(tài)代理依照上文預(yù)備對(duì)平均血壓和血氧含量的初始簡(jiǎn)單時(shí)態(tài)抽取,并且當(dāng)同時(shí)發(fā)生時(shí)預(yù)備復(fù)雜的時(shí)態(tài)抽取以選擇分段。這些被相對(duì)校準(zhǔn)到心率不穩(wěn)定事件。在此示例中,在DM規(guī)則生成和選擇重要規(guī)則集步驟期間由功能代理執(zhí)行的探索性數(shù)據(jù)挖掘帶來(lái)支持上文零星臨床證據(jù)的關(guān)聯(lián)。制定零假設(shè)步驟使得規(guī)則集能夠表示為零假設(shè)。針對(duì)此示例使用為0. 8的關(guān)聯(lián)系數(shù)。因此該假設(shè)利用以下形式的關(guān)聯(lián)系數(shù)表示H1 P (XjY) > 0. 8其中X表示ECG不穩(wěn)定以及;Y表示ABP平均<胎齡達(dá)20秒;以及Sa02 < 85%同樣達(dá)20秒。有效零假設(shè)表示為H0 P (XjY) = 0. 8真零假設(shè)表示為H0 P (χ,γ) < 0. 8在運(yùn)行統(tǒng)計(jì)過(guò)程以測(cè)試假設(shè)步驟期間,在STDMntl擴(kuò)展到CRISP-DM模型之下展開(kāi), 針對(duì)測(cè)試集的其他混合測(cè)試零假設(shè)以嘗試反駁該零假設(shè)。如果不能反駁該零假設(shè),則認(rèn)為證實(shí)該假設(shè)??蛇x擇地,探索性和確認(rèn)性數(shù)據(jù)挖掘可以是自動(dòng)的。探索性數(shù)據(jù)挖掘可以依次使用事件時(shí)間、表示日期時(shí)間點(diǎn)的實(shí)體屬性、或者時(shí)態(tài)抽取開(kāi)始時(shí)間而與系統(tǒng)自動(dòng)執(zhí)行,以確定將符合條件的實(shí)體的相對(duì)校準(zhǔn)點(diǎn)。符合條件的實(shí)體可以基于以實(shí)體屬性標(biāo)準(zhǔn)、事件屬性標(biāo)準(zhǔn)時(shí)態(tài)抽取標(biāo)準(zhǔn)和/或相對(duì)時(shí)態(tài)抽取標(biāo)準(zhǔn)為基礎(chǔ)的限制而迭代地選擇。數(shù)據(jù)挖掘可以是自動(dòng)的以嘗試基于共同行為或經(jīng)由其他數(shù)據(jù)挖掘方法返回存在強(qiáng)關(guān)聯(lián)的結(jié)果來(lái)聚集實(shí)體。例如,用戶可以可選地選擇某些數(shù)據(jù)流或者有意義的數(shù)據(jù)流,并繼而使用這些數(shù)據(jù)流進(jìn)行進(jìn)ー步的解釋性數(shù)據(jù)挖掘。用戶可以選擇執(zhí)行該步驟以例如輸入基于域知識(shí)已知的結(jié)果,從而避免附加系統(tǒng)處理發(fā)現(xiàn)已知的趨勢(shì)。功能代理使用使得數(shù)據(jù)能夠直接推送或拉送到功能代理的探索性數(shù)據(jù)挖掘和確認(rèn)性數(shù)據(jù)挖掘web服務(wù)。數(shù)據(jù)還可以經(jīng)由直接連接直接向功能代理發(fā)送。接下來(lái)參考圖3的規(guī)則生成代理垂直欄,規(guī)則生成代理執(zhí)行如下任務(wù),即通過(guò)功能代理內(nèi)的探索性數(shù)據(jù)挖掘?qū)?chuàng)建作為規(guī)則集生成的一部分的規(guī)則添加至可以通過(guò)支持插入規(guī)則表的方式表示的規(guī)則格式。用戶可以評(píng)估規(guī)則集,并且決定是否將要將其并入實(shí)時(shí)規(guī)則庫(kù)作為針對(duì)智能實(shí)體監(jiān)控的活動(dòng)規(guī)則。如圖3中所示,該任務(wù)是擴(kuò)展CRISP-DM模型中評(píng)估階段的一部分。這些規(guī)則可以供事件流處理器(諸如在圖8中針對(duì)實(shí)時(shí)事件監(jiān)控的方案管理器服務(wù)中詳細(xì)所述的事件流處理器)利用。事件流處理器可以并入實(shí)時(shí)數(shù)據(jù)流上的時(shí)態(tài)抽取以允許利用用于警告的時(shí)態(tài)抽取規(guī)則。規(guī)則生成代理使用使得數(shù)據(jù)能夠直接推送或拉送到規(guī)則生成代理的規(guī)則管理web 服務(wù)。數(shù)據(jù)還可以經(jīng)由直接連接直接向規(guī)則生成代理發(fā)送。圖4中圖示了滿足零假設(shè)測(cè)試需求的擴(kuò)展CRISP-DM模型。該擴(kuò)展的CRISP-DM 模型用于支持STDMntl框架中的數(shù)據(jù)挖掘模型。這種對(duì)CRISP-DM模型的擴(kuò)展圖示了擴(kuò)展 CRISP-DM模型的確認(rèn)性數(shù)據(jù)挖掘建模和評(píng)估組件中科學(xué)方法方式的零假設(shè)測(cè)試組件的合井。以下部分詳細(xì)描述了 STDMntl框架內(nèi)擴(kuò)展的CRISP-DM實(shí)現(xiàn)。尤其是建模和評(píng)估組件內(nèi)的擴(kuò)展。數(shù)據(jù)理解數(shù)據(jù)理解階段涉及與采集相關(guān)聯(lián)并且熟悉所采集數(shù)據(jù)的各種任務(wù)。對(duì)所述數(shù)據(jù)進(jìn)行描述和調(diào)查,并且標(biāo)識(shí)出任何數(shù)據(jù)質(zhì)量問(wèn)題。數(shù)據(jù)理解階段使用多代理系統(tǒng)中處理代理的服務(wù)來(lái)完成STDMntl框架中本地采集和清洗任務(wù)的一部分。數(shù)據(jù)預(yù)備數(shù)據(jù)預(yù)備階段包括在將最初未處理的數(shù)據(jù)轉(zhuǎn)換成待饋送至數(shù)據(jù)挖掘工具的最終數(shù)據(jù)集過(guò)程中涉及的所有動(dòng)作。所述動(dòng)作包括以下活動(dòng),諸如選擇和清洗數(shù)據(jù)、構(gòu)造并集成數(shù)據(jù)集以及格式化數(shù)據(jù)以為數(shù)據(jù)挖掘做好準(zhǔn)備。數(shù)據(jù)預(yù)備階段使用多代理系統(tǒng)中的三個(gè)代理的服務(wù)。在相對(duì)代理根據(jù)實(shí)施的研究執(zhí)行數(shù)據(jù)的相對(duì)重新校準(zhǔn)之前,處理代理完成在數(shù)據(jù)理解階段開(kāi)始的最初準(zhǔn)備,為時(shí)態(tài)代理做好準(zhǔn)備以執(zhí)行時(shí)態(tài)數(shù)據(jù)上的時(shí)態(tài)抽取。建模和評(píng)估建模階段包括選擇和應(yīng)用建模技木。該階段包括數(shù)據(jù)挖掘規(guī)則集生成,選擇重要規(guī)則集,制定零假設(shè)以及運(yùn)行統(tǒng)計(jì)過(guò)程以測(cè)試假設(shè)。制定零假設(shè)和運(yùn)行統(tǒng)計(jì)過(guò)程以測(cè)試零假設(shè)表示建模和評(píng)估組件中CRISP-DM擴(kuò)展的STDMntl框架實(shí)現(xiàn)以支持科學(xué)方法中測(cè)試零假設(shè)和通過(guò)/失敗測(cè)試。所有建模和評(píng)估階段由多代理系統(tǒng)中的功能代理執(zhí)行,并且映射到如下文所述的STDMntl框架。數(shù)據(jù)挖掘規(guī)則集生成和選擇重要的規(guī)則集數(shù)據(jù)挖掘規(guī)則集生成階段是其中進(jìn)行探索性數(shù)據(jù)挖掘的階段。在STDMntl框架中, 探索性數(shù)據(jù)挖掘在相對(duì)校準(zhǔn)的時(shí)態(tài)抽取上執(zhí)行,包括多個(gè)實(shí)體的多個(gè)流。當(dāng)移至選定的重要規(guī)則集階段吋,使用探索性數(shù)據(jù)挖掘的結(jié)果。制定零假設(shè)制定零假設(shè)階段使用選擇重要規(guī)則集階段的輸出,其中重要規(guī)則集選自探索性數(shù)據(jù)挖掘的結(jié)果。零假設(shè)針對(duì)任何表明興趣和進(jìn)ー步調(diào)查的結(jié)果而創(chuàng)建。運(yùn)行統(tǒng)計(jì)過(guò)程以測(cè)試零假設(shè)建模階段的另一部分,運(yùn)行統(tǒng)計(jì)過(guò)程以測(cè)試零假設(shè)階段跟隨制定零假設(shè)階段。運(yùn)行統(tǒng)計(jì)過(guò)程以測(cè)試零假設(shè)階利用STDMntl框架的零假設(shè)任務(wù)執(zhí)行確認(rèn)性數(shù)據(jù)挖掘,目的在于證實(shí)或反駁該零假設(shè)。數(shù)據(jù)源部署擴(kuò)展的CRISP-DM模型的數(shù)據(jù)源部署組件通過(guò)規(guī)則生成代理的功能而實(shí)現(xiàn)。數(shù)據(jù)存儲(chǔ)圖6圖示了用于實(shí)現(xiàn)STDMntl框架的數(shù)據(jù)存儲(chǔ)模式。圖7中示出了用于支持新生兒重癥監(jiān)護(hù)的數(shù)據(jù)存儲(chǔ)模式的另ー示例??蚣苤袑?shí)體的靜態(tài)實(shí)體數(shù)據(jù)可以記錄在實(shí)體表中。實(shí)體表包含經(jīng)標(biāo)識(shí)的或者研究未標(biāo)識(shí)的實(shí)體的歷史臨床靜態(tài)數(shù)據(jù)。實(shí)體表的屬性是用于將實(shí)體表的內(nèi)容鏈接到實(shí)體事件、實(shí)體流、時(shí)態(tài)抽取、TA_相對(duì)時(shí)間和實(shí)體診斷表的內(nèi)容的實(shí)體ID。實(shí)體表與實(shí)體流之間的關(guān)系是ー對(duì)多,實(shí)體表與時(shí)態(tài)抽取表之間的關(guān)系是ー對(duì)多,實(shí)體表與TA_相對(duì)時(shí)間表之間的關(guān)系是ー對(duì)多,并且實(shí)體表與實(shí)體診斷表之間的關(guān)系是ー對(duì)多。實(shí)體表繼而可以包含圖6中列出的任意數(shù)目的實(shí)體屬性,如實(shí)體屬性ェ到實(shí)體屬性n。如圖7中所示,可以實(shí)現(xiàn)這點(diǎn)以支持新生兒重癥監(jiān)護(hù)。在此上下文內(nèi),實(shí)體是患者。實(shí)體表被示為具有患者_(dá)ID而不是實(shí)體ID的患者表,以及一系列實(shí)體屬性(出生時(shí)間和日期、出生胎齡、性別、出生體重、出生長(zhǎng)度、出生頭圍)。事件表存儲(chǔ)關(guān)于可以在給定時(shí)間點(diǎn)對(duì)實(shí)體發(fā)生的事件類(lèi)型的限定信息。事件表包含事件ID碼,其是每個(gè)事件連同包含事件的人們可讀名稱(chēng)的事件名稱(chēng)一起的唯一標(biāo)識(shí)符。 事件類(lèi)型使得事件能夠例如在事件可以與診斷、觀察記錄、實(shí)驗(yàn)室結(jié)果和增長(zhǎng)紀(jì)錄有關(guān)的情況下進(jìn)行分組。事件描述包含描述事件的進(jìn)ー步文本細(xì)節(jié)。實(shí)體事件表包含對(duì)已經(jīng)過(guò)診斷的給定實(shí)體發(fā)生的事件表中列出的所有事件的記錄。包括該表的主鍵的屬性是其例如可以用于將診斷鏈接到特定實(shí)體的實(shí)體ID、例如可以用于將針對(duì)實(shí)體的記錄鏈接到診斷的特定類(lèi)型事件ID以及日期和時(shí)間。在數(shù)據(jù)采集過(guò)程期間,特定實(shí)體可以在相同狀況下診斷若干次,因此有必要包括連結(jié)主鍵中的所有這些屬性。在圖7中,實(shí)體/事件表已經(jīng)被填充為患者/診斷表,其中最后ー個(gè)屬性(嚴(yán)重性)在適當(dāng)情況下用于記錄狀況的嚴(yán)重性。返回參考圖6,每個(gè)實(shí)體的各種傳感器的經(jīng)標(biāo)識(shí)或研究未標(biāo)識(shí)原始傳感器數(shù)據(jù)存儲(chǔ)在實(shí)體流表中。包含在實(shí)體流表中的屬性為實(shí)體ID、流_ID、閱讀的日期和時(shí)間、值以及一系列其他屬性,表示為所需的屬性1至屬性n,諸如但不限于方位和位置,如圖7中臨床研究模式所示。實(shí)體ID屬性用于將傳感器數(shù)據(jù)鏈接到實(shí)體表中的正確實(shí)體。實(shí)體流表與實(shí)體表之間存在多對(duì)ー關(guān)系。流_ID用于標(biāo)識(shí)哪個(gè)傳感器以及該傳感器中可能正在讀取的哪個(gè)流鏈接到流定義表。實(shí)體流表與流定義表之間存在多對(duì)ー關(guān)系。實(shí)體已經(jīng)讀取的每個(gè)流必須被標(biāo)識(shí)。流定義表包含作為屬性的id、傳感器ID和針對(duì)每個(gè)流實(shí)體可以具有讀取值的名稱(chēng),即,流名稱(chēng)。傳感器ID在實(shí)體流表中被用作外鍵來(lái)鏈接到流定義表以支持由每個(gè)流的名稱(chēng)進(jìn)行的標(biāo)識(shí)。針對(duì)如何抽取特定流的規(guī)則包含在圖6的TA_規(guī)則表中。每個(gè)流可以被鏈接到不止ー個(gè)規(guī)則以創(chuàng)建不止ー個(gè)抽取。TA_規(guī)則表中的屬性是規(guī)則ID,其包含特定規(guī)則的id,傳感器ID,其將TA_規(guī)則表鏈接到流定義表,并且用于標(biāo)識(shí)特定規(guī)則被應(yīng)用到的參數(shù)類(lèi)型。規(guī)則屬性包含特定規(guī)則的細(xì)節(jié)。TA_規(guī)則表具有對(duì)于流定義表的多對(duì)ー關(guān)系,其表明特定流定義可以具有不止ー個(gè)向其應(yīng)用的時(shí)態(tài)抽取規(guī)則。從實(shí)體的流中創(chuàng)建的時(shí)態(tài)抽取存儲(chǔ)在時(shí)態(tài)抽取表中。該抽取可以通過(guò)向單獨(dú)實(shí)體流的數(shù)據(jù)值(其可以在實(shí)體流表中找到)應(yīng)用先前定義的抽取規(guī)則(存儲(chǔ)在圖6的
則表中)來(lái)創(chuàng)建。每個(gè)實(shí)體的每個(gè)傳感器數(shù)據(jù)流的原始數(shù)據(jù)從實(shí)體流表提取、抽取以及產(chǎn)生的抽取存儲(chǔ)到時(shí)態(tài)抽取表中。時(shí)態(tài)抽取表的屬性為實(shí)體ID,用于將特定抽取鏈接到特定實(shí)體;傳感器ID,用于將抽取與特定流關(guān)聯(lián);抽取值(TA值),示出了抽取的結(jié)果(值例如可以是高、低、正常、上升等);實(shí)際開(kāi)始時(shí)間(TA開(kāi)始時(shí)間),其為抽取成真的時(shí)間;以及實(shí)際結(jié)束時(shí)間(TA結(jié)束時(shí)間),其為特定抽取不再為真時(shí)、結(jié)束的時(shí)間。存儲(chǔ)在此表中的時(shí)態(tài)抽取通過(guò)向存儲(chǔ)在實(shí)體流中實(shí)體的相關(guān)流應(yīng)用包含在ΤΑ_ 規(guī)則表中的規(guī)則而產(chǎn)生。時(shí)態(tài)抽取表以多對(duì)一關(guān)系鏈接到實(shí)體表,表明特定實(shí)體可以具有存儲(chǔ)在該表中的多個(gè)抽取。時(shí)態(tài)抽取表與流限定表之間存在多對(duì)ー關(guān)系,其表明流可以具有其上執(zhí)行的若干抽取。在傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)設(shè)置中,其中原始數(shù)據(jù)被拷貝至數(shù)據(jù)倉(cāng)庫(kù)并且經(jīng)由批聚合之后的周期負(fù)載進(jìn)行聚合,時(shí)態(tài)代理例如可以實(shí)現(xiàn)為容納數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)中的代理。例如這可以利用DB2(商標(biāo))中的腳本。例如在此實(shí)例中,上文列出的五個(gè)功能可以實(shí)現(xiàn)為1)查詢TA_規(guī)則表并且從活動(dòng)的表中選定行的每行的規(guī)則欄中選擇所有規(guī)則。2)建立包含針對(duì)TA_規(guī)則表規(guī)則欄中列出的每個(gè)時(shí)態(tài)抽取的插入語(yǔ)句的DB2腳本。插入語(yǔ)句可以包含選擇語(yǔ)句,其針對(duì)專(zhuān)用于將行插入時(shí)態(tài)抽取表的日期范圍執(zhí)行時(shí)態(tài)抽取功能。3)存儲(chǔ)可以通過(guò)運(yùn)行腳本和啟動(dòng)插入語(yǔ)句來(lái)完成。4)復(fù)雜抽取可以從在該復(fù)雜抽取之前執(zhí)行的新近創(chuàng)建的簡(jiǎn)單抽取插入語(yǔ)句選擇數(shù)據(jù)。5)復(fù)雜抽取的存儲(chǔ)可以通過(guò)運(yùn)行腳本以及啟動(dòng)針對(duì)復(fù)雜抽取的插入語(yǔ)句來(lái)完成。在流計(jì)算范例中,在當(dāng)數(shù)據(jù)實(shí)時(shí)到達(dá)時(shí)數(shù)據(jù)被操作為流的情況下,時(shí)態(tài)代理可以是流計(jì)算程序,用于分析當(dāng)數(shù)據(jù)實(shí)時(shí)到達(dá)時(shí)的數(shù)據(jù)流或者采用源自數(shù)據(jù)倉(cāng)庫(kù)表的數(shù)據(jù)以及創(chuàng)建作為簡(jiǎn)單或復(fù)雜抽取的一系列結(jié)果低頻流,并繼而將他們實(shí)時(shí)加載到數(shù)據(jù)庫(kù)中。在此實(shí)現(xiàn)中,除了原始數(shù)據(jù)流向數(shù)據(jù)倉(cāng)庫(kù)環(huán)境的周期拷貝外,還需要時(shí)態(tài)抽取數(shù)據(jù)的周期拷貝。 例如在此實(shí)例中,上文列出的五個(gè)功能在實(shí)時(shí)環(huán)境中實(shí)現(xiàn)如下1)使用包含在TA_規(guī)則表中的信息來(lái)驅(qū)動(dòng)針對(duì)每個(gè)規(guī)則產(chǎn)生實(shí)時(shí)流模塊。例如在 IBM hfosphere流中,可以創(chuàng)建出現(xiàn)一系列SPADE圖表。2)代表簡(jiǎn)單抽取的每個(gè)流模塊可以在源原始流和相關(guān)聯(lián)所需靜態(tài)數(shù)據(jù)中讀取,并且寫(xiě)出該結(jié)果低頻輸出流。這些實(shí)時(shí)流模塊可以針對(duì)正由實(shí)時(shí)流環(huán)境監(jiān)控的每個(gè)實(shí)體進(jìn)行
ρΡ-Θ O3)存儲(chǔ)可以通過(guò)將ー個(gè)輸出流或多個(gè)輸出流寫(xiě)入數(shù)據(jù)庫(kù)來(lái)完成。
16
4)類(lèi)似于1),復(fù)雜抽取可以被實(shí)現(xiàn)為在來(lái)自2)的實(shí)時(shí)流中產(chǎn)生的輸出流中創(chuàng)建的流模塊,同時(shí)其通過(guò)一旦數(shù)據(jù)被寫(xiě)入數(shù)據(jù)庫(kù)便從復(fù)雜抽取之前執(zhí)行的新創(chuàng)建的簡(jiǎn)單抽取中選擇數(shù)據(jù)來(lái)生成。5)復(fù)雜抽取的存儲(chǔ)可以通過(guò)將ー個(gè)輸出流或多個(gè)輸出流寫(xiě)入數(shù)據(jù)庫(kù)來(lái)完成。圖6的研究表,其規(guī)定了特定校準(zhǔn),持有與可能需要被應(yīng)用于針對(duì)每個(gè)研究存儲(chǔ)在時(shí)態(tài)抽取表中的抽取的任意相對(duì)規(guī)則有關(guān)的信息。如果在引起診斷的時(shí)間的某些參數(shù)的行為將被研究,則取決于從事的特定研究,時(shí)態(tài)抽取可能需要相對(duì)于特定時(shí)間點(diǎn)(諸如診斷點(diǎn))重新校準(zhǔn)。在該情況下,特定抽取為真時(shí)的絕對(duì)時(shí)間點(diǎn)并不重要,相反,每個(gè)實(shí)體關(guān)于相關(guān)的實(shí)體診斷時(shí)間的相對(duì)時(shí)間點(diǎn)才重要。每個(gè)研究研究表中均存在條目。研究表的屬性為研究_ID、每個(gè)研究的、以及用于鏈接到TA_相對(duì)時(shí)間表的唯一標(biāo)識(shí)符。研究表可以具有零個(gè)到許多研究屬性,諸如但不限于圖6表中指出的研究名稱(chēng)和研究歸屬如研究屬性ェ至研究屬性n。研究_歸屬屬性用于標(biāo)識(shí)進(jìn)行特定研究的用戶。為了支持實(shí)體對(duì)這些興趣的限制(如果需要),則研究表包含用于通過(guò)實(shí)體限制屬性限定實(shí)體限制的本質(zhì)的屬性。為了支持對(duì)感興趣事件的限制(如果需要),研究表包含用于通過(guò)事件限制屬性限定事件限制的本質(zhì)的屬性。為了支持對(duì)感興趣時(shí)態(tài)抽取的限制(如果需要),研究表包含用于通過(guò)TA限制限定時(shí)態(tài)抽取限制的本質(zhì)的屬性。為了支持對(duì)感興趣相對(duì)校準(zhǔn)的限制(如果需要),研究表包含用于通過(guò)TA相對(duì)屬性限定相對(duì)校準(zhǔn)限制的本質(zhì)的屬性。用于支持新生兒危重監(jiān)護(hù)的該表實(shí)現(xiàn)的示例在圖7中為示出為研究表,其中實(shí)體已經(jīng)由患者替代。研究限定的示例如下研究員期望選擇不到30周胎齡出生的所有患者。在此示例中,感興趣事件為新生兒心動(dòng)過(guò)緩的事件,其針對(duì)該研究被限定為心率降到每分鐘10跳以下。感興趣時(shí)態(tài)抽取為1)平均血壓的簡(jiǎn)單TA降到當(dāng)前同等胎齡以下達(dá)超過(guò)20秒;幻血氧飽和度的簡(jiǎn)單TA降到百分之85以下達(dá)超過(guò)20秒;以及3)當(dāng)1和2 —同或重疊發(fā)生時(shí)的復(fù)雜抽取。相對(duì)校準(zhǔn)限制用于只選擇在前至新生兒心動(dòng)過(guò)緩事件的日期和時(shí)間之前36小時(shí)發(fā)生的時(shí)態(tài)抽取。在此示例中應(yīng)當(dāng)注意,相同實(shí)體可以具有多個(gè)事件發(fā)生,從而導(dǎo)致針對(duì)該患者的多個(gè)相對(duì)校準(zhǔn)的數(shù)據(jù)集。如以SQL在數(shù)據(jù)庫(kù)管理系統(tǒng)中實(shí)現(xiàn)的研究限制信息的示例可以是如下一系列選擇語(yǔ)句,其中子句部分分別在實(shí)體限制、TA限制、針對(duì)來(lái)自實(shí)體行限制的事件限制和TA相對(duì)限制屬性、時(shí)態(tài)屬性、事件限制和TA_相對(duì)時(shí)間表的每ー個(gè)中。這繼而可以在復(fù)合插入語(yǔ)句中使用來(lái)將數(shù)據(jù)插入TA_相對(duì)時(shí)間表中。再次參考圖6,TA_相對(duì)時(shí)間表持有時(shí)間上相對(duì)于已經(jīng)由如下用戶視為感興趣的時(shí)間點(diǎn)校準(zhǔn)的抽取,該用戶擁有表中相對(duì)校準(zhǔn)抽取的研究。多個(gè)研究的數(shù)據(jù)可以存儲(chǔ)在TA_ 相對(duì)時(shí)間表中。TA_相對(duì)時(shí)間表的屬性非常類(lèi)似于時(shí)態(tài)抽取表中的屬性,然而實(shí)際開(kāi)始時(shí)間和實(shí)際結(jié)束時(shí)間已經(jīng)由相對(duì)開(kāi)始時(shí)間和相對(duì)結(jié)束時(shí)間替代,其將是相對(duì)于條目所屬研究的歸屬視為感興趣的時(shí)間點(diǎn)的時(shí)間。研究_ID屬性已經(jīng)被添加以將相對(duì)抽取鏈接到研究表中的特定研究。TA_相對(duì)時(shí)間表與研究表之間的關(guān)系是多對(duì)ー關(guān)系,因?yàn)門(mén)A_相對(duì)時(shí)間表中可以存在屬于特定研究的許多條目。
在此上下文中,相關(guān)代理例如可以實(shí)現(xiàn)為容納數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS) 中的代理。這可以例如利用DB2中的腳本。例如在此實(shí)例中,上文所列三個(gè)功能可以實(shí)現(xiàn)為1)查詢研究表并選擇所有研究以及使用每個(gè)欄中包含的信息來(lái)填充結(jié)果插入語(yǔ)句中的信息,以在TA_相對(duì)時(shí)間表中創(chuàng)建行。2)構(gòu)建包含如從1)創(chuàng)建的每個(gè)相關(guān)校準(zhǔn)規(guī)則的插入語(yǔ)句的DB2腳本。插入語(yǔ)句可以包含執(zhí)行指定用于在TA_相對(duì)時(shí)間表中產(chǎn)生行的日期范圍執(zhí)行相對(duì)校準(zhǔn)功能的選擇語(yǔ)句。3)存儲(chǔ)可以通過(guò)運(yùn)行腳本并且啟動(dòng)插入語(yǔ)句至TA_相對(duì)時(shí)間表來(lái)完成。在流計(jì)算范例中,在當(dāng)數(shù)據(jù)實(shí)時(shí)到達(dá)時(shí)數(shù)據(jù)被操作為流的情況下,相對(duì)校準(zhǔn)代理可以是流計(jì)算程序,用于分析當(dāng)數(shù)據(jù)實(shí)時(shí)到達(dá)時(shí)的時(shí)態(tài)數(shù)據(jù)流,或者采用源自數(shù)據(jù)倉(cāng)庫(kù)表的數(shù)據(jù),并創(chuàng)建作為簡(jiǎn)單或復(fù)雜抽取的一系列結(jié)果低頻流,繼而將它們實(shí)時(shí)加載到數(shù)據(jù)庫(kù)中。在此實(shí)現(xiàn)中,還需要相關(guān)數(shù)據(jù)的周期拷貝以創(chuàng)建用于數(shù)據(jù)挖掘的相關(guān)數(shù)據(jù)拷貝。例如在此實(shí)例中,上文列出的五個(gè)功能在實(shí)時(shí)環(huán)境中實(shí)現(xiàn)如下1)使用包含在研究表中的信息來(lái)驅(qū)動(dòng)針對(duì)每個(gè)規(guī)則創(chuàng)建實(shí)時(shí)流模塊。例如在IBM hfosphere (商標(biāo))流中,這將帶來(lái)一系列SPADE圖表的創(chuàng)建。2)表示研究相對(duì)校準(zhǔn)的每個(gè)流模塊可以在時(shí)態(tài)抽取流和相關(guān)聯(lián)所需靜態(tài)數(shù)據(jù)中讀取,并且寫(xiě)出該作為結(jié)果的經(jīng)相對(duì)校準(zhǔn)流。這些實(shí)時(shí)流模塊可以針對(duì)特定研究范圍中考慮的每個(gè)實(shí)體進(jìn)行部署。3)存儲(chǔ)可以通過(guò)將ー個(gè)輸出流或多個(gè)輸出流寫(xiě)入數(shù)據(jù)庫(kù)來(lái)完成。除了上文形成STDMntl框架一部分的表,從作為STDMntl框架處理結(jié)果的假設(shè)所創(chuàng)建的可能結(jié)果規(guī)則還可以存儲(chǔ)在實(shí)時(shí)規(guī)則庫(kù)表中(如圖6所示),其可訪問(wèn)以供實(shí)時(shí)患者監(jiān)控 (諸如SMS內(nèi)的事件流處理器)使用。該表可以位于STDMntl數(shù)據(jù)存儲(chǔ)外部。圖6說(shuō)明了實(shí)時(shí)規(guī)則庫(kù)表的示例,其中針對(duì)已經(jīng)是研究主題的每個(gè)事件ID,關(guān)于特定流(流ID)的時(shí)態(tài)抽取(TA規(guī)則ID)可以基于它們與事件的相對(duì)距離以及需要相關(guān)聯(lián)值的位置進(jìn)行限定。針對(duì)流可以存在多個(gè)時(shí)態(tài)抽取規(guī)則,其中每個(gè)均有可能與事件處于不同的相對(duì)距離。針對(duì)每個(gè)事件可以存在跨多個(gè)流的多個(gè)時(shí)態(tài)抽取。方案管理器服務(wù)在本發(fā)明的一個(gè)實(shí)現(xiàn)中,方案管理器服務(wù)(SMQ是支持新生兒臨床管理和研究的智能決策支持系統(tǒng)(IDSS)。與方案管理服務(wù)的交互經(jīng)由一系列web服務(wù)。在本發(fā)明的特定代表性實(shí)現(xiàn)中,圖9中所示的SMS包含六個(gè)組件方案構(gòu)建器是捕獲如下元數(shù)據(jù)的構(gòu)建時(shí)間組件,所述元數(shù)據(jù)用于安裝并初始化運(yùn)行時(shí)組件和數(shù)據(jù)管理層。醫(yī)療警告監(jiān)控器是使得新生兒專(zhuān)家能夠限定和改變復(fù)雜醫(yī)療警告規(guī)則的運(yùn)行時(shí)組件。事件流處理器提供連續(xù)集成并轉(zhuǎn)換事件的可擴(kuò)展數(shù)據(jù)分級(jí)環(huán)境以支持復(fù)雜醫(yī)療警告。分析處理器提供用于獲取接近實(shí)時(shí)的患者數(shù)據(jù)的運(yùn)行時(shí)接ロ或者根據(jù)位于數(shù)據(jù)管理層內(nèi)數(shù)據(jù)倉(cāng)庫(kù)或?qū)崟r(shí)數(shù)據(jù)存儲(chǔ)中的數(shù)據(jù)在患者或匯總級(jí)別執(zhí)行臨床試驗(yàn)分析。
數(shù)據(jù)管理提供構(gòu)建時(shí)間元數(shù)據(jù)、醫(yī)療規(guī)則以及存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)或者活動(dòng)規(guī)則和連同時(shí)態(tài)抽取(TA)規(guī)則庫(kù)在內(nèi)數(shù)據(jù)存儲(chǔ)中存儲(chǔ)的運(yùn)行時(shí)間生理和臨床數(shù)據(jù)的永久存儲(chǔ)。Web服務(wù)接ロ經(jīng)由web服務(wù)集提供對(duì)這些組件的訪問(wèn)。本文描述了與方案管理器服務(wù)和數(shù)據(jù)采集単元有關(guān)的研究。SMS支持實(shí)時(shí)處理和數(shù)據(jù)挖掘,實(shí)時(shí)處理在新生兒示例實(shí)現(xiàn)的背景中表示實(shí)時(shí)智能患者監(jiān)控。圖3中所示的STDMntl框架組件如下映射到圖8中的SMS組件SMS內(nèi)的臨床日志W(wǎng)eb服務(wù)執(zhí)行STDMntl框架中靜態(tài)數(shù)據(jù)采集Web服務(wù)的功能。SMS內(nèi)的生理日志W(wǎng)eb服務(wù)執(zhí)行STDMntl框架中劉數(shù)據(jù)采集Web服務(wù)的功能。SMS內(nèi)的分析Web服務(wù)表示STDMntl框架中的web服務(wù)集,即時(shí)態(tài)抽取Web服務(wù)、 相對(duì)校準(zhǔn)Web服務(wù)、探索性數(shù)據(jù)挖掘Web服務(wù)、確認(rèn)性數(shù)據(jù)挖掘Web服務(wù)和規(guī)則管理Web服務(wù)。SMS事件流處理器功能的一部分在于實(shí)施處理代理以從SMS實(shí)時(shí)數(shù)據(jù)存儲(chǔ)將數(shù)據(jù)移到SMS數(shù)據(jù)倉(cāng)庫(kù)。SMS內(nèi)的分析處理器通過(guò)STDMntl框架中剰余四種類(lèi)型的處理代理進(jìn)行實(shí)施,即時(shí)態(tài)代理、相對(duì)代理、功能代理和規(guī)則生成代理。圖6中以其一般形式以及圖7中針對(duì)新生兒重癥監(jiān)護(hù)的示例形式示出的STDMntl框架數(shù)據(jù)模型是SMS內(nèi)數(shù)據(jù)倉(cāng)庫(kù)的表示。SMS臨床日志W(wǎng)eb服務(wù)和生理日志W(wǎng)eb服務(wù)將數(shù)據(jù)分別加載至STDMntl框架數(shù)據(jù)模型實(shí)體和實(shí)體流表的實(shí)時(shí)數(shù)據(jù)存儲(chǔ)拷貝,并且表示連續(xù)填充的表以支持實(shí)時(shí)患者監(jiān)控。時(shí)態(tài)抽取表的拷貝還可以存在于以下實(shí)例中的實(shí)時(shí)數(shù)據(jù)存儲(chǔ)中,其中該表的內(nèi)容通過(guò)如下技術(shù)實(shí)時(shí)產(chǎn)生,所述技術(shù)包括但不限于流編程。STDMntl框架處理代理作為SMS分析處理器的組件從SMS實(shí)時(shí)數(shù)據(jù)存儲(chǔ)中的匹配表拷貝用于在STDMntl框架數(shù)據(jù)模型實(shí)體、實(shí)體流以及可選的SMS數(shù)據(jù)倉(cāng)庫(kù)的時(shí)態(tài)抽取數(shù)據(jù)表中填充的數(shù)據(jù)作為周期性増加負(fù)載。SMS醫(yī)療警告監(jiān)控器及其支持的監(jiān)控器Web服務(wù)支持實(shí)時(shí)智能患者監(jiān)控所需的功能。SMS方案構(gòu)建器和定義Web服務(wù)可以用于首先限定SMS實(shí)時(shí)數(shù)據(jù)存儲(chǔ)內(nèi)實(shí)時(shí)智能患者監(jiān)控所需的表以及SMS數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的STDMntl框架數(shù)據(jù)模型表。示例I危重監(jiān)護(hù)本發(fā)明可以被實(shí)現(xiàn)為用于確定與診斷相關(guān)的模式以及可選地預(yù)測(cè)未來(lái)診斷的臨床監(jiān)控和數(shù)據(jù)挖掘環(huán)境。圖8圖示了用于使得臨床醫(yī)生能夠執(zhí)行上述方法的方案管理器服務(wù)。在危重監(jiān)護(hù)背景中,臨床數(shù)據(jù)以及生理數(shù)據(jù)與時(shí)態(tài)規(guī)則一起使用來(lái)創(chuàng)建原始生理數(shù)據(jù)流的時(shí)態(tài)數(shù)據(jù)匯總流。生理數(shù)據(jù)流由臨床數(shù)據(jù)補(bǔ)充。這些匯總流可以基于多個(gè)原始流的交叉相關(guān)來(lái)表示匯總。在對(duì)相對(duì)于興趣點(diǎn)、的時(shí)序時(shí)間戳進(jìn)行編碼的數(shù)據(jù)預(yù)備步驟期間,用戶可以容易地在靈活的多維環(huán)境中生成基于單獨(dú)研究的相對(duì)時(shí)態(tài)數(shù)據(jù)表。例如,、可以指基于針對(duì)每個(gè)患者診斷的特定狀況的時(shí)間,一組新生兒患者的新生兒患者流的校準(zhǔn),由此使得先前流行為的校準(zhǔn)能夠在t_”t_2…t_n的連續(xù)體中,其中η是針對(duì)給定研究的回到感興趣的時(shí)間的距離。環(huán)境的用戶可以創(chuàng)建表示面對(duì)患者、事件、生理和時(shí)態(tài)數(shù)據(jù)表的一系列功能和/ 或標(biāo)準(zhǔn)的相對(duì)規(guī)則。處理代理處理代理的角色在于獲取和預(yù)備來(lái)自傳感器的流數(shù)據(jù)以及靜態(tài)數(shù)據(jù),以用于分別存儲(chǔ)在流數(shù)據(jù)表和靜態(tài)數(shù)據(jù)表內(nèi)。在危重監(jiān)護(hù)環(huán)境中,靜態(tài)數(shù)據(jù)可以由臨床信息系統(tǒng)提供, 例如出生日期或出生時(shí)的胎齢,以及從醫(yī)療傳感器設(shè)備獲取的流數(shù)據(jù)(例如,ECG信號(hào)),或者隨時(shí)間手動(dòng)重復(fù)采集的流數(shù)據(jù),例如隨時(shí)間手動(dòng)重復(fù)采用的溫度讀數(shù)。靜態(tài)數(shù)據(jù)可以經(jīng)由靜態(tài)數(shù)據(jù)web服務(wù)提供,其在危重監(jiān)護(hù)環(huán)境中例如可以是經(jīng)由 HL7消息格式。流數(shù)據(jù)可以經(jīng)由流數(shù)據(jù)web服務(wù)提供。時(shí)杰代理時(shí)態(tài)代理的角色在于通過(guò)抽取時(shí)間區(qū)間,在匯集時(shí)間區(qū)間期間表示流的趨勢(shì)和/ 或行為以相對(duì)于正被編碼的一個(gè)或多個(gè)數(shù)據(jù)流更低的頻率創(chuàng)建新的時(shí)態(tài)編碼流。每個(gè)數(shù)據(jù)流時(shí)態(tài)上抽取成適當(dāng)抽取,諸如基于用于驅(qū)動(dòng)時(shí)態(tài)規(guī)則表中包含的時(shí)態(tài)抽取的時(shí)態(tài)規(guī)則的趨勢(shì)(増加,減少)和等級(jí)轉(zhuǎn)變(高,低)。每個(gè)原始數(shù)據(jù)片可以屬于若干抽取。例如,特定測(cè)量可以是“増加”抽取的一部分,并且同時(shí)處干“正?!钡南拗浦小?fù)雜抽取還可以跨多個(gè)抽取參數(shù)完成。每個(gè)抽取流存儲(chǔ)在時(shí)態(tài)數(shù)據(jù)表中。相對(duì)、功能和規(guī)則生成代理可以一起運(yùn)行作為ー組任意給定研究(從研究i到研究 )。還有可能運(yùn)行利用針對(duì)特定研究所需的新的時(shí)態(tài)規(guī)則的時(shí)態(tài)代理。該原理經(jīng)由以下示例研究示出。(a)臨床研究示例1 :ECG不穩(wěn)定臨床研究員例如可以通過(guò)平均血壓降到小于同等胎齡(例如35周胎齡嬰兒的 35mm Hg)達(dá)超過(guò)20秒同時(shí)伴有外圍氧飽和度小于85%達(dá)超過(guò)20秒來(lái)確定在過(guò)去M小時(shí)內(nèi)ECG不穩(wěn)定性是否領(lǐng)先(precede)。在此示例中,生理數(shù)據(jù)流包括ECG、血壓和外圍氧飽和度。首先,ECG、血壓和外圍氧飽和度的生理數(shù)據(jù)流數(shù)據(jù)經(jīng)由流數(shù)據(jù)采集web服務(wù)通過(guò)處理代理加載至流數(shù)據(jù)表。類(lèi)似地相關(guān)臨床數(shù)據(jù)經(jīng)由靜態(tài)數(shù)據(jù)采集web服務(wù)加載至靜態(tài)數(shù)據(jù)表。通過(guò)使用時(shí)態(tài)代理,可以創(chuàng)建時(shí)態(tài)抽取規(guī)則以創(chuàng)建時(shí)態(tài)編碼流來(lái)基于針對(duì)每個(gè)患者評(píng)估的ECG流檢測(cè)ECG不穩(wěn)定性。類(lèi)似地,可以創(chuàng)建時(shí)態(tài)規(guī)則來(lái)確定平均血壓何時(shí)降到基于患者同等胎齡的閾值以下達(dá)超過(guò)20秒的時(shí)間區(qū)間??梢詣?chuàng)建時(shí)態(tài)規(guī)則來(lái)確定外圍氧飽和度小于85%達(dá)超過(guò)20秒??梢詣?chuàng)建復(fù)雜規(guī)則用于表示他們?cè)诤翁幹丿B。這些規(guī)則可以使用時(shí)態(tài)抽取web服務(wù)進(jìn)行創(chuàng)建。相對(duì)代理選擇已經(jīng)被檢測(cè)為具有ECG不穩(wěn)定性的患者,并且針對(duì)此示例可以使用 ECG不穩(wěn)定的第一次出現(xiàn)來(lái)確定感興趣的時(shí)間點(diǎn)。該感興趣的時(shí)間點(diǎn)在圖9中被示為診斷的圓點(diǎn)。其中復(fù)雜時(shí)態(tài)抽取可能已經(jīng)出現(xiàn)的示例被示為流上位于診斷前面的矩形框。可以在圖9的絕對(duì)時(shí)間表示中看出,復(fù)雜抽取和感興趣診斷的實(shí)際時(shí)間點(diǎn)發(fā)生在每個(gè)患者的實(shí)際時(shí)間中的不同點(diǎn)。如圖9的相對(duì)時(shí)間部分中所示,針對(duì)每個(gè)選定患者,ECG不穩(wěn)定的時(shí)間用于基于成為、的感興趣時(shí)間來(lái)將感興趣的所有三個(gè)流中的實(shí)際時(shí)間復(fù)位成相對(duì)時(shí)間。圖9中的示例示出了與針對(duì)此研究的感興趣診斷點(diǎn)的復(fù)雜抽取情形類(lèi)似的相對(duì)距離。隨著基于興趣點(diǎn)的數(shù)據(jù)預(yù)備、時(shí)態(tài)抽取和校準(zhǔn),所述兩步驟數(shù)據(jù)挖掘可以開(kāi)始。該兩步驟處理支持最初規(guī)則生成(探索性數(shù)據(jù)挖掘),然后通過(guò)確認(rèn)性數(shù)據(jù)挖掘測(cè)試零假設(shè)。在此示例中,已經(jīng)提出在ECG行為與平均血壓和外圍氧飽和量的先前行為之間存在疑似關(guān)聯(lián)的假設(shè)。因此,規(guī)則集可以基于已經(jīng)提出的內(nèi)容立即進(jìn)行限定。然而,可以改變研究來(lái)在其他數(shù)據(jù)流上執(zhí)行探索性數(shù)據(jù)挖掘以了解是否存在如下其它時(shí)態(tài)抽取,該時(shí)態(tài)抽取與在ECG不穩(wěn)定之前導(dǎo)致需要執(zhí)行探索性數(shù)據(jù)挖掘的發(fā)生高度相關(guān)。針對(duì)此示例,可以使用為0. 8的關(guān)聯(lián)系數(shù)來(lái)對(duì)假設(shè)編碼。因此該假設(shè)利用以下形式的關(guān)聯(lián)系數(shù)進(jìn)行表示H1 P (XjY) > 0. 8其中X表示ECG不穩(wěn)定性以及;Y表示ABP平均<胎齡達(dá)20秒;并且< 85%同樣達(dá)20秒。有效零假設(shè)表示為H0 P (XjY) = 0. 8真零假設(shè)表示為H0 P (XjY) < 0. 8在確認(rèn)性數(shù)據(jù)挖掘階段,確定具有先前ABP平均的ECG不穩(wěn)定性與MO2下降之間的關(guān)聯(lián)。如果Htl不能被接受,則由上文H1表示的規(guī)則可以被接受,并且被創(chuàng)建作為規(guī)則庫(kù)表中的規(guī)則。例如,規(guī)則可以是基于ABP平均的兩個(gè)簡(jiǎn)單閾值分支的關(guān)聯(lián)的復(fù)雜抽取,并且在規(guī)則作用吋,MO2下降同時(shí)具有對(duì)ECG穩(wěn)定性的潛勢(shì)的警告。規(guī)則管理web服務(wù)可以獨(dú)立于規(guī)則生成過(guò)程來(lái)添加、改變或刪除規(guī)則。規(guī)則可以存在作為產(chǎn)生規(guī)則、測(cè)試規(guī)則或開(kāi)發(fā)規(guī)則。(b)臨床研究示例2 平均血壓臨床研究員例如可以針對(duì)通常由于早產(chǎn)之前沒(méi)有進(jìn)行診斷的嬰兒來(lái)確定平均血壓與同等胎齡(例如35周妊娠嬰兒的35mm Hg)之間是否存在關(guān)聯(lián)。在此示例中,生理數(shù)據(jù)流包括血壓?,F(xiàn)有時(shí)態(tài)規(guī)則可以用于確定平均血壓何時(shí)降到基于患者同等胎齡的閾值以下達(dá)超過(guò)20秒的時(shí)間區(qū)間。相關(guān)代理可以選擇滿足由于其第35個(gè)等同妊娠周期間早產(chǎn)而沒(méi)有針對(duì)診斷為異常進(jìn)行治療的標(biāo)準(zhǔn)的患者。針對(duì)每個(gè)選定患者,胎齡的第35周的開(kāi)始時(shí)間可以用于將感興趣流(平均血壓)內(nèi)的實(shí)際時(shí)間復(fù)位成基于成為、并前進(jìn)7天的興趣時(shí)間的相對(duì)時(shí)間。在此示例中,已經(jīng)提出假設(shè)在平均血壓行為與同等胎齡存在疑似關(guān)聯(lián)。因此,規(guī)則集可以基于已經(jīng)提出的內(nèi)容立即進(jìn)行限定。如在先前示例中,零假設(shè)可以在確認(rèn)性數(shù)據(jù)挖掘階段進(jìn)行測(cè)試。(c)臨床研究示例3 =ECG不穩(wěn)定性II臨床研究員例如可以通過(guò)生理流中出現(xiàn)1分鐘或更長(zhǎng)時(shí)間的常見(jiàn)行為來(lái)確定過(guò)去M小時(shí)內(nèi)ECG不穩(wěn)定性是否領(lǐng)先。
在此示例中,生理數(shù)據(jù)流包括ECG和其他生理流??梢允褂孟惹皠?chuàng)建用于基于針對(duì)每個(gè)患者評(píng)估ECG流來(lái)檢測(cè)ECG不穩(wěn)定的時(shí)態(tài)抽取規(guī)則。在所述研究中包括在流上而非ECG上的所有時(shí)態(tài)流編碼。相對(duì)代理可以選擇已經(jīng)檢測(cè)具有ECG不穩(wěn)定性的患者,并且對(duì)于該示例使用ECG 不穩(wěn)定的第一次出現(xiàn)來(lái)確定感興趣的時(shí)間點(diǎn)。針對(duì)每個(gè)選定患者,ECG不穩(wěn)定的時(shí)間可以用于將所有感興趣流中的實(shí)際時(shí)間復(fù)位到基于成為、的感興趣時(shí)間的相對(duì)時(shí)間。隨著數(shù)據(jù)預(yù)備、時(shí)態(tài)上抽取和基于興趣點(diǎn)的校準(zhǔn),可以開(kāi)始所述兩步驟數(shù)據(jù)挖掘。 該兩步驟處理支持最初規(guī)則生成(探索性數(shù)據(jù)挖掘),然后通過(guò)確認(rèn)性數(shù)據(jù)挖掘測(cè)試零假設(shè)。在此示例中,假設(shè)還沒(méi)有提出,因此探索性數(shù)據(jù)挖掘階段針對(duì)ECG行為與所提供的其他流的先前行為之間可能存在關(guān)聯(lián)的患者訓(xùn)練集來(lái)完成。如果在訓(xùn)練集上檢測(cè)為到聯(lián),則該關(guān)聯(lián)被轉(zhuǎn)換成零假設(shè)并且在測(cè)試數(shù)據(jù)集上進(jìn)ー 步測(cè)試以確定關(guān)聯(lián)因子。如果成功,則由上文H1表示的規(guī)則可以被接受并且作為規(guī)則庫(kù)數(shù)據(jù)庫(kù)中的規(guī)則。II其他示例本發(fā)明可以在臨床研究領(lǐng)域外實(shí)現(xiàn)數(shù)據(jù)挖掘。例如,用戶可以確定如下之間的關(guān)系針對(duì)兩種不同類(lèi)型的產(chǎn)品銷(xiāo)售模式、在路由器發(fā)生故障之前的計(jì)算機(jī)網(wǎng)絡(luò)流量特性、通過(guò)智能儀表數(shù)據(jù)的分析與特定天氣和體育賽事相關(guān)的電力使用行為、在機(jī)動(dòng)車(chē)內(nèi)的特定形式的組件出現(xiàn)故障之前的汽車(chē)遙感系統(tǒng)信息、在特定里程或車(chē)齡之后特定品牌和型號(hào)的機(jī)動(dòng)車(chē)的期望操作行為,、設(shè)備故障或即將出現(xiàn)故障之前核電站操作傳感器讀數(shù)、在特定股票價(jià)格變動(dòng)行為之前股票價(jià)格購(gòu)買(mǎi)趨勢(shì)、或者公司之間從公司宣告到特定股票價(jià)格變動(dòng)行為的時(shí)間距離。
2權(quán)利要求
1.一種用于多維時(shí)態(tài)抽取和數(shù)據(jù)挖掘的方法,所述方法的特征在于采集并選擇性清洗多維數(shù)據(jù),所述多維數(shù)據(jù)包括多個(gè)數(shù)據(jù)流;時(shí)態(tài)抽取所述多維數(shù)據(jù);以及基于至少一個(gè)感興趣的時(shí)間點(diǎn)來(lái)相對(duì)校準(zhǔn)經(jīng)所述時(shí)態(tài)抽取的多維數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其中經(jīng)所述采集、時(shí)態(tài)抽取和相對(duì)校準(zhǔn)的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)存儲(chǔ)中用于隨后獲取。
3.根據(jù)權(quán)利要求1所述的方法,進(jìn)ー步特征在于從事對(duì)經(jīng)所述相對(duì)校準(zhǔn)的經(jīng)時(shí)態(tài)抽取的多維數(shù)據(jù)的探索性數(shù)據(jù)挖掘。
4.根據(jù)權(quán)利要求3所述的方法,其中所述探索性數(shù)據(jù)挖掘步驟包括用于使用戶能夠生成規(guī)則以供智能監(jiān)控系統(tǒng)使用的機(jī)制。
5.根據(jù)權(quán)利要求1所述的方法,進(jìn)ー步特征在于將至少ー個(gè)遠(yuǎn)程設(shè)備鏈接到經(jīng)所述時(shí)態(tài)抽取的多維數(shù)據(jù)以支持由所述至少一個(gè)遠(yuǎn)程設(shè)備進(jìn)行進(jìn)ー步的數(shù)據(jù)處理。
6.根據(jù)權(quán)利要求1所述的方法,其中所述時(shí)態(tài)抽取步驟包括以下步驟獲取至少ー個(gè)時(shí)態(tài)規(guī)則,并且向所述多維數(shù)據(jù)應(yīng)用所述至少一個(gè)規(guī)則來(lái)創(chuàng)建經(jīng)時(shí)態(tài)抽取的多維數(shù)據(jù)。
7.根據(jù)權(quán)利要求1所述的方法,其中經(jīng)所述時(shí)態(tài)抽取的多維數(shù)據(jù)特征在于多個(gè)數(shù)據(jù)值,所述多個(gè)數(shù)據(jù)值的每ー個(gè)數(shù)據(jù)值均具有實(shí)際開(kāi)始時(shí)間和實(shí)際結(jié)束時(shí)間。
8.根據(jù)權(quán)利要求7所述的方法,其中所述相對(duì)校準(zhǔn)步驟包括以下步驟針對(duì)所述多個(gè)數(shù)據(jù)值的每ー個(gè)數(shù)據(jù)值,計(jì)算所述實(shí)際時(shí)間與所述至少一個(gè)感興趣的時(shí)間點(diǎn)之間的差別。
9.根據(jù)權(quán)利要求1所述的方法,其中所述至少一個(gè)感興趣的時(shí)間點(diǎn)為事件。
10.根據(jù)權(quán)利要求1所述的方法,其中所述相對(duì)校準(zhǔn)步驟包括以下步驟基于由用戶提供的選擇規(guī)范來(lái)從數(shù)據(jù)存儲(chǔ)獲取經(jīng)所述時(shí)態(tài)抽取的多維數(shù)據(jù),以及向經(jīng)所述時(shí)態(tài)抽取的多維數(shù)據(jù)應(yīng)用轉(zhuǎn)換。
11.一種計(jì)算機(jī)實(shí)現(xiàn)的數(shù)據(jù)挖掘系統(tǒng),其特征在干至少ー個(gè)數(shù)據(jù)存儲(chǔ);與所述至少ー個(gè)數(shù)據(jù)存儲(chǔ)通信的處理器,所述處理器配置用于使用由用戶設(shè)置的選擇標(biāo)準(zhǔn)來(lái)從所述數(shù)據(jù)存儲(chǔ)中采集并構(gòu)造至少ー個(gè)時(shí)間相關(guān)的數(shù)據(jù)集;根據(jù)預(yù)先限定的抽取規(guī)則來(lái)向所述至少一個(gè)時(shí)間相關(guān)的數(shù)據(jù)集應(yīng)用時(shí)態(tài)抽取,以產(chǎn)生至少ー個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集;以及相對(duì)于至少ー個(gè)感興趣的時(shí)間點(diǎn)來(lái)重新校準(zhǔn)所述至少一個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集,以產(chǎn)生至少ー個(gè)經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)集。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述至少ー個(gè)時(shí)間相關(guān)的數(shù)據(jù)集、所述至少一個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集和所述至少一個(gè)經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)集被存儲(chǔ)用于隨后獲取。
13.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述處理器進(jìn)ー步配置用于從事對(duì)所述至少ー 個(gè)經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)集的探索性數(shù)據(jù)挖掘。
14.根據(jù)權(quán)利要求13所述的系統(tǒng),其中所述探索性數(shù)據(jù)挖掘過(guò)程包括用于使用戶能夠生成規(guī)則以供智能監(jiān)控系統(tǒng)使用的機(jī)制。
15.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述過(guò)程進(jìn)ー步配置用于將至少ー個(gè)遠(yuǎn)程設(shè)備鏈接到所述至少一個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集以支持由所述至少一個(gè)遠(yuǎn)程設(shè)備對(duì)所述數(shù)據(jù)集的進(jìn)ー步處理。
16.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述時(shí)態(tài)抽取的應(yīng)用包括以下步驟獲取至少一個(gè)時(shí)態(tài)規(guī)則,并且向所述至少一個(gè)時(shí)間相關(guān)的數(shù)據(jù)集應(yīng)用所述至少ー個(gè)規(guī)則,以產(chǎn)生至少ー個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集。
17.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述至少一個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集特征在于多個(gè)數(shù)據(jù)值,所述多個(gè)數(shù)據(jù)值的每ー個(gè)均具有實(shí)際開(kāi)始時(shí)間和實(shí)際結(jié)束時(shí)間。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其中所述至少一個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集的重新校準(zhǔn)特征在干,針對(duì)所述多個(gè)數(shù)據(jù)值的每ー個(gè)來(lái)計(jì)算所述實(shí)際時(shí)間與所述至少一個(gè)感興趣的時(shí)間點(diǎn)之間的差別。
19.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述至少一個(gè)感興趣的時(shí)間點(diǎn)為事件。
20.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述至少一個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集的重新校準(zhǔn)特征在干,基于由用戶提供的選擇規(guī)范來(lái)從數(shù)據(jù)存儲(chǔ)中獲取所述經(jīng)時(shí)態(tài)抽取的多維數(shù)據(jù), 以及向所述經(jīng)時(shí)態(tài)抽取的多維數(shù)據(jù)應(yīng)用轉(zhuǎn)換。
21.ー種其上存儲(chǔ)有用于數(shù)據(jù)挖掘的計(jì)算機(jī)程序的計(jì)算機(jī)可讀介質(zhì),所述計(jì)算機(jī)程序包括用于生成并存儲(chǔ)多個(gè)可訪問(wèn)信息文件的指令集,當(dāng)與處理器一起使用吋,所述指令集包括其特征在于如下的方法使用由用戶設(shè)置的選擇標(biāo)準(zhǔn)來(lái)構(gòu)造至少ー個(gè)時(shí)間相關(guān)的數(shù)據(jù)集;根據(jù)預(yù)先限定的抽取規(guī)則來(lái)向所述至少一個(gè)時(shí)間相關(guān)的數(shù)據(jù)集應(yīng)用時(shí)態(tài)抽取,以產(chǎn)生至少ー個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集;相對(duì)于感興趣的時(shí)間點(diǎn)來(lái)相對(duì)地校準(zhǔn)所述至少一個(gè)經(jīng)時(shí)態(tài)抽取的數(shù)據(jù)集,以創(chuàng)建至少一個(gè)經(jīng)相對(duì)校準(zhǔn)的數(shù)據(jù)集;以及存儲(chǔ)每個(gè)至少一個(gè)數(shù)據(jù)集供隨后獲取。
全文摘要
本發(fā)明提供了一種用于多維時(shí)態(tài)抽取和數(shù)據(jù)挖掘的系統(tǒng)、方法和計(jì)算機(jī)程序。本發(fā)明包括采集并選擇性清洗多維數(shù)據(jù),所述多維數(shù)據(jù)包括多個(gè)數(shù)據(jù)流;時(shí)態(tài)抽取所述多維數(shù)據(jù);以及基于感興趣的共享時(shí)間點(diǎn)來(lái)相對(duì)校準(zhǔn)經(jīng)所述時(shí)態(tài)抽取的多維數(shù)據(jù)。
文檔編號(hào)G06F17/30GK102597992SQ201080039589
公開(kāi)日2012年7月18日 申請(qǐng)日期2010年7月22日 優(yōu)先權(quán)日2009年7月22日
發(fā)明者卡羅林·帕特里希亞·麥格瑞戈 申請(qǐng)人:卡羅林·帕特里希亞·麥格瑞戈
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
安岳县| 沁源县| 拜泉县| 濉溪县| 苏尼特右旗| 建始县| 铁岭县| 益阳市| 潢川县| 惠来县| 昭平县| 郎溪县| 兴隆县| 甘德县| 怀来县| 巴塘县| 额尔古纳市| 康乐县| 荣昌县| 崇仁县| 甘孜县| 永靖县| 丁青县| 乐陵市| 宜章县| 明水县| 白山市| 喀喇沁旗| 宁城县| 丹寨县| 淄博市| 合川市| 永定县| 古浪县| 新巴尔虎左旗| 香格里拉县| 旺苍县| 越西县| 湘乡市| 鄂伦春自治旗| 邢台市|