基于增量局部鑒別子空間嵌入的川崎病和發(fā)燒診斷系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及的是一種大數(shù)據(jù)醫(yī)療領(lǐng)域中的兒科疾病診斷系統(tǒng),具體設(shè)及的是一種 基于增量局部鑒別子空間嵌入、可在線訓(xùn)練的川崎病和發(fā)燒診斷系統(tǒng),可W為兒科醫(yī)生的 初步診斷提供決策支持。
【背景技術(shù)】
[0002] 川崎病是一種血管炎綜合癥,也稱為小兒皮膚粘膜淋己結(jié)綜合癥,它是W日本川 崎富作醫(yī)師命名的一種兒科疾病。它的臨床表現(xiàn)是發(fā)熱、皮疹、頸部非脈性淋己結(jié)腫大、眼 結(jié)合膜充血、口腔黏膜彌漫充血、楊梅舌、掌巧紅斑、手足硬性水腫等。川崎病好發(fā)于五歲W 下的幼童,男孩得到的機(jī)率約為女孩的1. 5倍,亞洲兒童的發(fā)病率要明顯高于其人種。
[0003] 由于持續(xù)發(fā)燒是川崎病的一個(gè)重要特征,因而其早期診斷的難點(diǎn)之一是迅速區(qū)分 患者兒童所得的是川崎病還是普通發(fā)燒。如果不能正確診斷,進(jìn)而快速治療,川崎病患者很 可能發(fā)展成為冠狀動(dòng)脈擴(kuò)張或者動(dòng)脈瘤,對(duì)屯、臟血管造成極大的傷害,并且即使在痊愈W 后,瘡痕組織也造成冠狀動(dòng)脈狹窄或巧化引起屯、肌缺氧。然而,臨床表明,如果患者能夠及 時(shí)的進(jìn)行大量丙種球蛋白靜滴,可W很大程度上的減小患者的屯、臟血管的損失。因而,研發(fā) 一種快速而有效的川崎病和普通發(fā)燒的診斷系統(tǒng)是十分有意義的。
[0004] 盡管川崎病最早發(fā)現(xiàn)于1967年,經(jīng)過(guò)近四十年的研究,但是至今尚無(wú)專屬的川 崎病診斷方法。目前主要的診斷方法是基于臨床指南中介紹的臨床表現(xiàn)的,如持續(xù)高燒 (39-40°C)超過(guò)五天、手腳末梢出現(xiàn)紅腫、手腳掌或指尖及肛口周圍產(chǎn)生脫皮現(xiàn)象、多形性 紅斑、兩側(cè)性結(jié)膜炎、口腔黏膜變化(如草替舌、口腔咽喉黏膜充血,嘴唇紅腫干裂甚至流 血)、急性非化脈性頸部淋己結(jié)腫大。然而,該種傳統(tǒng)的診斷方法的診斷準(zhǔn)確度十分依賴醫(yī) 生的經(jīng)驗(yàn)。本發(fā)明的目的是綜合患者的臨床表現(xiàn)和醫(yī)院常規(guī)的檢測(cè)生理數(shù)據(jù),實(shí)現(xiàn)一種基 于機(jī)器學(xué)習(xí)的兒童川崎病診斷系統(tǒng)。
[0005] 經(jīng)檢索,目前沒有利用患者臨床表現(xiàn)和檢測(cè)生理數(shù)據(jù)進(jìn)行川崎病和發(fā)燒診斷的公 開專利。在公開文獻(xiàn)中,XuefengB.Ling等人[LingXBl,KanegayeJT,JiJ,PengS,Sato Y,TremouletA,BurnsJC,CohenHJ.Point-of-caredifferentiationofKawasaki diseasefromotherfebrileillnesses.JPediatr.2013Jan; 162 (1):183-188. e3.doi: 10. 1016/j. ^eds. 2012. 06. 012.]提出了一種基于線性鑒別分析的川崎病和發(fā)燒 的鑒別方法。然而,該種方法有兩個(gè)缺點(diǎn);1)分類使用的是線性鑒別分析,屬于線性全局特 征提取方法,無(wú)法充分挖掘隱藏在數(shù)據(jù)中的非線性局部信息;2)所使用的訓(xùn)練方法需要對(duì) 批量數(shù)據(jù)求解一個(gè)廣義特征值問(wèn)題,計(jì)算量較大,不易實(shí)現(xiàn)在線更新。然而,在實(shí)際應(yīng)用中, 如果能將全國(guó)最新的病歷信息及時(shí)添加到模型之中,就可W增加診斷的正確度。
【發(fā)明內(nèi)容】
[0006] 針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明目的是綜合利用患者的臨床表現(xiàn)特征和檢測(cè)生理數(shù) 據(jù),基于機(jī)器學(xué)習(xí),為臨床醫(yī)生診斷川崎病提供一種快速而有效的輔助決策系統(tǒng),從而使患 有川崎病的兒童可w及時(shí)的得到治療,減少發(fā)展成為冠狀動(dòng)脈擴(kuò)張或者動(dòng)脈瘤的概率,減 弱患者的屯、臟血管受到的損傷。
[0007] 為實(shí)現(xiàn)W上目的,本發(fā)明提供一種基于增量局部鑒別子空間嵌入的川崎病和發(fā)燒 診斷系統(tǒng),包含兩個(gè)子系統(tǒng),分別為訓(xùn)練子系統(tǒng)和診斷子系統(tǒng),其中:
[0008] 所述訓(xùn)練子系,從川崎病和普通發(fā)燒兒童的歷史病歷中生成訓(xùn)練用臨床表現(xiàn)和檢 測(cè)生理數(shù)據(jù),然后分析局部結(jié)構(gòu)信息,尋找最優(yōu)的局部鑒別子空間,從而在其中建立川崎病 和發(fā)燒特征模型;此外,當(dāng)獲取了新的患者病歷W后,訓(xùn)練子系統(tǒng)W增量學(xué)習(xí)的方式進(jìn)行模 型更新;
[0009] 所述診斷子系統(tǒng),記錄待診患者的臨床表現(xiàn)和檢測(cè)生理數(shù)據(jù),并根據(jù)訓(xùn)練子系統(tǒng) 得到的川崎病和發(fā)燒特征模型判斷其是否患有川崎病。
[0010] 優(yōu)選地,所述的訓(xùn)練子系統(tǒng)包括;訓(xùn)練患者數(shù)據(jù)生成模塊、基于局部鑒別子空間嵌 入的模型訓(xùn)練模塊、基于增量局部鑒別子空間嵌入的模型更新模塊、訓(xùn)練局部鑒別特征提 取模塊,其中:
[0011] 所述訓(xùn)練患者數(shù)據(jù)生成模塊,從輸入川崎病和發(fā)燒患者病歷數(shù)據(jù)庫(kù)中選擇合適的 川崎病和發(fā)燒患者,從病歷中提取訓(xùn)練所需的臨床表現(xiàn)數(shù)據(jù)和檢測(cè)生理數(shù)據(jù),作為訓(xùn)練數(shù) 據(jù)輸出,然后傳入所述基于局部鑒別子空間嵌入的模型訓(xùn)練模塊;
[0012] 所述基于局部鑒別子空間嵌入的模型訓(xùn)練模塊,使用局部鑒別子空間嵌入方法, 對(duì)訓(xùn)練患者數(shù)據(jù)生成模塊輸出的臨床表現(xiàn)數(shù)據(jù)和檢測(cè)生理數(shù)據(jù)進(jìn)行訓(xùn)練,分析其局部鑒別 信息,輸出最優(yōu)的局部鑒別投影矩陣給基于增量局部鑒別子空間嵌入的模型更新模塊;
[0013] 所述基于增量局部鑒別子空間嵌入的模型更新模塊,利用從新的患者病歷中提取 的新患者的臨床表現(xiàn)和檢測(cè)生理數(shù)據(jù)與基于局部鑒別子空間嵌入的模型訓(xùn)練模塊所得的 局部鑒別投影矩陣,使用增量局部鑒別子空間嵌入方法對(duì)模型進(jìn)行更新,輸出新的最優(yōu)局 部鑒別投影矩陣給訓(xùn)練局部鑒別特征提取模塊;
[0014] 所述訓(xùn)練局部鑒別特征提取模塊,利用基于局部鑒別子空間嵌入的模型訓(xùn)練模塊 或者所述基于增量局部鑒別子空間嵌入的模型更新模塊輸出的局部鑒別投影矩陣,分別將 川崎病患者數(shù)據(jù)和發(fā)燒患者的臨床表現(xiàn)與檢測(cè)生理數(shù)據(jù)從原始數(shù)據(jù)空間投影到低維特征 空間中,投影結(jié)果作為川崎病和發(fā)燒特征模型,輸出用于所述診斷子系統(tǒng)診斷使用。
[0015] 更優(yōu)選地,所述的訓(xùn)練子系統(tǒng)中,所述訓(xùn)練患者數(shù)據(jù)生成模塊中川崎病和發(fā)燒患 者選擇標(biāo)準(zhǔn)優(yōu)選為對(duì)川崎病兒童,發(fā)燒超過(guò)3天,出現(xiàn)了 4-5種典型的川崎病癥狀,或者少 于=種癥狀,但是已經(jīng)出現(xiàn)了冠狀動(dòng)脈異常;對(duì)普通的發(fā)燒兒童,出現(xiàn)一種川崎病癥狀的。
[0016] 更優(yōu)選地,所述的訓(xùn)練子系統(tǒng)中,訓(xùn)練患者數(shù)據(jù)生成模塊的訓(xùn)練數(shù)據(jù)包括臨床表 現(xiàn)數(shù)據(jù)和檢測(cè)生理數(shù)據(jù)兩種;
[0017] 所述臨床表現(xiàn)數(shù)據(jù)包括;過(guò)去24小時(shí)的體溫、結(jié)膜充血、極端變化(包括紅,腫,脫 皮或手或腳)、口咽的變化(包括咽紅、紅,裂開的嘴唇或草替舌)、至少1. 5厘米頸部淋己 結(jié)、皮疹、疾病的天數(shù),其中;體溫使用過(guò)去24小時(shí)所測(cè)體溫的均值表示,疾病的天數(shù)為整 數(shù),其他臨床表現(xiàn)數(shù)據(jù)為1,表明患者有該癥狀,為0表示患者沒有該癥狀;
[0018] 所述檢測(cè)生理數(shù)據(jù)包括:白細(xì)胞總數(shù)、單核細(xì)胞百分比、淋己細(xì)胞、嗜酸性粒細(xì) 胞、嗜中性粒細(xì)胞、未成熟的嗜中性粒細(xì)胞、血小板數(shù)、年齡標(biāo)準(zhǔn)化的血紅蛋白(HGB)濃度、 C-反應(yīng)性蛋白、丫-谷氨酷轉(zhuǎn)移酶、丙氨酸氨基轉(zhuǎn)移酶、紅細(xì)胞沉降率,所述檢測(cè)生理數(shù)據(jù) 均直接使用原始的儀器輸出結(jié)果;
[0019] 合并每一個(gè)患者的臨床表現(xiàn)數(shù)據(jù)和檢測(cè)生理數(shù)據(jù)并保存在一個(gè)列向量中,則所有 患者的所述訓(xùn)練數(shù)據(jù)可W表示為數(shù)據(jù)集:
[0020] 耗,£,.膽1,
[00川其中;x為第i個(gè)患者數(shù)據(jù),ti為第i個(gè)患者的標(biāo)簽,n表示患者的數(shù)目,1代表川 崎病,0代表普通發(fā)燒;記X= [XI,X2,…,X。]為訓(xùn)練數(shù)據(jù)矩陣。
[0022] 更優(yōu)選地,所述的訓(xùn)練子系統(tǒng)中,基于局部鑒別子空間嵌入的模型訓(xùn)練模塊的局 部鑒別子空間嵌入的任務(wù)是在原始的患者原始臨床表現(xiàn)和檢測(cè)生理數(shù)據(jù)中分析訓(xùn)練數(shù)據(jù) 的局部結(jié)構(gòu)信息,尋找最優(yōu)的局部鑒別子空間,確定最優(yōu)的局部鑒別投影矩陣。
[0023] 更優(yōu)選的,所述最優(yōu)的局部鑒別投影矩陣的確定過(guò)程包括W下幾個(gè)步驟:
[0024] 1)對(duì)每一個(gè)患者數(shù)據(jù)Xi,尋找其類內(nèi)近鄰NNi(Xi)和類間近鄰NNc(X