i),然后構(gòu)建數(shù) 據(jù)集的本征圖G和懲罰圖G';
[0025] 2)計算本征圖G和懲罰圖G'的中每條鄰接邊的權(quán)重,并生成鄰接權(quán)重矩陣S和 Sp;
[0026] 3)計算本征圖G和懲罰圖G'的拉普拉斯矩陣L和Lp,及其索引矩陣L'和L'P;
[0027]4)計算H=XL',Hp=化'。,的列數(shù)記為N。;
[002引 5)運
【主權(quán)項】
1. 一種基于增量局部鑒別子空間嵌入的川崎病和發(fā)燒診斷系統(tǒng),其特征在于,包含兩 個子系統(tǒng),分別為訓(xùn)練子系統(tǒng)和診斷子系統(tǒng),其中: 所述訓(xùn)練子系,從川崎病和普通發(fā)燒兒童的歷史病歷中生成訓(xùn)練用臨床表現(xiàn)和檢測生 理數(shù)據(jù),然后分析局部結(jié)構(gòu)信息,尋找最優(yōu)的局部鑒別子空間,從而在其中建立川崎病和發(fā) 燒特征模型;此外,當(dāng)獲取了新的患者病歷以后,訓(xùn)練子系統(tǒng)以增量學(xué)習(xí)的方式進行模型更 新; 所述診斷子系統(tǒng),記錄待診患者的臨床表現(xiàn)和檢測生理數(shù)據(jù),并根據(jù)訓(xùn)練子系統(tǒng)得到 的川崎病和發(fā)燒特征模型判斷其是否患有川崎病。
2. 根據(jù)權(quán)利要求1所述的一種基于增量局部鑒別子空間嵌入的川崎病和發(fā)燒診斷系 統(tǒng),其特征在于,所述的訓(xùn)練子系統(tǒng)包括:訓(xùn)練患者數(shù)據(jù)生成模塊、基于局部鑒別子空間嵌 入的模型訓(xùn)練模塊、基于增量局部鑒別子空間嵌入的模型更新模塊、訓(xùn)練局部鑒別特征提 取模塊,其中: 所述訓(xùn)練患者數(shù)據(jù)生成模塊,從輸入川崎病和發(fā)燒患者病歷數(shù)據(jù)庫中選擇合適的川崎 病和發(fā)燒患者,從病歷中提取訓(xùn)練所需的臨床表現(xiàn)數(shù)據(jù)和檢測生理數(shù)據(jù),作為訓(xùn)練數(shù)據(jù)輸 出,然后傳入所述基于局部鑒別子空間嵌入的模型訓(xùn)練模塊; 所述基于局部鑒別子空間嵌入的模型訓(xùn)練模塊,使用局部鑒別子空間嵌入方法,對訓(xùn) 練患者數(shù)據(jù)生成模塊輸出的臨床表現(xiàn)數(shù)據(jù)和檢測生理數(shù)據(jù)進行訓(xùn)練,分析其局部鑒別信 息,輸出最優(yōu)的局部鑒別投影矩陣給基于增量局部鑒別子空間嵌入的模型更新模塊; 所述基于增量局部鑒別子空間嵌入的模型更新模塊,利用從新的患者病歷中提取的新 患者的臨床表現(xiàn)與檢測生理數(shù)據(jù)與基于局部鑒別子空間嵌入的模型訓(xùn)練模塊所得的局部 鑒別投影矩陣,使用增量局部鑒別子空間嵌入方法對模型進行更新,輸出新的最優(yōu)局部鑒 別投影矩陣給訓(xùn)練局部鑒別特征提取模塊; 所述訓(xùn)練局部鑒別特征提取模塊,利用基于局部鑒別子空間嵌入的模型訓(xùn)練模塊或者 所述基于增量局部鑒別子空間嵌入的模型更新模塊輸出的局部鑒別投影矩陣,分別將川崎 病患者數(shù)據(jù)和發(fā)燒患者的臨床表現(xiàn)與檢測生理數(shù)據(jù)從原始數(shù)據(jù)空間投影到低維特征空間 中,投影結(jié)果作為川崎病和發(fā)燒特征模型,輸出用于所述診斷子系統(tǒng)診斷使用。
3. 根據(jù)權(quán)利要求2所述的一種基于增量局部鑒別子空間嵌入的川崎病和發(fā)燒診斷系 統(tǒng),其特征在于,所述的訓(xùn)練子系統(tǒng)中: 訓(xùn)練患者數(shù)據(jù)生成模塊中川崎病和發(fā)燒患者選擇標(biāo)準(zhǔn)為:對川崎病兒童,發(fā)燒超過3 天,出現(xiàn)了 4-5種典型的川崎病癥狀,或者少于三種癥狀,但是已經(jīng)出現(xiàn)了冠狀動脈異常; 對普通的發(fā)燒兒童,出現(xiàn)一種川崎病癥狀的; 訓(xùn)練患者數(shù)據(jù)生成模塊提取的訓(xùn)練數(shù)據(jù)包括臨床表現(xiàn)數(shù)據(jù)和檢測生理數(shù)據(jù),所述臨床 表現(xiàn)數(shù)據(jù)包括過去24小時的體溫、結(jié)膜充血、極端變化、口咽的變化、至少1. 5厘米頸部淋 巴結(jié)、皮瘆、疾病的天數(shù),其中:體溫使用過去24小時所測體溫的均值表示;疾病的天數(shù)為 整數(shù);其他臨床表現(xiàn)數(shù)據(jù)為1,表明患者有該癥狀,為〇表示患者沒有該癥狀;所述檢測生理 數(shù)據(jù)包括白細胞總數(shù)、單核細胞百分比、淋巴細胞、嗜酸性粒細胞、嗜中性粒細胞、未成熟的 嗜中性粒細胞、血小板數(shù)、年齡標(biāo)準(zhǔn)化的血紅蛋白HGB濃度、C-反應(yīng)性蛋白、γ -谷氨酰轉(zhuǎn) 移酶、丙氨酸氨基轉(zhuǎn)移酶、紅細胞沉降率,所述檢測生理數(shù)據(jù)均直接使用原始的儀器輸出結(jié) 果; 合并每一個患者的所述臨床表現(xiàn)數(shù)據(jù)和所述檢測生理數(shù)據(jù)并保存在一個列向量中,則 所有患者的訓(xùn)練數(shù)據(jù)表示為數(shù)據(jù)集: {義", 其中:Xi是第i個患者數(shù)據(jù),t i是第i個患者的標(biāo)簽,η表示患者的數(shù)目,1代表川崎病, 〇代表普通發(fā)燒;記X = [X1, x2,…,xn]為訓(xùn)練數(shù)據(jù)矩陣。
4. 根據(jù)權(quán)利要求2所述的一種基于增量局部鑒別子空間嵌入的川崎病和發(fā)燒診斷系 統(tǒng),其特征在于,所述的訓(xùn)練子系統(tǒng)中,基于局部鑒別子空間嵌入的模型訓(xùn)練模塊的局部鑒 別子空間嵌入的任務(wù)是在患者的原始臨床表現(xiàn)和檢測生理數(shù)據(jù)中分析訓(xùn)練數(shù)據(jù)的局部結(jié) 構(gòu)信息,尋找最優(yōu)的局部鑒別子空間,確定最優(yōu)的局部鑒別投影矩陣W ; 最優(yōu)的局部鑒別投影矩陣W的確定過程包括以下幾個步驟: 1) 對每一個患者數(shù)據(jù)Xi,尋找其類內(nèi)近鄰NN1 (Xi)和類間近鄰NNe(Xi),然后構(gòu)建數(shù)據(jù)集 的本征圖G和懲罰圖C ; 2) 計算本征圖G和懲罰圖C的中每條鄰接邊的權(quán)重,并生成鄰接權(quán)重矩陣S和Sp; 3) 計算本征圖G和懲罰圖G'的拉普拉斯矩陣L*LP,及其索引矩陣L'和L' p; 4) 計算H = XL',Hp= XL' p,Hp的列數(shù)記為Np; 5) 設(shè)
.計算奇異值分解,K = FRQT,R的秩記為t = rank(R); 6) 提取所得到的左奇異向量矩陣F的前%行、前t列,并計算其奇異值分解,F(xiàn)(1:NP; l:t) =JXE; 7) 計算廣義奇異值分解的右奇異向量矩陣Z:
,其中IT1是步驟5)所得 的奇異值矩陣R的逆,E是步驟6)中所得的右奇異值向量矩陣,I是單位陣;最優(yōu)的局部鑒 別投影矩陣W為Z的前r列。
5. 根據(jù)權(quán)利要求4所述的一種基于增量局部鑒別子空間嵌入的川崎病和發(fā)燒診斷系 統(tǒng),其特征在于,所述確定過程中: \的類內(nèi)近鄰和類間近鄰分別定義為在中心為Xi、半徑為ε JP ε 2的球鄰域中的川崎 病患者和發(fā)燒患者數(shù)據(jù),即 NN1 (Xi) = {Xj I I I Xj-Xi I 12< ε 1; ti= t j} NNe (Xi) = {xj I I I Xj-Xi I 12< ε 2, t j}, 其中,\和^_為患者數(shù)據(jù),為對應(yīng)的標(biāo)簽,ε JP ε 2的取值規(guī)則是訓(xùn)練數(shù)據(jù)集 中所有樣本和其第三的類內(nèi)和類間最近鄰距離的平均值; 數(shù)據(jù)集的本征圖G和懲罰圖G'分別節(jié)點和鄰接邊構(gòu)成:全體數(shù)據(jù)集中的每一個樣本 均為一個節(jié)點;本征圖G中,如果兩個樣本之間存在類內(nèi)鄰域關(guān)系,則其之間存在鄰接邊; 懲罰圖C中,如果兩個樣本之間存在類間鄰域關(guān)系,則其之間存在鄰接邊;本征圖G中的 鄰接邊是需要保持的本征特征,即在嵌入的低維空間中需要強化的同類患者數(shù)據(jù)之間的相 似關(guān)系;懲罰圖G'中的鄰接邊在數(shù)據(jù)的聚類結(jié)構(gòu)中具有鑒別性,用于避免在嵌入的低維 空間中不同類患者的數(shù)據(jù)之間的距離太近;因而,本征圖G和鄰接圖的定義有助于提高本 發(fā)明對川崎病和發(fā)燒患者數(shù)據(jù)的區(qū)分能力; 構(gòu)建鄰接權(quán)重矩陣是指在本征圖G和懲罰圖G'中分別為患者數(shù)據(jù)集中的每一對樣本 計算鄰接權(quán)重;如果兩樣本之間沒有鄰接邊,那么它們的鄰接權(quán)重為〇 ;如果兩樣本之間存 在鄰接邊,那么它們的權(quán)重通過熱核計算,即:
本征圖G和懲罰圖C的拉普拉斯矩陣L和1^是L = S-D和L p= S P-DP,其中D和Dp 均為對角陣,其對角線元素分別為S和Sp的行和,即D "= Σ D p>ii= Σ #p, V所述索 引矩陣L'和L' 5分別構(gòu)成拉普拉斯矩陣L*LP的一種分解形式,即L = L 'L '3PLp = L' PL' ρτ,其中,L'和L' p中的每一列對應(yīng)于S和上三角矩陣中的一個正元素,實際 上也就是對應(yīng)于患者樣本之間的一個鄰接關(guān)系;L'和L' 5的列數(shù)分別等于S*SP的上三 角矩陣中的正元素數(shù)目N和Nn;具體的,S中的一個正元素 S "對應(yīng)的索引矩陣中的列為:
那么,L' = [Il1, Il2,…,riN],類似的根據(jù)Sp計算L' p; 第4)到7)步的作用是求解由拉普拉斯矩陣L和Lp確定的一個基于圖約束的優(yōu)化問 題,即 J (w) = minwwTXLXTw