本發(fā)明涉及醫(yī)療大數(shù)據(jù)領(lǐng)域,具體涉及一種基于醫(yī)療大數(shù)據(jù)的患者畫像方法及裝置。
背景技術(shù):
目前我國大醫(yī)院的門診和急診量非常大,值診醫(yī)生僅有5-6分鐘就需要接待一名患者,醫(yī)生雖然有強(qiáng)烈的意愿去全面了解患者情況,但是受制于時(shí)間和精力以及患者醫(yī)學(xué)知識(shí)的局限性,醫(yī)生往往還未能全面交流、認(rèn)識(shí)患者的個(gè)體情況下,憑經(jīng)驗(yàn)開出檢查單或處方,即制定醫(yī)療方案時(shí)并不能充分考慮患者個(gè)體情況做出準(zhǔn)確的判斷。醫(yī)生超負(fù)荷工作,患者不理解,無形中造成醫(yī)患關(guān)系緊張。
當(dāng)前,隨著我國醫(yī)療機(jī)構(gòu)的衛(wèi)生信息化建設(shè)日益完善,各類信息系統(tǒng)如HIS/EMR、LIS、RIS/PACS等已經(jīng)廣泛應(yīng)用于各級(jí)醫(yī)院,各類醫(yī)療設(shè)備和儀器也已經(jīng)全面數(shù)字化,從而使得醫(yī)療數(shù)據(jù)呈爆炸式增長,目前醫(yī)療機(jī)構(gòu)已經(jīng)積累了海量醫(yī)療數(shù)據(jù),這為基于醫(yī)療大數(shù)據(jù)的患者畫像提供了基礎(chǔ)。
患者畫像,即患者信息標(biāo)簽化,就是通過收集患者個(gè)體人口信息及臨床治療、定期體檢、公共衛(wèi)生、婦幼保健、慢病監(jiān)測等醫(yī)療業(yè)務(wù)過程中產(chǎn)生的大量電子健康檔案、電子病歷、體檢報(bào)告等大量數(shù)據(jù),通過模型算法從中抽取患者個(gè)體特征,從而形成一個(gè)標(biāo)簽化的患者模型。通過患者畫像,醫(yī)生能在極短的時(shí)間內(nèi)全面了解患者個(gè)體情況,能有的放矢地進(jìn)行溝通,對(duì)用藥和治療方案做出準(zhǔn)確判斷,既能避免醫(yī)療事故的發(fā)生,減輕醫(yī)生工作負(fù)荷,又能改善醫(yī)患關(guān)系。
目前通用的用戶畫像方法主要是通過分析用戶的注冊信息和用戶的上網(wǎng)行為來為用戶打上標(biāo)簽,而這種畫像的方法并不適用于醫(yī)療領(lǐng)域,它存在以下的不足:1、準(zhǔn)確度不夠,醫(yī)療是一個(gè)嚴(yán)謹(jǐn)?shù)倪^程,需要一個(gè)更為精確的模型來提取患者標(biāo)簽;2、用戶畫像只考慮標(biāo)簽特征的衰減因子,而患者畫像既要考慮衰減因子,又要考慮隨著年齡增長而出現(xiàn)的增強(qiáng)因子,還要考慮疾病伴隨因子;3、通用用戶畫像系統(tǒng)沒有讓用戶參與到其中來,而患者畫像是直接面向患者個(gè)體,需要患者全程參與到系統(tǒng)中來,從而才能使畫像逐步改善,逐步提高準(zhǔn)確性;4、用戶隱私保護(hù),通用的用戶畫像系統(tǒng)并沒有充分考慮這一問題,但是患者的醫(yī)療信息是比較敏感的,系統(tǒng)需要確?;颊唠[私不被非法利用。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)階段“值診醫(yī)生沒法快速讀懂患者”問題,本發(fā)明提供了一種基于醫(yī)療大數(shù)據(jù)的患者畫像方法及裝置。通過構(gòu)建精確的患者畫像,輔助醫(yī)生快速、準(zhǔn)確了解患者的個(gè)體情況,從而為患者提供針對(duì)性的優(yōu)質(zhì)醫(yī)療服務(wù)。
本發(fā)明提供了一種基于醫(yī)療大數(shù)據(jù)的患者畫像方法,包括:
獲取患者個(gè)人人口信息、電子健康檔案、電子病歷、體檢報(bào)告、健康監(jiān)測等醫(yī)療數(shù)據(jù),并對(duì)其進(jìn)行預(yù)處理。
建立臨床知識(shí)庫,包括共性知識(shí)、疾病分類、醫(yī)學(xué)術(shù)語、病因、伴生病、發(fā)病機(jī)制、臨床表現(xiàn)、并發(fā)癥、藥物不良反應(yīng)等,以及上述信息之間的多維關(guān)聯(lián)信息。
構(gòu)建患者基本信息標(biāo)簽:通過人口信息、體檢報(bào)告、電子健康檔案等數(shù)據(jù),提取包括患者性別、年齡、血型、職業(yè)(特殊職業(yè))、過敏史、計(jì)劃免疫、婦幼保健等標(biāo)簽。
構(gòu)建患者疾病標(biāo)簽:通過電子病歷、電子健康檔案、檢查檢驗(yàn)等抽取的信息結(jié)合臨床知識(shí)庫建立疾病分析模型,獲得患者既往疾病史、慢性病、疾病狀況、伴生病等標(biāo)簽。
構(gòu)建患者不良藥物反應(yīng)及用藥禁忌標(biāo)簽:針對(duì)患者過敏史、藥物不良反應(yīng)史、所患疾?。ㄌ貏e是肝腎)、懷孕哺乳情況、特殊職業(yè)(高空作業(yè)運(yùn)動(dòng)員)、兩周內(nèi)用藥等信息構(gòu)建用藥不良反應(yīng)及禁忌標(biāo)簽。
構(gòu)建患者疾病預(yù)測標(biāo)簽:將疾病標(biāo)簽、個(gè)體屬性、疾病歷史組合作為一個(gè)輸入向量,然后根據(jù)輸入向量確定患者的轉(zhuǎn)移矩陣,采用隨機(jī)森林方式預(yù)測患者轉(zhuǎn)移到下一個(gè)疾病的概率,構(gòu)建疾病預(yù)測標(biāo)簽。
計(jì)算患者標(biāo)簽數(shù)據(jù):對(duì)患者畫像標(biāo)簽的權(quán)重、疾病風(fēng)險(xiǎn)因子、標(biāo)簽增衰因子、疾病關(guān)聯(lián)因子進(jìn)行計(jì)算處理。
患者線上標(biāo)簽確認(rèn):考慮到醫(yī)療領(lǐng)域是一個(gè)嚴(yán)謹(jǐn)?shù)念I(lǐng)域,在患者畫像初步完成后,患者可以通過互聯(lián)網(wǎng)對(duì)自己的畫像標(biāo)簽進(jìn)行糾錯(cuò)和調(diào)整,從而提高患者畫像的精確度。
完成畫像,為醫(yī)療服務(wù)提供調(diào)用接口。
本發(fā)明提供了一種基于醫(yī)療大數(shù)據(jù)的患者畫像裝置,包括:
患者數(shù)據(jù)獲取模塊:該模塊獲取信息包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)兩類,結(jié)構(gòu)化數(shù)據(jù)包括人口信息、HIS/EMR、LIS、EHR、RIS/PACS 等,非結(jié)構(gòu)化數(shù)據(jù)包括影像、病歷文檔、臨床指南、文獻(xiàn)知識(shí)等。
數(shù)據(jù)預(yù)處理模塊:在獲取數(shù)據(jù)后需要對(duì)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、過濾,然后對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化、標(biāo)準(zhǔn)化、向量化處理。
患者標(biāo)簽計(jì)算提取模塊:提取患者標(biāo)簽,包括患者基本信息標(biāo)簽、患者疾病標(biāo)簽、不良藥物反應(yīng)及用藥禁忌標(biāo)簽、疾病預(yù)測標(biāo)簽,提取標(biāo)簽后對(duì)標(biāo)簽的權(quán)重、疾病風(fēng)險(xiǎn)因子、增衰因子、關(guān)聯(lián)因子進(jìn)行計(jì)算。
患者標(biāo)簽在線確認(rèn)模塊:患者可以通過畫像裝置提供的服務(wù),對(duì)自己畫像進(jìn)行進(jìn)一步調(diào)整,使得患者畫像的精確度得到進(jìn)一步提升。
基于區(qū)塊鏈的患者隱私保護(hù)模塊:使用區(qū)塊鏈技術(shù),讓患者畫像的數(shù)據(jù)管理區(qū)中心化和匿名化,從技術(shù)手段上對(duì)患者隱私進(jìn)行保護(hù)。
患者畫像服務(wù)調(diào)用模塊:服務(wù)調(diào)用方式主要包括Web GUI、WebService、Web API等。
與普通用戶畫像方法及裝置相比,本發(fā)明具有以下優(yōu)勢:首先標(biāo)簽體系提取和計(jì)算是建立在醫(yī)學(xué)知識(shí)庫的基礎(chǔ)上,有很強(qiáng)的專業(yè)性,因此使得患者畫像系統(tǒng)的精確性得到很大程度上的提高;其次,考慮了標(biāo)簽特征的風(fēng)險(xiǎn)因子、增衰因子和關(guān)聯(lián)因子,更符合疾病發(fā)展規(guī)律;再者,讓患者參與到畫像的確認(rèn)和管理中來,解決了標(biāo)簽的計(jì)算偏差;最后在患者畫像數(shù)據(jù)的個(gè)人隱私方面引入了區(qū)塊鏈技術(shù),從技術(shù)上降低了敏感醫(yī)療數(shù)據(jù)泄露的風(fēng)險(xiǎn)。
附圖說明
圖1 示出了本發(fā)明一實(shí)施例的患者畫像構(gòu)建的流程圖;
圖2 示出了本發(fā)明一實(shí)施例的患者畫像裝置的示意圖。
具體實(shí)施方式
本發(fā)明提供了一種基于醫(yī)療大數(shù)據(jù)的患者畫像方法及裝置,通過建立專業(yè)的醫(yī)療臨床知識(shí)庫,在此基礎(chǔ)上采用新的計(jì)算模型和方法構(gòu)建患者標(biāo)簽,解決了通用用戶畫像精確度不夠,不適合于醫(yī)療領(lǐng)域應(yīng)用以及患者個(gè)人隱私保護(hù)困難等問題。
為了使本發(fā)明的目的、方法以及優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施方式做進(jìn)一步詳細(xì)描述。
實(shí)施例一
本發(fā)明實(shí)施例提供了一種基于醫(yī)療大數(shù)據(jù)的患者畫像方法,現(xiàn)結(jié)合流程圖對(duì)本發(fā)明方法進(jìn)行詳細(xì)解釋說明。參見圖1,本實(shí)施例提供方法的流程包括:
步驟S1:獲取預(yù)處理數(shù)據(jù),從數(shù)據(jù)源中抽取患者相關(guān)信息,主要數(shù)據(jù)源及抽取信息包括以下幾個(gè)部分:
市民卡、醫(yī)保卡,抽取包括患者個(gè)人人口信息,包括姓名、性別、年齡、職業(yè)、出生地、居住地、家庭成員、工作單位。
健康檔案:提取數(shù)據(jù)包括血型、計(jì)劃免疫、過敏史、婦幼保健、慢性病、傳染病、體檢信息等。
電子病歷:提取數(shù)據(jù)包括門診記錄、急診記錄、住院記錄、處方信息、檢查檢驗(yàn)信息、輸血信息、手術(shù)信息等。
在提取源數(shù)據(jù)后,將數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、過濾,并對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化、標(biāo)準(zhǔn)化、向量化處理,最后導(dǎo)入到MongoDB數(shù)據(jù)存儲(chǔ)集群。
步驟S2:建立臨床知識(shí)庫,將疾病共性知識(shí)、疾病分類、醫(yī)學(xué)術(shù)語、病因、伴生病、發(fā)病機(jī)制、臨床表現(xiàn)、并發(fā)癥、藥物不良反應(yīng)醫(yī)學(xué)信息寫入臨床知識(shí)庫,同時(shí)將MongoDB數(shù)據(jù)存儲(chǔ)集群中的數(shù)據(jù)導(dǎo)入到Spark集群進(jìn)行分析,找出疾病種類和發(fā)病率、疾病種類和臨床表現(xiàn)、疾病和伴生病關(guān)系、疾病導(dǎo)致的并發(fā)癥、疾病和發(fā)病機(jī)制關(guān)系、疾病和治療結(jié)果關(guān)系、檢查結(jié)果和疾病的關(guān)系、疾病和使用的藥物等發(fā)生的規(guī)律,生成多維關(guān)聯(lián)信息,最后將分析的結(jié)果寫回到臨床知識(shí)庫。
步驟S3:構(gòu)建患者人口基本信息標(biāo)簽,通過人口信息、體檢報(bào)告、電子健康檔案等數(shù)據(jù),提取包括患者性別、年齡、血型、職業(yè)、過敏史、計(jì)劃免疫、婦幼保健等標(biāo)簽;
步驟S4:構(gòu)建患者疾病標(biāo)簽,通過電子健康檔案、電子病歷、檢查檢驗(yàn)等抽取的信息結(jié)合臨床知識(shí)庫建立疾病分析模型。通過基于粗糙集的疾病特征相似度匹配得到疾病史、疾病狀況、伴生病等標(biāo)簽;通過基于聚類分析的慢性病分析模型得到患者慢性病標(biāo)簽。
步驟S5:構(gòu)建患者不良藥物反應(yīng)及用藥禁忌標(biāo)簽,這類標(biāo)簽主要分為四類,一、針對(duì)患者對(duì)某種藥或某些物質(zhì)發(fā)生過敏和異常反應(yīng)給出藥物過敏和不良反應(yīng)藥物標(biāo)簽。二、針對(duì)患者所患疾病用藥禁忌標(biāo)簽,比如肝腎疾病,這類患者肝腎功能不良,一些藥品對(duì)對(duì)肝腎功能影響較大,需要給出用藥禁忌標(biāo)簽;比如糖尿病患者,需要給出用藥避免含糖量高的禁忌標(biāo)簽;再比如孕婦和哺乳期婦女,應(yīng)該給出“孕婦慎用”,“哺乳期慎用”等標(biāo)簽;三、重復(fù)用藥標(biāo)簽,主要是針對(duì)兩周內(nèi)正在服用藥品,如果其中有藥品特別容易和其他藥品發(fā)生重復(fù)用藥危險(xiǎn)的需要給出禁忌標(biāo)簽;四、特殊職業(yè)用藥禁忌標(biāo)簽,主要是針對(duì)公交車司機(jī)、高空作業(yè)、職業(yè)運(yùn)動(dòng)員用藥禁忌標(biāo)簽。
步驟S6:構(gòu)建患者疾病預(yù)測標(biāo)簽,將疾病標(biāo)簽、個(gè)體屬性、疾病歷史、臨床知識(shí)庫多維關(guān)聯(lián)信息組合作為一個(gè)輸入向量,然后根據(jù)輸入向量確定患者的轉(zhuǎn)移矩陣,采用隨機(jī)森林方式預(yù)測患者轉(zhuǎn)移到下一個(gè)疾病的概率,構(gòu)建疾病預(yù)測標(biāo)簽。
步驟S7:計(jì)算患者標(biāo)簽數(shù)據(jù),這一步需要對(duì)上述標(biāo)簽的權(quán)重、疾病危險(xiǎn)因子、增衰因子及疾病標(biāo)簽關(guān)聯(lián)因子進(jìn)行計(jì)算。其中標(biāo)簽權(quán)重需要根據(jù)臨床知識(shí)庫和患者個(gè)體情況給出權(quán)重;疾病危險(xiǎn)因子需要針對(duì)患者所患疾病狀況、過往疾病史、診療方案、發(fā)病機(jī)理等得出危險(xiǎn)因子;增衰因子,主要根據(jù)疾病類型、時(shí)間、標(biāo)簽行為類型確定為[0.8,1.2]小數(shù),例如慢性病加上患者年紀(jì)因素,標(biāo)簽不衰減反而增強(qiáng),如果標(biāo)簽行為類型為科研行為,則標(biāo)簽就不進(jìn)行衰減計(jì)算;疾病標(biāo)簽關(guān)聯(lián)因子計(jì)算主要根據(jù)臨床知識(shí)庫中的多維關(guān)聯(lián)信息結(jié)合患者個(gè)體計(jì)算得出。
步驟S8:患者線上標(biāo)簽確認(rèn),通過以上7個(gè)步驟完成初步患者畫像,由于通過大數(shù)據(jù)運(yùn)算,患者標(biāo)簽以及標(biāo)簽權(quán)重危險(xiǎn)因子具有一定的不確定性,最終需要患者通過人工方式對(duì)標(biāo)簽進(jìn)行管理,患者也可以根據(jù)個(gè)人具體狀況對(duì)標(biāo)簽權(quán)重、風(fēng)險(xiǎn)因子、增衰因子、關(guān)聯(lián)因子進(jìn)行相應(yīng)的調(diào)整,最終把患者畫像的精確度調(diào)整到一個(gè)最高的狀態(tài),從而完成患者畫像。
實(shí)施例二
本發(fā)明實(shí)施例提供了一種基于醫(yī)療大數(shù)據(jù)的患者畫像裝置,現(xiàn)結(jié)合裝置系統(tǒng)架構(gòu)圖對(duì)該裝置進(jìn)行詳細(xì)解描述,參見圖2。
處于整個(gè)裝置最底層是數(shù)據(jù)源,數(shù)據(jù)源包括人口信息、HIS、LIS、電子健康檔案、電子病歷、RIS/PACS等結(jié)構(gòu)化數(shù)據(jù),以及醫(yī)學(xué)影像、文獻(xiàn)知識(shí)、臨床指南等非結(jié)構(gòu)化數(shù)據(jù)。由于每個(gè)數(shù)據(jù)源的組織結(jié)構(gòu)以及存儲(chǔ)方式都不太一樣,因此針對(duì)不同數(shù)據(jù)源的數(shù)據(jù)獲取采用的技術(shù)方式包括數(shù)據(jù)探頭、數(shù)據(jù)抓取、文件解析、數(shù)據(jù)庫導(dǎo)入等進(jìn)行獲取,獲取數(shù)據(jù)之后對(duì)數(shù)據(jù)進(jìn)行清洗/過濾、轉(zhuǎn)換、結(jié)構(gòu)化、標(biāo)準(zhǔn)化、向量化處理。離線數(shù)據(jù)在進(jìn)行預(yù)處理之后存入群,對(duì)于在線數(shù)據(jù)采用Storm流式處理框架進(jìn)行實(shí)時(shí)計(jì)算處理,最后統(tǒng)一存入MongoDB存儲(chǔ)集群。
在數(shù)據(jù)獲取和預(yù)處理的基礎(chǔ)上,系統(tǒng)將臨床知識(shí)庫和患者個(gè)人醫(yī)療數(shù)據(jù)經(jīng)由Spark導(dǎo)入并分析,從分析結(jié)果中提取患者標(biāo)簽并對(duì)標(biāo)簽進(jìn)行包括權(quán)重、疾病風(fēng)險(xiǎn)因子、增衰因子、關(guān)聯(lián)因子計(jì)算,其中分析結(jié)果存入關(guān)系數(shù)據(jù)庫MySQL中,標(biāo)簽數(shù)據(jù)存入內(nèi)存數(shù)據(jù)庫Redis。
在初步完成患者畫像后,需要患者本人參與到患者畫像的確認(rèn)和管理中,患者畫像確認(rèn)模塊主要是給患者提供在線服務(wù),通過該模塊患者可以根據(jù)自身實(shí)際情況進(jìn)行調(diào)整,比如患者某種疾病已經(jīng)痊愈,患者可以把標(biāo)簽刪除或者把參數(shù)降低,反之患者覺得嚴(yán)重了或者出現(xiàn)新的疾病,患者可以添加標(biāo)簽或調(diào)整參數(shù)。同時(shí)通過畫像的確認(rèn),也可以讓患者自己更加簡明和通俗地去了解自己身體的健康狀態(tài),特別是疾病預(yù)測標(biāo)簽,患者在參考疾病預(yù)測標(biāo)簽后就會(huì)對(duì)自己的日常生活做出調(diào)整,比如加強(qiáng)身體特定部位鍛煉、控制飲食種類、加強(qiáng)某些營養(yǎng)補(bǔ)充等。
在患者確認(rèn)完畫像之后,患者畫像就完成并可以交付醫(yī)療機(jī)構(gòu)使用了,但是在這之前還需要隱私保護(hù)模塊對(duì)患者畫像數(shù)據(jù)進(jìn)行保護(hù)?;颊唠[私保護(hù)在本發(fā)明中除了常規(guī)保護(hù)技術(shù)手段比如訪問控制、數(shù)據(jù)加密、匿名化、審計(jì)等之外,本裝置還利用了區(qū)塊鏈技術(shù),讓患者畫像數(shù)據(jù)以及畫像管理數(shù)據(jù)去中心化,采用共識(shí)模型提供一個(gè)可信任的環(huán)境,使得數(shù)據(jù)交換過程不被篡改,交換歷史記錄不可被篡改。在訪問控制上將畫像數(shù)據(jù)掛到區(qū)塊鏈上,分配一個(gè)組合的private key,由醫(yī)生、診斷設(shè)備、醫(yī)療機(jī)構(gòu)管理部門還有患者本人共同持有key的不同部分,只有患者本人private key遇到了上面任何一方,才能授權(quán)訪問隱私數(shù)據(jù)。
患者畫像和系統(tǒng)應(yīng)用主要是通過對(duì)外服務(wù)接口提供,目前主要有三種方式包括Web GUI、WebService、Web API,醫(yī)療機(jī)構(gòu)、患者個(gè)人、健康咨詢公司以及醫(yī)保等部門,同構(gòu)服務(wù)接口,可以將患者畫像服務(wù)無縫連接到各自的應(yīng)用中去。
綜上所述,本發(fā)明基于醫(yī)療大數(shù)據(jù)構(gòu)建患者畫像的方法及裝置,主要應(yīng)用醫(yī)療領(lǐng)域,通過患者畫像從數(shù)據(jù)中讀懂患者,讓醫(yī)生更加簡便快捷地去認(rèn)識(shí)患者,既能減輕醫(yī)生工作負(fù)荷又能改善醫(yī)患關(guān)系。同時(shí)患者畫像可以更廣泛應(yīng)用于個(gè)性化治療定制、智能輔助醫(yī)療、醫(yī)療科研、疾病早期預(yù)警、精準(zhǔn)醫(yī)療等領(lǐng)域,轉(zhuǎn)變以疾病為中心醫(yī)療模式到以患者為中心醫(yī)療模式。
以上所述,僅是本發(fā)明的在醫(yī)療領(lǐng)域較佳實(shí)施例而已,并非是對(duì)本發(fā)明作其它形式的限制,任何熟悉本專業(yè)的技術(shù)人員可能利用上述揭示的技術(shù)內(nèi)容加以變更或改型為等同變化的等效實(shí)施例應(yīng)用于其它領(lǐng)域,但是凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡單修改、等同變化與改型,仍屬于本發(fā)明技術(shù)方案的保護(hù)范圍。