本發(fā)明涉及醫(yī)療信息領域,更具體地,涉及一種智能結構化搜索系統(tǒng)及其搜索方法。
背景技術:
隨著信息技術的發(fā)展和醫(yī)療信息化的建設,現在醫(yī)院及各種醫(yī)療機構早已實施了各類信息化系統(tǒng)軟件,如“HIS(醫(yī)院信息管理系統(tǒng))”、“EMR(電子病歷系統(tǒng))”、“PACS(醫(yī)學影像存檔及傳輸系統(tǒng))”、“RIS(影像信息管理系統(tǒng))”等。隨著信息化系統(tǒng)遍布各個醫(yī)療領域,多年以來,生成并積攢了大量數據,其中既有基本的患者人口學信息,也有非常有價值的醫(yī)學診斷等大量信息,如何對這些數據進行快速有效的搜索成為日益困難的問題。
現有的信息系統(tǒng)軟件,對于搜索條件的錄入主要有如下三種方式:
1直接列出所有的搜索項供用戶選擇(如圖1所示),該種方法雖然操作簡單,但是搜索條件嚴格受限于軟件的設計,即使有的軟件可以在后期填加查詢項目,也不可能把所有可能性全部排布到軟件界面中。
2采用樹型結構顯示更多的查詢項目(如圖2所示),此方法雖然可以不受屏幕空間的限制,顯示更多的查詢項目,但也無法窮舉出所有的查詢可能;而且操作復雜,界面繁瑣,用戶不易找到自己想要的查詢項目。
3類似百度等搜索引擎,查詢關鍵字,雖然此種方法比較靈活,可以任意錄入內容,但是只能進行關鍵字匹配查詢,無法精確定位,使用極其受限。例如無法實現類似于“所有年齡大于50歲的患者”的搜索。
因此以上無論何種方法,都無法簡單并且準確的實現搜索需求。隨著醫(yī)療信息系統(tǒng)的普及以及深入應用,更多未知類型的數據正在產生,因此如何幫助醫(yī)生及其他用戶方便準確的搜索到感興趣數據也日益迫切。
技術實現要素:
有鑒于此,本發(fā)明的主要目的在于提供一種智能結構化搜索系統(tǒng)及其搜索方法,能夠解決現有技術中存在的搜索不準確、操作復雜以及搜索界面繁瑣的問題。
為達到上述目的,本發(fā)明的技術方案是這樣實現的:
一方面,本發(fā)明提供了一種智能結構化搜索系統(tǒng),包括采集模塊、處理模塊、分析模塊、數據存儲模塊和查詢模塊,其中,采集模塊,與處理模塊相連,用于采集客戶端輸入的自然語言查詢數據;處理模塊,分別與采集模塊和分析模塊相連,用于對自然語言查詢數據進行字符集轉換,將中文及非中文數據統(tǒng)一轉換為相同字符集,將字符集轉換后的自然語言查詢數據拆分為單獨的關鍵詞詞匯,并對每個關鍵詞詞匯進行同義詞轉換,根據同義詞字典進行同義詞歸一;分析模塊,與處理模塊相連,用于分析識別處理模塊處理后的關鍵詞詞匯,根據語義生成邏輯表達式或結構化邏輯樹;數據存儲模塊,與查詢模塊相連,用于存儲結構化數據以及關系數據;查詢模塊,分別與分析模塊和數據存儲模塊相連,將邏輯表達式或結構化邏輯樹與數據存儲模塊中的數據進行對比,并將查詢結果輸出。
優(yōu)選地,當分析模塊生成的是邏輯表達式時,查詢模塊將邏輯表達式與關系數據進行對比,并將符合該邏輯表達式的相關數據輸出。
優(yōu)選地,當分析模塊生成的是結構化邏輯樹時,查詢模塊將結構化邏輯樹與結構化數據進行匹配,并將符合該結構化邏輯樹的相關數據輸出。
優(yōu)選地,分析模塊還包括結構化語言查詢生成單元,用于將邏輯表達式生成結構化語言查詢表達式,此時,查詢模塊將結構化語言查詢表達式與關系數據進行對比,并將符合該結構化語言查詢表達式的相關數據輸出。
優(yōu)選地,該系統(tǒng)還包括存儲模塊,與查詢模塊相連,用于在查詢模塊輸出查詢結果之后自動保存客戶端輸入的自然語言查詢數據。
另一方面,本發(fā)明還提供了一種智能結構化搜索系統(tǒng)的搜索方法,包括:采集模塊采集客戶端輸入的自然語言查詢數據;處理模塊對自然語言查詢數據進行字符集轉換,將中文及非中文數據統(tǒng)一轉換為相同字符集,將字符集轉換后的自然語言查詢數據拆分為單獨的關鍵詞詞匯,并對每個關鍵詞詞匯進行同義詞轉換,根據同義詞字典進行同義詞歸一;分析模塊分析識別處理模塊處理后的關鍵詞詞匯,根據語義生成邏輯表達式或結構化邏輯樹;查詢模塊將邏輯表達式或結構化邏輯樹與數據存儲模塊中的數據進行對比,并將查詢結果輸出;其中,數據存儲模塊存儲的數據為結構化數據以及關系數據。
優(yōu)選地,當分析模塊生成的是邏輯表達式時,查詢模塊將邏輯表達式與關系數據進行對比,并將符合該邏輯表達式的相關數據輸出。
優(yōu)選地,當分析模塊生成的是結構化邏輯樹時,查詢模塊將結構化邏輯樹與結構化數據進行匹配,并將符合該結構化邏輯樹的相關數據輸出。
優(yōu)選地,該方法還包括:結構化語言查詢生成單元將邏輯表達式生成結構化語言查詢表達式,此時,查詢模塊將結構化語言查詢表達式與關系數據進行對比,并將符合該結構化語言查詢表達式的相關數據輸出。
優(yōu)選地,在查詢模塊輸出查詢結果之后,存儲模塊自動保存客戶端輸入的自然語言查詢數據。
本發(fā)明的技術效果:
1.由于本發(fā)明中設置了處理模塊和分析模塊,用戶可以隨意輸入搜索條件,例如,用戶可以直接以“年齡大于50歲”、“有吸煙史”、“左肺有腫瘤”等作為搜索條件,可以將用戶輸入的自然語言查詢數據進行處理并生成邏輯表達式或結構化邏輯樹,不受軟件設計或現有的數據種類的限制,兼容未來新產生的數據,使用戶操作簡單,易于使用,提高了搜索效率;
2.本發(fā)明不受搜索條件限制,解決了現有技術中存在的搜索受限于軟件本身的設計,無法窮舉所有的搜索可能的問題,能夠簡單準確的實現搜索需求,提高了搜索的準確度;
3.由于本發(fā)明設置了存儲模塊,在查詢模塊輸出查詢結果之后自動保存客戶端輸入的自然語言查詢數據,自動保存歷史搜索條件,隨著搜索次數的增多,本發(fā)明可以根據用戶的錄入習慣自動提示相關的搜索條件,方便了用戶的錄入,使之更加人性化。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構成對本發(fā)明的不當限定。在附圖中:
圖1示出了現有技術中直接列出所有的搜索項用戶界面示意圖;
圖2示出了現有技術中樹型結構顯示的用戶界面示意圖;
圖3示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)結構示意圖;
圖4示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)的文本結構樹示意圖;
圖5示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)的文本結構樹示意圖;
圖6示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)中分析模塊生成邏輯表達式的示意圖;
圖7示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)中分析模塊生成結構化邏輯樹的示意圖;
圖8示出了根據本發(fā)明實施例二的智能結構化搜索系統(tǒng)結構示意圖;
圖9示出了根據本發(fā)明實施例三的智能結構化搜索系統(tǒng)結構示意圖;
圖10示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法流程圖;
圖11示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法中文本結構樹示意圖;
圖12示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法中文本結構樹示意圖;
圖13示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法中邏輯表達式生成的示意圖;
圖14示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法中結構化邏輯樹生成的示意圖。
具體實施方式
下面將參考附圖并結合實施例,來詳細說明本發(fā)明。
實施例一
圖3示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)結構示意圖;如圖1所示,該系統(tǒng)包括:采集模塊10、處理模塊20、分析模塊30、數據存儲模塊40和查詢模塊50,其中,
采集模塊10,與處理模塊20相連,用于采集客戶端輸入的自然語言查詢數據;
處理模塊20,分別與采集模塊10和分析模塊30相連,用于對自然語言查詢數據進行字符集轉換,將中文及非中文數據統(tǒng)一轉換為相同字符集,將字符集轉換后的自然語言查詢數據拆分為單獨的關鍵詞詞匯,并對每個關鍵詞詞匯進行同義詞轉換,根據同義詞字典進行同義詞歸一;
分析模塊30,與處理模塊20相連,用于分析識別處理模塊20處理后的關鍵詞詞匯,根據語義生成邏輯表達式或結構化邏輯樹;
數據存儲模塊40,與查詢模塊50相連,用于存儲結構化數據以及關系數據;
結構化數據是系統(tǒng)對非結構化數據進行處理得到的,具體的,系統(tǒng)對每條非結構化數據進行分詞處理,將非結構化數據拆分為單獨的關鍵詞詞匯,對關鍵詞詞匯進行同義詞轉換,根據同義詞字典進行同義詞歸一,識別關鍵詞詞匯的范圍值,并根據語法上下文建立一個對應于該非結構化數據的文本結構樹。
查詢模塊50,分別與分析模塊30和數據存儲模40塊相連,將邏輯表達式或結構化邏輯樹與數據存儲模塊中的數據進行對比,并將查詢結果輸出。
這里所提及的非結構化數據為醫(yī)生錄入或是患者口述,如患者主訴、病史、影像學報告等等;
圖4示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)的文本結構樹示意圖;如圖4所示;
下面以一個例子來具體說明文本結構樹的生成:
圖5示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)的文本結構樹示意圖;如圖5所示;
例如醫(yī)生書寫了如下描述:
“食管下段管壁明顯不均勻增厚,并見軟組織腫塊影形成,最厚層面約2.8厘米”
系統(tǒng)將其進行結構化重構后生成如圖5所示的文本結構樹。
其中,當分析模塊30生成的是邏輯表達式時,查詢模塊50將邏輯表達式與關系數據進行對比,并將符合該邏輯表達式的相關數據輸出。
其中,當分析模塊30生成的是結構化邏輯樹時,查詢模塊50將結構化邏輯樹與結構化數據進行匹配,并將符合該結構化邏輯樹的相關數據輸出。
下面以一個例子來具體說明本實施例:
例如用戶要查找符合條件“年齡大于50歲并且有吸煙史且影像檢查為核磁共振”的記錄:
圖6示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)中分析模塊生成邏輯表達式的示意圖;如圖6所示;經過處理模塊和分析模塊的處理,生成了年齡﹥50Y and吸煙史=true and影像檢查=MR邏輯表達式,查詢模塊將上述生成的邏輯表達式(年齡﹥50Y and吸煙史=trueand影像檢查=MR)與關系數據進行對比,并將符合年齡﹥50Y and吸煙史=true and影像檢查=MR的邏輯表達式的相關搜索數據輸出至客戶端。
再如,用戶要查找符合條件“食管下部分管壁明顯增厚,并且可見軟組織腫塊影形成”的記錄:
圖7示出了根據本發(fā)明實施例一的智能結構化搜索系統(tǒng)中分析模塊生成結構化邏輯樹的示意圖;如圖7所示;經過處理模塊和分析模塊的處理,生成了如圖7所示的結構化邏輯樹,查詢模塊將上述生成的結構化邏輯樹與數據存儲模塊中的每個文本結構樹進行匹配,將符合條件的相關搜索數據輸出至客戶端。
本發(fā)明的實施例中設置了處理模塊和分析模塊,用戶可以隨意輸入搜索條件,例如,用戶可以直接以“年齡大于50歲”、“有吸煙史”、“左肺有腫瘤”等作為搜索條件,可以將用戶輸入的自然語言查詢數據進行處理并生成邏輯表達式或結構化邏輯樹,不受軟件設計或現有的數據種類的限制,兼容未來新產生的數據,使用戶操作簡單,易于使用,提高了搜索效率;同時,本發(fā)明不受搜索條件限制,解決了現有技術中存在的搜索受限于軟件本身的設計,無法窮舉所有的搜索可能的問題,能夠簡單準確的實現搜索需求,提高了搜索的準確度。
實施例二
圖8示出了根據本發(fā)明實施例二的智能結構化搜索系統(tǒng)結構示意圖;如圖8所示,分析模塊30還包括結構化語言查詢(SQL)生成單元302,用于將邏輯表達式生成結構化語言查詢(SQL)表達式,此時,查詢模塊50將結構化語言查詢(SQL)表達式與關系數據進行對比,并將符合該結構化語言查詢表達式的相關數據輸出。
例如將實施例一中的對應于“年齡大于50歲并且有吸煙史且影像檢查為核磁共振”的邏輯表達式生成結構化語言查詢表達式為:age﹥50Y and smoke=true and modality=MR,查詢模塊將上述生成的結構化語言查詢表達式age﹥50Y and smoke=true and modality=MR與關系數據進行對比,并將符合age﹥50Y and smoke=true and modality=MR的結構化語言查詢表達式的相關搜索數據輸出至客戶端。
實施例三
圖9示出了根據本發(fā)明實施例三的智能結構化搜索系統(tǒng)結構示意圖;如圖9所示,該系統(tǒng)還包括:存儲模塊60,與所述查詢模塊50相連,用于在查詢模塊50輸出查詢結果之后自動保存客戶端輸入的自然語言查詢數據。
本發(fā)明的實施例設置了存儲模塊,在查詢模塊輸出查詢結果之后自動保存客戶端輸入的自然語言查詢數據,自動保存歷史搜索條件,隨著搜索次數的增多,本發(fā)明可以根據用戶的錄入習慣自動提示相關的搜索條件,方便了用戶的錄入,使之更加人性化。
實施例四
圖10示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法流程圖,如圖10所示,該方法包括以下步驟:
步驟S401,采集模塊采集客戶端輸入的自然語言查詢數據;
步驟S402,處理模塊對自然語言查詢數據進行字符集轉換,將中文及非中文數據統(tǒng)一轉換為相同字符集,將字符集轉換后的自然語言查詢數據拆分為單獨的關鍵詞詞匯,并對每個關鍵詞詞匯進行同義詞轉換,根據同義詞字典進行同義詞歸一;
步驟S403,分析模塊分析識別處理模塊處理后的關鍵詞詞匯,根據語義生成邏輯表達式或結構化邏輯樹;
步驟S404,查詢模塊將邏輯表達式或結構化邏輯樹與數據存儲模塊中的數據進行對比,并將查詢結果輸出。
其中,數據存儲模塊存儲的數據為結構化數據以及關系數據。
結構化數據是系統(tǒng)對非結構化數據進行處理得到的,具體的,系統(tǒng)對每條非結構化數據進行分詞處理,將非結構化數據拆分為單獨的關鍵詞詞匯,對關鍵詞詞匯進行同義詞轉換,根據同義詞字典進行同義詞歸一,識別關鍵詞詞匯的范圍值,并根據語法上下文建立一個對應于該非結構化數據的文本結構樹。
這里所提及的非結構化數據為醫(yī)生錄入或是患者口述,如患者主訴、病史、影像學報告等等;
圖11示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法中文本結構樹示意圖;如圖11所示;
下面以一個例子來具體說明文本結構樹的生成:
圖12示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法中文本結構樹示意圖;如圖12所示;
例如醫(yī)生書寫了如下描述:
“食管下段管壁明顯不均勻增厚,并見軟組織腫塊影形成,最厚層面約2.8厘米”
該方法將其進行結構化重構后生成如圖12所示的文本結構樹。
其中,當分析模塊生成的是邏輯表達式時,查詢模塊將邏輯表達式與關系數據進行對比,并將符合該邏輯表達式的相關數據輸出。
其中,當分析模塊生成的是結構化邏輯樹時,查詢模塊將結構化邏輯樹與結構化數據進行匹配,并將符合該結構化邏輯樹的相關數據輸出。
下面以一個例子來具體說明本實施例:
例如用戶要查找符合條件“年齡大于50歲并且有吸煙史且影像檢查為核磁共振”的記錄:
圖13示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法中邏輯表達式生成的示意圖;如圖13所示;經過處理模塊和分析模塊的處理,生成了年齡﹥50Y and吸煙史=trueand影像檢查=MR邏輯表達式,查詢模塊將上述生成的邏輯表達式(年齡﹥50Y and吸煙史=true and影像檢查=MR)與關系數據進行對比,并將符合年齡﹥50Y and吸煙史=true and影像檢查=MR的邏輯表達式的相關搜索數據輸出至客戶端。
再如,用戶要查找符合條件“食管下部分管壁明顯增厚,并且可見軟組織腫塊影形成”的記錄:
圖14示出了根據本發(fā)明實施例四的智能結構化搜索系統(tǒng)的搜索方法中結構化邏輯樹生成的示意圖;如圖14所示;經過處理模塊和分析模塊的處理,生成了如圖14所示的結構化邏輯樹,查詢模塊將上述生成的結構化邏輯樹與數據存儲模塊中的每個文本結構樹進行匹配,將符合條件的相關搜索數據輸出至客戶端。
其中,該方法還包括:結構化語言查詢(SQL)生成單元將邏輯表達式生成結構化語言查詢(SQL)表達式,此時,查詢模塊將結構化語言查詢(SQL)表達式與關系數據進行對比,并將符合該結構化語言查詢表達式的相關數據輸出。
例如將上述例子中的對應于“年齡大于50歲并且有吸煙史且影像檢查為核磁共振”的邏輯表達式生成結構化語言查詢表達式為:age﹥50Y and smoke=true and modality=MR,查詢模塊將上述生成的結構化語言查詢表達式age﹥50Y and smoke=true and modality=MR與關系數據進行對比,并將符合age﹥50Y and smoke=true and modality=MR的結構化語言查詢表達式的相關搜索數據輸出至客戶端。
其中,在查詢模塊輸出查詢結果之后存儲模塊自動保存客戶端輸入的自然語言查詢數據。
本發(fā)明的實施例中用戶可以隨意輸入搜索條件,例如,用戶可以直接以“年齡大于50歲”、“有吸煙史”、“左肺有腫瘤”等作為搜索條件,可以將用戶輸入的自然語言查詢數據進行處理并生成邏輯表達式或結構化邏輯樹,不受軟件設計或現有的數據種類的限制,兼容未來新產生的數據,使用戶操作簡單,易于使用,提高了搜索效率;同時,本發(fā)明不受搜索條件限制,解決了現有技術中存在的搜索受限于軟件本身的設計,無法窮舉所有的搜索可能的問題,能夠簡單準確的實現搜索需求,提高了搜索的準確度;由于在查詢結果輸出之后自動保存客戶端輸入的自然語言查詢數據,自動保存歷史搜索條件,隨著搜索次數的增多,本實施例可以根據用戶的錄入習慣自動提示相關的搜索條件,方便了用戶的錄入,使之更加人性化。
從以上描述中,可以看出,本發(fā)明的上述實施例實現了如下技術效果:本發(fā)明的實施例用戶可以隨意輸入搜索條件,例如,用戶可以直接以“年齡大于50歲”、“有吸煙史”、“左肺有腫瘤”等作為搜索條件,可以將用戶輸入的自然語言查詢數據進行處理并生成邏輯表達式或結構化邏輯樹,不受軟件設計或現有的數據種類的限制,兼容未來新產生的數據,使用戶操作簡單,易于使用,提高了搜索效率;同時,本發(fā)明不受搜索條件限制,解決了現有技術中存在的搜索受限于軟件本身的設計,無法窮舉所有的搜索可能的問題,能夠簡單準確的實現搜索需求,提高了搜索的準確度;由于在查詢結果輸出之后自動保存客戶端輸入的自然語言查詢數據,自動保存歷史搜索條件,隨著搜索次數的增多,本實施例可以根據用戶的錄入習慣自動提示相關的搜索條件,方便了用戶的錄入,使之更加人性化。
顯然,本本領域的技術人員應該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計算裝置來實現,它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網絡上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現,從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現。這樣,本發(fā)明不限制于任何特定的硬件和軟件結合。
以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,對于本領域的技術人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。