1.一種結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成方法,其特征在于,包括:
接收待處理醫(yī)療文本,并對所述待處理醫(yī)療文本進(jìn)行分詞,得到多個詞語;
結(jié)合多個第一醫(yī)療命名實體從所述多個詞語中識別出多個第二醫(yī)療命名實體;
基于所述多個第一醫(yī)療命名實體之間的邏輯關(guān)系以及自然語言實體關(guān)系建立所述多個第二醫(yī)療命名實體之間的邏輯關(guān)系;
結(jié)合所述第二醫(yī)療命名實體以及所述第二醫(yī)療命名實體之間的邏輯關(guān)系生成結(jié)構(gòu)化醫(yī)療數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成方法,其特征在于,根據(jù)隱式馬爾科夫模型對所述待處理醫(yī)療文本進(jìn)行分詞。
3.根據(jù)權(quán)利要求1所述的結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成方法,其特征在于,從所述多個詞語中識別出多個第二醫(yī)療命名實體包括:
基于所述多個第一醫(yī)療命名實體對所述多個詞語進(jìn)行精確匹配,以從所述多個詞語中識別出第一部分所述第二醫(yī)療命名實體;以及
基于預(yù)設(shè)規(guī)則對所述多個詞語進(jìn)行模糊匹配,以從所述多個詞語中識別出第二部分所述第二醫(yī)療命名實體。
4.根據(jù)權(quán)利要求1所述的結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成方法,其特征在于,建立所述多個第二醫(yī)療命名實體之間的邏輯關(guān)系包括:
基于所述多個第一醫(yī)療命名實體之間的邏輯關(guān)系判斷多個所述第二醫(yī)療命名實體之間是否可能存在邏輯關(guān)系;
在判斷多個所述第二醫(yī)療命名實體之間可能存在邏輯關(guān)系時,結(jié)合自然語言實體關(guān)系確認(rèn)所述邏輯關(guān)系是否確實存在。
5.根據(jù)權(quán)利要求4所述的結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成方法,其特征在于,結(jié)合自然語言實體關(guān)系確認(rèn)所述邏輯關(guān)系是否確實存在包括:
基于人工先驗知識、數(shù)據(jù)統(tǒng)計以及條件隨機(jī)場CRF算法中的一種或多種確認(rèn)所述邏輯關(guān)系是否確實存在。
6.一種結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成裝置,其特征在于,包括:
文本接收模塊:用于接收待處理醫(yī)療文本,并對所述待處理醫(yī)療文本進(jìn)行分詞,得到多個詞語;
實體識別模塊:用于結(jié)合多個第一醫(yī)療命名實體從所述多個詞語中識別出多個第二醫(yī)療命名實體;
關(guān)系識別模塊:用于基于所述多個第一醫(yī)療命名實體之間的邏輯關(guān)系以及自然語言實體關(guān)系建立所述多個第二醫(yī)療命名實體之間的邏輯關(guān)系;
數(shù)據(jù)生成模塊:用于結(jié)合所述第二醫(yī)療命名實體以及所述第二醫(yī)療命名實體之間的邏輯關(guān)系生成結(jié)構(gòu)化醫(yī)療數(shù)據(jù)。
7.根據(jù)權(quán)利要求6所述的結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成裝置,其特征在于,根據(jù)隱式馬爾科夫模型對所述待處理醫(yī)療文本進(jìn)行分詞。
8.根據(jù)權(quán)利要求6所述的結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成裝置,其特征在于,從所述多個詞語中識別出多個第二醫(yī)療命名實體包括:
基于所述多個第一醫(yī)療命名實體對所述多個詞語進(jìn)行精確匹配,以從所述多個詞語中識別出第一部分所述第二醫(yī)療命名實體;以及,
基于預(yù)設(shè)規(guī)則對所述多個詞語進(jìn)行模糊匹配,以從所述多個詞語中識別出第二部分所述第二醫(yī)療命名實體。
9.根據(jù)權(quán)利要求6所述的結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成裝置,其特征在于,建立所述多個第二醫(yī)療命名實體之間的邏輯關(guān)系包括:
基于所述多個第一醫(yī)療命名實體之間的邏輯關(guān)系判斷多個所述第二醫(yī)療命名實體之間是否可能存在邏輯關(guān)系;
在判斷多個所述第二醫(yī)療命名實體之間可能存在邏輯關(guān)系時,結(jié)合自然語言實體關(guān)系確認(rèn)所述邏輯關(guān)系是否確實存在。
10.根據(jù)權(quán)利要求9所述的結(jié)構(gòu)化醫(yī)療數(shù)據(jù)生成裝置,其特征在于,結(jié)合自然語言實體關(guān)系確認(rèn)所述邏輯關(guān)系是否確實存在包括:
基于人工先驗知識、數(shù)據(jù)統(tǒng)計以及條件隨機(jī)場CRF算法中的一種或多種確認(rèn)所述邏輯關(guān)系是否確實存在。