技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明涉及一種從文本中智能提取日期的方法,其包括以下步驟:步驟1:獲取將要從中提取日期的文本和單據(jù)填寫日期;步驟2:對文本作預(yù)處理,將文本中出現(xiàn)的日期轉(zhuǎn)換為規(guī)范形式的日期;步驟3:構(gòu)造正則表達式,并利用正則表達式對文本中的日期表達式進行匹配,從中提取出符合正則表達式格式的日期表達式;步驟4:針對不同格式的日期表達式,分別提取出其中的年、月、日數(shù)字;步驟5:借助填單日期,補全文本中缺失的年份或月份數(shù)據(jù);步驟6:將識別出的年、月、日數(shù)字組合成完整的日期,并以日期格式存儲。本發(fā)明還提供了一種用于實現(xiàn)上述方法的裝置。
技術(shù)研發(fā)人員:孫曉東;向萬紅
受保護的技術(shù)使用者:遠光軟件股份有限公司
技術(shù)研發(fā)日:2015.12.31
技術(shù)公布日:2017.07.07