技術(shù)編號:40637390
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明涉及信息處理,具體來說是一種基于信創(chuàng)環(huán)境的配置化word數(shù)據(jù)提取方法。背景技術(shù)、當(dāng)前行業(yè)在采集公告結(jié)構(gòu)化數(shù)據(jù)時,主要依賴于基于gpu的大模型技術(shù)或基于x架構(gòu)的office工具包,但這些技術(shù)與國產(chǎn)信創(chuàng)環(huán)境的兼容性尚未實現(xiàn)。此外,人工智能技術(shù)的應(yīng)用導(dǎo)致了軟硬件成本的增加,以及在處理長篇公告時效率不高。上市公司公告的結(jié)構(gòu)復(fù)雜多變,對數(shù)據(jù)的需求更新迅速,而現(xiàn)有的定制化word提取工具的可擴(kuò)展性不足,每次增加新的提取需求都需要大量的開發(fā)資源。同時,現(xiàn)有技術(shù)在解析公告中的跨頁表格和無框表格等復(fù)雜...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。