技術(shù)特征:1.一種基于商事登記地址的數(shù)據(jù)治理方法,其特征在于,包括以下具體步驟:
2.根據(jù)權(quán)利要求1所述的一種基于商事登記地址的數(shù)據(jù)治理方法,其特征在于,所述步驟二中訓(xùn)練集和測(cè)試集的比例為80%的數(shù)據(jù)用于訓(xùn)練,20%的數(shù)據(jù)用于測(cè)試。
3.根據(jù)權(quán)利要求2所述的一種基于商事登記地址的數(shù)據(jù)治理方法,其特征在于,所述步驟一中的地質(zhì)數(shù)據(jù)需要進(jìn)行數(shù)據(jù)標(biāo)注,形成標(biāo)準(zhǔn)化地質(zhì)。
4.根據(jù)權(quán)利要求3所述的一種基于商事登記地址的數(shù)據(jù)治理方法,其特征在于,所述api接口提供地址解析、地址分詞補(bǔ)全和標(biāo)準(zhǔn)化服務(wù)。
5.根據(jù)權(quán)利要求4所述的一種基于商事登記地址的數(shù)據(jù)治理方法,其特征在于,所述訓(xùn)練好的roberta模型采用負(fù)載均衡和緩存技術(shù),支持高并發(fā)請(qǐng)求,并定期更新模型和數(shù)據(jù)庫,以保持?jǐn)?shù)據(jù)的最新和準(zhǔn)確。
技術(shù)總結(jié)本發(fā)明涉及地理信息系統(tǒng)技術(shù)領(lǐng)域,具體的說是一種基于商事登記地址的數(shù)據(jù)治理方法,包括構(gòu)建一個(gè)具有高度兼容的系統(tǒng)和能夠通過標(biāo)準(zhǔn)化接口進(jìn)行調(diào)用的標(biāo)準(zhǔn)地址數(shù)據(jù)庫,且標(biāo)準(zhǔn)地址數(shù)據(jù)庫存有當(dāng)?shù)匾欢〝?shù)量的標(biāo)準(zhǔn)地址,用于支持地址治理算法模型的開發(fā)。為佛山本地地名進(jìn)行全面的語料庫收集,構(gòu)建一個(gè)詳盡的本地化地址數(shù)據(jù)庫,利用先進(jìn)的人工智能深度學(xué)習(xí)算法,對(duì)該語料庫進(jìn)行訓(xùn)練,以建立一個(gè)專門針對(duì)佛山地區(qū)的地址治理模型,能夠更準(zhǔn)確地識(shí)別和分級(jí)佛山本地的各類地名,顯著提高地址解析和標(biāo)準(zhǔn)化的準(zhǔn)確度和細(xì)致度,此外,模型的分級(jí)算法也能夠更靈活地適應(yīng)佛山本地的地址體系,確保在處理復(fù)雜地址結(jié)構(gòu)時(shí)能給出最符合實(shí)際的結(jié)果。
技術(shù)研發(fā)人員:范志勇,高培玉,張成發(fā),王鵬飛
受保護(hù)的技術(shù)使用者:廣東省新基建科技有限公司
技術(shù)研發(fā)日:技術(shù)公布日:2025/1/2