本發(fā)明涉及數(shù)據(jù)管理和處理,尤其涉及一種基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法。
背景技術(shù):
1、材料數(shù)據(jù)是指關(guān)于材料的各種性質(zhì)和特征的信息,包括但不限于化學(xué)成分、物理性質(zhì)、機(jī)械性能、熱學(xué)性能、電學(xué)性能等。這些數(shù)據(jù)對于材料的研究、開發(fā)、應(yīng)用以及安全使用都具有重要意義。
2、材料種類繁多,名稱不規(guī)范,導(dǎo)致很多材料歸集不了,需要人工識別材料種類,手動歸集工作量大,錯誤率高、效率低、成本大。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是為了解決現(xiàn)有技術(shù)中存在材料種類繁多,名稱不規(guī)范,導(dǎo)致很多材料歸集不了,需要人工識別材料種類,手動歸集工作量大,錯誤率高、效率低、成本大的缺點,而提出的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法。
2、為了實現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:
3、基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,包括以下步驟:
4、s1、先定義材料類別,然后定義材料名稱,將定義的材料類別和材料名稱傳輸至材料知識庫進(jìn)行存儲;
5、s2、獲取成果文件中材料名稱,根據(jù)名稱從材料知識庫中匹配類別,匹配到對應(yīng)的類別,則自動將該成果文件歸類到該類別科目;
6、s3、未匹配到類別則推送材料名稱、知識庫,通過ai對材料進(jìn)行語義識別、標(biāo)準(zhǔn)化處理,然后再匹配類別,若匹配到類別則推送材料名稱、類別;
7、s4、對推送的材料名稱、類別進(jìn)行接收,將該成果文件自動歸集到科目;
8、s5、s3中若沒有匹配到類別,則推送材料名稱,將此材料視為未歸集材料,然后進(jìn)行手動歸集類別,手動歸類的材料、類別傳輸至知識庫存儲。
9、優(yōu)選的,所述s3中,通過ai對材料進(jìn)行語義識別、標(biāo)準(zhǔn)化處理前,建立材料信息,定義材料標(biāo)準(zhǔn)格式,并進(jìn)行存儲。
10、優(yōu)選的,所述s3中,通過ai對材料進(jìn)行語義識別具體如下:將文本按照一定的規(guī)則進(jìn)行分割,劃分為標(biāo)準(zhǔn)名稱、規(guī)格型號,對每個單詞或短語進(jìn)行詞性標(biāo)注,標(biāo)明其在句子中的語法角色和含義,對句子中的結(jié)構(gòu)進(jìn)行分析,判斷各個單詞或短語之間的語法關(guān)系和依存關(guān)系,對文本的含義和語境進(jìn)行分析,理解文本中的概念、實體、事件,根據(jù)文本的語義信息,判斷文本的意圖和目的。
11、優(yōu)選的,所述s1中,先定義材料類別,然后定義材料名稱,將材料名稱與材料類別進(jìn)行關(guān)聯(lián),將定義的材料類別和材料名稱傳輸至材料知識庫進(jìn)行存儲。
12、優(yōu)選的,所述s2中,將材料名稱輸入知識庫,查看該材料名稱是否存在關(guān)聯(lián)的材料類別,存在關(guān)聯(lián)的類別則說明匹配到類別,反之,則未匹配到類別。
13、優(yōu)選的,所述s1中,將定義的材料類別和材料名稱傳輸至材料知識庫,材料知識庫對材料類別和材料名稱進(jìn)行接收,然后進(jìn)行識別,識別后進(jìn)行存儲。
14、優(yōu)選的,所述s1中,對知識庫的存儲容量進(jìn)行監(jiān)測,設(shè)置存儲容量閾值,當(dāng)監(jiān)測的存儲容量大于容量閾值時,則進(jìn)行預(yù)警。
15、優(yōu)選的,所述s2中,匹配時,建立多個匹配通道,將知識庫中存儲的材料數(shù)據(jù)分組傳輸至多個匹配通道中,將獲取的成果文件中的材料名稱傳輸至多個匹配通道,同時進(jìn)行匹配。
16、優(yōu)選的,多個匹配通道中任何一個匹配通道匹配到類別時,則結(jié)束匹配,關(guān)閉匹配通道,清除匹配通道內(nèi)的數(shù)據(jù)。
17、優(yōu)選的,所述s3中,對材料進(jìn)行標(biāo)準(zhǔn)化處理具體如下:將原始數(shù)據(jù)的值縮放到一個特定的區(qū)間,通常是[0,1],轉(zhuǎn)換函數(shù)為x1=x-min/max-min,其中x1是標(biāo)準(zhǔn)化后的值,x是原始值,min和max分別是數(shù)據(jù)集中的最小值和最大值。
18、本發(fā)明中,所述基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法的有益效果:
19、本發(fā)明利用語義識別,擴(kuò)大識別范圍,同時規(guī)范材料數(shù)據(jù),人工干預(yù)部分會自動更新到知識庫,準(zhǔn)確率高、效率高、成本較低。
1.基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,所述s3中,通過ai對材料進(jìn)行語義識別、標(biāo)準(zhǔn)化處理前,建立材料信息,定義材料標(biāo)準(zhǔn)格式,并進(jìn)行存儲。
3.根據(jù)權(quán)利要求2所述的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,所述s3中,通過ai對材料進(jìn)行語義識別具體如下:將文本按照一定的規(guī)則進(jìn)行分割,劃分為標(biāo)準(zhǔn)名稱、規(guī)格型號,對每個單詞或短語進(jìn)行詞性標(biāo)注,標(biāo)明其在句子中的語法角色和含義,對句子中的結(jié)構(gòu)進(jìn)行分析,判斷各個單詞或短語之間的語法關(guān)系和依存關(guān)系,對文本的含義和語境進(jìn)行分析,理解文本中的概念、實體、事件,根據(jù)文本的語義信息,判斷文本的意圖和目的。
4.根據(jù)權(quán)利要求3所述的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,所述s1中,先定義材料類別,然后定義材料名稱,將材料名稱與材料類別進(jìn)行關(guān)聯(lián),將定義的材料類別和材料名稱傳輸至材料知識庫進(jìn)行存儲。
5.根據(jù)權(quán)利要求4所述的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,所述s2中,將材料名稱輸入知識庫,查看該材料名稱是否存在關(guān)聯(lián)的材料類別,存在關(guān)聯(lián)的類別則說明匹配到類別,反之,則未匹配到類別。
6.根據(jù)權(quán)利要求5所述的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,所述s1中,將定義的材料類別和材料名稱傳輸至材料知識庫,材料知識庫對材料類別和材料名稱進(jìn)行接收,然后進(jìn)行識別,識別后進(jìn)行存儲。
7.根據(jù)權(quán)利要求6所述的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,所述s1中,對知識庫的存儲容量進(jìn)行監(jiān)測,設(shè)置存儲容量閾值,當(dāng)監(jiān)測的存儲容量大于容量閾值時,則進(jìn)行預(yù)警。
8.根據(jù)權(quán)利要求7所述的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,所述s2中,匹配時,建立多個匹配通道,將知識庫中存儲的材料數(shù)據(jù)分組傳輸至多個匹配通道中,將獲取的成果文件中的材料名稱傳輸至多個匹配通道,同時進(jìn)行匹配。
9.根據(jù)權(quán)利要求8所述的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,多個匹配通道中任何一個匹配通道匹配到類別時,則結(jié)束匹配,關(guān)閉匹配通道,清除匹配通道內(nèi)的數(shù)據(jù)。
10.根據(jù)權(quán)利要求9所述的基于ai技術(shù)的材料數(shù)據(jù)管理和處理方法,其特征在于,所述s3中,對材料進(jìn)行標(biāo)準(zhǔn)化處理具體如下:將原始數(shù)據(jù)的值縮放到一個特定的區(qū)間,通常是[0,1],轉(zhuǎn)換函數(shù)為x1=x-min/max-min,其中x1是標(biāo)準(zhǔn)化后的值,x是原始值,min和max分別是數(shù)據(jù)集中的最小值和最大值。