本發(fā)明涉及計(jì)算機(jī),特別涉及一種端智能模型管理方法、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、端智能(on-device?ai)是指將算法模型直接運(yùn)行在終端設(shè)備上,包括但不限于手機(jī)和其他智能設(shè)備等,該技術(shù)能夠使得復(fù)雜的計(jì)算和數(shù)據(jù)處理可以在設(shè)備本地進(jìn)行,而不需要依賴云計(jì)算服務(wù)。目前,越來越多場(chǎng)景需要使用端智能提升用戶體驗(yàn),對(duì)端智能模型的需求也從常規(guī)的cpu算法模型擴(kuò)展到不同結(jié)構(gòu)的算法模型。但是,相關(guān)技術(shù)中,終端從云端服務(wù)端將模型下載到本地實(shí)現(xiàn)端智能,往往無法實(shí)現(xiàn)多場(chǎng)景異構(gòu)模型管理。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種端智能模型管理方法、設(shè)備及存儲(chǔ)介質(zhì),能夠支持多種結(jié)構(gòu)模型管理,提高了端智能模型管理的能力。其具體方案如下:
2、第一方面,本申請(qǐng)公開了一種端智能模型管理方法,應(yīng)用于終端,包括:
3、獲取服務(wù)端下發(fā)的模型標(biāo)識(shí)信息;所述模型標(biāo)識(shí)信息具體唯一性,所述模型標(biāo)識(shí)信息包括所對(duì)應(yīng)算法模型的模型所屬業(yè)務(wù)、擴(kuò)展字段、引擎類型和模型版本;
4、基于所述模型標(biāo)識(shí)信息根據(jù)本地需求,判斷所述模型標(biāo)識(shí)信息對(duì)應(yīng)的算法模型是否為待下載的目標(biāo)模型;
5、若是待下載的目標(biāo)模型,則基于所述模型標(biāo)識(shí)信息生成模型下載請(qǐng)求發(fā)送給所述服務(wù)端,并接收所述服務(wù)端下發(fā)的目標(biāo)模型,以便利用所述目標(biāo)模型執(zhí)行計(jì)算任務(wù);所述服務(wù)端用于通過查詢預(yù)先構(gòu)建的模型標(biāo)識(shí)信息與模型的對(duì)應(yīng)關(guān)系,確定出所述模型下載請(qǐng)求對(duì)應(yīng)的目標(biāo)模型。
6、可選的,所述獲取服務(wù)端下發(fā)的模型標(biāo)識(shí)信息,包括:
7、向所述服務(wù)端發(fā)送模型信息獲取請(qǐng)求,以便所述服務(wù)端根據(jù)所述模型信息獲取請(qǐng)求下發(fā)對(duì)應(yīng)的模型標(biāo)識(shí)信息;
8、或,獲取所述服務(wù)端針對(duì)更新的模型下發(fā)的模型標(biāo)識(shí)信息。
9、可選的,所述基于所述模型標(biāo)識(shí)信息根據(jù)本地需求,判斷所述模型標(biāo)識(shí)信息對(duì)應(yīng)的算法模型是否為待下載的目標(biāo)模型,包括:
10、根據(jù)所述模型標(biāo)識(shí)信息和終端運(yùn)行環(huán)境信息,判斷所述模型標(biāo)識(shí)信息對(duì)應(yīng)的算法模型是否為所述終端需求的模型類型;
11、若是,則根據(jù)所述模型標(biāo)識(shí)信息,判斷所述模型標(biāo)識(shí)信息對(duì)應(yīng)的算法模型相對(duì)于終端已存在的算法模型是否存在版本升級(jí);
12、若是,則所述模型標(biāo)識(shí)信息對(duì)應(yīng)的算法模型為待下載的目標(biāo)模型。
13、可選的,所述端智能模型管理方法,還包括:
14、根據(jù)已下載模型的模型標(biāo)識(shí)信息,通過查詢所述服務(wù)端判斷所述已下載模型是否有效;
15、若所述已下載模型無效,則從終端數(shù)據(jù)庫(kù)中刪除所述已下載模型。
16、可選的,所述基于所述模型標(biāo)識(shí)信息生成模型下載請(qǐng)求,包括:
17、基于所述模型標(biāo)識(shí)信息生成模型下載任務(wù),并將所述模型下載任務(wù)添加至模型下載列表;
18、按照所述模型下載列表中的順序,依次生成各模型下載任務(wù)對(duì)應(yīng)的模型下載請(qǐng)求。
19、可選的,所述接收所述服務(wù)端下發(fā)的目標(biāo)模型之后,還包括:
20、根據(jù)所述目標(biāo)模型的類型信息和終端運(yùn)行環(huán)境信息,生成所述目標(biāo)模型對(duì)應(yīng)的推理引擎策略;
21、按照所述推理引擎策略對(duì)所述目標(biāo)模型進(jìn)行推理加速。
22、可選的,所述根據(jù)所述目標(biāo)模型的類型信息和終端運(yùn)行環(huán)境信息,生成所述目標(biāo)模型對(duì)應(yīng)的推理引擎策略,包括:
23、根據(jù)所述目標(biāo)模型的類型信息和終端運(yùn)行環(huán)境信息,確定所述目標(biāo)模型對(duì)應(yīng)的硬件加速代理類型;
24、根據(jù)所述硬件加速代理類型生成所述目標(biāo)模型對(duì)應(yīng)的推理引擎策略。
25、第二方面,本申請(qǐng)公開了一種端智能模型管理方法,應(yīng)用于服務(wù)端,包括:
26、向終端下發(fā)模型標(biāo)識(shí)信息,以便所述終端基于所述模型標(biāo)識(shí)信息根據(jù)終端需求,判斷所述模型標(biāo)識(shí)信息對(duì)應(yīng)的算法模型是否為終端待下載的目標(biāo)模型;所述模型標(biāo)識(shí)信息具體唯一性,所述模型標(biāo)識(shí)信息包括所對(duì)應(yīng)算法模型的模型所屬業(yè)務(wù)、擴(kuò)展字段、引擎類型和模型版本;
27、獲取所述終端在判定所述模型標(biāo)識(shí)信息對(duì)應(yīng)的算法模型是目標(biāo)模型后,基于所述模型標(biāo)識(shí)信息發(fā)送的模型下載請(qǐng)求;
28、通過查詢預(yù)先構(gòu)建的模型標(biāo)識(shí)信息與模型的對(duì)應(yīng)關(guān)系,確定出所述模型下載請(qǐng)求對(duì)應(yīng)的目標(biāo)模型,并將所述目標(biāo)模型下發(fā)給所述終端,以便所述終端利用所述目標(biāo)模型執(zhí)行計(jì)算任務(wù)。
29、第三方面,本申請(qǐng)公開了一種電子設(shè)備,包括:
30、存儲(chǔ)器,用于保存計(jì)算機(jī)程序;
31、處理器,用于執(zhí)行所述計(jì)算機(jī)程序,以實(shí)現(xiàn)前述的端智能模型管理方法。
32、第四方面,本申請(qǐng)公開了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),用于存儲(chǔ)計(jì)算機(jī)程序;其中計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)前述的端智能模型管理方法。
33、第五方面,本申請(qǐng)公開了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)前述的音樂生成方法。
34、本申請(qǐng)中,獲取服務(wù)端下發(fā)的模型標(biāo)識(shí)信息;所述模型標(biāo)識(shí)信息具體唯一性,所述模型標(biāo)識(shí)信息包括所對(duì)應(yīng)算法模型的模型所屬業(yè)務(wù)、擴(kuò)展字段、引擎類型和模型版本;基于所述模型標(biāo)識(shí)信息根據(jù)本地需求,判斷所述模型標(biāo)識(shí)信息對(duì)應(yīng)的算法模型是否為待下載的目標(biāo)模型;若是待下載的目標(biāo)模型,則基于所述模型標(biāo)識(shí)信息生成模型下載請(qǐng)求發(fā)送給所述服務(wù)端,并接收所述服務(wù)端下發(fā)的目標(biāo)模型,以便利用所述目標(biāo)模型執(zhí)行計(jì)算任務(wù);所述服務(wù)端用于通過查詢預(yù)先構(gòu)建的模型標(biāo)識(shí)信息與模型的對(duì)應(yīng)關(guān)系,確定出所述模型下載請(qǐng)求對(duì)應(yīng)的目標(biāo)模型。通過為模型創(chuàng)建唯一的模型標(biāo)識(shí)信息,通過模型標(biāo)識(shí)信息標(biāo)識(shí)模型的所屬的業(yè)務(wù),模型對(duì)應(yīng)的引擎類型以及模型版本,由此,不同結(jié)構(gòu)的模型對(duì)應(yīng)的模型標(biāo)識(shí)信息不同,服務(wù)端結(jié)合模型標(biāo)識(shí)信息進(jìn)行模型存儲(chǔ),終端根據(jù)模型標(biāo)識(shí)信息從服務(wù)端下載模型并進(jìn)行模型管理,能夠支持多種結(jié)構(gòu)模型管理,提高了端智能模型管理的能力。
1.一種端智能模型管理方法,其特征在于,應(yīng)用于終端,包括:
2.根據(jù)權(quán)利要求1所述的端智能模型管理方法,其特征在于,所述獲取服務(wù)端下發(fā)的模型標(biāo)識(shí)信息,包括:
3.根據(jù)權(quán)利要求1所述的端智能模型管理方法,其特征在于,所述基于所述模型標(biāo)識(shí)信息根據(jù)本地需求,判斷所述模型標(biāo)識(shí)信息對(duì)應(yīng)的算法模型是否為待下載的目標(biāo)模型,包括:
4.根據(jù)權(quán)利要求1所述的端智能模型管理方法,其特征在于,還包括:
5.根據(jù)權(quán)利要求1所述的端智能模型管理方法,其特征在于,所述基于所述模型標(biāo)識(shí)信息生成模型下載請(qǐng)求,包括:
6.根據(jù)權(quán)利要求1至5任一項(xiàng)所述的端智能模型管理方法,其特征在于,所述接收所述服務(wù)端下發(fā)的目標(biāo)模型之后,還包括:
7.根據(jù)權(quán)利要求6所述的端智能模型管理方法,其特征在于,所述根據(jù)所述目標(biāo)模型的類型信息和終端運(yùn)行環(huán)境信息,生成所述目標(biāo)模型對(duì)應(yīng)的推理引擎策略,包括:
8.一種端智能模型管理方法,其特征在于,應(yīng)用于服務(wù)端,包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,用于存儲(chǔ)計(jì)算機(jī)程序;其中計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7任一項(xiàng)所述的端智能模型管理方法或權(quán)利要求8所述的端智能模型管理方法。