欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種大小模型協(xié)同處理的手機型號智能推薦系統(tǒng)的制作方法

文檔序號:40818134發(fā)布日期:2025-01-29 02:37閱讀:11來源:國知局
一種大小模型協(xié)同處理的手機型號智能推薦系統(tǒng)的制作方法

本發(fā)明涉及人工智能,具體為一種大小模型協(xié)同處理的手機型號智能推薦系統(tǒng)。


背景技術(shù):

1、在智能客服和手機銷售領(lǐng)域中,快速、準(zhǔn)確地識別并標(biāo)準(zhǔn)化用戶提及的手機型號至關(guān)重要,尤其在客戶服務(wù)系統(tǒng)中,當(dāng)用戶查詢特定型號的手機信息時,系統(tǒng)需要能夠精確理解用戶需求,然而,由于手機型號的復(fù)雜性和更新頻率,僅依賴傳統(tǒng)的關(guān)鍵詞匹配或單一的大模型來進(jìn)行實體抽取往往難以滿足實際應(yīng)用需求;

2、隨著手機品牌和型號的不斷推陳出新,手機型號命名不再局限于簡單的數(shù)字和字母組合,還包括諸如品牌簡稱、系列縮寫、特殊后綴等多樣化的表達(dá)形式,同時,為了應(yīng)對用戶的非標(biāo)準(zhǔn)化輸入,智能客服系統(tǒng)在處理各種描述、簡稱和口語表達(dá)上面臨巨大的挑戰(zhàn),例如,用戶可能會以簡寫、別稱甚至是模糊的描述來提及手機型號,使得傳統(tǒng)的抽取和映射方法很難覆蓋所有表達(dá)情況,此外,不同的手機品牌具有各自的命名規(guī)則,進(jìn)一步增加了系統(tǒng)準(zhǔn)確識別和匹配的復(fù)雜性;

3、而我們發(fā)現(xiàn)現(xiàn)有技術(shù)中存在以下缺陷:

4、1.關(guān)鍵詞匹配的覆蓋不足:現(xiàn)有的手機型號識別方法大多依賴關(guān)鍵詞匹配技術(shù),通過預(yù)先構(gòu)建一個包含品牌和型號的詞典來進(jìn)行匹配。然而,由于手機市場新品層出不窮,這類詞典需要頻繁更新,維護(hù)成本較高,且難以實時涵蓋所有新推出的型號。此外,關(guān)鍵詞匹配方法在遇到型號的各種別稱和縮寫時,往往存在識別錯誤或遺漏的問題;

5、2.基于實體抽取的數(shù)據(jù)量受限:當(dāng)前的實體抽取方法在手機型號識別領(lǐng)域表現(xiàn)出一定的潛力,尤其是在包含一定數(shù)據(jù)規(guī)模的語料訓(xùn)練下。然而,由于手機型號種類繁多,單一的數(shù)據(jù)集難以涵蓋所有可能的表達(dá)方式,導(dǎo)致模型的訓(xùn)練效果不足。同時,不同用戶可能以不同的形式描述同一型號(如使用縮寫或昵稱),導(dǎo)致現(xiàn)有方法難以應(yīng)對實際應(yīng)用中各種非標(biāo)準(zhǔn)化的輸入表達(dá);

6、3.純大模型的效率問題:在手機型號識別的具體任務(wù)中,直接依賴大型語言模型進(jìn)行實體抽取雖然能夠提高覆蓋度,但對于每個用戶輸入進(jìn)行候選型號的逐一抽取,帶來了極大的計算開銷。大型模型在處理長文本或復(fù)雜語句時需要消耗大量的計算資源和時間,尤其是在高并發(fā)環(huán)境下,影響了系統(tǒng)的響應(yīng)速度和用戶體驗。這種方法的處理成本較高,且難以滿足實時響應(yīng)的需求;

7、以上缺陷表明了當(dāng)前手機型號識別技術(shù)在關(guān)鍵詞匹配、實體抽取和大型模型應(yīng)用中的不足。


技術(shù)實現(xiàn)思路

1、本發(fā)明的目的在于提供一種大小模型協(xié)同處理的手機型號智能推薦系統(tǒng),通過引入大小模型協(xié)同機制,實現(xiàn)高效且準(zhǔn)確的手機型號識別與標(biāo)準(zhǔn)化映射并進(jìn)行推薦,以解決上述背景技術(shù)中提出的問題。

2、為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種大小模型協(xié)同處理的手機型號智能推薦系統(tǒng),包括:

3、意圖分類模塊,對用戶輸入的文本內(nèi)容進(jìn)行識別,同時進(jìn)行意圖場景區(qū)分,并標(biāo)記對應(yīng)的意圖類別標(biāo)簽;

4、實體識別模塊,從用戶輸入的文本內(nèi)容中提取產(chǎn)品品牌與型號實體,并對品牌與型號的實體內(nèi)容和非實體內(nèi)容進(jìn)行定義標(biāo)簽,反向優(yōu)化所述實體識別模塊;

5、型號推理模塊,通過維護(hù)一個包含品牌標(biāo)準(zhǔn)名稱和別名映射的詞典,并根據(jù)意圖類別標(biāo)簽將上述實體識別模塊提取的品牌與型號實體,在詞典中進(jìn)行標(biāo)準(zhǔn)名匹配,同時進(jìn)行向量相似匹配,輸出型號及品牌的候選集;

6、型號推薦模塊,根據(jù)用戶輸入的文本內(nèi)容,判斷輸入情境,同時利用根據(jù)輸入情境搭建的思維鏈提示詞,動態(tài)維護(hù)并篩選上述型號推理模塊中生成的候選集,推薦最符合用戶需求的品牌型號。

7、作為優(yōu)選,所述意圖分類模塊與所述實體識別模塊中均包括有用于數(shù)據(jù)擴增處理的數(shù)據(jù)收集模塊,具體方法如下:

8、首先從各個平臺中采集包含各種產(chǎn)品品牌和型號的文本內(nèi)容,構(gòu)建相關(guān)的數(shù)據(jù)集,采集的樣本應(yīng)覆蓋多種品牌和型號的真實產(chǎn)品名稱;

9、其次將采集的數(shù)據(jù)進(jìn)行標(biāo)注處理,并存儲為結(jié)構(gòu)化的json格式文件,每條數(shù)據(jù)包含若干個字段;

10、最后對數(shù)據(jù)集進(jìn)行擴增,增強表達(dá)形式的覆蓋,其中包括:同義詞替換、縮寫擴展與替換品牌或型號擴充數(shù)據(jù)樣本的品牌泛化。

11、作為優(yōu)選,所述意圖分類模塊中每條數(shù)據(jù)均包括取值為“推薦產(chǎn)品型號”或“非推薦產(chǎn)品型號”的意圖標(biāo)簽字段;

12、所述實體識別模塊中每條數(shù)據(jù)均包括含有實體類別、實體值以及在文本內(nèi)容中的起始和結(jié)束位置的實體列表標(biāo)簽字段。

13、作為優(yōu)選,所述意圖分類模塊中還包括利用采集的數(shù)據(jù)進(jìn)行意圖分類訓(xùn)練的分類模型訓(xùn)練模塊,具體方法如下:

14、s101:特征向量提取,使用語義向量提取模型bert對采集的數(shù)據(jù)進(jìn)行詞向量化,確保采集的數(shù)據(jù)中語義和上下文信息,處理后,每條數(shù)據(jù)將轉(zhuǎn)換為一個固定長度的向量;

15、s102:輸入特征向量至分類模型,將提取的特征向量輸入到distilbert模型中,distilbert模型對輸入的特征向量進(jìn)行層級處理,逐步提取更高級的語義和上下文信息,輸出一個保留句子中重要語義信息的固定長度的特征表示;

16、s103:特征向量傳遞至全連接層,將上述的特征表示傳遞到一個全連接層,該層對特征進(jìn)行線性變換,將高維特征向量映射為一個用于分類的低維特征向量,得到每個類別的logits值,最后輸出類別的logits值;

17、s104:logits值傳遞至softmax層,將logits值轉(zhuǎn)化為兩個類別的概率值,以確定輸入文本屬于“推薦產(chǎn)品型號”還是“非推薦產(chǎn)品型號”類別;

18、s105:計算交叉熵?fù)p失,將softmax層的輸出概率與實際標(biāo)簽進(jìn)行比較,計算交叉熵?fù)p失,衡量模型預(yù)測與真實標(biāo)簽之間的差異,輸出單個樣本的損失值;

19、s106:反向傳播優(yōu)化模型,利用計算出的損失值,通過反向傳播算法(如adam優(yōu)化器)更新模型的參數(shù),使模型逐步學(xué)習(xí)到每個類別的特征,使損失函數(shù)收斂,從而優(yōu)化模型性能,訓(xùn)練完成后,保存最終的模型參數(shù),并部署使用,記錄為m推薦分類。

20、作為優(yōu)選,所述實體識別模塊中還包括利用采集的數(shù)據(jù)進(jìn)行實體識別訓(xùn)練的實體識別訓(xùn)練模塊,從文本內(nèi)容中從中提取出品牌和型號實體的具體步驟如下:

21、s201:采用bert模型對采集的數(shù)據(jù)進(jìn)行詞級別的向量化,將每個句子將轉(zhuǎn)換為一個序列,每個詞語對應(yīng)一個特征向量;

22、s202:將bert輸出的詞向量序列輸入到雙向長短期記憶網(wǎng)絡(luò)(bilstm)層,以捕獲句子的上下文序列信息,輸出包含上下文信息的詞級別特征表示;

23、s203:將上述輸出的特征表示傳遞到條件隨機場(crf)層,以建模標(biāo)簽之間的依賴關(guān)系,crf層計算所有可能的標(biāo)簽序列的得分,選擇得分最高的標(biāo)簽序列作為預(yù)測結(jié)果,輸出每個詞的預(yù)測標(biāo)簽;

24、s204:計算損失函數(shù),輸入預(yù)測的標(biāo)簽序列和真實的標(biāo)簽序列,使用crf層自帶的對數(shù)似然損失函數(shù),計算負(fù)對數(shù)似然損失,衡量模型對訓(xùn)練數(shù)據(jù)的擬合程度,計算模型預(yù)測標(biāo)簽序列與真實標(biāo)簽序列之間的差異,輸出損失值;

25、s205:利用計算出的損失值,通過反向傳播算法(如adam優(yōu)化器)更新模型的參數(shù),根據(jù)損失梯度調(diào)整模型的參數(shù),使模型逐步學(xué)習(xí)到實體的特征,訓(xùn)練完成后,保存最終的模型參數(shù),并部署使用,記為m品牌類型實體抽取。

26、作為優(yōu)選,所述實體識別模塊中定義標(biāo)簽采用bio標(biāo)注方式,對每個詞進(jìn)行標(biāo)注,具體為:

27、?-?b-品牌:品牌實體的開頭詞;

28、?-?i-品牌:品牌實體的內(nèi)部詞;

29、?-?b-型號:型號實體的開頭詞;

30、?-?i-型號:型號實體的內(nèi)部詞;

31、?-?o:非實體詞。

32、作為優(yōu)選,所述型號推理模塊包括對品牌標(biāo)準(zhǔn)名稱和別名映射詞典的動態(tài)維護(hù)更新,具體方法包括以下步驟:

33、s301:數(shù)據(jù)源接入與定期更新,接入各個平臺的數(shù)據(jù),實時獲取對應(yīng)產(chǎn)品品牌、系列與型號,包含標(biāo)準(zhǔn)名稱和別名數(shù)據(jù)來豐富原有的詞典,對獲取的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗與格式統(tǒng)一,清洗與統(tǒng)一后的數(shù)據(jù)進(jìn)入標(biāo)準(zhǔn)詞典候選條目庫d候選,供進(jìn)一步的別名抽取和頻率分析;

34、s302:基于頻率的別名抽取與映射,在數(shù)據(jù)清洗后,系統(tǒng)對候選庫d候選中的型號進(jìn)行頻率統(tǒng)計,識別出高頻別名,并通過映射機制,將用戶的非標(biāo)準(zhǔn)化描述與詞典中已有的標(biāo)準(zhǔn)型號進(jìn)行關(guān)聯(lián),該步驟包括頻次分析、高頻別名映射和未匹配別名的聚類:

35、高頻別名頻次分析:對每次更新中采集的d候選型號進(jìn)行頻率統(tǒng)計,記錄每個描述的出現(xiàn)次數(shù),若某描述在一天內(nèi)的出現(xiàn)次數(shù)超過設(shè)定的頻次閾值,則為高頻別名,記為aliahigh-freq,將該別名作為候選條目,進(jìn)入下一個處理流程;

36、高頻別名映射:系統(tǒng)利用預(yù)訓(xùn)練語言模型(如bert或word2vec)為詞典中每條描述的標(biāo)準(zhǔn)名及別名生成向量表示vech,并存儲于向量數(shù)據(jù)庫中,便于后續(xù)匹配;

37、對高頻別名aliahigh-freq生成向量,表示為vecalia_h,將高頻別名向量vecalia_h?與詞典向量vech進(jìn)行余弦相似度計算,若高頻別名與詞典中已有型號的相似度高于閾值,則標(biāo)記為“已匹配高頻別名”;否則,標(biāo)記為“未匹配高頻別名”;

38、未匹配別名的聚類處理:對于未匹配的高頻別名,系統(tǒng)將通過聚類算法進(jìn)行自動分組,將相似描述歸為同一類,并選取頻率最高的描述作為標(biāo)準(zhǔn)描述,具體為:

39、對未匹配的高頻別名進(jìn)行dbscan等聚類算法處理,將相似度較高的描述歸為同一簇;

40、在每個簇中,根據(jù)頻次信息選擇出現(xiàn)頻率最高的描述作為標(biāo)準(zhǔn)描述,其余描述作為該標(biāo)準(zhǔn)描述的別名;

41、結(jié)合詞典中的品牌信息,為聚類生成的標(biāo)準(zhǔn)描述補充品牌信息,聚類結(jié)果將作為新增候選條目;

42、s303:詞典更新與優(yōu)化,將已匹配的高頻別名直接加入詞典的別名列表,以擴展詞典的覆蓋范圍,對于未匹配的高頻別名生成的候選條目,將其加入候選隊列q,并通過人工審核確認(rèn)后正式加入詞典,同時系統(tǒng)將定期清理詞典中使用頻率較低的描述,將其移入備用詞庫;

43、低頻描述清理:根據(jù)使用頻率設(shè)定閾值(如一年內(nèi)出現(xiàn)次數(shù)少于10次),將低頻描述從詞典移至備用詞庫;

44、備用詞庫調(diào)用:被清理的描述仍存儲于備用詞庫,以備特殊查詢時調(diào)用,避免誤刪用戶的個性化表達(dá)。

45、作為優(yōu)選,所述型號推理模塊還包括基于關(guān)鍵詞對品牌型號進(jìn)行匹配,具體的匹配方法步驟為:

46、首先進(jìn)行關(guān)鍵詞匹配,使用多層正則表達(dá)式匹配,對句子中出現(xiàn)的品牌或型號詞匯進(jìn)行快速篩選,形成候選品牌型號列表,基于詞典中已存在的品牌和型號構(gòu)建正則表達(dá)式:

47、品牌表達(dá)式:對系統(tǒng)中已有的品牌名稱及其別名,構(gòu)建品牌匹配的正則表達(dá)式;型號表達(dá)式:對系統(tǒng)中已有的標(biāo)準(zhǔn)型號和別名構(gòu)建型號匹配的正則表達(dá)式;對用戶輸入語句,利用上述正則表達(dá)式進(jìn)行篩選,提取出符合條件的候選品牌和型號;

48、其次進(jìn)行向量相似匹配,進(jìn)一步擴充候選集,通過語義層面的匹配提升解析效果,對用戶輸入文本內(nèi)容利用所述實體識別模塊提取品牌型號實體,提取向量vinput,再利用標(biāo)準(zhǔn)名-別名詞典生成的向量vech,對vinput與vech計算余弦相似度,提取相似型號,最終形成產(chǎn)品型號及品牌的候選集。

49、作為優(yōu)選,所述型號推薦模塊包括對用戶需求的推理分析模塊,具體的推理分析方法步驟為:

50、s401:輸入數(shù)據(jù)準(zhǔn)備,收集用戶在當(dāng)前會話中的所有歷史對話內(nèi)容,包括之前的詢問、偏好、否定條件等信息,同時獲取用戶的最新輸入以及候選集;

51、s402:情境判斷,根據(jù)用戶的歷史對話和當(dāng)前問題,判斷用戶的輸入情境,具體為:初次需求表達(dá)、遞進(jìn)需求表達(dá)與否定條件表達(dá);

52、s403:選擇合適的推理流程和思維鏈提示詞,根據(jù)情境判斷結(jié)果,選擇相應(yīng)的推理流程,并設(shè)計思維鏈提示詞,引導(dǎo)模型按預(yù)期邏輯進(jìn)行推理;

53、s404:執(zhí)行大模型推理,將構(gòu)建的思維鏈提示詞和輸入數(shù)據(jù)一起傳遞給模型,執(zhí)行推理過程,得到模型的輸出結(jié)果;

54、s405:結(jié)果解析與輸出,解析模型的輸出,得到最終的推薦型號列表和推薦理由反饋給用戶。

55、作為優(yōu)選,所述思維鏈提示詞的構(gòu)建包括:

56、角色設(shè)定:明確模型的角色和任務(wù);

57、任務(wù)說明:詳細(xì)描述模型需要完成的任務(wù)目標(biāo);

58、輸入說明:明確輸入數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容;

59、思維鏈推理步驟:逐步描述模型需要進(jìn)行的推理步驟;

60、輸出格式:指定輸出結(jié)果的格式,確保結(jié)果一致性和易解析。

61、作為優(yōu)選,所述型號推薦模塊中還包括對最終形成產(chǎn)品型號及品牌的候選集進(jìn)行調(diào)整解析,當(dāng)候選列表中的型號過多時,模塊將通過進(jìn)一步篩選,減少冗余,只保留最符合用戶描述的核心型號;當(dāng)未能識別出用戶需求的所有相關(guān)型號時,模塊將通過模型解析用戶輸入的細(xì)節(jié),補充遺漏的候選型號,確保用戶需求不被忽略。

62、綜上所述,本發(fā)明有益效果是:

63、1、協(xié)同優(yōu)化的識別機制:引入大小模型協(xié)同機制,首先通過小模型進(jìn)行快速過濾與匹配,迅速篩選出可能的候選型號,以提升后續(xù)處理效率并降低計算資源消耗,隨后,大模型負(fù)責(zé)復(fù)雜場景的深度語義理解,從而精準(zhǔn)解析多樣化輸入表達(dá),對復(fù)雜推薦場景進(jìn)行補充和校正,從而更準(zhǔn)確地映射到標(biāo)準(zhǔn)化的手機型號,此協(xié)同優(yōu)化機制顯著提高了系統(tǒng)在應(yīng)對不同輸入形式時的靈活性,實現(xiàn)了高效、精準(zhǔn)的手機型號識別。

64、2、上下文理解的增強:基于大小模型的協(xié)同框架,本發(fā)明能夠更好地捕捉和理解用戶對手機型號的多種描述和上下文信息,此方法不僅僅基于單一的詞匯匹配,而是能夠結(jié)合上下文和語境,通過大模型對復(fù)雜推薦場景進(jìn)行補充和校正,從而更準(zhǔn)確地映射到標(biāo)準(zhǔn)化的手機型號。

65、3、動態(tài)更新和行業(yè)適配:考慮到手機型號的更新頻率以及不同品牌命名規(guī)則的多樣性,本發(fā)明引入了動態(tài)更新機制和行業(yè)適配策略,此方法允許模型適應(yīng)新型號的推出并及時更新字典,以保持高效、準(zhǔn)確的識別和匹配能力,從而確保在快速變化的手機行業(yè)環(huán)境中始終保持識別的準(zhǔn)確性和實用性。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
乳山市| 东宁县| 桐乡市| 海淀区| 永寿县| 周至县| 和田市| 房产| 德令哈市| 赤壁市| 卓资县| 饶河县| 汝城县| 山西省| 通州区| 台东县| 长白| 永嘉县| 南投县| 梁山县| 房产| 通榆县| 曲松县| 宝兴县| 天祝| 同仁县| 密山市| 潮州市| 同江市| 苏尼特左旗| 陇川县| 阜阳市| 普陀区| 景洪市| 湘潭市| 偏关县| 出国| 兴宁市| 乐昌市| 毕节市| 新兴县|