本發(fā)明涉及語音講解,尤其涉及一種基于aigc大模型的智能互動語音講解系統(tǒng)。
背景技術(shù):
1、語音講解技術(shù)領(lǐng)域涉及通過語音輸出傳遞信息和知識。語音講解技術(shù)用以實現(xiàn)從文本到語音的轉(zhuǎn)換,以及理解和響應(yīng)用戶命令的功能。隨著人工智能的發(fā)展,語音講解技術(shù)已廣泛應(yīng)用于各種智能助手、教育工具和客戶服務(wù)系統(tǒng)中,通過自然語言生成技術(shù)提升交互體驗的自然性和流暢性。旨在改善信息獲取的便捷性和有效性方,特別是在駕駛導(dǎo)航、虛擬助理以及無障礙技術(shù)應(yīng)用中具有廣泛的應(yīng)用前景。
2、其中,智能互動語音講解器是一種利用語音講解技術(shù)實現(xiàn)的系統(tǒng),旨在通過人工智能驅(qū)動的交互式語音響應(yīng)來提供信息和指導(dǎo)。系統(tǒng)通常包括一個中央處理單元,用于處理輸入的語音命令并生成相應(yīng)的語音反饋。用途包括為用戶提供即時的信息講解,如博物館展品介紹、公共場所指引或教育內(nèi)容講解。系統(tǒng)設(shè)計注重用戶交互的實時性和準(zhǔn)確性,能夠根據(jù)用戶的詢問提供定制化的信息輸出,豐富用戶的學(xué)習(xí)和體驗過程。
3、傳統(tǒng)講解器依賴預(yù)設(shè)的解說詞,難以實時調(diào)整和更新信息,導(dǎo)致用戶在接收信息時可能感受到內(nèi)容的過時或與當(dāng)前環(huán)境不匹配。傳統(tǒng)講解器在理解用戶具體需求方面的精確度不足,無法準(zhǔn)確捕捉用戶的意圖和需求變化,限制了交互的自然性和用戶體驗的連貫性,會造成信息傳遞的局限性和用戶體驗的斷層,影響用戶的游覽體驗。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是解決現(xiàn)有技術(shù)中存在的缺點,而提出的一種基于aigc大模型的智能互動語音講解系統(tǒng)。
2、為了實現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:一種基于aigc大模型的智能互動語音講解系統(tǒng),包括智能互動語音講解器主體(1),所述智能互動語音講解器主體(1)內(nèi)部搭載存儲器和處理器,所述存儲器中存儲有計算機(jī)程序,所述處理器執(zhí)行計算機(jī)程序?qū)崿F(xiàn)基于aigc大模型的智能互動語音講解系統(tǒng),所述系統(tǒng)包括:
3、游客意圖識別模塊基于游客提出的疑問和要求語言,將語音內(nèi)容轉(zhuǎn)化為文字,提取解說需求中的關(guān)鍵詞和短語,并通過分析游客的語音,識別游客的解說需求,得到游客解說需求識別結(jié)果;
4、標(biāo)準(zhǔn)解說詞匹配模塊基于所述游客解說需求識別結(jié)果,檢索預(yù)設(shè)的標(biāo)準(zhǔn)解說詞庫,識別匹配的標(biāo)準(zhǔn)解說詞內(nèi)容,得到標(biāo)準(zhǔn)解說詞匹配結(jié)果;
5、解說內(nèi)容補(bǔ)充模塊基于所述標(biāo)準(zhǔn)解說詞匹配結(jié)果和游客解說需求識別結(jié)果,分析現(xiàn)有解說詞中的信息覆蓋率,判斷標(biāo)準(zhǔn)解說詞是否存在遺漏的解說內(nèi)容,利用aigc大模型的知識庫,搜索匹配的解說補(bǔ)充內(nèi)容,評估補(bǔ)充內(nèi)容的有效性,選擇有效補(bǔ)充內(nèi)容,得到補(bǔ)充內(nèi)容列表;
6、解說內(nèi)容播報模塊基于所述補(bǔ)充內(nèi)容列表,結(jié)合游客當(dāng)前所處環(huán)境,選擇匹配當(dāng)前環(huán)境的補(bǔ)充內(nèi)容,結(jié)合所述標(biāo)準(zhǔn)解說詞匹配結(jié)果,對文本進(jìn)行編排整合,并將文本轉(zhuǎn)換為語音,調(diào)整語音語速和音調(diào),進(jìn)行語音解說,得到互動解說結(jié)果;
7、基于aigc大模型的智能互動語音講解系統(tǒng)通過處理器執(zhí)行計算機(jī)程序?qū)崿F(xiàn),計算機(jī)程序存儲在存儲器中,存儲器和處理器搭載在智能互動語音講解器主體(1)內(nèi)。
8、本發(fā)明改進(jìn)有,所述提取解說需求中的關(guān)鍵詞和短語的方法為:
9、基于游客提出的疑問和要求語言,通過語音識別,將語音內(nèi)容轉(zhuǎn)化為文字,將文本內(nèi)容分割成單獨(dú)的詞匯和短語,得到詞匯和短語分割信息;
10、基于所述詞匯和短語分割信息,通過公式:
11、
12、計算詞匯的權(quán)重,其中,是第個詞匯在文本中出現(xiàn)的次數(shù),是第個詞匯的長度,是文本中的總詞匯數(shù),是歷史提問數(shù)據(jù)集中的文本總數(shù),是包含第個詞匯的文本數(shù)量,、和是權(quán)重參數(shù),是第個詞匯的權(quán)重;
13、基于所述詞匯的權(quán)重,與預(yù)設(shè)關(guān)鍵詞閾值進(jìn)行對比,將超過預(yù)設(shè)關(guān)鍵詞閾值的詞語標(biāo)記為關(guān)鍵詞,得到解說需求關(guān)鍵詞識別結(jié)果。
14、本發(fā)明改進(jìn)有,所述游客解說需求識別結(jié)果的獲取步驟為:
15、基于所述解說需求關(guān)鍵詞識別結(jié)果,結(jié)合游客情緒識別數(shù)據(jù),通過公式:
16、
17、計算游客的解說需求指數(shù),其中,代表第個詞語的情緒強(qiáng)度指數(shù),是第個詞語的語義相關(guān)度分?jǐn)?shù),是調(diào)整系數(shù),是第個詞語情緒強(qiáng)度的平均值,表示詞語總數(shù),為游客的解說需求指數(shù);
18、基于所述游客的解說需求指數(shù),根據(jù)值的大小,判斷解說需求強(qiáng)度,得到游客解說需求識別結(jié)果。
19、本發(fā)明改進(jìn)有,所述標(biāo)準(zhǔn)解說詞匹配結(jié)果的獲取步驟為:
20、基于所述游客解說需求識別結(jié)果,根據(jù)識別的解說需求關(guān)鍵詞,檢索預(yù)設(shè)的標(biāo)準(zhǔn)解說詞庫,并通過公式:
21、
22、計算標(biāo)準(zhǔn)解說詞與解說需求的匹配度得分,其中,是第個關(guān)鍵詞權(quán)重因子,是解說詞與查詢關(guān)鍵詞之間的相似度分?jǐn)?shù),是關(guān)鍵詞總數(shù),為匹配度得分;
23、基于所述匹配度得分,通過比較值的大小,選擇值最大的標(biāo)準(zhǔn)解說詞作為匹配標(biāo)準(zhǔn)解說詞,得到標(biāo)準(zhǔn)解說詞匹配結(jié)果。
24、本發(fā)明改進(jìn)有,所述判斷標(biāo)準(zhǔn)解說詞是否存在遺漏的解說內(nèi)容的方法為:
25、基于所述標(biāo)準(zhǔn)解說詞匹配結(jié)果和游客解說需求識別結(jié)果,通過公式:
26、
27、計算標(biāo)準(zhǔn)解說詞的解說內(nèi)容覆蓋率,其中,表示解說內(nèi)容覆蓋率,為標(biāo)準(zhǔn)解說詞中第個關(guān)鍵詞的向量,為游客需求中的第個關(guān)鍵詞的向量,是指數(shù)參數(shù),是正規(guī)化常數(shù),為參與計算的關(guān)鍵詞總數(shù);
28、基于所述解說內(nèi)容覆蓋率,與預(yù)設(shè)的內(nèi)容覆蓋率閾值進(jìn)行對比,若值低于內(nèi)容覆蓋率閾值,則判斷需要補(bǔ)充解說內(nèi)容,并通過對比標(biāo)準(zhǔn)解說詞中的關(guān)鍵詞與游客解說需求的關(guān)鍵詞,識別標(biāo)準(zhǔn)解說詞中缺少的關(guān)鍵詞,得到補(bǔ)充內(nèi)容需求信息。
29、本發(fā)明改進(jìn)有,所述補(bǔ)充內(nèi)容列表的獲取步驟為:
30、基于所述補(bǔ)充內(nèi)容需求信息,利用aigc大模型的知識庫,搜索匹配的解說補(bǔ)充內(nèi)容,得到補(bǔ)充內(nèi)容檢索結(jié)果;
31、基于所述補(bǔ)充內(nèi)容檢索結(jié)果,通過公式:
32、
33、計算補(bǔ)充內(nèi)容的有效性評分其中,是第個內(nèi)容項的相關(guān)性評分,是第個內(nèi)容項的豐富度評分,是加權(quán)指數(shù),為歸一化因子,為內(nèi)容項總數(shù),為有效性評分;
34、基于所述有效性評分,與預(yù)設(shè)的有效性閾值進(jìn)行對比,將值超過預(yù)設(shè)有效性閾值的補(bǔ)充內(nèi)容標(biāo)記為有效,得到補(bǔ)充內(nèi)容列表。
35、本發(fā)明改進(jìn)有,所述選擇匹配當(dāng)前環(huán)境的補(bǔ)充內(nèi)容的方法為:
36、基于所述補(bǔ)充內(nèi)容列表,收集游客當(dāng)前所處的物理和文化環(huán)境,包括地理位置、文化背景和環(huán)境因素,得到實時環(huán)境數(shù)據(jù);
37、基于所述實時環(huán)境數(shù)據(jù),通過公式:
38、計算補(bǔ)充內(nèi)容的匹配度評分,其中是第個內(nèi)容項的環(huán)境適應(yīng)性權(quán)重,?是第個內(nèi)容項與環(huán)境匹配的二元指標(biāo),是內(nèi)容項總數(shù),為補(bǔ)充內(nèi)容的匹配度評分;
39、基于所述補(bǔ)充內(nèi)容的匹配度評分,與預(yù)設(shè)的匹配度閾值進(jìn)行對比,選擇值超過匹配度閾值的補(bǔ)充內(nèi)容,得到補(bǔ)充內(nèi)容選定結(jié)果。
40、本發(fā)明改進(jìn)有,所述互動解說結(jié)果的獲取步驟為:
41、基于所述補(bǔ)充內(nèi)容選定結(jié)果,結(jié)合所述標(biāo)準(zhǔn)解說詞匹配結(jié)果,對文本進(jìn)行編排整合,并將文本轉(zhuǎn)換為語音,得到語音轉(zhuǎn)化結(jié)果;
42、基于所述語音轉(zhuǎn)化結(jié)果,通過公式:
43、計算調(diào)整后的語速,并通過公式:
44、計算調(diào)整后的音調(diào),其中,為基準(zhǔn)語速,為基準(zhǔn)音調(diào),為語速調(diào)整系數(shù),為音調(diào)調(diào)整系數(shù),為環(huán)境影響因子,為內(nèi)容類型因子,為語速的正規(guī)化因子,為自然對數(shù)的底數(shù),為調(diào)整后的語速,為調(diào)整后的音調(diào);
45、基于所述調(diào)整后的語速和調(diào)整后的音調(diào),進(jìn)行語音解說,得到互動解說結(jié)果。
46、與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點和積極效果在于:
47、本發(fā)明中,通過將游客語音轉(zhuǎn)換文本,提取游客需求中的關(guān)鍵信息,對游客需求分析,能夠及時識別匹配的標(biāo)準(zhǔn)解說內(nèi)容,并通過分析解說詞的信息覆蓋率,搜索補(bǔ)充內(nèi)容,豐富了解說資料的詳實性和教育價值,提高了解說內(nèi)容的相關(guān)性和針對性,并通過調(diào)整語音的語速和音調(diào),增強(qiáng)了語音輸出的自然性,為游客創(chuàng)造了更加沉浸和個性化的體驗,豐富了游客的互動體驗和信息獲取的便捷性。