本發(fā)明涉及ai領域,尤其涉及一種基于智能化識別的用戶意識及關鍵詞提取系統(tǒng)。
背景技術:
1、隨著互聯(lián)網(wǎng)的快速發(fā)展和智能化技術的不斷成熟,人們在日常生活和工作中產(chǎn)生了大量的文本和語音數(shù)據(jù)。然而,這些海量的數(shù)據(jù)往往難以直接理解和利用,給信息管理和智能化服務帶來了挑戰(zhàn)。為了更好地理解和利用這些數(shù)據(jù),自然語言處理(nlp)技術應運而生,成為處理和分析文本和語音數(shù)據(jù)的重要工具。當前,基于nlp技術的智能化系統(tǒng)在多個領域取得了廣泛應用,如智能客服、智能搜索、輿情監(jiān)測、智能翻譯等。
2、如cn1198225c的現(xiàn)有技術公開了的?關鍵字提取系統(tǒng)及采用該系統(tǒng)的文本檢索系統(tǒng),系統(tǒng)為構成文本庫的每個文本生成文本中所用每個單字的單字id以及相應單字的單字出現(xiàn)計數(shù)。系統(tǒng)為構成文本庫的任一文本中所用的每個單字生成總的單字出現(xiàn)計數(shù)和包含文本計數(shù),它表示包含該單字的文本數(shù)。對于所選文本中所含的每個單字,利用該單字出現(xiàn)計數(shù)、總的單字出現(xiàn)計數(shù)和包含文本計數(shù)計算重要度。按照重要度順序對所選文本中所含的單字排序。至少有一部分排序單字作為所選關鍵字顯示。
3、另一種典型的如cn112784021a的現(xiàn)有技術公開的用于使用從評論提取的關鍵字的系統(tǒng)和方法,一種用于生成搜索結果的方法和系統(tǒng)。在一些示例中,從與商業(yè)出售物相關聯(lián)的一個或多個存儲的評論提取一個或多個關鍵字。第一提取的關鍵字與商業(yè)出售物的存儲的列表相關聯(lián)。第一提取的關鍵字可不在存儲的列表中。響應于包括第一關鍵字的搜索詢問,提供搜索結果的集合,其中搜索結果的集合包括與第一關鍵字相關聯(lián)的列表。
4、再來看如cn1345426a的現(xiàn)有技術公開的用于提取索引關鍵字數(shù)據(jù)字段的系統(tǒng)和方法,該系統(tǒng)含有用于從一個數(shù)據(jù)庫中提取索引定義和列定義的定義查詢器。該系統(tǒng)還含有與定義查詢器相連的代碼發(fā)生器。代碼發(fā)生器能夠根據(jù)索引定義和列定義建立用于提取索引關鍵字數(shù)據(jù)字段的計算機代碼。一個表分析器與代碼發(fā)生器相連,并利用計算機代碼從數(shù)據(jù)表中提取索引數(shù)據(jù)。
5、現(xiàn)有的自然語言處理技術往往依靠詞典庫進行分詞和語義識別,當出現(xiàn)一些新詞或專有名詞時往往無法正確識別,在使用中造成諸多不便,為了解決本領域普遍存在的問題,作出了本發(fā)明。
技術實現(xiàn)思路
1、本發(fā)明的目的在于,針對目前所存在的不足,提出了一種防碾壓抗干擾直流充電用電力電纜。
2、為了克服現(xiàn)有技術的不足,本發(fā)明采用如下技術方案:一種基于智能化識別的用戶意識及關鍵詞提取系統(tǒng),包括意識理解模塊、自動回復模塊、用戶界面以及數(shù)據(jù)反饋優(yōu)化模塊;所述用戶界面用于接收用戶的輸入信息或輸出自動回復模塊的回復信息,所述意識理解模塊用于分析所述用戶界面接收的輸入信息并根據(jù)輸入信息識別語義和提取關鍵字,所述自動回復模塊用于根據(jù)所述意識理解模塊的分析結果生成回復信息并將回復信息發(fā)送到所述用戶界面,所述數(shù)據(jù)反饋優(yōu)化模塊用于接收用戶對回復信息的反饋和并根據(jù)反饋信息對意識理解模塊和自動回復模塊進行優(yōu)化。
3、更進一步的,所述意識理解模塊包括輸入信息接收單元、預處理單元、語義分析單元和關鍵詞提取單元,所述信息接收單元用于接收用戶界面收到的輸入信息,所述預處理單元對輸入信息進行預處理,所述預處理包括降噪和輸入信息轉化,所述輸入信息轉化包括將語音信息轉化為文本信息,所述語義分析單元用于分析文本信息的語義,所述關鍵詞提取單元用于從文本信息中提取關鍵詞。
4、更進一步的,所述自動回復模塊包括回復生成器和回復輸出單元,所述回復生成器用于根據(jù)所述意識理解模塊的分析結果生成對應的回復信息,所述回復輸出單元用于輸出回復信息到所述用戶界面,所述回復生成器包括規(guī)則引擎,所述規(guī)則引擎用于根據(jù)所述語義分析單元分析的語義以及所述關鍵詞提取單元所提取的關鍵詞與回復規(guī)則進行匹配,并根據(jù)匹配結果過輸出對應的回復內(nèi)容。
5、更進一步的,所述語義分析單元包括分詞單元、詞性標注單元、詞典、句法分析單元和語義分析單元,所述分詞單元用于根據(jù)詞典將文本信息切分為詞語,所述詞性標注單元用于根據(jù)詞典對詞語的詞性進行標注,所述句法分析單元用于分析句子的結構和語法關系,所述語義分析單元用于根據(jù)所述分詞單元、詞性標注單元和句法分析單元的分析結果分析文本信息的語義。
6、更進一步的,所述用戶意識及關鍵詞提取系統(tǒng)的工作流程包括以下步驟:
7、s1,用戶界面接收用戶輸入的信息;
8、s2,意識理解模塊對用戶界面接收的輸入信息進行理解,將分析結果發(fā)送到自動回復模塊;
9、s3,自動回復模塊根據(jù)分析結果生成回復內(nèi)容;
10、s4,用戶界面顯示回復內(nèi)容,用戶在用戶界面進行反饋;
11、s5,數(shù)據(jù)反饋優(yōu)化模塊接收用戶的反饋信息并判斷回復內(nèi)容是否符合用戶預期,若回復內(nèi)容符合用戶預期,則將用戶的輸入信息補充到詞典中,并將意識理解模塊的分析結果和自動回復模塊的回復內(nèi)容補充到規(guī)則引擎的訓練集中;若回復內(nèi)容不符合用戶預期,則發(fā)送再提問請求到用戶界面。
12、更進一步的,所述意識理解模塊對用戶界面接收的輸入信息進行理解包括以下步驟:
13、s21,預處理單元對接收的輸入信息進行預處理,得到文本信息;
14、s22,分詞單元根據(jù)詞典將文本信息切分為詞語;
15、s23,詞性標注單元根據(jù)詞典對詞語的詞性進行標注;
16、s24,句法分析單元分析句子的結構和語法關系;
17、s25,語義分析單元根據(jù)所述分詞單元、詞性標注單元和句法分析單元的分析結果分析文本信息的語義;
18、s26,關鍵詞提取單元根據(jù)分詞單元的分詞結果,從分詞結果中提取關鍵詞。
19、更進一步的,所述自動回復模塊根據(jù)分析結果生成回復內(nèi)容包括以下步驟:
20、s31,根據(jù)關鍵詞提取單元所提取的關鍵詞,從數(shù)據(jù)庫中搜索對應的數(shù)據(jù);
21、s32,將接收的語義分析結果輸入到規(guī)則引擎中,規(guī)則引擎輸出對應的回復模板;
22、s33,將從數(shù)據(jù)庫中搜索到的數(shù)據(jù)填入回復模板中,得到回復信息;
23、s34,回復輸出單元將回復信息發(fā)送到用戶界面。
24、更進一步的,所述分詞單元根據(jù)詞典將文本信息切分為詞語包括以下步驟:
25、s221,從文本信息的開頭開始,獲取m個文字作為待切分字段,m為詞典中的詞語所包括的最多文字數(shù)量;
26、s222,將待切分字段與詞典中的詞語進行匹配,若成功則執(zhí)行s224,反之,執(zhí)行s223;
27、s223,從待切分字段中去掉最后一個文字,得到新的待切分字段,返回s222;
28、s224,將待切分字段從文本信息中作為已切分字段去除,返回s221,直到文本信息中的所有文字都被切分為詞語;
29、s225,根據(jù)下式判斷每個被切分的詞語的準確度指標:
30、;
31、其中,為準確度指標,x為被切分詞語前面的詞語數(shù)量,y為被切分詞語后面的詞語數(shù)量,為詞典中出現(xiàn)了被切分詞語的段落中,第x個詞語出現(xiàn)在被切分詞語前面的概率,為詞典中出現(xiàn)了被切分詞語的段落中,第y個詞語出現(xiàn)在被切分詞語后面的概率,為的相關度權重,為的相關度權重。
32、本發(fā)明所取得的有益效果是:1.通過意識理解模塊理解用戶的需求,根據(jù)用戶的需求從數(shù)據(jù)庫中搜索對應的數(shù)據(jù)并進行自動回復,并根據(jù)用戶的回復做出各種反應,全程無需人工操作,節(jié)省了勞動力。
33、2.通過準確度指標評價每個詞語的準確度,避免了系統(tǒng)遇到新詞或生僻詞時,將新詞或生僻詞進行強行識別,并根據(jù)強行識別的結果生成對應的回復,有利于提高回復的準確率,提高用戶的滿意度。