本發(fā)明涉及通訊領(lǐng)域,特別是涉及一種匹配職能部門的方法、裝置及計算機設(shè)備。
背景技術(shù):
現(xiàn)有市民在向市政部門報案,以獲取想要知道的職能部門對應(yīng)的信息時,需要人工接通市民的呼入電話,并人工分析報案內(nèi)容,分發(fā)到相應(yīng)區(qū)域相關(guān)職能部門。例如,當(dāng)用戶向市政部門反映垃圾隨處傾倒問題,則需要人工將該問題進行分析,查找到對應(yīng)的智能部門。整個過程全程都需要人工參與,人工成本較高,且市政服務(wù)效率較低,不利于市政建設(shè)。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種匹配職能部門的方法、裝置及計算機設(shè)備,用以解決現(xiàn)有技術(shù)的如下問題:現(xiàn)有市政服務(wù)系統(tǒng)工作時,全程都需要人工參與,人工成本較高,且市政服務(wù)效率較低,不利于市政建設(shè)。
為解決上述技術(shù)問題,一方面,本發(fā)明提供一種匹配職能部門的方法,其特征在于,包括:獲取報案文本信息,得到所述報案文本信息對應(yīng)的地名信息;根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與所述地名信息相匹配的地名;
根據(jù)匹配到的地名和預(yù)先輸入的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門。
可選的,所述根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與所述地名信息相匹配的地名,包括:分別計算所述地名信息與所述預(yù)設(shè)地名數(shù)據(jù)庫中各標(biāo)準(zhǔn)地名的語義相似度,將大于預(yù)設(shè)相似度閾值且最大的語義相似度對應(yīng)的標(biāo)準(zhǔn)地名作為與所述地名信息相匹配的地名。
可選的,所述根據(jù)匹配到的地名和預(yù)先輸入的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門之前,還包括:對預(yù)設(shè)的報案類別訓(xùn)練樣本集采用分類算法訓(xùn)練,得到報案類別分類器,其中,所述訓(xùn)練樣本集包括多個報案類別的樣本;獲取所述報案文本信息中的報案類別相關(guān)文本信息;將所述報案類別相關(guān)文本信息輸入所述報案類別分類器,得到所述預(yù)先輸入的報案類別。
可選的,所述分類算法包括以下一種或幾種:樸素貝葉斯nb分類算法、支持向量機svm分類算法、k最鄰近knn分類算法和隨機森林分類算法。
可選的,所述報案文本信息包括:報案時呼入電話的語音數(shù)據(jù)轉(zhuǎn)換后對應(yīng)的文本信息,或者,報案時發(fā)送的文本信息。
可選的,獲取報案文本信息,得到所述報案文本信息對應(yīng)的地名信息,包括:按照預(yù)定分詞方法對所述報案文本信息進行分詞處理,得到分詞結(jié)果;對所述分詞結(jié)果進行地名詞性標(biāo)注,得到地名詞集;
對所述地名詞集進行命名實體識別,得到地名實體;將所述地名實體對應(yīng)的地名詞作為該地名實體的所述地名信息。
可選的,所述預(yù)定分詞方法至少包括以下之一:字典雙向最大匹配法,hmm方法和crf方法。
可選的,根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與所述地名信息相匹配的地名,包括:s11,獲取所述地名信息中最低等級的地名詞;s12,所述預(yù)設(shè)地名數(shù)據(jù)庫中包括標(biāo)準(zhǔn)地名,根據(jù)所述地名詞按預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與獲取到的所述地名信息相匹配的所述標(biāo)準(zhǔn)地名,其中,所述標(biāo)準(zhǔn)地名為以最低等級的標(biāo)準(zhǔn)地名詞命名的地名。
可選的,在s12之后還包括:s13,在未搜索到相匹配的地名的情況下,獲取所述地名詞的上一個等級的地名詞,并根據(jù)獲取到的所述地名詞執(zhí)行s12過程,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
可選的,s12的根據(jù)所述地名詞按預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與獲取到的所述地名信息相匹配的標(biāo)準(zhǔn)地名,包括:分別計算所述地名詞與所述預(yù)設(shè)地名數(shù)據(jù)庫中各標(biāo)準(zhǔn)地名的語義相似度,將大于預(yù)設(shè)相似度閾值且最大的語義相似度對應(yīng)的標(biāo)準(zhǔn)地名作為與所述地名信息相匹配的地名。
可選的,s11包括:按照所述報案文本信息輸入順序?qū)⑺龅孛畔⒌牡孛~進行排列,得到所述地名詞列表;若所述地名詞為英文,則獲取所述地名詞列表中第一個地名詞作為最低等級的地名詞;若所述地名詞為中文,則獲取所述地名詞列表中最后一個地名詞作為最低等級的地名詞;
所述獲取所述地名詞的上一個等級的地名詞,包括:若所述地名詞為英文,則獲取所述地名詞列表中當(dāng)前地名詞的下一個地名詞;若所述地名詞為中文,則獲取所述地名詞列表中當(dāng)前地名詞的上一個地名詞。
可選的,根據(jù)匹配到的地名和預(yù)先輸入的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門之后,還包括以下一步或幾步:將所述職能部門的電話反饋至所述報案文本信息對應(yīng)的用戶終端;為所述報案文本信息對應(yīng)的用戶終端呼叫所述職能部門;將報案信息發(fā)送到所述職能部門的終端。
另一方面,本發(fā)明還提供一種匹配職能部門的裝置,包括:處理模塊,用于獲取報案文本信息,得到所述報案文本信息對應(yīng)的地名信息;
匹配模塊,用于根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與所述地名信息相匹配的地名;搜索模塊,用于根據(jù)匹配到的地名和預(yù)先輸入的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門。
可選的,所述匹配模塊,具體用于:分別計算所述地名信息與所述預(yù)設(shè)地名數(shù)據(jù)庫中各標(biāo)準(zhǔn)地名的語義相似度,將大于預(yù)設(shè)相似度閾值且最大的語義相似度對應(yīng)的標(biāo)準(zhǔn)地名作為與所述地名信息相匹配的地名。
可選的,還包括:訓(xùn)練模塊,用于對預(yù)設(shè)的報案類別訓(xùn)練樣本集采用分類算法訓(xùn)練,得到報案類別分類器,其中,所述訓(xùn)練樣本集包括多個報案類別的樣本;獲取所述報案文本信息中的報案類別相關(guān)文本信息;將所述報案類別相關(guān)文本信息輸入所述報案類別分類器,得到所述預(yù)先輸入的報案類別。
可選的,所述分類算法包括以下一種或幾種:樸素貝葉斯nb分類算法、支持向量機svm分類算法、k最鄰近knn分類算法和隨機森林分類算法。
可選的,所述報案文本信息包括:報案時呼入電話的語音數(shù)據(jù)轉(zhuǎn)換后對應(yīng)的文本信息,或者,報案時發(fā)送的文本信息。
可選的,所述處理模塊,包括:分詞單元,用于按照預(yù)定分詞方法對所述報案文本信息進行分詞處理,得到分詞結(jié)果;詞性標(biāo)注單元,用于對所述分詞結(jié)果進行地名詞性標(biāo)注,得到地名詞集;實體識別單元,用于對所述地名詞集進行命名實體識別,得到地名實體;將所述地名實體對應(yīng)的地名詞作為該地名實體的所述地名信息。
可選的,所述預(yù)定分詞方法至少包括以下之一:字典雙向最大匹配法,hmm方法和crf方法。
可選的,所述匹配模塊,包括:最低等級地名獲取單元,用于獲取所述地名信息中最低等級的地名詞;標(biāo)準(zhǔn)地名獲取單元,用于所述預(yù)設(shè)地名數(shù)據(jù)庫中包括標(biāo)準(zhǔn)地名,根據(jù)所述地名詞按預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與獲取到的所述地名信息相匹配的所述標(biāo)準(zhǔn)地名,其中,所述標(biāo)準(zhǔn)地名為以最低等級的標(biāo)準(zhǔn)地名詞命名的地名。
可選的,所述匹配模塊,具體還包括上一等級地名獲取單元,用于在標(biāo)準(zhǔn)地名獲取單元獲取到的所述地名信息相匹配的所述標(biāo)準(zhǔn)地名之后執(zhí)行:在未搜索到相匹配的地名的情況下,獲取所述地名詞的上一個等級的地名詞,并將獲取到的所述地名詞輸入標(biāo)準(zhǔn)地名獲取單元,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
可選的,執(zhí)行標(biāo)準(zhǔn)地名獲取單元時,根據(jù)所述地名詞按預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與獲取到的所述地名信息相匹配的標(biāo)準(zhǔn)地名,包括:分別計算所述地名詞與所述預(yù)設(shè)地名數(shù)據(jù)庫中各標(biāo)準(zhǔn)地名的語義相似度,將大于預(yù)設(shè)相似度閾值且最大的語義相似度對應(yīng)的標(biāo)準(zhǔn)地名作為與所述地名信息相匹配的地名。
可選的,最低等級地名獲取單元,包括:順序排列子單元,用于按照所述報案文本信息輸入順序?qū)⑺龅孛畔⒌牡孛~進行排列,得到所述地名詞列表;首地名詞識別子單元,用于若所述地名詞為英文,則獲取所述地名詞列表中第一個地名詞作為最低等級的地名詞;若所述地名詞為中文,則獲取所述地名詞列表中最后一個地名詞作為最低等級的地名詞;
所述上一等級地名獲取單元,包括:語言等級地名詞識別子單元,用于若所述地名詞為英文,則獲取所述地名詞列表中當(dāng)前地名詞的下一個地名詞;若所述地名詞為中文,則獲取所述地名詞列表中當(dāng)前地名詞的上一個地名詞;循環(huán)匹配子單元,用于將獲取到的所述地名詞輸入標(biāo)準(zhǔn)地名獲取單元,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
可選的,還包括:執(zhí)行模塊,用于將所述職能部門的電話反饋至所述報案文本信息對應(yīng)的用戶終端,為所述用戶終端呼叫所述職能部門,和/或,將報案信息發(fā)送到所述職能部門的終端。
另一方面,本發(fā)明還提供一種計算機存儲介質(zhì),存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)上述的一種匹配職能部門的方法的步驟。
另一方面,本發(fā)明還提供一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可以在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述的一種匹配職能部門的方法的步驟。
本發(fā)明有益效果如下:
本發(fā)明獲取市政服務(wù)系統(tǒng)的報案文本信息,以得到報案文本信息對應(yīng)的地名信息,根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與地名信息相匹配的地名,并結(jié)合預(yù)先輸入的報案類別來搜索報案文本信息對應(yīng)的職能部門,整個過程自動確定地名信息,自動匹配地名,自動搜索職能部門,無需人工參與,節(jié)省了大量的人工成本,特別是對于市政服務(wù),市民可以較為快速的獲取到報案內(nèi)容的回饋,提高了市政服務(wù)效率,有利于市政建設(shè),解決了現(xiàn)有技術(shù)的如下問題:現(xiàn)有服務(wù)系統(tǒng)工作時,全程都需要人工參與,人工成本較高,特別是對于市政服務(wù),市政服務(wù)效率較低,不利于市政建設(shè)
附圖說明
圖1是本發(fā)明第一實施例中匹配職能部門的方法的流程圖;
圖2是本發(fā)明第二實施例中匹配職能部門的裝置的結(jié)構(gòu)示意圖;
圖3是本發(fā)明第三實施例中計算機設(shè)備匹配職能部門的流程圖。
具體實施方式
為了解決現(xiàn)有技術(shù)的如下問題:現(xiàn)有市政服務(wù)系統(tǒng)工作時,全程都需要人工參與,人工成本較高,且市政服務(wù)效率較低,不利于市政建設(shè);本發(fā)明提供了一種匹配職能部門的方法、裝置及計算機設(shè)備,以下結(jié)合附圖以及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不限定本發(fā)明。
本發(fā)明第一實施例提供了一種匹配職能部門的方法,該方法的流程如圖1所示,包括步驟s102至s106:
s102,獲取報案文本信息,得到報案文本信息對應(yīng)的地名信息;
s104,根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與地名信息相匹配的地名;
s106,根據(jù)匹配到的地名和預(yù)先輸入的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門。
本發(fā)明實施例獲取的報案文本信息可以為市政服務(wù)系統(tǒng)的報案文本信息,以得到報案文本信息對應(yīng)的地名信息,根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與地名信息相匹配的地名,并結(jié)合預(yù)先輸入的報案類別來搜索報案文本信息對應(yīng)的職能部門,整個過程自動確定地名信息,自動匹配地名,自動搜索職能部門,無需人工參與,節(jié)省了大量的人工成本,市民可以較為快速的獲取到報案內(nèi)容的回饋,提高了服務(wù)效率,有利于市政建設(shè),解決了現(xiàn)有技術(shù)的如下問題:現(xiàn)有服務(wù)系統(tǒng)工作時,全程都需要人工參與,人工成本較高,特別是對于市政服務(wù),市政服務(wù)效率較低,不利于市政建設(shè)。
實現(xiàn)的過程中,在根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與地名信息相匹配的地名時,可以分別計算地名信息與預(yù)設(shè)地名數(shù)據(jù)庫中各標(biāo)準(zhǔn)地名的語義相似度,將大于預(yù)設(shè)相似度閾值且最大的語義相似度對應(yīng)的標(biāo)準(zhǔn)地名作為與地名信息相匹配的地名。其中,標(biāo)準(zhǔn)地名為以最低等級的標(biāo)準(zhǔn)地名詞命名的地名或為完整地名,當(dāng)標(biāo)準(zhǔn)地名為完整地名時,可以用完整地名信息與標(biāo)準(zhǔn)地名做相似度計算。
在根據(jù)匹配到的地名和預(yù)先輸入的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門之前,還可以對預(yù)設(shè)的報案類別訓(xùn)練樣本集采用分類算法訓(xùn)練,得到報案類別分類器,其中,訓(xùn)練樣本集包括多個報案類別的樣本;獲取報案文本信息中的報案類別相關(guān)文本信息;將報案類別相關(guān)文本信息輸入報案類別分類器,得到預(yù)先輸入的報案類別。其中,分類算法包括以下一種或幾種:樸素貝葉斯nb分類算法、支持向量機svm分類算法、k最鄰近knn分類算法和隨機森林分類算法。
通過上述過程,就可以快速的獲取到輸入的報案類別,以便進行職能部門的匹配。
由于使用服務(wù)系統(tǒng)報案的用戶不同,因此,報案方式也不同;有的可能通過電話呼叫報案,例如,在發(fā)生打架斗毆事件需要報警時,則可能市民用戶會選擇通過電話主叫呼入市政服務(wù)系統(tǒng);有的可能通過發(fā)送信息進行報案,例如,當(dāng)市民用戶想要反應(yīng)某一區(qū)域垃圾處理問題,想知道該問題歸哪里負責(zé)時,則由于該問題不是迫切需要解決,因此,可能會通過向服務(wù)系統(tǒng)發(fā)送短信等方式報案。因此,本發(fā)明實施例在獲取報案文本信息時,報案文本信息可以包括報案時呼入電話的語音數(shù)據(jù)轉(zhuǎn)換后對應(yīng)的文本信息,或者是報案時發(fā)送的文本信息。這樣,無論用戶通過哪種方式進行報案,都可以獲取到對應(yīng)的報案文本信息,系統(tǒng)處理性能增強。
本實施例通過獲取報案文本信息,進而可以得到報案文本信息對應(yīng)的地名信息,具體處理時,包括如下過程:
按照預(yù)定分詞方法對報案文本信息進行分詞處理,得到分詞結(jié)果,再對分詞結(jié)果進行地名詞性標(biāo)注,得到地名詞集,例如,詞性為ns的就是地名;上述過程中,分詞是和詞性標(biāo)注一起進行的,詞性標(biāo)注是把分詞詞典中標(biāo)示的每個詞的詞性標(biāo)到分詞結(jié)果里。上述預(yù)定分詞方法可以是多種,例如,字典雙向最大匹配法、hmm方法或crf方法等。
隨后,對地名詞集進行命名實體識別,得到地名實體,再將地名實體對應(yīng)的地名詞作為該地名實體的地名信息。實現(xiàn)時,地名信息里可能包括一個或多個復(fù)合地名詞,當(dāng)包括多個復(fù)合地名詞時,例如,上海市嘉定區(qū)金沙江西路,包括三個地名詞,但所指為一個地名,因此需要通過實體識別得到,實體識別得到的地名實體為包括一個地名詞或多個地名詞復(fù)合的地名信息。
通過上述過程,就可以從獲取到的報案文本信息中得到市民用戶報案涉及到的地名信息,為自動化報案提供了堅實基礎(chǔ)。
在根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與地名信息相匹配的地名時,由于地名信息通常情況下可能包括多個地名詞,通常是采用地名信息與地名數(shù)據(jù)庫中的標(biāo)準(zhǔn)地名來匹配,此處的標(biāo)準(zhǔn)地名為以最低等級的標(biāo)準(zhǔn)地名詞命名的地名。所以,在實現(xiàn)時,需要根據(jù)報案文本信息的語言情況來確定先識別哪個地名詞,具體實現(xiàn)過程如下:
s11,獲取地名信息中最低等級的地名詞。
s12,預(yù)設(shè)地名數(shù)據(jù)庫中包括標(biāo)準(zhǔn)地名,根據(jù)地名詞按預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與獲取到的地名信息相匹配的標(biāo)準(zhǔn)地名,其中,標(biāo)準(zhǔn)地名為以最低等級的標(biāo)準(zhǔn)地名詞命名的地名。
s13,在未搜索到相匹配的地名的情況下,獲取地名詞的上一個等級的地名詞,并根據(jù)獲取到的地名詞執(zhí)行s12過程,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
具體的,s12的分別計算地名詞與預(yù)設(shè)地名數(shù)據(jù)庫中各標(biāo)準(zhǔn)地名的語義相似度,將大于預(yù)設(shè)相似度閾值且最大的語義相似度對應(yīng)的標(biāo)準(zhǔn)地名作為與地名信息相匹配的地名。
s11具體包括:按照報案文本信息輸入順序?qū)⒌孛畔⒌牡孛~進行排列,得到地名詞列表;若地名詞為英文,則獲取地名詞列表中第一個地名詞作為最低等級的地名詞;若地名詞為中文,則獲取地名詞列表中最后一個地名詞作為最低等級的地名詞;s13中,獲取地名詞的上一個等級的地名詞,包括:若地名詞為英文,則獲取地名詞列表中當(dāng)前地名詞的下一個地名詞;若地名詞為中文,則獲取地名詞列表中當(dāng)前地名詞的上一個地名詞。
例如,當(dāng)?shù)孛畔楸本┦泻5韰^(qū)中關(guān)村第三小學(xué)時,則該地名信息對應(yīng)的多個地名詞依次為“北京市,海淀區(qū),中關(guān)村第三小學(xué)”,則在進行匹配時,從“中關(guān)村第三小學(xué)”這個地名詞開始進行地名匹配,如果“中關(guān)村第三小學(xué)”這個地名詞沒有匹配到地名,則再使用“海淀區(qū)”進行匹配。
當(dāng)?shù)孛畔椤癰aihuasilu,futiandistrict,shenzhencity,guangdongprovince”時,則該地名信息對應(yīng)的多個地名詞依次為“baihuasilu,futiandistrict,shenzhencity,guangdongprovince”,則在進行匹配時,從“baihuasilu”這個地名詞開始進行地名匹配,如果“baihuasilu”這個地名詞沒有匹配到地名,則再使用“futiandistrict”進行匹配,如果“futiandistrict”沒有匹配到,則再使用“shenzhencity”進行匹配。
由于中文和英文對地名信息表述方式不同,即中文習(xí)慣按照省市縣等由大到小順序播報或記錄地名信息,英文習(xí)慣按照縣市省等由小到大順序播報或記錄地名信息,所以,本實施例針對不同報案語言需要執(zhí)行不同的匹配方式,以便能夠靈活的適用報案語言的類型,增強報案系統(tǒng)的性能。
當(dāng)已經(jīng)匹配到對應(yīng)的地名后,就可以結(jié)合報案用戶預(yù)先輸入的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門。對于該預(yù)設(shè)映射數(shù)據(jù)庫,其存儲著本市各個地區(qū)內(nèi)各個職能部門的相關(guān)信息,比如,職能部門,坐落位置,職責(zé)等。
在根據(jù)匹配到的地名和預(yù)先輸入的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門之后還包括以下一步或幾步:可以將職能部門的電話反饋至報案文本信息對應(yīng)的用戶終端;為用戶終端呼叫職能部門;將報案信息發(fā)送到所述職能部門的終端。如果市民用戶是通過呼入服務(wù)系統(tǒng)的方式報案,則可以直接在電話內(nèi)將對應(yīng)職能部門的電話進行語音播報,也可以直接為用戶轉(zhuǎn)接呼入電話帶對應(yīng)的職能部門;如果用戶是通過向服務(wù)系統(tǒng)發(fā)送信息的方式報案,則可以以信息的方式向報案用戶終端發(fā)送對應(yīng)職能部門的電話。
本發(fā)明第二實施例提供了一種匹配職能部門的裝置,該裝置的結(jié)構(gòu)示意如圖2所示,包括:
處理模塊10,用于獲取報案文本信息,得到報案文本信息對應(yīng)的地名信息;匹配模塊11,與處理模塊10耦合,用于根據(jù)預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與地名信息相匹配的地名;搜索模塊12,與匹配模塊11耦合,用于根據(jù)匹配到的地名和預(yù)先輸入的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門。
本發(fā)明實施例上述整個過程自動確定地名信息,自動匹配地名,自動搜索職能部門,無需人工參與,節(jié)省了大量的人工成本,市民可以較為快速的獲取到報案內(nèi)容的回饋,提高了服務(wù)效率,有利于市政建設(shè),解決了現(xiàn)有技術(shù)的如下問題:現(xiàn)有服務(wù)系統(tǒng)工作時,全程都需要人工參與,人工成本較高,特別是對于市政服務(wù),市政服務(wù)效率較低,不利于市政建設(shè)。
由于使用服務(wù)系統(tǒng)報案的用戶不同,因此,報案方式也不同;有的可能通過電話呼叫報案,例如,在發(fā)生打架斗毆事件需要報警時,則可能市民用戶會選擇通過電話主叫呼入市政服務(wù)系統(tǒng);有的可能通過發(fā)送信息進行報案,例如,當(dāng)市民用戶想要反應(yīng)某一區(qū)域垃圾處理問題,想知道該問題歸哪里負責(zé)時,則由于該問題不是迫切需要解決,因此,可能會通過向服務(wù)系統(tǒng)發(fā)送短信等方式報案。因此,上述報案文本信息可以是報案時呼入電話的語音數(shù)據(jù)轉(zhuǎn)換后對應(yīng)的文本信息,或者是報案時發(fā)送的文本信息。這樣,無論用戶通過哪種方式進行報案,都可以獲取到對應(yīng)的報案文本信息,系統(tǒng)處理性能增強。
上述匹配模塊11,具體用于:分別計算地名信息與預(yù)設(shè)地名數(shù)據(jù)庫中各標(biāo)準(zhǔn)地名的語義相似度,將大于預(yù)設(shè)相似度閾值且最大的語義相似度對應(yīng)的標(biāo)準(zhǔn)地名作為與地名信息相匹配的地名。其中,標(biāo)準(zhǔn)地名為以最低等級的標(biāo)準(zhǔn)地名詞命名的地名或為完整地名,當(dāng)標(biāo)準(zhǔn)地名為完整地名時,可以用完整地名信息與標(biāo)準(zhǔn)地名做相似度計算。
上述裝置還可以包括與搜索模塊12耦合的訓(xùn)練模塊,用于對預(yù)設(shè)的報案類別訓(xùn)練樣本集采用分類算法訓(xùn)練,得到報案類別分類器,其中,訓(xùn)練樣本集包括多個報案類別的樣本;獲取報案文本信息中的報案類別相關(guān)文本信息;將報案類別相關(guān)文本信息輸入報案類別分類器,得到預(yù)先輸入的報案類別。其中,分類算法包括以下一種或幾種:樸素貝葉斯nb分類算法、支持向量機svm分類算法、k最鄰近knn分類算法和隨機森林分類算法。通過上述過程,就可以快速的獲取到輸入的報案類別,以便進行職能部門的匹配。
處理模塊10具體包括分詞單元、詞性標(biāo)注單元和實體識別單元。
其中,分詞單元,用于用于按照預(yù)定分詞方法對報案文本信息進行分詞處理,得到分詞結(jié)果。例如,詞性為ns的就是地名;上述過程中,分詞是和詞性標(biāo)注一起進行的,詞性標(biāo)注是把分詞詞典中標(biāo)示的每個詞的詞性標(biāo)到分詞結(jié)果里。上述預(yù)定分詞方法可以是多種,例如,字典雙向最大匹配法、hmm方法或crf方法等。
詞性標(biāo)注單元,用于對分詞結(jié)果進行地名詞性標(biāo)注,得到地名詞集;對地名詞集進行命名實體識別,得到地名實體。
實體識別單元,用于將地名實體對應(yīng)的地名詞作為該地名實體的地名信息。
實現(xiàn)時,地名信息里可能包括一個或多個復(fù)合地名詞,當(dāng)包括多個復(fù)合地名詞時,例如,上海市嘉定區(qū)金沙江西路,包括三個地名詞,但所指為一個地名,因此需要通過實體識別得到,實體識別得到的地名實體為包括一個地名詞或多個地名詞復(fù)合的地名信息。
通過上述過程,就可以從獲取到的報案文本信息中得到市民用戶報案涉及到的地名信息,為自動化報案提供了堅實基礎(chǔ)。
為了簡化識別地名詞過程的操作,匹配模塊11可以包括:
最低等級地名獲取單元,用于獲取地名信息中最低等級的地名詞;
標(biāo)準(zhǔn)地名獲取單元,用于預(yù)設(shè)地名數(shù)據(jù)庫中包括標(biāo)準(zhǔn)地名,根據(jù)地名詞按預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與獲取到的地名信息相匹配的標(biāo)準(zhǔn)地名,其中,標(biāo)準(zhǔn)地名為以最低等級的標(biāo)準(zhǔn)地名詞命名的地名。
上一等級地名獲取單元,用于在標(biāo)準(zhǔn)地名獲取單元獲取到的所述地名信息相匹配的所述標(biāo)準(zhǔn)地名之后執(zhí)行:在未搜索到相匹配的地名的情況下,獲取地名詞的上一個等級的地名詞,并將獲取到的地名詞輸入標(biāo)準(zhǔn)地名獲取單元,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
其中,執(zhí)行標(biāo)準(zhǔn)地名獲取單元時,所述根據(jù)地名詞按預(yù)設(shè)語義相似度算法在預(yù)設(shè)地名數(shù)據(jù)庫中搜索與獲取到的地名信息相匹配的標(biāo)準(zhǔn)地名,包括:分別計算地名詞與預(yù)設(shè)地名數(shù)據(jù)庫中各標(biāo)準(zhǔn)地名的語義相似度,將大于預(yù)設(shè)相似度閾值且最大的語義相似度對應(yīng)的標(biāo)準(zhǔn)地名作為與地名信息相匹配的地名。
最低等級地名獲取單元,包括順序排列子單元和首地名詞識別子單元。
其中,順序排列子單元,用于按照報案文本信息輸入順序?qū)⒌孛畔⒌牡孛~進行排列,得到地名詞列表;首地名詞識別子單元,用于若地名詞為英文,則獲取地名詞列表中第一個地名詞作為最低等級的地名詞;若地名詞為中文,則獲取地名詞列表中最后一個地名詞作為最低等級的地名詞。
上一等級地名獲取單元包括語言等級地名詞識別子單元和循環(huán)匹配子單元。語言等級地名詞識別子單元,用于獲取地名詞的上一個等級的地名詞,包括:若地名詞為英文,則獲取地名詞列表中當(dāng)前地名詞的下一個地名詞;若地名詞為中文,則獲取地名詞列表中當(dāng)前地名詞的上一個地名詞。循環(huán)匹配子單元,用于將獲取到的所述地名詞輸入標(biāo)準(zhǔn)地名獲取單元,直到搜索到相匹配的標(biāo)準(zhǔn)地名為止。
本實施例可以針對不同報案語言需要執(zhí)行不同的匹配方式,以便能夠靈活的適用報案語言的類型,增強報案系統(tǒng)的性能。
上述裝置還可以包括:執(zhí)行模塊,與搜索模塊耦合,用于將職能部門的電話反饋至報案文本信息對應(yīng)的用戶終端,為用戶終端呼叫職能部門,和/或,將報案信息發(fā)送到所述職能部門的終端。如果市民用戶是通過呼入服務(wù)系統(tǒng)的方式報案,則可以直接在電話內(nèi)將對應(yīng)職能部門的電話進行語音播報,也可以直接為用戶轉(zhuǎn)接呼入電話帶對應(yīng)的職能部門;如果用戶是通過向服務(wù)系統(tǒng)發(fā)送信息的方式報案,則可以以信息的方式向報案用戶終端發(fā)送對應(yīng)職能部門的電話。
本發(fā)明第三實施例還提供了一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可以在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)第一實施例的一種匹配職能部門的方法。實現(xiàn)時,上述計算機程序可以存儲在計算機存儲介質(zhì)中。
例如,處理器執(zhí)行計算機程序時實現(xiàn)圖3的如下過程:
s1,獲取報案文本信息。該過程中,還可以根據(jù)報案文本信息確定問題類別或投訴內(nèi)容等信息。
s2,對報案文本信息進行分詞、詞性標(biāo)注、命名實體識別(ner,namedentityrecognition)、地名信息提取。
s3,判斷地名數(shù)據(jù)庫中是否存在與地名信息匹配度達到預(yù)設(shè)匹配度的地名。在存在的情況下,執(zhí)行s4,否則執(zhí)行s6。
s4,根據(jù)地名詞和報案文本信息中的報案類別到預(yù)設(shè)映射數(shù)據(jù)庫中搜索對應(yīng)的職能部門。
s5,將搜索到的職能部門反饋至市民用戶。
s6,按照順序查找地名信息中的下一個地名詞,返回s3。其中,該順序可能是地名信息順序方式或地名信息的倒序方式。
例如,當(dāng)市民用戶電話呼入報案“北京市海淀區(qū)中關(guān)村第三小學(xué)附近有交通事故”時,則地名信息為北京市海淀區(qū)中關(guān)村第三小學(xué),則該地名信息對應(yīng)的多個地名詞依次為“北京市,海淀區(qū),中關(guān)村第三小學(xué)”,對應(yīng)的報案類別就是交通、突發(fā)事故類,則在查找智能部門時,可以匹配到交警部門,則可以為市民用戶提供中關(guān)村第三小學(xué)附近交警部門的電話,以便及時處理問題。
本實施例人工本系統(tǒng)能夠?qū)崿F(xiàn)市政報案的自動流轉(zhuǎn),提高市政服務(wù)效率,降低人工成本。
可選地,在本實施例中,上述存儲介質(zhì)可以包括但不限于:u盤、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、移動硬盤、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。可選地,在本實施例中,處理器根據(jù)存儲介質(zhì)中已存儲的程序代碼執(zhí)行上述實施例記載的方法步驟??蛇x地,本實施例中的具體示例可以參考上述實施例及可選實施方式中所描述的示例,本實施例在此不再贅述。顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計算裝置來實現(xiàn),它們可以集中在單個的計算裝置上,或者分布在多個計算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計算裝置可執(zhí)行的程序代碼來實現(xiàn),從而,可以將它們存儲在存儲裝置中由計算裝置來執(zhí)行,并且在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟,或者將它們分別制作成各個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
盡管為示例目的,已經(jīng)公開了本發(fā)明的優(yōu)選實施例,本領(lǐng)域的技術(shù)人員將意識到各種改進、增加和取代也是可能的,因此,本發(fā)明的范圍應(yīng)當(dāng)不限于上述實施例。