專利名稱:大容量電話簿智能檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種大容量電話簿智能檢索方法。
背景技術(shù):
農(nóng)訊通,是為適應(yīng)信息新時(shí)代,使農(nóng)民定期獲取到有關(guān)農(nóng)業(yè)生產(chǎn)和農(nóng)業(yè)科技等相關(guān) 農(nóng)業(yè)資訊包括政策法規(guī)、農(nóng)情預(yù)測(cè)、病蟲害預(yù)報(bào)、農(nóng)村熱點(diǎn)、農(nóng)業(yè)氣象、農(nóng)產(chǎn)品市場(chǎng)每 日?qǐng)?bào)價(jià)、農(nóng)產(chǎn)品流通信息、勞動(dòng)用工信息、農(nóng)產(chǎn)品供求信息、農(nóng)技資訊信息、品種廣告 信息等的一種移動(dòng)終端產(chǎn)品。
傳統(tǒng)上的農(nóng)訊通大容量電話簿檢索,采用順序檢索,二分法檢索,字典檢索等方法, 檢索速度非常慢,效率極其低,低到用戶無(wú)法接受。
神經(jīng)網(wǎng)絡(luò)智能檢索技術(shù)己經(jīng)成為有效的大容量信息搜索和信息瀏覽的一項(xiàng)具有實(shí)用 價(jià)值的技術(shù)。它在數(shù)據(jù)庫(kù)、信息檢索和計(jì)算機(jī)搜索等領(lǐng)域受到廣泛地關(guān)注。但目前為止 該技術(shù)很少應(yīng)用在嵌入式終端設(shè)備中。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種大容量電話簿智能檢索方法,采用神經(jīng)網(wǎng)絡(luò)智能檢索技 術(shù),提高農(nóng)訊通大容量電話簿的檢索速度。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用了如下的技術(shù)方案 大容量電話簿智能檢索方法包括如下步驟
步驟一設(shè)置網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)及初始化,給各連接權(quán)及閾值賦予0.1 0.8之間的隨
機(jī)數(shù);
步驟二將預(yù)參加訓(xùn)練的電話簿記錄數(shù)據(jù)進(jìn)行量化并數(shù)據(jù)變換歸一化處理,形成 訓(xùn)練樣本集;
步驟三將電話簿中記錄的特征碼向量的分量隨機(jī)輸入給輸入層對(duì)應(yīng)的神經(jīng)元, 分別計(jì)算輸出層與隱含層各單元的輸出;
步驟四通過導(dǎo)師信號(hào),計(jì)算輸出層與隱含層各單元的一般化誤差;步驟五計(jì)算各層各單元的局部梯度;
步驟六用一般化誤差修正輸出層與隱含層各單元的連接權(quán)和閾值; 步驟七順次選取下一個(gè)樣本,返回步驟三直到訓(xùn)練集樣本全部學(xué)習(xí)一遍; 步驟八如果沒有滿足設(shè)定誤差、設(shè)定次數(shù),則修正誤差并用帶動(dòng)量的自適應(yīng)調(diào)
節(jié)步長(zhǎng)重新返回步驟三直到網(wǎng)絡(luò)的總誤差函數(shù)小于預(yù)先設(shè)定的值,即網(wǎng)絡(luò)收斂或?qū)W習(xí)次
數(shù)大于預(yù)先給定值;
步驟九記錄電話簿的智能檢索訓(xùn)練網(wǎng)絡(luò)的連接權(quán)值和閾值,保存并結(jié)束網(wǎng)絡(luò)學(xué)習(xí)。
本發(fā)明就是在農(nóng)訊通大容量電話簿檢索中采用誤差修正、記錄數(shù)據(jù)量化及變換歸 一化處理、帶動(dòng)量項(xiàng)、自適應(yīng)調(diào)節(jié)步長(zhǎng)等方式的神經(jīng)網(wǎng)絡(luò)智能檢索技術(shù),從電話簿中直 接提取記錄對(duì)象的特征碼(如名字、號(hào)碼或其他),然后根據(jù)這些特征碼的線索從大量 存儲(chǔ)在ROM中的電話簿記錄進(jìn)行査找,檢索出用戶所要的有用信息。特別地由于神經(jīng)網(wǎng) 絡(luò)的自學(xué)習(xí)、自適應(yīng)、并行處理等特點(diǎn),該方法會(huì)根據(jù)用戶對(duì)檢索結(jié)果的評(píng)價(jià)滿意度, 動(dòng)態(tài)構(gòu)造下一個(gè)神經(jīng)網(wǎng)絡(luò),有效地縮小記錄的搜索空間,進(jìn)一步描述記錄之間的相似性 和相關(guān)性,記錄間的這種相似性以及本次檢索結(jié)果可以作為以后檢索的歷史信息保存在 神經(jīng)網(wǎng)絡(luò)中,從而提高下一次檢索的命中率,因而提高檢索效率,加快檢索速度。
本發(fā)明方法應(yīng)用在中移動(dòng)的終端產(chǎn)品農(nóng)訊通上,可以大大提高檢索速度。當(dāng)電話 簿容量達(dá)到l萬(wàn)條記錄以上,分組測(cè)試多次,每組連續(xù)檢索ioo次,應(yīng)用傳統(tǒng)的二分法檢 索(速度上比順序檢索要快,但是要求記錄有序)時(shí),平均需要檢索時(shí)間為5 20秒, 而本發(fā)明方法單次檢索時(shí)間不會(huì)超過l秒,每組平均檢索時(shí)間為O. 4秒左右。
圖l是本發(fā)明神經(jīng)網(wǎng)絡(luò)智能檢索網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖2是本發(fā)明神經(jīng)網(wǎng)絡(luò)智能檢索算法程序設(shè)計(jì)流程圖。
圖3是本發(fā)明農(nóng)訊通大容量電話簿檢索過程圖。
具體實(shí)施例方式
如圖1所示,該圖為神經(jīng)網(wǎng)絡(luò)智能檢索網(wǎng)絡(luò)結(jié)構(gòu)圖,它由輸入層、隱含層和輸出 層組成,各層之間實(shí)行全連接,層內(nèi)神經(jīng)元之間無(wú)連接,對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)的過程亦即是對(duì)權(quán)重和閥值的調(diào)整過程。輸入層的神經(jīng)元節(jié)點(diǎn)對(duì)應(yīng)于輸入變量(參數(shù))即電話簿記 錄的姓名,號(hào)碼和其他特征碼;輸出層的神經(jīng)元節(jié)點(diǎn)對(duì)應(yīng)于輸出變量(參數(shù))即用戶需要 檢索的信息如特定的姓名或號(hào)碼。
如圖2所示,該圖為神經(jīng)網(wǎng)絡(luò)智能檢索算法的程序設(shè)計(jì)流程圖。具體程序設(shè)計(jì)的 檢索步驟如下
(1) 設(shè)置網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)及初始化,給各連接權(quán)及閾值賦予(O. 1 0.8)之間的隨
機(jī)數(shù);
(2) 將預(yù)參加訓(xùn)練的電話簿記錄數(shù)據(jù)進(jìn)行量化并數(shù)據(jù)變換歸一化處理,形成訓(xùn) 練樣本集;
(3) 將電話簿中記錄的特征碼向量^4 ^(Z",X",…,^^,…,^^)的n個(gè)分量隨機(jī)
輸入給輸入層對(duì)應(yīng)的n個(gè)神經(jīng)元,用 l + e J 和 l + e' 分別
計(jì)算輸出層與隱含層各單元的輸出"、
(4) 通過導(dǎo)師信號(hào),用; 7和
2 "1 分別計(jì)算輸出層與隱含層各單元的一般化誤差、e';
竺
(5) 計(jì)算各層各單元的局部梯度3 ;
(6) —般化誤差A(yù)、 e,^("l) = K0 + ^ZA+flA『w(f),
《(/ +1)=《(0+A + , (0 , +D = ^ ") + MA + (0 ,
;0(,+1) = ^ + /^+必 0(0四式修正輸出層與隱含層各單元的連接權(quán)^、 ^,閾值
7j、《;
(7) 順次選取下一個(gè)樣本,返回步驟3直到訓(xùn)練集樣本全部學(xué)習(xí)一遍;
(8) 如果沒有滿足設(shè)定誤差E、設(shè)定次數(shù)N,則用式
泥
A『w(t) = ^T) + "AWhl(t-1) w n、 ww "、
5Ww 修正誤差并用Whi (1 + D = Ww (t) — ^t)zc),Z(t) =-+
5Ww") 式帶動(dòng)量項(xiàng)的自適應(yīng)調(diào)節(jié)步長(zhǎng)從新返回3直到網(wǎng)絡(luò)的總誤差函 數(shù)小于預(yù)先設(shè)定的值,即網(wǎng)絡(luò)收斂或?qū)W習(xí)次數(shù)大于預(yù)先給定值;
(9)記錄電話簿的智能檢索訓(xùn)練網(wǎng)絡(luò)的連接權(quán)值和閾值,保存并結(jié)束網(wǎng)絡(luò)學(xué)習(xí)。
如圖3所示,該圖為農(nóng)訊通大容量電話簿檢索過程圖,用戶輸入特征值之后,網(wǎng) 絡(luò)讀取或修正訓(xùn)練好的網(wǎng)絡(luò)參數(shù)并執(zhí)行檢索,找到用戶的所要信息。如果檢索結(jié)果不滿 意,則再次執(zhí)行網(wǎng)絡(luò)智能檢索,直到用戶滿意為止。
權(quán)利要求
1、一種大容量電話簿智能檢索方法,其特征在于,所述方法包括如下步驟步驟一設(shè)置網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)及初始化,給各連接權(quán)及閾值賦予隨機(jī)數(shù);步驟二將預(yù)參加訓(xùn)練的電話簿記錄數(shù)據(jù)進(jìn)行量化并數(shù)據(jù)變換歸一化處理,形成訓(xùn)練樣本集;步驟三將電話簿中記錄的特征碼向量的分量隨機(jī)輸入給輸入層對(duì)應(yīng)的神經(jīng)元,分別計(jì)算輸出層與隱含層各單元的輸出;步驟四通過導(dǎo)師信號(hào),計(jì)算輸出層與隱含層各單元的一般化誤差;步驟五計(jì)算各層各單元的局部梯度;步驟六用一般化誤差修正輸出層與隱含層各單元的連接權(quán)和閾值;步驟七順次選取下一個(gè)樣本,返回步驟三直到訓(xùn)練集樣本全部學(xué)習(xí)一遍;步驟八如果沒有滿足設(shè)定誤差、設(shè)定次數(shù),則修正誤差并帶動(dòng)量項(xiàng)的自適應(yīng)調(diào)節(jié)步長(zhǎng)重新返回步驟三直到網(wǎng)絡(luò)的總誤差函數(shù)小于預(yù)先設(shè)定的值,即網(wǎng)絡(luò)收斂或?qū)W習(xí)次數(shù)大于預(yù)先給定值;步驟九記錄電話簿的智能檢索訓(xùn)練網(wǎng)絡(luò)的連接權(quán)值和閾值,保存并結(jié)束網(wǎng)絡(luò)學(xué)習(xí)。
2、 如權(quán)利要求l所述的大容量電話簿智能檢索方法,其特征是,所述步驟三中, 將電話簿中記錄的特征碼向量^^ =(;^',^^""^^"'";^ )的11個(gè)分量隨機(jī)輸入給輸入層對(duì)應(yīng)的n個(gè)神經(jīng)元,用7_ 7 _l + eUj和^—/(" —T^一分別計(jì)算輸出層與隱含層各單元的輸出"、Q。
3、 如權(quán)利要求2所述的大容量電話簿智能檢索方法,其特征是,所述步驟四中,通過導(dǎo)師信號(hào),用 J 2 J^ J和 2 產(chǎn)i分別計(jì)算輸出層與隱含層各單元的一般化誤差《、e'。
4、 如權(quán)利要求3所述的大容量電話簿智能檢索方法,其特征是,所述步驟五中,歷計(jì)算各層各單元的局部梯度公式為7 。
5、 如權(quán)利要求4所述的大容量電話簿智能檢索方法,其特征是,所述步驟六中, 一般化誤差<formula>formula see original document page 3</formula>, (0四式修正輸出層與隱含層各單元的連接權(quán)^'、 ^,閾值^、《。
6、 如權(quán)利要求5所述的大容量電話簿智能檢索方法,其特征是,所述步驟八中,如果沒有滿足設(shè)定誤差E、設(shè)定次數(shù)N,則用式 5Ww 修正誤差<formula>formula see original document page 3</formula>并用Whl (t +1) = Ww (t) - ;7(t)Z(t) , W 式帶動(dòng)量項(xiàng)的自適應(yīng)調(diào)節(jié)步長(zhǎng)重新返回步驟三直到網(wǎng)絡(luò)的總誤差函數(shù)小于預(yù)先設(shè)定的值。
7、 如權(quán)利要求l所述的大容量電話簿智能檢索方法,其特征是,所述網(wǎng)絡(luò)為神經(jīng) 網(wǎng)絡(luò)智能檢索網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)智能檢索網(wǎng)絡(luò)結(jié)構(gòu)由輸入層、隱含層和輸出層組成,各層 之間實(shí)行全連接,層內(nèi)神經(jīng)元之間無(wú)連接,對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)的過程亦即是對(duì)權(quán)重和 閥值的調(diào)整過程。
8、 如權(quán)利要求7所述的大容量電話簿智能檢索方法,其特征是,輸入層的神經(jīng)元 節(jié)點(diǎn)對(duì)應(yīng)于輸入變量即電話簿記錄的姓名,號(hào)碼和其他特征碼,輸出層的神經(jīng)元節(jié)點(diǎn)對(duì) 應(yīng)于輸出變量即用戶需要檢索的信息如特定的姓名或號(hào)碼。
9、 如權(quán)利要求l所述的大容量電話簿智能檢索方法,其特征是,步驟一中給各連 接權(quán)及閾值賦予O. 1 0. 8之間的隨機(jī)數(shù)。
全文摘要
本發(fā)明是在農(nóng)訊通大容量電話簿檢索中采用誤差修正、記錄數(shù)據(jù)量化及變換歸一化處理、帶動(dòng)量項(xiàng)、自適應(yīng)調(diào)節(jié)步長(zhǎng)等方式的神經(jīng)網(wǎng)絡(luò)智能檢索技術(shù),從電話簿中直接提取記錄對(duì)象的特征碼,然后根據(jù)這些特征碼的線索從大量存儲(chǔ)在ROM中的電話簿記錄進(jìn)行查找,檢索出用戶所要的有用信息。本發(fā)明方法應(yīng)用在中移動(dòng)的終端產(chǎn)品農(nóng)訊通上,可以大大提高檢索速度。當(dāng)電話簿容量達(dá)到1萬(wàn)條記錄以上,分組測(cè)試多次,每組連續(xù)檢索100次,應(yīng)用傳統(tǒng)的二分法檢索時(shí),平均需要檢索時(shí)間為5~20秒,而本發(fā)明方法單次檢索時(shí)間不會(huì)超過1秒,每組平均檢索時(shí)間為0.4秒左右。
文檔編號(hào)H04M3/493GK101448048SQ20071017100
公開日2009年6月3日 申請(qǐng)日期2007年11月27日 優(yōu)先權(quán)日2007年11月27日
發(fā)明者曾垂喜 申請(qǐng)人:希姆通信息技術(shù)(上海)有限公司