欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于改進(jìn)貝葉斯分類的短信智能分類及搜索方法與流程

文檔序號(hào):12040704閱讀:來源:國(guó)知局
一種基于改進(jìn)貝葉斯分類的短信智能分類及搜索方法與流程

技術(shù)特征:
1.一種基于改進(jìn)貝葉斯分類的短信智能分類方法,其步驟為:1)在手機(jī)中加載一用于對(duì)短信進(jìn)行分類的特征詞表,其中記錄每個(gè)特征詞在各個(gè)預(yù)定義的類別中的重要性值,預(yù)定義類別為m個(gè);2)從該手機(jī)的短信數(shù)據(jù)庫(kù)中讀取短信,對(duì)于每條短信d,對(duì)該短信進(jìn)行分詞處理,得到短信d的特征詞{t1,t2,…,tk};3)利用貝葉斯分類算法根據(jù)特征詞表計(jì)算短信d屬于類別Ci的概率P(Ci|d),將具有最大P(Ci|d)的類別Ci作為該短信d最終的分類結(jié)果;其中:F(Ci)表示類別Ci中的短信總數(shù),P(tj|Ci)為第j個(gè)特征詞tj在類別Ci中出現(xiàn)的概率,P(tj|Ci)=I(tj,Ci),I(tj,Ci)為特征詞tj在類別Ci中的重要性值,N是手機(jī)短信庫(kù)中的短信總數(shù),k為長(zhǎng)度影響因子,avgLen(Ci)為類別Ci的文檔平均長(zhǎng)度,Len(d)為短信d的文本長(zhǎng)度。2.如權(quán)利要求1所述的方法,其特征在于建立所述特征詞表的方法為:1)在PC端利用中科院漢語分詞系統(tǒng)對(duì)短信訓(xùn)練集中的短信文本進(jìn)行分詞,得到每個(gè)文檔及其詞條的集合;2)對(duì)于每個(gè)詞條,利用特征值提取方法計(jì)算它在該訓(xùn)練集中的重要性值;3)將詞條按重要性值降序排列,取前Q個(gè)詞條作為特征詞;4)將每個(gè)特征詞及其在每個(gè)類別中的重要性值輸出到所述特征詞表中。3.如權(quán)利要求1或2所述的方法,其特征在于詞條在一類別中的所述重要性值與詞條在該類別中出現(xiàn)的概率成正比、與該類別中的平均文檔成反比、與該類別中的詞條數(shù)成反比。4.如權(quán)利要求3所述的方法,其特征在于將詞條t在類別C中的重要性值用I(t,C)來表示;采用公式計(jì)算所述重要性值;其中,F(xiàn)(C)表示類別C中的短信總數(shù),F(xiàn)(t,C)表示屬于類別C的短信中出現(xiàn)詞條t的短信個(gè)數(shù),avgLen(C)表示類別C中短信的平均文本長(zhǎng)度,termNum(C)表示類別C中的總詞條數(shù)。5.如權(quán)利要求4所述的方法,其特征在于采用公式或計(jì)算所述重要性值。6.如權(quán)利要求2所述的方法,其特征在于所述中科院漢語分詞系統(tǒng)對(duì)詞條集合中的分詞結(jié)果進(jìn)行詞性標(biāo)注,并保留詞性為名詞、動(dòng)詞和形容詞的三類詞條。7.如權(quán)利要求1所述的方法,其特征在于當(dāng)一新短信到來時(shí),在通知欄上顯示短信預(yù)覽,短信正文前加上分類結(jié)果作為前綴。8.一種基于權(quán)利要求1所述方法的短信智能搜索方法,其特征在于手機(jī)根據(jù)用戶輸入的關(guān)鍵詞,在手機(jī)短信數(shù)據(jù)庫(kù)中進(jìn)行搜索,返回與關(guān)鍵詞匹配的同一類短信列表。9.如權(quán)利要求8所述的方法,其特征在于手機(jī)以短信氣泡的形式顯示每一條短信,并提供刪除短信、發(fā)新短信功能。
當(dāng)前第2頁(yè)1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
长宁县| 襄汾县| 淳安县| 连州市| 盐津县| 宝坻区| 玉林市| 新源县| 吴川市| 大埔区| 公主岭市| 沿河| 石河子市| 旬邑县| 葵青区| 屏东市| 汾西县| 略阳县| 南涧| 同德县| 都江堰市| 沂南县| 紫阳县| 卫辉市| 和静县| 满洲里市| 通道| 锡林郭勒盟| 得荣县| 石河子市| 石棉县| 常山县| 和政县| 临西县| 湘西| 新余市| 从江县| 鹰潭市| 辛集市| 喀喇| 吉安县|