欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種快速搜索移動終端短信息的方法和移動終端與流程

文檔序號:11276505閱讀:299來源:國知局

本發(fā)明信息檢索領(lǐng)域,尤其涉及一種快速搜索移動終端短信息的方法和移動終端。

現(xiàn)有技術(shù)中,用戶普遍使用移動終端進(jìn)行信息傳輸,短信息服務(wù)也為用戶提供了便利。由于現(xiàn)在技術(shù)的發(fā)展,使得移動終端的內(nèi)存量日益擴(kuò)大,因此用戶可以擁有比較大的內(nèi)存存儲接收到的短信息,但是當(dāng)用戶需要從大量的短信息中快速查找出所需短信息,則可能會花費(fèi)大量時(shí)間。

目前雖然有通過關(guān)鍵詞進(jìn)行短信息搜索的功能,但是現(xiàn)有技術(shù)主要采用的匹配方式為字面含義的匹配,通過相同或近似的字來判斷詞語是否匹配,例如“接近”和“靠近”,由于都具有“近”這個(gè)字,系統(tǒng)會判斷這兩個(gè)詞匹配度較高,文字的內(nèi)涵博大精深,僅僅依靠字面含義進(jìn)行匹配經(jīng)常容易出現(xiàn)錯誤,從而嚴(yán)重影響了匹配精確度,因此不能取得較好的查找效果。

因此,現(xiàn)有技術(shù)還有待進(jìn)一步的改進(jìn)。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明提供了一種快速搜索移動終端短信息的方法和移動終端。

一種快速搜索移動終端短信息的方法,其中,所述方法包括:

接收用戶輸入的至少一個(gè)搜索詞,并將所述搜索詞作為第一詞語;

獲取移動終端中存儲的短信息所包含的文字信息,并對所述文字信息進(jìn)行分詞處理,將分詞后得到的詞語作為第二詞語;

對所述第一詞語進(jìn)行概念拆分得到包含若干個(gè)概念的第一概念集合,對所述第二詞語進(jìn)行概念拆分得到包含若干個(gè)概念的第二概念集合;

計(jì)算所述第一概念集合中的第一概念與所述第二概念集合中的第二概念之間的概念相似度,所述第一概念為所述第一概念集合中的任一概念,所述第二概念為所述第二概念集合中的任一概念;

將計(jì)算得到的各概念相似度中的最大值作為所述第一詞語與所述第二詞語之間的詞語相似度;

根據(jù)所述詞語相似度判斷所述第一詞語與所述第二詞語是否匹配成功;

若匹配成功,則將含有對應(yīng)所述第一詞語的短信息進(jìn)行顯示。

所述的快速搜索移動終端短信息的方法,其中,在上述步驟中,還包括:

將每個(gè)搜索詞均作為第一詞語;

將文字信息分詞處理后得到的各個(gè)詞語作為第二詞語;

依次對每個(gè)第一詞語進(jìn)行概念拆分,得到與每個(gè)第一詞語所對應(yīng)的包含若干個(gè)概念的第一概念集合,

依次對每個(gè)所述第二詞語進(jìn)行概念拆分,得到與每個(gè)第二詞語所對應(yīng)的包含若干個(gè)概念的第二概念集合;

依次計(jì)算每個(gè)第一詞語所屬第一概念集合中的第一概念與每個(gè)第二詞語所屬第二概念集合中的第二概念之間的概念相似度,得到每個(gè)第一詞語與任意一個(gè)第二詞語之間的詞語相似度。

所述的快速搜索移動終端短信息的方法,其中,所述計(jì)算所述第一概念集合中的第一概念與所述第二概念集合中的第二概念之間的概念相似度包括:

計(jì)算所述第一概念的第一獨(dú)立義原與第二概念的第一獨(dú)立義原之間的第一相似度;

計(jì)算所述第一概念的第二獨(dú)立義原與第二概念的第二獨(dú)立義原之間的第二相似度,所述第二獨(dú)立義原為語義表達(dá)式中除所述第一獨(dú)立義原以外的所有其他獨(dú)立義原;

計(jì)算所述第一概念的關(guān)系義原與第二概念的關(guān)系義原之間的第三相似度;

計(jì)算所述第一概念的符號義原與第二概念的符號義原之間的第四相似度;

根據(jù)所述第一相似度、第二相似度、第三相似度、第四相似度計(jì)算所述第一概念與所述第二概念之間的概念相似度。

所述的快速搜索移動終端短信息的方法,其中,所述計(jì)算所述第一概念的第一獨(dú)立義原與第二概念的第一獨(dú)立義原之間的第一相似度包括:

按照如下公式計(jì)算所述第一相似度sim1(v1,v2):

其中,所述(d+α)表示兩個(gè)義原,d是和在義原層次體系中的路徑長度,α為常數(shù)參數(shù)。

所述的快速搜索移動終端短信息的方法,其中,計(jì)算所述第一概念的第二獨(dú)立義原與第二概念的第二獨(dú)立義原之間的第二相似度包括:

1)將第一概念與第二概念的語義表達(dá)式的所有獨(dú)立義原任意配對,計(jì)算兩兩獨(dú)立義原相似度;

2)將相似度取值最大的一對歸為一組;

3)對剩余的獨(dú)立義原兩兩執(zhí)行步驟2),直至所有獨(dú)立義原都完成分組;

4)對各組的相似度計(jì)算平均值作為所述第二相似度。

所述的快速搜索移動終端短信息的方法,其中,所述根據(jù)所述第一相似度、第二相似度、第三相似度、第四相似度計(jì)算所述第一概念與所述第二概念之間的概念相似度包括:

按照如下公式計(jì)算所述概念相似度sim(si,tj):

所述的快速搜索移動終端短信息的方法,其中,所述將含有所述第一詞語的短信息進(jìn)行顯示的步驟中包括:

獲取每條含有第一詞語的短信息所對應(yīng)的電話號碼,并將相同電話號碼的短信息按照接收時(shí)間的前后順序以列表的形式顯示。

所述的快速搜索移動終端短信息的方法,其中,對所述文字信息中的文字進(jìn)行分詞處理后,還包括步驟:

對分詞處理后得到的詞語賦予詞語編碼,建立所述詞語編碼與詞語所屬短信息編碼之間的索引列表;

所述將含有所述第一詞語的文章進(jìn)行顯示的步驟中包括:

通過所述索引列表查找與所述第二詞語所對應(yīng)短信息。

一種移動終端,其中,包含:利用所述的快速搜索移動終端短信息的方法進(jìn)行信息檢索的短信息模塊。

所述的移動終端,其中,所述短信息模塊還包括:索引單元;

所述索引單元,用于對分詞處理后得到的詞語賦予詞語編碼,建立所述詞語編碼與詞語所屬短信息編碼之間的索引列表,以及通過所述索引列表查找與所述第二詞語所對應(yīng)短信息。

本發(fā)明公開了一種快速搜索移動終端短信息的方法和移動終端,接收用戶輸入的至少一個(gè)搜索詞,并將所述搜索詞作為第一詞語;獲取移動終端中存儲的短信息所包含的文字信息,并對所述文字信息進(jìn)行分詞處理,將分詞后得到的詞語作為第二詞語;計(jì)算所述第一詞語與所述第二詞語之間的詞語相似度;根據(jù)所述詞語相似度判斷所述第一詞語與所述第二詞語是否匹配成功,若匹配成功,若匹配成功,則將含有對應(yīng)所述第一詞語的短信息進(jìn)行顯示。本發(fā)明中,通過計(jì)算搜索詞與短信息中文字信息所含詞語之間的詞語相似度,實(shí)現(xiàn)精確檢索,且所述詞語相似度是通過進(jìn)行數(shù)據(jù)匹配時(shí)要對詞語進(jìn)行拆分,形成概念集合的基礎(chǔ)上計(jì)算得到的,因此概念集合中的概念可以最大程度的涵蓋詞語的本質(zhì)含義,所以可以有效的提高檢索的精確度。

附圖說明

圖1為本發(fā)明提供的基于一種快速搜索移動終端短信息的方法的步驟流程示意圖。

具體實(shí)施方式

為了使本領(lǐng)域的技術(shù)人員更好的理解本發(fā)明的技術(shù)方案,下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明作進(jìn)一步的詳細(xì)說明。

請參閱圖1,本發(fā)明所公開的一種快速搜索移動終端短信息的方法步驟流程圖,所述方法包括:

101、接收用戶輸入的至少一個(gè)搜索詞,并將所述搜索詞作為第一詞語;

獲取移動終端中存儲的短信息所包含的文字信息,并對所述文字信息進(jìn)行分詞處理,將分詞后得到的詞語作為第二詞語;

102、對所述第一詞語進(jìn)行概念拆分得到包含若干個(gè)概念的第一概念集合,對所述第二詞語進(jìn)行概念拆分得到包含若干個(gè)概念的第二概念集合;

103、計(jì)算所述第一概念集合中的第一概念與所述第二概念集合中的第二概念之間的概念相似度,所述第一概念為所述第一概念集合中的任一概念,所述第二概念為所述第二概念集合中的任一概念;

104、將計(jì)算得到的各概念相似度中的最大值最為所述第一詞語與所述第二詞語之間的詞語相似度;

105、根據(jù)所述詞語相似度判斷所述第一詞語與所述第二詞語是否匹配成功;若匹配成功,則將含有對應(yīng)所述第一詞語的短信息進(jìn)行顯示。

上述方法提供了一種移動終端中短信息的快速檢索方法,其針對搜索詞對移動終端中短信息所包含的文字信息進(jìn)行匹配,若匹配成功,則判定符合檢索條件。上述方法中提供了一種基于詞語本身概念描述相關(guān)的匹配方法,提供匹配準(zhǔn)確性。

hownet中,對實(shí)詞的概念描述由以下三種形式的描述式組成:

(1)獨(dú)立義原描述式:由“基本義原”或“(具體詞)”表示;

(2)關(guān)系義原描述式:由“關(guān)系義原=基本義原”或“關(guān)系義原=(具體詞)”或者“(關(guān)系義原=具體詞)”來表示,其中關(guān)系義原是指包含“eventrole|動態(tài)角色”和“eventfeatures|動態(tài)屬性”這兩類的義原;

(3)符號義原描述式:由“關(guān)系符號基本義原”或者“關(guān)系符號(具體詞)”表示,其中關(guān)系符號包括“#、%、$、*、+、&、@、?、!”,其各自代表的關(guān)系不再贅述。

在實(shí)際應(yīng)用中,每一個(gè)概念由多個(gè)義原組成,義原是最基本的、不易于再分割的意義的最小單位。例如:“人”雖然是一個(gè)非常復(fù)雜的概念,它可以是多種屬性的集合體,但也可以把它看作為一個(gè)義原。

所有的概念都可以分解成各種各樣的義原。同時(shí)也應(yīng)該有一個(gè)有限的義原集合,其中的義原組合成一個(gè)無限的概念集合。中文中的字(包括單純詞)是有限的,并且它可以被用來表達(dá)各種各樣的單純的或復(fù)雜的概念,以及表達(dá)概念與概念之間、概念的屬性與屬性之間的關(guān)系。

通過對義原和概念的定義,就可以對兩個(gè)詞語的相似度進(jìn)行計(jì)算,例如對于詞語x1和詞語x2,如果x1有n個(gè)概念[s1,s2,…,sn],x2有m個(gè)概念[t1,t2,…,tm],x1和x2的相似度sim(x1,x2)為各個(gè)概念的相似度的最大值:

因此,為了計(jì)算得到x1和x2的相似度sim(x1,x2),則需要計(jì)算每兩個(gè)概念之間的相似度。

計(jì)算兩個(gè)概念之間的相似度則需要通過多個(gè)方面來綜合計(jì)算:

(1)第一獨(dú)立義原描述式:

因?yàn)樗械母拍疃甲罱K歸結(jié)于用義原來表示,所以義原的相似度計(jì)算是概念相似度的基礎(chǔ)。由于所有的義原根據(jù)上下位關(guān)系構(gòu)成樹狀的義原層次體系,可以簡單的通過語義距離計(jì)算相似度。

用sim1(v1,v2)表示兩個(gè)概念的這部分相似度,具體就是兩個(gè)義原的相似度,具體計(jì)算公式如下:

其中(d+α)表示兩個(gè)義原,d是和在義原層次體系中的路徑長度。α是一個(gè)可調(diào)節(jié)的參數(shù),在基于hownet的詞匯語義相似度計(jì)算方法中可以設(shè)定α的取值,例如:α=0.5。

(2)其他獨(dú)立義原描述式:語義表達(dá)式中除第一獨(dú)立義原以外的所有其他獨(dú)立義原,用sim2(v1,v2)表示兩個(gè)概念的這部分相似度,具體計(jì)算步驟如下:

a、先把兩個(gè)表達(dá)式的所有獨(dú)立義原任意配對,計(jì)算兩兩義原相似度;

b、取值最大的一對歸為一組;

c、對剩下的獨(dú)立義原兩兩相似度執(zhí)行第b步。如此反復(fù),直到所有都完成分組。任何義原與空值的相似度定義為常數(shù)δ,例如:δ=0.2;

d、最后求平均值。

(3)關(guān)系義原描述式:語義表達(dá)式中所有的關(guān)系義原,用sim3(v1,v2)表示兩個(gè)概念的這部分相似度,把關(guān)系義原相同的表達(dá)式分為一組,計(jì)算相似度,最后求平均值。

(4)符號義原描述式:語義表達(dá)式中所有的符號義原,用sim4(v1,v2)表示兩個(gè)概念的這部分相似度,把關(guān)系符號相同的表達(dá)式分為一組,計(jì)算相似度,最后求平均值。

綜上所述,兩個(gè)概念的相似度計(jì)算方法如公式(3)所示。

本發(fā)明所提供的方法通過上述的相似度計(jì)算方法,得到第一詞語與第二詞語的詞語相似度,從而實(shí)現(xiàn)兩個(gè)詞語的匹配。

由于在具體實(shí)施時(shí),搜索詞可能為多個(gè),則設(shè)置每個(gè)搜索詞均作為第一詞語,依次對每個(gè)搜索詞進(jìn)行拆分,得到每個(gè)搜索詞相對應(yīng)的第一概念集合。

由于移動終端內(nèi)保存的短信息中的分詞也為多個(gè)分詞,因此依次對每個(gè)所述第二詞語進(jìn)行概念拆分,得到與每個(gè)第二詞語所對應(yīng)的包含若干個(gè)概念的第二概念集合;

依次計(jì)算每個(gè)第一詞語所屬第一概念集合中的第一概念與每個(gè)第二詞語所屬第二概念集合中的第二概念之間的概念相似度,得到每個(gè)第一詞語與任意一個(gè)第二詞語之間的詞語相似度。

當(dāng)計(jì)算出每個(gè)第一詞語與每個(gè)第二詞語之間的詞語相似度后,判斷各個(gè)第一詞語與任意一個(gè)第二詞語之間的詞語相似度是否超出預(yù)設(shè)相似度閾值,若有超出,則判定詞語相似度超出預(yù)設(shè)相似度閾值所對應(yīng)的文章為所需要的文章,將該短信息進(jìn)行輸出顯示。

為了給用戶提供較佳的顯示效果,所述將含有所述第一詞語的短信息進(jìn)行顯示的步驟中包括:

獲取每條含有第一詞語的短信息所對應(yīng)的電話號碼,并將相同電話號碼的短信息按照接收時(shí)間的前后順序以列表的形式顯示。

為了較快的匹配出所需要的短信息,對所述文字信息中的文字進(jìn)行分詞處理后,還包括步驟:

對分詞處理后得到的詞語賦予詞語編碼,建立所述詞語編碼與詞語所屬短信息編碼之間的索引列表;

所述將含有所述第一詞語的文章進(jìn)行顯示的步驟中包括:

通過所述索引列表查找與所述第二詞語所對應(yīng)短信息。

下面以其具體實(shí)施方式為例,對上述方法進(jìn)行更加詳細(xì)的說明。

獲取用戶輸入的搜索詞,將所述搜索詞作為第一詞語??梢韵氲降氖?,上述搜索詞不一定是一個(gè)詞語,可以是多個(gè)。

獲取移動終端中存儲短信息中含有的文字信息,對文字信息進(jìn)行分詞,獲取分詞后得到的多個(gè)詞語,并將多個(gè)詞語作為第二詞語。

分別對第一詞語和第二詞語進(jìn)行概念拆分得到包含若干個(gè)概念的第一概念集合,對各個(gè)所述第二詞語進(jìn)行概念拆分得到包含若干個(gè)概念的第二概念集合;具體的,可以想到,每個(gè)第一詞語對應(yīng)一個(gè)第一概念集合,每個(gè)第二詞語對應(yīng)一個(gè)第二概念集合。

上述步驟中分別得到每個(gè)第一詞語對應(yīng)的第一概念集合和每個(gè)第二詞語對應(yīng)的第二概念集合,分別計(jì)算第一詞語和第二詞語之間的詞語相似度。

使用上述公式(1)-公式(3)中計(jì)算兩個(gè)詞語相似度的方法計(jì)算出第一詞語和第二詞語之間的相似度后,可以得到任意一個(gè)第一詞語和第二詞語之間的詞語相似度。

若兩個(gè)詞語之間的相似度達(dá)到預(yù)定的相似度閾值,則對認(rèn)為匹配成功,對含有第一詞語的短信息進(jìn)行輸出顯示。

為獲取更加準(zhǔn)確檢索結(jié)果,當(dāng)任何一個(gè)第一詞語和任何一個(gè)第二詞語之間的詞語相似度均計(jì)算完成,可以通過將每條短信息所含有的第二詞語與第一詞語之間匹配出的詞語相似度相加,通過計(jì)算每條短信息與搜索詞之間的詞語相似度總和是否超出預(yù)定相似度閾值,判斷任何一條短信息的相似度是否達(dá)到要求。

本發(fā)明在提供上述一種快速搜索移動終端短信息的方法的同時(shí),還提供了一種移動終端,其中包含:利用所述的快速搜索移動終端短信息的方法進(jìn)行信息檢索的短信息模塊。

所述移動終端由于利用上述方法中所述的方法進(jìn)行短信息搜索,因此可以取得較準(zhǔn)確的檢索結(jié)果。

本發(fā)明中,在進(jìn)行第一詞語與第二詞語的數(shù)據(jù)匹配時(shí)要對詞語進(jìn)行拆分,形成概念集合,而概念集合中的概念可以最大程度的涵蓋詞語的本質(zhì)含義,所以從概念的粒度對詞語進(jìn)行匹配,可以有效的提高匹配的精確度,因此可以取得較佳的檢索效果。

以上所述,以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
淳化县| 高州市| 洞头县| 新兴县| 大竹县| 离岛区| 卓资县| 凯里市| 清水河县| 静宁县| 建昌县| 吉安市| 旬邑县| 西平县| 肃北| 缙云县| 木兰县| 临海市| 孝感市| 江山市| 理塘县| 常山县| 蚌埠市| 虎林市| 肇源县| 赤峰市| 同江市| 津南区| 上犹县| 云南省| 周口市| 贵溪市| 屏山县| 当涂县| 宽甸| 武隆县| 晋宁县| 湘潭市| 宝山区| 茶陵县| 普洱|