欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法及裝置的制作方法

文檔序號:6435334閱讀:195來源:國知局
專利名稱:手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及數(shù)據(jù)檢索技術(shù)領(lǐng)域,尤其與一種手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法及一種手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置有關(guān)。
背景技術(shù)
在日常交流和書面寫作中,根據(jù)人們?nèi)粘5乃季S習(xí)慣和語言習(xí)慣,人們經(jīng)常使用縮略語來指代一個名稱較長的實體名稱,如用“北工大”來指代“北京工業(yè)大學(xué)”。特別隨著手機上網(wǎng)越來越普及,網(wǎng)絡(luò)查詢功能也越來越多地被廣泛應(yīng)用。但是,手機不像計算機具有操作屏幕大、查看方便、書寫方便的特點,用戶更希望通過詞語縮略語的查詢來獲得自己需要的信息。因此,一種用手機網(wǎng)絡(luò)用語簡稱來識別其全稱的方法與裝置就顯得非常有必要。全稱(F)是對實體或?qū)ο蟮拿Q的完整稱呼,簡稱(A)是為了表達(dá)的簡潔明快,而對全稱進(jìn)行精簡壓縮后得到的稱呼,若F和A具有全簡稱關(guān)系,則稱F為A的全稱,A為F的簡稱。簡稱處理問題就是對給定的一個簡稱A,設(shè)法了解它的全稱。簡稱處理問題已經(jīng)成為自然語言處理、信息檢索等應(yīng)用中一個基本而又關(guān)鍵的問題。自然語言處理是計算機科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個重要問題。它研究能實現(xiàn)人與計算機之間用自然語言進(jìn)行有效通信的各種理論和方法。隨著計算機和互聯(lián)網(wǎng)的廣泛應(yīng)用,計算機可處理的自然語言文本數(shù)量空前增長,面向海量信息的文本挖掘、信息提取、跨語言信息處理、人機交互等應(yīng)用需求急速增長,自然語言處理的對象也從小規(guī)模受限語言處理轉(zhuǎn)向大規(guī)模真實文本處理,其研究必將對人們的生活產(chǎn)生深遠(yuǎn)的影響。信息檢索,研究如何從紛繁復(fù)雜的大量信息中,快速、準(zhǔn)確獲取所需信息的技術(shù)。信息檢索技術(shù)經(jīng)過多年的發(fā)展,目前已經(jīng)相當(dāng)成熟,新型信息檢索技術(shù)正朝智能化、動態(tài)化、多樣化、個性化等方向發(fā)展。解決網(wǎng)絡(luò)用語檢索的簡稱處理問題的方法可以分為兩大類一類是基于模式的方法,主要利用語言學(xué)和自然語言處理技術(shù),通過詞法分析和語法分析提取關(guān)系模式,然后利用模式匹配獲取全簡稱關(guān)系,但該方法準(zhǔn)確率難以達(dá)到理想的實用要求;另一類是基于統(tǒng)計的方法,主要基于語料庫和統(tǒng)計語言模型,通過計算概念之間的關(guān)聯(lián)度來獲取全簡稱關(guān)系,該方法準(zhǔn)確率雖高,但不能滿足超大規(guī)模獲取。而其他一些處理全簡稱問題的方法,處理速度不高,難以應(yīng)用于搜索引擎這樣的實時系統(tǒng)中。

發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中存在的問題,本發(fā)明的目的在于提供一種手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法,以解決現(xiàn)有技術(shù)手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法不能兼顧準(zhǔn)確率和處理速度的技術(shù)問題。本發(fā)明的另一個目的在于提供一種手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置。
為實現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下一種手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法,包括步驟將輸入的簡稱分解為由一個一個單字組成的單字串;從一全稱數(shù)據(jù)庫中找出含有所述單字串中所有單字的全稱串,如果找不到所述全稱串,則輸出沒有匹配的全稱;對找到的候選全稱串,分別按照相關(guān)度公式進(jìn)行評分,并將最大評分值所對應(yīng)的候選全稱串作為該簡稱所對應(yīng)的全稱進(jìn)行輸出。一種手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置,包括全稱數(shù)據(jù)庫、輸入單元、匹配單元、評分單元、比較器和輸出單元;所述輸入單元,接收一輸入的簡稱;所述匹配單元,將所述輸入單元所輸入的所述簡稱分解為由一個一個單字組成的單字串;并從所述全稱數(shù)據(jù)庫中找出含有所述單字串中所有單字的全稱串;所述評分單元,對找到的候選全稱串,分別按照相關(guān)度公式進(jìn)行評分;所述比較器,比較所述評分單元的評分,選出最大評分值;輸出單元,如果找不到所述全稱串,則由輸出單元輸出沒有匹配的全稱;否則將最大評分值所對應(yīng)的全稱串作為該簡稱所對應(yīng)的全稱進(jìn)行輸出。本發(fā)明的有益效果在于,本發(fā)明的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法,
首先接收一個簡稱A作為輸入,然后從一個全稱數(shù)據(jù)庫中找到A的侯選全稱Fl.....Fn,最
后根據(jù)特定的判斷法則,挑選最好的一個(或多個)全稱Fi,作為A的全稱。本發(fā)明的方法具有較高的準(zhǔn)確性和較快的處理速度,在含有2101個全稱數(shù)據(jù)庫(全國普通高校名稱)的測試中,準(zhǔn)確率達(dá)到97%。


圖1為本發(fā)明實施例的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法的流程圖。圖2為本發(fā)明實施例的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置的示意圖。
具體實施例方式體現(xiàn)本發(fā)明特征與優(yōu)點的典型實施例將在以下的說明中詳細(xì)敘述。應(yīng)理解的是本發(fā)明能夠在不同的實施例上具有各種的變化,其皆不脫離本發(fā)明的范圍,且其中的說明及所附附圖在本質(zhì)上是當(dāng)作說明之用,而非用以限制本發(fā)明。本發(fā)明的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法,主要的步驟包括首先接
收一簡稱A作為輸入,然后從一全稱數(shù)據(jù)庫中找到簡稱A的侯選全稱Fl.....Fn,最后根據(jù)
一個判斷法則,挑選最好的一個全稱Fi作為A的全稱輸出。以下具體介紹本發(fā)明實施例的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法與裝置。本發(fā)明實施例的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法,需要用到一全稱數(shù)據(jù)庫(包括檢索用語簡稱所對應(yīng)的一個或多個領(lǐng)域的所有可能全稱的數(shù)據(jù)庫,簡稱為FDB)。在給定的全稱數(shù)據(jù)庫FDB中,全稱的形式如表I所示,它們以3列的方式存儲在全稱數(shù)據(jù)庫中。表I
權(quán)利要求
1.一種手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法,包括步驟將輸入的簡稱分解為由一個一個單字組成的單字串;從一全稱數(shù)據(jù)庫中找出含有所述單字串中所有單字的全稱串,如果找不到所述全稱串,則輸出沒有匹配的全稱;對找到的候選全稱串,分別按照相關(guān)度公式進(jìn)行評分,并將最大評分值所對應(yīng)的候選全稱串作為該簡稱所對應(yīng)的全稱進(jìn)行輸出。
2.如權(quán)利要求1所述的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法,其特征在于,所述相關(guān)度公式為
3.如權(quán)利要求2所述的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法,其特征在于,還包括針對每個全稱預(yù)先計算相關(guān)度并將結(jié)果進(jìn)行緩存的步驟。
4.如權(quán)利要求3所述的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法,其特征在于,還包括建立全稱數(shù)據(jù)庫的單字倒排表的步驟。
5.一種手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置,包括全稱數(shù)據(jù)庫、輸入單元、匹配單元、評分單元、比較器和輸出單元;所述輸入單元,接收一輸入的簡稱;所述匹配單元,將所述輸入單元所輸入的所述簡稱分解為由一個一個單字組成的單字串;并從所述全稱數(shù)據(jù)庫中找出含有所述單字串中所有單字的全稱串;所述評分單元,對找到的候選全稱串,分別按照相關(guān)度公式進(jìn)行評分;所述比較器,比較所述評分單元的評分,選出最大評分值;輸出單元,如果找不到所述全稱串,則由輸出單元輸出沒有匹配的全稱;否則將最大評分值所對應(yīng)的全稱串作為該簡稱所對應(yīng)的全稱進(jìn)行輸出。
6.如權(quán)利要求5所述的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置,其特征在于,所述相關(guān)度公式為
7.如權(quán)利要求6所述的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置,其特征在于,所述手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置還包括針對每個全稱預(yù)先計算相關(guān)度并將結(jié)果進(jìn)行緩存的緩存單元。
8.如權(quán)利要求7所述的手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置,其特征在于,所述手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別裝置還包括建立全稱數(shù)據(jù)庫的單字倒排表的倒排單元。
全文摘要
本發(fā)明公開了一種手機網(wǎng)絡(luò)檢索用語簡稱-全稱轉(zhuǎn)換識別方法及裝置,所述轉(zhuǎn)換識別方法包括步驟將輸入的簡稱分解為由一個一個單字組成的單字串;從一全稱數(shù)據(jù)庫中找出含有所述單字串中所有單字的全稱串,如果找不到所述全稱串,則輸出沒有匹配的全稱;對找到的候選全稱串,分別按照相關(guān)度公式進(jìn)行評分,并將最大評分值所對應(yīng)的候選全稱串作為該簡稱所對應(yīng)的全稱進(jìn)行輸出。本發(fā)明的轉(zhuǎn)換識別方法,兼顧了準(zhǔn)確率和處理速度。
文檔編號G06F17/30GK103049442SQ20111030720
公開日2013年4月17日 申請日期2011年10月12日 優(yōu)先權(quán)日2011年10月12日
發(fā)明者盧玉成 申請人:盧玉成
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
哈尔滨市| 舟曲县| 英山县| 朝阳县| 准格尔旗| 酉阳| 常宁市| 建始县| 临泽县| 独山县| 寿光市| 司法| 香河县| 泽普县| 苏州市| 襄城县| 杭锦旗| 区。| 尤溪县| 松原市| 夏河县| 镇原县| 双桥区| 郎溪县| 莎车县| 浦江县| 吴江市| 鹿邑县| 洛浦县| 浏阳市| 姜堰市| 东乡县| 长沙县| 射阳县| 宜城市| 北票市| 兰州市| 乌鲁木齐市| 崇义县| 九江市| 长沙市|