欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法

文檔序號(hào):8223588閱讀:260來(lái)源:國(guó)知局
基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)數(shù)據(jù)檢索和語(yǔ)義分析領(lǐng)域,特別涉及一種基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法。
【背景技術(shù)】
[0002]對(duì)于日常檢索,通常情況只能檢索出包含檢索關(guān)鍵字的信息,如果需要檢索包含關(guān)鍵字的相關(guān)同義詞或者近義詞信息,通常會(huì)變得非常困難;如果在多語(yǔ)言環(huán)境下實(shí)現(xiàn)關(guān)鍵字的檢索,幾乎是不可能完成這樣的工作。但不論專業(yè)的多語(yǔ)言的翻譯還是日常的跨多語(yǔ)目的息檢索,都需要解決這個(gè)難題。

【發(fā)明內(nèi)容】

[0003]針對(duì)現(xiàn)有技術(shù)中的多語(yǔ)言翻譯或跨語(yǔ)言的同義詞檢索難題,本發(fā)明提供一種基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法,適用于信息檢索、搜索引擎、語(yǔ)言翻譯等,解決多種語(yǔ)言互譯、跨語(yǔ)言近義詞同義詞關(guān)聯(lián)的難點(diǎn)。
[0004]按照本發(fā)明所提供的設(shè)計(jì)方案,一種基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法,包含如下步驟:
步驟1、將待翻譯信息轉(zhuǎn)化為源文字信息;
步驟2、根據(jù)不同語(yǔ)言,將轉(zhuǎn)化的源文字信息存入文字處理單元,對(duì)文字處理單元存儲(chǔ)的源文字信息進(jìn)行分詞斷句,源文字信息、分詞斷句后的信息形成一條元素記錄存入結(jié)果集,并賦予該條元素記錄身份標(biāo)簽標(biāo)識(shí)和時(shí)間標(biāo)簽標(biāo)識(shí),若判定不同語(yǔ)言的詞組具有相同的涵義,則賦予該詞組統(tǒng)一標(biāo)簽標(biāo)識(shí),若判定同一語(yǔ)言的詞組具有相同的涵義,則賦予近義標(biāo)簽標(biāo)識(shí),并對(duì)該條元素記錄中的統(tǒng)一標(biāo)簽和近義標(biāo)簽加密處理,對(duì)具有相同的近義標(biāo)簽和統(tǒng)一標(biāo)簽的元素記錄賦予相同的父標(biāo)簽;
步驟3、根據(jù)元素記錄中的關(guān)鍵字進(jìn)行信息關(guān)聯(lián)數(shù)據(jù)庫(kù)檢索,查找是否有對(duì)應(yīng)的記錄,若有,則完成關(guān)聯(lián);否則,進(jìn)入下一步驟;
步驟4、將步驟2中賦予身份標(biāo)簽、時(shí)間標(biāo)簽、統(tǒng)一標(biāo)簽、近義標(biāo)簽和父標(biāo)簽的元素記錄存儲(chǔ)到信息關(guān)聯(lián)數(shù)據(jù)庫(kù)中,供用戶進(jìn)行信息關(guān)聯(lián)數(shù)據(jù)庫(kù)檢索。
[0005]上述的,步驟I中的待翻譯信息包含語(yǔ)音信息、文本信息、圖像信息及視頻信息,語(yǔ)音信息通過(guò)語(yǔ)音識(shí)別轉(zhuǎn)化為源文字信息,圖像信息通過(guò)圖像識(shí)別轉(zhuǎn)化為源文字信息,視頻信息通過(guò)視頻識(shí)別轉(zhuǎn)化為源文字信息。
[0006]上述的,步驟2的分詞斷句包含文字處理單元根據(jù)不同語(yǔ)言語(yǔ)系對(duì)源文字信息進(jìn)行分詞斷句,若源文字信息為拉丁語(yǔ)系,按照空格進(jìn)行分詞,并存入結(jié)果集;若源文字信息為東方語(yǔ)系,則先單字拆解,重新組合成詞組,并與該語(yǔ)系詞庫(kù)進(jìn)行匹配,若匹配成功,則為有效詞組,否則,視為無(wú)效詞組,將單字及該有效詞組存入結(jié)果集,將結(jié)果集中的詞組與信息關(guān)聯(lián)數(shù)據(jù)庫(kù)進(jìn)行匹配,如果詞組匹配成功,則視為已關(guān)聯(lián)詞組,從結(jié)果集中移除。
[0007]本發(fā)明基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法的有益效果: 本發(fā)明適用于信息檢索、搜索引擎、語(yǔ)言翻譯等,解決多種語(yǔ)言互譯、跨語(yǔ)言近義詞同義詞關(guān)聯(lián)的難點(diǎn),將每條元素記錄均賦予唯一的身份標(biāo)識(shí),不同語(yǔ)言的詞組具有相同的涵義,則賦予該詞組統(tǒng)一標(biāo)簽標(biāo)識(shí),同一語(yǔ)言的詞組具有相同的涵義,則賦予近義標(biāo)簽標(biāo)識(shí),并對(duì)該條元素記錄中的統(tǒng)一標(biāo)簽和近義標(biāo)簽加密處理,當(dāng)跨語(yǔ)言的多個(gè)元素記錄具有相同的統(tǒng)一標(biāo)簽或近義標(biāo)簽,則證明其之間是跨語(yǔ)言的近義詞或同義詞,可以方便的檢索出輸入的關(guān)鍵字的近義或同義的詳細(xì)信息,實(shí)現(xiàn)跨語(yǔ)言的同義詞及近義詞之間的匹配,提高信息檢索、語(yǔ)言翻譯的效率。
[0008]【附圖說(shuō)明】:
圖1為本發(fā)明基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法的流程示意圖;
圖2為本發(fā)明的結(jié)果集存儲(chǔ)示意圖;
圖3為本發(fā)明的標(biāo)簽關(guān)聯(lián)方法示意圖;
圖4為本發(fā)明的實(shí)施例關(guān)聯(lián)示意圖。
[0009]【具體實(shí)施方式】:
下面結(jié)合附圖和技術(shù)方案對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明,并通過(guò)優(yōu)選的實(shí)施例詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式,但本發(fā)明的實(shí)施方式并不限于此。
[0010]實(shí)施例:參見圖1~4所示,一種基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法,包含如下步驟:
步驟1、將待翻譯信息轉(zhuǎn)化為源文字信息;
步驟2、根據(jù)不同語(yǔ)言,將轉(zhuǎn)化的源文字信息存入文字處理單元,對(duì)文字處理單元存儲(chǔ)的源文字信息進(jìn)行分詞斷句,源文字信息、分詞斷句后的信息形成一條元素記錄存入結(jié)果集,并賦予該條元素記錄身份標(biāo)簽標(biāo)識(shí)和時(shí)間標(biāo)簽標(biāo)識(shí),若判定不同語(yǔ)言的詞組具有相同的涵義,則賦予該詞組統(tǒng)一標(biāo)簽標(biāo)識(shí),若判定同一語(yǔ)言的詞組具有相同的涵義,則賦予近義標(biāo)簽標(biāo)識(shí),并對(duì)該條元素記錄中的統(tǒng)一標(biāo)簽和近義標(biāo)簽加密處理,對(duì)具有相同的近義標(biāo)簽和統(tǒng)一標(biāo)簽的元素記錄賦予相同的父標(biāo)簽;
步驟3、根據(jù)元素記錄中的關(guān)鍵字進(jìn)行信息關(guān)聯(lián)數(shù)據(jù)庫(kù)檢索,查找是否有對(duì)應(yīng)的記錄,若有,則完成關(guān)聯(lián);否則,進(jìn)入下一步驟;
步驟4、將步驟2中賦予身份標(biāo)簽、時(shí)間標(biāo)簽、統(tǒng)一標(biāo)簽、近義標(biāo)簽和父標(biāo)簽的元素記錄存儲(chǔ)到信息關(guān)聯(lián)數(shù)據(jù)庫(kù)中,供用戶進(jìn)行信息關(guān)聯(lián)數(shù)據(jù)庫(kù)檢索。
[0011]上述的,步驟I中的待翻譯信息包含語(yǔ)音信息、文本信息、圖像信息及視頻信息,語(yǔ)音信息通過(guò)語(yǔ)音識(shí)別轉(zhuǎn)化為源文字信息,圖像信息通過(guò)圖像識(shí)別轉(zhuǎn)化為源文字信息,視頻信息通過(guò)視頻識(shí)別轉(zhuǎn)化為源文字信息。
[0012]上述的,步驟2的分詞斷句包含文字處理單元根據(jù)不同語(yǔ)言語(yǔ)系對(duì)源文字信息進(jìn)行分詞斷句,若源文字信息為拉丁語(yǔ)系,按照空格進(jìn)行分詞,并存入結(jié)果集;若源文字信息為東方語(yǔ)系,則先單字拆解,重新組合成詞組,并與該語(yǔ)系詞庫(kù)進(jìn)行匹配,若匹配成功,則為有效詞組,否則,視為無(wú)效詞組,將單字及該有效詞組存入結(jié)果集,將結(jié)果集中的詞組與信息關(guān)聯(lián)數(shù)據(jù)庫(kù)進(jìn)行匹配,如果詞組匹配成功,則視為已關(guān)聯(lián)詞組,從結(jié)果集中移除。
[0013]圖2所示,每個(gè)元素記錄存儲(chǔ)均賦予一個(gè)唯一身份標(biāo)識(shí),同時(shí)將該元素記錄存儲(chǔ)的時(shí)間作為時(shí)間標(biāo)簽,存儲(chǔ)中的狀態(tài)字段標(biāo)識(shí)該字段的狀態(tài),統(tǒng)一標(biāo)簽及近義標(biāo)簽用于對(duì)多語(yǔ)言翻譯關(guān)聯(lián)、同語(yǔ)言同義詞近義詞關(guān)聯(lián);圖3所示,多個(gè)元素記錄具有相同的統(tǒng)一標(biāo)簽或近義標(biāo)簽,即具有相同的父標(biāo)簽,則說(shuō)明是跨語(yǔ)言的近義詞或同義詞,可以方便的檢索出詞條信息;列舉具體實(shí)例,如圖4所示,在不同的語(yǔ)言中“吉他”有不同的表述,如英語(yǔ)中“Guitar”,西班牙語(yǔ)中“Guitarra”,日文中“ ¥夕一”,這些語(yǔ)種中“吉他”通過(guò)標(biāo)簽“Tagl”近義標(biāo)簽進(jìn)行關(guān)聯(lián),表示其之間是不同語(yǔ)種之間的翻譯;同時(shí),在中文中,“吉他”和“琵琶”是比較相近的樂(lè)器,通過(guò)“Tag2”統(tǒng)一標(biāo)簽將二者關(guān)聯(lián)起來(lái);然后,通過(guò)“Tag3”,把“Tagl ”和“Tag2”關(guān)聯(lián)起來(lái);關(guān)聯(lián)完成后,如果用戶想把“々'夕一”翻譯成英文,就可以通過(guò)“Tagl”和語(yǔ)種快速檢索到目標(biāo)內(nèi)容,如果用戶想查詢有關(guān)“々'夕一”的所有內(nèi)容,那就可以通過(guò)“Tagl,,、“Tag2,,、“Tag3,,把“吉他,,、“Guitar,,、“Guitarra,,、“ 年' 夕一”、“琵琶”全部快速地檢索出來(lái),快捷方便。
[0014]本發(fā)明并不局限于上述【具體實(shí)施方式】,本領(lǐng)域技術(shù)人員還可據(jù)此做出多種變化,但任何與本發(fā)明等同或者類似的變化都應(yīng)涵蓋在本發(fā)明權(quán)利要求的范圍內(nèi)。
【主權(quán)項(xiàng)】
1.一種基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法,其特征在于:包含如下步驟: 步驟1、將待翻譯信息轉(zhuǎn)化為源文字信息; 步驟2、根據(jù)不同語(yǔ)言,將轉(zhuǎn)化的源文字信息存入文字處理單元,對(duì)文字處理單元存儲(chǔ)的源文字信息進(jìn)行分詞斷句,源文字信息、分詞斷句后的信息形成一條元素記錄存入結(jié)果集,并賦予該條元素記錄身份標(biāo)簽標(biāo)識(shí)和時(shí)間標(biāo)簽標(biāo)識(shí),若判定不同語(yǔ)言的詞組具有相同的涵義,則賦予該詞組統(tǒng)一標(biāo)簽標(biāo)識(shí),若判定同一語(yǔ)言的詞組具有相同的涵義,則賦予近義標(biāo)簽標(biāo)識(shí),并對(duì)該條元素記錄中的統(tǒng)一標(biāo)簽和近義標(biāo)簽加密處理,對(duì)具有相同的近義標(biāo)簽和統(tǒng)一標(biāo)簽的元素記錄賦予相同的父標(biāo)簽; 步驟3、根據(jù)元素記錄中的關(guān)鍵字進(jìn)行信息關(guān)聯(lián)數(shù)據(jù)庫(kù)檢索,查找是否有對(duì)應(yīng)的記錄,若有,則完成關(guān)聯(lián);否則,進(jìn)入下一步驟; 步驟4、將步驟2中賦予身份標(biāo)簽、時(shí)間標(biāo)簽、統(tǒng)一標(biāo)簽、近義標(biāo)簽和父標(biāo)簽的元素記錄存儲(chǔ)到信息關(guān)聯(lián)數(shù)據(jù)庫(kù)中,供用戶進(jìn)行信息關(guān)聯(lián)數(shù)據(jù)庫(kù)檢索。
2.根據(jù)權(quán)利要求1所述的基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法,其特征在于:步驟I中的待翻譯信息包含語(yǔ)音信息、文本信息、圖像信息及視頻信息,語(yǔ)音信息通過(guò)語(yǔ)音識(shí)別轉(zhuǎn)化為源文字信息,圖像信息通過(guò)圖像識(shí)別轉(zhuǎn)化為源文字信息,視頻信息通過(guò)視頻識(shí)別轉(zhuǎn)化為源文字信息。
3.根據(jù)權(quán)利要求1所述的基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法,其特征在于:所述步驟2的分詞斷句包含文字處理單元根據(jù)不同語(yǔ)言語(yǔ)系對(duì)源文字信息進(jìn)行分詞斷句,若源文字信息為拉丁語(yǔ)系,按照空格進(jìn)行分詞,并存入結(jié)果集;若源文字信息為東方語(yǔ)系,則先單字拆解,重新組合成詞組,并與該語(yǔ)系詞庫(kù)進(jìn)行匹配,若匹配成功,則為有效詞組,否則,視為無(wú)效詞組,將單字及該有效詞組存入結(jié)果集,將結(jié)果集中的詞組與信息關(guān)聯(lián)數(shù)據(jù)庫(kù)進(jìn)行匹配,如果詞組匹配成功,則視為已關(guān)聯(lián)詞組,從結(jié)果集中移除。
【專利摘要】本發(fā)明涉及一種基于多語(yǔ)言翻譯的近義詞關(guān)聯(lián)方法,將每條元素記錄均賦予唯一的身份標(biāo)識(shí),不同語(yǔ)言的詞組具有相同的涵義,則賦予該詞組統(tǒng)一標(biāo)簽標(biāo)識(shí),同一語(yǔ)言的詞組具有相同的涵義,則賦予近義標(biāo)簽標(biāo)識(shí),并對(duì)該條元素記錄中的統(tǒng)一標(biāo)簽和近義標(biāo)簽加密處理,當(dāng)跨語(yǔ)言的多個(gè)元素記錄具有相同的統(tǒng)一標(biāo)簽或近義標(biāo)簽,則證明其之間是跨語(yǔ)言的近義詞或同義詞,可以方便的檢索出輸入的關(guān)鍵字的近義或同義的詳細(xì)信息,實(shí)現(xiàn)跨語(yǔ)言的同義詞及近義詞之間的匹配,提高信息檢索、語(yǔ)言翻譯的效率。
【IPC分類】G06F17-27, G06F17-30
【公開號(hào)】CN104537066
【申請(qǐng)?zhí)枴緾N201410839087
【發(fā)明人】陳立杰, 李之光
【申請(qǐng)人】鄭州市中業(yè)科技有限公司
【公開日】2015年4月22日
【申請(qǐng)日】2014年12月30日
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
会同县| 阿图什市| 台东县| 上林县| 云林县| 岚皋县| 通山县| 宁强县| 铜鼓县| 乌兰县| 景谷| 丰城市| 乐昌市| 饶平县| 灵川县| 阳原县| 固镇县| 平定县| 麻江县| 汾阳市| 上思县| 达州市| 台安县| 章丘市| 怀化市| 许昌市| 荔波县| 伊吾县| 甘孜| 阜康市| 益阳市| 临清市| 嵊泗县| 湘潭县| 新巴尔虎左旗| 张北县| 莎车县| 芦山县| 扎兰屯市| 余江县| 开原市|