欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

機(jī)器翻譯方法和機(jī)器翻譯系統(tǒng)的制作方法

文檔序號:6488485閱讀:382來源:國知局
機(jī)器翻譯方法和機(jī)器翻譯系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種機(jī)器翻譯方法和機(jī)器翻譯系統(tǒng)。所述機(jī)器翻譯方法包括:利用多個機(jī)器翻譯設(shè)備,分別將源語言的原文翻譯為目標(biāo)語言,以得到多個候選譯文;利用語言模型,針對多個候選譯文分別計算語言模型得分;分別獲得多個機(jī)器翻譯設(shè)備給出的關(guān)于多個候選譯文的設(shè)備得分;基于原文的長度和候選譯文的長度,針對多個候選譯文分別計算長度得分;基于語言模型得分、設(shè)備得分、長度得分的至少一個,分別計算多個候選譯文的總得分;以及選擇總得分最高的候選譯文作為機(jī)器翻譯的結(jié)果。
【專利說明】機(jī)器翻譯方法和機(jī)器翻譯系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明一般地涉及機(jī)器翻譯領(lǐng)域。更具體地說,本發(fā)明涉及用于將源語言的原文翻譯為目標(biāo)語言的譯文的機(jī)器翻譯方法和機(jī)器翻譯系統(tǒng)。
【背景技術(shù)】
[0002]機(jī)器翻譯技術(shù)是指使用計算機(jī)等計算設(shè)備將一種自然語言(一般稱為源語言)的原文翻譯為另一種自然語言(一般稱為目標(biāo)語言)的譯文的技術(shù)。由于這一技術(shù)由機(jī)器完成,所以與人工翻譯相比,可以以相對短的時間處理大量的翻譯工作。近年來,機(jī)器翻譯技術(shù)得到了長足的發(fā)展。
[0003]機(jī)器翻譯技術(shù)大體上可以分為三類:基于規(guī)則的機(jī)器翻譯技術(shù)(Rule-basedmachine translation, RBMT),基于實(shí)例的機(jī)器翻譯技術(shù)(Example-based machinetranslation, EMBT)和基于統(tǒng)計的機(jī)器翻譯技術(shù)(Statistical Machine Translation)。
[0004]基于規(guī)則的機(jī)器翻譯技術(shù)一般需要借助于詞典、模板和人工整理的規(guī)則進(jìn)行。需要對要被翻譯的源語言的原文進(jìn)行分析,并對原文的意義進(jìn)行表示,然后再生成等價的目標(biāo)語言的譯文。一個好的基于規(guī)則的機(jī)器翻譯設(shè)備,需要有足夠多、覆蓋面足夠廣的翻譯規(guī)貝U,并且有效地解決規(guī)則之間的沖突問題。由于規(guī)則通常需要人工整理,因此,人工成本高、很難得到數(shù)量非常多、覆蓋非常全面的翻譯規(guī)則,并且不同人給出的翻譯規(guī)則沖突的概率較大。
[0005]基于實(shí)例的機(jī)器翻譯技術(shù)以實(shí)例為基礎(chǔ),主要利用預(yù)處理過的雙語語料和翻譯詞典進(jìn)行翻譯。在翻譯的過程中,首先在翻譯實(shí)例庫搜索與原文片段相匹配的片段,再確定相應(yīng)的譯文片段,重新組合譯文片段以得到最終的譯文。翻譯實(shí)例的覆蓋范圍和存儲方式直接影響著這種翻譯技術(shù)的翻譯質(zhì)量和速度。
[0006]基于統(tǒng)計的機(jī)器翻譯技術(shù)是基于雙語語料庫的,其將雙語語料庫中的翻譯知識通過機(jī)器學(xué)習(xí)的方法表示為統(tǒng)計模型并抽取翻譯規(guī)則,按照翻譯規(guī)則將需要翻譯的原文翻譯為目標(biāo)語言的譯文。由于基于統(tǒng)計的機(jī)器翻譯技術(shù)需要的人工處理少、不依賴于具體的實(shí)例、不受領(lǐng)域限制、處理速度快,所以相對于其它兩種機(jī)器翻譯技術(shù)具有明顯的優(yōu)勢。本發(fā)明主要涉及基于統(tǒng)計的機(jī)器翻譯技術(shù)。
[0007]如上所述,在基于統(tǒng)計的機(jī)器翻譯技術(shù)中,翻譯規(guī)則是非常重要的翻譯資源?;诮y(tǒng)計的機(jī)器翻譯技術(shù)要想取得較好的翻譯質(zhì)量,前提之一就是要有足夠多且足夠好的雙語平行語料,使得計算機(jī)等計算設(shè)備能夠基于雙語平行語料自動學(xué)習(xí)到覆蓋面足夠廣的翻譯規(guī)則。
[0008]可見,在基于統(tǒng)計的機(jī)器翻譯技術(shù)中,需要足夠多且足夠好的雙語平行語料以及翻譯規(guī)則。
[0009]然而,對于很多語言來說,要獲取高質(zhì)量、大規(guī)模的雙語平行語料庫較為困難。而對于一些語言來說,存在著這種語言與多種語言之間的大量的雙語語料。例如,中日的雙語平行語料較少,但中英、英日的雙語平行語料較多。[0010]因此,存在一些機(jī)器翻譯設(shè)備,其借助于中間語言進(jìn)行源語言到目標(biāo)語言的翻譯。
[0011]然而,現(xiàn)有技術(shù)中存在的問題是機(jī)器翻譯技術(shù)尤其是借助于中間語言的機(jī)器翻譯技術(shù)的翻譯質(zhì)量存在提高的需要。

【發(fā)明內(nèi)容】

[0012]在下文中給出了關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
[0013]本發(fā)明的目的是提供一種機(jī)器翻譯設(shè)備和機(jī)器翻譯方法,能夠通過對于同一原文通過多種手段給出多個譯文候選,并采用合理的機(jī)制篩選出最佳的譯文來提高翻譯質(zhì)量。
[0014]同時,本發(fā)明還從語料、譯文候選篩選、規(guī)則等多個方面提出了對于借助于中間語言進(jìn)行翻譯的機(jī)器翻譯技術(shù)的改進(jìn),以進(jìn)一步提高翻譯質(zhì)量。
[0015]為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供一種機(jī)器翻譯方法,其包括:利用多個機(jī)器翻譯設(shè)備,分別將源語言的原文翻譯為目標(biāo)語言,以得到多個候選譯文;利用語言模型,針對多個候選譯文分別計算語言模型得分;分別獲得多個機(jī)器翻譯設(shè)備給出的關(guān)于多個候選譯文的設(shè)備得分;基于原文的長度和候選譯文的長度,針對多個候選譯文分別計算長度得分;基于語言模型得分、設(shè)備得分、長度得分的至少一個,分別計算多個候選譯文的總得分;以及選擇總得分最高的候選譯文作為機(jī)器翻譯的結(jié)果。
[0016]根據(jù)本發(fā)明的另一方面,提供一種機(jī)器翻譯設(shè)備,其包括:多個機(jī)器翻譯設(shè)備,用于將源語言的原文翻譯為目標(biāo)語言,以得到多個候選譯文;語言模型,用于針對多個候選譯文分別計算語言模型得分;設(shè)備得分獲取裝置,被配置為分別獲得多個機(jī)器翻譯設(shè)備給出的關(guān)于多個候選譯文的設(shè)備得分;長度得分計算裝置,被配置為基于原文的長度和候選譯文的長度,針對多個候選譯文分別計算長度得分;總得分計算裝置,被配置為基于語言模型得分、設(shè)備得分、長度得分的至少一個,分別計算多個候選譯文的總得分;以及譯文選擇裝置,被配置為選擇總得分最高的候選譯文作為機(jī)器翻譯的結(jié)果。
[0017]另外,根據(jù)本發(fā)明的另一方面,還提供了 一種存儲介質(zhì)。所述存儲介質(zhì)包括機(jī)器可讀的程序代碼,當(dāng)在信息處理設(shè)備上執(zhí)行所述程序代碼時,所述程序代碼使得所述信息處理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述方法。
[0018]此外,根據(jù)本發(fā)明的再一方面,還提供了 一種程序產(chǎn)品。所述程序產(chǎn)品包括機(jī)器可執(zhí)行的指令,當(dāng)在信息處理設(shè)備上執(zhí)行所述指令時,所述指令使得所述信息處理設(shè)備執(zhí)行根據(jù)本發(fā)明的上述方法。
[0019]在下面的說明書部分中給出本發(fā)明的其他方面,其中,詳細(xì)說明用于充分地公開本發(fā)明的優(yōu)選實(shí)施例,而不對其施加限定。
【專利附圖】

【附圖說明】
[0020]參照下面結(jié)合附圖對本發(fā)明實(shí)施例的說明,會更加容易地理解本發(fā)明的以上和其它目的、特點(diǎn)和優(yōu)點(diǎn)。附圖中的部件只是為了示出本發(fā)明的原理。在附圖中,相同的或類似的技術(shù)特征或部件將采用相同或類似的附圖標(biāo)記來表示。附圖中:[0021]圖1是示出根據(jù)本發(fā)明的機(jī)器翻譯方法的流程圖;
[0022]圖2是示出擴(kuò)展語料的獲取方法的流程圖;
[0023]圖3是示出根據(jù)本發(fā)明的第二翻譯設(shè)備將源語言的原文翻譯為目標(biāo)語言的譯文的流程圖;
[0024]圖4是示出擴(kuò)展規(guī)則的獲取方法的示意圖;
[0025]圖5是示出根據(jù)本發(fā)明的機(jī)器翻譯系統(tǒng)的示例結(jié)構(gòu)的圖;
[0026]圖6是示出根據(jù)本發(fā)明的擴(kuò)展語料生成裝置的示例結(jié)構(gòu)的圖;
[0027]圖7是示出根據(jù)本發(fā)明的第二翻譯設(shè)備的示例結(jié)構(gòu)的圖;
[0028]圖8是示出根據(jù)本發(fā)明的擴(kuò)展規(guī)則生成裝置的示例結(jié)構(gòu)的圖;以及
[0029]圖9是示出個人計算機(jī)的示例性結(jié)構(gòu)的框圖。
【具體實(shí)施方式】
[0030]在下文中將結(jié)合附圖對本發(fā)明的示范性實(shí)施例進(jìn)行詳細(xì)描述。為了清楚和簡明起見,在說明書中并未描述實(shí)際實(shí)施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實(shí)際實(shí)施例的過程中必須做出很多特定于實(shí)施方式的決定,以便實(shí)現(xiàn)開發(fā)人員的具體目標(biāo),例如,符合與設(shè)備及業(yè)務(wù)相關(guān)的那些限制條件,并且這些限制條件可能會隨著實(shí)施方式的不同而有所改變。此外,還應(yīng)該了解,雖然開發(fā)工作有可能是非常復(fù)雜和費(fèi)時的,但對得益于本公開內(nèi)容的本領(lǐng)域技術(shù)人員來說,這種開發(fā)工作僅僅是例行的任務(wù)。
[0031]在此,還需要說明的一點(diǎn)是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。另外,還需要指出的是,在本發(fā)明的一個附圖或一種實(shí)施方式中描述的元素和特征可以與一個或多個其它附圖或?qū)嵤┓绞街惺境龅脑睾吞卣飨嘟Y(jié)合。
[0032]如上所述,在采用多個機(jī)器翻譯設(shè)備對同一原文進(jìn)行翻譯時,并不存在有效的手段對來自多個機(jī)器翻譯設(shè)備的多個候選譯文進(jìn)行合理的評價以選擇最佳譯文。
[0033]本發(fā)明的發(fā)明人意識到至少可以從以下三個方面對譯文進(jìn)行評價:語言模型、翻譯設(shè)備給出的特征、原文譯文長度比。本發(fā)明不限于此,可以將其它方面的評價結(jié)果與本發(fā)明提出的三個方面中的至少一個的評價結(jié)果相融合,作為最終的評價結(jié)果。
[0034]這里應(yīng)指出,機(jī)器翻譯設(shè)備的原文和譯文不限于句子,也應(yīng)包括由句子組成的段落,以及句子的一部分。
[0035]下面參照圖1詳細(xì)描述根據(jù)本發(fā)明的機(jī)器翻譯方法的細(xì)節(jié)。
[0036]圖1示出了根據(jù)本發(fā)明的機(jī)器翻譯方法的流程圖。
[0037]根據(jù)本發(fā)明的機(jī)器翻譯方法包括:利用多個機(jī)器翻譯設(shè)備,分別將源語言的原文翻譯為目標(biāo)語言,以得到多個候選譯文(步驟SI);利用語言模型,針對多個候選譯文分別計算語言模型得分(步驟S2);分別獲得多個機(jī)器翻譯設(shè)備給出的關(guān)于多個候選譯文的設(shè)備得分(步驟S3);基于原文的長度和候選譯文的長度,針對多個候選譯文分別計算長度得分(步驟S4);基于語言模型得分、設(shè)備得分、長度得分的至少一個,分別計算多個候選譯文的總得分(步驟S5);以及選擇總得分最高的候選譯文作為機(jī)器翻譯的結(jié)果(步驟S6)。
[0038]在步驟SI中,利用多個機(jī)器翻譯設(shè)備,分別將源語言的原文翻譯為目標(biāo)語言,以得到多個候選譯文。[0039]應(yīng)注意,本發(fā)明能夠利用的機(jī)器翻譯設(shè)備可以包括上面提到的各種機(jī)器翻譯設(shè)備,如基于規(guī)則的機(jī)器翻譯設(shè)備、基于實(shí)例的機(jī)器翻譯設(shè)備、基于統(tǒng)計的機(jī)器翻譯設(shè)備等。顯然,也包括借助于中間語言進(jìn)行翻譯的機(jī)器翻譯設(shè)備,但不限于此,只要機(jī)器翻譯設(shè)備能夠?qū)崿F(xiàn)將源語言翻譯為目標(biāo)語言的功能即可。
[0040]在步驟S2中,利用語言模型,針對多個候選譯文分別計算語言模型得分。
[0041]語言模型包括能夠針對候選譯文,從候選譯文本身的特性,例如候選譯文的流暢度、語法結(jié)構(gòu)或語義結(jié)構(gòu)的等方面,評價候選譯文質(zhì)量的語言模型。
[0042]語言模型大體可分為如下幾類:基于譯文流暢度的語言模型(如N元語言模型)、基于譯文語法結(jié)構(gòu)或語義結(jié)構(gòu)的語言模型(如結(jié)構(gòu)化語言模型)。
[0043]例如,N元語言模型可以計算一個句子的出現(xiàn)的概率來測試句子的流暢度。語言模型得分可以反映哪個詞序列出現(xiàn)的可能性更大。例如,假設(shè)句子S=W1W2W3W4W5WfWn^md表示一個句子,W表示句子中的一個單元(詞或字等),句子S的概率可以表示為:
[0044]P (S) =P (W1) P (W21W1) P (w31W1W2)...p (wn | W1W2…Wlri)
[0045]上式中的各概率及條件概率可通過對于語料庫中的單語語料的學(xué)習(xí)而獲得。
[0046]可以以概率值本身,或經(jīng)過任何適當(dāng)?shù)淖儞Q處理等得到語言模型得分。
[0047]N元語言模型描述一個句子中單 元序列的線性關(guān)系,而結(jié)構(gòu)化語言模型引入語法信息或語義結(jié)構(gòu)。通過分析句子的語法信息和語義結(jié)構(gòu),并用樹的形式對句子進(jìn)行表示,來構(gòu)建相應(yīng)的語言模型。在給句子打分的時候,首先分析句子的結(jié)構(gòu)信息,然后針對句子的結(jié)構(gòu)信息給句子進(jìn)行打分。
[0048]語言模型例如可以通過對語料庫進(jìn)行學(xué)習(xí)而生成。語言模型的生成方法在此不再贅述,本發(fā)明的意圖在于利用語言模型,從語言模型的角度對候選譯文進(jìn)行評價。
[0049]在步驟S3中,分別獲得多個機(jī)器翻譯設(shè)備給出的關(guān)于多個候選譯文的設(shè)備得分。
[0050]機(jī)器翻譯設(shè)備在給出其輸出結(jié)果即譯文之前,通常會產(chǎn)生多個譯文候選,通過機(jī)器翻譯設(shè)備內(nèi)部的評價方法對多個譯文候選進(jìn)行評價,并根據(jù)評價結(jié)果輸出最佳的譯文。
[0051]有的機(jī)器翻譯設(shè)備會在輸出譯文的同時,輸出該譯文對應(yīng)的設(shè)備得分;有的機(jī)器翻譯設(shè)備雖然并不將設(shè)備得分與譯文同時輸出,但可以獲得作為中間結(jié)果的設(shè)備得分。只要能夠從機(jī)器翻譯設(shè)備獲得其給出的設(shè)備得分,就可以對于該譯文執(zhí)行本發(fā)明的步驟S3。
[0052]應(yīng)注意,即使對于某些譯文,無法獲得其對應(yīng)的設(shè)備得分,由于只要有譯文就能計算本發(fā)明步驟S2中的語言模型得分以及下面將描述的長度得分,因此,這樣的機(jī)器翻譯設(shè)備及其譯文仍適用于本發(fā)明的方法和系統(tǒng),可以基于譯文的語言模型得分和長度得分的至少一個,對該譯文進(jìn)行評價。
[0053]在下文所述的本發(fā)明的第一翻譯設(shè)備、第二翻譯設(shè)備、第三翻譯設(shè)備中,均可通過如下方法計算設(shè)備得分:根據(jù)機(jī)器翻譯設(shè)備給出的特征和權(quán)重,計算其輸出的候選譯文的設(shè)備得分。
[0054]其中,特征可以包括正向翻譯概率、反向翻譯概率、正向詞匯化概率、反向詞匯化概率、原文中有多少詞需要調(diào)序等。各個特征的權(quán)重之和等于1,權(quán)重的具體取值可根據(jù)經(jīng)驗或語言學(xué)規(guī)律指定,或利用如最小錯誤率訓(xùn)練算法(Minimum Error Rate Training,MERT)在大量語料基礎(chǔ)上訓(xùn)練得到。
[0055]例如,某一機(jī)器翻譯設(shè)備使用M個特征W ('O,s表示原文,t表示譯文,i表示特征的序號,i=l, 2,…,M,M為自然數(shù),相應(yīng)的特征權(quán)重為。則譯文t的設(shè)備得分S (t)可
通過下式計算:
【權(quán)利要求】
1.一種機(jī)器翻譯方法,包括: 利用多個機(jī)器翻譯設(shè)備,分別將源語言的原文翻譯為目標(biāo)語言,以得到多個候選譯文; 利用語言模型,針對多個候選譯文分別計算語言模型得分; 分別獲得多個機(jī)器翻譯設(shè)備給出的關(guān)于多個候選譯文的設(shè)備得分; 基于原文的長度和候選譯文的長度,針對多個候選譯文分別計算長度得分; 基于語言模型得分、設(shè)備得分、長度得分的至少一個,分別計算多個候選譯文的總得分;以及 選擇總得分最高的候選譯文作為機(jī)器翻譯的結(jié)果。
2.如權(quán)利要求1所述的機(jī)器翻譯方法,其中,所述分別計算語言模型得分包括: 利用語言模型,基于候選譯文的流暢度、語法結(jié)構(gòu)或語義結(jié)構(gòu)的至少一個,計算每一個候選譯文的語言模型得分。
3.如權(quán)利要求1所述的機(jī)器翻譯方法,其中,所述分別獲得設(shè)備得分包括: 根據(jù)機(jī)器翻譯設(shè)備給出的特征和權(quán)重,計算其輸出的候選譯文的設(shè)備得分。
4.如權(quán)利要求1所述的機(jī)器翻譯方法,其中,所述分別計算長度得分包括: 根據(jù)原文的長度和候選譯文的長度之比與預(yù)定值的比較,計算每一個候選譯文的長度得分。
5.如權(quán)利要求1所述的機(jī)器翻譯方法, 其中,所述多個機(jī)器翻譯設(shè)備包括:基于擴(kuò)展語料訓(xùn)練的第一翻譯設(shè)備; 其中,所述擴(kuò)展語料通過如下步驟獲得: 對于源語言和中間語言的第一語料庫中的雙語句對,將雙語句對中的中間語言翻譯為目標(biāo)語言,以獲得源語言和目標(biāo)語言的雙語句對,作為第一新雙語句對; 對于中間語言和目標(biāo)語言的第二語料庫中的雙語句對,將雙語句對中的中間語言翻譯為源語言,以獲得源語言和目標(biāo)語言的雙語句對,作為第二新雙語句對;以及基于第一新雙語句對和第二新雙語句對,獲得擴(kuò)展語料。
6.如權(quán)利要求5所述的機(jī)器翻譯方法,其中,所述基于第一新雙語句對和第二新雙語句對,獲得擴(kuò)展語料包括: 去除不滿足下述條件的第一新雙語句對和第二新雙語句對:新雙語句對中的源語言的句子的長度與目標(biāo)語言的句子的長度之比大于第一閾值且小于第二閾值;以及 將剩余的第一新雙語句對和第二新雙語句對與現(xiàn)有的源語言和目標(biāo)語言的雙語句對進(jìn)行合并和去除重復(fù),以獲得擴(kuò)展語料。
7.如權(quán)利要求1所述的機(jī)器翻譯方法, 其中,所述多個機(jī)器翻譯設(shè)備包括:第二翻譯設(shè)備,所述第二翻譯設(shè)備包括級聯(lián)的能夠在源語言和中間語言之間進(jìn)行翻譯的第一翻譯子設(shè)備和能夠在中間語言和目標(biāo)語言之間進(jìn)行翻譯的第二翻譯子設(shè)備; 其中,利用第一翻譯子設(shè)備,將源語言的原文翻譯為中間語言的多個中間結(jié)果;利用第二翻譯子設(shè)備,將多個中間結(jié)果的每一個翻譯為目標(biāo)語言的多個譯文候選;并從多個譯文候選中選擇最佳的一個作為候選譯文; 其中,所述選擇步驟包括:對于多個譯文候選的每一個,根據(jù)第一翻譯子設(shè)備給出的特征和權(quán)重,計算其第一翻譯子設(shè)備得分,并根據(jù)第二翻譯子設(shè)備給出的特征和權(quán)重,計算其第二翻譯子設(shè)備得分;以及 將第一翻譯子設(shè)備得分和第二翻譯子設(shè)備得分之和最大的譯文候選,作為候選譯文。
8.如權(quán)利要求1所述的機(jī)器翻譯方法, 其中,所述多個機(jī)器翻譯設(shè)備包括:基于擴(kuò)展規(guī)則的第三翻譯設(shè)備; 其中,所述擴(kuò)展規(guī)則通過如下步驟獲得: 基于源語言和中間語言的第一語料庫,抽取關(guān)于源語言和中間語言的第一規(guī)則; 基于中間語言和目標(biāo)語言的第二語料庫,抽取關(guān)于中間語言和目標(biāo)語言的第二規(guī)則; 選擇第一規(guī)則和第二規(guī)則使得第一規(guī)則的目標(biāo)端與第二規(guī)則的源端相同;以及 基于所選擇的第一規(guī)則的源端和第二規(guī)則的目標(biāo)端,生成擴(kuò)展規(guī)則。
9.如權(quán)利要求8所述的機(jī)器翻譯方法,其中,所述生成擴(kuò)展規(guī)則包括: 將所選擇的第一規(guī)則的源端和第二規(guī)則的目標(biāo)端作為擴(kuò)展規(guī)則的源端和目標(biāo)端;并且基于所選擇的第一規(guī)則和第二規(guī)則的正向翻譯概率、反向翻譯概率、正向詞匯化概率、反向詞匯化概率,分別計算擴(kuò)展規(guī)則的正向翻譯概率、反向翻譯概率、正向詞匯化概率、反向詞匯化概率; 其中,對于具有同一源端的多個擴(kuò)展規(guī)則,僅保留其正向翻譯概率、反向翻譯概率、正向詞匯化概率、反向詞匯化概率之和最大的前K個擴(kuò)展規(guī)則,K為預(yù)定自然數(shù)。
10.一種機(jī)器翻譯系統(tǒng),包括: 多個機(jī)器翻譯設(shè)備,用于將源語言的原文翻譯為目標(biāo)語言,以得到多個候選譯文; 語言模型,用于針對多個候選譯文分別計算語言模型得分; 設(shè)備得分獲取裝置,被配置為分別獲得多個機(jī)器翻譯設(shè)備給出的關(guān)于多個候選譯文的設(shè)備得分; 長度得分計算裝置,被配置為基于原文的長度和候選譯文的長度,針對多個候選譯文分別計算長度得分; 總得分計算裝置,被配置為基于語言模型得分、設(shè)備得分、長度得分的至少一個,分別計算多個候選譯文的總得分;以及 譯文選擇裝置,被配置為選擇總得分最高的候選譯文作為機(jī)器翻譯的結(jié)果。
【文檔編號】G06F17/28GK103678285SQ201210320544
【公開日】2014年3月26日 申請日期:2012年8月31日 優(yōu)先權(quán)日:2012年8月31日
【發(fā)明者】李賢華, 鄭仲光, 付亦雯, 孟遙, 于浩 申請人:富士通株式會社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
永靖县| 雷波县| 兰溪市| 宜良县| 阿瓦提县| 湖南省| 黄浦区| 湘阴县| 农安县| 长治市| 辽阳县| 永德县| 宁安市| 肃北| 兴仁县| 五原县| 邢台县| 陆川县| 镇雄县| 台州市| 贵德县| 刚察县| 天水市| 南宁市| 台前县| 汝州市| 乌兰县| 莱阳市| 彭州市| 洛宁县| 平安县| 巴中市| 彰化市| 佛山市| 祁门县| 英德市| 克东县| 麻江县| 涟源市| 西峡县| 伊宁县|