欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于機(jī)器翻譯的設(shè)備和方法

文檔序號(hào):6480824閱讀:325來(lái)源:國(guó)知局
專利名稱:用于機(jī)器翻譯的設(shè)備和方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種用于將已輸入的源語(yǔ)言語(yǔ)句翻譯成目標(biāo)語(yǔ)言語(yǔ)句的機(jī) 器翻譯設(shè)備和機(jī)器翻譯方法。
背景技術(shù)
隨著自然語(yǔ)言處理技術(shù)的發(fā)展,機(jī)器翻譯設(shè)備得到了發(fā)展,這種設(shè)備 接收以源語(yǔ)言表達(dá)的源語(yǔ)言語(yǔ)句的輸入、將輸入語(yǔ)句轉(zhuǎn)換成期望目標(biāo)語(yǔ)言 的語(yǔ)句并輸出轉(zhuǎn)換結(jié)果。例如,將日文表達(dá)的文本等翻譯成諸如英文或中 文之類的另一種語(yǔ)言的機(jī)器翻譯設(shè)備己經(jīng)投入實(shí)際使用。為了以更高水平 的精確度更忠實(shí)地翻譯源語(yǔ)言的輸入語(yǔ)句,這種機(jī)器翻譯設(shè)備需要包括能 夠針對(duì)自然語(yǔ)言的多樣性和歧義找到充分的解決方案的機(jī)構(gòu)。
例如,JP-A 2000-10974(特開)提出了一種技術(shù),利用該技術(shù),通過(guò)與 用戶交互來(lái)補(bǔ)充源語(yǔ)言語(yǔ)句中缺少的格要素(case element)。該技術(shù)實(shí)現(xiàn) 了針對(duì)源語(yǔ)言語(yǔ)句翻譯期間出現(xiàn)的歧義提供解決方案并實(shí)現(xiàn)了高水平的精 確度而不會(huì)造成分析錯(cuò)誤的翻譯設(shè)備。
然而,有這樣一些情形,其中,即使源語(yǔ)言語(yǔ)句沒(méi)有分析歧義,該翻 譯設(shè)備也不能夠產(chǎn)生充分反映源語(yǔ)言語(yǔ)句暗含目的的翻譯語(yǔ)句。例如,由 于文化背景、措辭或語(yǔ)用的原因,任何源語(yǔ)言都有通常省略的某些單詞或 短語(yǔ)。情況常常是省略這樣的單詞或短語(yǔ)不會(huì)導(dǎo)致源語(yǔ)言中的文法問(wèn)題。 于是,難以檢測(cè)到這種情況在翻譯涉及到省略這種單詞或短語(yǔ)的源語(yǔ)言 語(yǔ)句時(shí),翻譯語(yǔ)句未適當(dāng)反映出源語(yǔ)言語(yǔ)句的暗含目的。
此外, 一般而言,機(jī)器翻譯設(shè)備的用戶通常對(duì)目標(biāo)語(yǔ)言了解不夠。于 是,用戶極難檢査該設(shè)備輸出的翻譯語(yǔ)句以判定翻譯語(yǔ)句未恰當(dāng)反映用戶 目的并進(jìn)一步再次輸入帶補(bǔ)充信息的源語(yǔ)言語(yǔ)句以獲得更適當(dāng)?shù)姆g語(yǔ) 句。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面, 一種機(jī)器翻譯設(shè)備,其包括范例存儲(chǔ)單元, 其彼此對(duì)應(yīng)地存儲(chǔ)目標(biāo)語(yǔ)言形式的多個(gè)目標(biāo)語(yǔ)言范例和源語(yǔ)言形式的多個(gè) 源語(yǔ)言范例,所述多個(gè)目標(biāo)語(yǔ)言范例中的每一個(gè)目標(biāo)語(yǔ)言范例的含義等價(jià)
于所述多個(gè)源語(yǔ)言范例中對(duì)應(yīng)一個(gè)源語(yǔ)言范例的含義;輸入接收單元,其 接收所述源語(yǔ)言形式的輸入語(yǔ)句;搜索單元,其在所述范例存儲(chǔ)單元中搜 索所述多個(gè)目標(biāo)語(yǔ)言范例中與所述多個(gè)源語(yǔ)言范例中匹配于或類似于所述 輸入語(yǔ)句的一個(gè)源語(yǔ)言范例相對(duì)應(yīng)的一個(gè)目標(biāo)語(yǔ)言范例;翻譯單元,其通 過(guò)將所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句,并通 過(guò)將所述搜索中找到的所述多個(gè)目標(biāo)語(yǔ)言范例中的所述一個(gè)目標(biāo)語(yǔ)言范例 翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生反向翻譯語(yǔ)句;檢測(cè)單元,其檢測(cè)所述反 向翻譯語(yǔ)句和所述輸入語(yǔ)句之間的多個(gè)差異部分;以及輸出單元,其輸出 所述差異部分。
根據(jù)本發(fā)明的另一個(gè)方面, 一種機(jī)器翻譯設(shè)備,其包括范例存儲(chǔ)單 元,其彼此對(duì)應(yīng)地存儲(chǔ)目標(biāo)語(yǔ)言形式的多個(gè)目標(biāo)語(yǔ)言范例和源語(yǔ)言形式的 多個(gè)源語(yǔ)言范例,所述多個(gè)目標(biāo)語(yǔ)言范例中的每一個(gè)目標(biāo)語(yǔ)言范例的含義 等價(jià)于所述多個(gè)源語(yǔ)言范例中對(duì)應(yīng)一個(gè)源語(yǔ)言范例的含義;輸入接收單元, 其接收所述源語(yǔ)言形式的輸入語(yǔ)句;搜索單元,其在所述范例存儲(chǔ)單元中 搜索所述多個(gè)目標(biāo)語(yǔ)言范例中與所述多個(gè)源語(yǔ)言范例中匹配于或類似于所 述輸入語(yǔ)句的一個(gè)源語(yǔ)言范例相對(duì)應(yīng)的一個(gè)目標(biāo)語(yǔ)言范例;第一翻譯單元, 其通過(guò)將所述搜索中找到的所述多個(gè)目標(biāo)語(yǔ)言范例中的一個(gè)目標(biāo)語(yǔ)言范例 翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生第一反向翻譯語(yǔ)句;第二翻譯單元,其通 過(guò)將所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句,并通 過(guò)將所產(chǎn)生的目標(biāo)語(yǔ)言語(yǔ)句翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生第二反向翻譯 語(yǔ)句;檢測(cè)單元,其檢測(cè)所述第一反向翻譯語(yǔ)句和所述第二反向翻譯語(yǔ)句 之間的差異部分;以及輸出單元,其輸出所述差異部分。
根據(jù)本發(fā)明的又一方面, 一種機(jī)器翻譯方法,其包括接收源語(yǔ)言形 式的輸入語(yǔ)句;在范例存儲(chǔ)單元中搜索所述多個(gè)目標(biāo)語(yǔ)言范例中與所述多 個(gè)源語(yǔ)言范例中匹配于或類似于所述輸入語(yǔ)句的一個(gè)源語(yǔ)言范例相對(duì)應(yīng)的 一個(gè)目標(biāo)語(yǔ)言范例,其中,所述范例存儲(chǔ)單元彼此對(duì)應(yīng)地存儲(chǔ)目標(biāo)語(yǔ)言形式的多個(gè)目標(biāo)語(yǔ)言范例和所述源語(yǔ)言形式的多個(gè)源語(yǔ)言范例,所述多個(gè)目 標(biāo)語(yǔ)言范例中的每一個(gè)目標(biāo)語(yǔ)言范例的含義等價(jià)于所述多個(gè)源語(yǔ)言范例中 對(duì)應(yīng)一個(gè)源語(yǔ)言范例的含義;通過(guò)將所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的 形式來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句;通過(guò)將所述搜索中找到的所述多個(gè)目標(biāo)語(yǔ)言范 例中的所述一個(gè)目標(biāo)語(yǔ)言范例翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生反向翻譯語(yǔ) 句;檢測(cè)所述反向翻譯語(yǔ)句和所述輸入語(yǔ)句之間的差異部分;以及輸出所 述差異部分。
根據(jù)本發(fā)明的又一方面, 一種機(jī)器翻譯方法,其包括接收源語(yǔ)言形 式的輸入語(yǔ)句;在范例存儲(chǔ)單元中搜索所述多個(gè)目標(biāo)語(yǔ)言范例中與所述多 個(gè)源語(yǔ)言范例中匹配于或類似于所述輸入語(yǔ)句的一個(gè)源語(yǔ)言范例相對(duì)應(yīng)的 一個(gè)目標(biāo)語(yǔ)言范例,其中,所述范例存儲(chǔ)單元彼此對(duì)應(yīng)地存儲(chǔ)目標(biāo)語(yǔ)言形 式的多個(gè)目標(biāo)語(yǔ)言范例和所述源語(yǔ)言形式的多個(gè)源語(yǔ)言范例,所述多個(gè)目 標(biāo)語(yǔ)言范例中的每一個(gè)目標(biāo)語(yǔ)言范例的含義等價(jià)于所述多個(gè)源語(yǔ)言范例中 對(duì)應(yīng)一個(gè)源語(yǔ)言范例的含義;通過(guò)將所述搜索中找到的所述多個(gè)目標(biāo)語(yǔ)言
范例中的一個(gè)目標(biāo)語(yǔ)言范例翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生第一反向翻譯 語(yǔ)句;通過(guò)將所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ) 句,并通過(guò)將所產(chǎn)生的目標(biāo)語(yǔ)言語(yǔ)句翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生第二 反向翻譯語(yǔ)句;檢測(cè)所述第一反向翻譯語(yǔ)句和所述第二反向翻譯語(yǔ)句之間 的差異部分;以及輸出所述差異部分。


圖l是根據(jù)本發(fā)明實(shí)施例的機(jī)器翻譯設(shè)備的方框圖; 圖2為示出了范例存儲(chǔ)單元中存儲(chǔ)的平行翻譯范例組的示范性數(shù)據(jù)結(jié) 構(gòu)的圖示;
圖3為示出了類似的平行翻譯范例列表范例的圖示;
圖4為解釋用于檢測(cè)源語(yǔ)言輸入語(yǔ)句和經(jīng)編輯的范例反向翻譯語(yǔ)句之 間差異的過(guò)程的圖示;
圖5為解釋用于檢測(cè)反向翻譯輸入語(yǔ)句和經(jīng)編輯的范例反向翻譯語(yǔ)句 之間差異的過(guò)程的圖示;
圖6為示出了其中存儲(chǔ)差異信息的差異信息列表范例的圖示;
9圖7為示出了建議語(yǔ)句范例的圖示;
圖8為示出了用戶差異信息范例的圖示;
圖9為示出了顯示屏范例的圖示;
圖10是根據(jù)該實(shí)施例的機(jī)器翻譯過(guò)程的總體流程的流程圖11是根據(jù)該實(shí)施例的差異檢測(cè)過(guò)程的總體流程的流程圖12是根據(jù)該實(shí)施例的建議語(yǔ)句產(chǎn)生過(guò)程的總體流程的流程圖13是根據(jù)該實(shí)施例的結(jié)果輸出過(guò)程的總體流程的流程圖14是根據(jù)該實(shí)施例的假設(shè)施加過(guò)程的總體流程的流程圖15是根據(jù)該實(shí)施例的更新過(guò)程的總體流程的流程圖16為示出了翻譯語(yǔ)句范例的圖示;
圖17為示出了編輯范例翻譯語(yǔ)句的范例的圖示;
圖18為示出了顯示屏范例的圖示;
圖19為示出了類似的平行翻譯范例列表范例的圖示;
圖20為示出了翻譯語(yǔ)句范例的圖示;
圖21為示出了差異信息列表的范例的圖示;
圖22為示出了顯示屏范例的圖示;
圖23為示出了顯示屏另一范例的圖示;以及
圖24為解釋根據(jù)該實(shí)施例的機(jī)器翻譯設(shè)備的硬件配置的圖示。
具體實(shí)施例方式
將參考附圖詳細(xì)描述根據(jù)本發(fā)明的機(jī)器翻譯設(shè)備和機(jī)器翻譯方法的示 范性實(shí)施例。在接下來(lái)的部分中,將利用在日文和中文語(yǔ)言之間或日文和 英文語(yǔ)言之間翻譯的范例來(lái)解釋本發(fā)明。然而,在翻譯過(guò)程中可用作目標(biāo) 語(yǔ)言的語(yǔ)言不限于這些語(yǔ)言。使用任何其他語(yǔ)言都是可接受的。
根據(jù)本發(fā)明實(shí)施例的機(jī)器翻譯設(shè)備搜索包括類似于源語(yǔ)言輸入語(yǔ)句的 范例的平行翻譯范例組,通過(guò)將平行翻譯范例組中的目標(biāo)語(yǔ)言范例翻譯成 源語(yǔ)言所獲得的反向翻譯語(yǔ)句與輸入語(yǔ)句或與進(jìn)一步將輸入語(yǔ)句翻譯成目 標(biāo)語(yǔ)言的結(jié)果翻譯成源語(yǔ)言所獲得的另一個(gè)反向翻譯語(yǔ)句進(jìn)行比較來(lái)檢測(cè) 差異部分(即差異),并輸出所檢測(cè)到的差異。
如圖1所示,機(jī)器翻譯設(shè)備100包括輸入接收單元101;選擇接收單元102;翻譯控制單元110;輸出單元103和范例存儲(chǔ)單元120。翻譯控制
單元110是控制翻譯過(guò)程的構(gòu)成要素,包括搜索單元lll、翻譯單元112、 檢測(cè)單元113、產(chǎn)生單元114、假設(shè)施加單元115和更新單元116。接下來(lái) 將詳細(xì)解釋每個(gè)構(gòu)成要素的功能。
輸入接收單元101接收用戶提供的源語(yǔ)言形式的輸入語(yǔ)句(在下文中稱 為"源語(yǔ)言輸入語(yǔ)句")。為了輸入源語(yǔ)言輸入語(yǔ)句,使用任何通用輸入模 塊,例如鍵盤、定點(diǎn)裝置、手寫字符識(shí)別裝置和光學(xué)字符讀取器(OCR)都是 可接受的。輸入接收單元101可以使用任何方法,只要其能夠執(zhí)行處理以 最終獲得源語(yǔ)言輸入語(yǔ)句即可。例如,如下設(shè)置是可接受的輸入接收單 元101接收用戶的發(fā)聲作為語(yǔ)音輸入,并作為對(duì)輸入進(jìn)行的語(yǔ)音識(shí)別過(guò)程 結(jié)果輸出源語(yǔ)言輸入語(yǔ)句。
范例存儲(chǔ)單元120中存儲(chǔ)平行翻譯范例組,每個(gè)平行翻譯范例組都由 源語(yǔ)言語(yǔ)句和至少一種目標(biāo)語(yǔ)言的語(yǔ)句構(gòu)成,源語(yǔ)言語(yǔ)句是目標(biāo)語(yǔ)言語(yǔ)句 的翻譯,反之亦然。在本實(shí)施例的描述中,在所用的范例中每個(gè)平行翻譯 范例組包括彼此對(duì)應(yīng)保持的日文、中文和英文范例。彼此對(duì)應(yīng)地保持范例
的語(yǔ)言數(shù)量不必一定是三個(gè)。換言之,另一種設(shè)置是可接受的彼此對(duì)應(yīng)
地保持兩種語(yǔ)言或四種或更多語(yǔ)言的范例。在使用三種或更多語(yǔ)言范例的 情況下,可以通過(guò)設(shè)置使用戶能夠動(dòng)態(tài)選擇期望的目標(biāo)語(yǔ)言。
在圖2中示出了存儲(chǔ)了六個(gè)平行翻譯范例組(即平行翻譯范例組201到 206)的范例。平行翻譯范例組201到206中的每一個(gè)都包含多種語(yǔ)言的范 例。例如,平行翻譯范例組201包含日文語(yǔ)句207、中文語(yǔ)句208和英文語(yǔ) 句209,每個(gè)語(yǔ)句都是其他語(yǔ)句的平行翻譯。
在下面的解釋中,將把每個(gè)平行翻譯范例組中的范例語(yǔ)句中與表達(dá)輸 入接收單元101接收的源語(yǔ)言輸入語(yǔ)句的語(yǔ)言相同的語(yǔ)句稱為"范例源語(yǔ) 句",而將把指定為翻譯目標(biāo)語(yǔ)言的語(yǔ)言的語(yǔ)句稱為"范例翻譯語(yǔ)句"。
可以利用任何通用存儲(chǔ)介質(zhì),例如硬盤驅(qū)動(dòng)器(HDD)、光盤、存儲(chǔ)卡和 隨機(jī)存取存儲(chǔ)器(RAM)來(lái)配置范例存儲(chǔ)單元120。
返回到圖1的描述,搜索單元111在范例存儲(chǔ)單元120中搜索均包含 類似于輸入接收單元101接收的源語(yǔ)言輸入語(yǔ)句的范例源語(yǔ)句的平行翻譯 范例組。搜索單元111還將平行翻譯范例組存儲(chǔ)到類似的平行翻譯范例列
ii表中,同時(shí)根據(jù)它們的相似水平的次序設(shè)置它們。為了計(jì)算平行翻譯范例 組的相似水平,使用通常使用的任何方法都是可接受的,例如在描述單詞 的概念性的上級(jí)/從屬關(guān)系和同義詞關(guān)系的類屬詞典中測(cè)量單詞之間的距 離的方法。
例如,搜索單元111使用在相關(guān)單詞完全匹配時(shí)具有最大值的指標(biāo)作 為表示單詞間相似水平的單詞與單詞相似水平。此外,搜索單元111利用 任何廣為人知的方法,例如動(dòng)態(tài)規(guī)劃方法來(lái)檢測(cè)使整個(gè)語(yǔ)句的單詞與單詞 相似水平最大的單詞與單詞對(duì)應(yīng)度。此外,搜索單元111將假想利用所檢 測(cè)的單詞與單詞對(duì)應(yīng)度獲得的單詞與單詞相似水平總和用作整個(gè)語(yǔ)句的相 似水平。于是,通過(guò)進(jìn)行搜索,搜索單元111找到按照整個(gè)語(yǔ)句相似水平 降序排列的預(yù)定數(shù)量的平行翻譯范例組。
圖3為示出了類似的平行翻譯范例列表范例的圖示,該列表中存儲(chǔ)了 搜索單元111進(jìn)行處理的結(jié)果。如圖3所示,該類似平行翻譯范例列表中 存儲(chǔ)了在搜索中發(fā)現(xiàn)的圖2中所示的一些平行翻譯范例組作為類似于源語(yǔ) 言輸入語(yǔ)句的范例,同時(shí)按照它們的相似水平的順序設(shè)置它們。圖3中所 示的為類似平行翻譯范例列表的范例,其中存儲(chǔ)了分別對(duì)應(yīng)于圖2所示的 平行翻譯范例組202、 203和201的平行翻譯范例組301、 302和303。
返回到圖1的描述,在輸出翻譯語(yǔ)句之前,在指定的字符串代表源語(yǔ) 言語(yǔ)句的情況下,翻譯單元112將該語(yǔ)句翻譯成目標(biāo)語(yǔ)言的語(yǔ)句,在指定 的字符串代表目標(biāo)語(yǔ)言語(yǔ)句的情況下,翻譯單元112將該語(yǔ)句翻譯成源語(yǔ) 言語(yǔ)句。例如,在目標(biāo)語(yǔ)言為中文且指定的字符串代表日文語(yǔ)句的情況下, 翻譯單元112將日文語(yǔ)句翻譯成中文語(yǔ)句。另一方面,在指定字符串代表 中文語(yǔ)句的情況下,翻譯單元112將中文語(yǔ)句翻譯成日文語(yǔ)句。
根據(jù)本實(shí)施例,響應(yīng)于來(lái)自檢測(cè)單元113的請(qǐng)求(稍后解釋),翻譯單 元112通過(guò)將編輯范例翻譯語(yǔ)句獲得的經(jīng)編輯的范例翻譯語(yǔ)句(稍后詳細(xì)解 釋)翻譯成源語(yǔ)言來(lái)產(chǎn)生經(jīng)編輯的范例反向翻譯語(yǔ)句。而且,響應(yīng)于來(lái)自檢 測(cè)單元113的請(qǐng)求,翻譯單元112通過(guò)將源語(yǔ)言輸入語(yǔ)句翻譯成目標(biāo)語(yǔ)言 產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句,并通過(guò)將所產(chǎn)生的目標(biāo)語(yǔ)言語(yǔ)句翻譯成源語(yǔ)言來(lái)產(chǎn)生 反向翻譯輸入語(yǔ)句。在檢測(cè)單元113檢測(cè)經(jīng)編輯的范例反向翻譯語(yǔ)句和源 語(yǔ)言輸入語(yǔ)句之間的差異、或經(jīng)編輯的范例反向翻譯語(yǔ)句和反向翻譯輸入語(yǔ)句之間的差異時(shí),會(huì)參考經(jīng)編輯的范例反向翻譯語(yǔ)句。
翻譯單元112執(zhí)行的翻譯過(guò)程可以采用通常使用的任何機(jī)器翻譯方法, 例如轉(zhuǎn)移法、基于范例的方法、基于統(tǒng)計(jì)的方法和中間語(yǔ)言方法。
檢測(cè)單元113檢測(cè)經(jīng)編輯的范例反向翻譯語(yǔ)句和源語(yǔ)言輸入語(yǔ)句之間
的差異、以及經(jīng)編輯的范例反向翻譯語(yǔ)句和反向翻譯輸入語(yǔ)句之間的差異。
更具體而言,首先,檢測(cè)單元113檢測(cè)源語(yǔ)言輸入語(yǔ)句和搜索單元111構(gòu) 造出的類似平行翻譯范例列表中存儲(chǔ)的平行翻譯范例組中包括的每個(gè)范例 源語(yǔ)句之間的差異。之后,檢測(cè)單元113利用源語(yǔ)言輸入語(yǔ)句中表現(xiàn)出差 異的單詞翻譯替換范例翻譯語(yǔ)句中對(duì)應(yīng)于范例源語(yǔ)句中表現(xiàn)出差異的單詞 的單詞,從而產(chǎn)生經(jīng)編輯的范例翻譯語(yǔ)句。此外,檢測(cè)單元113令翻譯單 元112將經(jīng)編輯的范例翻譯語(yǔ)句翻譯成源語(yǔ)言來(lái)獲得經(jīng)編輯的范例反向翻 譯語(yǔ)句。之后,檢測(cè)單元113檢測(cè)經(jīng)編輯的范例反向翻譯語(yǔ)句和源語(yǔ)言輸 入語(yǔ)句之間的差異。然后檢測(cè)單元113將包括所檢測(cè)的差異的差異信息存 儲(chǔ)到差異信息列表中,同時(shí)對(duì)應(yīng)于差異信息保持比較過(guò)程中所用的平行翻 譯范例組。
而且,檢測(cè)單元113令翻譯單元112將源語(yǔ)言輸入語(yǔ)句翻譯成目標(biāo)語(yǔ) 言來(lái)獲得目標(biāo)語(yǔ)言語(yǔ)句。此外,檢測(cè)單元113令翻譯單元112將目標(biāo)語(yǔ)言 語(yǔ)句進(jìn)一步翻譯成源語(yǔ)言來(lái)獲得反向翻譯輸入語(yǔ)句。之后,檢測(cè)單元113 檢測(cè)經(jīng)編輯的范例反向翻譯語(yǔ)句和反向翻譯輸入語(yǔ)句之間的差異。然后檢 測(cè)單元113將包括所檢測(cè)的差異的差異信息存儲(chǔ)到差異信息列表中,同時(shí) 對(duì)應(yīng)于差異信息保持比較過(guò)程中所用的平行翻譯范例組。
接下來(lái)將解釋檢測(cè)單元113執(zhí)行的差異檢測(cè)過(guò)程的特定范例。圖4為 示出了對(duì)以日文輸入的表達(dá)含義"我喜歡喝酒"的源語(yǔ)言輸入語(yǔ)句401進(jìn) 行的差異檢測(cè)過(guò)程范例的圖示。
應(yīng)當(dāng)指出,在日文中,在表達(dá)這種含義時(shí),可能會(huì)從該語(yǔ)句中省略以 "osake"(意為"酒")為賓語(yǔ)的動(dòng)詞"nomu"(意為"喝")。該源語(yǔ)言輸 入語(yǔ)句401代表省略了動(dòng)詞"nonm"(意為"喝")的日文語(yǔ)句。
在這種情形中,例如,作為搜索結(jié)果,搜索單元111找到對(duì)應(yīng)于圖2 中所示的平行翻譯范例組201的平行翻譯范例組402。平行翻譯范例組402 包括相互不同的語(yǔ)言范例,每個(gè)范例都表示"我喜歡看電影"。應(yīng)當(dāng)指出,從在平行翻譯范例組402中包括的日文范例源語(yǔ)句403中省略了以單詞 "eiga"(意為"電影")為賓語(yǔ)的動(dòng)詞"miru"(意為"看")。
因此,作為源語(yǔ)言輸入語(yǔ)句401和范例源語(yǔ)句403之間的差異,檢測(cè) 單元113檢測(cè)到意為"酒"的日文單詞"osake" 411和意為"電影"的日 文單詞"eiga" 412。然后,檢測(cè)單元113通過(guò)在范例翻譯語(yǔ)句404中以意 為"酒"的中文單詞或英文單詞代替至少一個(gè)意為"電影"的加下劃線的 單詞,來(lái)產(chǎn)生經(jīng)編輯的范例翻譯語(yǔ)句405。在圖4中示出了中文范例翻譯語(yǔ) 句和英文范例翻譯語(yǔ)句;然而,只要檢測(cè)單元113對(duì)對(duì)應(yīng)于指定目標(biāo)語(yǔ)言 的至少一個(gè)范例翻譯語(yǔ)句進(jìn)行差異檢測(cè)過(guò)程就足夠了。
接下來(lái),檢測(cè)單元113令翻譯單元112進(jìn)一步翻譯經(jīng)編輯的范例翻譯 語(yǔ)句405來(lái)產(chǎn)生經(jīng)編輯的范例反向翻譯語(yǔ)句406。之后,檢測(cè)單元113檢測(cè) 源語(yǔ)言輸入語(yǔ)句401和經(jīng)編輯的范例反向翻譯語(yǔ)句406之間的差異413、并 將包括所檢測(cè)的差異413的差異信息存儲(chǔ)到差異信息列表中,同時(shí)對(duì)應(yīng)于 該差異信息保持平行翻譯范例組402。
圖5為示出了對(duì)以日文輸入的表達(dá)含義"請(qǐng)不要忘記粘貼郵票"的源 語(yǔ)言輸入語(yǔ)句501進(jìn)行的差異檢測(cè)過(guò)程范例的圖示。
應(yīng)當(dāng)指出,在日文中,在表達(dá)這種含義時(shí),可能會(huì)從該語(yǔ)句中省略以 "kitte"(意為"郵票")為賓語(yǔ)的動(dòng)詞"ham"(意為"粘貼")。該源語(yǔ) 言輸入語(yǔ)句501代表省略了動(dòng)詞"haru"(意為"粘貼")的日文語(yǔ)句。
檢測(cè)單元113令翻譯單元112將源語(yǔ)言輸入語(yǔ)句501翻譯成目標(biāo)語(yǔ)言 來(lái)獲得目標(biāo)語(yǔ)言語(yǔ)句502。此外,檢測(cè)單元113令翻譯單元112將目標(biāo)語(yǔ)言 語(yǔ)句502進(jìn)一步翻譯成源語(yǔ)言來(lái)獲得反向翻譯輸入語(yǔ)句503。
另一方面,作為類似于源語(yǔ)言輸入語(yǔ)句501的范例,作為搜索結(jié)果, 搜索單元111找到對(duì)應(yīng)于圖2中所示的平行翻譯范例組204的平行翻譯范 例組504。該平行翻譯范例組504包括相互不同語(yǔ)言的范例,每個(gè)范例都表 示"請(qǐng)不要忘記買一本筆記本"。應(yīng)當(dāng)指出,從在平行翻譯范例組504中包 括的日文范例源語(yǔ)句505中省略了以單詞"nooto"(意為"筆記本")為賓 語(yǔ)的動(dòng)詞"kau"(意為"買")o
因此,作為源語(yǔ)言輸入語(yǔ)句501和范例源語(yǔ)句505之間的差異,檢測(cè) 單元113檢測(cè)到意為"郵票"的日文單詞"kitte" 511和意為"筆記本"
14的日文單詞"nooto" 512。然后,檢測(cè)單元113通過(guò)在范例翻譯語(yǔ)句506 中以意為"郵票"的中文單詞或英文單詞代替至少一個(gè)意為"筆記本"的 加下劃線單詞,來(lái)產(chǎn)生經(jīng)編輯的范例翻譯語(yǔ)句507。
接下來(lái),檢測(cè)單元113令翻譯單元112進(jìn)一步翻譯經(jīng)編輯的范例翻譯 語(yǔ)句507來(lái)產(chǎn)生經(jīng)編輯的范例反向翻譯語(yǔ)句508。之后,檢測(cè)單元113檢測(cè) 源語(yǔ)言輸入語(yǔ)句501和經(jīng)編輯的范例反向翻譯語(yǔ)句508之間的差異513,并 將包括所檢測(cè)的差異513的差異信息存儲(chǔ)到差異信息列表中,同時(shí)對(duì)應(yīng)于 該差異信息保持平行翻譯范例組504。
圖6為示出了在已經(jīng)獲得了包括圖3所示的三個(gè)平行翻譯范例組的類 似平行翻譯范例列表的情況下包括三條對(duì)應(yīng)于平行翻譯范例組的差異信息 的差異信息列表范例的圖示。如圖6所示,對(duì)應(yīng)于分別檢測(cè)到差異602、 605 和608的平行翻譯范例組603、 606和609分別保持諸條差異信息601、 604 和607。每條差異信息601、 604和607都包含均被置于符號(hào)"("和")" 之間且初始包括在源語(yǔ)言輸入語(yǔ)句中的短語(yǔ)。利用這些設(shè)置,用戶能夠容 易地理解經(jīng)編輯的范例反向翻譯語(yǔ)句中具有差異的部分。
返回到圖1的描述,產(chǎn)生單元114通過(guò)向源語(yǔ)言輸入語(yǔ)句添加檢測(cè)到 的差異來(lái)產(chǎn)生輸出語(yǔ)句。輸出語(yǔ)句是為用戶輸出的語(yǔ)句,以便針對(duì)包括補(bǔ) 充信息的新的源語(yǔ)言語(yǔ)句提示候選者,該補(bǔ)充信息是機(jī)器翻譯設(shè)備獲得用 戶期望的翻譯所需要的。在下面的解釋中,將把這種輸出語(yǔ)句稱為"建議 語(yǔ)句"。
更具體而言,產(chǎn)生單元114通過(guò)將差異信息列表中包括的差異析取地 設(shè)置到均設(shè)置于符號(hào)"("和")"之間且初始包括在源語(yǔ)言輸入語(yǔ)句中的 部分間的位置中來(lái)產(chǎn)生建議語(yǔ)句。如圖7所示,產(chǎn)生單元114將設(shè)置于符 號(hào)"{"和"}"之間且被析取地設(shè)置并同時(shí)彼此被符號(hào)"/"分隔的差異702、 703和704嵌入源語(yǔ)言輸入語(yǔ)句中表現(xiàn)出差異的部分中來(lái)產(chǎn)生建議語(yǔ)句 701。建議語(yǔ)句701是在已經(jīng)針對(duì)圖4所示的源語(yǔ)言輸入語(yǔ)句401獲得圖6 所示的差異信息列表情況下由產(chǎn)生單元114產(chǎn)生的建議語(yǔ)句的范例。
返回到圖1的描述,選擇接收單元102接收用戶從己經(jīng)由產(chǎn)生單元114 產(chǎn)生并由輸出單元103輸出的建議語(yǔ)句(稍后解釋)選擇的差異之一。而且, 選擇接收單元102接收用戶執(zhí)行的用于結(jié)束翻譯過(guò)程的操作。選擇接收單
15元102要接收所選差異并接收結(jié)束翻譯過(guò)程的操作,可以使用任何通用輸 入裝置,例如可以使用鍵盤和定點(diǎn)裝置。
例如,用戶利用定點(diǎn)裝置指到顯示如圖7所示已經(jīng)輸出的建議語(yǔ)句701 之內(nèi)的差異702的部分來(lái)選擇他/她意欲選擇的差異之一。結(jié)果,選擇接收 單元102接收到所選的差異。選擇接收單元102將包括所選差異702的圖6 所示的該條差異信息601作為所選差異信息存儲(chǔ)到諸如隨機(jī)存取存儲(chǔ)器 (RAM)之類的存儲(chǔ)單元等(未示出)中。
在用戶希望用除建議語(yǔ)句中包含的差異之外的單詞或短語(yǔ)補(bǔ)充源語(yǔ)言 輸入語(yǔ)句的情況下,選擇接收單元102接收用戶自己輸入的單詞或短語(yǔ)作 為用戶差異信息并將所接收的用戶差異信息存儲(chǔ)到存儲(chǔ)單元中。如圖8所 示,在用戶差異信息801中,將每一個(gè)均被設(shè)置于符號(hào)"("和")"之間 且初始包括在源語(yǔ)言輸入語(yǔ)句中的短語(yǔ)添加到代表用戶已輸入的短語(yǔ)的差 異802。
用戶差異信息與充當(dāng)圖6所示的差異信息列表的要素的差異信息的不 同之處在于,檢測(cè)到差異的平行翻譯范例組不是對(duì)應(yīng)于用戶差異信息保持 的。然而,用于存儲(chǔ)差異信息自身的存儲(chǔ)方法對(duì)用戶差異信息和差異信息 而言是公共的。于是,對(duì)于用戶已經(jīng)選擇輸出差異之一以及用戶已經(jīng)自己 輸入差異的兩種情形而言,要執(zhí)行的過(guò)程是彼此相同的。
另一種設(shè)置是可接受的,即配置選擇接收單元102,以便接收用戶的發(fā) 聲作為語(yǔ)音輸入,對(duì)所接收的語(yǔ)音進(jìn)行語(yǔ)音識(shí)別處理并接收與語(yǔ)音識(shí)別處 理結(jié)果匹配的差異作為所選差異。另一種設(shè)置是可接受的,其中,在用戶 僅發(fā)出差異一部分的關(guān)鍵字的聲音時(shí),選擇接收單元102判定已經(jīng)選擇了 包括該關(guān)鍵字的差異。
假設(shè)施加單元115利用所選的差異信息或用戶差異信息產(chǎn)生新的源語(yǔ) 言輸入語(yǔ)句并令翻譯單元112翻譯新產(chǎn)生的源語(yǔ)言輸入語(yǔ)句來(lái)獲得新的目
標(biāo)語(yǔ)言語(yǔ)句o
例如,在用戶已經(jīng)針對(duì)圖7所示的建議語(yǔ)句701選擇了差異702的情 況下,將圖6所示的該條差異信息601作為所選差異信息加以存儲(chǔ)。在這 種情況下,假設(shè)施加單元115通過(guò)從該條差異信息601消除符號(hào)"("和")" 來(lái)產(chǎn)生新的源語(yǔ)言輸入語(yǔ)句。而且,基于該用戶差異信息,假設(shè)施加單元115以類似方式產(chǎn)生新的源語(yǔ)言輸入語(yǔ)句。
更新單元116更新位置設(shè)置,從而將對(duì)應(yīng)于所選差異信息保持的平行 翻譯范例組移動(dòng)到已經(jīng)由搜索單元111產(chǎn)生的類似平行翻譯范例列表的頂 部。
輸出單元103輸出源語(yǔ)言輸入語(yǔ)句、目標(biāo)語(yǔ)言語(yǔ)句、建議語(yǔ)句以及類 似平行翻譯范例列表的內(nèi)容。可以利用通常使用的任何方法實(shí)現(xiàn)輸出單元 103使用的輸出方法,例如由顯示裝置(未示出)實(shí)現(xiàn)的圖像輸出、由打印裝 置(未示出)輸出的打印輸出、由音頻合成裝置(未示出)實(shí)現(xiàn)的合成音頻輸 出。此外,可以接受這樣的設(shè)置,即將這些輸出方法中的兩種或更多種集 成到該機(jī)器翻譯設(shè)備中,從而根據(jù)需要改變要使用的輸出方法??梢越邮?的另一種設(shè)置是組合使用這些輸出方法中的兩種或更多種。
如圖9所示,顯示屏包括向其中輸出源語(yǔ)言輸入語(yǔ)句的源語(yǔ)言輸入語(yǔ) 句字段901;向其中輸出目標(biāo)語(yǔ)言語(yǔ)句的目標(biāo)語(yǔ)言語(yǔ)句字段902;向其中輸 出建議語(yǔ)句的建議語(yǔ)句字段903;以及向其中輸出類似平行翻譯范例列表之 內(nèi)的平行翻譯范例組的類似平行翻譯范例列表字段904。
接下來(lái),將參考圖IO解釋如上所述配置的根據(jù)本實(shí)施例的機(jī)器翻譯設(shè) 備100執(zhí)行的機(jī)器翻譯過(guò)程。首先,輸入接收單元101接收源語(yǔ)言輸入語(yǔ) 句S(步驟SIOOI)。接下來(lái),搜索單元111在范例存儲(chǔ)單元120中搜索例如 均匹配或類似于源語(yǔ)言輸入語(yǔ)句S的范例并按照它們的相似水平的降序?qū)?范例存儲(chǔ)到類似平行翻譯范例列表Le中(步驟S1002)。
之后,翻譯單元112通過(guò)翻譯源語(yǔ)言輸入語(yǔ)句S來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句 T(步驟S1003)。此外,檢測(cè)單元113產(chǎn)生經(jīng)編輯的范例反向翻譯語(yǔ)句和反 向翻譯輸入語(yǔ)句并執(zhí)行差異檢測(cè)過(guò)程,以通過(guò)將經(jīng)編輯的范例反向翻譯語(yǔ) 句與源語(yǔ)言輸入語(yǔ)句進(jìn)行比較以及與反向翻譯輸入語(yǔ)句進(jìn)行比較來(lái)檢測(cè)差 異(步驟S1004)。稍后將解釋差異檢測(cè)過(guò)程的細(xì)節(jié)。作為差異檢測(cè)過(guò)程的結(jié) 果,輸出包括所檢測(cè)到的差異的差異信息列表Ld。
之后,參考所檢測(cè)到的差異,產(chǎn)生單元114執(zhí)行建議語(yǔ)句產(chǎn)生過(guò)程以 產(chǎn)生要提供給用戶的建議語(yǔ)句(步驟S1005)。稍后將解釋建議語(yǔ)句產(chǎn)生過(guò)程 的細(xì)節(jié)。
接下來(lái),輸出單元103執(zhí)行結(jié)果輸出過(guò)程以向顯示裝置等輸出源語(yǔ)言輸入語(yǔ)句、目標(biāo)語(yǔ)言語(yǔ)句和所產(chǎn)生的建議語(yǔ)句(步驟S1006)。稍后將解釋結(jié)
果輸出過(guò)程的細(xì)節(jié)。
之后,選擇接收單元102接收用戶的操作(步驟S1007)。選擇接收單元 102然后判斷所接收的操作是否是結(jié)束過(guò)程的操作(步驟S1008)。在所接收 的操作是結(jié)束過(guò)程的操作的情況下(步驟S1008:是),結(jié)束機(jī)器翻譯過(guò)程。
相反,在所接收的操作不是結(jié)束過(guò)程的操作的情況下(步驟S1008:否), 選擇接收單元102判斷是否已輸入差異(步驟S1009)。用于輸入差異的方法 范例包括用戶利用定點(diǎn)裝置等從所顯示的建議語(yǔ)句中選擇差異的方法以及 用戶自己輸入建議語(yǔ)句中未包括的差異的另一種方法。
在未輸入差異的情況下(步驟S1009:否),該過(guò)程返回到用戶操作接收 過(guò)程,從而重復(fù)該過(guò)程(步驟S1007)。
相反,在已經(jīng)輸入了差異的情況下(步驟S1009:是),假設(shè)施加單元 115判斷輸入的差異是否包括在己經(jīng)作為差異檢測(cè)過(guò)程的結(jié)果輸出的差異 信息列表中(步驟S1010)。在輸入的差異包括在差異信息列表中的情況下 (步驟S1010:是),假設(shè)施加單元115向存儲(chǔ)單元中存儲(chǔ)包括輸入差異的差 異信息作為所選差異信息H,并且還將用戶差異信息U設(shè)置為空白(步驟 SlOll)。
相反,在輸入差異未包括在差異信息列表中的情況下(步驟S1010:否),
假設(shè)施加單元115產(chǎn)生包括輸入差異的用戶差異信息li并將所產(chǎn)生的用戶 差異信息U存儲(chǔ)到存儲(chǔ)單元中。此外,假設(shè)施加單元115將所選的差異信 息H設(shè)置成空白(步驟S1012)。
之后,通過(guò)參考己經(jīng)存儲(chǔ)的所選差異信息H或用戶差異信息U,假設(shè)施 加單元115執(zhí)行假設(shè)施加過(guò)程以產(chǎn)生新的源語(yǔ)言輸入語(yǔ)句并通過(guò)翻譯新產(chǎn) 生的源語(yǔ)言輸入語(yǔ)句來(lái)獲得目標(biāo)語(yǔ)言語(yǔ)句(步驟S1013)。稍后將解釋假設(shè)施 加過(guò)程的細(xì)節(jié)。
接下來(lái),更新單元116執(zhí)行更新過(guò)程以在顯示屏上更新顯示(步驟 S1014)。稍后將解釋更新過(guò)程的細(xì)節(jié)。
作為上述過(guò)程的結(jié)果,可以將重新將翻譯結(jié)果翻譯成源語(yǔ)言獲得的反 向翻譯語(yǔ)句和源語(yǔ)言輸入語(yǔ)句之間的差異作為檢測(cè)翻譯結(jié)果是否恰當(dāng)反映 出源語(yǔ)言語(yǔ)句暗含目的所用的信息來(lái)輸出。因此,機(jī)器翻譯設(shè)備能夠利用
18用戶從輸出差異中選擇的差異翻譯新產(chǎn)生的源語(yǔ)言輸入語(yǔ)句。于是,機(jī)器 翻譯設(shè)備能夠容易地獲得恰當(dāng)反映該意圖的翻譯結(jié)果。
接下來(lái)將參考圖11解釋在步驟S1004執(zhí)行的差異檢測(cè)過(guò)程的細(xì)節(jié)。 首先,檢測(cè)單元113令翻譯單元112將目標(biāo)語(yǔ)言語(yǔ)句T翻譯成源語(yǔ)言 來(lái)產(chǎn)生反向翻譯輸入語(yǔ)句Tb(步驟SllOl)。之后,檢測(cè)單元113從類似平 行翻譯范例列表Le中獲得尚未被處理的平行翻譯范例組E(步驟S1102)。
接下來(lái),檢測(cè)單元113檢測(cè)所獲得的平行翻譯范例組E中的范例源語(yǔ) 句和源語(yǔ)言輸入語(yǔ)句S之間的差異部分(步驟S1103)。此外,檢測(cè)單元113
利用對(duì)應(yīng)于范例源語(yǔ)句中的差異部分的翻譯單詞/短語(yǔ)替代對(duì)應(yīng)于平行翻 譯范例組E之內(nèi)范例翻譯語(yǔ)句中的差異部分的單詞或短語(yǔ)產(chǎn)生經(jīng)編輯的范 例翻譯語(yǔ)句Em(步驟S1014)。在這種情況下,檢測(cè)單元113通過(guò)參考其中 存儲(chǔ)了源語(yǔ)言單詞和目標(biāo)語(yǔ)言單詞且同時(shí)彼此對(duì)應(yīng)地保持單詞的詞典(未 示出)等來(lái)獲得對(duì)應(yīng)于范例源語(yǔ)句中的差異部分的翻譯單詞/短語(yǔ)。
之后,檢測(cè)單元113令翻譯單元112將經(jīng)編輯的范例翻譯語(yǔ)句Em翻譯 成源語(yǔ)言來(lái)產(chǎn)生經(jīng)編輯的范例反向翻譯語(yǔ)句Et(步驟S1105)。接下來(lái),檢 測(cè)單元113檢測(cè)經(jīng)編輯的范例反向翻譯語(yǔ)句St和源語(yǔ)言輸入語(yǔ)句S之間的 差異,產(chǎn)生包括檢測(cè)到的差異的差異信息并將所產(chǎn)生的差異信息存儲(chǔ)到差 異信息列表Ld中(步驟S1106)。更具體而言,檢測(cè)單元113產(chǎn)生差異信息, 在差異信息中將設(shè)置于符號(hào)"("和")"之間且初始包括在源語(yǔ)言輸入語(yǔ) 句中的單詞或短語(yǔ)添加到所檢測(cè)到的差異中。此外,檢測(cè)單元113將所產(chǎn) 生的差異信息存儲(chǔ)到差異信息列表Ld中,同時(shí)對(duì)應(yīng)于所產(chǎn)生的差異信息保 持檢測(cè)出差異的平行翻譯范例組。
類似地,檢測(cè)單元113檢測(cè)經(jīng)編輯的范例反向翻譯語(yǔ)句Et和在步驟 S1101中產(chǎn)生的反向翻譯輸入語(yǔ)句Tb之間的差異,產(chǎn)生包括檢測(cè)到的差異 的差異信息并將所產(chǎn)生的差異信息存儲(chǔ)到差異信息列表Ld中(步驟S1107)。
之后,檢測(cè)單元113判斷是否已經(jīng)處理了類似平行翻譯范例列表Le中 的所有平行翻譯范例組(步驟S1108)。在尚未處理所有平行翻譯范例組的情 況下(步驟S1108:否),檢測(cè)單元113選擇下一個(gè)平行翻譯范例組并重復(fù)該 過(guò)程(步驟S1102)。相反,在已經(jīng)處理過(guò)所有平行翻譯范例組的情況下(步 驟S1108:是),差異檢測(cè)過(guò)程結(jié)束。
19接下來(lái),將參考圖12解釋在步驟S1005中執(zhí)行的建議語(yǔ)句產(chǎn)生過(guò)程的 細(xì)節(jié)。
首先,產(chǎn)生單元114將源語(yǔ)言輸入語(yǔ)句S指定為要在顯示裝置等上顯 示的建議語(yǔ)句P(步驟S1201)。之后,產(chǎn)生單元114從差異信息列表Ld中 獲得一條尚未處理過(guò)的差異信息(步驟S1202)。接下來(lái),產(chǎn)生單元114將所 獲得的這條差異信息與建議語(yǔ)句P組合(步驟S1203)。更具體而言,產(chǎn)生單 元114通過(guò)將該條差異信息中包括的差異插入建議語(yǔ)句P的對(duì)應(yīng)位置中同 時(shí)將差異設(shè)置于符號(hào)"("和")"之間來(lái)組合該條差異信息和建議語(yǔ)句P。 在這種情況下,在產(chǎn)生單元114將多個(gè)差異插入相同位置時(shí),產(chǎn)生單元114 利用符號(hào)"/"將插入的差異彼此分開。
接下來(lái),產(chǎn)生單元114判斷是否已處理了差異信息列表Ld中的所有各 條差異信息(步驟S1204)。在尚未處理所有各條差異信息的情況下(步驟 S1204:否),產(chǎn)生單元114選擇下一條差異信息并重復(fù)該過(guò)程(步驟S1202)。 相反,在己經(jīng)處理過(guò)所有各條差異信息的情況下(步驟S1204:是),建議語(yǔ) 句產(chǎn)生過(guò)程結(jié)束。
接下來(lái)將參考圖13解釋在步驟S1006執(zhí)行的結(jié)果輸出過(guò)程的細(xì)節(jié)。
首先,輸出單元103在顯示屏上的預(yù)定位置輸出源語(yǔ)言輸入語(yǔ)句S、目 標(biāo)語(yǔ)言語(yǔ)句T和建議語(yǔ)句P(步驟S1301)。之后,輸出單元103從類似平行 翻譯范例列表Le中獲得尚未被處理的平行翻譯范例組(步驟S1302)。接下 來(lái),輸出單元103將所獲得的平行翻譯范例組輸出到顯示屏上的預(yù)定位置 (步驟S1303)。
之后,輸出單元103判斷是否已經(jīng)處理了類似平行翻譯范例列表Le中 的所有平行翻譯范例組(步驟S1304)。在未處理過(guò)所有平行翻譯范例組的情 況下(步驟S1304:否),輸出單元103選擇下一個(gè)平行翻譯范例組并重復(fù)該 過(guò)程(步驟S1302)。相反,在己經(jīng)處理過(guò)所有平行翻譯范例組的情況下(步 驟S1304:是),結(jié)果輸出過(guò)程結(jié)束。
接下來(lái)將參考圖14解釋在步驟S1013執(zhí)行的假設(shè)施加過(guò)程的細(xì)節(jié)。 首先,假設(shè)施加單元115判斷所選的差異信息H是否為空白(步驟 S1401)。在所選差異信息H為空白的情況下(步驟S1401:是),假設(shè)施加單 元115基于用戶差異信息U產(chǎn)生新的源語(yǔ)言輸入語(yǔ)句S(步驟S1402)。更具體而言,假設(shè)施加單元115通過(guò)從用戶差異信息U去除符號(hào)"("和")"
來(lái)產(chǎn)生新的源語(yǔ)言輸入語(yǔ)句s。
相反,在所選差異信息H不是空白的情況下(步驟S1401:否),假設(shè)施 加單元115基于所選差異信息H產(chǎn)生新的源語(yǔ)言輸入語(yǔ)句S (步驟S1403)。
之后,假設(shè)施加單元115令翻譯單元112翻譯新產(chǎn)生的源語(yǔ)言輸入語(yǔ) 句S來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句T(步驟S1404),假設(shè)施加過(guò)程結(jié)束。
接下來(lái),將參考圖15解釋在步驟S1014執(zhí)行的更新過(guò)程的細(xì)節(jié)。
首先,更新單元116判斷所選的差異信息H是否為空白(步驟S1501)。 在所選差異信息H為空白的情況下(步驟S1501:是),更新單元116結(jié)束該 更新過(guò)程。
相反,在所選差異信息H不是空白的情況下(步驟S1501:否),更新單 元116基于已產(chǎn)生了哪些所選差異信息H獲得平行翻譯范例組Eh(步驟 S1502)。更具體而言,更新單元116從差異信息列表中獲得對(duì)應(yīng)于與所選 差異信息H匹配的該條差異信息保持的平行翻譯范例組Eh。
之后,更新單元116更新位置設(shè)置,使所獲得的平行翻譯范例組Eh位 于類似平行翻譯范例列表Le的頂部(步驟S1503),更新過(guò)程結(jié)束。
接下來(lái)將解釋根據(jù)本實(shí)施例的機(jī)器翻譯過(guò)程的特定范例。在以下解釋 中,假設(shè)范例存儲(chǔ)單元120中存儲(chǔ)了如圖2所示的平行翻譯范例組。還假 設(shè)源語(yǔ)言為日文,指定的目標(biāo)語(yǔ)言為中文或英文。
首先,假設(shè)輸入接收單元101已接收到以日文輸入的表示含義"我喜 歡喝酒"的如圖4所示的源語(yǔ)言輸入語(yǔ)句401(步驟S1001)。應(yīng)當(dāng)指出,如 上所述,源語(yǔ)言輸入語(yǔ)句401省略了意為"喝"的動(dòng)詞"nomu"。
搜索單元111在范例存儲(chǔ)單元120中搜索均類似于源語(yǔ)言輸入語(yǔ)句401 的范例。結(jié)果,搜索單元111獲得例如圖3所示的類似平行翻譯范例列表 Le(步驟S1002)。而且,翻譯單元112通過(guò)翻譯源語(yǔ)言輸入語(yǔ)句401例如產(chǎn) 生如圖16所示的中文語(yǔ)句1601或英文語(yǔ)句1602 (步驟S1003)。
中文語(yǔ)句1601和英文語(yǔ)句1602均具有"我喜歡被稱為酒的東西"這 一含義。換言之,這些翻譯語(yǔ)句是不自然的翻譯語(yǔ)句,每句的含義均與用 戶的意圖不同,因?yàn)槲唇?jīng)任何調(diào)整直接翻譯了省略動(dòng)詞的源語(yǔ)言輸入語(yǔ)句 401。為了在這種情況下實(shí)現(xiàn)恰當(dāng)反映用戶所說(shuō)意圖的翻譯過(guò)程,繼續(xù)如下
所述進(jìn)行該過(guò)程首先,檢測(cè)單元113執(zhí)行差異檢測(cè)過(guò)程(步驟S1004)。
例如,檢測(cè)單元113令翻譯單元112將作為中文語(yǔ)句1601和英文語(yǔ)句 1602之一的目標(biāo)語(yǔ)言語(yǔ)句T翻譯成源語(yǔ)言,從而獲得與源語(yǔ)言輸入語(yǔ)句401 相同的反向翻譯輸入語(yǔ)句Tb(步驟S1101)。
類似平行翻譯范例列表Le中存儲(chǔ)如圖3所示的三個(gè)平行翻譯范例組。 于是,在平行翻譯范例組E充當(dāng)處理目標(biāo)時(shí),檢測(cè)單元113提取列在類似 平行翻譯范例列表Le頂部的平行翻譯范例組301 (步驟S1102)。
平行翻譯范例組301中包括的范例源語(yǔ)句304和源語(yǔ)言輸入語(yǔ)句401 之間的差異為意為"牛奶"的日文單詞和意為"酒"的日文單詞。于是, 檢測(cè)單元113利用意為"酒"的單詞替換平行翻譯范例組301中包括的范 例翻譯語(yǔ)句305或范例翻譯語(yǔ)句306中使用的意為"牛奶"的單詞,從而 產(chǎn)生經(jīng)編輯的范例翻譯語(yǔ)句Em(步驟S1104)。
圖17為示出了在上述過(guò)程中產(chǎn)生的經(jīng)編輯的范例翻譯語(yǔ)句的范例的圖 示。在目標(biāo)語(yǔ)言為中文的情況下,產(chǎn)生圖17所示的中文語(yǔ)句1701作為經(jīng) 編輯的范例翻譯語(yǔ)句Em。另一方面,在目標(biāo)語(yǔ)言為英文的情況下,產(chǎn)生圖 17中所示的英文語(yǔ)句1702作為經(jīng)編輯的范例翻譯語(yǔ)句Em。
然后,檢測(cè)單元113令翻譯單元112將所產(chǎn)生的經(jīng)編輯的范例翻譯語(yǔ) 句Em翻譯成日文來(lái)產(chǎn)生經(jīng)編輯的范例反向翻譯語(yǔ)句Et(步驟S1105)。結(jié)果, 獲得了日文的經(jīng)編輯的范例反向翻譯語(yǔ)句Et,其包括源語(yǔ)言輸入語(yǔ)句401 中省略的意為"喝"的動(dòng)詞"nomu"。
之后,檢測(cè)單元113檢測(cè)源語(yǔ)言輸入語(yǔ)句401和經(jīng)編輯的范例反向翻 譯語(yǔ)句St之間的差異并將所檢測(cè)到的差異存儲(chǔ)到差異信息列表Ld中(步驟 S1106)。在本實(shí)例中,檢測(cè)單元113存儲(chǔ)如圖6所示的差異信息601,同時(shí) 對(duì)應(yīng)于差異信息601保持檢測(cè)出差異的平行翻譯范例組301。
作為上述過(guò)程的結(jié)果,已經(jīng)針對(duì)類似平行翻譯范例列表Le中包括的平 行翻譯范例組中的第一個(gè)平行翻譯范例組完成了差異檢測(cè)過(guò)程。之后,針 對(duì)類似平行翻譯范例列表Le中包括的所有平行翻譯范例組的每一個(gè)反復(fù)執(zhí) 行上述過(guò)程。結(jié)果,產(chǎn)生了如圖6所示的差異信息列表Ld。
接下來(lái),產(chǎn)生單元114執(zhí)行建議語(yǔ)句產(chǎn)生過(guò)程(步驟S1005)。首先,產(chǎn)生單元114將源語(yǔ)言輸入語(yǔ)句401指定為建議語(yǔ)句P的初始 值(步驟S1201)。之后,產(chǎn)生單元114執(zhí)行下述過(guò)程,依次將差異信息列表 Ld中存儲(chǔ)的每條差異信息嵌入建議語(yǔ)句P中。
在本實(shí)例中,差異信息列表Ld中存儲(chǔ)了三條差異信息,即如圖6所示 的差異信息601、 604和607。產(chǎn)生單元114從差異信息列表Ld提取第一條 差異信息(即差異信息601)(步驟S1202)。之后,產(chǎn)生單元114將差異信息 601中的差異602嵌入建議語(yǔ)句P中(步驟S1203)。在該階段,產(chǎn)生單元114 產(chǎn)生僅包括圖7所示建議語(yǔ)句701中的差異702的建議語(yǔ)句,差異702設(shè) 置于符號(hào)"{"和"}"之間。
作為上述過(guò)程的結(jié)果,在差異信息列表Ld中包括的各條差異信息中, 已經(jīng)完成了針對(duì)第一條差異信息的建議語(yǔ)句產(chǎn)生過(guò)程。之后,針對(duì)差異信 息列表Ld中包括的所有各條差異信息的每一條反復(fù)執(zhí)行上述過(guò)程。結(jié)果, 產(chǎn)生了如圖7所示的建議語(yǔ)句701。
接下來(lái),輸出單元103執(zhí)行結(jié)果輸出過(guò)程(步驟S1006)。作為結(jié)果輸出 過(guò)程的結(jié)果,輸出在迄今為止執(zhí)行的過(guò)程中已經(jīng)產(chǎn)生的源語(yǔ)言輸入語(yǔ)句S、 目標(biāo)語(yǔ)言語(yǔ)句T和建議語(yǔ)句P(步驟S1301)。而且,根據(jù)在類似平行翻譯范 例列表Le中設(shè)置平行翻譯范例組的次序依次輸出列表中存儲(chǔ)的平行翻譯范 例組(步驟S1302到S1303)。在本實(shí)例中,輸出單元103向如圖9所示的顯 示屏上輸出源語(yǔ)言輸入語(yǔ)句S、目標(biāo)語(yǔ)言語(yǔ)句T、建議語(yǔ)句P和平行翻譯范 例組。如圖9所示,根據(jù)平行翻譯范例組在列表中的設(shè)置次序?qū)⑵叫蟹g 范例組輸出到類似平行翻譯范例列表字段904中。 '
之后,假設(shè)用戶已從存在的建議語(yǔ)句701選擇了差異702,且選擇接收 單元102已經(jīng)接收到用戶的選擇(步驟S1007)。所接收到的操作不是結(jié)束過(guò) 程的操作(步驟S1008:否),且已經(jīng)輸入了差異(步驟S1009:是)。于是, 假設(shè)施加單元115判斷輸入的差異是否包括在差異信息列表Ld中(步驟 SIOIO)。
在本實(shí)例中,所選的差異702與圖6所示的差異信息列表Ld中包括的 各條差異信息中的差異信息601中包括的差異602匹配。于是,假設(shè)施加 單元115將差異信息601作為所選差異信息H存儲(chǔ)到存儲(chǔ)單元中并將用戶 差異信息U設(shè)置成空白(步驟S1011)。之后,執(zhí)行假設(shè)施加過(guò)程,從而基于已經(jīng)存儲(chǔ)的所選差異信息執(zhí)行恰
當(dāng)反映用戶意圖的翻譯過(guò)程(步驟S1013)。
所選差異信息H中存儲(chǔ)圖6中所示的差異信息601 (步驟S1401:否)。 于是,假設(shè)施加單元115基于差異信息601產(chǎn)生了新的源語(yǔ)言輸入語(yǔ)句S(步 驟S1403)。更具體而言,假設(shè)施加單元115通過(guò)從差異信息601刪除符號(hào) "("和")"來(lái)產(chǎn)生新的源語(yǔ)言輸入語(yǔ)句S。
接下來(lái),假設(shè)施加單元115令翻譯單元112將新產(chǎn)生的源語(yǔ)言輸入語(yǔ) 句S翻譯成目標(biāo)語(yǔ)言來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句T(步驟S1404)。在本實(shí)例中,例 如,假設(shè)施加單元115產(chǎn)生圖17中所示的中文語(yǔ)句1701和英文語(yǔ)句1702 之一作為目標(biāo)語(yǔ)言語(yǔ)句T。
這些目標(biāo)語(yǔ)言語(yǔ)句的每一句都是包括對(duì)目標(biāo)對(duì)象"酒"采取的動(dòng)作的 表達(dá)方式,這與一開始在步驟S1003中獲得的中文語(yǔ)句1601或英文語(yǔ)句 1602不同。換言之,每一目標(biāo)語(yǔ)言語(yǔ)句都是等價(jià)于用戶希望表達(dá)的源語(yǔ)言 輸入語(yǔ)句內(nèi)容的翻譯語(yǔ)句。
之后,更新單元116執(zhí)行更新過(guò)程(步驟S1014)。
所選差異信息H中存儲(chǔ)圖6中所示的差異信息601 (步驟S1501:否)。 于是,首先,更新單元116獲得對(duì)應(yīng)于所選差異信息H保持的平行翻譯范 例組Eh(步驟S1502)。然后,更新單元116設(shè)置位置設(shè)置,使所獲得的平 行翻譯范例組Eh位于類似平行翻譯范例列表Le的頂部(步驟S1503)。在本 實(shí)例中,因?yàn)槲挥诹斜眄敳康膱D3中的平行翻譯范例組301是對(duì)應(yīng)于所選 差異信息H保持的(參考圖6中所示的平行翻譯范例組603),因此列表中設(shè) 置平行翻譯范例組的次序未變化。
作為上述過(guò)程的結(jié)果,完成了更新過(guò)程且再次調(diào)用結(jié)果輸出過(guò)程(步驟 S1006)。結(jié)果,顯示出如圖18所示的顯示屏。如圖18所示,向源語(yǔ)言輸 入語(yǔ)句字段2001中輸出新的源語(yǔ)言輸入語(yǔ)句,利用該新的源語(yǔ)言輸入語(yǔ)句 能夠獲得忠實(shí)反映出用戶表達(dá)意圖的翻譯語(yǔ)句。而且,向目標(biāo)語(yǔ)言語(yǔ)句字 段2002中輸出通過(guò)翻譯新的源語(yǔ)言輸入語(yǔ)句獲得的翻譯語(yǔ)句。在類似平行 翻譯范例列表中設(shè)置平行翻譯范例組的次序己經(jīng)改變的情況下,按照改變 后的次序向類似平行翻譯范例列表字段2003中輸出平行翻譯范例組。
作為上述過(guò)程的結(jié)果,完成了結(jié)果輸出過(guò)程。在用戶輸入結(jié)束過(guò)程的
24操作時(shí)(步驟S1008:是),機(jī)器翻譯過(guò)程結(jié)束。
如上所述,根據(jù)本實(shí)施例,即使用戶對(duì)目標(biāo)語(yǔ)言了解不夠多,用戶也
能夠在源語(yǔ)言中找到機(jī)器翻譯設(shè)備100要輸出充分反映用戶表達(dá)意圖的翻
譯語(yǔ)句所需的信息。而且,基于該信息,用戶能夠容易地產(chǎn)生可以產(chǎn)生恰 當(dāng)反映表達(dá)意圖的翻譯語(yǔ)句的源語(yǔ)言輸入語(yǔ)句。結(jié)果,能夠?qū)崿F(xiàn)在翻譯過(guò)
程中實(shí)現(xiàn)高水平精確度的機(jī)器翻譯設(shè)備100。
接下來(lái)將解釋根據(jù)本實(shí)施例的機(jī)器翻譯過(guò)程的另一特定范例。在下面 的部分中,將解釋如下的過(guò)程范例,該過(guò)程是在輸出的建議語(yǔ)句不含恰當(dāng) 反映用戶意圖的信息、因此用戶自己輸入要用于補(bǔ)足建議語(yǔ)句的單詞或短 語(yǔ)的情況下執(zhí)行的。
在下面的解釋中,使用了如下范例,其中輸入接收單元101接收到以 日文輸入的圖5所示的表達(dá)含義"請(qǐng)不要忘記粘貼郵票"的源語(yǔ)言輸入語(yǔ) 句501 (步驟S1001)。如上所述,源語(yǔ)言輸入語(yǔ)句501中省略了意為"粘貼" 的動(dòng)詞"haru"。
搜索單元111在范例存儲(chǔ)單元120中搜索均類似于源語(yǔ)言輸入語(yǔ)句501 的范例,并且獲得例如圖19中所示的類似平行翻譯范例列表Le(步驟 S1002)。而且,翻譯單元112通過(guò)翻譯源語(yǔ)言輸入語(yǔ)句501例如產(chǎn)生如圖 20所示的中文語(yǔ)句2201和英文語(yǔ)句2202之一(步驟S1003)。
圖20中所示的中文語(yǔ)句2201和英文語(yǔ)句2202均具有含義"請(qǐng)不要忘 記買(一張)郵票"。換言之,這些翻譯語(yǔ)句的每一句都補(bǔ)充了動(dòng)作"買", 這與用戶的意圖不同。
為了在這種情況下實(shí)現(xiàn)恰當(dāng)反映用戶所說(shuō)意圖的翻譯過(guò)程,繼續(xù)如下 所述進(jìn)行該過(guò)程。從差異檢測(cè)過(guò)程到結(jié)果輸出過(guò)程(步驟S1004到S1006) 的過(guò)程與上述那些相同。于是將省略其詳細(xì)解釋。
圖21為示出了本范例中的差異檢測(cè)過(guò)程產(chǎn)生的差異信息列表Ld的范 例的圖示。圖22為示出了本范例中的結(jié)果輸出過(guò)程輸出的顯示屏范例的圖 示。如圖21和22所示,在本實(shí)例中,在搜索中未找到含有用戶希望表達(dá) 的意為"粘貼"的動(dòng)詞的平行翻譯范例組。于是,沒(méi)有顯示出含有意為"粘 貼"的動(dòng)詞的建議語(yǔ)句。然而,基于所顯示的建議語(yǔ)句,用戶能夠推測(cè)可 以通過(guò)用動(dòng)詞補(bǔ)充輸入語(yǔ)句來(lái)獲得適當(dāng)?shù)姆g語(yǔ)句。
25假設(shè)在完成結(jié)果輸出過(guò)程之后,盡管在任何給出的建議語(yǔ)句中都不包 括差異,但用戶輸入日文單詞來(lái)用意為"粘貼"的動(dòng)詞補(bǔ)充該語(yǔ)句(步驟
S1007)。
該操作不是結(jié)束過(guò)程的操作(步驟S1008:否),且已經(jīng)輸入了差異(步 驟S1009:是)。于是,假設(shè)施加單元115判斷輸入的差異是否包括在差異 信息列表Ld中(步驟S1010)。
在本實(shí)例中,輸入的差異不包括在差異信息列表Ld中(步驟S1010:否)。 于是,假設(shè)施加單元115產(chǎn)生包括輸入差異的用戶差異信息U,將所產(chǎn)生的 用戶差異信息U存儲(chǔ)到存儲(chǔ)單元中并將所選差異信息H設(shè)置成空白(步驟 S1012)。圖8中所示的用戶差異信息801代表在本實(shí)例中產(chǎn)生的用戶差異
"(曰息o
之后,執(zhí)行假設(shè)施加過(guò)程,從而能夠基于存儲(chǔ)的用戶差異信息801執(zhí) 行恰當(dāng)反映用戶意圖的翻譯過(guò)程(步驟S1013)。
在本實(shí)例中,因?yàn)樗x差異信息H是空白的(步驟S1401:是),假設(shè)施 加單元115基于用戶差異信息801產(chǎn)生新的源語(yǔ)言輸入語(yǔ)句S(步驟S1403)。 更具體而言,假設(shè)施加單元115通過(guò)從用戶差異信息801刪除符號(hào)"("和 ")"來(lái)產(chǎn)生新的源語(yǔ)言輸入語(yǔ)句S。
接下來(lái),假設(shè)施加單元115令翻譯單元112將新產(chǎn)生的源語(yǔ)言輸入語(yǔ) 句S翻譯成目標(biāo)語(yǔ)言來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句T(步驟S1404)。在本實(shí)例中,產(chǎn) 生圖20所示的中文語(yǔ)句2203和英文語(yǔ)句2204之一作為目標(biāo)語(yǔ)言語(yǔ)句T。 圖20中所示的中文語(yǔ)句2203和英文語(yǔ)句2204均為補(bǔ)充了用戶所意圖表達(dá) 的動(dòng)作"粘貼"的翻譯語(yǔ)句。
之后,更新單元116執(zhí)行更新過(guò)程(步驟S1014)。
在本實(shí)例中,所選差異信息H是空白的(步驟S1501:是)。于是,更新 單元116執(zhí)行更新過(guò)程而不更新類似平行翻譯范例列表Le中的位置設(shè)置。
作為上述過(guò)程的結(jié)果,完成了更新過(guò)程并再次調(diào)用結(jié)果輸出過(guò)程(步驟 S1006)。結(jié)果,顯示出如圖23所示的顯示屏。如圖23所示,向源語(yǔ)言輸 入語(yǔ)句字段2501中輸出新的源語(yǔ)言輸入語(yǔ)句,利用該新的源語(yǔ)言輸入語(yǔ)句 能夠獲得忠實(shí)反映出用戶表達(dá)意圖的翻譯語(yǔ)句。而且,向目標(biāo)語(yǔ)言語(yǔ)句字 段2502中輸出通過(guò)翻譯新的源語(yǔ)言輸入語(yǔ)句獲得的翻譯語(yǔ)句。如上所述,即使用戶對(duì)目標(biāo)語(yǔ)言了解不夠多,通過(guò)參考附于建議語(yǔ)句 的缺失單詞或短語(yǔ)的類似表達(dá)和信息范例,用戶也能夠推測(cè)出機(jī)器翻譯設(shè) 備要輸出充分反映用戶表達(dá)意圖的翻譯語(yǔ)句所需的信息。于是,用戶能夠 容易地執(zhí)行操作來(lái)糾正源語(yǔ)言輸入語(yǔ)句。
在上述實(shí)施例中,更新單元116將產(chǎn)生了所選差異的平行翻譯范例組 移動(dòng)到類似平行翻譯范例列表的頂部,從而以較高優(yōu)先級(jí)在顯示屏上顯示 平行翻譯范例組。除了這種設(shè)置之外,另一種可接受的設(shè)置是在之后執(zhí) 行的范例搜索過(guò)程中為產(chǎn)生了所選差異的平行翻譯范例組賦予較高優(yōu)先 級(jí)。
在這種情況下,配置范例存儲(chǔ)單元120以在其中對(duì)應(yīng)于平行翻譯范例 組存儲(chǔ)表示平行翻譯范例組的優(yōu)先化程度的優(yōu)先級(jí)水平。在已經(jīng)在搜索中 找到彼此具有相同相似水平的平行翻譯范例組的情況下,搜索單元111通 過(guò)為具有較高優(yōu)先級(jí)水平的平行翻譯范例組賦予較高優(yōu)先級(jí)來(lái)執(zhí)行搜索。 此外,更新單元116將分配給產(chǎn)生了所選差異的平行翻譯范例組的優(yōu)先級(jí) 水平提高預(yù)定值。
利用這些設(shè)置,能夠找到更加適當(dāng)?shù)钠叫蟹g范例組來(lái)從搜索中找到 的平行翻譯范例組中檢測(cè)出適當(dāng)?shù)牟町惒橛脩籼峁┧鶛z測(cè)的差異。
在上述實(shí)施例中,解釋了執(zhí)行如下兩種過(guò)程的范例通過(guò)將源語(yǔ)言輸 入語(yǔ)句與經(jīng)編輯的范例反向翻譯語(yǔ)句進(jìn)行比較來(lái)檢測(cè)差異的過(guò)程(例如步 驟S1106);以及通過(guò)將反向翻譯輸入語(yǔ)句與經(jīng)編輯的范例反向翻譯語(yǔ)句進(jìn)
行比較來(lái)檢測(cè)差異的過(guò)程(例如步驟S1107)。然而,用于檢測(cè)差異的方法不
限于該范例??梢越邮艿牧硪环N設(shè)置是執(zhí)行以上兩種過(guò)程之一來(lái)檢測(cè)差異。 在上述實(shí)施例中,在包括在建議語(yǔ)句中時(shí)輸出檢測(cè)到的差異,此外, 通過(guò)基于用戶從建議語(yǔ)句選擇的差異對(duì)新產(chǎn)生的源語(yǔ)言輸入語(yǔ)句再次翻譯 獲得恰當(dāng)反映用戶意圖的翻譯語(yǔ)句。然而,用于輸出差異的方法不限于該 范例中的方法。采用任何其他方法都是可接受的,只要該方法暗示能夠產(chǎn) 生至少通過(guò)補(bǔ)充差異來(lái)恰當(dāng)反映用戶意圖的翻譯語(yǔ)句即可。例如,僅以列 表形式輸出差異是可接受的設(shè)置。此外,用于執(zhí)行再次翻譯過(guò)程的方法不 限于上述范例中的方法。例如,另一種設(shè)置是可接受的,其中,機(jī)器翻譯 設(shè)備接收用戶通過(guò)參考輸出差異重新輸入的新源語(yǔ)言輸入語(yǔ)句并翻譯所接收的語(yǔ)句。
在上述具體范例中,如果假設(shè)在完成步驟S1006中的結(jié)果輸出過(guò)程之 后,用戶已經(jīng)輸入日文單詞來(lái)為該語(yǔ)句補(bǔ)充意為"買"的動(dòng)詞,該過(guò)程與 不做任何調(diào)整地接受反向翻譯輸入語(yǔ)句的無(wú)變化語(yǔ)句,即在步驟S1001接 收的源語(yǔ)言輸入語(yǔ)句的翻譯結(jié)果具有相同含義。如本文所述,通過(guò)進(jìn)行差 異比較過(guò)程來(lái)比較反向翻譯輸入語(yǔ)句和范例源語(yǔ)句,能夠確認(rèn)機(jī)器翻譯設(shè) 備輸出的翻譯結(jié)果是與用戶意圖忠實(shí)匹配的結(jié)果。
如上所述,在使用根據(jù)本實(shí)施例的機(jī)器翻譯設(shè)備時(shí),能夠搜索包括類 似于源語(yǔ)言輸入語(yǔ)句的范例的平行翻譯范例組,通過(guò)將平行翻譯范例組中 包括的目標(biāo)語(yǔ)言范例翻譯成源語(yǔ)言所獲得的反向翻譯語(yǔ)句與輸入語(yǔ)句或與 進(jìn)一步將輸入語(yǔ)句翻譯成目標(biāo)語(yǔ)言的結(jié)果翻譯成源語(yǔ)言所獲得的另一個(gè)反 向翻譯語(yǔ)句進(jìn)行比較來(lái)檢測(cè)差異,并為用戶輸出所檢測(cè)到的差異。
換言之,利用積累了翻譯范例的基于范例的信息,能夠推測(cè)出說(shuō)話者 的意圖即為翻譯過(guò)程中所需的信息,只要僅忠實(shí)地翻譯出源語(yǔ)言語(yǔ)句的表 面信息,說(shuō)話者的意圖就很少反映在目標(biāo)語(yǔ)言語(yǔ)句中。還可以為用戶提供 這種信息,以提示用戶輸入補(bǔ)充信息。結(jié)果,能夠避免目標(biāo)語(yǔ)言說(shuō)話者接 收到不同于用戶(即源語(yǔ)言說(shuō)話者)意圖的一些內(nèi)容的情形。
接下來(lái)將參考圖24解釋根據(jù)本實(shí)施例的機(jī)器翻譯設(shè)備的硬件配置。
根據(jù)本實(shí)施例的機(jī)器翻譯設(shè)備包括諸如中央處理單元(CPU)51之類的 控制裝置、諸如只讀存儲(chǔ)器(ROM) 52和隨機(jī)存取存儲(chǔ)器(RAM)之類53的存儲(chǔ) 裝置、建立通往網(wǎng)絡(luò)的連接并進(jìn)行通信的通信接口(I/F)54、諸如硬盤驅(qū)動(dòng) 器(HDD)和光盤(CD)驅(qū)動(dòng)裝置之類的外存儲(chǔ)裝置、顯示裝置、諸如鍵盤和鼠 標(biāo)之類的輸入裝置、以及將這些構(gòu)成單元彼此連接的總線61。該機(jī)器翻譯 設(shè)備具有通用計(jì)算機(jī)可以使用的硬件配置。
可以通過(guò)在計(jì)算機(jī)可讀記錄介質(zhì)中以可安裝格式或可執(zhí)行格式記錄成 文件來(lái)提供根據(jù)本實(shí)施例的機(jī)器翻譯設(shè)備執(zhí)行的機(jī)器翻譯計(jì)算機(jī)程序(在 下文中稱為"機(jī)器翻譯程序"),所述計(jì)算機(jī)可讀記錄介質(zhì)例如為只讀光盤 存儲(chǔ)器(CD-R0M)、軟磁盤(FD)、可記錄光盤(CE-R)和數(shù)字多用盤(DVD)等。
另一種設(shè)置是可接受的,即將根據(jù)本實(shí)施例的機(jī)器翻譯設(shè)備執(zhí)行的機(jī) 器翻譯程序存儲(chǔ)在連接到像因特網(wǎng)的網(wǎng)絡(luò)的計(jì)算機(jī)中,從而經(jīng)網(wǎng)絡(luò)下載來(lái)提供機(jī)器翻譯程序。另一種設(shè)置是可接受的,其中,經(jīng)由像因特網(wǎng)那樣的 網(wǎng)絡(luò)提供或分布由根據(jù)本實(shí)施例的機(jī)器翻譯設(shè)備執(zhí)行的機(jī)器翻譯程序。
此外,在另一種可接受的設(shè)置中,將根據(jù)本實(shí)施例的機(jī)器翻譯程序事
先集成到ROM等之中來(lái)加以提供。
根據(jù)本實(shí)施例的機(jī)器翻譯設(shè)備執(zhí)行的機(jī)器翻譯程序具有包括上述功能 單元(例如輸入接收單元、選擇接收單元、翻譯控制單元和輸出單元)的模
塊配置。作為實(shí)際硬件配置,在CPU 51(即處理器)如上所述從存儲(chǔ)裝置讀 取并執(zhí)行機(jī)器翻譯程序時(shí)將這些功能單元加載到主存儲(chǔ)裝置中,從而在主 存儲(chǔ)裝置中產(chǎn)生這些功能單元。
權(quán)利要求
1、一種機(jī)器翻譯設(shè)備,其包括范例存儲(chǔ)單元,其彼此對(duì)應(yīng)地存儲(chǔ)目標(biāo)語(yǔ)言形式的多個(gè)目標(biāo)語(yǔ)言范例和源語(yǔ)言形式的多個(gè)源語(yǔ)言范例,所述多個(gè)目標(biāo)語(yǔ)言范例中的每一個(gè)目標(biāo)語(yǔ)言范例的含義等價(jià)于所述多個(gè)源語(yǔ)言范例中對(duì)應(yīng)一個(gè)源語(yǔ)言范例的含義;輸入接收單元,其接收所述源語(yǔ)言形式的輸入語(yǔ)句;搜索單元,其在所述范例存儲(chǔ)單元中搜索所述多個(gè)目標(biāo)語(yǔ)言范例中與所述多個(gè)源語(yǔ)言范例中匹配于或類似于所述輸入語(yǔ)句的一個(gè)源語(yǔ)言范例相對(duì)應(yīng)的一個(gè)目標(biāo)語(yǔ)言范例;翻譯單元,其通過(guò)將所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句,并通過(guò)將所述搜索中找到的所述多個(gè)目標(biāo)語(yǔ)言范例中的所述一個(gè)目標(biāo)語(yǔ)言范例翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生反向翻譯語(yǔ)句;檢測(cè)單元,其檢測(cè)所述反向翻譯語(yǔ)句和所述輸入語(yǔ)句之間的差異部分;以及輸出單元,其輸出所述差異部分。
2、 根據(jù)權(quán)利要求1所述的設(shè)備,還包括產(chǎn)生單元,所述產(chǎn)生單元通過(guò)將所述差異部分添加到所述輸入語(yǔ)句來(lái)產(chǎn)生輸出語(yǔ)句,其中所述輸出單元輸出添加了所述差異部分的輸出語(yǔ)句。
3、 根據(jù)權(quán)利要求1所述的設(shè)備,還包括選擇接收單元,所述選擇接收單元接收對(duì)輸出的所述差異部分中的一個(gè)差異部分的選擇,其中所述翻譯單元還通過(guò)將添加了所述差異部分中的所選擇的一個(gè)差異部分的輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生所述目標(biāo)語(yǔ)言語(yǔ)句,以及所述輸出單元還輸出所述目標(biāo)語(yǔ)言語(yǔ)句。
4、 根據(jù)權(quán)利要求3所述的設(shè)備,其中所述范例存儲(chǔ)單元還存儲(chǔ)與所述多個(gè)目標(biāo)語(yǔ)言范例相對(duì)應(yīng)的多個(gè)優(yōu)先級(jí)水平,所述多個(gè)優(yōu)先級(jí)水平分別表示所述多個(gè)目標(biāo)語(yǔ)言范例優(yōu)先化的程度,所述搜索單元通過(guò)為所述多個(gè)目標(biāo)語(yǔ)言范例中的一些目標(biāo)語(yǔ)言范例賦予較高優(yōu)先級(jí)來(lái)執(zhí)行搜索,相比于所述多個(gè)目標(biāo)語(yǔ)言范例中具有較低優(yōu)先級(jí)水平的其他目標(biāo)語(yǔ)言范例,所述多個(gè)目標(biāo)語(yǔ)言范例中的所述一些目標(biāo)語(yǔ)言范例具有較高優(yōu)先級(jí)水平,以及所述設(shè)備還包括更新單元,所述更新單元將產(chǎn)生了包含所選差異部分的所述反向翻譯語(yǔ)句的目標(biāo)語(yǔ)言范例的優(yōu)先級(jí)水平提高預(yù)定值。
5、 根據(jù)權(quán)利要求1所述的設(shè)備,其中所述輸入接收單元還接收要添加到所述輸入語(yǔ)句的一個(gè)或多個(gè)單詞的輸入,所述翻譯單元還通過(guò)將添加了所接收的一個(gè)或多個(gè)單詞的所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生所述目標(biāo)語(yǔ)言語(yǔ)句,以及所述輸出單元還輸出所述目標(biāo)語(yǔ)言語(yǔ)句。
6、 根據(jù)權(quán)利要求l所述的設(shè)備,其中所述范例存儲(chǔ)單元彼此對(duì)應(yīng)地存儲(chǔ)所述多個(gè)目標(biāo)語(yǔ)言范例和所述多個(gè)源語(yǔ)言范例,可以從所述多個(gè)源語(yǔ)言范例的每一個(gè)源語(yǔ)言范例中省略所述多個(gè)目標(biāo)語(yǔ)言范例中對(duì)應(yīng)一個(gè)目標(biāo)語(yǔ)言范例所含的一個(gè)或多個(gè)單詞,以及所述檢測(cè)單元檢測(cè)從所述多個(gè)源語(yǔ)言范例中匹配于或類似于所述輸入語(yǔ)句的一個(gè)源語(yǔ)言范例省略的所述一個(gè)或多個(gè)單詞作為所述差異部分中的一個(gè)差異部分。
7、 一種機(jī)器翻譯設(shè)備,其包括范例存儲(chǔ)單元,其彼此對(duì)應(yīng)地存儲(chǔ)目標(biāo)語(yǔ)言形式的多個(gè)目標(biāo)語(yǔ)言范例和源語(yǔ)言形式的多個(gè)源語(yǔ)言范例,所述多個(gè)目標(biāo)語(yǔ)言范例中的每一個(gè)目標(biāo)語(yǔ)言范例的含義等價(jià)于所述多個(gè)源語(yǔ)言范例中對(duì)應(yīng)一個(gè)源語(yǔ)言范例的含義;輸入接收單元,其接收所述源語(yǔ)言形式的輸入語(yǔ)句;搜索單元,其在所述范例存儲(chǔ)單元中搜索所述多個(gè)目標(biāo)語(yǔ)言范例中與 所述多個(gè)源語(yǔ)言范例中匹配于或類似于所述輸入語(yǔ)句的一個(gè)源語(yǔ)言范例相 對(duì)應(yīng)的一個(gè)目標(biāo)語(yǔ)言范例;第一翻譯單元,其通過(guò)將所述搜索中找到的所述多個(gè)目標(biāo)語(yǔ)言范例中 的一個(gè)目標(biāo)語(yǔ)言范例翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生第一反向翻譯語(yǔ)句;第二翻譯單元,其通過(guò)將所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái) 產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句,并通過(guò)將所產(chǎn)生的目標(biāo)語(yǔ)言語(yǔ)句翻譯成所述源語(yǔ)言的 形式來(lái)產(chǎn)生第二反向翻譯語(yǔ)句;檢測(cè)單元,其檢測(cè)所述第一反向翻譯語(yǔ)句和所述第二反向翻譯語(yǔ)句之間的差異部分;以及輸出單元,其輸出所述差異部分。
8、 根據(jù)權(quán)利要求7所述的設(shè)備,還包括產(chǎn)生單元,所述產(chǎn)生單元通過(guò) 將所述差異部分添加到所述輸入語(yǔ)句來(lái)產(chǎn)生輸出語(yǔ)句,其中所述輸出單元輸出添加了所述差異部分的輸出語(yǔ)句。
9、 根據(jù)權(quán)利要求7所述的設(shè)備,還包括選擇接收單元,所述選擇接收 單元接收對(duì)所述差異部分中的一個(gè)差異部分的選擇,其中所述第二翻譯單元還通過(guò)將添加了所述差異部分中的所選擇的一個(gè)差 異部分的輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生所述目標(biāo)語(yǔ)言語(yǔ)句, 以及所述輸出單元還輸出所述目標(biāo)語(yǔ)言語(yǔ)句。
10、 根據(jù)權(quán)利要求9所述的設(shè)備,其中所述范例存儲(chǔ)單元還存儲(chǔ)與所述多個(gè)目標(biāo)語(yǔ)言范例相對(duì)應(yīng)的多個(gè)優(yōu)先 級(jí)水平,所述多個(gè)優(yōu)先級(jí)水平分別表示所述多個(gè)目標(biāo)語(yǔ)言范例優(yōu)先化的程 度,所述搜索單元通過(guò)為所述多個(gè)目標(biāo)語(yǔ)言范例中的一些目標(biāo)語(yǔ)言范例賦 予較高優(yōu)先級(jí)來(lái)執(zhí)行搜索,相比于所述多個(gè)目標(biāo)語(yǔ)言范例中具有較低優(yōu)先 級(jí)水平的其他目標(biāo)語(yǔ)言范例,所述多個(gè)目標(biāo)語(yǔ)言范例中的所述一些目標(biāo)語(yǔ)言范例具有較高優(yōu)先級(jí)水平,以及所述設(shè)備還包括更新單元,所述更新單元將產(chǎn)生了包含所選差異部分的所述反向翻譯語(yǔ)句的目標(biāo)語(yǔ)言范例的優(yōu)先級(jí)水平提高預(yù)定值。
11、 根據(jù)權(quán)利要求7所述的設(shè)備,其中所述輸入接收單元還接收要添加到所述輸入語(yǔ)句的一個(gè)或多個(gè)單詞的輸入,所述第二翻譯單元還通過(guò)將添加了所接收的一個(gè)或多個(gè)單詞的所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生所述目標(biāo)語(yǔ)言語(yǔ)句,以及所述輸出單元還輸出所述目標(biāo)語(yǔ)言語(yǔ)句。
12、 根據(jù)權(quán)利要求7所述的設(shè)備,其中所述范例存儲(chǔ)單元彼此對(duì)應(yīng)地存儲(chǔ)所述多個(gè)目標(biāo)語(yǔ)言范例和所述多個(gè)源語(yǔ)言范例,可以從所述多個(gè)源語(yǔ)言范例的每一個(gè)源語(yǔ)言范例中省略所述多個(gè)目標(biāo)語(yǔ)言范例中對(duì)應(yīng)一個(gè)目標(biāo)語(yǔ)言范例所含的一個(gè)或多個(gè)單詞,以及所述檢測(cè)單元檢測(cè)從所述多個(gè)源語(yǔ)言范例中匹配于或類似于所述輸入語(yǔ)句的一個(gè)源語(yǔ)言范例省略的所述一個(gè)或多個(gè)單詞作為所述差異部分中的一個(gè)差異部分。
13、 一種機(jī)器翻譯方法,其包括接收源語(yǔ)言形式的輸入語(yǔ)句;在范例存儲(chǔ)單元中搜索所述多個(gè)目標(biāo)語(yǔ)言范例中與多個(gè)源語(yǔ)言范例中匹配于或類似于所述輸入語(yǔ)句的一個(gè)源語(yǔ)言范例相對(duì)應(yīng)的一個(gè)目標(biāo)語(yǔ)言范例,其中,所述范例存儲(chǔ)單元彼此對(duì)應(yīng)地存儲(chǔ)目標(biāo)語(yǔ)言形式的所述多個(gè)目標(biāo)語(yǔ)言范例和所述源語(yǔ)言形式的所述多個(gè)源語(yǔ)言范例,所述多個(gè)目標(biāo)語(yǔ)言范例中的每一個(gè)目標(biāo)語(yǔ)言范例的含義等價(jià)于所述多個(gè)源語(yǔ)言范例中對(duì)應(yīng)一個(gè)源語(yǔ)言范例的含義;通過(guò)將所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句;通過(guò)將所述搜索中找到的所述多個(gè)目標(biāo)語(yǔ)言范例中的所述一個(gè)目標(biāo)語(yǔ)言范例翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生反向翻譯語(yǔ)句;檢測(cè)所述反向翻譯語(yǔ)句和所述輸入語(yǔ)句之間的差異部分;以及輸出所述差異部分。
14、 一種機(jī)器翻譯方法,其包括接收源語(yǔ)言形式的輸入語(yǔ)句;在范例存儲(chǔ)單元中搜索所述多個(gè)目標(biāo)語(yǔ)言范例中與多個(gè)源語(yǔ)言范例中匹配于或類似于所述輸入語(yǔ)句的一個(gè)源語(yǔ)言范例相對(duì)應(yīng)的一個(gè)目標(biāo)語(yǔ)言范例,其中,所述范例存儲(chǔ)單元彼此對(duì)應(yīng)地存儲(chǔ)目標(biāo)語(yǔ)言形式的所述多個(gè)目標(biāo)語(yǔ)言范例和所述源語(yǔ)言形式的所述多個(gè)源語(yǔ)言范例,所述多個(gè)目標(biāo)語(yǔ)言范例中的每一個(gè)目標(biāo)語(yǔ)言范例的含義等價(jià)于所述多個(gè)源語(yǔ)言范例中對(duì)應(yīng)一個(gè)源語(yǔ)言范例的含義;通過(guò)將所述搜索中找到的所述多個(gè)目標(biāo)語(yǔ)言范例中的一個(gè)目標(biāo)語(yǔ)言范例翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生第一反向翻譯語(yǔ)句;通過(guò)將所述輸入語(yǔ)句翻譯成所述目標(biāo)語(yǔ)言的形式來(lái)產(chǎn)生目標(biāo)語(yǔ)言語(yǔ)句,并通過(guò)將所產(chǎn)生的目標(biāo)語(yǔ)言語(yǔ)句翻譯成所述源語(yǔ)言的形式來(lái)產(chǎn)生第二反向翻譯語(yǔ)句;檢測(cè)所述第一反向翻譯語(yǔ)句和所述第二反向翻譯語(yǔ)句之間的差異部分;以及輸出所述差異部分。
全文摘要
本發(fā)明涉及用于機(jī)器翻譯的設(shè)備和方法。在一種機(jī)器翻譯設(shè)備中,在范例存儲(chǔ)單元中存儲(chǔ)目標(biāo)語(yǔ)言形式的目標(biāo)語(yǔ)言范例和源語(yǔ)言形式的源語(yǔ)言范例,同時(shí)彼此對(duì)應(yīng)地保持目標(biāo)語(yǔ)言范例和源語(yǔ)言范例。輸入接收單元接收所述源語(yǔ)言形式的輸入語(yǔ)句。搜索單元在所述范例存儲(chǔ)單元中搜索所述目標(biāo)語(yǔ)言范例中對(duì)應(yīng)于所述源語(yǔ)言范例中匹配或類似所述輸入語(yǔ)句的一個(gè)范例的一個(gè)范例。翻譯單元通過(guò)將所述搜索中找到的所述目標(biāo)語(yǔ)言范例之一翻譯成所述源語(yǔ)言形式來(lái)產(chǎn)生反向翻譯語(yǔ)句。檢測(cè)單元檢測(cè)所述反向翻譯語(yǔ)句和所述輸入語(yǔ)句之間的差異部分。輸出單元輸出所述差異部分。
文檔編號(hào)G06F17/28GK101520777SQ200910007558
公開日2009年9月2日 申請(qǐng)日期2009年2月23日 優(yōu)先權(quán)日2008年2月28日
發(fā)明者知野哲朗, 釜谷聰史, 降幡建太郎 申請(qǐng)人:株式會(huì)社東芝
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
方城县| 泉州市| 玛沁县| 平山县| 满城县| 定远县| 贵溪市| 聊城市| 合阳县| 大安市| 和龙市| 桂阳县| 信宜市| 南康市| 牙克石市| 洮南市| 来凤县| 凤阳县| 玉溪市| 宁乡县| 通化县| 拉孜县| 义乌市| 尚义县| 无棣县| 项城市| 永胜县| 曲周县| 凤台县| 会昌县| 常德市| 宜黄县| 河津市| 夏河县| 襄樊市| 麻栗坡县| 广水市| 张家界市| 千阳县| 安国市| 沽源县|