專利名稱:單詞翻譯裝置、翻譯方法以及翻譯程序的制作方法
技術領域:
本發(fā)明總的來講涉及一種單詞翻譯裝置,更具體地講,涉及一種兩 種或更多種語言之間的翻譯技術,所述單詞翻譯裝置將源語言的每個單 詞翻譯成目標語言的單詞。
背景技術:
通過單詞翻譯技術,在雙語對照字典中査閱該第一語言的輸入單詞, 并且從該雙語對照字典中提取出該單詞的第二語言的翻譯。然后輸出該 提取出的翻譯。通過句子翻譯技術,按照語素對第一語言的輸入句子進 行分析,并且提取出組成該句子的單詞組。從雙語對照字典檢索出該提 取的單詞的翻譯,并且基于單詞之間的鏈接形成句子形式的翻譯。例如, 非專利參考文獻1公開了一種利用單詞之間的鏈接的機器翻譯系統(tǒng)。這種單詞和句子翻譯技術應用于電子單詞翻譯裝置和計算機中。在電子單詞翻譯裝置中,兩種或更多種語言的雙語對照字典存儲在存儲器 中。當用戶輸入第一語言的單詞時,從這些雙語對照字典中提取出該單 詞的翻譯,并且將其顯示在顯示器上。專利參考文獻1公開了一種技術,該技術能夠為各用戶省去在電子 字典裝置中執(zhí)行檢索時選擇字典的類型的麻煩。基于用戶輸入的檢索詞, 在這些字典中檢索指示詞,并且將包含該指示詞的字典的內容進行集總 顯示。[專利參考文獻1]第2000—276479號日本專利公開 [非專利參考文獻1]Suzuki and Tochinai, "Machine Translation System Using Conjunctive Relations of Words", IPS J Transctions,Vo1.29, No.4,1988.本發(fā)明要解決的問題正常設計的各雙語對照字典涉及將一種語言翻譯成另一種語言(諸 如日文到英文或英文到日文),并且單詞信息被雙重記錄在雙語對照字典 中。例如,當執(zhí)行從英文到日文的翻譯時,不共享當執(zhí)行從日文到英文 的翻譯時使用的單詞信息。結果,字典的生產(chǎn)成本變高。另外,由于雙 語對照字典不能夠彼此參照,所以出現(xiàn)從雙語對照字典丟失信息的問題。例如,日英字典中的具有相同意義的一對單詞可能不存在于英日字典中。 在專利參考文獻1中公開的電子裝置中,英日翻譯字典和日英翻譯字典 彼此獨立使用,上述問題沒有解決。句子翻譯的終極目標是獲得準確的翻譯的句子。然而,實際上不能 夠容易地獲得準確的翻譯。在翻譯文檔中,--些句子是準確的,但是一 些句子不是準確的,并且用戶很難確定哪些句子是準確的。非專利參考 文獻1沒有公開或建議解決這個問題的任何結構。因此,本發(fā)明的目的在于提供一種涉及在兩種語言或多于兩種的語 言之間實現(xiàn)翻譯的雙語或多語對照字典的單詞翻譯裝置、翻譯方法、以 及翻譯程序。解決該問題的方法本發(fā)明提供了一種單詞翻譯裝置,所述單詞翻譯裝置能夠在語言之 間執(zhí)行單詞翻譯,所述單詞翻譯裝置包括存儲單元,用于至少將第一 單詞檢索結構、第二單詞檢索結構、第一單詞和翻譯信息記錄、以及第 二單詞和翻譯信息記錄存儲在字典中,其中,所述第一單詞檢索結構設 置用于檢索第一語言的單詞,所述第二單詞檢索結構設置用于檢索第二 語言的單詞,所述第一單詞和翻譯信息記錄包括關于存儲在所述第一單詞檢索結構中的單詞的單詞關聯(lián)信息和翻譯信息,所述第二單詞和翻譯 信息記錄包括關于存儲在所述第二單詞檢索結構中的單詞的單詞關聯(lián)信 息和翻譯信息。當將給定語言的單詞翻譯成另一種語言的單詞時,在所 述源語言的單詞檢索結構中檢索所述單詞。如果在所述源語言的單詞檢
索結構中存在所述對應的單詞,則從所述單詞和翻譯信息記錄中獲得對 應的單詞信息和翻譯信息?;谒@得的翻譯信息,從所述另外語言的 單詞檢索結構中獲得所述對應的翻譯信息。如果在所述源語言的單詞檢 索結構中不存在對應的單詞,則所述源語言的單詞原樣輸出。
在本發(fā)明的單詞翻譯裝置中,所述第一和第二單詞檢索結構包括用 于識別單詞和翻譯信息記錄的單詞和翻譯信息記錄識別信息。
在本發(fā)明的單詞翻譯裝置中,所述第一和第二單詞翻譯信息記錄分 別包括用于識別存儲在所述第一和第二單詞檢索結構中的單詞的單詞識 別信息。
在本發(fā)明的單詞翻譯裝置中,所述第一和第二單詞和翻譯信息記錄 分別包括關于存儲在所述第一和第二單詞檢索結構中的單詞的關聯(lián)信息。
在本發(fā)明的單詞翻譯裝置中,所述第一單詞和翻譯信息記錄包括用 于識別存儲在所述第二單詞和翻譯信息記錄中的翻譯信息的翻譯識別信 息,并且所述第二單詞和翻譯信息記錄包括用于識別存儲在所述第一單 詞和翻譯信息記錄中的翻譯信息的翻譯識別信息。
在本發(fā)明的單詞翻譯裝置中,所述第一和第二單詞和翻譯信息記錄 包括用于對各翻譯的同義詞進行識別的識別信息。
在本發(fā)明的單詞翻譯裝置中,所述第一和第二單詞和翻譯信息記錄 包括用于識別進行翻譯的語言的種類的識別信息。
在本發(fā)明的單詞翻譯裝置中,當主題單詞具有多于一種的詞性時,所述第一和第二單詞和翻譯信息記錄包括存儲與各詞性(POS)相關的一條單詞關聯(lián)信息和一條翻譯信息的記錄。
在本發(fā)明的單詞翻譯裝置中,所述各個詞性的記錄通過指針與所述 一條單詞關聯(lián)信息關聯(lián)。
更加優(yōu)選的是,所述單詞翻譯裝置還包括輸入單元,用于輸入單 詞;查閱單元,用于在存儲于所述第一單詞檢索結構中的單詞中查閱所 輸入的單詞;提取單元,用于基于與所述單詞關聯(lián)的所述第一單詞和翻譯信息記錄從存儲在所述第二單詞檢索結構中的翻譯中提取翻譯;以及
輸出單元,用于輸出所述提取的翻譯。通過這種結構,能夠高速度高精 度地翻譯每個輸入的單詞。更加優(yōu)選的是,所述提取單元基于與所述査 閱單元查閱的所述單詞關聯(lián)的所述第一單詞信息記錄提取所述第二單詞 信息和翻譯信息。另選地,所述第一單詞和翻譯信息記錄的所述翻譯信 息可以包括鏈接信息,所述鏈接信息用于識別存儲在所述第二單詞檢索 結構或第二單詞和翻譯信息記錄中的翻譯;以及所述提取單元可以基于 所述鏈接信息提取所述翻譯或所述第二單詞和翻譯信息記錄。本發(fā)明的另一種在兩種或更多種語言之間執(zhí)行單詞翻譯的單詞翻譯 裝置包括存儲單元,用于在字典中存儲N種語言的單詞檢索TRIE結 構以及與所述N種語言的所述各自的單詞檢索結構相關聯(lián)的所述N種語言的單詞信息記錄,N是大于等于2的整數(shù)。所述N種語言的單詞信息記錄中的一種語言的單詞信息記錄包括用于識別兩種或更多種語言中的 一種語言的翻譯的翻譯信息。通過這種結構,本發(fā)明的單詞翻譯裝置不 僅僅能夠在兩種語言之間也能夠在三種或更多種語言(多語對照字典) 之間執(zhí)行單詞翻譯。本發(fā)明的機器翻譯系統(tǒng)包括翻譯單元,用于輸入句子和翻譯所述 句子;以及根據(jù)權利要求1到10中的任何一個所述的單詞翻譯裝置,用于輸入所述翻譯單元沒有翻譯出的單詞并且翻譯所述單詞。在所述機器 翻譯系統(tǒng)中,所述翻譯單元包括翻譯存儲器引擎、基于句型的翻譯引擎、 以及基于語塊示例的翻譯引擎中的至少一個。更加優(yōu)選的是,所述機器 翻譯系統(tǒng)還包括區(qū)別輸出單元,所述區(qū)別輸出單元區(qū)別沒有由所述翻譯 單元翻譯的單詞的翻譯和其它翻譯,并且輸出所述翻譯。通過這種結構, 能夠執(zhí)行高準確翻譯,并且用戶能夠容易地確定哪個翻譯具有高可信度 以及哪個翻譯具有低可信度。本發(fā)明的另一種在兩種或更多種語言之間執(zhí)行單詞翻譯的單詞翻譯裝置包括存儲單元,用于存儲為各語言設置的單詞檢索字典數(shù)據(jù)以及為存儲在為各種語言設置的所述單詞檢索字典數(shù)據(jù)中的各單詞設置 的鏈接信息,并且指示一種語言單詞和另一種語言單詞的翻譯之間的關 系。
通過這種結構, 一種語言的單詞與另一種語言的單詞通過所述鏈接 信息進行鏈接。因此,能夠執(zhí)行兩種語言或多于兩種的語言之間的翻譯。更加優(yōu)選的是,在所述單詞翻譯裝置中,所述鏈接信息包括識別 信息,用于識別所述一種語言的單詞;識別信息,用于識別所述另一種 語言;指針,用于指向與所述另一種語言的翻譯相關的鏈接信息;以及 指針,指向與所述一種語言的單詞的同義詞相關的鏈接信息。更加優(yōu)選的是,在所述單詞翻譯裝置中,所述鏈接信息包括父鏈接 信息和子鏈接信息。所述父鏈接信息包括指向與所述一種語言的單詞的 同義詞相關的所述子鏈接信息的指針。所述子鏈接信息包括識別信息, 用-T識別所述另一種語言;指針,用于指向所述對應的父鏈接信息;指 針,用于指向與所述另一種語言的翻譯相關的所述子鏈接信息;以及指 針,用于指向與另 一 同義詞相關的所述子鏈接信息。更加優(yōu)選的是,在所述單詞翻譯裝置中,當所述單詞具有多種詞性 吋,為每種詞性設置所述鏈接信息。所述單詞檢索字典數(shù)據(jù)包括對所述 各種語言設置的并且用于檢索單詞的單詞檢索結構和為所述每種語言設 置并且存儲與所述單詞有關的信息的單詞信息記錄。更加優(yōu)選的是,所述單詞信息記錄包括所述鏈接信息。例如,所述 單詞檢索結構可以包括單詞TRIE結構或哈希函數(shù)結構。更加優(yōu)選的是,在所述單詞翻譯裝置中,所述單詞檢索字典數(shù)據(jù)包 括與對應語言的各單詞的第一字符有關的列表信息和與所述單詞有關 列表信息。所述第一字符列表信息包括與所述第一字符相關的信息、以 所述第一字符開始的單詞的數(shù)目、指向與以所述第一字符開始的單詞有 關的列表信息中的某一位置的指針。所述單詞列表信息包括指向與所述 單詞有關的鏈接信息的指針。更加優(yōu)選的是,所述鏈接信息與包括與存儲在所述單詞檢索字典數(shù) 據(jù)中的單詞有關的信息的所述單詞信息記錄相關聯(lián)。更加優(yōu)選的是,所述單詞翻譯裝置還包括輸入單元,用于輸入所 述--種語言的單詞;查閱單元,用于在與所述一種語言相關的所述單詞檢索字典數(shù)據(jù)中查閱所述一種語言的輸入單詞;以及提取單元,用于基 于與被找出的所述一種語言的所述單詞相關的所述鏈接信息,從與所述 另一種語言相關的所述單詞檢索字典數(shù)據(jù)提取所述另一種語言的翻譯。 通過這種結構,能夠高精確度地執(zhí)行單詞翻譯。更加優(yōu)選的是,所述提 取單元基于與被所述査閱單元査閱出的所述一種語言的單詞信息記錄相 關的所述鏈接信息提取所述另一種語言的單詞信息記錄。另外,所述提 取單元可以基于與被所述查閱單元查閱出的所述一種語言的單詞信息記 錄有關的所述鏈接信息,從所述另一種語言的所述單詞檢索結構提取翻 譯。本發(fā)明的用于在兩種或更多種語言之間翻譯單詞的單詞翻譯方法, 包括如下步驟將第一單詞檢索結構、第二單詞檢索結構、第一單詞信 息記錄和第二單詞信息記錄存儲在字典中。所述第一單詞檢索結構被設 置用于檢索第一語言的單詞,所述第二單詞檢索結構被設置用于檢索第 二語言的單詞,所述第一單詞信息記錄包括用于識別存儲在所述第一單 詞檢索結構中的單詞的翻譯的第一翻譯信息,所述第二單詞信息記錄包 括用于識別存儲在所述第二單詞檢索結構中的單詞的翻譯的第二翻譯信 息。所述的單詞翻譯方法還包括如下步驟輸入單詞;在存儲于所述第 一單詞檢索結構中的所述單詞中査閱所輸入的單詞;基于所査閱出的單 詞的所述第一單詞信息記錄,從所述第二單詞檢索結構提取翻譯;以及輸出所提取出的翻譯。更加優(yōu)選的是,所述單詞檢索字典數(shù)據(jù)包括為各 語言設置的單詞信息記錄并且存儲單詞檢索結構和與單詞有關的信息。 所述單詞信息記錄包括所述鏈接信息。在所述提取步驟中,基于所述一 種語言的所述單詞信息記錄的鏈接信息提取所述另一種語言的所述單詞信息記錄。本發(fā)明的用于在兩種或更多種語言之間翻譯單詞的單詞翻譯方法包括如下步驟將單詞檢索字典數(shù)據(jù)和鏈接信息存儲在存儲單元中。所述 單詞檢索字典數(shù)據(jù)為所述各語言設置,所述鏈接信息是為存儲在對所述 每種語言設置的所述單詞檢索字典數(shù)據(jù)中的每個單詞設置的并且指示一 種語言的單詞和另一種語言的單詞的翻譯之間的關系。
更加優(yōu)選的是,所述翻譯方法還包括如下步驟輸入一種語言的單 詞;在為所述一種語言設置的所述單詞檢索字典數(shù)據(jù)中査閱所述一種語 言的輸入單詞;以及基于與所述一種語言的所查閱出的單詞的所述鏈接 信息,從為所述另一種語言設置的所述單詞檢索字典數(shù)據(jù)中提取另一種 語言的翻譯。本發(fā)明的在兩種或更多種語言之間翻譯單詞的單詞翻譯程序可被運 行以執(zhí)行行如下步驟將第一單詞檢索結構、第二單詞檢索結構、第一 單詞信息記錄和第二單詞信息記錄存儲在字典中。所述第一單詞檢索結 構被設置用于檢索第一語言的單詞,所述第二單詞檢索結構被設置用于 檢索第二語言的單詞,所述第一單詞信息記錄包括用于識別存儲在所述 第一單詞檢索結構中的單詞的翻譯的第一翻譯信息,所述第二單詞信息 記錄包括用于識別存儲在所述第二單詞檢索結構中的單詞的翻譯的第二 翻譯信息。本發(fā)明的另一種在兩種或更多種語言之間翻譯單詞的單詞翻譯程序 可被運行以執(zhí)行如下步驟將單詞檢索字典數(shù)據(jù)和鏈接信息存儲在存儲 單元中。所述單詞檢索字典數(shù)據(jù)是為所述各語言設置的,所述鏈接信息 是對存儲在對所述每種語言設置的所述單詞檢索字典數(shù)據(jù)中的每個單詞 設置的并且指示一種語言的單詞和另一種語言的單詞的翻譯之間的關 系。更加具體地講,執(zhí)行翻譯程序以執(zhí)行如下步驟輸入一種語言的單 同;在為所述一種語言設置的所述單詞檢索字典數(shù)據(jù)中查閱所述一種語 言的輸入單詞;以及基于與查閱出的所述一種語言的單詞的所述鏈接信 息,從為所述另一種語言設置的所述單詞檢索字典數(shù)據(jù)提取另一種語言 的翻譯。本發(fā)明的有益效果根據(jù)本發(fā)明,對各種語言設置單詞檢索字典數(shù)據(jù)和鏈接信息。因此, 能夠高精度高速度地執(zhí)行語言之間的翻譯。此外,本發(fā)明的單詞翻譯裝 置不僅能夠應用于雙語對照單詞翻譯還能夠應用于多語對照單詞翻譯。
圖1示出了根據(jù)本發(fā)明示例性實施方式的機器翻譯系統(tǒng)的結構; 圖2示出了兩種語言之間的單詞翻譯裝置的結構;圖3示出了根據(jù)本發(fā)明示例性實施方式的單詞指導機器引擎的硬件結構;圖4示出了根據(jù)本發(fā)明示例性實施方式的TRIE結構;圖5詳細示出了TRIE結構;圖6示出了單詞信息記錄的結構;圖7示出了單詞標記的解釋;圖8A示出了子標記的解釋;圖8B示出了語言ID的解釋;圖9示出了單詞信息記錄ID的結構;圖10A到10C示出了 TRIE結構的字符信息的結構;圖11示出了結點記錄ID分配; 圖12示出了結點ID的陣列;圖13示出了用于存儲單詞信息記錄的方法的第一實施例; 圖14示出了用于存儲單詞信息記錄的方法的第二實施例; 圖15是單詞翻譯操作的流程圖;圖16示出了根據(jù)本發(fā)明的第二示例性實施方式的多語對照單詞翻譯裝置的多語對照字典;圖17示出了在本發(fā)明的第三示例性實施方式中使用的多語對照單詞翻譯字典的結構;圖18是多語對照單詞翻譯字典的第一實施例的概念圖;圖19是多語對照單詞翻譯字典的第二實施例的概念圖;圖20示出了基于哈希函數(shù)的單詞檢索字典的結構;圖21A到21C示出了釆用陣列結構基礎的單詞信息記錄的結構;圖22示出了采用雙陣列結構基礎的單詞信息記錄的結構;圖23示出了采用雙陣列結構基礎的同義詞信息記錄的結構;圖24示出了采用陣列結構基礎的在日文和中文之間的單詞翻譯中 使用的雙語對照字典的結構;圖25示出了釆用雙陣列結構基礎的在日文和中文之間的單詞翻譯 中使用的雙語對照字典的結構;圖26示出了采用陣列結構基礎的在日文和英文之間的單詞翻譯中 使用的雙語對照字典的結構;以及圖27示出了采用雙陣列結構基礎的在日文和英文之間的單詞翻譯 中使用的雙語對照字典的結構。
具體實施方式
下面,對照附圖來描述本發(fā)明的優(yōu)選示例性實施方式。圖1示出了 根據(jù)本發(fā)明示例性實施方式的機器翻譯系統(tǒng)的全部結構。該機器翻譯系 統(tǒng)1不能夠翻譯文檔的所有部分。如果對不能夠翻譯的部分進行強制翻 譯,則結果會使得用戶困惑,并且會不利地影響對源句子的內容的理解。 因此,翻譯結果分成成功和失敗,并且對翻譯結果分配信用等級。另外, 該翻譯系統(tǒng)配備有學習功能,用于自動地收集不能夠翻譯的部分并且對 這些不能夠翻譯的部分給出準確的翻譯。這樣,增強了翻譯性能。該機器翻譯系統(tǒng)l包括翻譯存儲器引擎12,用于翻譯經(jīng)由源語言 文本句子輸入單元10輸入的各個句子;語素分析單元14,用于接收沒有 包含在該翻譯存儲器引擎12中的數(shù)據(jù)庫中的部分或沒有被準確翻譯出的 部分,并且分析該部分的語素;基于句型的翻譯引擎16,用于接收經(jīng)由 語素分析單元14分析的句子或單詞,并且基于句型來翻譯該句子或單詞; 基于語塊(chunk-based)的翻譯引擎18,用于根據(jù)基于語塊的示例句子 (單詞的組合或短語(諸如名詞短語))來翻譯沒有被基于句型的翻譯引 擎16翻譯出的部分;基于分析/單詞指導翻譯引擎20,用于接收沒有被 基于語塊的翻譯引擎18翻譯出的單詞并且基于分析或逐字來翻譯該單 詞;以及目標語言文本句子創(chuàng)建單元22,用于創(chuàng)建目標語言文本句子。 該基于語塊的翻譯引擎18具有翻譯提取功能。該翻譯提取功能將包含在 句子中的各單詞串與從該單詞串翻譯出的單詞串進行關聯(lián)。該基于分析/ 單詞指導翻譯引擎20將翻譯提取功能應用到從該句子提取的各單詞串并
且獲得該單詞串的翻譯。與由翻譯存儲器引擎12、基于句型的翻譯引擎16以及基于語塊示例的翻譯引擎18成功翻譯出的部分相關的翻譯數(shù)據(jù)被輸入到目標語言文 本句子創(chuàng)建單元22?;谠摲g數(shù)據(jù),該目標語言文本句子創(chuàng)建單元22 創(chuàng)建目標語言的文本句子。這里,將保證準確度的標識分配到成功翻譯 出的部分。經(jīng)由基于分析/單詞指導翻譯引擎20獲得的翻譯數(shù)據(jù)僅僅作為 引導性翻譯(guide translation)從目標語言文本句子創(chuàng)建單元22輸出。 從而,用戶能夠迅速地區(qū)別文本翻譯中的可信翻譯結果和不可靠翻譯結 果。同時,不能由基于語塊示例的翻譯引擎18翻譯的部分由收集單元24 進行收集。該收集的不能翻譯的各部分然后由人類翻譯員進行準確翻譯, 并且將結果輸入到學習引擎26。基于該準確翻譯,學習引擎26將雙語對 照數(shù)據(jù)寫入雙語對照字典28中。圖2示出了作為這個示例性實施方式的優(yōu)選變型的兩種語言之間的 單詞翻譯裝置的結構。在兩種語言之間翻譯單詞的功能設置在單詞指導 翻譯引擎20中。在該單詞翻譯裝置中,源語言文本輸入單元IO將各文 本或單詞輸入到語素分析單元14。這里,屬性(諸如"名詞"或"動詞") 附到各單詞上,然后將該單詞輸入到單詞指導翻譯引擎20。通過使用雙 語對照字典,單詞指導翻譯引擎20將源語言的各輸入單詞翻譯成目標語 言的單詞,然后將結果輸入到目標語言文本句子創(chuàng)建單元22。單詞指導 翻譯引擎20使用的雙語對照字典可以是學習引擎26學習過的雙語對照 字典28。圖3示出了兩種語言之間的單詞翻譯裝置的硬件結構。該單詞翻譯 裝置包括輸入單元30、顯示單元32、主存儲單元34、外部存儲單元 36、中央處理單元38以及連接這些單元的總線40。該輸入單元30可以 是鍵盤或者是光讀取器,通過該鍵盤由鍵操作輸入各單詞,該光讀取器 光學地讀取包含在文檔中的各單詞或者由其它硬件或軟件執(zhí)行的操作的 結果(諸如基于語塊示例的翻譯引擎的輸出)。該顯示單元32包括顯示器等,用于輸出從源語言翻譯出的目標語言 的各單詞。該主存儲單元34包括ROM或RAM,并且存儲用于控制單詞
翻譯的程序和諸如操作結果的數(shù)據(jù)。外部存儲單元36包括諸如硬盤的大 容量存儲裝置。用于翻譯單詞所必需的雙語對照字典存儲在該大容量存儲裝置中。該CPU(中央處理單元)38根據(jù)存儲在主存儲單元34中的程序 來控制各單元。接下來,將詳細描述根據(jù)這個示例性實施方式的單詞指導翻譯引擎。 圖4示出了設置在單詞指導翻譯引擎20中的雙語對照字典的單詞檢索 TRIE結構和單詞信息記錄結構的概念。該雙語對照字典包括第一語言 單詞檢索TRIE結構100和與該單詞檢索TRIE結構100相關聯(lián)的第一語 言單詞信息記錄110、以及第二語言單詞檢索TRIE結構200和與該單詞 檢索TRIE結構200相關聯(lián)的第二語言單詞信息記錄210。在語言信息處理的領域,TRIE結構是通過組合在檢索關鍵詞的組中 共有的字符串獲得的樹結構。例如,圖5示出了從五個檢索關鍵詞 1/ 、"、 " V 、 $ V 、 "、 " & V 、 $ O "、 " V、0 二 "和"V 、(D D "形成的TR[E 結構。圖5中的符號"$"可以用作表示單詞的末端的特殊字符。當采用 TRIE結構來執(zhí)行檢索時,從左側開始掃描檢索字符串,并且掃描器沿著 該樹從根部(結點N1)開始向分配到結點N2到N13的各結點的字符移 動。這樣,提取出了與檢索字符串對應的單詞。通過采用TRIE結構,能 夠在與檢索字符串的長度成比例的時間段內執(zhí)行檢索,而不管檢索關鍵 詞的數(shù)目如何。返回圖4,根據(jù)這個示例性實施方式的雙語對照字典包括第一語 言單詞檢索TRIE結構100 (以下稱作第一 TRIE結構)、存儲與包含在第 一 TRIE結構100中的各單詞相關的翻譯信息的第一語言單詞信息記錄 110、第二語言單詞檢索TRIE結構200 (以下稱作第二TRIE結構)、以 及存儲與包含在第二 TRIE結構200中的各單詞相關的翻譯信息的第二語 言單詞信息記錄210。在第一語言是日文、第二語言是中文的情況下,當日文單詞"了.乂 'J力(美國)"存儲在第一TRIE結構100中時,中文單詞"美國"存儲 在第二 TRIE結構200中。在包含在第一單詞信息記錄110和第二單詞信息記錄2io中的翻譯信息中,日文單詞"7乂 y力"與中文單詞"美國"
彼此關聯(lián)。例如,當輸入日文單詞"7少!J力"的檢索字符串時,CPU 38從左側(從字符"7")掃描檢索字符串單詞"了乂 li力",并且從第一TRIE結構的根部開始從一個結點移動到一個結點。CPU 38然后確定是 否存在與單詞"7乂 ]i力"對應的單詞或路徑。如果存在對應的路徑或 單詞,則參照與單詞"7乂 y力"對應的單詞信息記錄110,從而識別出 第二 TRIE結構200中的中文路徑或單詞"美國"。這樣,獲得了單詞"了 爿y力"的中文翻譯。當輸入中文的單詞"美國"的檢索字符串時,與 單詞"美國"對應的單詞信息記錄210被參照,從而識別出第一 TRIE結 構100中的與單詞"美國"的日語翻譯對應的路徑。因此,獲得了單詞 "美國"的日文翻譯。這樣,第一和第二單詞信息記錄110和2i0彼此 鏈接,從而防止在這兩種語言中翻譯信息的丟失。當單詞"7乂 U力"的同義詞"米國"存儲在第一 TRIE結構100 中時,單詞信息記錄210中的關于中文單詞"美國"的翻譯信息與這兩 種單詞鏈接。因此,能夠從中文單詞"美國"獲得日文單詞"7乂 ]J力" 和"米國"。如上所述,為了基于存儲在第一 TRIE結構100中的單詞來識別存儲 在第二 TRIE結構200中的單詞,產(chǎn)生了第一語言單詞信息記錄110。為 了基于存儲在第二 TRIE結構200中的單詞來識別存儲在第一 TRIE結構 IOO中的單詞,產(chǎn)生了第二語言單詞信息記錄210。圖6示出了單詞信息 記錄的結構。該單詞信息記錄包括字符信息300、單詞標記+子標記十 語言ID 302、單詞信息記錄ID 304、父結點ID 306、以及相鄰兄弟結點 ID 308。該字符信息300指示包含在結點中的字符的類型,諸如日本漢字、 平假名、片假名或字母表。該單詞標記+子標記+翻譯語言ID 302由一 個字節(jié)形成,并且單詞標記由兩個比特形成。如圖7所示,當單詞標記 是"0"時,對應的結點是中間結點。當單詞標記是"1"時,對應的結 點是單詞結點(顯示在從根部到該對應的結點的路徑上的信息表示單 詞)。當單詞標記是"2"時,對應的結點是發(fā)音結點(顯示在從根部到對應結點的路徑上的信息表示發(fā)音)。當單詞標記是"3"時,對應結點 是單詞發(fā)音結點(顯示在從根部到對應結點的路徑上的信息表示單詞及 其發(fā)音)。所述子標記由一個比特形成。如圖8A所示,當子標記是"0"時, 對應結點不存在任何下位結點。當子標記是"l"時,在對應結點至少還 存在一個下位結點。所述翻譯語言ID標識進行翻譯的語言。如圖8B所示,當語言ID 是"1"時,該語言是日文。當語言ID是"2"時,該語言是中文。當語 言ID是3時,該語言是英文。如圖9所示,所述單詞信息記錄ID 304包括單詞ID、發(fā)音ID、 詞性ID、優(yōu)先級等級、同義詞信息(單詞數(shù)目)、概念ID、左鏈接信息 ID、右鏈接信息ID、翻譯語言ID、翻譯ID、下一個同義詞信息記錄ID 以及備注。該單詞ID是結點ID,用于識別存儲在TRIE結構中的各單詞。 在圖4示出的第一TRIE結構中的單詞"7乂 U力"的情況下,例如,單 詞ID是存儲單詞的最后字符的結點的ID。所述發(fā)音ID指示單詞的發(fā)音, 用于區(qū)別日本漢字的發(fā)音和平假名等的發(fā)音。該詞性ID識別單詞的詞性, 諸如名稱、動詞或形容詞。所述同義詞信息指示同義詞的數(shù)目。在圖4示出的第一 TRIE結構中的單詞""Ii力"的情況下,例如,同義詞的數(shù)目是"r("米國")。所述概念ID、左鏈接信息ID、右鏈接信息ID不是必需的,但是在基于分 析進行翻譯時是有用的。所述翻譯語言ID識別用于書寫翻譯后的單詞的語言。在日文單詞 "了- li力"翻譯成中文的情況下,該翻譯語言ID是表示中文的ID。在 這種情況下,該翻譯ID是存儲中文單詞"美國"的最后字符的結點的ID。 所述下一個同義詞信息記錄ID是識別與對應單詞的翻譯同義的下一個單 詞的記錄的ID。例如,如果在中文"美國"的單詞記錄中,翻譯后的日 文單詞是"7乂 y力"并且該日文單詞的同義詞是"米國",則該同義詞 記錄ID是識別日文單詞"米國"的ID。所述備注是注釋等,但不是必需 的。
父結點ID 306是對用于識別主題單詞的結點之上的結點進行識別的 ID。該相鄰兄弟結點ID 308是與該主題結點共享相同父結點的相鄰結點 的ID。這些結點ID是TRIE結構中必需的信息,但是不會直接影響單詞 翻譯。在相似發(fā)聲單詞的情況下,這些單詞的數(shù)目可以包含在單詞信息 記錄中。在這種情況下,與單詞信息記錄對應的TRIE結構與大于一個的 單詞相關聯(lián)。如圖4所示,當存儲在第一 TRIE結構100中的單詞"T少y力"的單詞信息記錄是k時,該單詞信息記錄k包含指示單詞"7乂 y力"的從根部起的路徑的信息、以及翻譯信息(翻譯語言ID、翻譯ID、以及同 義詞信息記錄ID)。當存儲在第二 TRIE結構200中的單詞"美國"的單 詞信息記錄是h時,單詞信息記錄h包含指示單詞"美國"的從根部起 的路徑的信息以及翻譯信息。該單詞信息記錄h還包含作為同義詞信息 記錄ID的日文單詞"米國"的單詞信息記錄k+l。這樣,經(jīng)由第一和第 二單詞信息記錄,第一和第二語言的翻譯后的單詞在這兩個方向上進行 鏈接,并且能夠肯定地對任何一種語言迅速進行翻譯?,F(xiàn)在參照圖10A到圖10C描述TRIE結構的字符信息的結構。在圖 IOA中,TRIE結構中的各結點示出為由兩個字節(jié)形成的一個字符。在圖 IOB中,各語言轉換成Unicode,并且高字節(jié)(高8比特)或低字節(jié)(低 8比特)分配到各結點。從而,每個字符由一個高字節(jié)和一個低字節(jié)形成。 采用圖10B所示的結構與采用圖10A所示的結構相比較,由于TRIE結 構的水平方向上的結點的數(shù)目變得較小(256),所以檢索速度變得更高。 然而,由于深度方向上結點的數(shù)目變得更大,所以信息量增加。圖10C 所示的結構是圖IOA所示結構和圖IOB所示結構的組合。接下來描述結點ID分配。圖11示出了結點ID分配方法。在每個 TRIE結構中,首先按照深度順序執(zhí)行檢索,并且檢索號從"1"或"0" 增加。這樣,結點ID分配到各個結點。在分配完結點ID以后,如圖12' 所示,根據(jù)結點ID來排列和存儲與結點ID對應的記錄。由于按照結點 ID來排列記錄,所以與各結點ID對應的結點信息能夠被立即訪問。在這 個示例性實施方式中,僅僅獲得了翻譯,而不能夠準確獲得諸如圖9所 示的單詞的發(fā)音和詞性的單詞信息(翻譯信息)。如果期望獲得如圖9所 示的關于翻譯的準確信息,則應該采用根據(jù)第二和第三示例性實施方式 (以后描述)的單詞檢索結構和單詞信息記錄結構。接下來,描述單詞記錄存儲。當?shù)谝徽Z言單詞和第二語言單詞之間 一對一對應時,各單詞具有一個單詞信息記錄。然而,許多單詞會具有 多于一個的詞性(或含義),并且許多翻譯關系不能夠由一對一對應所表如果單詞k具有多于一個的詞性,并且詞性之一具有多于一種的翻 譯,則對單詞k需要準備多于一個的信息記錄,并且經(jīng)由指針串聯(lián)鏈接 這些記錄。然后將翻譯信息存儲在各對應記錄中。如圖13所示,關于詞 性1和翻譯1的信息存儲在第一語言的單詞k的記錄中,并且關于詞性1和翻譯2的信息存儲在經(jīng)由指針與以上記錄進行鏈接的記錄中。這里, 該指針可以是圖6所示的下一個同義詞信息記錄ID。接下來,描述單詞 選擇的規(guī)則。優(yōu)選的是,僅僅翻譯名詞、代詞、形容詞、副詞、動詞以 及特定術語。如果翻譯關系指示一對一對應,則選擇首要對應翻譯。如 果存在一對n對應(n>l),則檢查n個單詞的類屬性,并且選擇具有與 源語言的單詞相同的詞性的各單詞。如果僅僅存在具有與源語言的單詞 相同的詞性的一種翻譯,則選擇該單個單詞。如果存在具有與源語言的 單詞相同的詞性的兩個或更多個單詞,則可以根據(jù)優(yōu)先級等級來選擇可 能的翻譯,或者可以任意地選擇可能的翻譯。在中文單詞"美國"要翻譯成日文單詞"了> !J力"和"米國"的 實施例情況下,對于中文字典中的單詞"美國"產(chǎn)生兩個記錄320和322, 并且這兩個記錄320和322經(jīng)由指針彼此鏈接。在日文字典中,對單詞 "米國"產(chǎn)生記錄330,對單詞"7^ y力"產(chǎn)生記錄332。中文單詞"美國"的記錄'320包含與日文單詞"7乂 y力"相關的翻譯信息,并且中文單詞"美國"的記錄322包含與日文單詞"米國"相關的翻譯信息。日文單詞U力"和"米國"的記錄330和332與有關于中文 單詞"美國"的翻譯信息相關聯(lián),從而如圖13中的虛線所示,中文單詞 "美國"被參照。
接下來描述用于存儲單詞信息記錄的其它方法。在圖13所示的實施 例中,產(chǎn)生了相同記錄,從而使用的存儲器的量變得較大。為了節(jié)省存 儲器空間,對于單詞k僅僅使用一個信息記錄,并且基于單詞k的單個 信息記錄來識別包含與同義詞信息陣列中的單詞相關的翻譯信息的兩個 或更多個記錄。然后將最少量的翻譯信息記錄在同義詞信息陣列中。如 圖14所示,準備了第一語言的單詞k的信息記錄和同義詞信息陣列。同 義詞信息陣列中的記錄例如包括關于詞性1的翻譯2、詞性1的翻譯3、以及詞性2的翻譯1的信息。同義詞信息陣列中的各記錄包括最少量的 翻譯信息,該最少量的翻譯信息為優(yōu)先級等級、概念ID、語言ID、翻譯 ID以及下一個同義詞信息記錄指針。在如圖14所示基于中文單詞"美國"檢索日文單詞的情況下,為中 文單詞"美國"創(chuàng)建了記錄320,并且創(chuàng)建了要被包含在同義詞信息陣列 中的記錄324。根據(jù)記錄320,日文單詞"米國"被參照,根據(jù)同義詞信 息陣列中的記錄324,日文單詞"7少y力"被參照。接下來,描述了單詞選擇的規(guī)則。優(yōu)選的是,僅僅翻譯名詞、代詞、 形容詞、副詞、動詞和特定術語。如果翻譯關系指示一對一對應,則選 擇該單個對應單詞。如果存在一對n對應(n〉1),則檢查n個單詞的類 屬性,并且可以從具有與源語言的單詞相同的詞性的單詞一個接一個地 選擇出可能的翻譯?;蛘?,可以任意地選擇可能的翻譯。圖15是單詞翻譯裝置的操作的流程圖。首先,當輸入了作為源語言 的文本句子的分析結果的單詞或由用戶指定的單詞時(步驟SIOI), CPU 38識別源語言的類型(步驟S102)。 CPU38然后選擇對應于識別出的語 言的雙語對照字典的TRIE結構(步驟S103),并且將輸入單詞與存儲在 TRIE結構中的單詞進行比較(步驟S104)。如果在TRIE結構中存在對 應單詞(步驟S105),則CPU38參照對應單詞的單詞信息記錄(步驟S106) 并且根據(jù)單詞信息記錄從被參照的目標語言的TRIE結構中提取單詞(步 驟S107)。提取出的單詞由目標語言文本句子創(chuàng)建單元22進行顯示(步 驟S簡)。如果輸入的單詞不存在(步驟S105),則將翻譯失敗輸出到該顯示
器。在這種情況下,通過人類翻譯員將恰當?shù)姆g附到該輸入的單詞上。 然后該翻譯被登記在雙語對照字典中,并且由學習功能進行學習(步驟S108)。接下來將描述本發(fā)明的第二示例性實施方式。該第二示例性實施方式有關多語對照翻譯或N種語言之間的單詞翻譯。圖16示出了在多語對 照翻譯中使用的多語對照字典的結構。如圖16所示,創(chuàng)建了第--語言的 TRIE結構,第二語言的TRIE結構,第N語言的TRIE結構,并且存儲 了各種語言的單詞檢索TRIE。同時,創(chuàng)建了第一語言單詞信息記錄410、 第二語言單詞信息記錄510和第N語言單詞信息記錄610以匹配各個 TRIE結構。
各單詞信息記錄包含關于多于一種語言的翻譯信息。例如,日文的 單詞信息記錄包含存儲英文翻譯信息的記錄和存儲中文翻譯信息的記 錄。采用這種結構,能夠基于日文單詞來檢測到英文或中文的單詞。用 戶能夠發(fā)出關于是要查找英文單詞還是要查找中文單詞的指令。還能夠 執(zhí)行從英文到日文的單詞翻譯以及從中文到日文的單詞翻譯。在這個示 例性實施方式中用于存儲單詞信息記錄的方法可以與圖13或14所示的 方法相同。
如上所述,當為各種語言創(chuàng)建了單詞檢索TRIE結構和單詞信息記錄 時,能夠在幾種語言之間執(zhí)行單詞翻譯。因此,能夠實現(xiàn)較高的可用性。
接下來,將描述本發(fā)明的第三示例性實施方式。圖17示出了要在第 三示例性實施方式中使用的多語對照單詞翻譯字典300的結構。該多語 對照單詞翻譯字典300形成有為第一到第N語言設置的第一語言單詞檢 索字典312-1到第N語言單詞檢索字典312-N (以下,在適當?shù)那闆r下, 將該第一語言單詞檢索字典312-1到第N語言單詞檢索字典312-N集總 地稱作"單詞檢索字典312")、以及為第一語言到第N語言設置的第一 語言單詞翻譯鏈接信息314-1到第N語言單詞翻譯鏈接信息(以下,在 適當?shù)那闆r下,將第一語言單詞翻譯鏈接信息314-1到第N語言單詞翻 譯鏈接信息314-N集總地稱作"單詞翻譯鏈接信息314")。各單詞檢索字典312具有基于哈希函數(shù)或TRIE結構的結構。該單詞
翻譯鏈接信息314指示一種語言的各單詞和另外語言的各對應單詞之間 的關聯(lián)。該單詞翻譯鏈接信息314具有基于連續(xù)結構的結構或基于雙連 續(xù)結構的結構,該連續(xù)結構僅僅具有由單詞信息記錄形成的單詞信息陣列列表,該雙連續(xù)結構具有由單詞信息記錄形成的單詞信息陣列列表和 由同義詞信息記錄形成的同義詞陣列列表。圖18是多語對照單詞翻譯字典300的第一實施例結構的概念圖。在 圖18所示的實施例結構中,各單詞檢索字典基于TRIE結構。當在兩種 語言之間進行翻譯時,第一語言單詞檢索字典具有第一語言單詞檢索 TRIE結構(第一TRIE結構),并且第一語言單詞翻譯鏈接^f言息由與包含 在第一TRIE結構中的單詞有關的信息(單詞信息記錄)形成。該單詞信 息記錄包含指示與第二語言的單詞關聯(lián)的指針。同樣,第二語言單詞檢 索字典具有第二語言單詞檢索TRIE結構(第二TRIE結構),并且第二 語言單詞翻譯鏈接信息由與包含在第二 TRIE結構中的單詞相關的信息 (單詞信息記錄)形成。該單詞信息記錄包含指示與第一語言的單詞關 聯(lián)的指針。在圖18中,第一語言的單詞k與第二語言的單詞h+l是翻 譯關系,并且彼此關聯(lián)。在單詞存在兩個或更多個詞性并且詞性存在兩 個或更多個翻譯的情況下,針對各個詞性和各個翻譯準備該單詞的單詞 信息記錄,并且該單詞信息記錄通過包含在單詞信息記錄中的指針彼此 鏈接。圖6是多語對照單詞翻譯字典300的第二實施例結構的概念圖。在 圖19所示的實施例結構中,各單詞檢索字典基于哈希函數(shù),并且該單詞 翻譯鏈接信息基于連續(xù)結構。在基于哈希函數(shù)的這個結構中,在兩種語言之間要執(zhí)行翻譯的情況下,該第一語言單詞檢索字典具有包含指針信息的單詞列表,該指針信 息與第一語言的單詞和與這些單詞對應的單詞翻譯信息字典中的單詞信息記錄有關。同樣,該第二語言單詞檢索字典具有包含指針信息的單詞 列表,該指針信息與第二語言的單詞以及與這些單詞對應的該單詞翻譯 信息字典中的單詞信息記錄有關。與第一語言和第二語言有關的單詞翻 譯鏈接信息與圖18所示的信息結構相同,因此,這里省去了對其的解釋。 以后將詳細描述哈希函數(shù)單元320。圖20示出了基于哈希函數(shù)的單詞檢索字典的結構。該哈希函數(shù)單元 320將對應語言的所有字符碼轉換成連續(xù)字符碼。第一字符列表包含與單詞(其為由該哈希函數(shù)單元320從字符碼轉換出來的多個字符)的第 一字符有關的信息、從該第一字符開始的單詞的數(shù)目、以及與和從該第 一字符開始的單詞對應的該單詞列表中的記錄有關的指針信息。該單詞 列表包含與各單詞有關的信息、單詞發(fā)音信息、以及與這些單詞對應的 單詞翻譯鏈接信息中的單詞信息的記錄ID。當要執(zhí)行單詞翻譯時,該單詞指導翻譯引擎20識別與輸入的單詞的 第一字符對應的第-一字符列表中的記錄?;谧R別出的記錄中的單詞的 數(shù)目和關于單詞列表的指針信息,該單詞指導翻譯引擎20檢測與從輸入 單詞的第一字符開始的單詞對應的單詞列表中的記錄。該單詞指導翻譯 引擎20然后將輸入的單詞與所有識別出的記錄中的單詞信息相比較,并 且識別該輸入單詞。接下來描述要由單詞指導翻譯引擎20執(zhí)行的單詞翻譯的實施例。當 對單詞翻譯鏈接信息采用陣列結構基礎時,各單詞信息記錄具有圖21A 所示的結構。各單詞信息記錄由單詞信息記錄ID唯一識別,并且包含主 題單詞的單詞ID、發(fā)音ID、詞性ID、優(yōu)先級等級、同義詞信息、單詞/ 語塊識別標記、區(qū)域分類ID、概念ID、左鏈接信息ID、右鏈接信息ID、 翻譯語言ID、翻譯信息記錄ID、下一個同義詞信息記錄ID以及備注。 如果不存在與下一個同義詞對應的單詞信息記錄,則下一個同義詞信息 記錄ID是"0"。所述翻譯語言ID包括圖21B所示的語言ID和圖21C 所示的子標記。'這些與圖8A-和8B所示的語言ID和子標記相同。在對單詞翻譯鏈接信息采用雙陣列結構基礎的情況下,各單詞信息 記錄具有圖22所示的結構。各單詞信息記錄由單詞信息記錄ID唯一識 別,并且包含主題單詞的單詞ID、發(fā)音ID、詞性ID、優(yōu)先級等級、同 義詞信息、單詞/語塊識別標記、區(qū)域分類ID、概念ID、左鏈接信息ID、 右鏈接信息ID、同義詞信息記錄ID以及備注。在對單詞翻譯鏈接信息采 用雙陣列結構基礎的情況下,各同義詞信息記錄具有圖23所示的結構。
各同義詞信息記錄由同義詞信息記錄ID唯一識別,并且包含主題翻譯的語言ID、父單詞的單詞信息記錄ID、主題翻譯的同義詞信息記錄ID、 以及下一個同義詞的同義詞信息記錄ID。如果不存在與下一個同義詞對 應的同義詞信息記錄,則下一個同義詞的同義詞信息記錄ID是"0"。圖24示出了在對單詞翻譯鏈接信息采用陣列結構基礎的情況下的 在曰文和中文之間進行單詞翻譯使用的雙語對照字典的結構。在日文單 詞檢索字典的TRIE結構中,日文單詞"7乂 U力"和作為單詞"7乂 y 力"的同義詞的日文單詞"米國"被存儲。在中文單詞檢索字典的TRIE 結構中,中文單詞"美利堅合眾國"和作為單詞"美利堅合眾國"的同 義詞的中文單詞"美國"被存儲。單詞!J力"的中文書寫如下美利堅合眾國在這種情況下,日文單詞翻譯鏈接信息包含與單詞"7乂y力"對應的、單詞信息記錄ID為"330"的單詞信息記錄和單詞信息記錄ID 為"333 "的單詞信息記錄,與單詞"米國"對應的、單詞信息記錄ID 為"444"的單詞信息記錄和單詞信息記錄ID為"451"的單詞信息記錄。該中文單詞翻譯鏈接信息包含與單詞"美利堅合眾國"對應的、 單詞信息記錄ID為"100"的單詞信息記錄和單詞信息記錄ID為"101" 的單詞信息記錄,以及與單詞"美國"對應的單詞信息記錄ID為"400" 的單詞信息記錄和單詞信息記錄ID為"541"的單詞信息記錄。日文單 詞"7乂 y力"與日文單詞"米國"是同義詞,并且中文單詞"美利堅 合眾國"與中文單詞"美國"是同義詞。日文單詞翻譯鏈接信息中的ID為"330"的單詞信息記錄包含日 文主題單詞y力"的單詞ID "5"、作為翻譯語言的中文語言的語 言ID "2"、作為翻譯語言的中文單詞"美利堅合眾國"的單詞信息記錄 的ID "100"、以及下一個同義詞的單詞信息記錄的ID "333"。日文單詞 翻譯鏈接信息中的ID為"333"的單詞信息記錄包含主題單詞"7乂 y力"的單詞ID "5"、作為翻譯語言的中文語言的語言ID "2"、"作為 翻譯語言的中文的單詞"美利堅合眾國"的同義詞的中文單詞"美國" 或作為日文單詞"7少U力"的同義詞的日文單詞"米國"的翻譯的翻
譯語言的中文單詞"美國"的單詞信息記錄的ID "541"、以及指示不存 在下一個同義詞單詞的單詞信息記錄的下一個同義詞單詞信息記錄ID "0"。另外,日文單詞翻譯鏈接信息中的ID為"444"的單詞信息記錄包 含日文主題單詞"米國"的單詞ID "7"、作為翻譯語言的中文語言的 語言ID"2"、作為翻譯語言的中文單詞"美國"的單詞信息記錄的ID"400"、 以及下一個同義詞單詞的單詞信息記錄的ID "451"。日文單詞翻譯鏈接 信息中的ID為"451"的單詞信息記錄包含主題單詞"米國"的單詞 ID "7"、作為翻譯語言的中文語言的語言ID "2"、作為翻譯語言的中文 單詞"美國"的同義詞的中文單詞"美利堅合眾國"或作為作為日文單詞"米國"的同義詞的日文單詞"7^ y力"的翻譯的作為翻譯語言的中文單詞"美利堅合眾國"的單詞信息記錄的ID "101"、以及指示不存 在下一個同義詞的單詞信息記錄的下一個同義詞信息記錄ID "0"。同時、中文單詞翻譯鏈接信息中的ID為"100"的單詞信息記錄包 含中文主題單詞"美利堅合眾國"的單詞ID "7"、作為翻譯語言的日 文語言的語言ID "1"、作為翻譯語言的日文單詞"TV li力"的單詞信 息記錄的ID"330"、以及下一個同義詞的單詞信息記錄的ID "101"。中 文單詞翻譯鏈接信息中的ID為"101"的單詞信息記錄包含主題單詞 "美利堅合眾國"的單詞ID "7"、作為翻譯語言的日文的語言ID "1"、 作為翻譯語言日文的單詞y力"的同義詞的單詞"米國"或作為 作為中文單詞"美利堅合眾國"的同義詞的中文單詞"美國"的翻譯的 作為翻譯語言日文的單詞"米國"的單詞信息記錄的ID "451"、以及指 示不存在下一個同義詞的單詞信息記錄的下一個同義詞信息記錄I.D"O"。另外,中文單詞翻譯鏈接信息中的ID為"400"的單詞信息記錄包 含中文主題單詞"美國"的單詞ID "9"、作為翻譯語言的日文的語言 ID "1"、作為翻譯語言日文的單詞"USA"的單詞信息記錄的ID "444"、 以及下一個同義詞的單詞信息記錄的ID "541"。中文單詞翻譯鏈接信息 中的ID為"541"的單詞信息記錄包含中文主題單詞"美國"的單詞 ID "7"、.作為翻譯語言的日文的語言ID "1"、作為翻譯語言日文的單詞
"米國"的同義詞的單詞"7少y力"或作為中文單詞"美國"的同義 詞的中文單詞"美利堅合眾國"的翻譯的作為翻譯語言的日文單詞"77< y力"的單詞信息記錄的ID "333"、以及指示不存在下一個同義詞的 單詞信息記錄的下一個同義詞信息記錄ID "0"。如上所述,日文單詞和中文單詞通過日文和中文單詞翻譯鏈接信息 彼此鏈接。當將中文單詞"美利堅合眾國"翻譯成日文時,單詞指導翻 譯引擎20檢測中文單詞翻譯鏈接信息中包含中文單詞"美利堅合眾國" 的單詞ID "7"'和日文的語言ID "1"的ID為"100"的單詞信息記錄。 該單詞指導翻譯引擎20然后查找作為包含在ID為"100"的單詞信息記 錄中的下一個同義詞的單詞信息記錄的ID為"101"的單詞信息記錄。 基于與作為包含在ID為"100"的單詞信息記錄中的翻譯的日文單詞對 應的單詞信息記錄ID"330",該單詞指導翻譯引擎20査找日文單詞翻譯 鏈接信息中的ID為"330"的單詞信息記錄。另外,基于與作為包含在 ID為"101"中的單詞信息記錄中的翻譯的日文單詞對應的單詞信息記錄 ID "451",該單詞指導翻譯引擎20查找日文單詞翻譯鏈接信息中的ID 為"451"單詞信息記錄?;诎贗D為"330"的單詞信息記錄中的 單詞ID"5",該單詞指導翻譯引擎20從日文單詞檢索字典中提取單詞"了 > !J力"。基于包含在ID為"451"的單詞信息記錄中的單詞ID"7",該 單詞指導翻譯引擎20從日文單詞檢索字典中提取單詞"米國"。通過這 種操作,中文單詞"美利堅合眾國"翻譯成了日文單詞"7乂 !i力"和 "米國"。圖25示出了在對單詞翻譯鏈接信息釆用雙陣列結構基礎的情況下 的要在日文和中文之間的單詞翻譯中使用的雙語對照字典的結構。由于 曰文和中文單詞檢索字典的TRIE結構與圖23所示的結構相同,所以這 里省去了對其的描述。該曰文單詞翻譯鏈接信息包含與單詞"了> U力"對應的單詞信 息記錄ID為"330"的單詞信息記錄和與單詞"米國"對應的單詞信息 記錄ID為"444"的單詞信息記錄。該日文單詞翻譯鏈接信息還包含ID 為"01"和"02"并且將ID為"330"的單詞信息記錄作為父記錄的同 義詞信息記錄以及ID為"14"和"15"并且將ID "333"的單詞信息記 錄作為父記錄的同義詞信息記錄。
該中文單詞翻譯鏈接信息包含與單詞"美利堅合眾國"對應的單詞信息記錄ID為"100"的單詞信息記錄以及與單詞"美國"對應的單 詞信息記錄ID為"211"的單詞信息記錄。該中文單詞翻譯鏈接信息還 包含ID為"04"和"05"并且將ID為"100"的單詞信息記錄作為父 記錄的同義詞信息記錄、以及ID為"214"和"215"并且將ID為"211" 的單詞信息記錄作為父記錄的同義詞信息記錄。
日文單詞翻譯鏈接信息中的ID為"330"的單詞信息記錄包含日 文主題單詞"7乂 y力"的單詞ID "5"、作為子記錄的同義詞信息記錄 的ID "01"。該ID為"01"的同義詞信息記錄包含作為翻譯語言的中 文的語言ID"2"、作為父記錄的單詞信息記錄的ID"330"、與作為翻譯 語言的中文的該主題單詞的同義詞的中文單詞"美國"對應的單詞信息 記錄的子記錄(即同義詞信息記錄)的ID "214"、以及下一個同義詞的 同義詞信息記錄的ID "02"。 ID為"02"的同義詞信息記錄包含作為 翻譯語言的中文的語言ID"2"、作為父記錄的單詞信息記錄的ID"330"、 與作為翻譯語言的中文單詞"美利堅合眾國"對應的該單詞信息記錄的 子記錄(即同義詞信息記錄)的ID"05"、以及指示不存在下一個同義詞 的同義詞信息記錄的下一個同義詞信息記錄ID "0"。
日文單詞翻譯鏈接信息中的ID為"333"單詞信息記錄包含日文 主題單詞"米國"的單詞ID "7"、以及作為子記錄的同義詞信息記錄的 ID "15"。 ID為"15"的同義詞信息記錄包含作為翻譯語言的中文的語 言ID"2"、作為父記錄的單詞信息記錄的ID "333"、與作為翻譯語言的 中文的該主題單詞的同義詞的中文單詞"美利堅合眾國"對應的單詞信 息記錄的子記錄(即同義詞信息記錄)的ID"04"、以及下一個同義詞的 同義詞信息記錄的ID "15"。 ID為"15"的同義詞信息記錄包含作為 翻譯語言的中文的語言ID"2"、作為父記錄的單詞信息記錄的ID"333"、 與作為翻譯語言的中文單詞"美國"對應的單詞信息記錄的子記錄(即 同義詞信息記錄)的ID "215"、以及指示不存在下一個同義詞的同義詞
信息記錄的下一個同義詞信息記錄ID "0"。同時,中文單詞翻譯鏈接信息中的ID為"100"的單詞信息記錄包 含中文主題單詞"美利堅合眾國"的單詞ID "7"、以及作為子記錄的同義詞信息記錄的ID "04"。 ID為"04"的同義詞信息記錄包含作為 翻譯語言的日文的語言ID "1"、父單詞信息記錄的ID"100"、與作為翻 譯語言的日文的該主題單詞的同義詞日文單詞"米國"對應的單詞信息 記錄的子記錄(即同義詞信息記錄)的ID"14"、以及下一個同義詞的同 義詞信息記錄ID "05"。 ID為"05"的同義詞信息記錄包含作為翻譯 語言的日文的語言ID "1"、父單詞信息記錄的ID "100"、與作為翻譯 語言的口文的單詞"7乂 y力"對應的單詞信息記錄的子記錄(即同義 詞信息記錄)的ID"02"、以及指示不存在下一個同義詞的同義詞信息記 錄的下一個同義詞信息記錄ID "0"。中文單詞翻譯鏈接信息中的ID為"211"的單詞信息記錄包含中 文主題單詞"美國"的單詞ID "9"、作為子記錄的同義詞信息記錄的ID "214"。 ID為"214"的同義詞信息記錄包含作為翻譯語言的日文的語 -言ID "1"、父單詞信息記錄的ID "211"、與作為翻譯語言的日文的該主 題單詞的日文同義詞單詞"了乂 U力"對應的單詞信息記錄的子記錄(即 同義詞信息記錄)的ID"01"、以及下一個同義詞單詞的同義詞信息記錄 的ID "215"。 ID為"215"的同義詞信息記錄包含作為翻譯語言的日 文的語言ID "1"、父單詞信息記錄的ID "211"、與作為翻譯語言的曰文 單詞"米國"對應的單詞信息記錄的子記錄(即同義詞信息記錄)的ID "15"、以及指示不存在下一個同義詞的同義詞信息記錄的下一個同義詞 信息記錄ID "0"。如上所述,日文單詞和中文單詞通過日文和中文單詞翻譯鏈接信息 相互鏈接。當中文單詞"美利堅合眾國"翻譯成日文時,該單詞指導翻 譯引擎20查找中文單詞翻譯鏈接信息中的包含中文單詞"美利堅合眾國" 的單詞ID "7"的ID為"100"的單詞信息記錄。基于包含在ID為"100" 的單詞信息記錄中的同義詞信息記錄ID "04",該單詞指導翻譯引擎20 查找ID為"04"的同義詞信息記錄。基于與包含在ID為"04"的同義
詞信息記錄中的下一個同義詞單詞對應的同義詞信息記錄ID"05",該單詞指導翻譯引擎20查找ID為"05"的同義詞信息記錄?;谠谡业降?ID為"04"和"05"的同義詞信息記錄中包含的、同義詞信息記錄(其 為與作為翻譯的日文單詞對應的單詞信息記錄的子記錄)的ID "02"和"14",該單詞指導翻譯引擎20查找作為與日文單詞對應的單詞信息記 錄的子記錄的ID為"02"和"04"的同義詞信息記錄。基于包含在找到 的ID為"02"和"04"的同義詞信息記錄中的父單詞信息記錄ID "330" 和"333",該單詞指導翻譯引擎20查找ID為"330"和ID為"333"的 單詞信息記錄?;诎贗D為"330"的單詞信息記錄中的單詞ID"5", 該單詞指導翻譯引擎20從日文單詞檢索字典提取單詞"7乂 U力"。基 于包含在JD為"451"的單詞信息記錄中的單詞ID "7",該單詞指導翻 譯引擎20從日文單詞檢索字典提取單詞"米國"。通過這種操作,中文 單詞"美利堅合眾國"被翻譯成日文單詞"7乂 ]i力"和"米國"。圖26示出了在對單詞翻譯鏈接信息采用陣列結構基礎的情況下的 要在日文和英文之間的單詞翻譯中使用的雙語對照字典的結構。在日文 單詞檢索字典的TRIE結構中,存儲了日文單詞"7^ !J力"和作為單詞"了> y力"的同義詞的日文單詞"米國"。在英文單詞檢索字典的TRIE 結構中,存儲了單詞"America (美國)"和作為單詞"America"的同義 詞的單詞"USA"。在這種情況下,日文單詞翻譯鏈接信息包含與日文單詞"7乂li 力"對應的單詞信息記錄ID為"340"的單詞信息記錄、單詞信息記錄 ID為"343"的單詞信息記錄,與日文單詞"米國"對應的單詞信息記錄 ID為"464"的單詞信息記錄、單詞信息記錄ID為"471"的單詞信息記 錄。該英文單詞翻譯鏈接信息包含與單詞"America"對應的單詞信息 記錄ID為"200"的單詞信息記錄、單詞信息記錄ID為"201"的單詞 信息記錄,與單詞"USA"對應的單詞信息記錄ID為"500"的單詞信 息記錄以及單詞信息記錄ID為"641"的單詞信息記錄。日文單詞"7 乂 y力"與日文單詞"米國"同義,并且英文單詞"America"也與英文
單詞"USA"同義。日文單詞翻譯鏈接信息中的ID為"330"的單詞信息記錄包含日文主題單詞"了> U力"的單詞ID "5"、作為翻譯語言的英文的語言ID "3"、作為翻譯語言的英文的單詞"America"的單詞信息記錄的ID"200"、 以及下一個同義詞的單詞信息記錄的ID "343"。日文單詞翻譯鏈接信息 中的ID為"343"的單詞信息記錄包含日文主題單詞"7^ y力"的 單詞ID "5"、作為翻譯語言的英文的語言ID"3"、作為翻譯語言的英文 單詞"America"的同義詞的單詞"USA"或作為日文單詞"7少U力" 的同義詞的日文單詞"米國"的翻譯的英文單詞"USA"的單詞信息記 錄的ID "641"、以及指示不存在下一個同義詞的單詞信息記錄的下一個 同義詞信息記錄ID "0"。另外,日文單詞翻譯鏈接信息中的ID為"464"單詞信息記錄包含 曰文主題單詞"米國"的單詞ID"7"、作為翻譯語言的英文的語言ID"3"、 作為翻譯語言的英文單詞"USA"的單詞信息記錄的ID "500"、以及下 一個同義詞的單詞信息記錄的ID "471"。日文單詞翻譯鏈接信息中的ID 為"471"中的單詞信息記錄包含日文主題單詞"米國"的單詞ID "7"、 作為翻譯語言的英文的語言ID "3"、作為翻譯語言的英文的單詞"USA" 的同義詞的英文單詞"America"的(或作為曰文的單詞"米國"的同義 詞的日文單詞"7^ !i力"的翻譯的)作為翻譯語;t的英文單詞"America" 的單詞信息記錄的ID "201"、以及指示不存在下一個同義詞的單詞信息 記錄的下一個同義詞信息記錄ID "0"。同時,英文單詞翻譯鏈接信息中的ID為"200"的單詞信息記錄包 含英文主題單詞"America"的單詞ID"8"、作為翻譯語言的日文的語 言ID "1"、作為翻譯語言的日語的單詞"了乂 !J力"的單詞信息記錄的 ID "340"、以及下一個同義詞的單詞信息記錄的ID "201"。英文單詞翻 譯鏈接信息中的ID為"201"的單詞信息記錄包含英文主題單詞 "America"的單詞ID "8"、作為翻譯語言的日文的語言ID "1"、作為翻譯語言的日文單詞"7乂 y力"的同義詞的單詞"米國"的(或作為英文單詞"America"的同義詞的英文單詞"USA"的翻譯的)作為翻譯
語言的日文單詞"米國"的單詞信息記錄的ID "471"、以及指示不存在 下一個同義詞的單詞信息記錄的下一個同義詞信息記錄ID "0"。另外,英文單詞翻譯鏈接信息中的ID為"500"的單詞信息記錄包 含英文主題單詞"USA"的單詞ID"11"、作為翻譯語言的日文的語言 ID "1"、作為翻譯語言的日文單詞"米國"的單詞信息記錄的ID "464"、 以及下一個同義詞的單詞信息記錄的ID "641"。英文單詞翻譯鏈接信息 中的ID為"641"的單詞信息記錄包含英文主題單詞"USA"的單詞 ID "11"、作為翻譯語言的日文的語言ID"l"、作為翻譯語言的日文單詞 "米國"的同義詞的單詞"7乂 !i力"的(或作為英文單詞"USA"的 同義詞的英文單詞"America"的翻譯的作為翻譯語言的日文單詞 U力")的單詞信息記錄的ID"343"、以及指示不存在下一個同義詞的單 詞信息記錄的下一個同義詞信息記錄ID "0"。如上所述,日文單詞和英文單詞通過日文和英文單詞翻譯鏈接信息 彼此鏈接。當英文單詞"America"翻譯成日文時,單詞指導翻譯引擎20 在英文單詞翻譯鏈接信息中査找包含英文單詞"America"的單詞ID"8"、 以及日文語言的語言ID"1"的單詞信息記錄(其ID為"200")。該單詞 指導翻譯引擎20然后檢測ID為"201"的單詞信息記錄,該ID為"201" 的單詞信息記錄是包含在ID為"200"的單詞信息記錄中的下一個同義 詞的單詞信息記錄?;谂c作為包含在ID為"200"的單詞信息記錄中 的翻譯的日文單詞對應的單詞信息記錄ID "340",單詞指導翻譯引擎20 檢測日文單詞翻譯鏈接信息中的ID為"340"的單詞信息記錄。另外, 基于與包含在ID為"201"的單詞信息記錄中的作為翻譯的日文單詞對 應的單詞信息記錄ID "471 ",單詞指導翻譯引擎20檢測日文單詞翻譯鏈 接信息中的ID為"471"的單詞信息記錄。基于包含在ID為"340"的 單詞信息記錄中的單詞ID"5",單詞指導翻譯引擎20從日文單詞檢索字 典中提取單詞"7乂 ]j力"?;诎贗D為"471"的單詞信息記錄中 的單詞ID "7",單詞指導翻譯引擎20從日文單詞檢索字典提取單詞"米 國"。通過這種操作,英文單詞"America"翻譯成日文單詞"7乂 U力" 和"米國"。
圖27示出了在對單詞翻譯鏈接信息采用雙陣列結構基礎的情況下, 單詞指導翻譯引擎20在日文和英文之間的單詞翻譯中使用的雙語對照字典的結構。由于日文和英文單詞檢索字典的TRIE結構與圖23所示的結 構相同,所以這里省去了對其的描述。日文單詞翻譯鏈接信息包含與單詞"7乂 U力"對應的單詞信息 記錄ID為"331"的單詞信息記錄、與單詞"米國"對應的單詞信息記 錄ID為"334"的單詞信息記錄。該日文單詞翻譯鏈接信息還包含ID 為"03"和"04"并且以ID為"331"的單詞信息記錄為父記錄的同義 詞信息記錄、以及ID為"16"和"17"并且以ID為"334"的單詞信息 記錄為父記錄的同義詞信息記錄。該英文單詞翻譯鏈接信息包含與單詞"America"對應的單詞信息 記錄ID為"101"的單詞信息記錄和與單詞"USA"對應的單詞信息記 錄ID為"212"的單詞信息記錄。該英文單詞翻譯鏈接信息還包含ID 為"06"和"07"并且以ID為"101"的單詞信息記錄為父記錄的同義 詞信息記錄、和ID為"216"和"217"并且以ID為"212"的單詞信息 記錄為父記錄的同義詞信息記錄。曰文單詞翻譯鏈接信息中的ID為"331"的單詞信息記錄包含曰 文主題單詞"7乂 y力"的單詞ID "5"、以及作為子記錄的同義詞信息 記錄的ID "03"。 ID為"03"的同義詞信息記錄包含作為翻譯語言的 英文的語言ID"3"、作為父記錄的單詞信息記錄的ID "331"、與英文單 詞"USA"(其為作為翻譯語言的該英文主題單詞的同義詞)對應的單詞 信息記錄的子記錄(即同義詞信息記錄)的ID "216"、以及下一個同義 詞的同義詞信息記錄的ID"04"。該ID為"04"的同義詞信息記錄包含 作為翻譯語言的英文的語言ID "3"、作為父記錄的單詞信息記錄的ID "331"、作為與翻譯語言的英文單詞"America"對應的單詞信息記錄的 子記錄的同義詞信息記錄的ID "07"、以及指示不存在下一個同義詞的同 義詞信息記錄的下一個同義詞信息記錄ID "0"。曰文單詞翻譯鏈接信息中的ID為"334"的單詞信息記錄包含日 文主題單詞"米國"的單詞ID "7"、以及作為子記錄的同義詞信息記錄 的ID "16。" ID為"16"的同義詞信息記錄包含作為翻譯語言的英文的語言ID "3"、作為父記錄的單詞信息記錄的ID"334"、作為與英文單 詞"America"(其為翻譯語言的該英文主題單詞的同義詞)對應的單詞 信息記錄的子記錄的同義詞信息記錄的ID"06"、以及下一個同義詞的同 義詞信息記錄的ID "17。"該ID為"17"的同義詞信息記錄包含作為 翻譯語言的英文的語言ID "3"、作為父記錄的單詞信息記錄的ID "334"、 作為與作為翻譯語言的英文單詞"USA"對應的單詞信息記錄的子記錄 的同義詞信息記錄的ID "217"、以及指示不存在下一個同義詞的同義詞 信息記錄的下一個同義詞信息記錄ID "0"。同時,英文單詞翻譯鏈接信息中的ID為"101"的單詞信息記錄包 含英文主題單詞"America"的單詞ID"8"、以及作為子記錄的同義詞 信息記錄的ID "06"。 ID為"06"的同義詞信息記錄包含作為翻譯語 言的日文的語言ID" 1 "、父單詞信息記錄的ID" 101 "、與日文單詞"USA" (其為翻譯語言的該日文主題單詞的同義詞)對應的單詞信息記錄的子 記錄(即同義詞信息記錄)的ID"16"、以及下一個同義詞的同義詞信息 記錄的ID "07"。該ID為"07"的同義詞信息記錄包含作為翻譯語言 的日文的語言ID"1"、父單詞信息記錄的ID "101"、與作為翻譯語言的 曰文單詞"America"對應的單詞信息記錄的子記錄(即同義詞信息記錄) 的ID "04"、以及指示不存在下一個同義詞的同義詞信息記錄的下一個同 義詞信息記錄ID "0"。英文單詞翻譯鏈接信息中的ID為"212"的單詞信息記錄包含英 文主題單詞"USA"的單詞ID "11"、以及作為子記錄的同義詞信息記錄 的ID "216"。該ID為"216"的同義詞信息記錄包含作為翻譯語言的 曰文的語言ID "1"、父單詞信息記錄的ID "212"、與日文單詞"7乂 U 力"(即作為翻譯語言的該日文主題單詞的同義詞)對應的單詞信息記錄 的子記錄(即同義詞信息記錄)的ID"03"、以及下一個同義詞的同義詞 信息記錄的ID "217"。該ID為217的同義詞信息記錄包含作為翻譯語 言的日文的語言ID "1"、父單詞信息記錄的ID "212"、作為與作為翻譯 語言的日文單詞"USA"對應的單詞信息記錄的子記錄的同義詞信息記
錄的ID "17"、以及指示不存在下一個同義詞的同義詞信息記錄的下一個同義詞信息記錄ID "0"。如上所述,日文單詞和英文單詞通過日文和英文單詞翻譯鏈接信息 彼此鏈接。當英文單詞"America"翻譯成日文時,該單詞指導翻譯引擎 20査找英文單詞翻譯鏈接信息中的包含英文單詞"America"的單詞ID"7"的單詞信息記錄(其ID為"101")?;诎贗D為"101"的單 詞信息記錄中的同義詞信息記錄ID "06",該單詞指導翻譯引擎20査找 ID為"06"的同義詞信息記錄?;谂c包含在ID為"06"的同義詞信息 記錄中的下一個同義詞對應的同義詞信息記錄ID"07",該單詞指導翻譯 引擎20查找ID為"07"的同義詞信息記錄?;谂c包含在找到的ID為"06"和"07"的同義詞信息記錄中的作為翻譯的日文單詞對應的單詞 信息記錄的子記錄的同義詞信息記錄ID "04"和"16",該單詞指導翻譯 引擎20査找作為與日文單詞對應的單詞信息記錄的子記錄的ID為"04" 和"16"的同義詞信息記錄?;诎谡业降腎D為"04"和"06"的 同義詞信息記錄中的父單詞信息記錄ID "331"和"334",該單詞指導翻 譯引擎20檢測ID為"331"和ID為"334"的單詞信息記錄?;诎?在ID為"331"的單詞信息記錄中的單詞ID "5",該單詞指導翻譯引擎 20從日文單詞檢索字典提取單詞"7乂 !i力"。基于包含在ID為"334" 的單詞信息記錄中的單詞ID "7",該單詞指導翻譯引擎20從日文單詞檢 索字典提取單詞"米國"。通過這種操作,英文單詞"America"被翻譯 成了日文單詞""U力"和"米國"。該單詞指導翻譯引擎20將通過上述翻譯過程獲得的單詞輸出到目 標語言文本句子創(chuàng)建單元22。如果存在兩種或更多種翻譯,則單詞指導 翻譯引擎20比較源語言的主題單詞的詞性屬性和每種翻譯的詞性屬性, 并且可以僅僅輸出這些種翻譯中的具有與源語言的主題單詞相同的詞性 屬性的翻譯。如果存在具有與源語言的主題單詞相同的詞性屬性的兩種 或更多種翻譯,則單詞指導翻譯引擎20可以任意選擇并且輸出其中一種 翻譯。如果不存在作為翻譯結果的單詞,則單詞指導翻譯引擎20將源語 言的主題單詞輸出到目標語言文本句子創(chuàng)建單元22?;诟鬏斎雴卧~和
各翻譯,單詞指導翻譯引擎20能夠從外部知識數(shù)據(jù)庫(未示出)獲得多 種信息,諸如統(tǒng)計信息和語法信息。
如上所述, 一種語言的單詞與另外語言的單詞通過單詞翻譯鏈接信 息進行鏈接。因此,能夠在兩種語言或三種語言或更多種語言之間進行 翻譯。
盡管已經(jīng)顯示和描述了本發(fā)明的一些示例性實施方式,但是本發(fā)明 不限于這些實施例,并且在不脫離本發(fā)明的原理和精神的情況下可以對 這些實施方式進行改變,本發(fā)明的范圍由權利要求限定。
根據(jù)本發(fā)明的單詞翻譯裝置可以用于補充翻譯存儲器引擎、基于句 型的翻譯引擎、基于語塊的翻譯引擎和基于分析翻譯引擎(見圖1),或 者可以與翻譯引擎、基于句型的翻譯引擎或基于語塊的翻譯引擎結合使 用。所述單詞翻譯裝置可以形成為獨立結構??梢酝ㄟ^將執(zhí)行單詞翻譯 裝置的功能的缺件安裝到計算機上來實現(xiàn)所述單詞翻譯裝置,或者所述 單詞翻譯裝置可以用作便攜式電子字典。
權利要求
1、 一種單詞翻譯裝置,所述單詞翻譯裝置能夠執(zhí)行多種語言之間的 單詞翻譯,所述單詞翻譯裝置包括存儲單元,用于至少將第一單詞檢索結構、第二單詞檢索結構、第 一單詞和翻譯信息記錄、以及第二單詞信息記錄存儲在字典中,其中, 所述第一單詞檢索結構被設置用于檢索第一語言的單詞,所述第二單詞 檢索結構被設置用于檢索第二語言的單詞,所述第一單詞和翻譯信息記 錄包括與存儲在所述第一單詞檢索結構中的單詞相關的單詞關聯(lián)信息和 翻譯信息,所述第二單詞信息記錄包括與存儲在所述第二單詞檢索結構 中的單詞相關的單詞關聯(lián)信息和翻譯信息。
2、 如權利要求1所述的單詞翻譯裝置,其中,所述第一單詞檢索結 構和第二單詞檢索結構包括用于識別單詞和翻譯信息記錄的單詞和翻譯 信息記錄識別信息。
3、 如權利要求1所述的單詞翻譯裝置,其中,所述第一單詞和翻譯 信息記錄與所述第二單詞和翻譯信息記錄分別包括用于識別存儲在所述 第一單詞檢索結構和第二單詞檢索結構中的單詞的單詞識別信息。
4、 如權利要求1所述的單詞翻譯裝置,其中,所述第一單詞和翻譯信息記錄和第二單詞和翻譯信息記錄分別包括與存儲在所述第一單詞檢 索結構和第二單詞檢索結構中的單詞相關的關聯(lián)信息。
5、 如權利要求1所述的單詞翻譯裝置,其中所述第一單詞和翻譯信息記錄包括用于識別存儲在所述第二單詞和 翻譯信息記錄中的翻譯信息的翻譯識別信息;以及所述第二單詞和翻譯信息記錄包括用于識別存儲在所述第一單詞和 翻譯信息記錄中的翻譯信息的翻譯識別信息。
6、 如權利要求1到4中的任何一個所述的單詞翻譯裝置,其中,所 述第一單詞和翻譯信息記錄與第二單詞和翻譯信息記錄都包括識別各翻 譯的同義詞的信息。
7、 如權利要求1到5中的任何一個所述的單詞翻譯裝置,其中,所 述第一單詞和翻譯信息記錄與所述第二單詞和翻譯信息記錄都包括用于識別進行翻譯的語言的種類的識別信息。
8、 如權利要求1到3中的任何--個所述的單詞翻譯裝置,其中,當 主題單詞具有多種詞性時,所述第一單詞和翻譯信息記錄與所述第二單 詞和翻譯信息記錄都包括用于存儲與各詞性相關的一條單詞關聯(lián)信息和 一條翻譯信息的記錄。
9、 如權利要求8所述的單詞翻譯裝置,其中,所述各詞性的記錄通過指針與所述一條單詞關聯(lián)信息關聯(lián)。
10、 如權利要求1到9中的任何一個所述的單詞翻譯裝置,所述裝置還包括輸入單元,用于輸入單詞;查閱單元,用于在所述第一單詞檢索結構中存儲的單詞中査閱所輸 入的單詞;提取單元,用于基于與所述單詞關聯(lián)的所述第一單詞信息記錄從存 儲在所述第二單詞檢索結構中的翻譯中提取翻譯;以及 輸出單元,用于輸出所提取出的翻譯。
11、 如權利要求10所述的單詞翻譯裝置,其中,所述提取單元基于 與所述査閱單元所査閱的所述單詞相關聯(lián)的所述第一單詞信息記錄提取 所述第二單詞信息記錄。
12、 如權利要求10或11所述的單詞翻譯裝置,其中 所述第一單詞信息記錄的所述翻譯信息包括鏈接信息,所述鏈接信息用于識別存儲在所述第二單詞檢索結構或第二單詞信息記錄中的翻 譯;以及所述提取單元基于所述鏈接信息提取所述翻譯或所述第二單詞信息 記錄。
13、 一種單詞翻譯裝置,所述單詞翻譯裝置執(zhí)行多種語言之間的單 詞翻譯,所述單詞翻譯裝置包括存儲單元,用于在字典中存儲N種語言的單詞檢索結構以及與所述 N種語言的各自的單詞檢索結構相關聯(lián)的所述N種語言的單詞信息記錄, N是2或大于2的整數(shù),所述N種語言的所述單詞信息記錄中的一種語言的所述單詞信息記 錄包括翻譯信息,該翻譯信息用于識別所述多種語言中的所述一種語言 的翻譯。
14、 一種單詞翻譯裝置,所述單詞翻譯裝置執(zhí)行多種語言之間的單詞翻譯,所述單詞翻譯裝置包括存儲單元,用于存儲為各語言設置的單詞檢索字典數(shù)據(jù)以及鏈接信 息,所述鏈接信息是為存儲在為各種語言設置的所述單詞檢索字典數(shù)據(jù) 中的各單詞設置的、并且指示一種語言中的單詞和另一種語言中的所述 單詞的翻譯之間的關系。
15、 如權利要求14所述的單詞翻譯裝置,其中,所述鏈接信息包括識別信息,用于識別所述一種語言的單詞;識別信息,用于識別所述另 一種語言;指針,用于指向與所述另一種語言的翻譯相關的鏈接信息; 以及指針,指向與所述一種語言的單詞的同義詞相關的鏈接信息。
16、 如權利要求14所述的單詞翻譯裝置,其中所述鏈接信息包括父鏈接信息和子鏈接信息;所述父鏈接信息包括指向與所述一種語言的單詞的同義詞相關的所 述子鏈接信息的指針;所述子鏈接信息包括識別信息,用于識別所述另一種語言;指針, 用于指向所述對應的父鏈接信息;指針,用于指向與所述另一種語言的 翻譯相關的子鏈接信息;以及指針,用于指向與另一同義詞相關的子鏈 接信息。
17、 如權利要求14到16中的任何一個所述的單詞翻譯裝置,其中, 當所述單詞具有多種詞性時,為各詞性設置所述鏈接信息。
18、 如權利要求14到17中的任何一個所述的單詞翻譯裝置,其中, 所述單詞檢索字典數(shù)據(jù)包括單詞檢索結構和單詞信息記錄,所述單詞檢索結構是為所述各種語言設置的并且用于檢索單詞,所述單詞信息記錄 是為所述各種語言設置的并且存儲與所述單詞相關的信息。
19、 如權利要求18所述的單詞翻譯裝置,其中,所述單詞信息記錄 包括所述鏈接信息。
20、 如權利要求18所述的單詞翻譯裝置,其中,所述單詞檢索結構 包括單詞TRIE結構或哈希函數(shù)結構。
21、 如權利要求14到20中的任何一個所述的單詞翻譯裝置,其中 所述單詞檢索結構包括與所述對應語言的各單詞的第一字符相關的列表信息和與所述單詞相關的列表信息;所述第一字符列表信息包括與所述第一字符相關的信息、以所述第 ---字符開始的單詞的數(shù)目、指向與以所述第一字符開始的單詞相關的列 表信息中的某一位置的指針;以及所述單詞列表信息包括指向與所述單詞相關的鏈接信息的指針。
22、 如權利要求14到21中的任何一個所述的單詞翻譯裝置,所述 單詞翻譯裝置還包括輸入單元,用于輸入所述一種語言的單詞;查閱單元,用于在與所述一種語言相關的所述單詞檢索字典數(shù)據(jù)中 査閱所輸入的所述一種語言的單詞;以及提取單元,用于基于與所查閱的所述一種語言的單詞相關的所述鏈 接信息,從與所述另一種語言相關的所述單詞檢索字典數(shù)據(jù)中提取所述 另一種語言的翻譯。
23、 如權利要求22所述的單詞翻譯裝置,其中,所述提取單元基于 與所述查閱單元查閱的所述一種語言的單詞信息記錄相關的所述鏈接信 息,提取所述另一種語言的單詞信息記錄。
24、 如權利要求22所述的單詞翻譯裝置,其中,所述提取單元基于 與所述査閱單元查閱的所述一種語言的單詞信息記錄相關的所述鏈接信 息,從所述另一種語言的所述單詞檢索結構提取翻譯。
25、 一種機器翻譯系統(tǒng),所述機器翻譯系統(tǒng)包括 翻譯單元,用于輸入句子并且翻譯所述句子;以及 如權利要求1到24中的任何一個所述的所述單詞翻譯裝置,用于輸入所述翻譯單元未翻譯出的單詞并且翻譯所述單詞。
26、 如權利要求25所述的機器翻譯系統(tǒng),其中,所述翻譯單元包括 翻譯存儲器引擎、基于句型的翻譯引擎和基于語塊示例的翻譯引擎中的 至少一個。
27、 如權利要求26所述的機器翻譯系統(tǒng),所述機器翻譯系統(tǒng)還包括: 區(qū)別輸出單元,用于區(qū)別不是由所述翻譯單元翻譯出的所述單詞的翻譯和其它翻譯,并且輸出所述翻譯。
28、 一種用于在多種語言之間翻譯單詞的單詞翻譯方法,所述單詞翻譯方法包括如下步驟將第一單詞檢索結構、第二單詞檢索結構、第一單詞信息記錄和第 二單詞信息記錄存儲在字典中,所述第一單詞檢索結構被設置用于檢索 第一語言的單詞,所述第二單詞檢索結構被設置用于檢索第二語言的單 詞,所述第一單詞信息記錄包括用于識別存儲在所述第一單詞檢索結構 中的單詞的翻譯的第一翻譯信息,所述第二單詞信息記錄包括用于識別 存儲在所述第二單詞檢索結構中的單詞的翻譯的第二翻譯信息。
29、 如權利要求28所述的單詞翻譯方法,還包括如下步驟 輸入單詞;在存儲于所述第一單詞檢索結構中的所述單詞中查閱所輸入的單詞;基于所查閱的單詞的所述第一單詞信息記錄,從所述第二單詞檢索 結構中提取翻譯;以及輸出所提取出的翻譯。
30、 一種在多種語言之間翻譯單詞的翻譯方法,所述翻譯方法包括 如下步驟將單詞檢索字典數(shù)據(jù)和鏈接信息存儲在存儲單元中,所述單詞檢索字典數(shù)據(jù)是為所述各種語言設置的,所述鏈接信息是為存儲在為所述各種語言設置的所述單詞檢索字典數(shù)據(jù)中的各單詞設置的、并且指示一種 語言的單詞和該單詞的另一種語言的翻譯之間的關系。
31、 如權利要求29所述的翻譯方法,所述翻譯方法還包括如下步驟 輸入一種語言的單詞;在為所述一種語言設置的所述單詞檢索字典數(shù)據(jù)中查閱所述一種語 言的輸入單詞;以及基于與所查閱的所述一種語言的單詞相關的所述鏈接信息,從為所 述另一種語言設置的所述單詞檢索字典數(shù)據(jù)中提取所述另一種語言的翻 譯。
32、 如權利要求31所述的翻譯方法,其中所述單詞檢索字典數(shù)據(jù)包括單詞信息記錄,所述單詞信息記錄是為各種語言設置的,并且存儲單詞檢索結構和與單詞有關的信息; 所述單詞信息記錄包括所述鏈接信息;以及所述提取步驟包括基于所述一種語言的所述單詞信息記錄的鏈接 信息提取所述另一種語言的所述單詞信息記錄。
33、 一種在多種語言之間翻譯單詞的單詞翻譯程序,執(zhí)行所述程序以執(zhí)行如下步驟將第一單詞檢索結構、第二單詞檢索結構、第一單詞信息記錄和第 二單詞信息記錄存儲在字典中,所述第一單詞檢索結構被設置用于檢索 第一語言的單詞,所述第二單詞檢索結構被設置用于檢索第二語言的單 詞,所述第一單詞信息記錄包括用于識別存儲在所述第一單詞檢索結構 中的單詞的翻譯的第一翻譯信息,所述第二單詞信息記錄包括用于識別 存儲在所述第二單詞檢索結構中的單詞的翻譯的第二翻譯信息。
34、 如權利要求31所述的單詞翻譯程序,其中,執(zhí)行所述程序以另外執(zhí)行如下步驟輸入單詞;在存儲于所述第一單詞檢索結構中的所述單詞中査閱所輸入的單詞;基于所述査閱的單詞的所述第一單詞信息記錄,從所述第二單詞檢 索結構提取翻譯;以及輸出所提取出的翻譯。
35、 一種在多種語言之間翻譯單詞的翻譯程序,執(zhí)行所述程序以執(zhí) 行如下步驟將單詞檢索字典數(shù)據(jù)和鏈接信息存儲在存儲單元中,所述單詞檢索 字典數(shù)據(jù)是為所述各種語言設置的,所述鏈接信息是對存儲在為所述各 種語言設置的所述單詞檢索字典數(shù)據(jù)中的各單詞設置的并且指示一種語 言的單詞和另一種語言的該單詞的翻譯之間的關系。
36、 一種翻譯程序,執(zhí)行所述程序以執(zhí)行如下步驟輸入一種語言的單詞;將所述一種語言的輸入單詞參照到為所述一種語言設置的所述單詞 檢索字典數(shù)據(jù);以及基于與所述一種語言的所述參照的單詞有關的所述鏈接信息,從為 所述另一種語言設置的所述單詞檢索字典數(shù)據(jù)中提取另一種語言的翻譯。
37、 如權利要求36所述的翻譯程序,其中所述單詞檢索字典數(shù)據(jù)包括為各種語言設置的單詞信息記錄并且存 儲單詞檢索結構和與單詞有關的信息;所述單詞信息記錄包括所述鏈接信息;以及所述提取步驟包括基于所述一種語言的所述單詞信息記錄的鏈接 信息提取所述另一種語言的所述單詞信息記錄。
全文摘要
本發(fā)明公開了單詞翻譯裝置、翻譯方法以及翻譯程序,該單詞翻譯裝置將第一語言單詞檢索TRIE結構(100)、第二語言單詞檢索TRIE結構(200)、第一語言單詞信息記錄(110)、第二語言單詞信息記錄(210)存儲在雙語對照字典中。第一語言單詞檢索TRIE結構(100)用以檢索第一語言的單詞。第二語言單詞檢索TRIE結構(200)用以檢索第二語言的單詞。第一語言單詞信息記錄(110)包括識別存儲在第一語言單詞檢索TRIE結構(100)中的各單詞的翻譯的第一翻譯信息。第二語言單詞信息記錄(210)包括識別存儲在第二語言單詞檢索TRIE結構(200)中的各單詞的翻譯的第二翻譯信息。通過參照第一和第二單詞信息記錄(110)和(210),能夠高精度高速度地在第一和第二語言之間執(zhí)行單詞翻譯。
文檔編號G06F17/28GK101124579SQ20068000558
公開日2008年2月13日 申請日期2006年2月22日 優(yōu)先權日2005年2月24日
發(fā)明者劉紹明 申請人:富士施樂株式會社