一種翻譯系統(tǒng)及翻譯方法
【專利摘要】本發(fā)明公開了一種翻譯系統(tǒng)及翻譯方法,其中,一種翻譯方法,其特征在于,包括:用戶端輸入需要翻譯的原文,用戶端將需要翻譯的原文傳輸給服務(wù)器,服務(wù)器根據(jù)原文字?jǐn)?shù)是否超過數(shù)量閥值判斷是否需要切割,進(jìn)行標(biāo)點(diǎn)切割及一級標(biāo)記,再一次判斷,進(jìn)行連詞切割及二級標(biāo)記,將切割后的碎片在語料庫中檢索,檢索到匹配的譯文,將譯文返回到用戶端,檢索不到匹配的譯文,轉(zhuǎn)接到人工翻譯,進(jìn)行拼接,將拼接后的譯文傳遞給用戶端。提高了語料庫的匹配效率,進(jìn)一步減少了人工成本。
【專利說明】一種翻譯系統(tǒng)及翻譯方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種用于各類電腦設(shè)備、嵌入式系統(tǒng)、便攜式系統(tǒng)、系統(tǒng)芯片、手機(jī)設(shè)備或移動電子裝置中的翻譯系統(tǒng)及翻譯方法,特別是涉及一種翻譯系統(tǒng)及翻譯方法。
【背景技術(shù)】
[0002]隨著經(jīng)濟(jì)的發(fā)展,對外交流的增多,人們越來越需要有一種準(zhǔn)確、使用方便且費(fèi)用低廉的語言及時翻譯工具。而由于語言的復(fù)雜性,在現(xiàn)有的技術(shù)條件下完全通過機(jī)器實(shí)現(xiàn)這一目標(biāo)并不可行,采用人工翻譯結(jié)合翻譯軟件并通過互聯(lián)網(wǎng)及移動(固定)電話網(wǎng)絡(luò)傳播是在現(xiàn)階段較為經(jīng)濟(jì)、可行的辦法。如何利用翻譯軟件在不同語言間實(shí)現(xiàn)合理而準(zhǔn)確的翻譯,這在目前還是一個世界性難題?,F(xiàn)有的翻譯軟件大多在詞匯翻譯上有所建樹,而對不同語言的語法轉(zhuǎn)換都做的勉強(qiáng),更不用說對不同語言豐富語境的表達(dá)了。因此,在今后很長一段時間里,人工翻譯還是人們在不同語言之間進(jìn)行溝通的主要方式。
[0003]人工翻譯準(zhǔn)確率高,但是減少其人工成本、時間成本提高效率更是迫在眉睫。
[0004]申請?zhí)栁?0109861.6,98110927.6的發(fā)明專利,完全采用機(jī)器翻譯,雖然翻譯成本低,但翻譯的準(zhǔn)確性差。因?yàn)楝F(xiàn)有的完全憑借機(jī)器翻譯,雖然現(xiàn)有的翻譯軟件大多在詞匯翻譯上有所建樹,而對不同語言的語法轉(zhuǎn)換都做的勉強(qiáng),更不用說對不同語言豐富語境的表達(dá)了。因此,翻譯的準(zhǔn)確度差,對有些內(nèi)容的翻譯或表達(dá)混亂,或意思相差很大,很難滿足需要。
[0005]申請?zhí)枮?01110009593.4的專利,采用數(shù)據(jù)庫和人工翻譯端相結(jié)合,但是不夠詳細(xì),沒有公開如何拆分翻譯原文和如何將翻譯片段在語料庫中進(jìn)行匹配和推送,沒有切割條件庫和匹配模塊,本專利是在此基礎(chǔ)上的精進(jìn)。
【發(fā)明內(nèi)容】
[0006]現(xiàn)有人工翻譯在流程上比較復(fù)雜,設(shè)有眾多的角色,在反應(yīng)速度上相對較慢,而且,每一份需要翻譯的內(nèi)容(文本、圖片、語音)都需要經(jīng)過譯員來翻譯,如果翻譯的內(nèi)容是重復(fù)的,就意味著要做很多重復(fù)的工作,因此,為了減少人工翻譯工作量,避免重復(fù)翻譯,進(jìn)而提高現(xiàn)有翻譯后臺的響應(yīng)速度,提升用戶體驗(yàn),提出了此發(fā)明。
[0007]本發(fā)明公開了一種翻譯方法,其特征在于,包括:
用戶端輸入需要翻譯的原文,
用戶端將需要翻譯的原文傳輸給服務(wù)器;
服務(wù)器判斷原文字?jǐn)?shù)是否超過數(shù)量閥值,如果超過,則進(jìn)行標(biāo)點(diǎn)切割:將原文按照標(biāo)點(diǎn)庫進(jìn)行切割,切割后,對原文碎片進(jìn)行一級標(biāo)記,記錄編號和對應(yīng)的標(biāo)點(diǎn);
再次判斷一級標(biāo)記的原文碎片是否超過數(shù)量閥值,如果超過,則進(jìn)行連詞切割:服務(wù)器將一級標(biāo)記的原文碎片按照連詞庫進(jìn)行切割,切割后,對原文碎片進(jìn)行二級標(biāo)記,記錄編號和相應(yīng)的連詞;
將原文碎片在語料庫中檢索,檢索到匹配的譯文,將譯文返回到用戶端; 檢索不到匹配的譯文,轉(zhuǎn)到人工翻譯;
根據(jù)原文碎片的二級標(biāo)記,對譯文進(jìn)行排序,排序后,進(jìn)行連詞拼接;
根據(jù)原文碎片的一級標(biāo)記,對譯文進(jìn)行排序,排序后,進(jìn)行標(biāo)點(diǎn)拼接;
將拼接后的譯文傳遞給用戶端;
所述標(biāo)點(diǎn)庫,用于儲存適合切割原文的標(biāo)點(diǎn),可不斷更新;
所述連詞庫,用于儲存適合切割原文的連詞,可不斷更新。
[0008]進(jìn)一步,將人工翻譯的譯文返回到語料庫進(jìn)行存儲。
[0009]進(jìn)一步,所述匹配分為若干個級別,默認(rèn)是一級匹配:原文碎片和在語料庫中檢索到的原文從字面100%匹配;
還可以選擇二級匹配:原文碎片和在語料庫中檢索到的原文從字面90%匹配;
還可以選擇三級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面80%匹配; 還可以手動輸入自定義匹配比例。
[0010]進(jìn)一步,如果是一級匹配,將一條以上相同的匹配譯文去重;一條以上不同的匹配譯文,轉(zhuǎn)到人工翻譯端。
[0011]進(jìn)一步,所述數(shù)量閥值默認(rèn)為是10,用戶可以手動輸入自定義的數(shù)量。
[0012]本發(fā)明還公開了一種翻譯系統(tǒng),包括一個或一個以上的用戶端,與用戶端信號連接的服務(wù)器、人工翻譯端,其特征在于服務(wù)器還包括文本切割模塊和文本組合模塊;
用戶端包括:
用戶端輸入模塊,用于輸入用戶端翻譯請求并將其傳輸?shù)椒?wù)器,所述翻譯請求包括需翻譯的原文、翻譯語種;
人工翻譯端,用于人工翻譯從服務(wù)器反饋的翻譯需求、判斷譯文是否正確并進(jìn)行修改替換,所述翻譯請求包括需翻譯的原文碎片、翻譯語種;
服務(wù)器包括:
文本切割模塊,所述文本切割模塊包括標(biāo)點(diǎn)庫和連詞庫、判斷模塊、標(biāo)記模塊,用于當(dāng)原文字?jǐn)?shù)超過數(shù)量閥值時根據(jù)標(biāo)點(diǎn)庫將需翻譯的原文切割為若干個原文碎片,對原文碎片進(jìn)行一級標(biāo)記,記錄編號和對應(yīng)的標(biāo)點(diǎn),當(dāng)一級標(biāo)記的原文碎片仍超過數(shù)量閥值時,根據(jù)連詞庫將需翻譯的原文碎片進(jìn)一步切割,對原文碎片進(jìn)行二級標(biāo)記,記錄編號和相應(yīng)的連詞;
所述標(biāo)點(diǎn)庫,用于儲存適合切割原文的標(biāo)點(diǎn),可不斷更新;
所述連詞庫,用于儲存適合切割原文碎片的連詞,可不斷更新;
所述判斷模塊,用于判斷原文或者原文碎片是否超過數(shù)量閥值;
所述標(biāo)記模塊,用于對原文碎片進(jìn)行標(biāo)記、記錄編號、標(biāo)點(diǎn)、連詞;
服務(wù)器還包括語料庫,用于儲存建立服務(wù)器數(shù)據(jù)庫時由人工錄入的原文及對應(yīng)的譯文資料;
服務(wù)器還包括檢索模塊,用于從將原文碎片在語料庫中檢索,檢索到匹配的譯文,將譯文返回到用戶端,檢索不到匹配的譯文,轉(zhuǎn)接到人工翻譯端;
還包括文本組合模塊,用于根據(jù)原文碎片的二級標(biāo)記,對譯文進(jìn)行排序,連詞拼接,還用于根據(jù)原文碎片的一級標(biāo)記,對譯文進(jìn)行排序,標(biāo)點(diǎn)拼接;
還包括譯文推送模塊,用于將拼接后的譯文傳遞給用戶端。[0013]優(yōu)選地,服務(wù)器還包括更新模塊,用于將人工翻譯端的譯文轉(zhuǎn)移儲存到語料庫中,同時用于更新維護(hù)服務(wù)器中的翻譯檢索應(yīng)用程序。
[0014]優(yōu)選地,服務(wù)器還包括匹配模塊,用于將原文碎片在語料庫中默認(rèn)進(jìn)行一級匹配或選擇進(jìn)行二級匹配或三級匹配或自定義匹配,
一級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面100%匹配;
二級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面90%匹配;
三級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面80%匹配。
[0015]優(yōu)選地,服務(wù)器還包括去重模塊,用于將一條以上相同的匹配譯文去重,將一條以上不同的匹配譯文轉(zhuǎn)到人工翻譯端。
[0016]本發(fā)明中的翻譯系統(tǒng),具有以下優(yōu)點(diǎn):
1、通過語料庫的利用,提高了人工翻譯的效率,節(jié)省了人力成本;
2、通過標(biāo)點(diǎn)切割和連詞切割將原文切割成碎片,提高了語料庫的匹配效率;
3、通過可選擇及可自定義的匹配模塊,有利于用戶根據(jù)經(jīng)驗(yàn)值選擇更合理的匹配。
【專利附圖】
【附圖說明】
[0017]此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定,在附圖中:
圖1示出了翻譯方法的流程圖。
[0018]圖2示出了翻譯系統(tǒng)的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0019]下面將參考附圖并結(jié)合實(shí)施例,來詳細(xì)說明本發(fā)明。
[0020]實(shí)施例1:本發(fā)明公開了一種翻譯方法,參考附圖1,其特征在于,包括:
用戶端輸入需要翻譯的原文,
用戶端將需要翻譯的原文傳輸給服務(wù)器;
服務(wù)器判斷原文字?jǐn)?shù)是否超過10個字,如果超過,則進(jìn)行標(biāo)點(diǎn)切割:
將原文按照標(biāo)點(diǎn)庫進(jìn)行切割,切割后,對原文碎片進(jìn)行一級標(biāo)記,記錄編號和對應(yīng)的標(biāo)
占.再次判斷一級標(biāo)記的原文碎片是否超過10個字,如果超過,則進(jìn)行連詞切割:
服務(wù)器將一級標(biāo)記的原文碎片按照連詞庫進(jìn)行切割,切割后,對原文碎片進(jìn)行二級標(biāo)記,記錄編號和相應(yīng)的連詞;
將原文碎片在語料庫中檢索,檢索到匹配的譯文,將譯文返回到用戶端;
檢索不到匹配的譯文,轉(zhuǎn)到人工翻譯;
根據(jù)原文碎片的二級標(biāo)記,對譯文進(jìn)行排序,排序后,進(jìn)行連詞拼接;
根據(jù)原文碎片的一級標(biāo)記,對譯文進(jìn)行排序,排序后,進(jìn)行標(biāo)點(diǎn)拼接;
將拼接后的譯文傳遞給用戶端;
所述標(biāo)點(diǎn)庫,用于儲存適合切割原文的標(biāo)點(diǎn),可不斷更新;
所述連詞庫,用于儲存適合切割原文的連詞,可不斷更新。
[0021]進(jìn)一步,將人工翻譯的譯文返回到語料庫進(jìn)行存儲。[0022]進(jìn)一步,所述匹配分為若干個級別,默認(rèn)是一級匹配:原文碎片和在語料庫中檢索到的原文從字面100%匹配;
還可以選擇二級匹配:原文碎片和在語料庫中檢索到的原文從字面90%匹配;
還可以選擇三級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面80%匹配; 還可以手動輸入自定義匹配比例。
[0023]進(jìn)一步,如果是一級匹配,將一條以上相同的匹配譯文去重;一條以上不同的匹配譯文,轉(zhuǎn)到人工翻譯端。
[0024]實(shí)施例2:本發(fā)明還公開了一種翻譯系統(tǒng),參考附圖2,包括一個或一個以上的用戶端,與用戶端信號連接的服務(wù)器、人工翻譯端,其特征在于服務(wù)器還包括文本切割模塊和文本組合模塊;
用戶端包括:
用戶端輸入模塊,用于輸入用戶端翻譯請求并將其傳輸?shù)椒?wù)器,所述翻譯請求包括需翻譯的原文、翻譯語種;
人工翻譯端,用于人工翻譯從服務(wù)器反饋的翻譯需求、判斷譯文是否正確并進(jìn)行修改替換,所述翻譯請求包括需翻譯的原文碎片、翻譯語種;
服務(wù)器包括:
文本切割模塊,所述文本切割模塊包括標(biāo)點(diǎn)庫和連詞庫、判斷模塊、標(biāo)記模塊,用于當(dāng)原文字?jǐn)?shù)超過10個字時根據(jù)標(biāo)點(diǎn)庫將需翻譯的原文切割為若干個原文碎片,對原文碎片進(jìn)行一級標(biāo)記,記錄編號和對應(yīng)的標(biāo)點(diǎn),當(dāng)一級標(biāo)記的原文碎片仍超過10個字時,根據(jù)連詞庫將需翻譯的原文碎片進(jìn)一步切割,對原文碎片進(jìn)行二級標(biāo)記,記錄編號和相應(yīng)的連詞;
所述標(biāo)點(diǎn)庫,用于儲存適合切割原文的標(biāo)點(diǎn),可不斷更新;
所述連詞庫,用于儲存適合切割原文碎片的連詞,可不斷更新;
所述判斷模塊,用于判斷原文或者原文碎片是否超過數(shù)量閥值;
所述標(biāo)記模塊,用于對原文碎片進(jìn)行標(biāo)記、記錄編號、標(biāo)點(diǎn)、連詞;
服務(wù)器還包括語料庫,用于儲存建立服務(wù)器數(shù)據(jù)庫時由人工錄入的原文及對應(yīng)的譯文資料;
服務(wù)器還包括檢索模塊,用于從將原文碎片在語料庫中檢索,檢索到匹配的譯文,將譯文返回到用戶端,檢索不到匹配的譯文,轉(zhuǎn)接到人工翻譯端;
還包括文本組合模塊,用于根據(jù)原文碎片的二級標(biāo)記,對譯文進(jìn)行排序,連詞拼接,還用于根據(jù)原文碎片的一級標(biāo)記,對譯文進(jìn)行排序,標(biāo)點(diǎn)拼接;
還包括譯文推送模塊,用于將拼接后的譯文傳遞給用戶端。
[0025]優(yōu)選地,服務(wù)器還包括更新模塊,用于將人工翻譯端的譯文轉(zhuǎn)移儲存到語料庫中,同時用于更新維護(hù)服務(wù)器中的翻譯檢索應(yīng)用程序。
[0026]優(yōu)選地,服務(wù)器還包括匹配模塊,用于將原文碎片在語料庫中默認(rèn)進(jìn)行一級匹配或選擇進(jìn)行二級匹配或三級匹配或自定義匹配,
一級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面100%匹配;
二級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面90%匹配;
三級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面80%匹配。[0027]優(yōu)選地,服務(wù)器還包括去重模塊,用于將一條以上相同的匹配譯文去重,將一條以上不同的匹配譯文轉(zhuǎn)到人工翻譯端。
[0028]以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在【具體實(shí)施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對本發(fā)明的限制。
【權(quán)利要求】
1.一種翻譯方法,其特征在于,包括: 用戶端輸入需要翻譯的原文, 用戶端將需要翻譯的原文傳輸給服務(wù)器; 服務(wù)器判斷原文字?jǐn)?shù)是否超過數(shù)量閥值,如果超過,則進(jìn)行標(biāo)點(diǎn)切割:將原文按照標(biāo)點(diǎn)庫進(jìn)行切割,切割后,對原文碎片進(jìn)行一級標(biāo)記,記錄編號和對應(yīng)的標(biāo)點(diǎn); 再次判斷一級標(biāo)記的原文碎片是否超過數(shù)量閥值,如果超過,則進(jìn)行連詞切割:服務(wù)器將一級標(biāo)記的原文碎片按照連詞庫進(jìn)行切割,切割后,對原文碎片進(jìn)行二級標(biāo)記,記錄編號和相應(yīng)的連詞; 將原文碎片在語料庫中檢索,檢索到匹配的譯文,將譯文返回到用戶端; 檢索不到匹配的譯文,轉(zhuǎn)到人工翻譯; 根據(jù)原文碎片的二級標(biāo)記,對譯文進(jìn)行排序,排序后,進(jìn)行連詞拼接; 根據(jù)原文碎片的一級標(biāo)記,對譯文進(jìn)行排序,排序后,進(jìn)行標(biāo)點(diǎn)拼接; 將拼接后的譯文傳遞給用戶端; 所述標(biāo)點(diǎn)庫,用于儲存適合切割原文的標(biāo)點(diǎn),可不斷更新; 所述連詞庫,用于儲存適合切割原文的連詞,可不斷更新。
2.根據(jù)權(quán)利要求1所述的一種翻譯方法,其特征在于,將人工翻譯的譯文返回到語料庫進(jìn)行存儲。
3.根據(jù)權(quán)利要求1所述的一種翻譯方法,其特征在于,所述匹配分為若干個級別,默認(rèn)是一級匹配:原文碎片和在語料庫中檢索到的原文從字面100%匹配; 還可以選擇二級匹配:原文碎片和在語料庫中檢索到的原文從字面90%匹配; 還可以選擇三級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面80%匹配; 還可以手動輸入自定義匹配比例。
4.根據(jù)權(quán)利要求1所述的一種翻譯方法,其特征在于,如果是一級匹配,將一條以上相同的匹配譯文去重;一條以上不同的匹配譯文,轉(zhuǎn)到人工翻譯端。
5.根據(jù)權(quán)利要求1所述的一種翻譯方法,其特征在于,所述數(shù)量閥值默認(rèn)為是10,用戶可以手動輸入自定義的數(shù)量。
6.一種翻譯系統(tǒng),包括一個或一個以上的用戶端,與用戶端信號連接的服務(wù)器、人工翻譯端,其特征在于服務(wù)器還包括文本切割模塊和文本組合模塊; 用戶端包括: 用戶端輸入模塊,用于輸入用戶端翻譯請求并將其傳輸?shù)椒?wù)器,所述翻譯請求包括需翻譯的原文、翻譯語種; 人工翻譯端,用于人工翻譯從服務(wù)器反饋的翻譯需求、判斷譯文是否正確并進(jìn)行修改替換,所述翻譯請求包括需翻譯的原文碎片、翻譯語種; 服務(wù)器包括: 文本切割模塊,所述文本切割模塊包括標(biāo)點(diǎn)庫和連詞庫、判斷模塊、標(biāo)記模塊,用于當(dāng)原文字?jǐn)?shù)超過數(shù)量閥值時根據(jù)標(biāo)點(diǎn)庫將需翻譯的原文切割為若干個原文碎片,對原文碎片進(jìn)行一級標(biāo)記,記錄編號和對應(yīng)的標(biāo)點(diǎn),當(dāng)一級標(biāo)記的原文碎片仍超過數(shù)量閥值時,根據(jù)連詞庫將需翻譯的原文碎片進(jìn)一步切割,對原文碎片進(jìn)行二級標(biāo)記,記錄編號和相應(yīng)的連詞;所述標(biāo)點(diǎn)庫,用于儲存適合切割原文的標(biāo)點(diǎn),可不斷更新; 所述連詞庫,用于儲存適合切割原文碎片的連詞,可不斷更新; 所述判斷模塊,用于判斷原文或者原文碎片是否超過數(shù)量閥值; 所述標(biāo)記模塊,用于對原文碎片進(jìn)行標(biāo)記、記錄編號、標(biāo)點(diǎn)、連詞; 服務(wù)器還包括語料庫,用于儲存建立服務(wù)器數(shù)據(jù)庫時由人工錄入的原文及對應(yīng)的譯文資料; 服務(wù)器還包括檢索模塊,用于從將原文碎片在語料庫中檢索,檢索到匹配的譯文,將譯文返回到用戶端,檢索不到匹配的譯文,轉(zhuǎn)接到人工翻譯端; 還包括文本組合模塊,用于根據(jù)原文碎片的二級標(biāo)記,對譯文進(jìn)行排序,連詞拼接,還用于根據(jù)原文碎片的一級標(biāo)記,對譯文進(jìn)行排序,標(biāo)點(diǎn)拼接; 還包括譯文推送模塊,用于將拼接后的譯文傳遞給用戶端。
7.根據(jù)權(quán)利要求6所述的一種翻譯系統(tǒng),其特征在于,服務(wù)器還包括更新模塊,用于將人工翻譯端的譯文轉(zhuǎn)移儲存到語料庫中,同時用于更新維護(hù)服務(wù)器中的翻譯檢索應(yīng)用程序。
8.根據(jù)權(quán)利要求6所述的一種翻譯系統(tǒng),其特征在于,服務(wù)器還包括匹配模塊,用于將原文碎片在語料庫中默認(rèn)進(jìn)行一級匹配或選擇進(jìn)行二級匹配或三級匹配或自定義匹配, 所述一級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面100%匹配; 所述二級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面90%匹配; 所述三級匹配:輸入的原文碎片和在語料庫中檢索到的原文從字面80%匹配。
9.根據(jù)權(quán)利要求6所述的一種翻譯系統(tǒng),其特征在于,服務(wù)器還包括去重模塊,用于將一條以上相同的匹配譯文去重,將一條以上不同的匹配譯文轉(zhuǎn)到人工翻譯端。
【文檔編號】G06F17/28GK103838718SQ201410061459
【公開日】2014年6月4日 申請日期:2014年2月24日 優(yōu)先權(quán)日:2014年2月24日
【發(fā)明者】江潮, 何戰(zhàn)濤, 賴超 申請人:武漢傳神信息技術(shù)有限公司