一種基于語料庫的雙語檢索統(tǒng)計翻譯系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及搜索引擎領(lǐng)域,具體涉及一種基于語料庫的雙語檢索統(tǒng)計翻譯系統(tǒng)。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)應(yīng)用的發(fā)展、以及各種類型的數(shù)字化內(nèi)容(文本、圖片、音頻和視頻等)以指數(shù)級的形式呈現(xiàn)出爆炸性的增長,如何根據(jù)用戶的輸入在海量信息中準確地查找相關(guān)內(nèi)容,是一個非?;A(chǔ)而又具有重大意義的技術(shù)挑戰(zhàn)。目前,以Google、百度等為代表的通用搜索引擎在一定程度上已經(jīng)較好地解決了這一難題。
[0003]然而以通用搜索引擎為代表及其他基于傳統(tǒng)的文本檢索系統(tǒng)的軟件、網(wǎng)絡(luò)應(yīng)用等,在針對各類雙語搜索上仍然具有很大的局限性,一方面其單單存在翻譯功能,而不具備檢索功能,另一方面,相關(guān)詞句的介紹以及應(yīng)用案例等,都需要重新去查詢,這無疑增加了用戶的工作量。
[0004]且,在具體使用過程中,由于單詞由均為多個字母構(gòu)成,很容易導(dǎo)致使用者在檢索時,拼寫錯誤,或者無法拼寫的情況的發(fā)生,而導(dǎo)致無法進行檢索。
【發(fā)明內(nèi)容】
[0005]為解決上述問題,本發(fā)明提供了一種基于語料庫的雙語檢索統(tǒng)計翻譯系統(tǒng),命名為Word Smart語料庫教學(xué)與研究系統(tǒng)。
[0006]為實現(xiàn)上述目的,本發(fā)明采取的技術(shù)方案為:
[0007]一種基于語料庫的雙語檢索統(tǒng)計翻譯系統(tǒng),包括
[0008]數(shù)據(jù)庫,用于儲存各類相關(guān)詞表、語句、單詞以及每個單詞、語句對應(yīng)的解釋和應(yīng)用案例數(shù)據(jù);
[0009]數(shù)據(jù)庫更新模塊,用于通過3G網(wǎng)絡(luò)、W1-Fi網(wǎng)絡(luò)方式更新數(shù)據(jù)庫;
[0010]人機操作模塊,包括鍵盤輸入模塊、手寫輸入模塊以及語音輸入模塊,用于輸入需要查詢的英語數(shù)據(jù)或漢語數(shù)據(jù),并將數(shù)據(jù)發(fā)送到數(shù)據(jù)識別單元;同時還用于輸入信息調(diào)用命令;
[0011]數(shù)據(jù)識別單元,用于接收人機操作模塊發(fā)送來的數(shù)據(jù),并判斷數(shù)據(jù)屬于英語還是漢語,并將漢語數(shù)據(jù)發(fā)送到數(shù)據(jù)分割單元,將英語數(shù)據(jù)發(fā)送到檢索模塊;
[0012]數(shù)據(jù)分割單元,用于將接收的漢語數(shù)據(jù)進行分割,識別所述漢語數(shù)據(jù)中的標點,以句號為分割位置,得到以句子為單位的文本信息并將該文本信息發(fā)送到數(shù)據(jù)翻譯模塊;
[0013]數(shù)據(jù)翻譯模塊,用于將獲取的文本信息進行數(shù)據(jù)庫搜索,查找是否有對應(yīng)或類似的翻譯目標語句,并將翻譯結(jié)果通過電子顯示屏顯示,若未查詢到,文本信息會傳送到聯(lián)網(wǎng)模塊,通過聯(lián)網(wǎng)模塊進行翻譯結(jié)果查詢,并將翻譯結(jié)果儲存在數(shù)據(jù)庫內(nèi),且通過電子顯示屏顯不;
[0014]檢索處理模塊,包括
[0015]檢索功能模塊,用于接收數(shù)據(jù)識別模塊以及數(shù)據(jù)翻譯模塊發(fā)來的文本數(shù)據(jù),將文本數(shù)據(jù)與公式數(shù)據(jù)庫中的公式數(shù)據(jù)進行類似度對比,并將比對結(jié)果按照相似度進行升序或降序排序后,通過電子顯示屏顯示;
[0016]詞表功能模塊,對導(dǎo)入文件進行詞表統(tǒng)計與顯示;
[0017]搭配詞功能模塊,用于實現(xiàn)對某一詞的搭配信息的統(tǒng)計與顯示功能;
[0018]詞簇功能模塊,用于實現(xiàn)多詞詞表的統(tǒng)計與顯示;
[0019]主題性功能模塊,用于通過詞表對比,可以統(tǒng)計出導(dǎo)入文本的主題性信息;
[0020]詞匯分類功能模塊,用于實現(xiàn)對導(dǎo)入文本的詞性、水平級別其它形式的統(tǒng)計與分類;
[0021]中央處理器,用于根據(jù)信息調(diào)用命令,從數(shù)據(jù)庫中調(diào)用人們所需的數(shù)據(jù)信息,并用于添加用戶、刪除用戶、密碼修改、權(quán)限管理;
[0022]液晶顯示屏,用于顯示檢索模塊的檢索結(jié)果以及輸入的文本數(shù)據(jù);
[0023]語音單元,用于語音播放檢索模塊的檢索結(jié)果;
[0024]自學(xué)功能模塊,用于就某一文件,自動生成具有交互性的測試內(nèi)容,供學(xué)生練習(xí)。
[0025]其中,還包括資源共享模塊,用于下載檢索結(jié)果。
[0026]其中,所述語音輸入模塊采用麥克風(fēng)。
[0027]其中,所述聯(lián)網(wǎng)模塊包括一網(wǎng)絡(luò)爬蟲進程,用于在網(wǎng)絡(luò)中查找與輸入文本相關(guān)的網(wǎng)頁或文檔。
[0028]其中,所述電子顯不屏為觸摸屏。
[0029]本發(fā)明具有以下有益效果:
[0030]可以選擇不同的輸入模式,檢索過程簡單快速,在得到檢索結(jié)果時,可以得到該文本數(shù)據(jù)的分類、詞句以及應(yīng)用案例等數(shù)據(jù),減省了用戶的時間,使用方便。
【附圖說明】
[0031]圖1為本發(fā)明實施例一種基于語料庫的雙語檢索統(tǒng)計翻譯系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實施方式】
[0032]為了使本發(fā)明的目的及優(yōu)點更加清楚明白,以下結(jié)合實施例對本發(fā)明進行進一步詳細說明。應(yīng)當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0033]如圖1所示,本發(fā)明實施例提供了一種基于語料庫的雙語檢索統(tǒng)計翻譯系統(tǒng),包括
[0034]數(shù)據(jù)庫,用于儲存各類相關(guān)詞表、語句、單詞以及每個單詞、語句對應(yīng)的解釋和應(yīng)用案例數(shù)據(jù);
[0035]數(shù)據(jù)庫更新模塊,用于通過3G網(wǎng)絡(luò)、W1-Fi網(wǎng)絡(luò)方式更新數(shù)據(jù)庫;
[0036]人機操作模塊,包括鍵盤輸入模塊、手寫輸入模塊以及語音輸入模塊,用于輸入需要查詢的英語數(shù)據(jù)或漢語數(shù)據(jù),并將數(shù)據(jù)發(fā)送到數(shù)據(jù)識別單元;同時還用于輸入信息調(diào)用命令;
[0037]數(shù)據(jù)識別單元,用于接收人機操作模塊發(fā)送來的數(shù)據(jù),并判斷數(shù)據(jù)屬于英語還是漢語,并將漢語數(shù)據(jù)發(fā)送到數(shù)據(jù)分割單元,將英語數(shù)據(jù)發(fā)送到檢索模塊;
[0038]數(shù)據(jù)分割單元,用于將接收的漢語數(shù)據(jù)進行分割,識別所述漢語數(shù)據(jù)中的標點,以句號為分割位置,得到以句子為單位的文本信息并將該文本信息發(fā)送到數(shù)據(jù)翻譯模塊;
[0039]數(shù)據(jù)翻譯模塊,用于將獲取的文本信息進行數(shù)據(jù)庫搜索,查找是否有對應(yīng)或類似的翻譯目標語句,并將翻譯結(jié)果通過電子顯示屏顯示,若未查詢到,文本信息會傳送到聯(lián)網(wǎng)模