欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種獲取復述短語的方法及裝置、問題改寫方法及裝置的制造方法_3

文檔序號:9708309閱讀:來源:國知局
20、關鍵詞篩選模塊21、以 及查詢擴展模塊22 ;其中,
[0100] 所述獲取模塊20,用于通過統(tǒng)計機器翻譯系統(tǒng)對每個源短語進行翻譯,得到源短 語到復述短語的關聯(lián)關系;
[0101] 這里,所述獲取模塊20,具體用于利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻 譯,依次得到一次翻譯結果和二次翻譯結果;所述一次翻譯為從源短語到中間短語的翻譯; 所述二次翻譯為從中間短語到復述短語的翻譯;根據(jù)所述一次翻譯結果和二次翻譯結果確 定從源短語到復述短語的關聯(lián)關系。
[0102] 其中,所述獲取模塊20根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到 復述短語的關聯(lián)關系包括:根據(jù)所述一次翻譯結果確定中間短語的出現(xiàn)概率和從源短語到 中間短語的轉換概率;根據(jù)所述二次翻譯結果確定復述短語的出現(xiàn)概率和從中間短語到復 述短語的轉換概率;根據(jù)所確定的中間短語的出現(xiàn)概率、從源短語到中間短語的轉換概率、 復述短語的出現(xiàn)概率、以及從中間短語到復述短語的轉換概率,進一步確定從源短語到復 述短語的轉換概率。
[0103] 需要說明的是,所述中間短語的出現(xiàn)概率、從源短語到中間短語的轉換概率、復述 短語的出現(xiàn)概率、從中間短語到復述短語的轉換概率、以及從源短語到復述短語的轉換概 率的表達式在前述對本發(fā)明實施例獲取復述短語的方法的實現(xiàn)流程中有相關描述,這里不 再贅述。
[0104] 所述關鍵詞篩選模塊21,用于對用戶輸入的問句進行查詢關鍵詞的篩選;
[0105] 所述查詢擴展模塊22,用于利用源短語到復述短語的關聯(lián)關系對篩選出的查詢關 鍵詞進行查詢擴展,得到擴展后的問句。
[0106] 具體地,所述查詢擴展模塊22將查詢關鍵詞作為源短語,通過源短語到復述短語 的關聯(lián)關系找出查詢關鍵詞所對應的復述短語;將所述查詢關鍵詞所對應的復述短語構成 類隱馬爾科夫模型的結構;再通過維特比算法計算得到擴展后的問句。
[0107] 這里,如圖5所示為本發(fā)明實施例基于復述短語的問題改寫裝置中關鍵詞篩選模 塊的組成結構示意圖;所述關鍵詞篩選模塊21包括劃分模塊211、第一確定模塊212、第二 確定模塊213、以及篩選模塊214 ;其中,
[0108] 所述劃分模塊211,用于對用戶輸入的問句進行短語塊劃分,得到若干個查詢短 語;
[0109] 所述第一確定模塊212,用于計算確定每個查詢短語在所述問句中的權重系數(shù);
[0110] 這里,所述第一確定模塊212通過評價方式計算確定每個查詢短語ti在 所述問句中的權重系數(shù).所述權重系數(shù)%的計算公式采用前述表達式,這里不再贅述。
[0111] 所述第二確定模塊213,用于利用所有查詢短語在所述問句中的權重系數(shù)確定權 重系數(shù)閾值;
[0112] 所述篩選模塊214,用于根據(jù)所述權重系數(shù)閾值從所述查詢短語中篩選出所述問 句的查詢關鍵詞。
[0113] 在實際應用中,所述獲取模塊20、關鍵詞篩選模塊21、查詢擴展模塊22、劃分模塊 211、第一確定模塊212、第二確定模塊213、以及篩選模塊214均可由基于復述短語的問題 改寫裝置中的中央處理器(CPU)、微處理器(MPU)、數(shù)字信號處理器(DSP)、或現(xiàn)場可編程門 陣列(FPGA)等實現(xiàn)。
[0114] 以上所述僅是本發(fā)明實施例的實施方式,應當指出,對于本技術領域的普通技術 人員來說,在不脫離本發(fā)明實施例原理的前提下,還可以作出若干改進和潤飾,這些改進和 潤飾也應視為本發(fā)明實施例的保護范圍。
【主權項】
1. 一種獲取復述短語的方法,其特征在于,所述方法包括: 利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到一次翻譯結果和二次翻譯 結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻譯為從中間短語到復述短 語的翻譯; 根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述短語的關聯(lián)關系。2. 根據(jù)權利要求1所述的方法,其特征在于,根據(jù)所述一次翻譯結果和二次翻譯結果 確定從源短語到復述短語的關聯(lián)關系包括: 根據(jù)所述一次翻譯結果確定中間短語的出現(xiàn)概率和從源短語到中間短語的轉換概 率; 根據(jù)所述二次翻譯結果確定復述短語的出現(xiàn)概率和從中間短語到復述短語的轉換概 率; 根據(jù)所確定的源短語的出現(xiàn)概率、從源短語到中間短語的轉換概率、中間短語的出現(xiàn) 概率、以及從中間短語到復述短語的轉換概率,進一步確定從源短語到復述短語的轉換概 率。3. -種基于復述短語的問題改寫方法,其特征在于,通過統(tǒng)計機器翻譯系統(tǒng)對每個源 短語進行翻譯,得到源短語到復述短語的關聯(lián)關系;所述方法還包括: 對用戶輸入的問句進行查詢關鍵詞的篩選; 利用源短語到復述短語的關聯(lián)關系對篩選出的查詢關鍵詞進行查詢擴展,得到擴展后 的問句。4. 根據(jù)權利要求3所述的方法,其特征在于,通過統(tǒng)計機器翻譯系統(tǒng)對每個源短語進 行翻譯,得到源短語到復述短語的關聯(lián)關系包括: 利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到一次翻譯結果和二次翻譯 結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻譯為從中間短語到復述短 語的翻譯; 根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述短語的關聯(lián)關系。5. 根據(jù)權利要求4所述的方法,其特征在于,根據(jù)所述一次翻譯結果和二次翻譯結果 確定從源短語到復述短語的關聯(lián)關系包括: 根據(jù)所述一次翻譯結果確定中間短語的出現(xiàn)概率和從源短語到中間短語的轉換概 率; 根據(jù)所述二次翻譯結果確定復述短語的出現(xiàn)概率和從中間短語到復述短語的轉換概 率; 根據(jù)所確定的中間短語的出現(xiàn)概率、從源短語到中間短語的轉換概率、復述短語的出 現(xiàn)概率、以及從中間短語到復述短語的轉換概率,進一步確定從源短語到復述短語的轉換 概率。6. -種獲取復述短語的裝置,其特征在于,所述裝置包括:翻譯模塊和確定模塊;其 中, 所述翻譯模塊,用于利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到一次 翻譯結果和二次翻譯結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻譯為 從中間短語到復述短語的翻譯; 所述確定模塊,用于根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述短語 的關聯(lián)關系。7. 根據(jù)權利要求6所述的裝置,其特征在于,所述確定模塊具體用于,根據(jù)所述一次翻 譯結果確定中間短語的出現(xiàn)概率和從源短語到中間短語的轉換概率; 根據(jù)所述二次翻譯結果確定復述短語的出現(xiàn)概率和從中間短語到復述短語的轉換概 率; 根據(jù)所確定的源短語的出現(xiàn)概率、從源短語到中間短語的轉換概率、中間短語的出現(xiàn) 概率、以及從中間短語到復述短語的轉換概率,進一步確定從源短語到復述短語的轉換概 率。8. -種基于復述短語的問題改寫裝置,其特征在于,所述裝置包括:獲取模塊、關鍵詞 篩選模塊、以及查詢擴展模塊;其中, 所述獲取模塊,用于通過統(tǒng)計機器翻譯系統(tǒng)對每個源短語進行翻譯,得到源短語到復 述短語的關聯(lián)關系; 所述關鍵詞篩選模塊,用于對用戶輸入的問句進行查詢關鍵詞的篩選; 所述查詢擴展模塊,用于利用源短語到復述短語的關聯(lián)關系對篩選出的查詢關鍵詞進 行查詢擴展,得到擴展后的問句。9. 根據(jù)權利要求8所述的裝置,其特征在于,所述獲取模塊具體用于,利用統(tǒng)計機器翻 譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到一次翻譯結果和二次翻譯結果;所述一次翻譯 為從源短語到中間短語的翻譯;所述二次翻譯為從中間短語到復述短語的翻譯;根據(jù)所述 一次翻譯結果和二次翻譯結果確定從源短語到復述短語的關聯(lián)關系。10. 根據(jù)權利要求8所述的裝置,其特征在于,所述關鍵詞篩選模塊包括劃分模塊、第 一確定模塊、第二確定模塊、以及篩選模塊;其中, 所述劃分模塊,用于對用戶輸入的問句進行短語塊劃分,得到若干個查詢短語; 所述第一確定模塊,用于計算確定每個查詢短語在所述問句中的權重系數(shù); 所述第二確定模塊,用于利用所有查詢短語在所述問句中的權重系數(shù)確定權重系數(shù)閾 值; 所述篩選模塊,用于根據(jù)所述權重系數(shù)閾值從所述查詢短語中篩選出所述問句的查詢 關鍵詞。
【專利摘要】本發(fā)明提供了一種獲取復述短語的方法,該方法包括:利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到一次翻譯結果和二次翻譯結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻譯為從中間短語到復述短語的翻譯;根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述短語的關聯(lián)關系。本發(fā)明還提供了一種獲取復述短語的裝置、一種基于復述短語的問題改寫方法及裝置。
【IPC分類】G06F17/28, G06F17/30
【公開號】CN105468609
【申請?zhí)枴緾N201410429144
【發(fā)明人】羅圣美, 陳虹, 張偉男, 張宇
【申請人】中興通訊股份有限公司, 哈爾濱工業(yè)大學
【公開日】2016年4月6日
【申請日】2014年8月27日
當前第3頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
双城市| 内江市| 库车县| 图木舒克市| 攀枝花市| 林西县| 湟源县| 神木县| 湖南省| 安顺市| 华蓥市| 洪洞县| 扶风县| 西充县| 济阳县| 晋州市| 台东市| 黄石市| 英德市| 平潭县| 琼海市| 满洲里市| 锡林浩特市| 治县。| 黔西| 建瓯市| 荥经县| 临潭县| 扎兰屯市| 沙田区| 遂川县| 漳平市| 玉林市| 库车县| 文水县| 承德县| 汝阳县| 辉县市| 长岭县| 思南县| 精河县|