欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種獲取復述短語的方法及裝置、問題改寫方法及裝置的制造方法

文檔序號:9708309閱讀:263來源:國知局
一種獲取復述短語的方法及裝置、問題改寫方法及裝置的制造方法
【技術領域】
[0001] 本發(fā)明涉及信息檢索技術,尤其涉及一種獲取復述短語的方法及裝置、基于復述 短語的問題改寫方法及裝置。
【背景技術】
[0002] 在信息檢索的問答系統(tǒng)中,問句與陳述句相比,能提供一些額外信息,如疑問詞、 問題類型和焦點詞等。因此,在實際應用中,為了滿足對問句的有效改寫,可以預先設置針 對特定問句的改寫模板;可以使用語義詞典來進行關鍵詞擴展;還可以使用網(wǎng)絡來挖掘有 用的查詢擴展資源。
[0003] 然而,以上問題的改寫方法存在明顯缺陷:雖然根據(jù)問句得到固定數(shù)量的相關查 詢短語,但沒有考慮語義信息;且需要根據(jù)人工構建規(guī)則建立一個龐大的語義詞典。因此, 在語義詞典不足以覆蓋所有的問句信息,或者在不考慮語義信息的情況下,根據(jù)問句得到 固定數(shù)量的相關查詢短語來通過問答系統(tǒng)進行問句擴展,會嚴重降低問答系統(tǒng)的精確率。

【發(fā)明內(nèi)容】

[0004] 有鑒于此,本發(fā)明實施例期望提供一種獲取復述短語的方法及裝置、基于復述短 語的問題改寫方法及裝置,以獲得源短語到與復述短語的關聯(lián)關系,為高質(zhì)量的問題改寫 奠定基礎,從而有效提高問答系統(tǒng)的精確率。
[0005] 為達到上述目的,本發(fā)明實施例的技術方案是這樣實現(xiàn)的:
[0006] 本發(fā)明實施例提供一種獲取復述短語的方法,該方法包括:
[0007] 利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到一次翻譯結果和二次 翻譯結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻譯為從中間短語到復 述短語的翻譯;
[0008] 根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述短語的關聯(lián)關系。
[0009] 上述方案中,根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述短語的 關聯(lián)關系包括:
[0010] 根據(jù)所述一次翻譯結果確定中間短語的出現(xiàn)概率和從源短語到中間短語的轉(zhuǎn)換 概率;
[0011] 根據(jù)所述二次翻譯結果確定復述短語的出現(xiàn)概率和從中間短語到復述短語的轉(zhuǎn) 換概率;
[0012] 根據(jù)所確定的源短語的出現(xiàn)概率、從源短語到中間短語的轉(zhuǎn)換概率、中間短語的 出現(xiàn)概率、以及從中間短語到復述短語的轉(zhuǎn)換概率,進一步確定從源短語到復述短語的轉(zhuǎn) 換概率。
[0013] 本發(fā)明實施例還提供一種基于復述短語的問題改寫方法,通過統(tǒng)計機器翻譯系統(tǒng) 對每個源短語進行翻譯,得到源短語到復述短語的關聯(lián)關系;該方法還包括:
[0014] 對用戶輸入的問句進行查詢關鍵詞的篩選;
[0015] 利用源短語到復述短語的關聯(lián)關系對篩選出的查詢關鍵詞進行查詢擴展,得到擴 展后的問句。
[0016] 上述方案中,通過統(tǒng)計機器翻譯系統(tǒng)對每個源短語進行翻譯,得到源短語到復述 短語的關聯(lián)關系包括:
[0017] 利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到一次翻譯結果和二次 翻譯結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻譯為從中間短語到復 述短語的翻譯;
[0018] 根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述短語的關聯(lián)關系。
[0019] 本發(fā)明實施例又提供一種獲取復述短語的裝置,該裝置包括:翻譯模塊和確定模 塊;其中,
[0020] 所述翻譯模塊,用于利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到 一次翻譯結果和二次翻譯結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻 譯為從中間短語到復述短語的翻譯;
[0021] 所述確定模塊,用于根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述 短語的關聯(lián)關系。
[0022] 上述方案中,所述確定模塊具體用于,根據(jù)所述一次翻譯結果確定中間短語的出 現(xiàn)概率和從源短語到中間短語的轉(zhuǎn)換概率;
[0023] 根據(jù)所述二次翻譯結果確定復述短語的出現(xiàn)概率和從中間短語到復述短語的轉(zhuǎn) 換概率;
[0024] 根據(jù)所確定的源短語的出現(xiàn)概率、從源短語到中間短語的轉(zhuǎn)換概率、中間短語的 出現(xiàn)概率、以及從中間短語到復述短語的轉(zhuǎn)換概率,進一步確定從源短語到復述短語的轉(zhuǎn) 換概率。
[0025] 本發(fā)明實施例還提供一種基于復述短語的問題改寫裝置,該裝置包括:獲取模塊、 關鍵詞篩選模塊、以及查詢擴展模塊;其中,
[0026] 所述獲取模塊,用于通過統(tǒng)計機器翻譯系統(tǒng)對每個源短語進行翻譯,得到源短語 到復述短語的關聯(lián)關系;
[0027] 所述關鍵詞篩選模塊,用于對用戶輸入的問句進行查詢關鍵詞的篩選;
[0028] 所述查詢擴展模塊,用于利用源短語到復述短語的關聯(lián)關系對篩選出的查詢關鍵 詞進行查詢擴展,得到擴展后的問句。
[0029] 上述方案中,所述獲取模塊具體用于,利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二 次翻譯,依次得到一次翻譯結果和二次翻譯結果;所述一次翻譯為從源短語到中間短語的 翻譯;所述二次翻譯為從中間短語到復述短語的翻譯;根據(jù)所述一次翻譯結果和二次翻譯 結果確定從源短語到復述短語的關聯(lián)關系。
[0030] 上述方案中,所述關鍵詞篩選模塊包括劃分模塊、第一確定模塊、第二確定模塊、 以及篩選模塊;其中,
[0031] 所述劃分模塊,用于對用戶輸入的問句進行短語塊劃分,得到若干個查詢短語;
[0032] 所述第一確定模塊,用于計算確定每個查詢短語在所述問句中的權重系數(shù);
[0033] 所述第二確定模塊,用于利用所有查詢短語在所述問句中的權重系數(shù)確定權重系 數(shù)閾值;
[0034] 所述篩選模塊,用于根據(jù)所述權重系數(shù)閾值從所述查詢短語中篩選出所述問句的 查詢關鍵詞。
[0035] 本發(fā)明實施例所提供的獲取復述短語的方法及裝置、基于復述短語的問題改寫方 法及裝置,利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到一次翻譯結果和二 次翻譯結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻譯為從中間短語到 復述短語的翻譯;根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述短語的關聯(lián) 關系。如此,通過統(tǒng)計機器翻譯系統(tǒng)對每個源短語進行翻譯,得到源短語到復述短語的關聯(lián) 關系,為1?質(zhì)量的問題改與奠定基礎,進而有效提1?問答系統(tǒng)的精確率。
【附圖說明】
[0036] 圖1為本發(fā)明實施例獲取復述短語的方法的實現(xiàn)流程示意圖;
[0037] 圖2為本發(fā)明實施例基于復述短語的問題改寫方法的實現(xiàn)流程示意圖;
[0038] 圖3為本發(fā)明實施例獲取復述短語的裝置的組成結構示意圖;
[0039] 圖4為本發(fā)明實施例基于復述短語的問題改寫裝置的組成結構示意圖;
[0040] 圖5為本發(fā)明實施例基于復述短語的問題改寫裝置中關鍵詞篩選模塊的組成結 構示意圖。
【具體實施方式】
[0041] 下面結合附圖及具體實施例對本發(fā)明再作進一步詳細的說明。
[0042] 在本發(fā)明實施例中,利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到 一次翻譯結果和二次翻譯結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻 譯為從中間短語到復述短語的翻譯;根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語 到復述短語的關聯(lián)關系。
[0043] 進一步地,在通過統(tǒng)計機器翻譯系統(tǒng)獲得從源短語到復述短語的關聯(lián)關系的基礎 上,對用戶輸入的問句進行查詢關鍵詞的篩選;利用源短語到復述短語的關聯(lián)關系對篩選 出的查詢關鍵詞進行查詢擴展,得到擴展后的問句。如此,能夠?qū)崿F(xiàn)高質(zhì)量的問題改寫,進 而有效提1?問答系統(tǒng)的精確率。
[0044] 這里,為了保證問答系統(tǒng)的精確率,在通過統(tǒng)計機器翻譯系統(tǒng)獲得從源短語到復 述短語的關聯(lián)關系的過程中,可以通過現(xiàn)有技術中比較成熟的問答短語數(shù)據(jù)庫來獲取足夠 多的源短語。
[0045] 圖1為本發(fā)明實施例獲取復述短語的方法的實現(xiàn)流程示意圖,如圖1所示,本發(fā)明 實施例獲取復述短語的方法包括:
[0046] 步驟S10 :利用統(tǒng)計機器翻譯系統(tǒng)執(zhí)行一次翻譯和二次翻譯,依次得到一次翻譯 結果和二次翻譯結果;所述一次翻譯為從源短語到中間短語的翻譯;所述二次翻譯為從中 間短語到復述短語的翻譯;
[0047] 步驟S20 :根據(jù)所述一次翻譯結果和二次翻譯結果確定從源短語到復述短語的關 耳關關系。
[0048] 在本發(fā)明實施例中,所述步驟S20包括如下步驟:
[0049] 步驟a,根據(jù)所述一次翻譯結果確定中間短語fphj的出現(xiàn)概率Paphj)和從源短 語到中間短語的轉(zhuǎn)換概率Paphjlph。);
[0050] 這里, tprii
[0051] 其中,
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
彭山县| 天等县| 石泉县| 贵溪市| 外汇| 万山特区| 张掖市| 石林| 新邵县| 个旧市| 辉县市| 新闻| 宜君县| 申扎县| 邛崃市| 长寿区| 吉林市| 湖州市| 容城县| 贡觉县| 左云县| 子长县| 芜湖市| 那坡县| 澎湖县| 海安县| 华容县| 定安县| 全州县| 越西县| 盈江县| 正阳县| 大姚县| 安乡县| 天峻县| 阳信县| 宾川县| 九龙坡区| 溆浦县| 肇州县| 兴隆县|