技術特征:
技術總結
基于圖的雙語遞歸自編碼器,涉及基于深度學習的自然語言處理。從平行語料中抽取雙語短語作為訓練數(shù)據(jù),計算雙語短語之間的翻譯概率;基于樞軸語言的方法,計算復述概率;構造雙語短語的語義關系圖;基于雙語短語的語義關系圖;量化模型目標函數(shù),進行模型參數(shù)訓練。以更好地學習雙語短語嵌入表示為目標,針對傳統(tǒng)方法缺乏考慮自然語言中更加充分的語義約束關系,提出一種基于圖的雙語遞歸自編碼器。算法明確、思路清晰,可以提高學到的雙語短語嵌入表示,更好地作用于自然語言處理任務。首先構造雙語短語的語義關系圖,通過圖結構定義兩個隱式語義約束,用于學習更加精確的雙語短語嵌入表示,進而更好地應用于自然語言處理任務中,如機器翻譯。
技術研發(fā)人員:蘇勁松;殷建民;宋珍巧;阮志偉
受保護的技術使用者:廈門大學
技術研發(fā)日:2017.04.19
技術公布日:2017.08.25