技術(shù)編號:12667151
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。本發(fā)明涉及語言的信息處理技術(shù)領(lǐng)域,尤其涉及一種基于圖片構(gòu)建資源稀缺語言可比語料庫的方法及系統(tǒng)。背景技術(shù)跨語言語料庫是開展跨語言自然語言處理研究的重要手段,根據(jù)語料庫互譯程度的差異,跨語言語料庫可分為平行語料庫和可比語料庫。平行語料庫(ParallelCorpus)是由源語言文本和翻譯的目標語言文本構(gòu)成的文本對集合,兩種語言文本間存在嚴格的互譯關(guān)系,語料庫質(zhì)量高,是進行跨語言信息處理研究的重要資源,但是平行語料庫構(gòu)建難度大、構(gòu)建成本高;可比語料庫(comparablecorpora)則是語言不同、...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。