Machine Translation into Low-resource Language Varieties

Sachin Kumar

doi:10.48448/bwq8-y897

Abstract

State-of-the-art machine translation (MT) systems are typically trained to generate ``standard'' target language; however, many languages have multiple varieties (regional varieties, dialects, sociolects, non-native varieties) that are different from the standard language. Such varieties are often low-resource, and hence do not benefit from contemporary NLP solutions, MT included. We propose a general framework to rapidly adapt MT systems to generate language varieties that are close to, but different from, the standard target language, using no parallel (source--variety) data. This also includes adaptation of MT systems to low-resource typologically-related target languages. We experiment with adapting an English--Russian MT system to generate Ukrainian and Belarusian, an English--Norwegian Bokmål system to generate Nynorsk, and an English--Arabic system to generate four Arabic dialects, obtaining significant improvements over competitive baselines.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Machine Translation into Low-resource Language Varieties

Abstract

Talk to us

Similar Papers

Lead the way for us

Similar Papers

Baidu Translate: Research and Products
Zhongjun He
-
Zhongjun HeZhongjun He
01 Jan 2015
01 Jan 2015

Shift in Controlled English Norms for Different Purposes and for Different Machine Translation Systems
Chung-Ling Shih
Journal of Universal Language | VOL. 11
Chung-Ling ShihChung-Ling Shih
30 Sep 2010
Journal of Universal Language | VOL. 11

Arabic to English Machine Translation of Verb Phrases Using Rule-Based Approach
S
Journal of Computer Science | VOL. 8
S S
01 Oct 2012
Journal of Computer Science | VOL. 8

Low-Resource Multi-Domain Machine Translation for Spanish-Farsi: Neural or Statistical?
Benyamin Ahmadnia ... Bonnie J Dorr
Procedia Computer Science | VOL. 177
Benyamin Ahmadnia, et. al.Benyamin Ahmadnia ... Bonnie J Dorr
01 Jan 2020
Procedia Computer Science | VOL. 177

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Machine Translation into Low-resource Language Varieties

Abstract

Talk to us

Similar Papers