Abstract

This paper describes COPA-TRAD Version 2.0, a parallel corpus-based system developed at the Universidade Federal de Santa Catarina (UFSC) for translation research, teaching and practice. COPA-TRAD enables the user to investigate the practices of professional translators by identifying translational patterns related to a particular element or linguistic pattern. In addition, the system allows for the comparison between human translation and automatic translation provided by three well-known machine translation systems available on the Internet (Google Translate, Microsoft Translator and Yandex). Currently, COPA-TRAD incorporates five subcorpora (Children's Literature, Literary Texts, Meta-Discourse in Translation, Subtitles and Legal Texts) and provides the following tools: parallel concordancer, monolingual concordancer, wordlist and a DIY Tool that enables the user to create his own parallel disposable corpus. The system also provides a POS-tagging tool interface to analyze and classify the parts of speech of a text.

Highlights

  • This paper describes COPA-TRAD Version 2.0, a parallel corpus-based system developed at the Universidade Federal de Santa Catarina (UFSC) for translation research, teaching and practice

  • Outra ferramenta disponível é o COPA-STATS, que é a parte do COPATRAD relacionada à exibição de estatísticas e gráficos entre outros dados de ordem quantitativa

  • Dada as características técnicas de utilização de um software como o TreeTagger, talvez, seja um desafio para usuários com pouca experiência, ou para alunos que estão começando a estudar as ferramentas de análise automática

Read more

Summary

Introdução

O objetivo deste artigo é apresentar à comunidade acadêmica o Corpus Paralelo de Tradução (COPA-TRAD) Versão 2.0, um sistema computacional desenvolvido com vistas à pesquisa, ensino e prática da tradução. A partir daí, o trabalho inicial de desenvolvimento do COPATRAD teve como responsável, na época, o doutorando Carlos Eduardo da Silva, especialista em engenharia e projetos de software, responsável pela criação de um sistema online para abrigar o corpus, incluindo banco de dados e ferramentas de busca. O objetivo dessa comparação era fornecer subsídios para o aperfeiçoamento do Google Translate, um sistema de tradução automática com base em técnicas computacionais de Redes Neurais (Neural Machine Translation) que identifica padrões tradutórios em textos disponíveis online já traduzidos por tradutores humanos (WU et al, 2016). A partir dessa breve contextualização do cenário institucional no qual o sistema foi desenvolvido, partimos agora para as especificidades da compilação do COPA-TRAD que dividimos em três estágios principais, seguindo a proposta sugerida por Fernandes (2009): projeto, construção e processamento.

Projeto do COPA-TRAD
Construção do COPA-TRAD
Desenvolvimento técnico do sistema
Processamento do COPA-TRAD
COPACONC
MONOCONC
WORDLIST
CORPUS-BUILDER
COPA-STATS
TREETAGGER CLOUD
COPA DASHBOARD
Considerações finais
Full Text
Published version (Free)

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call