Abstract

La constitution et l’évaluation de ressources annotées ainsi que des systèmes automatiques d’annotation revêtent une importance grandissante en linguistique et en TAL. Pour autant, les méthodes d’évaluation ne sont pas toujours maîtrisées ni utilisées à bon escient, notamment en linguistique où la nature séquentielle des données textuelles nécessite des méthodes spécifiques. Dans cet article, nous analysons tout d’abord les notions de corpus et d’annotation dans leurs multiples formes, puis nous nous focalisons sur les questions d’évaluation qui en résultent. Nous insistons en particulier sur la différence de nature qui existe entre l’évaluation d’un système d’annotation et l’évaluation de ressources multi-annotées manuellement, et nous donnons un aperçu des outils d’évaluation existants et leur usage possible dans chacun de ces deux cas.

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.