Herramientas para la codificación, el análisis y la explotación de un corpus oral de aprendices francófonos de español

Cristina Muñoz

doi:10.1344/teisel.v3.44741

Abstract

En este trabajo se analiza el uso de tres herramientas digitales para la codificación, el análisis y la explotación de un corpus oral de aprendices de L2. En primer lugar, se presenta la creación, codificación y actualización del corpus, que se compiló con el objetivo de analizar los errores cometidos en el plano oral por parte de un grupo compuesto por 51 informantes franceses, estudiantes de segundo año de Lenguas Extranjeras Aplicadas de la Universidad François Rabelais de Tours (Francia). Una vez conseguido el material auditivo, se procedió a la transcripción y anotación textual codificada, siguiendo la normativa que marca Text Encoding Initiative. Esta investigación se valió de ciertas herramientas digitales, como XML Formatter (https://jsonformatter.org/xml-formatter), XML Validator (https://codebeautify.org/xmlvalidator), VS Studio (https://code.visualstudio.com/), Git (https://git-scm.com/), GitHub (https://github.com/), SpaCy (https://SpaCy.io/), CATMA (https://catma.de/) y Google Colaboratory (https://colab.google/), que contribuyeron al desarrollo del análisis y la explotación del corpus oral, sirviendo para la configuración y validación de la cabecera del corpus (XML Formatter - Validator), para el etiquetado del corpus (VS Studio), para el control y almacenaje de las versiones (Git-GitHub) y para la actualización del corpus (SpaCy permite nuevos análisis, Google Colaboratory es un instalador de software usado junto a SpaCy, y con CATMA se desarrolla el nuevo etiquetado).

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

R Discovery Prime

R Discovery Prime

Herramientas para la codificación, el análisis y la explotación de un corpus oral de aprendices francófonos de español

Abstract

Talk to us

Similar Papers

More From: TEISEL. Tecnologías para la investigación en segundas lenguas

Lead the way for us

Journal: TEISEL. Tecnologías para la investigación en segundas lenguas	Publication Date: Mar 11, 2024
License type: CC BY 4.0

Similar Papers

GRAPE-MARS: una nueva herramienta para el análisis multimodal en la investigación sobre segundas lenguas
Inmaculada Fortanet Gómez ... Julia Valeiras Jurado
TEISEL. Tecnologías para la investigación en segundas lenguas | VOL. 4
Inmaculada Fortanet Gómez, et. al.Inmaculada Fortanet Gómez ... Julia Valeiras Jurado
25 Sep 2024
TEISEL. Tecnologías para la investigación en segundas lenguas | VOL. 4

El Corpus léxico del español de Colombia CorlexCo y su aplicación a la investigación sobre el español LE y L2
Gloria Viviana Nieto Martín
TEISEL. Tecnologías para la investigación en segundas lenguas | VOL. 3
Gloria Viviana Nieto MartínGloria Viviana Nieto Martín
03 Jun 2024
TEISEL. Tecnologías para la investigación en segundas lenguas | VOL. 3

Reseña de Manchón, Rosa M.; Roca de Larios, Julio (Eds.) (2023). Research Methods in the Study of L2 Writing Processes. John Benjamins Publishing Company
Aymé Pino Rodriguez
TEISEL. Tecnologías para la investigación en segundas lenguas | VOL. -
Aymé Pino RodriguezAymé Pino Rodriguez
18 May 2024
TEISEL. Tecnologías para la investigación en segundas lenguas | VOL. -

Automating task design: bridging the gap between second language research and L2 instruction
Joan Castellví ... Roger Gilabert Guerrero
TEISEL. Tecnologías para la investigación en segundas lenguas | VOL. -
Joan Castellví, et. al.Joan Castellví ... Roger Gilabert Guerrero
09 Apr 2024
TEISEL. Tecnologías para la investigación en segundas lenguas | VOL. -

Editage

Paperpal

R Discovery

Mind the Graph

R Discovery Prime

R Discovery Prime

Herramientas para la codificación, el análisis y la explotación de un corpus oral de aprendices francófonos de español

Abstract

Talk to us

Similar Papers

More From: TEISEL. Tecnologías para la investigación en segundas lenguas