Abstract

El presente trabajo tiene como objetivo el desarrollo de un sistema de reconocimiento automático de una carta de baraja ubicada sobre una mesa, como parte del proyecto más general de crear un dispositivo para asistir a personas no videntes en el juego de azar denominado “cuarenta”. El objeto de dicho dispositivo será informar al usuario de las cartas en juego, vía audio. Para esta fase del proyecto se utilizó el algoritmo de k-vecinos más cercanos entrenado con un conjunto de caracteres alfanuméricos sintéticos. El conjunto de prueba constó de fotografías tomadas en condiciones controladas de iluminación, con las cartas ubicadas en orientación arbitraria. La parametrización del algoritmo arrojó un valor de 1 como k óptimo, con el cual se obtuvo un error de clasificación en el conjunto de prueba de 5%. Solo dos caracteres fueron confundidos por el clasificador, la “A” y la “J”, con errores de 20% y 40% cada uno. El algoritmo fue implementado en un sistema embebido Raspberry Pi 3, obteniendo un tiempo de respuesta de 5 segundos, incluida la conversión a audio, y una ocupación de memoria RAM que no superó el 60% de la capacidad del sistema. Estos resultados sugieren su aplicabilidad en dispositivos portátiles.

Highlights

  • The present work has the objective of developing a system for the automatic recognition of a playing card on a table, as part of a more general project to create a device to assist the blind in the chance game called “cuarenta”

  • El resultado de aplicar el cambio de orientación se ilustra en la Figura 6c

  • El resultado de este proceso es obtener la región de la carta que contenga la letra correspondiente

Read more

Summary

Introducción

En el Ecuador existen alrededor de 274846 personas no videntes (López, 2010), las personas de este sector de la población aún deben sobrellevar grandes dificultades para poder tener una vida normal, y es una política estatal del gobierno del Ecuador permitir que este escenario cambie en el país y se logre una inclusión más eficaz. El presente trabajo consiste en crear una aplicación para dicho dispositivo en el campo de la inteligencia artificial, puntualmente en la visión por computadora, para realizar las cinco fases del procesamiento de imágenes (Szeliski, 211) descritas en la Figura 1. La imagen es convertida en un vector que contiene la información más relevante de la misma para el problema. El conjunto de entrenamiento consta del vector de características xj, más una variable de atributo que es la clase, denominada Cj, para cada uno de los ejemplos. 2. Hacer una lista con los vectores de características correspondientes a las k distancias más cortas. Gráficamente, y mediante la definición euclídea de distancia en un espacio bidimensional, el algoritmo de k-vecinos más cercanos puede visualizarse en la Figura 2. Algoritmo de k-vecinos más cercanos en un espacio bidimensional

Metodología
Dispositivo Óptico
Sistema de iluminación
Adquisición de imagen
Segmentación
Parametrización de kNN
2.10 Clasificación
2.11. Conversor Text to Speech
Findings
Conclusiones y Recomendaciones

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.