Abstract
Text recognition in images is a very urgent problem in modern search engines. There are many different methods and techniques for text recognition. The paper is a method for text recognition in a standardized image. Standardized image means an image that has the same font, character size, certain writing order, such as the serial number or license plate of the car. In the paper, we developed an improved method for text recognition in the image. The method consists in a preliminary search of the same characters and memorizing their positions. Identical symbols are recognized only once. After recognition, symbols are arranged in the desired position. Image processing and isolation of character boundaries is performed using JavaCV. The modified method was developed based on the template method. Both methods were implemented in Java language. To create a text-recognition software, a neural network based on a single-layer perceptron was built. The results of tests have shown the superiority of the modified method compared to the original one. At best, the performance of the modified method is 300% of the performance of the original one. At worst, it is slower only by 5-10%. In addition, the modified algorithm requires 3 times fewer iterations. The modified algorithm allows to accelerate the text recognition process in standardized images if they have recurring characters.
Highlights
Разработан модифицированный метод распознавания текста на изображении
При этом необходимо проанализировать и выбрать оптимальный метод распознавания текста для поставленной задачи
Убоженко // Перспективы развития информационных технологий. – 2014. – No 18. – С. 57–61
Summary
Розроблено модифікований метод розпізнавання стандартизованого тексту на зображенні. Виділені етапи обробки зображення перед використанням методу: перетворення зображення в чорно-біле, виправлення спотворень символів, детектування окремих символів. Розпізнавання символів здійснено нейронною мережею за допомогою методу шаблонів. Представлені два варіанти рішення поставленої задачі – перший типовий, другий модифікований. В результаті проведених експериментів підтверджується ефективність модифікованого методу. Ключові слова: розпізнавання тексту, метод шаблонів, еталон, нейронна мережа, перцептрон, OpenCV. Разработан модифицированный метод распознавания текста на изображении. Выделены этапы обработки изображения перед применением метода: преобразование изображения, исправление искажений, детектирование символов. Распознавание символов осуществлено нейронной сетью с помощью метода шаблонов. Представлены два варианта решения поставленной задачи – первый реализован по известному алгоритму, второй модифицированный. В результате проведенных экспериментов подтверждается эффективность модифицированного метода. Ключевые слова: распознавание текста, метод шаблонов, эталон, нейронная сеть, перцептрон, номерной знак, OpenCV
Published Version (Free)
Talk to us
Join us for a 30 min session where you can share your feedback and ask us any queries you have