Abstract

Facial landmark detection is an important sub-task in solving a number of biometric facial recognition tasks. In face recognition systems, the construction of a biometric template occurs according to a previously aligned (normalized) face image and the normalization stage includes the task of finding facial keypoints. A balance between quality and speed of the facial keypoints detector is important in such a problem. This article proposes a CNN-based one-stage detector of faces and keypoints operating in real time and achieving high quality on a number of well-known test datasets (such as AFLW2000, COFW, Menpo2D). The proposed face and facial landmarks detector is based on the idea of a one-stage SSD object detector, which has established itself as an algorithm that provides high speed and high quality in object detection task. As a basic CNN architecture, we used the ShuffleNet V2 network. An important feature of the proposed algorithm is that the face and facial keypoint detection is done in one CNN forward pass, which can significantly save time at the implementation stage. Also, such multitasking allows one to reduce the percentage of errors in the facial keypoints detection task, which positively affects the final face recognition algorithm quality.

Highlights

  • The construction of a biometric template occurs according to a previously aligned face image and the normalization stage includes the task of finding facial keypoints

  • This article proposes a CNN-based one-stage detector of faces and keypoints operating in real time and achieving high quality on a number of well-known test datasets

  • The proposed face and facial landmarks detector is based on the idea of a one-stage SSD object detector, which has established itself as an algorithm that provides high speed and high quality in object detection task

Read more

Summary

Архитектура сети

Общая идея всех алгоритмов семейства SSD заключается в том, что поиск областей и классификация происходят за один проход, в отличие от двухэтапных детекторов объектов семейства R-CNN. Для обнаружения объектов разных масштабов используются глубокие карты признаков разных конволюционных слоев. Подсеть для прогнозирования местоположения объектов предсказывает смещение координат прогнозируемого описывающего прямоугольника относительно центра заданного анкера для каждой ячейки карты признаков, а также показатель уверенности найденного класса объекта. На приведенном изображении карты признаков в одной из ее ячеек приведен пример опорного прямоугольника (анкера) с соотношением сторон 1:1 (пунктирная линия). Выбор опорного положительного (содержащего объект) прямоугольника, относительно которого считается смещение прогнозируемого описывающего прямоугольника, происходит с использованием метрики «пересечение над объединением» (intersection over union, IoU). Для обнаружения лиц на входных изображениях размера 640×640 пикселей применяются карты признаков трех различных масштабов. В нижней части основной сети находятся карты признаков, предназначенные для обработки лиц наименьшего масштаба на изображении.

Мультизадачная функция потерь
Обучающая выборка
Параметры обучения
Методика тестирования
Оценка результатов
Время работы алгоритма
Full Text
Paper version not known

Talk to us

Join us for a 30 min session where you can share your feedback and ask us any queries you have

Schedule a call

Disclaimer: All third-party content on this website/platform is and will remain the property of their respective owners and is provided on "as is" basis without any warranties, express or implied. Use of third-party content does not indicate any affiliation, sponsorship with or endorsement by them. Any references to third-party content is to identify the corresponding services and shall be considered fair use under The CopyrightLaw.