Система распознавания лиц предназначена для идентификации личности по видеоизображению. Она состоит из двух основных частей:
Детектор лиц производит захват видео из источника и обнаружение в кадре лица человека. Далее, полученные фотографии передаются в ядро распознавания, где происходит вычисление опорных точек, создание дескриптора лица и сравнение полученного дескриптора со списком имеющихся в базе лиц.
Помимо непосредственно распознавания и идентификации, система позволяет:
В основе системы распознавания лиц лежит инновационная технология распознавания образов Re:Action от компании Vision Labs, обладающая лучшими в мире показателями полноты и точности распознавания в реальных условиях (По результатам тестирования на независимой базе данных Labeled Faces in the Wild (LFW), Unrestricted training – Commercial systems http://vis-www.cs.umass.edu/lfw/results.html, University of Massachusetts).
Оригинальный гибридный алгоритм поиска лиц предварительно сканирует изображение каскадным способом, выделяя подозрительные области, которые в дальнейшем аппроксимируются деформируемой шаблонной моделью лица и, в случае положительного отклика, помечаютс я как детектированные лица.
Основанный на наборе эвристик алгоритм выполняет оценку качества изображения лица и возможности дальнейшего распознавания.
От кадра к кадру вычисляется вектор смещения области лица, подтверждая или опровергая прогноз следующей координаты лица, фильтруются ложные срабатывания и формируется галерея наилучших портретов.
Быстрый детектор обнаруживает устойчивые к возрастным и мимическим изменениям ключевые точки лица (от 8 до 56 в зависимости от решаемой задачи), экстраполирует значения координат точек невидимых частей лица (из-за усов, бороды и т.п.) и строит эластичный граф, проверив корректность взаимных пропорций.
Извлеченная последовательность точек посредством серии сверток и матричных преобразований кодируется в уникальный дескриптор (ключ) изображения лица.
Опционально выполняется классификация пола и возрастной группы (ребенок/взрослый/пожилой) лица.
По заранее определенным сценариям выполняется сравнения извлеченного ключа с имеющейся в базе данных или файловой системе ключами, в ответ получая скалярное значение Евклидовой дистанции между парой ключей (степень схожести) с возможность представления в виде процента схожести.
Гибкая система настроек позволяет задавать пороговые значения допустимых колебаний по каждой из величин, вычисляемых в процессе работы системы, что позволяет настроить систему для работы в любых условиях.
Параметр | Значение |
Минимальное разрешение видео | 320 x 240 пикс |
Минимальный размер лица в кадре | 40 x 40 пикс |
Максимальный размер лица в кадре | 200 x 200 пикс |
Вероятность достоверного обнаружения лиц | 93 – 98% |
Допустимый угол крена лиц в кадре | ±10° |
Максимальный наклон видеокамеры без потери качества извлеченных дескрипторов (ключей) | Не более 30° по вертикали |
Формат кадров видео последовательности | Цветное (RGB) |
Последовательность каналов цветного RGB изображения | B-G-R (Blue – Green – Red) |
Количество лиц, одновременно обрабатываемых в кадре | До 5 |
Количество портретов на каждого человека в кадре | 3 |