Обзор компьютерного зрения с использованием изображений наших лиц

Лицо, пожалуй, та часть человеческого тела, которая передает большую часть значимой визуальной информации о человеке. Неудивительно, что на каждом документе, удостоверяющем личность, есть фотография его владельца. В компьютерном зрении несколько систем использовали данные о лицах для решения различных типов задач. В этой серии мы исследуем типы информации и приложений, связанных с человеческим лицом.

В компьютерном зрении существует широкий спектр приложений, использующих информацию с лиц для разных целей: развлечения, слежка, мода и т. д. Многие из этих приложений относятся к области классификации, являясь наиболее актуальными задачами обнаружения и признание. Сложность этих систем различна. Некоторые могут решать проблемы, используя одну необработанную функцию, в то время как другие используют более продвинутые методы для извлечения важной информации.

Человеческое лицо является источником обширной информации. В зависимости от особенностей анализа и того, как это сделать, результаты могут существенно различаться. По этой причине важно иметь хорошее представление о предметной области приложения, чтобы получить правильные результаты. Например, в системе, определяющей настроение человека, разумнее использовать выражение лица, а не цвет волос или глаз.

Нам, людям, легко определить характерные черты объектов, что позволяет нам правильно действовать или реагировать. Однако в компьютерном зрении это нетривиальная задача. Было разработано несколько детекторов признаков общего назначения из изображений, таких как Детектор углов Харриса и знаменитый SIFT. Независимо от их области, конечной целью этих подходов является предоставление информации осмысленным образом. Затем приложение может выполнять заданную задачу с хорошими результатами.

Информация, извлеченная из лиц, может быть использована для подачи в различные системы для различных целей. Многие из альтернатив используют методы машинного обучения, поскольку нейронные сети популярны для таких задач, как обнаружение лиц, распознавание лиц и проверка лиц; все они по своей сути являются классификационными задачами.

В следующих постах мы рассмотрим два основных типа информации в человеческом лице: геометрия и цвет. Там мы увидим типы задач, которые можно решить с помощью этих типов информации.

Привет, я Себастьян. Я разработчик программного обеспечения и консультант по искусственному интеллекту. Работаю в проектах, связанных с машинным обучением, компьютерным зрением и UX. Свяжитесь со мной в LinkedIn.