Публикации по теме 'computer-vision'


Компьютерное зрение с человеческими лицами (1/3)
Обзор компьютерного зрения с использованием изображений наших лиц Лицо, пожалуй, та часть человеческого тела, которая передает большую часть значимой визуальной информации о человеке. Неудивительно, что на каждом документе, удостоверяющем личность, есть фотография его владельца. В компьютерном зрении несколько систем использовали данные о лицах для решения различных типов задач. В этой серии мы исследуем типы информации и приложений, связанных с человеческим лицом. В компьютерном..

Как считать толпу?
Искусство машинного обучения Как считать толпу? Новый метод подсчета толпы на основе изображений Метод Джейкобса, названный в честь человека, который его придумал, является наиболее распространенным способом подсчета людей на протестах и ​​митингах . Метод Джейкобса состоит в том, чтобы разделить пространство, занимаемое толпой, на секции, вычислить, сколько людей в среднем находится в каждой секции, и умножить это число на количество…

Лучше бросить учебу! Реализация DropBlock в PyTorch
Лучше бросить учебу! Реализация DropBlock в PyTorch Интерактивную версию этой статьи можно найти здесь . DropBlock доступен на очках в моей библиотеке компьютерного зрения! Вступление Сегодня мы собираемся внедрить DropBlock в PyTorch! DropBlock , представленный Ghiasi и др., Представляет собой методику регуляризации, специально предназначенную для изображений, которая эмпирически работает лучше, чем Dropout. Почему Dropout недостаточно? Проблема с выпадением..

Искусственный интеллект - обоюдоострый меч нашего будущего
В течение ВЕКОВ ученых интересовали глубины человеческого разума. От создания графики до создания архитектуры, математики и языков - люди всегда считались самыми умными и храбрыми из всех животных. В течение ДЕСЯТИЛЕТИЯ ученые смогли разработать новые технологии для помощи людям, от калькуляторов до автономных роботов и новых дронов. Теперь возникает вопрос: можем ли мы сделать эту технологию такой же умной, как люди? Ученые и исследователи занимались этим годами и вернулись с такими..

Многозадачные архитектуры
Облегченные модели для многозадачного вывода в реальном времени Введение Вы когда-нибудь задумывались, как научить глубокую нейронную сеть делать множество вещей? Такая модель называется многозадачной архитектурой и может иметь преимущества по сравнению с традиционным подходом, использующим отдельные модели для каждой задачи. Многозадачная архитектура — это подмножество многозадачного обучения, которое представляет собой общий подход к обучению модели или набора моделей для..

Представление изображений и предварительная обработка: изучение форматов и методов
Представление изображений и предварительная обработка: изучение форматов и методов Введение. В современном цифровом мире изображения играют решающую роль в различных приложениях, начиная от фотографии и веб-дизайна и заканчивая компьютерным зрением и машинным обучением. Понимание различных форматов изображений и использование соответствующих методов предварительной обработки необходимы для оптимизации данных изображения и достижения желаемых результатов. В области компьютерного..

GAN - Почему так сложно обучить генеративные состязательные сети!
Картину Моне распознать легче, чем нарисовать. Генеративные модели (создание данных) считаются гораздо более сложными по сравнению с дискриминантными моделями (обработка данных). Тренировать GAN тоже сложно. Эта статья является частью серии GAN , и мы исследуем, почему обучение так неуловимо. Благодаря этому исследованию мы понимаем некоторые фундаментальные проблемы, которые определяют направления многих исследователей. Мы рассмотрим некоторые разногласия, чтобы знать, к чему могут..