Публікації по тегам computer-vision

Публікації на тему 'computer-vision'

Комп'ютерне бачення з людськими обличчями (1/3)

Огляд комп’ютерного зору за допомогою зображень наших облич Обличчя – це, мабуть, та частина людського тіла, яка передає більшість релевантної візуальної інформації про людину. Не дивно, що на кожному документі, що засвідчує особу, є зображення його власника. У комп’ютерному зорі кілька систем використовували дані облич для вирішення різних типів завдань. У цій серії ми досліджуємо типи інформації та застосування, пов’язані з людським обличчям. У комп’ютерному зорі існує широкий..

Як ви рахуєте натовпи?

Мистецтво машинного навчання Як ви рахуєте натовпи? Новий метод підрахунку натовпу на основі зображень Метод Джейкобса, названий на честь людини, яка його придумала, є найпоширенішим способом підрахунку людей на протестах і мітингах . Метод Джейкобса полягає в тому, щоб розділити простір, який займає натовп, на секції, визначити, скільки в середньому людей у кожній секції, і помножити це число на кількість...

Кращий Dropout! Впровадження DropBlock у PyTorch

Кращий Dropout! Впровадження DropBlock у PyTorch Інтерактивну версію цієї статті можна знайти тут DropBlock доступний на окулярах у моїй бібліотеці комп’ютерного зору! вступ Сьогодні ми збираємося реалізувати DropBlock у PyTorch! DropBlock , представлений Ghiasi та іншими, — це спеціальний інструмент для створення зображень, який емпірично працює краще, ніж Dropout. Чому Dropout недостатньо? Проблема з Dropout на зображеннях Вилучення — це техніка регулярізації,..

Штучний інтелект — це двосічний меч нашого майбутнього

Протягом СТОЛІТЬ вчені дивувалися глибинам людського інтелекту. Від створення графіки до створення архітектури, математики та мов, люди завжди вважалися найрозумнішими та найсміливішими з усіх тварин. Протягом ДЕСЯТИЛІТЬ науковцям вдалося розробити нові технології для допомоги людям, від калькуляторів до автономних роботів і нових дронів. Тепер постає питання, чи можемо ми зробити цю технологію такою ж розумною, як люди? Вчені та дослідники займалися цим протягом багатьох років і..

Багатозадачні архітектури

Полегшені моделі для багатозадачного висновку в реальному часі вступ Ви коли-небудь замислювалися, як навчити глибоку нейронну мережу робити багато речей? Така модель називається багатозадачною архітектурою і може мати переваги порівняно з традиційним підходом, який використовує окремі моделі для кожного завдання. Багатозадачна архітектура — це підмножина багатозадачного навчання, яке є загальним підходом до навчання моделі або набору моделей для виконання кількох завдань одночасно...

Представлення зображення та попередня обробка: вивчення форматів і методів

Представлення зображення та попередня обробка: вивчення форматів і методів Вступ. У сучасному цифровому світі зображення відіграють вирішальну роль у різних програмах, починаючи від фотографії та веб-дизайну до комп’ютерного бачення та машинного навчання. Розуміння різних форматів зображень і використання відповідних методів попередньої обробки є важливими для оптимізації даних зображень і досягнення бажаних результатів. У сферах комп’ютерного зору та машинного навчання зображення є..

GAN — Чому так важко навчити Generative Adversarial Networks!

Легше впізнати картину Моне, ніж намалювати. Генеративні моделі (створення даних) вважаються набагато складнішими порівняно з дискримінаційними моделями (обробка даних). Тренувати GAN теж важко. Ця стаття є частиною серії GAN , і ми дослідимо, чому навчання таке невловиме. Завдяки дослідженню ми розуміємо деякі фундаментальні проблеми, які керують напрямками багатьох дослідників. Ми розглянемо деякі розбіжності, щоб знати, куди можуть прямувати дослідження. Перш ніж розглядати..