Искусственный интеллект, машинное обучение и глубокое обучение: в чем разница?

Почему машины должны учиться? Потому что люди не успевают.

Текущий бум AI / ML является результатом развития особого подхода к обучению, Deep Learning. Искусственный интеллект, машинное обучение и глубокое обучение - все они стали причиной некоторых из самых больших достижений за последний год, и люди отмечают эти технологии взаимозаменяемо. В последнее время технические конференции кишат людьми, желающими узнать больше об искусственном интеллекте, машинном обучении и глубоком обучении, как если бы они были одним и тем же. Каждая из этих технологий имеет богатую историю, но более простой способ отследить разницу - по нашим мотивам.

Разница в мотивации

Машины учатся, потому что у людей есть дела поважнее. Я наполовину шучу, но это хорошее начало. Конечно, есть и другие технические аспекты взаимосвязи ИИ, машинного обучения и глубокого обучения.

Разница в определениях

Искусственный интеллект - это искусственно созданный интеллект, вдохновленный тем, что мы ощущаем как люди. Обучение - это не только часть этого, но и средство, которое мы сами используем для достижения большего интеллекта. Искусственный интеллект - это инструмент, а машинное обучение - способ его создания. Глубокое обучение - это тип машинного обучения, используемый для достижения искусственного интеллекта. Для наглядного представления, вот учебная диаграмма взаимосвязей между ИИ, машинным обучением и глубоким обучением.

Если кто-то спросит, что значит работать с ИИ, я отвечу: «Я работаю над тем, чтобы компьютеры лучше выполняли то, что делают люди». Если кто-то спросит один из способов достижения ИИ, я могу ответить «с помощью машинного обучения» или «глубокого обучения», если быть более конкретным.

Разница в истории

Этот стандарт наличия машин, которые работают лучше людей, был известен Аланом Тьюрингом в его статье 1950 года о Вычислительных машинах и интеллекте, широко известной как Тест Тьюринга (основанный на Имитационной игре). Тьюринг предполагает, что машины могут пройти тест с дискретными наборами правил и конечными автоматами, как сегодня работает большинство компьютерных программ. В самом конце своей статьи он представляет себе идею обучающихся машин, уровня сложности, превышающего мыслящие машины. Тьюринг сначала спросил: Могут ли машины думать? Ближе к концу статьи он спрашивает: Можно ли сделать машину сверхкритической? Первое - о том, сможем ли мы достичь ИИ. Последний вопрос касается того, сможем ли мы достичь ML.

ML был представлен Аланом Тьюрингом в 1950 году. В 1952 году была создана первая компьютерная обучающая программа для изучения стратегий игры в шашки. Первая нейронная сеть была разработана в 1957 году. Глубокое обучение - это дальнейшее развитие искусственных нейронных сетей, но не получило своего названия до 2006 года. С 2010 года в машинном интеллекте был достигнут значительный прогресс. Текущий бум машинного обучения и искусственного интеллекта в основном связан с достижениями в области глубокого обучения.

Чтобы понять разницу между ИИ, машинным обучением и глубоким обучением, еще одним хорошим началом является понимание того, почему мы вообще создали машины для обучения. По мере того, как компьютеры становятся такими же хорошими, как люди (или лучше) в определенных задачах, мы достигаем важных вех в развитии ИИ. Во многих случаях машинное обучение оказалось предпочтительным способом достижения этих целей.

Почему машины учатся

Одним из самых серьезных критических замечаний по поводу предложения Алана Тьюринга о тестировании ИИ является аргумент ассоциативного прайминга (и его дополнительная проблема фрейма). Утверждается, что из-за сложности, с которой мы обретаем наш интеллект, машины не могут осуществить этот процесс. Этот процесс называется обучением, и компьютеры не были так хороши в этом (до сих пор).

Идея заключается в следующем: люди в течение своей жизни развивают определенные ассоциации разной силы между концепциями. Фактически, единственный способ, которым машина может определить, даже в среднем, все ассоциативные силы между человеческими концепциями, - это испытать мир как человеческий кандидат и интервьюируемые. (Французский, 1990)

Поскольку человеческий опыт сложен и запутан, с помощью какой педагогики мы переносим наш опыт на машины? Тьюринг предположил, что машинам, возможно, придется научиться тому пониманию, которое мы принимаем как должное.

Важной особенностью обучающейся машины является то, что ее учитель часто в значительной степени игнорирует то, что происходит внутри, хотя он все еще может в некоторой степени предсказать поведение своего ученика. В наибольшей степени это должно относиться к более позднему обучению машины, возникшей на основе детской машины с хорошо проверенным дизайном (или программой). Это резко контрастирует с обычной процедурой, когда при использовании машины для выполнения вычислений цель состоит в том, чтобы иметь ясную мысленную картину состояния машины в каждый момент вычислений. (Тьюринг, 1950)

Машины учатся, потому что для определенных целей (в настоящее время) предпочтительнее программировать компьютеры так, чтобы они учились разуму, чем программировать компьютеры, чтобы они были умными напрямую. Это может быть предпочтительнее, потому что (1) требуется меньше человеческих усилий, чтобы развивать изученный интеллект (чем непосредственно развивать интеллект); или (2) это может быть предпочтительным, потому что машина работает лучше, когда обучается сама.

На практике машинное обучение полезно, когда проблемы требуют точных прогнозов. Возьмите игру «Двадцать вопросов». Первоначально в нее играли люди. Чтобы заменить одну из них машиной, нам понадобится машина, которая воспроизводит некое подобие человеческого разума. Для «Двадцать вопросов» машинное обучение - не единственный способ достичь искусственного интеллекта, но, возможно, это лучший способ, как показано ниже.

(1) Пример машинного обучения, требующего меньших человеческих усилий:

В двух веб-версиях Twenty Questions, 20Q и Akinator, человек заменен программой. Так как же они заменили человека? Вместо того, чтобы заставлять кого-то создавать базу данных для всех общественных деятелей (всех времен), вы могли бы обучить программу изучать свойства известных людей через людей, отвечающих на вопросы в игре. Это экономит усилия, чтобы сделать это таким образом.

(2) Пример машинного обучения, позволяющего работать лучше

Независимо от того, сколько усилий это экономит, машинное обучение может просто работать лучше, чем другие типы алгоритмов. Сундар Пичай на недавнем мероприятии Google I / O показал, что компьютеры превзошли людей в распознавании изображений. Это достижение было связано с достижениями в области машинного обучения, в частности, глубокого обучения.

Примеры отличий ML от AI

Как показано на приведенном выше графике, компьютеры теперь лучше (во многих отношениях), чем люди, в прогнозировании, идентификации и проверке того, что изображено на изображении. Ниже представлен занимательный коллаж с изображением собак, похожих на кексы, рогалики и швабры. Как узнать разницу? Как компьютер узнает разницу? Для того, чтобы это был ИИ, не имеет значения, как компьютер может отличить разницу, важно только то, что он может. Чтобы это было ML, компьютер должен был обучиться и научиться различать.

Стандартным стандартом интеллекта всегда был наш собственный интеллект и поведение. Если бы мы соотносили наши способности с академическими занятиями в области ИИ и связанных с ними технологий, мы обнаружили, что обучение - это не только навыки, которыми хорошо владеют люди, но и способ достичь мастерства в этих навыках.

Чтобы компьютер мог различать изображения собак и кексов, доказано, что машинное обучение работает лучше, чем другие методы. Однако не для всех задач синтаксического анализа изображений требуется ML. Например, обнаружение линий на изображении может быть выполнено путем формального определения правильной организации пикселей без ML. Точно так же автономные транспортные средства не нуждаются в машинном обучении для обнаружения близлежащих объектов. Можно просто использовать лидар. ИИ крестики-нолики также не нуждается в машинном обучении, как и игра в шахматы.

В частности, если проблемы можно сопоставить с управляемым пространством поиска (например, приведенное выше дерево игры Крестики-нолики), то эвристика поиска может помочь вернуть оптимальный ответ. Чтобы дать более учебный пример, возьмем поиск пути. A *, жадный поиск в глубину или сначала лучший, это хорошо известный алгоритм поиска кратчайших путей из одной точки в другую. Способность A * предсказывать оптимальные пути (показанные ниже) не требует машинного обучения.

Хотя утверждается, что эти проблемы лишают себя возможности быть интеллектуальным занятием (поскольку они могут быть решены алгоритмически), дискредитация всей истории ИИ также немного близорука. Во всяком случае, будущее ИИ - это некая смешанная инициатива человека, формальных моделей, эвристики поиска и машинного обучения.

Что такое глубокое обучение?

Глубокое обучение отвечает на вопросы о том, как машина может чему-то научиться. Машинное обучение - это то, как мы научили компьютеры видеть лучше нас (в определенном смысле), но есть дополнительная сложность в том, как Машина научилась видеть. Как и у людей, существует множество подходов (и тех, которые еще предстоит открыть) в том, как компьютеры могут учиться. Текущий бум AI / ML является результатом развития особого подхода к обучению, Deep Learning.

Одним из наиболее определяющих качеств глубокого обучения на основе других форм ИИ является то, насколько хорошо мы (не понимаем) вычисления, лежащие в основе принимаемых решений и прогнозов. Например, формальная логика обратима. Если A- ›B-› C, вы можете смоделировать эту логику вручную. Глубокое обучение использует скрытые слои искусственных нейронов и не имеет таких дискретных, детерминированных или отслеживаемых шагов. На изображении ниже показана упрощенная иллюстрация глубокого обучения.

На изображении выше показано животное в корзине. Если бы мы хотели предсказать, кошка это или собака, наш мозг (возможно) проанализировал бы длину шерсти и форму головы по направлению к собаке. Для компьютера пиксели изображения являются входным слоем для вывода, между входным слоем и выходом находятся скрытые слои вычислений, которые пытаются определить, какие конкретные группы пикселей могут представлять.

Пиксели фотографии по своей природе неструктурированы. Хотя качества, которые мы ищем, можно формально обосновать (например, длина шерсти или форма головы животного), оказалось, что более эффективно позволить компьютеру понять, что значит быть собакой, и построить свою собственную модель. Эти модели обучаются путем отправки большого количества фотографий собак и кошек на компьютер для обучения заранее.

Но что, если бы данные были более структурированными? Не все проблемы связаны с неструктурированными данными. Допустим, мы играем в игру Угадай, кто?. Подобно предсказанию, есть ли в корзине собака или кошка, Угадай, кто? позволяет игрокам сокращать пространство поиска до тех пор, пока они не смогут точно предсказать, какой образ выбран противником. В этом случае мы можем проследить логику, потому что у нас есть дискретные свойства / качества, с которыми нужно работать. По этой причине вам не потребуется глубокое обучение, чтобы научить машину выигрывать в этой игре.

Akinator и 20Q, онлайн-версии настольной игры Guess Who? - отличные примеры ИИ, созданного с помощью машинного обучения, но не обязательно глубокого обучения. Формально Акинатора можно смоделировать вручную, но он так же хорошо учился, играя снова и снова.

В шахматы и крестики-нолики можно играть на компьютере с жестко запрограммированными правилами и состояниями. Akinator и 20Q более эффективно тренируются при прохождении. Что отличает такие игры, как Go и Starcraft, так это то, что в них гораздо больше пространства поиска, состояний и стратегий. И пока наши машины не станут достаточно мощными, чтобы отображать эти игры целиком, мы полагаемся на глубокое обучение.

Сводка примеров

Как «не отставать от Джонсов»

Итак, где вообще машинное обучение подходит для вашей жизни? Хорошее место для начала - это места, где происходит демократизация ИИ. Google недавно анонсировал Google.ai, который делит пространство машинного обучения на три категории: исследования, инструменты и инфраструктура и приложения. В исследованиях вы работаете над способами создания лучшего ИИ. В инструментах вы найдете способы заставить ИИ работать эффективно. Наконец, в приложении вы будете работать над практиками и способами использования ИИ. Такие компании, как Google, стремятся сделать ML доступным для сотен тысяч разработчиков, а AI используется обычными людьми.

(Если вас действительно интересует производительность ИИ, вот исследовательская статья Авторские рычаги.)