Коммунальные предприятия владеют миллионами миль линий электропередач, и им необходимо регулярно их проверять. Аномалии на линиях электропередач могут иметь огромные последствия, такие как большие перебои в подаче электроэнергии, лесные пожары и серьезный риск для жизни людей. Миллионы опор линий электропередач необходимо осматривать под разными углами, чтобы найти дефекты, которые могут быть шириной всего несколько миллиметров.

Вручную просмотреть огромное количество изображений и найти эти дефекты - это утомительная задача.

Sterblue удалось достичь человеческого уровня в нескольких задачах, связанных с аномалиями и сегментацией оборудования для линий электропередач, с помощью современных методов глубокого обучения и анализа данных.

Здесь мы делимся некоторыми базовыми выводами из нашего растущего опыта, далекими от клише об искусственном интеллекте как волшебном инструменте, решающем все проблемы одним щелчком мыши.

Все начинается с хороших данных

Размеченные данные очень высокого качества необходимы для успешного обучения нейронных сетей. Дело в том, что в 2019 году, чтобы добиться успеха в машинном обучении, вам понадобится почти идеальный набор данных.

Вот почему стратегия Sterblue заключается в предоставлении решения для сквозной проверки, которое включает в себя как автоматический анализ данных, так и автоматический сбор данных. Наличие четкого, детерминированного и воспроизводимого плана полета дронов вокруг линий электропередачи критично для получения хорошего однородного набора данных.

После того, как мы начали использовать изображения, снятые с помощью нашего программного обеспечения для дрона, мы заметили значительное улучшение результатов по сравнению с использованием изображений, снятых другими способами.

Много данных

Качественные данные - это одно. Но для того, чтобы изменить мир прикладного ИИ, необходим доступ к большому количеству данных.

Любой проект ИИ, которому не хватает огромного количества обучающих данных, считается провальным, за исключением чрезвычайно редких случаев, когда революционный подход успешно разрабатывается, но здесь мы говорим о событии, которое случается раз в десятилетие. Для нас, остального мира, наличие большой воронки для ввода данных в систему является обязательным условием для получения ценных результатов.

Инструменты сбора данных Sterblue помогают нам получать такие большие объемы данных. Но даже в этом случае совершенно необходимо тратить много энергии на оперативное развертывание решения для сбора данных в больших масштабах. Ежедневно десятки людей участвуют в сборе данных в полевых условиях, что требует дорогостоящей логистической подготовки.

Качественная маркировка

Бесполезно иметь много хороших изображений, если маркировка изображений не на высшем уровне. Sterblue начал с обучения нейронных сетей с использованием изображений, помеченных нашими конечными пользователями (утилитами) на нашей платформе. Однако мы заметили, что качество не всегда было идеальным.

В этом есть смысл: наши конечные пользователи - это именно те люди, которые платят нам за то, чтобы сами не маркировать изображения. Они рады изначально маркировать наборы данных, чтобы запустить конвейер ИИ, но ИИ 2019 года требует больше данных, чем это, и более высокие стандарты качества, которые наши клиенты не могут предоставить без особых усилий с их стороны.

Вот почему мы используем сторонних поставщиков меток данных для очистки наборов данных, чтобы в итоге получить идеальные данные для обучения ИИ. Этот переход несколько месяцев назад был самым значительным изменением, которое мы реализовали для достижения нашей цели.

Знание области бизнеса

Стратегия Sterblue всегда заключалась в обращении к бизнес-вертикали одна за другой. Это оказалось очень ценным, поскольку мы поняли, что глубокие знания предметной области являются критическим фактором успеха в прикладном машинном обучении.

Эти бизнес-знания позволили нам разработать соответствующие представления данных, оптимизировать инструменты маркировки, обеспечить качество данных и многие другие аспекты конвейера обработки данных.

Обучение глубоких нейронных сетей без знания бизнеса было бы похоже на изучение темы, о которой вы ничего не знаете, просто читая книгу: вы думаете, что это может сработать в теории, но на практике это плохо.

С другой стороны, подробные бизнес-знания, которые мы приобрели, взаимодействуя с данными из реального мира в течение нескольких лет, сейчас являются для нас бесценным активом.

Как сделать точную науку реальностью

Как следует из названия, наука о данных - это наука. Некоторые люди изображают это как вид искусства, но как нельзя более ошибаются.

Наука о данных - это наука, а это означает оценку результатов по сравнению с объективными измерениями в реальной жизни и никогда не упускать из виду суровые истины. Легко обмануть себя и с энтузиазмом наблюдать за этими удивительными результатами, полученными вашим ИИ, в то время как вокруг - море мусорных результатов. Последовательные объективные показатели - это хороший способ узнать, где вы находитесь и идете ли вы в правильном направлении. Анекдотических результатов нет.

Успех в искусственном интеллекте достигается не за счет выполнения уникальных трюков, а за счет методичного применения новейших методов со здоровой дозой прагматизма и творчества.

Сила смешивания

Машинное обучение - не полностью решенная проблема. Это означает, что для решения одной проблемы несколько методов могут дать хорошие результаты. Специалисту по анализу данных необходимо быть открытым для различных подходов и пробовать их, чтобы найти наиболее подходящие для конкретного варианта использования.

Часто надежность окончательного решения достигается за счет разумного сочетания нескольких решений. Иллюстрацией этого являются состязательные примеры: простая наклейка или несколько измененных пикселей могут обмануть некоторые архитектуры нейронной сети и спутать объект с другим, казалось бы, несвязанным объектом.

Точно так же, как чистопородные животные самые хрупкие, а животные смешанных рас более устойчивы, применение нейронных сетей для чистопородных животных иногда бывает хрупким. Продукт, сочетающий в себе различные прикладные подходы к машинному обучению, будет более надежным.

Инструментальная поддержка

Мы видим, что достижение ценных результатов в прикладном машинном обучении зависит от нескольких ключевых элементов, перечисленных выше в этом посте.

Я пока не говорил о том, что для эффективного выполнения каждого из этих элементов требуется множество инструментов. Разработка инструментов, поддерживающих и оптимизирующих все эти шаги, - вот что собственно и составляет прикладное машинное обучение.

Разработка новых моделей нейронных сетей - лишь малая часть успеха в прикладном машинном обучении. Основная часть работы - это все вспомогательные инструменты, которые ее окружают.

От суперэффективных интерфейсов для маркировки данных до оптимального планирования полета дронов - все инструменты Sterblue участвуют в обеспечении эффективного масштабного использования машинного обучения.