В Wallaroo наше ведущее видение состоит в том, чтобы сделать развертывание ИИ простым нажатием кнопки и интуитивно понятным. Если мы что-то проектируем и обнаруживаем, что это не так интуитивно понятно, как должно быть, мы не боимся попробовать еще раз. После нескольких итераций мы оптимизировали способ взаимодействия специалистов по данным с платформой до основной концепции: конвейера моделей.

Конвейер содержит все артефакты, необходимые для конкретного процесса машинного обучения: не только все обученные модели, участвующие в этом процессе, но и любую промежуточную обработку данных, которая может потребоваться для запуска моделей. Самый простой конвейер — это единая модель; более сложные пайплайны могут включать связанные модели или несколько моделей, сравниваемых в A/B-тестировании или других экспериментах.

В этой статье мы рассмотрим особенности конвейера Wallaroo и обсудим преимущества организации процессов обработки данных с помощью конвейеров.

Особенности конвейера

Промежуточные этапы обработки

Реальные данные часто должны быть подготовлены и обработаны, прежде чем они будут введены в модель: эта обработка данных и проектирование функций часто являются обязанностью специалиста по данным, который строит модель. Например, у вас может быть процесс машинного обучения, который принимает текст на естественном языке, например вопрос, и выдает понятный человеку ответ. Для этого требуется этап предварительной обработки, который кодирует текст вопроса в числовое представление, понятное модели, и этап постобработки, который переводит выходные данные модели обратно в текст, понятный пользователю.

С помощью Wallaroo специалист по данным может развертывать этапы предварительной и постобработки данных, реализованные в Python, так же, как они развертывают модели, с помощью нашего простого в использовании SDK:

Объединив этапы обработки и модель в конвейер Wallaroo, специалист по данным может задокументировать необходимые этапы обработки данных и убедиться, что они развернуты вместе.

Теперь предположим, что пришло время обновить модель «вопрос-ответ». Если в новой модели используется один и тот же текст до и после обработки, то легко просто обновить модель в конвейере. Если в новой модели используются другие этапы обработки, то по-прежнему просто создать новый конвейер и развернуть его вместо старого!

Комбинируемость

Конвейеры Wallaroo также позволяют объединять несколько моделей в единый поток, включая любую промежуточную обработку данных, которая может потребоваться между моделями. Например, вы можете проанализировать новостные статьи, извлекая объекты, упомянутые в тексте, а затем выполняя анализ тональности этого текста, включая информацию об извлеченных объектах.

Это может включать две модели: модель извлечения сущностей и модель анализа настроений. Эти модели (и связанная с ними обработка данных) могли бы разрабатываться отдельно. С Wallaroo вы можете объединить эти модели в единый конвейер и развернуть их.

A/B-тестирование и теневое развертывание

Конвейеры Wallaroo также имеют явные экспериментальные конфигурации, которые позволяют вам сравнивать, как разные модели работают в реальном мире. Это может быть тест A/B (или A/B/C…), когда входные данные в реальном времени передаются в различные модели в соответствии с критериями, которые может указать пользователь. Или это может быть теневое развертывание, когда основные модели и теневые модели видят все входные данные, и их прогнозы регистрируются, но в систему возвращается только ответ от основной модели. Теневые развертывания позволяют специалистам по обработке и анализу данных «просмотреть», как модель работает с реальными данными, прежде чем полностью приступить к ее использованию в производстве.

Мониторинг моделей

В дополнение к упрощению процесса развертывания конвейеры Wallaroo также позволяют специалистам по обработке и анализу данных добавлять некоторые полезные средства мониторинга и оповещения. Например, если вы используете модель мошенничества с кредитными картами для транзакций по кредитным картам, вы можете отслеживать и получать предупреждения, если необычно большое количество транзакций будет помечено как «мошенничество» за короткий период.

Вы также можете отслеживать входные данные модели, поскольку необычные изменения входных данных модели могут привести к неожиданному или нежелательному поведению модели. Мониторинг модели Wallaroo может выявлять потенциально аномальные входные данные, а также необычное поведение модели и при необходимости отправлять предупреждения, чтобы вы могли выявить потенциальные проблемы, пока не стало слишком поздно.

Содействие процессу развертывания

Процесс принятия решений на основе машинного обучения может состоять из множества движущихся частей, и запуск этих процессов в производство может занять много времени. Платформа Wallaroo и конвейеры помогают специалистам по обработке и анализу данных организовывать и разрабатывать сложные приложения машинного обучения и искусственного интеллекта таким образом, чтобы сделать процесс развертывания проще, быстрее и удобнее в сопровождении.

Хотите провести тест, чтобы увидеть, как конвейеры машинного обучения Wallaroo сравниваются с вашими текущими решениями для развертывания? Свяжитесь с нами по адресу [email protected], чтобы мы могли организовать тест технической оценки.