Что произошло на этой неделе в AI от Луи

На этой неделе, посвященной искусственному интеллекту, мы представляем новые доказательства внедрения моделей большого языка (LLM), которые способствуют значительному росту доходов на западном рынке, а также внедрению новых моделей искусственного интеллекта в Китае.

Сообщается, что OpenAI достигла уровня дохода в 1 миллиард долларов, что означает существенный и быстрый рост по сравнению с 28 миллионами долларов, зафиксированными в 2022 году. Все внимание также приковано к новым графическим процессорам Nvidia H100, темпы роста доходов которых, как сообщается, сейчас находятся на высоком уровне. десятки миллиардов. LLM больше не ограничивается нишевыми областями исследований, и ChatGPT вызвал огромное изменение спроса на продукты и инфраструктуру LLM, которые приносят значительный доход. Эта волна интереса также вызвала значительный приток венчурных инвестиций в сектор искусственного интеллекта. Однако еще неизвестно, насколько быстро эта волна инвестиций в API-интерфейсы и инфраструктуру искусственного интеллекта перерастет в потребительские продукты, получившие устойчивое распространение.

Китайские технологические компании и университеты в последние годы также вложили значительные средства в искусственный интеллект и внесли значительный вклад в машинное обучение. Однако, в отличие от других стран, Китай требует, чтобы компании проходили оценку безопасности и получали разрешение на использование моделей искусственного интеллекта. Ранее эта политика задерживала публичный выпуск чат-ботов LLM в Китае. Тем не менее, на этой неделе произошло важное событие: Китай одобрил выпуск новых моделей от 11 фирм. Мы наблюдаем за внедрением этих продуктов в Китае и за тем, как они будут конкурировать с моделями западных конкурентов.

Хотя разработки искусственного интеллекта в Китае являются многообещающими, правительство США ужесточило санкции на поставку ведущих чипов искусственного интеллекта в Китай. Это поднимает вопросы о потенциальном влиянии на прогресс. Остается неясным, насколько обширными будут эти ограничения и как китайские проекты искусственного интеллекта смогут компенсировать это менее эффективными чипами, собственными разработками чипов или производством чипов в Китае, но мы ожидаем, что обучение большинства вычислительных специалистов станет все более сложной задачей. интенсивные модели в будущем.

- Луи Питерс — соучредитель и генеральный директор компании Towards AI

Эта проблема возникла благодаря invideo AI:

Превратите любую идею в видео с помощью одного инструмента искусственного интеллекта

Представьте себе, что у вас есть второй пилот для создания видео — это искусственный интеллект invideo.

Мгновенно преобразуйте свои идеи в потрясающие визуальные эффекты. Дайте ИИ текстовые команды и получите готовое к использованию видео со сценарием, стоковыми медиафайлами, закадровым голосом и субтитрами.

Вносите изменения и корректировки с помощью простых текстовых подсказок. Создание контента стало в 100 раз проще для создателей контента, пользователей YouTube и маркетологов.

Протестируйте сейчас — бесплатно!

Горячие новости

  1. Политика конфиденциальности X подтверждает, что она будет использовать общедоступные данные для обучения моделей ИИ

Недавно обновленная политика конфиденциальности X сообщила своим пользователям, что теперь она будет собирать биометрические данные, а также историю работы и образования пользователей, чтобы помочь в обучении моделей искусственного интеллекта и машинного обучения. В некоторых сообщениях предполагается, что Илон Маск, возможно, частично приобрел Twitter из-за огромного количества собственных обучающих данных, которые можно было бы использовать для обучения систем для его новой компании по искусственному интеллекту.

2. Google делает все возможное в облаке искусственного интеллекта

Недавно Google продемонстрировала расширенную экосистему, включающую как глобальных системных интеграторов, так и более мелких поставщиков облачных услуг, способствуя широкому внедрению предложений Google во всем мире. Хотя Google остается на третьем месте в гонке «инфраструктура как услуга» и «платформа как услуга», Google принимает долгосрочную стратегию и активно инвестирует в искусственный интеллект как ключевой фактор своего будущего в сфере облачных вычислений.

3. WeatherBench 2: эталон для следующего поколения моделей погоды, управляемых данными

Google выпустил набор данных WeatherBench 2, который привлекает все больше внимания в области прогнозирования погоды с помощью искусственного интеллекта. Методы машинного обучения оказываются столь же эффективными, как и модели, основанные на физике, но с преимуществом более быстрого прогнозирования с использованием доступного оборудования. Набор данных WeatherBench 2 призван улучшить исследования машинного обучения в области прогнозирования погоды.

4. Ideogram запускает генератор изображений AI с впечатляющей типографикой

Идеограмма — это альтернативный инструмент искусственного интеллекта, который превосходно генерирует изображения с сильными типографскими возможностями. Он предлагает уникальную функцию генерации текста внутри изображений, эффективно решая общую проблему, с которой сталкиваются популярные генераторы изображений AI.

5. ИИ может задохнуться от собственных выхлопов, заполняя сеть

Эксперты предсказывают, что контент, созданный искусственным интеллектом, вскоре будет доминировать в сети, но это создает такие риски, как информационная перегрузка и деградация. Одной из заметных проблем является «коллапс модели», когда модели ИИ чрезмерно полагаются на предсказуемый выбор слов, что потенциально может привести к потере их способности создавать интересный и детализированный контент.

Пять 5-минутных чтений/видео, которые помогут вам учиться

  1. Трансформеры произвели революцию в искусственном интеллекте. Что их заменит?

Если бы у современного искусственного интеллекта был основополагающий документ, то это была бы исследовательская работа Google 2017 года «Внимание — это все, что вам нужно». В этой статье подробно рассматривается концепция трансформеров, обрисовываются их ограничения и обсуждаются потенциальные альтернативы для преодоления этих недостатков. В нем представлены убедительные альтернативы, подкрепленные здравой логикой.

2. Глоссарий ChatGPT: 41 термин AI, который должен знать каждый

Учитывая темпы развития ИИ, может быть трудно идти в ногу с новейшей терминологией. Этот глоссарий служит ресурсом для тех, кто только знакомится с ИИ, а также для тех, кто ищет ссылки или освежения словарного запаса.

3. Выбор правильной стратегии графического процессора для вашего проекта искусственного интеллекта

В этом руководстве рассматривается решение о том, арендовать или купить графический процессор для вашего проекта искусственного интеллекта. Владение графическим процессором обеспечивает стабильность, тогда как аренда обеспечивает адаптивность. Фрилансеры могут счесть аренду выгодной для краткосрочных проектов, в то время как долгосрочные исследователи могут обнаружить, что владение собственностью более рентабельно.

4. Варианты решения галлюцинаций в генеративном ИИ

В этой статье рассматривается проблема галлюцинаций ИИ в генеративных моделях и представлено решение, известное как поисковая дополненная генерация (RAG). RAG эффективно смягчает галлюцинации, извлекая соответствующий контекст во время генерации данных, что делает его предпочтительным выбором для компаний, занимающихся искусственным интеллектом.

5. Vertex AI LLM Укрепление обучения на основе отзывов людей

В статье предлагается подробное руководство по внедрению обучения с подкреплением с обратной связью от человека (RLHF) в Google Cloud с использованием Vertex AI.

Документы и репозитории

  1. RLAIF: Масштабирование обучения с подкреплением на основе обратной связи от человека с помощью обратной связи от ИИ

Новые результаты Google показывают, что обучение с подкреплением на основе обратной связи искусственного интеллекта (RLAIF) может представлять собой жизнеспособную альтернативу обучению с подкреплением с использованием высококачественных меток человеческих предпочтений (RLHF). RLAIF использует готовую языковую модель для обозначения предпочтений и имеет потенциал для устранения ограничений масштабируемости и повышения эффективности LLM.

2. YaRN: Эффективное контекстное расширение больших языковых моделей

В этом документе представлен YaRN, эффективный в вычислительном отношении метод расширения контекстного окна таких моделей, требующий в 10 раз меньше токенов и в 2,5 раза меньше шагов обучения, чем предыдущие методы. Он был успешно использован для точной настройки моделей LLaMa 2 7B и 13B с контекстными окнами 64 КБ и 128 КБ.

3. Qwen-VL: передовая модель большого визуального языка с универсальными возможностями

Alibaba Cloud представляет Qwen-VL, мощную модель визуального языка, предназначенную для чат-приложений. Qwen-VL объединяет входные изображения и текст для генерации точного текста и ограничивающих рамок, улучшая такие задачи, как создание подписей к изображениям, ответы на вопросы, локализация и понимание текста и изображений.

4. MedAlign: набор данных, созданный врачом, для инструкций по использованию электронных медицинских записей

MedAlign — это ценный набор данных, содержащий 983 инструкции для анализа данных электронных медицинских карт (EHR). Исследователи использовали этот набор данных для оценки производительности шести общих моделей предметных языков. Они выявили значительный уровень ошибок: GPT-4 показал уровень ошибок 35%, а MPT-7B-Instruct имел уровень ошибок 68%.

5. OpenBMB/ЧатДев

ChatDev — это компания, занимающаяся виртуальным программным обеспечением, которая работает через несколько интеллектуальных агентов, каждому из которых назначены разные роли, включая главного исполнительного директора, главного технического директора, программиста, тестировщика и других. Эти агенты в ChatDev сотрудничают, участвуя в специализированных функциональных семинарах, охватывающих такие задачи, как проектирование, кодирование, тестирование и документирование.

Нравятся эти статьи и сводки новостей? Получите ежедневный обзор на свой почтовый ящик!

Раздел сообщества Learn AI Together!

Мем недели!

Мем поделился пользователем neuralink

Избранное сообщение сообщества из Discord

Well.job представила многоязычный семантический поиск, предлагающий возможности семантического поиска с открытым исходным кодом или OpenAI. Это решение создано для работы с любым языком и предлагает простые и эффективные средства для проведения семантического поиска по сходству с использованием библиотеки FAISS на разных языках. Проверьте это на GitHub и поддержите другого участника сообщества. Делитесь своими вопросами и отзывами в теме здесь.

AI-опрос недели!

Присоединяйтесь к обсуждению в Discord.

Кураторский раздел TAI

Статья недели

10 крутых вещей, которые можно сделать с помощью встраивания! [Часть 1] от Зубия Мансур

Отходя от классического машинного обучения (ML), внедрение является основой большинства вариантов использования глубокого обучения (DL). Понимание этой концепции позволяет вам выполнять гибкие задачи с пространством функций и по-другому переосмысливать проблемы ML/DL, особенно с многомерными данными в компьютерном зрении и обработке естественного языка.

Наши статьи, которые обязательно нужно прочитать

Эволюция в вашем коде: понимание и кодирование генетического алгоритма с нуля — Часть 1, автор Фрэнсис Адриан Вирнес

Обучение с подкреплением: динамическое программирование и Монте-Карло — Часть 2, автор Тан Пэнши Элвин

Машинное обучение в масштабе: модель и параллелизм данных, автор Шубхам Сабу

Самый крутой спуск и метод Ньютона в Python, с нуля: сравнение Николо Козимо Альбанезе

Если вы заинтересованы в публикации с помощью Towards AI, проверьте наши рекомендации и зарегистрируйтесь. Мы опубликуем вашу работу в нашей сети, если она соответствует нашей редакционной политике и стандартам.

Предложения о работе

Руководитель группы разработки программного обеспечения @Persado (удалённо)

Консультант по тестированию программного обеспечения QA — США @ReVisionz (Удаленно)

Главный инженер-программист — Vue.JS @Creative Chaos (Удаленно)

Инженер по данным @Mercari (Удаленно)

Стажер по исследованию данных @Clarity AI (Мадрид, Испания)

Инженер данных @Decathlon (Сингапур)

Стажировки для разработчиков программного обеспечения — лето 2023/24 @Phocas Software (Крайстчерч, Новая Зеландия)

Хотите поделиться здесь вакансией? Обращайтесь по адресу [email protected].

Если вы готовитесь к следующему собеседованию по машинному обучению, обязательно посетите наш ведущий сайт подготовки к собеседованию confetti!