Воскресный брифинг D4S №152

Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта.

24 апр. 2022 г.

Дорогие друзья,

Добро пожаловать в воскресный брифинг, посвященный пасхальному воскресенью.

На этой неделе мы с гордостью объявляем о последнем посте в серии G4Sci: Перекрытие соседей и веса краев. В подстеке V4Sci последний пост посвящен Климатической спирали НАСА, а в Среднем у нас есть резюме 10 лучших книг, которые мы прочитали в 2021 году.

Прежде чем мы углубимся в наше содержание, просто напомним, что в ближайшую среду, 27 апреля, мы углубимся в НЛП с глубоким обучением для всех. Регистрация еще открыта, так что не пропустите!

В нашем регулярно запланированном контенте мы рассматриваем Математические основы методов Монте-Карло, Парадокс Браесса и Бэктестирование моделей машинного обучения по пути Uber.

Из Башни слоновой кости академических кругов у нас есть опрос на тему Справедливость в анализе графов, Как внедрить необнаруживаемые бэкдоры в модели машинного обучения и Как редкость влияет на рынок NFT.

Главной темой книги по науке о данных на этой неделе является книга по науке о данных Правило Байеса: учебное введение в байесовский анализ Дж. В. Стоуна. Как всегда, вы можете найти все рекомендации предыдущих книг на нашем веб-сайте. В видео недели мы рассматриваем Новый золотой век компьютерной архитектуры: история, вызовы и возможности.

Данные показывают, что лучший способ распространения информационного бюллетеня — это распространение из уст в уста, поэтому, если вы думаете, что кому-то из ваших друзей или коллег понравится этот информационный бюллетень, просто перешлите ему это письмо. Это поможет нам распространить информацию!

Всегда разбирайтесь,

Команда D4S

Блог:

Вышел последний пост в подстеке Graphs for Data Science: Перекрытие соседей и веса ребер. Вы должны Зарегистрироваться, чтобы не пропустить пост!

Вышел последний пост в подразделе Visualization for Data Science: Климатическая спираль НАСА. Не забудьте Подписаться, чтобы быть первым в очереди на получение каждого поста.

В последнем посте из серии CoVID-19 Как моделировать эффекты вакцинации рассматривается, как простые модификации модели SIR могут помочь нам лучше понять, как работают вакцины. Как обычно, весь код доступен на GitHub: http://github.com/DataForScience/Epidemiology101

Последний пост из серии Причинно-следственная связь посвящен разделу 3.7 — Медиация, рецепту расчета контролируемого направленного эффекта. Код для каждого поста в блоге из этой серии размещен в специальном репозитории GitHub: https://github.com/DataForScience/Causality

Книга по науке о данных:

На этой неделе книга по науке о данных называется Правило Байеса: учебное введение в байесовский анализ Дж. В. Стоуна. Несмотря на свою простоту, правило Байеса является одной из самых мощных теорем теории вероятностей. Эта относительно короткая книга (170 страниц) представляет собой хороший обзор и практическое введение в байесовский анализ. В то время как основной текст обеспечивает прочную основу для основных идей и концепций, сопутствующий код Python дает вам возможность внедрить эти методы в вашу повседневную работу. В целом, отличное первое введение в тему и хороший справочник, если вы не касались этой области какое-то время.

Лучшие ссылки:

Учебники и сообщения в блогах, которые попались нам на стол на этой неделе.

Только что из прессы:

Некоторые из самых интересных научных статей, опубликованных за последнее время

Согласование современной практики машинного обучения и компромисса между смещением и дисперсией (М. Белкин, Д. Хсу, С. Ма, С. Мандал)
Степенные корреляции в графах с кликовой кластеризацией (П. Манн, В. А. Смит, Дж. Б. О. Митчелл, С. Добсон)
Дают ли анализы сети мобильности человека, полученные из различных источников данных о местоположении, одинаковые результаты в разных масштабах? (К.-В. Хсу, К. Лю, К.М. Нгуен, Ю.-Х. Чиен, А. Мостафави)
Справедливость в анализе графов: обзор (Ю. Донг, Дж. Ма, К. Чен, Дж. Ли)
Как редкость формирует рынок NFT (А. Мекахер, А. Браччи, М. Надини, М. Мартино, Л. Алессандретти, Л. М. Айелло, А. Барончелли)
Внедрение необнаруживаемых бэкдоров в модели машинного обучения (С. Голдвассер, М. П. Ким, В. Вайкунтанатан, О. Замир)

Видео недели:

Интересные обсуждения, идеи или учебные пособия, которые попадались нам на стол.

Новый золотой век компьютерной архитектуры: история, проблемы и возможности

Все видео недели теперь доступны в нашем плейлисте Youtube.

Предстоящие События

Возможности учиться у нас:

27 апреля 2022 г. — НЛП с глубоким обучением для всех [Регистрация]
06 мая 2022 г. — Прикладная теория вероятностей для всех [Регистрация]
20 мая 2022 г. — Преобразование анализа Excel в модели данных Python и pandas [Регистрация]
07.06.2022 — Графы и сетевые алгоритмы для всех [Регистрация] 🆕
23 июня 2022 г. — Почему и что, если — причинно-следственный анализ для всех [Регистрация] 🆕

Видео по запросу

Подробные руководства:

Обработка естественного языка 5,5 часов, охватывающая базовые и продвинутые техники с использованием NLTK и Keras.
Анализ временных рядов для всех 6 часов, охватывающий предварительную обработку данных, визуализацию, модели ARIMA, ARCH и глубокого обучения.

Благодарим вас за подписку на нашу еженедельную рассылку с кратким обзором мира наук о данных и машинного обучения. Пожалуйста, поделитесь своими контактами, чтобы помочь нам расти!

Публикуется в воскресенье.

Воскресный брифинг D4S №152