Воскресный брифинг D4S №152
Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта.
24 апр. 2022 г.
Дорогие друзья,
Добро пожаловать в воскресный брифинг, посвященный пасхальному воскресенью.
На этой неделе мы с гордостью объявляем о последнем посте в серии G4Sci: Перекрытие соседей и веса краев. В подстеке V4Sci последний пост посвящен Климатической спирали НАСА, а в Среднем у нас есть резюме 10 лучших книг, которые мы прочитали в 2021 году.
Прежде чем мы углубимся в наше содержание, просто напомним, что в ближайшую среду, 27 апреля, мы углубимся в НЛП с глубоким обучением для всех. Регистрация еще открыта, так что не пропустите!
В нашем регулярно запланированном контенте мы рассматриваем Математические основы методов Монте-Карло, Парадокс Браесса и Бэктестирование моделей машинного обучения по пути Uber.
Из Башни слоновой кости академических кругов у нас есть опрос на тему Справедливость в анализе графов, Как внедрить необнаруживаемые бэкдоры в модели машинного обучения и Как редкость влияет на рынок NFT.
Главной темой книги по науке о данных на этой неделе является книга по науке о данных Правило Байеса: учебное введение в байесовский анализ Дж. В. Стоуна. Как всегда, вы можете найти все рекомендации предыдущих книг на нашем веб-сайте. В видео недели мы рассматриваем Новый золотой век компьютерной архитектуры: история, вызовы и возможности.
Данные показывают, что лучший способ распространения информационного бюллетеня — это распространение из уст в уста, поэтому, если вы думаете, что кому-то из ваших друзей или коллег понравится этот информационный бюллетень, просто перешлите ему это письмо. Это поможет нам распространить информацию!
Всегда разбирайтесь,
Команда D4S
Блог:
Вышел последний пост в подстеке Graphs for Data Science: Перекрытие соседей и веса ребер. Вы должны Зарегистрироваться, чтобы не пропустить пост!
Вышел последний пост в подразделе Visualization for Data Science: Климатическая спираль НАСА. Не забудьте Подписаться, чтобы быть первым в очереди на получение каждого поста.
В последнем посте из серии CoVID-19 Как моделировать эффекты вакцинации рассматривается, как простые модификации модели SIR могут помочь нам лучше понять, как работают вакцины. Как обычно, весь код доступен на GitHub: http://github.com/DataForScience/Epidemiology101
Последний пост из серии Причинно-следственная связь посвящен разделу 3.7 — Медиация, рецепту расчета контролируемого направленного эффекта. Код для каждого поста в блоге из этой серии размещен в специальном репозитории GitHub: https://github.com/DataForScience/Causality
Книга по науке о данных:
На этой неделе книга по науке о данных называется Правило Байеса: учебное введение в байесовский анализ Дж. В. Стоуна. Несмотря на свою простоту, правило Байеса является одной из самых мощных теорем теории вероятностей. Эта относительно короткая книга (170 страниц) представляет собой хороший обзор и практическое введение в байесовский анализ. В то время как основной текст обеспечивает прочную основу для основных идей и концепций, сопутствующий код Python дает вам возможность внедрить эти методы в вашу повседневную работу. В целом, отличное первое введение в тему и хороший справочник, если вы не касались этой области какое-то время.
Лучшие ссылки:
Учебники и сообщения в блогах, которые попались нам на стол на этой неделе.
- Математические основы методов Монте-Карло [scratchapixel.com]
- Парадокс Браесса [rjlipton.wpcomstaging.com]
- Что такое геометрическое глубокое обучение? [a-j.gitbook.io]
- Математика — это больше, чем строгость и доказательства [terrytao.wordpress.com]
- Проклятие системных мыслителей [blog.relyabilit.ie]
- Мне потребовалось 10 лет, чтобы понять энтропию, вот чему я научился [cantorsparadise.com]
- Бэктестинг моделей машинного обучения в стиле Uber [pub.towardsai.net]
Только что из прессы:
Некоторые из самых интересных научных статей, опубликованных за последнее время
- Согласование современной практики машинного обучения и компромисса между смещением и дисперсией (М. Белкин, Д. Хсу, С. Ма, С. Мандал)
- Степенные корреляции в графах с кликовой кластеризацией (П. Манн, В. А. Смит, Дж. Б. О. Митчелл, С. Добсон)
- Дают ли анализы сети мобильности человека, полученные из различных источников данных о местоположении, одинаковые результаты в разных масштабах? (К.-В. Хсу, К. Лю, К.М. Нгуен, Ю.-Х. Чиен, А. Мостафави)
- Справедливость в анализе графов: обзор (Ю. Донг, Дж. Ма, К. Чен, Дж. Ли)
- Как редкость формирует рынок NFT (А. Мекахер, А. Браччи, М. Надини, М. Мартино, Л. Алессандретти, Л. М. Айелло, А. Барончелли)
- Внедрение необнаруживаемых бэкдоров в модели машинного обучения (С. Голдвассер, М. П. Ким, В. Вайкунтанатан, О. Замир)
Видео недели:
Интересные обсуждения, идеи или учебные пособия, которые попадались нам на стол.
Новый золотой век компьютерной архитектуры: история, проблемы и возможности
Все видео недели теперь доступны в нашем плейлисте Youtube.
Предстоящие События
Возможности учиться у нас:
- 27 апреля 2022 г. — НЛП с глубоким обучением для всех [Регистрация]
- 06 мая 2022 г. — Прикладная теория вероятностей для всех [Регистрация]
- 20 мая 2022 г. — Преобразование анализа Excel в модели данных Python и pandas [Регистрация]
- 07.06.2022 — Графы и сетевые алгоритмы для всех [Регистрация] 🆕
- 23 июня 2022 г. — Почему и что, если — причинно-следственный анализ для всех [Регистрация] 🆕
Видео по запросу
Подробные руководства:
- Обработка естественного языка 5,5 часов, охватывающая базовые и продвинутые техники с использованием NLTK и Keras.
- Анализ временных рядов для всех 6 часов, охватывающий предварительную обработку данных, визуализацию, модели ARIMA, ARCH и глубокого обучения.
Благодарим вас за подписку на нашу еженедельную рассылку с кратким обзором мира наук о данных и машинного обучения. Пожалуйста, поделитесь своими контактами, чтобы помочь нам расти!
Публикуется в воскресенье.