7 навыков, которые помогут улучшить возможности трудоустройства на должность специалиста по обработке и анализу данных

В этой статье я расскажу о вещах, которые помогут вам получить работу по науке о данных в 2022 году. Если вы выполните все эти требования, я считаю, что вы сможете довольно быстро получить работу по науке о данных.

Некоторое время назад я написал аналогичную статью, в которой перечислил необходимые навыки работы с данными на 2020 год. Я чувствую, что был не так уж и далек. Но область науки о данных продолжает меняться, и кажется, что сейчас подходящий момент для создания новой версии.

Но разве наука о данных не умерла?

Я видел несколько статей, ставших вирусными, в которых говорилось, что «наука о данных мертва».

Возможно, золотой период перехода к науке о данных закончился, но вы все еще можете получить работу по науке о данных в 2022 году. Есть много вакансий, и я считаю, что работа (техническая) по работе с данными по-прежнему является хорошим выбором для вас. будущее.

Одно из больших изменений заключается в том, что теперь существует множество конкурирующих должностей. Спецификация должности специалиста по науке о данных по-прежнему сильно различается от одной компании к другой.

Некоторые из этих новых должностей относятся к техническим должностям:

  • Инженер-программист с навыками машинного обучения
  • Инженер по машинному обучению
  • Операции машинного обучения

Некоторые другие ставят работу по науке о данных на уже существующие позиции, например:

  • Аналитик данных с навыками машинного обучения

А некоторые компании хотят нанимать только многокомпетентных кандидатов, которые также в совершенстве владеют Data Engineering, чтобы их рассматривали на должность в области науки о данных.

Должны ли вы знать все?

Редко можно найти людей, которые глубоко разбираются во всех этих темах. Так что нет, вам не нужно знать все это, чтобы получить работу. Однако, если у вас есть время, повышение квалификации может значительно повысить ваши шансы найти себе пару на рынке труда.

В этой статье я представлю список дополнительных навыков, которым вы могли бы потренироваться, если у вас их еще нет. Я надеюсь, что это дало вам хорошее представление о том, что вам нужно делать, если вы хотите максимально увеличить свои шансы получить работу в области обработки данных в 2022 году.

Я не включаю более стандартные навыки, такие как статистика, машинное обучение и Python, поскольку считаю их фундаментальными, и вы можете найти их практически на любом тренинге по науке о данных.

1. Навыки разработки программного обеспечения

Многие инженеры-программисты вновь обратились к специалистам по науке о данных. Это увеличило необходимость овладения навыками разработки программного обеспечения для специалистов по данным, даже если вы изначально не занимались программным обеспечением.

Вот ряд навыков, которые вы можете проверить или подвергнуть сомнению при приеме на работу в области науки о данных.

Структуры данных и алгоритмы

Структуры данных и алгоритмы составляют основу программной инженерии. Однако в степенях науки о данных он не обязательно присутствует, иначе он может быть немного на стороне.

Структуры данных и алгоритмы все чаще становятся частью технических тестов для интервью специалистов по данным. Причина этого в том, что все больше и больше вакансий по науке о данных требуют написания производственного кода и доставки ваших собственных моделей в производственные среды.

В Интернете есть множество обучающих ресурсов по структурам данных и алгоритмам.

Тестирование и написание модульных тестов

Раньше написание тестов и модульное тестирование было прерогативой разработчиков и инженеров-программистов. В 2022 году многие должности в области науки о данных требуют от кандидатов способности писать тесты для собственного кода.

Если вы еще не освоили это, вы можете начать с изучения PyTest, который вполне доступен.

Вы также можете ознакомиться с Разработкой через тестирование и использовать ее, чтобы улучшить свои навыки в этом вопросе.

Совершенство

Чтобы работать специалистом по данным, многие компании также требуют, чтобы вы безупречно использовали git. Раньше этот инструмент предназначался в основном для разработчиков, но сегодня он стал обязательным и для многих специалистов по обработке и анализу данных.

Вы можете ознакомиться с некоторыми ресурсами для начала работы с git (Введение в git и пошаговое руководство по основам git) или сразу перейти к расширенному использованию git.

Докер и контейнеры

Docker — еще одна из тех технологий, которые раньше считались плюсом для специалистов по данным, но быстро стали очень важными. Контейнеры Docker позволяют решить множество проблем с настройкой среды, и это отличный инструмент для любого специалиста по данным, который ожидает, что его код будет использоваться где угодно, кроме его локальной машины.

Вы можете начать работу с Docker здесь.

Выйдите из среды ноутбука

Многие специалисты по данным в настоящее время работают над средами для ноутбуков. На блокнотах и ​​из блокнотов в наше время можно многое сделать. Однако интервьюер может быть критичен, если у вас нет надежной среды в других средах. Возможность продемонстрировать опыт написания автономного программного обеспечения или создания пакетов Python — отличная дополнительная ценность для вашего заявления о приеме на работу.

2. Инженерия машинного обучения и навыки MLOps

Роль инженера по машинному обучению представляет собой сочетание ученого по данным и инженера-программиста. MLOps — это машинное обучение, эквивалентное DevOps.

Возможность запускать свои собственные модели в производство с использованием автоматизированной CI/CD и хорошо спроектированных облачных архитектур — это реальная дополнительная ценность для поиска работы в области обработки данных в 2022 году.

Развертывание

Развертывание моделей не обязательно сложно, но это то, с чем многие специалисты по данным не сталкивались. Либо их работа больше сводилась к аналитике, либо, возможно, в их компании были специальные роли, которые выполняли эту часть работы.

Я настоятельно рекомендую приобрести навыки, необходимые для развертывания моделей, включая знание архитектуры, знание CI/CD, проблемы безопасности, проблемы скорости/производительности модели, мониторинга и т. д.

API, микросервисы и архитектура

Понимание того, как работают API и микросервисы, — отличный первый шаг к этому. Как только вы поймете, как можно преобразовать свой артефакт модели в службу, вы начнете понимать развертывание.

Облачные провайдеры, такие как AWS, предоставляют отличное обучение и сертификацию, которые могут помочь вам повысить квалификацию в этой области.

CI/CD

Второй шаг, который я бы рекомендовал, — изучить CI/CD. Как только вы поймете, как настроить API и предоставлять прогнозы вашей модели таким образом, потребуется много дополнительной работы, чтобы сделать его более надежным.

Автоматизация конвейера CI/CD помогает лучше управлять конвейером развертывания. В конце концов, если вы доставляете свою модель в производственную среду, вы создаете риск для приложений, которые от нее зависят. Вы должны убедиться, что все сделано тщательно.

3. Навыки обработки данных

Data Engineering — одна из самых востребованных профессий на данный момент. Если вы хотите максимизировать свои возможности трудоустройства, лучшим выбором будет наличие набора навыков обработки данных.

Сейчас, когда во многих компаниях есть группы по анализу данных, проблемы с качеством и доступностью данных стали новой горячей темой, а проекты по созданию озера данных и миграции в облако продолжаются повсюду.

Существует множество статей, в которых перечислены навыки работы с данными, поэтому я не буду вдаваться в подробности здесь. Я чувствую, что эта статья дает довольно хороший список, но есть много других списков.

4. Используйте многоязычный язык программирования

Чем больше языков программирования вы освоите, тем меньше шансов, что вы не выполните требования компании. У многих рекрутеров есть просто контрольный список, и отсутствие опыта в одном из этих флажков остановит ваше приложение напрямую.

Некоторые языки программирования, которые вам может потребоваться знать (кроме, конечно, Python):

  • Искра
  • Скала
  • "Юлия"
  • Ржавчина
  • Голанг
  • R
  • САС
  • и более

Различные языки обычно запрашиваются для разных типов должностей. Например, Spark и Scala чаще приглашают на должности в средах больших данных, тогда как R и SAS можно брать на более аналитические роли, а Rust или Golang — на должности, где вы будете писать производственный код.

5. Опыт глубокого обучения

В более легкие времена можно было найти работу, просто зная, как собрать воедино конвейер обучения scikit. Сегодня этого далеко не достаточно, так как рекрутеры будут сканировать ваше резюме на предмет глубокого обучения и ключевых слов, таких как Компьютерное зрение, НЛП, Анализ звука и других.

Чтобы подать заявку на многие должностные инструкции по науке о данных, необходимо освоить Tensorflow и Pytorch. Ожидайте технических тестов по этому вопросу, так как компьютерное зрение и НЛП стали важными вариантами использования во многих областях, в то время как раньше они были лишь небольшим плюсом в резюме несколько раз. лет назад.

Конечно, это также во многом зависит от домена, в котором вы подаете заявку.

Если вы ищете дополнительные вводные руководства по глубокому обучению, вы также можете ознакомиться со статьями здесь или здесь.

6. Вспомни уроки математики

Наука о данных сильно основана на математике. Наличие сильного математического образования является обязательным условием для достижения успеха в науке о данных.

Во время собеседований и технических тестов не удивляйтесь случайному расчету вероятности вручную или выполнению алгебры, оптимизации и даже более сложных задач за относительно короткий промежуток времени, пока рекрутеры наблюдают за тем, что вы делаете.

Если решение математических задач — это не то, чем вы занимаетесь ежедневно (а это касается многих), было бы неплохо потренироваться на большом количестве примеров вопросов, прежде чем идти на техническое собеседование по науке о данных.

7. Будьте экспертом в предметной области

Знание предметной области по-прежнему является большим плюсом при приеме на работу. Если вы подаете заявку на работу в области науки о данных в области, с которой вы хорошо знакомы, у вас больше шансов на успех.

Использовать это как ступеньку в своей карьере специалиста по данным — отличная идея.

Заключение

В заключение, да, вы можете найти работу специалиста по данным в 2022 году. Если вы начинаете с нуля или работаете над текущим преобразованием, это, вероятно, потребует некоторой работы.

Если вы все еще колеблетесь, я бы порекомендовал потратить некоторое время, чтобы выяснить, какая работа лучше всего подходит для вас. Наука о данных — это не золотая жила возможностей трудоустройства: я бы рекомендовал заниматься ею, только если она вам действительно нравится. Вы также можете ознакомиться с описаниями вакансий многих других ИТ-вакансий, которые существуют и расцветают в данный момент.

Я надеюсь, что эта статья дала вам некоторое представление о том, как проводить время во время подготовки к работе в области обработки данных в 2022 году. Спасибо за чтение, и, пожалуйста, следите за обновлениями, чтобы узнать больше о математике, статистике и науке о данных. контент!