Повседневная жизнь специалиста по данным в отрасли

Вам все еще интересно, как выглядит повседневная жизнь профессионального специалиста по данным?

Позвольте мне пролить свет на это и поделиться несколькими полученными мною советами, которые помогут вам стать профессиональным специалистом по данным.

Проблема

Большинство студентов, изучающих науку о данных, с которыми я разговариваю, ошеломлены огромным количеством контента, который они находят в Интернете.

Существуют тысячи онлайн-курсов, сообщений в блогах и вебинаров, которые охватывают различные инструменты, алгоритмы и технологии в мире науки о данных.

Однако до сих пор остается неясным, как выглядит реальная повседневная жизнь профессионального специалиста по данным.

Как выглядит реальная работа по науке о данных?

Давайте рассмотрим это слепое пятно в этой статье.

Роль специалиста по данным

Как специалист по данным, вы, по сути, являетесь «интерфейсом» между двумя командами:

  • Разработчики/инженеры данных 👷
  • Люди бизнеса/продукта 👩🏻‍💼

Ваша роль — наводить мосты (то есть продукты данных), которые переводят абстрактные данные в высококачественные бизнес-решения.

Чем больше вы общаетесь с обоими мирами, тем эффективнее будет ваша работа. Однако каждая из этих двух команд говорит на «немного другом языке».

Общение с деловыми/продуктовыми людьми

Заинтересованные стороны бизнеса, такие как руководители продуктов, сосредоточены на установлении и достижении четких бизнес-результатов. Вам нужно регулярно общаться с ними, чтобы убедиться, что вы решаете нужную проблему для компании.

Нет ничего более разочаровывающего, чем создание идеального решения… для неправильной проблемы.

Например, ваши лиды по продуктам могут подойти к вам и сказать что-то вроде:

👩🏻‍💼: «Мы хотим увеличить удержание пользователей на 5% к концу этого квартала. Есть идеи?"

Прохладный. Вы знаете, ЧТО вам нужно решить.

Давайте теперь перейдем к тому, КАК вы можете это решить.

Для этого вам нужны релевантные качественные данные. Без высококачественных данных вы не сможете измерить удержание и, следовательно, не сможете измерить свой прогресс. Без качественных данных вы с треском провалитесь.

Разговор с дата-инженерами

Инженеры данных позаботятся об инфраструктуре, необходимой для предоставления вам доступа к высококачественным данным. Так что они ваш лучший союзник на данном этапе.

Переписка между вами и инженером данных ОБЯЗАТЕЛЬНА, если вы хотите добиться успеха в качестве специалиста по данным.

Хорошие разговоры между инженерами данных и учеными приводят к конкретным действиям. Например:

  • давайте добавим сторонние данные Facebook, чтобы обогатить профили пользователей, или
  • удалить повторяющиеся записи в таблице транзакций или
  • сделать данные доступными для интерфейсных панелей.

Когда у вас есть высококачественные данные и четкий бизнес-результат, вы готовы творить магию науки о данных.

Обычная магия «науки о данных»

Три способа решения бизнес-задач с использованием данных:

№1. Создайте панель мониторинга с помощью Tableau/Power BI.

Создайте панель управления удержанием пользователей, которую ведущий специалист сможет использовать для разбивки этой метрики по соответствующим свойствам пользователя (например, по географическому положению, возрасту). Информационные панели — отличный способ поддерживать диалог между людьми, занимающимися продуктом, и вами.

Я лично рекомендую вам начать с этого.

№ 2. Запустите исследование данных

Изучите данные самостоятельно, чтобы найти легко висящие плоды (также известные как быстрые победы). Например, вы можете обнаружить, что определенные кампании в Facebook привлекают пользователей с низким уровнем удержания, поэтому вы отправляете запрос маркетинговой команде, чтобы остановить их. Быстрая и легкая победа. Я люблю это.

№3. Обучить модель машинного обучения

Иногда вам нужно вытащить большие пушки и использовать машинное обучение. Например, вы можете построить модель прогнозирования оттока, чтобы определить клиентов, которые могут уйти. Имея эту информацию, маркетинговая команда может отправлять предложения этим пользователям и поддерживать их активность.

Мой совет: машинное обучение очень заманчиво. Но часто вам не нужно его использовать. Попробуйте № 1 и № 2, прежде чем прибегать к ML.

Как этого достичь: проектное обучение

Каждый профессиональный специалист по данным должен освоить несколько навыков для реализации любого из трех решений, упомянутых выше. Тогда возникает вопрос: что это за навыки?

Какие навыки мне нужно освоить, чтобы стать профессиональным специалистом по данным?

На мой взгляд, любой специалист по данным должен знать:

  • SQL: без данных не может быть специалиста по данным. А чтобы запрашивать и извлекать данные для своих проектов, вам необходимо освоить SQL. Без него вы будете медленным и зависимым от дата-инженеров.
  • Python: основной язык программирования в науке о данных и машинном обучении благодаря обширной экосистеме библиотек с открытым исходным кодом.
  • Презентация и визуализация: специалист по данным является «посредником» между заинтересованными сторонами бизнеса и инженерами данных. Таким образом, вам нужно говорить и представлять информацию действенным образом, уделяя особое внимание ее влиянию на бизнес.
  • Машинное обучение (ML). ML — это создание программного обеспечения на основе данных. Он используется для автоматизации и улучшения операций и бизнес-решений.
  • (Немного) облачных сервисов. У большинства компаний инфраструктура находится в облаке (например, AWS, Google Cloud или Azure). Важно, чтобы вы чувствовали себя комфортно, работая в облачной среде и создавая решения, которые интегрируются с облачными службами.
  • (Немного) библиотек глубокого обучения: если вы хотите углубиться в компьютерное зрение или обработку естественного языка, вам нужно понимать нейронные сети, как их обучать и как их настраивать.

Большинство людей придерживаются подхода, основанного на курсах, когда они начинают много курсов (и заканчивают часть из них). Это не то, что работает лучше всего для меня.

Вместо этого я предлагаю вам учиться, следуя проектному подходу.

→ Выберите проблему, которая вас волнует

→ Найдите данные, относящиеся к нему.

→ Создайте решение (любое из трех упомянутых выше) и сделайте его общедоступным (например, GitHub).

И повторить.

Единственный способ изучить науку о данных — это решать задачи науки о данных.

Хотите стать профессионалом в области машинного обучения и науки о данных?

🚀 Подпишитесь на информационный бюллетень Datamachines, чтобы узнать о реальном подходе к машинному обучению и науке о данных.

➡️ Подключайтесь в Twitter🐦, LinkedIn👔

💎 Стань участником сегодня, используя мою реферальную ссылкуи получи неограниченный доступ ко всему контенту, который я публикую на Medium, и поддержи мое письмо.



Удачного обучения 🤗

Пау