Мнение

Data Scientist vs Data Analyst Лучшие практики

Лучшие способы работать профессионалом на этих популярных технических должностях

Оглавление

  1. Вступление
  2. Специалист по данным
  3. Аналитик данных
  4. Резюме
  5. использованная литература

Вступление

Как человек, который работал в обеих профессиях, я изучил некоторые передовые методы, процессы или приемы, которые помогли мне лучше выполнять свою работу. Работа специалиста по данным и аналитика данных имеет некоторые сходства, а также явные различия, которые также могут относиться к лучшим практикам. В этой статье я выделю три примера передового опыта для каждой позиции. С учетом сказанного, продолжайте читать, если вы хотите узнать немного о том, что я узнал, чтобы вы могли применить это в своей карьере, а также если вам интересно услышать некоторые из лучших практик каждая роль в целом.

Специалист по данным

У специалистов по данным часто намного больше обязанностей, чем то, что обсуждается в образовательных программах. Например, основное внимание в науке о данных при обучении уделяется различным популярным алгоритмам. Конечно, алгоритмы машинного обучения являются ключом к вашим знаниям в области науки о данных, но есть некоторые другие аспекты, которые по-прежнему важны, которые в конечном итоге помогут вам внедрить алгоритм в пригодную для использования модель для вашей компании / бизнеса.

Вот три лучших практики для специалистов по данным:

  • Заявление о проблеме заинтересованных сторон

Работая специалистом по данным, скорее всего, вы фактически не будете работать с другими специалистами по данным (конечно, есть компании, у которых есть несколько специалистов по данным, но даже в этом случае вы можете быть изолированы от отдельных, конкретных проектов ). Обычно вы больше всего работаете с заинтересованной стороной, обычно с менеджером по продукту или кем-то в аналогичной роли. Одним из первых шагов является определение проблемы простым способом, не беспокоясь о науке о данных. После того, как он будет доработан и отточен, вы можете сосредоточиться на том, как наука о данных является решением проблемы.

Вот пример постановки задачи, которую вы и ваше заинтересованное лицо определите: «ручное назначение водителей Uber клиентам занимает много времени». Он понятен и только обсуждает проблему.

  • Анализ усилий заинтересованных сторон

Следующие две передовые практики связаны между собой. Первый описывает, что вы должны составить общий план того, сколько времени займет проект по науке о данных, включая полную временную шкалу, необходимые ресурсы данных, другие ресурсы сотрудников, использование приложений, разработку / проектирование серверной части / интерфейс / использование конечных точек и т. Д. A Многие факторы будут влиять на то, что определяет уровень усилий, необходимых для проекта по науке о данных. Лучше четко понимать, что ожидается от вашего проекта, чтобы у вас было достаточно времени для завершения вашей модели науки о данных.

  • Ресурсы по моделям науки о данных

Как я уже сказал выше, вам нужно будет реализовать главные ресурсы для вашего предстоящего проекта. При анализе ресурсов модели науки о данных следует учитывать следующие моменты: время, усилия, необходимые инструменты и платформы, используемый язык программирования, периодическое обучение - как часто вам нужно будет обучать вашу модель, необходимые данные, нужны другие инженеры, другое ожидаемый предмет и т. д. Как видите, при выделении и запросе ресурсов для вашей модели науки о данных следует учитывать множество факторов.

Все эти передовые практики - это несколько нетехнические шаги, которые следует помнить при разработке модели. Тем не менее, эти методы по-прежнему невероятно важны и будут определять вашу модель науки о данных и алгоритм машинного обучения в будущем.

Аналитик данных

По большей части проекты аналитиков данных обычно выполняются в более короткие сроки, однако они могут выполняться чаще. Это соображение немного по-другому сформирует лучшие практики для аналитиков данных.

Вот три передовых практики для аналитиков данных:

  • Важность фильтра запросов и панели инструментов

Когда аналитик данных получает запрос на запрос или панель мониторинга, есть некоторые вещи, которые следует учитывать при работе с заинтересованной стороной, которая запрашивает любую из этих задач. Вы можете начать с запроса, который представляет собой результат полного набора данных, но затем вы поймете, когда будете возвращаться к заинтересованному лицу, что вам действительно нужны, скажем, три фильтра или, по сути, три оператора WHERE в вашем коде SQL. То же самое можно сказать и о привязке вашего кода SQL к информационной панели, которая имеет кнопку фильтра в качестве опции. Конечно, добавление одного фильтра может дать совсем другой результат, поэтому лучше всего сразу же работать с заинтересованным лицом, чтобы убедиться, что вы находитесь на одной странице с данными, которые действительно хотите вернуть.

  • Определение ожиданий заинтересованных сторон

Подобно анализу усилий заинтересованных сторон и ресурсам модели науки о данных, как аналитику данных, вам нужно будет согласовывать ожидания по срокам. Этот шаг важен, чтобы у вас не было так много запросов одновременно, и вы могли сосредоточиться на правильном выполнении своих задач.

  • Даты, даты, даты

Сроки непростые, и, кажется, вы всегда имеете дело с практически каждым запросом аналитика данных. Они сложны, потому что, если вы создаете запрос или панель мониторинга, вам нужно убедиться, что вы получаете результаты за последний завершенный час или день и т. Д. Этот метод запросов также важен для панелей мониторинга, так что вы показываете сравнения правильно. Например, вы можете показывать еженедельные показатели, но если вы находитесь на текущей неделе, это может ввести в заблуждение, поскольку неделя не завершена. Вы могли бы либо отметить это в запросе, панели управления, отчете и т. Д., Либо возвращать только полные часы / дни / недели и т. Д.

Как видите, все эти передовые практики требуют взаимодействия с другими людьми, вашими заинтересованными сторонами, поэтому важно отметить, что простое заполнение запроса - это не единственное ваше требование, это также необходимо обсудить с заинтересованным лицом.

Резюме

В целом, тенденция и направленность этих передовых методов сосредоточены на сотрудничестве с заинтересованными сторонами для обеих ролей. Этот аспект вашей работы очень важен. С учетом сказанного, я хотел выделить эту часть этих ролей, поскольку, похоже, обсуждались более технические передовые методы, которыми часто пренебрегают.

Подводя итог, вот несколько ключевых выводов о сравнении лучших практик специалистов по данным и бизнес-аналитиков:

* Data Scientist
Stakeholder Problem Statement
Stakeholder Effort Analysis
Data Science Model Resources
* Data Analyst
Query and Dashboard Filter Importance
Setting Stakeholder Expectations
Dates, Dates, Dates

Надеюсь, моя статья была вам интересна и полезна. Пожалуйста, не стесняйтесь оставлять комментарии ниже, если вы согласны или не согласны с этими сравнениями передовых практик. Почему или почему нет? Какие еще факторы, по вашему мнению, важно отметить в отношении передового опыта? Конечно, их можно прояснить еще больше, но я надеюсь, что смог пролить свет на передовой опыт специалистов по данным и бизнес-аналитиков.

Спасибо за чтение!

Я не связан ни с одной из этих компаний.

Не стесняйтесь проверить мой профиль, Matt Przybyla, и другие статьи, а также подписаться на получение уведомлений по электронной почте для моих блогов, перейдя по ссылке ниже, или нажав на значок подписки вверху экрана рядом со значком подписки, и свяжитесь со мной в LinkedIn, если у вас есть какие-либо вопросы или комментарии.

Ссылка для подписки: https://datascience2.medium.com/subscribe

использованная литература

[1] Фото Андреас Классен на Unsplash, (2017)

[2] Фото Christopher Gower на Unsplash, (2017)

[3] Фото Caspar Camille Rubin на Unsplash, (2017)