Мнение
Data Scientist vs Data Analyst Лучшие практики
Лучшие способы работать профессионалом на этих популярных технических должностях
Оглавление
- Вступление
- Специалист по данным
- Аналитик данных
- Резюме
- использованная литература
Вступление
Как человек, который работал в обеих профессиях, я изучил некоторые передовые методы, процессы или приемы, которые помогли мне лучше выполнять свою работу. Работа специалиста по данным и аналитика данных имеет некоторые сходства, а также явные различия, которые также могут относиться к лучшим практикам. В этой статье я выделю три примера передового опыта для каждой позиции. С учетом сказанного, продолжайте читать, если вы хотите узнать немного о том, что я узнал, чтобы вы могли применить это в своей карьере, а также если вам интересно услышать некоторые из лучших практик каждая роль в целом.
Специалист по данным
У специалистов по данным часто намного больше обязанностей, чем то, что обсуждается в образовательных программах. Например, основное внимание в науке о данных при обучении уделяется различным популярным алгоритмам. Конечно, алгоритмы машинного обучения являются ключом к вашим знаниям в области науки о данных, но есть некоторые другие аспекты, которые по-прежнему важны, которые в конечном итоге помогут вам внедрить алгоритм в пригодную для использования модель для вашей компании / бизнеса.
Вот три лучших практики для специалистов по данным:
- Заявление о проблеме заинтересованных сторон
Работая специалистом по данным, скорее всего, вы фактически не будете работать с другими специалистами по данным (конечно, есть компании, у которых есть несколько специалистов по данным, но даже в этом случае вы можете быть изолированы от отдельных, конкретных проектов ). Обычно вы больше всего работаете с заинтересованной стороной, обычно с менеджером по продукту или кем-то в аналогичной роли. Одним из первых шагов является определение проблемы простым способом, не беспокоясь о науке о данных. После того, как он будет доработан и отточен, вы можете сосредоточиться на том, как наука о данных является решением проблемы.
Вот пример постановки задачи, которую вы и ваше заинтересованное лицо определите: «ручное назначение водителей Uber клиентам занимает много времени». Он понятен и только обсуждает проблему.
- Анализ усилий заинтересованных сторон
Следующие две передовые практики связаны между собой. Первый описывает, что вы должны составить общий план того, сколько времени займет проект по науке о данных, включая полную временную шкалу, необходимые ресурсы данных, другие ресурсы сотрудников, использование приложений, разработку / проектирование серверной части / интерфейс / использование конечных точек и т. Д. A Многие факторы будут влиять на то, что определяет уровень усилий, необходимых для проекта по науке о данных. Лучше четко понимать, что ожидается от вашего проекта, чтобы у вас было достаточно времени для завершения вашей модели науки о данных.
- Ресурсы по моделям науки о данных
Как я уже сказал выше, вам нужно будет реализовать главные ресурсы для вашего предстоящего проекта. При анализе ресурсов модели науки о данных следует учитывать следующие моменты: время, усилия, необходимые инструменты и платформы, используемый язык программирования, периодическое обучение - как часто вам нужно будет обучать вашу модель, необходимые данные, нужны другие инженеры, другое ожидаемый предмет и т. д. Как видите, при выделении и запросе ресурсов для вашей модели науки о данных следует учитывать множество факторов.
Все эти передовые практики - это несколько нетехнические шаги, которые следует помнить при разработке модели. Тем не менее, эти методы по-прежнему невероятно важны и будут определять вашу модель науки о данных и алгоритм машинного обучения в будущем.
Аналитик данных
По большей части проекты аналитиков данных обычно выполняются в более короткие сроки, однако они могут выполняться чаще. Это соображение немного по-другому сформирует лучшие практики для аналитиков данных.
Вот три передовых практики для аналитиков данных:
- Важность фильтра запросов и панели инструментов
Когда аналитик данных получает запрос на запрос или панель мониторинга, есть некоторые вещи, которые следует учитывать при работе с заинтересованной стороной, которая запрашивает любую из этих задач. Вы можете начать с запроса, который представляет собой результат полного набора данных, но затем вы поймете, когда будете возвращаться к заинтересованному лицу, что вам действительно нужны, скажем, три фильтра или, по сути, три оператора WHERE
в вашем коде SQL. То же самое можно сказать и о привязке вашего кода SQL к информационной панели, которая имеет кнопку фильтра в качестве опции. Конечно, добавление одного фильтра может дать совсем другой результат, поэтому лучше всего сразу же работать с заинтересованным лицом, чтобы убедиться, что вы находитесь на одной странице с данными, которые действительно хотите вернуть.
- Определение ожиданий заинтересованных сторон
Подобно анализу усилий заинтересованных сторон и ресурсам модели науки о данных, как аналитику данных, вам нужно будет согласовывать ожидания по срокам. Этот шаг важен, чтобы у вас не было так много запросов одновременно, и вы могли сосредоточиться на правильном выполнении своих задач.
- Даты, даты, даты
Сроки непростые, и, кажется, вы всегда имеете дело с практически каждым запросом аналитика данных. Они сложны, потому что, если вы создаете запрос или панель мониторинга, вам нужно убедиться, что вы получаете результаты за последний завершенный час или день и т. Д. Этот метод запросов также важен для панелей мониторинга, так что вы показываете сравнения правильно. Например, вы можете показывать еженедельные показатели, но если вы находитесь на текущей неделе, это может ввести в заблуждение, поскольку неделя не завершена. Вы могли бы либо отметить это в запросе, панели управления, отчете и т. Д., Либо возвращать только полные часы / дни / недели и т. Д.
Как видите, все эти передовые практики требуют взаимодействия с другими людьми, вашими заинтересованными сторонами, поэтому важно отметить, что простое заполнение запроса - это не единственное ваше требование, это также необходимо обсудить с заинтересованным лицом.
Резюме
В целом, тенденция и направленность этих передовых методов сосредоточены на сотрудничестве с заинтересованными сторонами для обеих ролей. Этот аспект вашей работы очень важен. С учетом сказанного, я хотел выделить эту часть этих ролей, поскольку, похоже, обсуждались более технические передовые методы, которыми часто пренебрегают.
Подводя итог, вот несколько ключевых выводов о сравнении лучших практик специалистов по данным и бизнес-аналитиков:
* Data Scientist Stakeholder Problem Statement Stakeholder Effort Analysis Data Science Model Resources * Data Analyst Query and Dashboard Filter Importance Setting Stakeholder Expectations Dates, Dates, Dates
Надеюсь, моя статья была вам интересна и полезна. Пожалуйста, не стесняйтесь оставлять комментарии ниже, если вы согласны или не согласны с этими сравнениями передовых практик. Почему или почему нет? Какие еще факторы, по вашему мнению, важно отметить в отношении передового опыта? Конечно, их можно прояснить еще больше, но я надеюсь, что смог пролить свет на передовой опыт специалистов по данным и бизнес-аналитиков.
Спасибо за чтение!
Я не связан ни с одной из этих компаний.
Не стесняйтесь проверить мой профиль, Matt Przybyla, и другие статьи, а также подписаться на получение уведомлений по электронной почте для моих блогов, перейдя по ссылке ниже, или нажав на значок подписки вверху экрана рядом со значком подписки, и свяжитесь со мной в LinkedIn, если у вас есть какие-либо вопросы или комментарии.
Ссылка для подписки: https://datascience2.medium.com/subscribe
использованная литература
[1] Фото Андреас Классен на Unsplash, (2017)
[2] Фото Christopher Gower на Unsplash, (2017)
[3] Фото Caspar Camille Rubin на Unsplash, (2017)