В постоянно меняющемся мире информационной перегрузки всегда будут нужны люди, которые знают, как организовывать данные, хранить данные, принимать решения на основе данных и решать проблемы с данными. Если вы задумывались о своей роли в мире данных, эта статья может стать руководством, которое поможет вам в этом.

ДАННЫЕ

Что первое приходит вам на ум, когда вы сталкиваетесь со словом «данные»? Вы думаете о цифрах, фактах или цифрах? Данные — это гораздо больше. Селфи, хранящиеся на ваших устройствах, которые вы так любите, — это форма данных, данные — это та песня, которую вы не можете просто перестать слушать в Spotify или Apple Music. Статья, которую вы сейчас читаете, — это ДАННЫЕ!

Проще говоря, данные — это единицы информации, которые могут быть числовыми, звуками, словами, изображениями, они могут быть байтами и битами, хранящимися в памяти электронных устройств, фактами, хранящимися в уме человека и т. д. Данные повсюду, и они говорю вам (обратитесь к мему ниже, Мститель)

Карьера в сфере данных

Первое, что я хочу, чтобы вы помнили, это то, что независимо от области данных, в которой вы находитесь или которую вы выбираете, основное, чем вы будете заниматься, — это решать проблемы, поэтому будьте готовы стать супергероем данных (я назначил вас). Итак, что я буду делать, так это перемещаться по процессу обработки данных, чтобы вы могли найти то, что вам подходит.

  • Архитектор данных.Архитектор данных создает план проектирования для управления данными, чтобы базы данных можно было легко интегрировать, централизовать и защитить с помощью лучших мер безопасности. Они организуют данные на микро- и макроуровне. Они также гарантируют, что у дата-инженеров есть лучшие инструменты и системы для работы. Они современные специалисты по моделированию данных.

Навыки и таланты

  1. Решения для хранения данных
  2. Глубокие знания архитектуры баз данных
  3. Моделирование данных
  4. Разработка систем
  5. Извлечение, преобразование, загрузка (ETL), электронные таблицы и инструменты BI

Мышление

Inquesting Avenger с любовью к шаблонам проектирования архитектуры данных

Язык/Боевые преимущества

  1. Искра
  2. SQL (структурированный язык запросов)
  3. Улей
  4. XML
  5. Свинья латынь
  • Инженер данных –выполняйте пакетную обработку или обработку в реальном времени собранных и сохраненных данных. Инженеры данных также несут ответственность за создание и обслуживание конвейеров данных, которые создают надежную и взаимосвязанную экосистему данных внутри организации, делая информацию доступной для специалистов по данным. Инженеры данных часто сосредотачиваются на больших наборах данных, и им поручено оптимизировать инфраструктуру, окружающую различные процессы анализа данных. Например, инженер данных может сосредоточиться на процессе сбора данных, чтобы сделать конвейер сбора данных более эффективным. Им также может потребоваться обновить инфраструктуру базы данных для более быстрых запросов. По профессии они инженеры-программисты.

Навыки и таланты

  1. Системы баз данных (на базе SQL и без SQL)
  2. Инструменты моделирования данных и ETL
  3. Апис данных
  4. Решения для хранения данных

Мышление

Универсальный Мститель

Язык/Боевые преимущества

  1. SQL
  2. Улей
  3. свинья
  4. R
  5. Матлаб
  6. САС
  7. SPSS
  8. питон
  9. Джава
  10. Рубин
  11. C++
  12. Перл
  • Аналитик данных.Онианализируют данные компании и отрасли, чтобы найти ценность и возможности. Аналитики данных можно найти в каждой отрасли, и названия должностей могут различаться. Некоторые роли будут иметь отраслевые названия, такие как «аналитик медицинских данных». «Бизнес-аналитик», «аналитик разведки» и аналогичные роли часто имеют много общего с ролями аналитика данных. Одним из наиболее важных навыков аналитика данных является оптимизация. Это связано с тем, что им приходится создавать и модифицировать алгоритмы, которые можно использовать для отбора информации из некоторых самых больших баз данных без повреждения данных. В отличие от специалистов по данным, от них, как правило, не ожидают навыков машинного обучения. Это детективы данных.

Навыки и таланты

  1. Инструменты для работы с электронными таблицами (например, Excel)
  2. Системы баз данных (на основе SQL и NO SQL)
  3. Общение и визуализация (например, Tableau или Power BI)
  4. Математика и статистика (немного)

Мышление

Интуитивный наркоман данных с высоким коэффициентом «понимания»

Язык/Боевые преимущества

  1. HTML
  2. SQL
  3. R
  4. питон
  5. Javascript
  • Ученый по данным — они находят, очищают и систематизируют данные для компаний. Специалисты по данным должны будут иметь возможность анализировать большие объемы сложной необработанной и обработанной информации, чтобы находить закономерности, которые принесут пользу организации, помогут принимать стратегические бизнес-решения и сообщать полезные идеи. По сравнению с аналитиками данных, специалисты по данным гораздо более техничны.

Навыки и таланты

  1. Распределенных вычислений
  2. Прогнозное моделирование
  3. Рассказывание историй и визуализация
  4. Математика, статистика и машинное обучение

Мышление

Волшебник любопытных данных (я имею в виду волшебника уровня Мерлин)

Язык/Боевые преимущества

  1. свинья
  2. SQL
  3. R
  4. питон
  5. Искра
  6. САС
  7. Улей
  8. Матлаб
  • Инженер/ученый по машинному обучению.Инженеры по машинному обучению создают воронки данных и предоставляют программные решения. Им, как правило, нужны сильные статистические данные и навыки программирования, а также знания в области разработки программного обеспечения. Помимо проектирования и создания систем машинного обучения, они также отвечают за проведение тестов и экспериментов для мониторинга производительности и функциональности таких систем. Также ожидается, что инженеры по машинному обучению будут проводить A/B-тестирование, создавать конвейеры данных и внедрять общие алгоритмы машинного обучения, такие как классификация, кластеризация и т. д. Специалисты по машинному обучению исследуют новые подходы к данным и алгоритмы, которые будут использоваться в адаптивных системах, в том числе с учителем. , неконтролируемое и глубокое обучение. Ученые, занимающиеся машинным обучением, часто имеют такие должности, как научный сотрудник или инженер-исследователь. Они являются историческими лидерами в области данных.

Навыки и таланты

  1. Статистические теории и методология
  2. Интеллектуальный анализ данных и машинное обучение
  3. Распределенные вычисления (Hadoop)
  4. Системы баз данных (на основе SQL и NO SQL)
  5. Облачные инструменты

Мышление

Логичный и восторженный гений статистики

Язык/Боевые преимущества

  1. свинья
  2. SQL
  3. R
  4. питон
  5. Искра
  6. САС
  7. Улей
  8. Матлаб
  9. SPSS
  10. Стата
  11. Перл

Есть также инженеры MLOPs, которые специализируются на сочетании машинного обучения, DevOps и Data Engineering для надежного развертывания и обслуживания систем машинного обучения в производстве. Вы можете обнаружить, что выполняете все роли, связанные с данными, потому что вы являетесь человеком, к которому обращаются за данными в своей организации, это в основном зависит от размера группы данных в вашей организации. Не забывайте склоняться к ролям, в которых кроются ваши сильные стороны. Спасибо за чтение. Если у вас есть какие-либо вопросы или комментарии, пожалуйста, напишите в разделе комментариев.