Итак, вы хотите перейти в Data Science ...

Что ж, во-первых, позвольте мне сказать, что это хороший ход. Наука о данных - чрезвычайно интересная отрасль, ориентированная на будущее.

Однако для тех, кто хочет перейти в поле, это может показаться сложной задачей. В описаниях вакансий есть множество запросов на получение степени доктора или по крайней мере степени магистра в области науки о данных или информатики, не говоря уже о постоянно растущем списке навыков и инструментов, которые кажутся недоступными.

Я собираюсь сказать вам прямо сейчас - переход в Data Science на 100% выполним, и вы абсолютно способны добиться больших успехов в этой области. Фактически, для многих из вас набор навыков, которые у вас есть в других областях и ролях, дает вам явное преимущество перед теми, кто окончил университеты и колледжи без вашего реального опыта.

Хотите доказательства?

Я работаю в этой области более 13 лет, и мой путь туда, где я нахожусь сейчас, немного странный. Я не изучал науки о данных, информатику или даже математику в университете. Вместо этого я получил степень по маркетингу и психологии, и на самом деле просто случайно получил свою первую роль аналитика по маркетингу, просто играя в крикет с менеджером этой команды ...

Я продолжал учиться и переходить на разные должности в разных отраслях, и в последнее время мне посчастливилось работать в Amazon, а также в Sony PlayStation, где я создал и прототипировал функции на основе машинного обучения для PlayStation 5, некоторые из них которые были запатентованы Sony.

Должностные инструкции не всегда отражают реальность того, что компании нужно и чего хотят, поэтому относитесь к ним с недоверием.

В любом случае, вернемся к основному сюжету ...

В последнее время я разговаривал со многими профессионалами, и хотя многие говорят, что видят стремительный рост науки о данных и машинного обучения, они не знают, с чего начать свой путь обучения или как стать лучше. понять, что все это означает на практике.

Они знают, что движение в этом направлении будет чрезвычайно полезно для их карьеры, потому что давайте посмотрим правде в глаза - мир быстро становится полностью управляемым данными. Если вы не следите за этими тенденциями, вы действительно рискуете остаться позади или обогнать других, которые ищут возможности исследовать эти области или по крайней мере найти способы, которыми они могут это помочь. объединить их или добавить в их текущую роль.

Почему наука о данных - это такой хороший карьерный ход?

Ну вот цитата, которая, я думаю, все говорит ...

«Будущее науки о данных великолепно до тех пор, пока люди не перестанут производить какие-либо данные»

Поскольку объемы генерируемых и собираемых данных постоянно растут, компании из всех отраслей стремятся нанять специалистов по данным, которые помогут им эффективно использовать свои данные, понимать своих конечных пользователей и принимать правильные решения, а также опережать конкурентов.

Широко известно, что Data Science была названа «Самой сексуальной работой 21 века» и что зарплаты в этой области являются одними из самых высоких.

Компания Payscale, занимающаяся аналитикой заработной платы, подсчитала, что средняя зарплата специалиста по анализу данных в США составляет 96 тысяч долларов ... и помните, что это медиана, поэтому половина специалистов по анализу данных фактически зарабатывает больше чем это!

Звучит здорово - приступим!

Ну, не так быстро…

В результате удивительных вещей, которые делаются в этой области, и высоких зарплат, которые предлагаются, рынок наводнили честолюбивые специалисты в области данных, а из-за возросшей конкуренции, которую это вызывает, многие изо всех сил пытаются получить какую-либо роль. не говоря уже о роли их мечты.

Я хочу помочь вам опередить всех и успешно перейти на поле боя.

Как я уже говорил ранее, я более 13 лет проработал в Data Science в таких компаниях, как Amazon, а в последнее время - Sony PlayStation. На протяжении моей карьеры мне очень повезло: я имел возможность провести собеседование и проверить сотни кандидатов в области науки о данных и аналитике.

Я видел, что отличает тех, кто получает эту роль, от тех, кто ее не упускает - и это в первую очередь сводится к следующему ...

Существует разрыв между тем, чему учат в области науки о данных, и требованиями и требованиями реального мира.

Поэтому, чтобы убедиться, что мой опыт такой же, как и у других, я вышел и поговорил с сотнями лидеров, менеджеров по найму и рекрутеров на местах. Я спросил о:

Навыки, инструменты, методы, отношения и образование…

Я спросил их, что отличает хорошего специалиста по данным от отличного специалиста по данным ...

Я спросил, что отличает кандидата, который получает должность, от тех, кто получает письмо с отказом снова и снова.

Я объединил все это понимание и создал программу Data Science под названием DATA SCIENCE INFINITY. Но я здесь не для того, чтобы вам это продавать. Я пишу эту статью, чтобы убедиться, что вы чувствуете себя сильными. Я хочу, чтобы вы чувствовали, что у вас есть направление.

Итак, на чем вы должны сосредоточить свое время и усилия при изучении Data Science?

Кодирование и программирование

Перво-наперво вам нужно научиться программировать или кодировать.

Моя первая рекомендация - изучить SQL. SQL - это язык, который может извлекать данные, хранящиеся в реляционных базах данных (считая строки и столбцы), и манипулировать ими. Вы можете многое сделать на этом языке, от очень простого до очень сложного, но важно знать, что подавляющее большинство предприятий по-прежнему хранят свои данные таким образом, а SQL предоставляет способ легко извлекать ключевые бизнес-идеи.

Вы также захотите выучить более «настоящий» язык программирования - и я рекомендую изучить Python. Я говорю «Python над R» на основании того факта, что в разговоре с руководителями Data Science 87% сказали, что их команды используют Python для Data Science, а около 55% сказали, что R.

R - тоже замечательный язык, так что это тоже отличный вариант!

Математика и статистика

Далее вы будете часто слышать обо всей математике, которую вам нужно знать, чтобы стать специалистом по анализу данных.

Пожалуйста, не пугайтесь этого.

Нет недостатка в «привратниках» на местах, но реальность такова:

Да, вам нужно знать немного математики. Но вам не нужно тратить год на чтение учебников, прежде чем вам будет разрешено прогрессировать или до того, как вам разрешат стать специалистом по анализу данных.

Наоборот!

Начните изучать математические концепции, когда начнете применять такие вещи, как алгоритмы машинного обучения. Гораздо приятнее учиться, пока вы тестируете и изменяете что-то и видите, что меняется и почему ...

Учитесь с упором на интуицию, понимание и применение.

Машинное обучение

Машинное обучение - важная часть науки о данных, поэтому научиться применять часто используемые алгоритмы стоит, но не думайте, что вам нужно изучать их все!

В реальном мире - вы можете решить подавляющее большинство бизнес-задач с помощью небольшого подмножества алгоритмов, поэтому сосредоточьтесь на глубоком понимании некоторых, а не на понимании их всех на высоком уровне!

… Стоит ли углубляться в глубокое обучение?

Что ж, черт возьми, да, вам следует, глубокое обучение - это потрясающе, но, черт возьми, она соблазнительница!

Не упускайте сначала базовые навыки. Я видел это снова и снова, и это плохо отражается на реальном рынке труда! Сначала получите основные навыки, а затем приступайте к глубокому обучению!

Более мягкие навыки

так важно подчеркнуть, что наука о данных - это не только технические навыки - и если вы переходите с другой должности или области, то именно в этом заключается ваше первоначальное преимущество.

Фактически, лучшие специалисты по анализу данных, с которыми я работал за свою карьеру, по определению не являются «самыми умными». Безусловно, они знают свое дело с точки зрения кодирования, статистики и других ключевых концепций данных, но их отличает то, что ...

Они понимают, в чем заключается бизнес-проблема или чего компания пытается достичь. Они используют данные и свои уникальные навыки умными и часто простыми способами для решения этих проблем или для увеличения ощутимой ценности для команды, бизнеса или конечного пользователя.

Лучшие специалисты по анализу данных начинают с бизнес-задачи, а затем возвращаются к решению оттуда, а не наоборот!

Общение - ключ к успеху.

Хороший специалист по анализу данных знает множество технических концепций ... отличный специалист по данным может упростить их таким образом, чтобы вовлечь всех в бизнес.

Как специалисты по анализу данных, мы здесь для того, чтобы решать проблемы, а не вводить новые ...

… Мы здесь, чтобы улучшить и ускорить процесс принятия бизнес-решений, а не мешать ему!

Если вы переходите из другой области, эти более мягкие навыки могут действительно поставить вас выше конкурентов - так что у вас есть сильные позиции, чтобы стать великим специалистом по анализу данных!

Я все время говорю начинающим специалистам по данным: «Никто не будет платить вам только за то, что вы хорошо умеете кодировать, или просто хорошо разбираетесь в математике, или просто знаете много алгоритмов машинного обучения… но они будут платить вам, и они будут платить вам хорошо, чтобы повысить материальную ценность своего бизнеса или конечного пользователя »

Продемонстрируйте свои навыки в проектах

Как только вы начнете учиться, отличный способ продемонстрировать свои навыки менеджерам по найму или рекрутерам - это создать проекты. Я буду более чем счастлив поддержать вас в деталях этого дела, но я быстро скажу одну вещь о том, какие проекты вам следует выбрать, чтобы стоять над другими кандидатами, и это действительно просто ...

Выбирайте проекты, которые вас волнуют или интересуют. Это так просто.

Если вы увлечены или интересуетесь какой-либо темой, у вас будет гораздо больше мотивации задавать правильные вопросы по данным, глубже копаться в данных и по ходу тестировать различные решения.

Поверьте, эта мотивация просвечивает и может иметь решающее значение на собеседовании.

Наконец, стоит ли вам стать специалистом по данным или инженером по данным - и в любом случае, в чем разница !?

Мне часто задают этот вопрос, и, хотя вы можете об этом не подумать ... на самом деле это несколько спорная или, по крайней мере, очень обсуждаемая область.

Позвольте мне сначала объяснить, в чем разница между специалистом по данным и инженером по данным.

На сверхвысоком уровне можно сказать, что наука о данных - это процесс превращения данных в полезные или добавляющие ценность с помощью данных.

Инженерия данных - это больше процесс обеспечения пригодности данных или интеграции данных с инфраструктурой.

Таким образом, специалист по данным будет проводить большую часть своего дня, глядя на сами данные, тогда как инженер по данным, вероятно, будет проводить часть своего времени, глядя на данные, а также на инфраструктуру, которая будет хранить эти данные ...

Итак - опять же, это очень обобщение высокого уровня ... и причина дебатов в том, что между ними есть некая серая зона.

Есть те, кто считает, что специалисты по обработке данных должны обязательно обладать полным набором навыков Data Engineering ... а есть те, кто считает, что эти навыки выходят за рамки набора навыков Data Scientists, и что им следует сосредоточить свое время в основном на изучение данных, анализ данных и создание самих моделей машинного обучения.

Я не думаю, что здесь есть правильный или неправильный ответ, и это будут разные роли от компании к компании ... но, по моему опыту, он находится где-то посередине, но, вероятно, больше в сторону, где развертывание и обслуживание данных и самих моделей должны обрабатываться командой, у которой есть несколько иной набор навыков, чем у специалистов по данным, группы инженеров по данным. Эти команды работают бок о бок, и они оба стараются ценить и понимать роли друг друга, чтобы они могли работать вместе как можно более эффективно, но в этих настройках не ожидается, что у человека будет набор навыков, который может охватывать обе роли. .

Итак, по какому пути идти - решать только вам!

Если вы хотите проявить творческий подход к самим данным, тогда выбирайте Data Science - если вы хотите быть ближе к инфраструктуре, которая хранит данные, то, возможно, Data Engineering больше для вас!

Я действительно надеюсь, что это помогло вам в каком-то направлении, и я надеюсь, что вы чувствуете, что переход к Data Science в 2021 году - это то, на что вы более чем способны!

Удачного вам путешествия, оно увлекательное и полезное ...

А теперь вы хотите увидеть, на что вы действительно способны?

Недавно я создал БЕСПЛАТНЫЙ мини-курс Python + Data Science + Machine Learning для таких же профессионалов, как вы.

Это займет всего около 3 часов, но я хочу, чтобы вы убедились сами в том, что вы можете это сделать.

Я хочу, чтобы вы увидели, что это не какая-то недостижимая цель, а вместо этого увидели, что она прямо здесь для вас, если вы этого хотите.

Я хочу, чтобы вы начали путешествие на всю жизнь в одной из самых захватывающих сфер деятельности, которая обеспечит вашу карьеру в будущем.

Я хочу, чтобы вы расширили то, на что, как вы думали, были способны - и, что наиболее важно, я хочу, чтобы вы немного повеселились на этом пути и сделали то, о чем вам будет интересно рассказать друзьям или семье!

Через пару часов вы…

  • Узнайте о языке программирования Python
  • Установите Python и изучите основы программирования на нем.
  • Используйте пакет Python под названием Pandas для изучения и анализа набора данных - одной из основных повседневных задач, которую выполняет специалист по данным или аналитик.

Тогда… вы перейдете к первому интересному проекту.

Вы напишете около 7 или 8 строк кода, которые будут повторять некоторую умную логику снова и снова, пока не найдутся все простые числа, которые существуют меньше 1 миллиона. И это так круто, потому что он сделает это примерно за полсекунды!

Этот первый проект даст вам представление об интересной и удивительной логике, которую вы можете использовать в Python.

С этого момента вы начнете свое путешествие в машинное обучение, где вы:

  • Узнайте о более широкой области и ее приложениях
  • Изучите теорию высокого уровня, лежащую в основе одного из самых популярных алгоритмов машинного обучения, Случайный лес
  • А затем, для вашего второго проекта - вы собираетесь перейти на Python и построить, обучить и протестировать свою модель машинного обучения, которая предскажет, сколько времени потребуется определенным игрокам в видеоигры, чтобы выполнить конкретную задачу в их игре, на основе их уровень и количество боеприпасов у персонажа!

Это динамичный, но увлекательный тур по некоторым ключевым частям науки о данных. Вы будете поражены тем, что вы охватите за короткое время, и я знаю, что, как только вы закончите это, вы почувствуете себя уверенно, продвинувшись дальше в этой захватывающей и перспективной области!

Помните, что это совершенно бесплатно, поэтому, пожалуйста, сделайте зарегистрируйтесь здесь.

Наслаждайтесь - и удачи!

Пожалуйста, подпишитесь на меня здесь, в LinkedIn - и напишите мне, если вам когда-нибудь понадобится поддержка в области науки о данных, я всегда буду рад помочь!