Как учебный курс Metis Data Science Bootcamp поможет вам сделать карьеру в области науки о данных

Я недавно закончил учебный лагерь Metis Data Science Bootcamp (Сингапур, пакет 5), и запись в Bootcamp, возможно, была одним из лучших решений, которые я когда-либо принимал в своей жизни. Из 5 обязательных проектов, которые я завершил, все были опубликованы на сайте Towards Data Science (TDS), а 2 были опубликованы в социальных сетях. Однако, что наиболее важно, мне удалось получить два предложения о работе в качестве специалиста по данным еще до завершения Bootcamp. Простите меня, но, будучи бенефициаром, поэтому я хочу поделиться с начинающими специалистами по обработке данных о Bootcamp, его плюсах и минусах, а также о том, как использовать его для получения максимальной пользы.

Что такое учебный курс Metis Data Science Bootcamp?

Таким образом, учебный курс Metis Data Science Bootcamp - это аккредитованный 12-недельный учебный курс на основе проектов и иммерсивное обучение в области науки о данных с полным стеком. Bootcamp очень широк и охватывает широкий спектр областей науки о данных, от коммуникации и дизайна, исследовательского анализа данных до больших данных и нейронных сетей. Разрешите мне описать список основных тем, которые я изучил:

  • Коммуникация и дизайн проектов / презентаций
  • Подготовка к карьере (создание резюме, нетворкинг, интервью)
  • Исследовательский анализ данных
  • Сбор данных с помощью веб-скрейпинга
  • Построение модели (регуляризация, перекрестная проверка, выбор функций / разработка)
  • Машинное обучение с учителем (алгоритмы регрессии)
  • Машинное обучение с учителем (алгоритмы классификации)
  • Обучение без учителя - кластеризация, SVD, PCA
  • Обработка естественного языка
  • Рекомендательные системы
  • Нейронные сети (ИНС, CNN, RNN)

Однако даже длинный список вышеупомянутых тем не исчерпывает всего, что охватывает Bootcamp! Таким образом, чтобы сжать все эти знания в области науки о данных в 12-недельный курс, можно представить себе степень интенсивности Bootcamp. Примечательно, что мой инструктор сказал нам, что невозможно овладеть всем, чему учат в Bootcamp, и на самом деле ему потребовалось около 2 лет, чтобы усвоить эти знания.

Структура учебного лагеря

Bootcamp требует полной занятости (с понедельника по пятницу) в течение 12 недель, при этом занятия начинаются в 9 утра и заканчиваются в среднем около 14 часов.

Каждый день занятия начинаются с парного программирования, когда каждый объединяется с другом для решения задачи по программированию или науке о данных. Парное программирование стало для меня управляемым на первой неделе и постепенно усложнялось. Где-то около 6-й недели, после внедрения рекурсивных функций и KNN, я начал теряться, как и другие мои коллеги. Задачи парного программирования Metis были действительно сложными.

После парного программирования инструктор обычно просматривает слайды и записные книжки Jupyter по концепциям науки о данных и инструментам машинного обучения, которые обычно обслуживались к завершению последующего проекта. Поскольку эти уроки обычно заканчиваются около 12–14 часов, уроки обычно были короткими и интенсивными. Следовательно, очень важно открыть все уши и уделить максимум внимания.

Хотя уроки обычно заканчиваются около 14:00, я предостерегаю от того, чтобы остаток дня тратить на какую-то работу с частичной занятостью или какие-то обязательства. Помимо отдыха мозга от утреннего турне по концепциям науки о данных, следует потратить личное время на пересмотр концепций и чтение заранее, чтобы углубить понимание. Помните, я упоминал, что Bootcamp силен по размеру? Bootcamp слаб по глубине, возможно, намеренно. Следовательно, с нашей стороны требуется много самостоятельного исследования (во многих случаях с использованием Google), чтобы понять, где это осталось на уроке. Что еще более важно, это дополнительное время дается нам для работы над нашими проектами!

Всего в рамках Bootcamp предстоит завершить 5 проектов по науке о данных. В конце мы должны провести презентацию для класса, которая ограничена 4–5 минутами. Кроме того, мы настоятельно рекомендуем создавать сообщения в блоге о наших проектах. В конце проекта 5 (последний день - День карьеры) мы также проводим заключительную презентацию перед группой потенциальных работодателей. Ниже приведены хронология и описания проектов в Bootcamp:

Неделя 1 - Проект 1: Исследовательский анализ данных

В Проекте 1 все работали над одним проектом - Анализ турникетов MTA. Нам дали вымышленную бизнес-задачу и поручили применить исследовательский анализ данных, чтобы дать рекомендации по решениям бизнес-проблемы социального взаимодействия. Мы использовали уроки, полученные на Pandas, Numpy, Matplotlib и Seaborn для нашего проекта. Ниже представлен проект, который я сделал:



Неделя 2–3 - Проект 2: парсинг веб-страниц и регресс

В Project 2 мы попробовали парсинг веб-страниц и создали наш первый проект машинного обучения. Мы впервые познакомились с BeautifulSoup и Selenium для парсинга веб-страниц, а также с парадигмой построения модели машинного обучения: выбор функций / разработка, регуляризация и перекрестная проверка. Начиная с Проекта 2, каждый мог проявить свои творческие способности и выбрать свой собственный проект. Ниже представлен проект, который я сделал:



Неделя 4–6 - Проект 3: Классификация и приложение Flask

В Проекте 3 Bootcamp вошел в состав алгоритмов классификации. В этот период мы также рассмотрели другие инструменты анализа данных, такие как SQL, AWS и Tableau, однако они были больше связаны с широтой нашего образования в области науки о данных, чем с проектом. Наконец, мы познакомились с Javascript и Flask, где нам было поручено загрузить готовую модель классификации в приложение Flask, размещенное на Heroku. Ниже представлен проект, который я сделал:



Неделя 7–8 - Проект 4: Кластеризация, НЛП и рекомендательные системы

В Проекте 4 наш инструктор провел для нас головокружительный тур по обучению без учителя (кластеризация, SVD, PCA), обработке естественного языка и рекомендательным системам. Здесь концепции были охвачены очень широко, и их стало труднее усвоить. Поскольку приближались президентские выборы в США, я решил сделать проект НЛП о Дональде Трампе:



Неделя 9–12 - Проект 5: Проект "Страсть"

Проект 5 также называется "Проект страсти" на Bootcamp! Нам разрешали работать над любыми проектами машинного обучения, которые нам нравились. Тем не менее, поскольку глубокое обучение (CNN, RNN) было освещено на 9-й и 10-й неделе, некоторые студенты работали над проектом по глубокому обучению. Однако, поскольку я не завершил проект по Рекомендателю, и я хотел сначала углубить свои основы, я решил поработать над Рекомендателем на основе содержимого. Ниже представлен мой проект:



Плюсы Bootcamp

Я бы сказал, что учебный курс Metis Data Science Bootcamp действительно разработан для того, чтобы начать карьеру начинающего специалиста по данным в его или ее карьере в области науки о данных, если он или она приложит достаточно усилий с правильным отношением, а также начнет Bootcamp с достаточным опытом. Помимо предоставления вам арсенала знаний в области науки о данных, Bootcamp изобилует семинарами по подготовке к карьере, от которых я извлек большую пользу.

Более того, процесс мышления, трудовая этика и отношение, которые вдохновил нас мой инструктор, изменили наши горизонты за эти 12 недель. Когда мой инструктор сказал, что мы будем заново изобретены в конце учебного лагеря, он не шутил. Многие из моих сверстников тоже так не думали.

Также Bootcamp требует вступительного экзамена во время подачи заявки, и, таким образом, будут отфильтрованы только кандидаты с достаточным опытом. Это означает, что вы будете взаимодействовать со сверстниками того же уровня, если не более продвинутыми, чем вы. Лично я чувствую, что компетентные коллеги помогли мне многому научиться, когда мы делимся друг с другом, и в то же время подтолкнули меня к большему.

Минусы Bootcamp

При этом Bootcamp - это курс среднего уровня. И в самом конце первой недели мы уже вынуждены завершить полноценный продукт для науки о данных с кратким обзором основных моментов Pandas, Matplotlib и Seaborn. В этом и заключается недостаток Bootcamp. Хотя это, кажется, многому учит, в большинстве случаев это лишь поверхностная часть темы. Следовательно, чтобы выполнить отличный и более сложный проект, человек вынужден углубляться в тему, проводя много внешнего самоисследования. Для кого-то менее находчивого или менее инициативного он или она может в конечном итоге тратить время менее продуктивно и соглашаться на меньшее в проекте.

На плодотворное обучение потрачено всего около половины дня, и некоторые могут спросить, действительно ли Bootcamp стоит тех огромных сборов, которые он взимает. Для меня и других коллег из сингапурской когорты это, вероятно, того стоит, поскольку правительство Сингапура фактически спонсирует 2/3 сборов за учебный лагерь сингапурцев. Тем не менее, учитывая структуру и дизайн Bootcamp, я бы сказал, что даже полные сборы оправданно окупаются, если целенаправленные усилия тратятся на самоисследование, проекты и получение работы во время Bootcamp.

Совет по использованию всех возможностей Bootcamp

Если бы вы дочитали до этого места, я думаю, вы получили бы хорошее представление о Bootcamp. Хотя Bootcamp может работать не для всех - некоторые предпочитают идти по пути обычного обучения в колледжах, - я заметил некоторые факторы, которые могут оптимизировать кривую обучения в Bootcamp и, таким образом, потенциально привести к получению одного из них на работе:

  • Получите достаточные базовые знания до Bootcamp

Возможно, это самый важный фактор. Несмотря на то, что Bootcamp имеет вступительный тест, чтобы убедиться, что все находятся на одном уровне, вступительный тест по-прежнему является довольно простым по своей природе. Я настоятельно рекомендую всем, кто желает зарегистрироваться в Bootcamp, иметь хотя бы практические знания в области Python, а также пакетов Numpy, Pandas, Matplotlib и Seaborn. Некоторые из коллег и выпускников даже пошли дальше, чтобы заранее узнать о машинном обучении и глубоком обучении! Заинтересованным ученикам я бы также порекомендовал эти курсы Udemy - Python Bootcamp и Machine Learning Bootcamp - от Jose Portilla. Наличие достаточных базовых знаний важно, так как это позволяет вам легко догнать контент Bootcamp и еще больше погрузиться в свои проекты. Кроме того, помимо программирования, я настоятельно рекомендую потенциальным студентам хорошо разбираться в статистике (проверка гипотез и регрессия) и математике (многомерное исчисление и линейная алгебра).

  • Задавайте вопросы во время Bootcamp

Поскольку концепции Data Science могут быть сложными по своей природе, иногда маловероятно, что вы сможете понять в первый раз, когда преподаватель объясняет их. Таким образом, крайне важно набраться смелости и попросить инструктора еще раз объяснить или прояснить ваши сомнения, прежде чем они перейдут к следующей концепции. Если вы вместо этого оставите вопросы при себе, очень скоро вы потеряетесь и обнаружите, что запоминаете, а не понимаете то, чему вас учат. Кроме того, я не могу переоценить, как твердое понимание поможет вам в путешествии по науке о данных в Bootcamp.

  • Налаживайте отношения со сверстниками и инструктором

В то время как некоторые люди предпочитают оставаться в одиночестве и в одиночестве придумывать потрясающие проекты, я обычно рекомендую вместо этого налаживать взаимопонимание со сверстниками и инструктором. Это не только делает учебный лагерь более приятным, но и способствует взаимному обогащению идей во время взаимодействия, что приводит к лучшим результатам проекта. Еще одно замечание: технические специалисты обычно очень дружелюбны и полезны, и мы можем многому у них научиться.

  • Используйте свободное время

Я не могу достаточно упомянуть об этом. Полдня обучения на Bootcamp, безусловно, недостаточно, чтобы резко повысить ваши знания в области науки о данных. Таким образом, чтобы получить максимальную пользу от обучения, крайне важно пересмотреть и продолжить путь самопознания и чтения через Google и другие различные обучающие платформы. Таким образом, насколько эффективен и плодотворен учебный курс, зависит от того, сколько времени и усилий вы потратили на свое обучение.

И наконец, что немаловажно, можно было потратить время на поиски работы во время Bootcamp. В зависимости от ваших предпочтений некоторые люди могут этого избежать, так как они хотели бы сосредоточить и максимизировать свои знания во время Bootcamp, что, на мой взгляд, является достойным выбором. Однако у поиска работы во время Bootcamp есть свои плюсы, так как ваш инструктор, скорее всего, предложит вам совет и поддержку, если они вам понадобятся. Более того, разве не приятнее знать, что вы получили работу по окончании учебы?

Заключение

Учебный лагерь Metis Data Science Bootcamp действительно стал потрясающим и меняющим событием. Оглядываясь назад, я опасался регистрироваться, опасаясь, что не смогу оправдать ожиданий или что Bootcamp может не стоить того. Сделав решительный шаг и впоследствии получив работу в качестве специалиста по данным, все, что я могу сказать, это то, что иногда просчитанный риск может привести к неожиданным и прекрасным результатам. Следовательно, я бы посоветовал любому кандидату, который хочет перейти в индустрию науки о данных, действительно рассмотреть возможность участия в учебном лагере Metis Data Science Bootcamp! А давайте, коллеги-энтузиасты и профессионалы в области науки о данных в этой захватывающей области, будем стремиться к более захватывающим возможностям. Удачи!

Наконец, большое спасибо за чтение! Следуйте за мной на GitHub, а также свяжитесь со мной в моем LinkedIn или оставьте комментарий ниже, чтобы обсудить!