Окончательный список курсов для специалистов по данным

Лучшие онлайн-курсы по Data Science, разбитые по темам

Десять лет назад вы, вероятно, изо всех сил пытались найти онлайн-курсы для изучения науки о данных. Теперь вы столкнетесь с другой проблемой: в Интернете слишком много контента, и вы не знаете, что выбрать.

Выполните поиск по запросу «наука о данных» на Coursera, и на сегодняшний день вы получите почти 3000 различных результатов. Подавляющее, правда?

Я прохожу онлайн-курсы уже много лет, и за эти годы я собрал список всех хороших (и того, что делает их хорошими). В этой статье вы найдете структурированный список онлайн-курсов, разделенных на 5 основных категорий, которые, как мне кажется, охватывают значительную часть контента, который должен знать специалист по данным / инженеру по машинному обучению:

  • Статистика
  • Кодирование
  • Анализ и визуализация данных
  • Машинное обучение
  • Инженерия данных / MLOps

Хотя большинство из них являются фактическими курсами, некоторые из них являются специализациями (группа курсов, которые предполагается проходить последовательно). Вы, вероятно, не сделаете все из них, так как весь этот контент займет у вас несколько лет, но вы можете (и должны) выбрать то, что лучше всего подходит для вас.

Статистика

Базовая статистика

Это самый базовый курс по статистике, который я смог найти в Интернете, и на самом деле он начнется с нуля, например, с изучения концепций медианы и среднего. Сделайте это, если вы почти ничего не знаете о статистике.



Введение в статистику

Этот курс довольно полный и охватывает большую часть статистической теории, имеющей отношение к науке о данных. Она следует более или менее по содержанию, что и книга Практическая статистика для науки о данных (если вы хотите увидеть краткое содержание книги, есть статья здесь). Однако предполагается, что вы знаете некоторые основы, такие как формула для стандартного отклонения, среднего и т. Д. Я рекомендую эту, если у вас уже есть некоторые знания в области статистики для начинающих.



Введение в статистику
Стэнфордское« Введение в статистику
учит вас концепциям статистического мышления, которые необходимы для изучения… www.coursera.org»



Статистика с R

Эта специализация R также является довольно полной и включает 5 курсов, начиная от вероятностной и логической статистики и заканчивая байесовской статистикой. Однако есть серьезная оговорка: он не научит вас R, он научит вас статистике с помощью R. Итак, пройдите этот курс, только если вы уже знакомы с R и просто хотите освежить свои навыки статистики, иначе вы будет бороться с R вместо изучения статистики (о том, как изучить R, я расскажу далее в статье).



Статистика для науки о данных с помощью Python

Этот курс, предлагаемый IBM, охватывает некоторые основы, но с более прикладным мышлением. Поскольку он не охватывает всего, что вам нужно для статистики, я рекомендую вам пройти его вместе с одним из двух курсов, упомянутых ранее («Базовая статистика» или «Введение в статистику»).



Статистика для науки о данных с помощью Python
Этот курс« Статистика для науки о данных
разработан, чтобы познакомить вас с основными принципами статистических методов и… www.coursera.org »



Кодирование

Для кодирования видео-лекции не очень помогут. Вместо этого я рекомендую вам попробовать платформу кодирования, такую ​​как Codeacademy. У них есть треки обучения программированию для всех основных языков, которые вам понадобятся, и множество вещей, предназначенных исключительно для науки о данных и анализа данных. Часть их контента бесплатна, но вы должны платить ежемесячную подписку на более конкретные «курсы» (хотя это не дорого, и они предлагают скидки для студентов).









Анализ и визуализация данных

Сертификация Google Data Analytics

Это профессиональный сертификат, предлагаемый Google, состоящий из 8 курсов, которые научат вас многому в области анализа и визуализации данных, охватывая темы от подготовки данных до того, как задавать правильные вопросы, и заканчивая завершающим проектом. Если вы изучаете только одну специализацию по этому предмету, это должно быть то, что вам нужно. Кроме того, в конце вы получите профессиональный сертификат, выданный Google.



Визуализация информации

Эта специализация из 4 курсов, предлагаемая Нью-Йоркским университетом, будет охватывать множество концепций визуализации, которые могут быть новыми для специалистов по данным, таких как использование цвета, пустых пространств, аннотаций и контраста. Речь идет не об использовании определенного инструмента, а о том, как научить вас, как сделать вашу следующую визуализацию данных действительно выдающейся.



Подготовка к сертификации специалистов по Tableau

Даже если вы, как специалист по анализу данных, можете не составлять много бизнес-отчетов, вы все равно можете воспользоваться инструментами бизнес-аналитики для двух вещей: представления результатов в более привлекательном и интерактивном виде для аудитории и создания информационных панелей для группы данных. для мониторинга производительности модели. Теперь, когда мы углубимся в конкретные инструменты, этот курс Udemy научит вас всем основам Tableau, одного из самых распространенных инструментов бизнес-аналитики. Это несложный для освоения инструмент, поэтому, пройдя этот курс и немного попрактиковавшись, вы быстро сможете создавать впечатляющие отчеты и информационные панели.



Учебный курс Microsoft Power BI с настольным ПК

Power BI также является одним из наиболее часто используемых инструментов для визуализации данных и бизнес-аналитики. Вам нужно изучить только один из них, поэтому выберите Power BI или Tableau, и все будет в порядке (основы более или менее одинаковы, поэтому, изучив любой из них, вам будет намного легче изучить любой другой новый инструмент).

Этот конкретный курс не займет у вас много времени и будет охватывать все, что вам нужно знать для повседневного использования Power BI.



Машинное обучение

Машинное обучение в Стэнфорде

Один из лучших курсов, которые я когда-либо проходил по машинному обучению, он подробно расскажет об основных алгоритмах машинного обучения, включая математику, лежащую в основе них. Эндрю Нг на самом деле научит вас кодировать их с нуля с помощью Matlab, что я нашел одновременно болезненным и поучительным (как это часто бывает). Я не могу рекомендовать этот курс достаточно высоко.



Структурирование проектов машинного обучения

Еще один от Эндрю Нг, он научит вас чему-то очень важному при изучении данных в реальной жизни: как структурировать свои проекты машинного обучения. Вы можете знать статистику, кодирование и алгоритмы, но, когда придет время фактически реализовать ваш проект, этот двухнедельный курс даст вам основу для оптимизации ваших процессов, а это означает, что вы больше не будете тратить время на размышления о том, что делать дальше. . Учитывая, насколько он короткий, вам обязательно стоит сделать это.



Подготовка к сертификации Google Cloud: инженер по машинному обучению

Это довольно длинная специализация с 9 курсами, которые помогут вам подготовиться к сертификации Google Cloud Platform (GCP) ML Engineer. Я рекомендую вам сделать это только в том случае, если вы уже являетесь опытным специалистом по данным, который хочет улучшить свои навыки машинного обучения и / или хочет узнать, как использовать GCP. Если это ваш случай, вы найдете этот курс весьма информативным. Предупреждение: если у вас нет большого опыта работы с GCP, этого курса будет недостаточно для прохождения сертификации ML Engineer, вам понадобится больше практического опыта или больше обучения, чтобы получить его.



Инженерия данных и MLOps

Основы инженерии данных

Базовая специализация из 5 курсов, предлагаемая IBM, начинается с введения в инженерию данных, а затем охватывает реляционные базы данных и использование SQL и Python в науке о данных. Поскольку он будет охватывать часть основного содержимого Python (например, структуры данных), он может быть немного избыточным, если вы уже знакомы с ним. Однако вы можете получить кое-что из API Python и частей для удаления веб-страниц, а также из практического проекта.



Машинное обучение для производства

За 4 коротких курса эта специализация проведет вас через все этапы внедрения моделей машинного обучения и конвейеров для производства. Он относительно простой и подходит для начинающих, но если вы готовы работать над практическими упражнениями, это даст вам хороший практический обзор предмета.



Основы MLOps (Machine Learning Operations)

Контент MLOps, предназначенный для пользователей GCP, этот короткий трехнедельный курс поможет вам узнать больше о Kubernetes, Kubeflow и платформе AI. Полезно только в том случае, если вы особенно заинтересованы в ML Engineering на GCP. В практических упражнениях есть некоторые ошибки и проблемы, но в целом это лучший способ познакомиться с MLOps на GCP.



Вывод

Используйте этот список как руководство, если вы погрязли в перегрузке контентом и не знаете, с чего начать. Вы также можете сохранить на потом и вернуться к нему, когда вам понадобится изучить материал по определенной теме.

Если вам понравилась эта статья, возможно, вам понравятся и эти:





Не стесняйтесь обращаться ко мне в LinkedIn, если вы хотите продолжить обсуждение, это будет приятно (честно).