«Успех не достигается в одночасье. Он приходит в рассрочку; вы получите немного сегодня, немного завтра, пока весь пакет не будет выдан. В тот день, когда вы прокрастинируете, вы потеряете успех этого дня».
Исраэльмор Айивор

Вы всегда можете посмотреть несколько хороших курсов на YouTube, Udemy, Coursera, edX Team и так далее. Но ничто не может сравниться со знаниями, изложенными в книгах, хотя видео обрабатывается мозгом в 60 000 раз быстрее.

Когда вы смотрите видео, содержание для вас упрощается, и вам не нужно много думать, чтобы понять содержание, в то время как при просмотре книг вам нужно формировать мысленные образы, чтобы понять содержание, и ваш мозг должен обработать его, чтобы вам было хорошо. разбирается в текстовой части.

Медиум делает вас более приземленным, более сосредоточенным ученым, независимо от сути.

Вот мои 11 лучших книг, которые я предпочитаю читать, чтобы укрепить свои знания в области науки о данных. Я поделился ссылкой на их страницу загрузки.

PDF Drive — это место, где можно скачать более 79 миллионов книг.

  1. Python Cookbook — если вам нужна помощь в написании программ на Python 3 или вы хотите обновить старый код Python 2, эта книга — то, что вам нужно. Эта уникальная кулинарная книга, содержащая практические рецепты, написанные и протестированные с помощью Python 3.3, предназначена для опытных программистов Python, которые хотят сосредоточиться на современных инструментах и ​​идиомах. Внутри вы найдете полные рецепты для более чем дюжины тем, охватывающих основной язык Python, а также задачи, общие для самых разных предметных областей. Каждый рецепт содержит примеры кода, которые вы можете сразу же использовать в своих проектах, а также обсуждение того, как и почему работает решение.
  2. Автоматизируйте скучные вещи с помощью Python — в разделе Автоматизируйте скучные вещи с помощью Python вы узнаете, как использовать Python для написания программ, которые за считанные минуты делают то, на что у вас ушли бы часы, чтобы сделать вручную без предварительного опыта программирования. После того, как вы освоите основы программирования, вы сможете создавать программы на Python, которые без труда выполняют полезные и впечатляющие функции автоматизации: поиск текста в файле или нескольких файлах, создание, обновление, перемещение и переименование файлов и папок, искать в Интернете и загружать онлайн-контент, обновлять и форматировать данные в электронных таблицах Excel любого размера, разделять, объединять, ставить водяные знаки и шифровать PDF-файлы, отправлять электронные письма с напоминаниями и текстовые уведомления и даже выполнять такие задачи, как заполнение онлайн-форм
  3. Введение в машинное обучение с помощью Python. Машинное обучение стало неотъемлемой частью многих коммерческих приложений и исследовательских проектов, но эта область не является исключительной для крупных компаний с обширными исследовательскими группами. Если вы используете Python даже в качестве новичка, эта книга научит вас практическим способам создания собственных решений для машинного обучения. Со всеми данными, доступными сегодня, приложения машинного обучения ограничены только вашим воображением. Вы узнаете, как создать успешное приложение для машинного обучения с помощью Python и библиотеки scikit-learn. Авторы Андреас Мюллер и Сара Гвидо сосредотачиваются на практических аспектах использования алгоритмов машинного обучения, а не на математике, стоящей за ними. Знакомство с библиотеками NumPy и matplotlib поможет вам извлечь из этой книги еще больше пользы.
  4. Практическая статистика для специалистов по данным: 50 основных концепций. Статистические методы являются ключевой частью науки о данных, но очень немногие специалисты по данным имеют какое-либо формальное образование в области статистики. Курсы и книги по базовой статистике редко освещают эту тему с точки зрения науки о данных. В этом практическом руководстве объясняется, как применять различные статистические методы в науке о данных, рассказывается, как избежать их неправильного использования, а также даются советы о том, что важно, а что нет. Многие ресурсы по науке о данных включают статистические методы, но не имеют более глубокой статистической перспективы. Если вы знакомы с языком программирования R и немного знакомы со статистикой, этот краткий справочник восполнит пробел в доступном и удобочитаемом формате.
  5. Элементы статистического обучения: интеллектуальный анализ данных, вывод и прогнозирование — В течение последнего десятилетия произошел взрыв в вычислительных и информационных технологиях. С ним пришло огромное количество данных в различных областях, таких как медицина, биология, финансы и маркетинг. Задача понимания этих данных привела к разработке новых инструментов в области статистики и породила новые области, такие как интеллектуальный анализ данных, машинное обучение и биоинформатика. Многие из этих инструментов имеют общую основу, но часто выражаются с помощью разной терминологии. Эта книга описывает важные идеи в этих областях в общей концептуальной основе. Хотя подход является статистическим, акцент делается на концепциях, а не на математике. Приведено множество примеров с широким использованием цветной графики. Это должно быть ценным ресурсом для статистиков и всех, кто интересуется интеллектуальным анализом данных в науке или промышленности. Охват книги широк, от обучения с учителем (прогнозирование) до обучения без учителя. Многие темы включают нейронные сети, машины опорных векторов, деревья классификации и бустинг — первое всестороннее рассмотрение этой темы в любой книге. Тревор Хасти, Роберт Тибширани и Джером Фридман — профессора статистики Стэнфордского университета. Они являются известными исследователями в этой области: Хасти и Тибширани разработали обобщенные аддитивные модели и написали популярную книгу с таким названием. Хасти написал большую часть программного обеспечения для статистического моделирования в S-PLUS и изобрел основные кривые и поверхности. Тибширани предложил Lasso и является соавтором очень успешной книги An Introduction to the Bootstrap. Фридман является соавтором многих инструментов интеллектуального анализа данных, включая CART, MARS и проекционное преследование.
  6. Практическое машинное обучение с помощью Scikit Learn и TensorFlow — ссылка на Github на репозиторий Орельена Жерона, содержащий код упражнений и коды из этой книги. За последнее десятилетие ряд прорывов в области глубокого обучения способствовал развитию всей области машинного обучения. Теперь, когда машинное обучение процветает, даже программисты, которые почти ничего не знают об этой технологии, могут использовать простые и эффективные инструменты для реализации программ, способных учиться на данных. Эта практическая книга покажет вам, как это сделать. Используя конкретные примеры, минимальную теорию и две готовые к работе среды Python — Scikit-Learn и TensorFlow — автор Орельен Жерон поможет вам получить интуитивное представление о концепциях и инструментах. для построения интеллектуальных систем. Вы узнаете, как использовать ряд методов, начиная с простой линейной регрессии и заканчивая глубокими нейронными сетями. Если у вас есть опыт программирования и вы готовы кодировать проект машинного обучения, это руководство для вас.
  7. Введение в статистическое обучение: с приложениями в RGithub ссылка на репозиторий, содержащий упражнения и их решение из книги. Введение в статистическое обучение предоставляет доступный обзор области статистического обучения, необходимый набор инструментов для осмысления обширных и сложных наборов данных, которые появились в различных областях, от биологии до финансов, маркетинга и астрофизики за последние двадцать лет. В этой книге представлены некоторые из наиболее важных методов моделирования и прогнозирования, а также соответствующие приложения. Темы включают линейную регрессию, классификацию, методы повторной выборки, подходы к усадке, методы на основе дерева, методы опорных векторов, кластеризацию и многое другое. Для иллюстрации представленных методов используются цветные графики и примеры из реальной жизни. Поскольку цель этого учебника состоит в том, чтобы облегчить использование этих статистических методов обучения практиками в науке, промышленности и других областях, каждая глава содержит руководство по реализации анализа и методов, представленных в R, чрезвычайно популярной статистической программной платформе с открытым исходным кодом. . Двое авторов стали соавторами Элементы статистического обучения (Хасти, Тибширани и Фридман, 2-е издание, 2009 г.), популярного справочника для исследователей статистики и машинного обучения. Введение в статистическое обучение охватывает многие из тех же тем, но на уровне, доступном для гораздо более широкой аудитории. Эта книга предназначена как для статистиков, так и для не статистиков, которые хотят использовать передовые методы статистического обучения для анализа своих данных. Текст предполагает только предыдущий курс линейной регрессии и отсутствие знаний матричной алгебры.
  8. Python Data Analytics: анализ данных и наука с использованием Pandas, matplotlib и PythonPython Data Analytics поможет вам разобраться в мире сбора и анализа данных, используя возможности языка Python. В основе этой книги лежит описание pandas, библиотеки с открытым исходным кодом под лицензией BSD, обеспечивающей высокопроизводительные, простые в использовании структуры данных и инструменты анализа данных для языка программирования Python.
    Автор Фабио Нелли со знанием дела показывает силу языка программирования Python применительно к обработке, управлению и извлечению информации. Внутри вы увидите, насколько интуитивно понятным и гибким является обнаружение и передача значимых шаблонов данных с использованием сценариев Python, систем отчетности и экспорта данных. В этой книге рассматривается, как получать, обрабатывать, хранить, управлять и анализировать данные с помощью языка программирования Python.
  9. Python для анализа данных. Обработка данных с помощью Pandas, NumPy и IPython — подписывайтесь на WesMckinney на Github. Получите полные инструкции по манипулированию, обработке, очистке и обработке наборов данных в Python. Второе издание этого практического руководства, обновленное для Python 3.6, содержит практические примеры, которые показывают, как эффективно решать широкий набор задач анализа данных. В процессе вы изучите последние версии pandas, NumPy, IPython и Jupyter. Эта книга, написанная Уэсом МакКинни, создателем проекта Python pandas, представляет собой практическое современное введение в инструменты обработки данных в Python. Он идеально подходит для аналитиков, плохо знакомых с Python, и для программистов Python, плохо знакомых с наукой о данных и научными вычислениями. Файлы данных и сопутствующие материалы доступны на GitHub. Используйте оболочку IPython и блокнот Jupyter для исследовательских вычислений. Изучите основные и дополнительные функции NumPy (Numerical Python). Начните работу с инструментами анализа данных в библиотеке pandas. Используйте гибкие инструменты для загрузки, очистки, преобразования, объединения и изменения данных. matplotlib Применяйте средство группировки pandas для нарезки, разделения и суммирования наборов данных Анализируйте и манипулируйте регулярными и нерегулярными данными временных рядов Узнайте, как решать реальные проблемы анализа данных с помощью подробных и подробных примеров.
  10. Глубокое обучение: адаптивные вычисления и машинное обучение — эта книга может быть полезна разным читателям, но мы написали ее, имея в виду две основные целевые аудитории. Одной из таких целевых аудиторий являются студенты университетов (бакалавры или выпускники), изучающие машинное обучение, в том числе те, кто начинает карьеру в области глубокого обучения и исследований в области искусственного интеллекта. Другая целевая аудитория — инженеры-программисты, которые не имеют опыта машинного обучения или статистики, но хотят быстро приобрести их и начать использовать глубокое обучение в своем продукте или платформе. Глубокое обучение уже доказало свою полезность во многих областях программного обеспечения, включая компьютерное зрение, обработку речи и звука, обработку естественного языка, робототехнику, биоинформатику и химию, видеоигры, поисковые системы, онлайн-рекламу и финансы. Эта книга разделена на три части, чтобы наилучшим образом удовлетворить запросы самых разных читателей. Часть I знакомит с основными математическими инструментами и концепциями машинного обучения. Часть II описывает наиболее известные алгоритмы глубокого обучения, которые по сути представляют собой решаемые технологии. Часть III описывает более спекулятивные идеи, которые, по широко распространенному мнению, важны для будущих исследований в области глубокого обучения. Мы предполагаем, что все читатели имеют опыт работы в области компьютерных наук. Мы предполагаем знакомство с программированием, базовое понимание вопросов производительности вычислений, теорию сложности, начальный уровень исчисления и некоторую терминологию теории графов.
  11. Думай как специалист по данным: шаг за шагом решай процесс обработки данныхДумай как специалист по данным учит пошаговому подходу к решению реальных задач, связанных с данными. Разбирая тщательно продуманные примеры, вы научитесь объединять аналитику, программирование и бизнес-перспективы в повторяемый процесс извлечения реальных знаний из данных. По мере чтения вы откроете для себя (или вспомните) ценные статистические методы и изучите мощное программное обеспечение для обработки данных. Что еще более важно, вы объедините эти знания, используя структурированный процесс для науки о данных. Когда вы закончите, у вас будет прочная основа для изучения и практики науки о данных на протяжении всей жизни.

Подпишитесь на меня в LinkedIn, GitHub и Kaggle, чтобы получать больше подобных статей и сообщений.

Если этот пост был полезен, пожалуйста, несколько раз нажмите кнопку аплодисментов 👏, чтобы выразить свою поддержку автору 👇

🚀Разработчики: учитесь и развивайтесь, не отставая от того, что важно, ПРИСОЕДИНЯЙТЕСЬ К FAUN.