Поскольку я всегда очень интересовался компьютерами, это заставило меня задуматься о других возможностях, которые мы могли бы иметь. Не только код if-else, гораздо больше вещей, например, может ли он предсказывать слова на основе предыдущих данных или анализировать шаблон. Так я натолкнулся на название «Машинное обучение».

Поскольку есть много других сообщений в блогах, в которых рассказывается, как начать, они просто рассказывают вам, как работать с такими библиотеками, как Pandas, Matplotlib, Seaborn и многими другими. Замечательно, что вам не нужно иметь полные знания о функциях Pandas.

В конце концов, вы должны уметь читать документацию и находить то, что вам нужно.

Давай нырнем

  1. Хорошо владейте хотя бы одним языком

Наиболее предпочтительным языком в области машинного обучения является Python, но вы можете выбрать любой, но я предпочитаю Python. Поддержка сообщества намного лучше. Если вы знаете хотя бы один язык, погружение в Python будет приятным сюрпризом. Вам понравится его простота; после этого пути назад нет.

2. Знайте, как использовать команды Git и терминал

Изучение терминала и git будет полезно для вас, даже если вы не подаете заявку на получение поля ML. Вы узнаете о возможностях командной строки

3. Вероятность и статистика

В будущих концепциях машинного обучения вам необходимо применять и извлекать смысл из данных с помощью статистики. Вы будете использовать вероятность в Наивном Байесе, а также во многих других областях. Лучше на этом запачкать руки.

4. Математика, связанная с машинным обучением

Если вы углубитесь, то поймете, что все является математикой. Как-то вроде регрессии, где мы работаем с линейной и полиномиальной регрессией, в которой используются методы линейных уравнений и их аспекты. Я просто делюсь отрывками из тем, чтобы понять, что необходимы базовые знания математики, например, линейная алгебра.

5. Манипулирование данными

Вам лучше знать, как манипулировать данными с помощью панд в соответствии с потребностями. Если вы хотите упорядочить данные, используя год и месяц в наборе данных, вы лучше понимаете, как решить эту проблему. Это можно сделать с помощью функции Groupby в Pandas. Так что хорошо иметь хорошее владение пандами, которые будут для вас весьма полезны в будущем.

6. Визуализация данных

Как мы знаем, изображения говорят о проблеме больше, чем просто слова, поэтому манипуляции с данными можно визуализировать с помощью Matplotlib, seaborn и других библиотек. Это важно, если вы тоже хотите заниматься наукой о данных. В науке о данных мы не визуализируем агрегированные данные, а вместо этого используем подмножество набора данных и делаем из него вывод.

7. Исследовательский анализ данных

Вам лучше знать, что дело не в написании кода и рисовании сюжета для визуализации. Все дело в точном извлечении результатов из этих графиков. Кроме того, вы должны знать, что мы можем сделать больше выводов из набора данных на основе различных графиков; он иногда меняется в зависимости от контекста. Из этого можно сделать опасный неверный вывод. Вы должны охватить все аспекты, чтобы посмотреть на набор данных.

8. Статистическое мышление

Статистическое обоснование - это способ, которым люди рассуждают на основе статистических идей и осмысливают статистическую информацию. Статистическое обоснование может включать соединение одной концепции с другой (например, центр и распространение) или может объединять идеи о данных и случайности. "Источник"

Все вышеперечисленные знания имеют решающее значение для лучшего понимания любой проблемы, которую вы хотите решить с помощью машинного обучения.

9. Бинго !!

вы готовы окунуться в мир машинного обучения

Вы можете охватить все эти темы только в одном месте: Datacamp, который является отличной платформой для всех тех новичков и людей среднего уровня, которые хотят учиться на этом.

Некоторые ресурсы для вас, чтобы начать

Вы можете связаться со мной в любое время, и я буду рад вам помочь.

Следуйте за мной в Linkedin, Github.

Критика и предложения приветствуются !!!

Я рад слышать от вас